- 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원

 

2025-deepseek-r1-on-aws-3-bedrock-marketplace.png

AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생성형 AI 모델을 보다 효과적으로 활용할 수 있으며, 비용 절감과 성능 향상을 동시에 누릴 수 있다.

 

딥시크(DeepSeek)202412월 딥시크-V3(DeepSeek-V3)를 출시한 이후, 2025120일 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 또한, 127일에는 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델을 추가했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

 

AWS는 고객들이 딥시크-R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다.

 

또한, AWS 트레이니움(AWS Trainium)AWS 인퍼런시아(AWS Inferentia)를 활용하면 딥시크-R1-디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장하며, 이를 통해 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다.

 

딥시크-R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스(Amazon Bedrock Marketplace)에서는 모델 카탈로그에서 딥시크-R1을 검색하여 손쉽게 배포할 수 있으며, 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크-R1-디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크-R1-디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

 

AWS는 딥시크-R1 모델을 통해 고객들이 AI 기술을 더욱 효과적으로 활용하고, 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 적극 지원할 예정이다.

 

 

#AWS#AI#딥시크#R1

 

 
?

  1. AWS, DeepSeek-R1 모델 제공 시작…생성형 AI 활용 확장 지원

    - 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원 AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생...
    Date2025.02.03 Bynewsit Views466
    Read More
  2. EDB, 한국 지사에 김희배 신임 지사장 선임…“포스트그레스 및 AI 기반 데이터 혁신의 새 시대 열 것”

    - 28년 이상 데이터와 분석 테크놀로지, 기술 생태계 조성에 앞장선 전문가 - 오픈소스 포스트그레스 데이터베이스와 AI 솔루션의 적용 범위를 넓히고, 도입 고객들이 디지털 혁신을 이어갈 수 있도록 지원 - 금융 및 공공 시장뿐만 아니라 제조, 유통 등 다양...
    Date2025.02.03 Bynewsit Views361
    Read More
  3. 사이오닉에이아이, OCI 기반으로 생성형 AI 솔루션 사업 가속화

    - OCI 도입으로 안정성과 성능을 강화한 생성형 AI RAG 솔루션 제공… 글로벌 사업 확장 및 비용 효율성 확보 목표 오라클은 국내 AI 솔루션 전문 기업 사이오닉에이아이가 생성형 AI 기반의 SaaS 플랫폼 구축을 위해 오라클 클라우드 인프라스트럭처(OCI)를 성...
    Date2025.02.03 Bynewsit Views378
    Read More
  4. 지멘스, IDC 마켓스케이프 MES 부문 리더로 선정

    - Siemens Xcelerator 산업용 소프트웨어 포트폴리오의 솔루션들과 통합된 MES용 Opcenter로 TCO 절감 - 클라우드 기반 Opcenter X로 중소기업 디지털 전환 지원 지멘스 디지털 인더스트리 소프트웨어가 IDC 마켓스케이프의 <전 세계 제조 실행 시스템 2024-20...
    Date2025.01.24 Bynewsit Views385
    Read More
  5. 데이터브릭스, 150억 달러 규모의 자금 조달 완료…AI 인재 유치 및 글로벌 확장 가속화

    - 100억 달러 규모의 시리즈 J 투자 유치 및 52억 5천만 달러 규모의 추가 자금 조달 완료 데이터브릭스(Databricks)가 시리즈 J 투자 유치를 최종 마무리했다고 발표했다. 이번 투자에는 기존 투자자인 카타르 투자청(QIA)과 신규 투자자인 테마섹(Temasek), ...
    Date2025.01.23 Bynewsit Views399
    Read More
  6. 델, ‘업무용 PC 사용 현황 및 AI PC 전망’ 보고서 발표

    - AI 워크로드 처리를 위해 일반 업무용 PC를 사용한다는 응답은 3.2%에서 7.1%로, 워크스테이션을 사용한다는 응답은 9.8%에서 13.1%로 증가 - AI PC의 가장 큰 매력 포인트로 ‘일반 PC보다 AI 워크로드를 더 빨리 처리한다’는 점 꼽아 - 설문에 참여한 IT 구...
    Date2025.01.23 Bynewsit Views602
    Read More
  7. 사이냅소프트, AI기술 혁신 선도 ‘이머징 AI+X 톱100’ 선정

    - 도큐먼트 AI로 주목받는 사이냅소프트 - 딥러닝 AI OCR에서, LLM을 활용한 AI 서비스까지 ~AI기술력과 혁신성 인정 사이냅소프트는 한국인공지능산업협회의 "2025 Emerging AI+X Top100"에서 NLP기반 AI 플랫폼 분야에 선정되었다고 발표했다. Emerging AI+X...
    Date2025.01.23 Bynewsit Views360
    Read More
  8. 라이언로켓, '젠버스 알파(Genvas Alpha)' 공식 출시…프로 웹툰 작가 위한 파운더스 클럽 운영 시작

    - 젠버스 알파, 27일(월) 서비스 오픈…작가의 창작 파트너로 반복 작업 줄이고 창작 과정 지원 - 프로 웹툰 작가 대상 파운더스 클럽 운영...무료 사용 및 독점 혜택 제공 웹툰 생성형 AI 기업 라이언로켓이 새로운 웹툰 창작 지원 솔루션인 '젠버스 알파(Genv...
    Date2025.01.23 Bynewsit Views610
    Read More
  9. 카테노이드, ‘콜러스 VOD 콘솔’ 신규 버전으로 통합…“신기능 추가 및 인터페이스 업그레이드”

    - 업무 효율 및 편의 위한 검색 환경∙인터페이스 제공 - 콜러스 애널리틱스 베타로 통계 인사이트 제공… 비즈니스 전략 수립 지원 - 맞춤형 시청 환경 위한 AI 배속, 다음 회차 등 신규 기능 추가 카테노이드가 자사 온라인 비디오 플랫폼 ‘콜러스(Kollus)’의 ...
    Date2025.01.23 Bynewsit Views434
    Read More
  10. 한국오라클, 국내 스타트업 5개사에 OCI 제공…“AI 기반 서비스 개발 지원”  

    - 게임프로, 럭스바이옴, 레이티스트케이, 맥케이, 위솝 5개 기술 스타트업, OCI 활용해 SaaS 기반의 스마트 솔루션 기술 고도화 한국오라클이 게임프로, 럭스바이옴, 레이티스트케이, 맥케이, 위솝 등 국내 스타트업 5개사에 오라클 클라우드 인프라스트럭처(...
    Date2025.01.23 Bynewsit Views409
    Read More
목록
Board Pagination Prev 1 ... 67 68 69 70 71 72 73 74 75 76 ... 222 Next
/ 222
CLOSE