- 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원

 

2025-deepseek-r1-on-aws-3-bedrock-marketplace.png

AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생성형 AI 모델을 보다 효과적으로 활용할 수 있으며, 비용 절감과 성능 향상을 동시에 누릴 수 있다.

 

딥시크(DeepSeek)202412월 딥시크-V3(DeepSeek-V3)를 출시한 이후, 2025120일 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 또한, 127일에는 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델을 추가했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

 

AWS는 고객들이 딥시크-R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다.

 

또한, AWS 트레이니움(AWS Trainium)AWS 인퍼런시아(AWS Inferentia)를 활용하면 딥시크-R1-디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장하며, 이를 통해 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다.

 

딥시크-R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스(Amazon Bedrock Marketplace)에서는 모델 카탈로그에서 딥시크-R1을 검색하여 손쉽게 배포할 수 있으며, 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크-R1-디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크-R1-디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

 

AWS는 딥시크-R1 모델을 통해 고객들이 AI 기술을 더욱 효과적으로 활용하고, 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 적극 지원할 예정이다.

 

 

#AWS#AI#딥시크#R1

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
» AWS, DeepSeek-R1 모델 제공 시작…생성형 AI 활용 확장 지원 file newsit 2025.02.03 414
3744 캐논코리아, 국내 렌즈 교환식 카메라 시장 ‘22년 연속 1위 기념 정품등록 프로모션’ 실시 file newsit 2025.02.03 101
3743 EDB, 한국 지사에 김희배 신임 지사장 선임…“포스트그레스 및 AI 기반 데이터 혁신의 새 시대 열 것” file newsit 2025.02.03 326
3742 사이오닉에이아이, OCI 기반으로 생성형 AI 솔루션 사업 가속화 file newsit 2025.02.03 350
3741 캐논코리아, 대구경 F2.8의 초광각 줌 렌즈 ‘RF16-28mm F2.8 IS STM’ 공개 file newsit 2025.01.24 118
3740 에이엘티, 고급감과 편의성 갖춘 마이브 ‘스타일폴더2’ 출시 file newsit 2025.01.24 188
3739 ​​​​​​​삼텍, 2024년 올해의 글로벌 우수 서비스 유통기업으로 ‘마우저 일렉트로닉스’ 선정 file newsit 2025.01.24 183
3738 한국레노버, ‘씽크패드 X9’ 시리즈 2종 국내 공식 출시…“AI 비서 및 지원 도구로 개인화된 AI 경험 제공” file newsit 2025.01.24 168
3737 지멘스, IDC 마켓스케이프 MES 부문 리더로 선정 file newsit 2025.01.24 335
3736 ST, ‘2025 글로벌 최고의 직장(Top Employer Global)’으로 선정 file newsit 2025.01.24 213
3735 데이터브릭스, 150억 달러 규모의 자금 조달 완료…AI 인재 유치 및 글로벌 확장 가속화 file newsit 2025.01.23 358
3734 한국넷앱, 유재성 신임 대표 선임…“넷앱의 한국 내 성장 가속화 기여할 것” file newsit 2025.01.23 89
3733 델, ‘업무용 PC 사용 현황 및 AI PC 전망’ 보고서 발표 file newsit 2025.01.23 572
3732 사이냅소프트, AI기술 혁신 선도 ‘이머징 AI+X 톱100’ 선정 file newsit 2025.01.23 337
3731 가민코리아, 2025년 브랜드 앰버서더로 가수 션 및 인플루언서 홍범석 발탁 file newsit 2025.01.23 137
3730 라이언로켓, '젠버스 알파(Genvas Alpha)' 공식 출시…프로 웹툰 작가 위한 파운더스 클럽 운영 시작 file newsit 2025.01.23 553
3729 카테노이드, ‘콜러스 VOD 콘솔’ 신규 버전으로 통합…“신기능 추가 및 인터페이스 업그레이드” file newsit 2025.01.23 377
3728 한국오라클, 국내 스타트업 5개사에 OCI 제공…“AI 기반 서비스 개발 지원”   file newsit 2025.01.23 376
3727 테스토코리아, ‘testo 300’ 및 ‘testo 868’ 출시…“겨울철 난방 설비의 에너지 효율적 관리에 최적” file newsit 2025.01.22 114
3726 가트너, “작년 PC 출하량 2억 5천만 대로 1.3% 성장”…“윈도우 11 교체 수요 및 AI PC 가치 상승” file newsit 2025.01.22 479
Board Pagination Prev 1 ... 75 76 77 78 79 80 81 82 83 84 ... 267 Next
/ 267
CLOSE