- 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원

 

2025-deepseek-r1-on-aws-3-bedrock-marketplace.png

AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생성형 AI 모델을 보다 효과적으로 활용할 수 있으며, 비용 절감과 성능 향상을 동시에 누릴 수 있다.

 

딥시크(DeepSeek)202412월 딥시크-V3(DeepSeek-V3)를 출시한 이후, 2025120일 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 또한, 127일에는 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델을 추가했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

 

AWS는 고객들이 딥시크-R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다.

 

또한, AWS 트레이니움(AWS Trainium)AWS 인퍼런시아(AWS Inferentia)를 활용하면 딥시크-R1-디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장하며, 이를 통해 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다.

 

딥시크-R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스(Amazon Bedrock Marketplace)에서는 모델 카탈로그에서 딥시크-R1을 검색하여 손쉽게 배포할 수 있으며, 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크-R1-디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크-R1-디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

 

AWS는 딥시크-R1 모델을 통해 고객들이 AI 기술을 더욱 효과적으로 활용하고, 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 적극 지원할 예정이다.

 

 

#AWS#AI#딥시크#R1

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1568 딥엘, 패스트컴퍼니 ‘2025 세계에서 가장 혁신적인 기업’에 선정 - 엔비디아·구글 웨이모 등과 함께 혁신 기업으로 선정… 비즈니스를 위한 최첨단 언어 AI 플랫폼으로 인정 글로벌 언어 AI 기업 딥엘(DeepL)이 미국 경제 매거진 ... file newsit 2025.03.19 454
1567 티유브이 슈드, ‘IEC 61508 규격 기본과정’ 교육 신규 개설 - 전기전자장치 기능 안전 국제 표준 - IEC 61508 인증 절차와 인증 준비 사항, 규격 요구사항 소개 - 4월 23일(수)에 첫 교육 진행, 티유브이슈드코리아 서울 여... file newsit 2025.03.19 462
1566 디오임플란트, 세일즈포스와 손잡고 디지털 영업 관리 시스템 구축…“70개국 영업 데이터 실시간 통합 관리” - 세일즈 클라우드 기반 전 세계 영업망 표준화와 AI 기반 데이터 분석으로 실시간 의사결정 체계 확립 - ERP 연동 통한 영업 프로세스 가시성 확보로 고객 대응... file newsit 2025.03.19 730
1565 [GTC 2025] 엔비디아, AI 추론 시대 가속화 ‘블랙웰 울트라 AI 팩토리 플랫폼’ 공개 - 최상위 컴퓨터 제조업체, 클라우드 서비스 제공업체, GPU 클라우드 제공업체와 협업 - 에이전틱에서 물리적 AI까지 광범위 추론 훈련 강화, 처리량 증가·응답 ... file newsit 2025.03.19 621
1564 [GTC 2025] 엔비디아, 차세대 차량 경험과 제조 혁신 위해 GM과 협력 - 첨단 운전자 지원 시스템 구축과 안전한 운전 경험 극대화 목표 - 엔비디아 옴니버스 플랫폼으로 조립 라인 디지털 트윈 구축, 생산 중단 시간 단축 - 엔비디아... file newsit 2025.03.19 682
1563 [GTC 2025] 엔비디아, 개인용 AI 컴퓨터 ‘DGX 스파크’와 ‘DGX 스테이션’ 발표 - 엔비디아 그레이스 블랙웰 탑재 데스크톱 슈퍼컴…개발자, 연구자, 데이터 과학자에게 가속AI 제공 - 에이수스, 델 테크놀로지스, HP, 레노버 등 선도적 컴퓨터 ... file newsit 2025.03.19 745
1562 슈나이더 일렉트릭 ‘에코스트럭처 IT’, 영국 데이터센터 매거진 선정 선도적인 DCIM 1위 - 데이터센터 관리 효율성과 지속 가능성을 극대화하는 선도적인 DCIM 솔루션으로 선정 - 클라우드 기반의 에코스트럭처 IT를 통해 데이터센터 인프라 실시간 분... file newsit 2025.03.18 432
1561 데이터브릭스, 확장성과 신뢰성을 갖춘 AI 에이전트 구축을 위한 새로운 도구 공개 - 거버넌스, 모니터링, 확장 기능 강화로 기업의 AI 에이전트 배포를 더욱 안정적으로 지원 데이터브릭스(Databricks)는 기업들이 AI 에이전트를 시범 단계를 넘... file newsit 2025.03.18 771
1560 트림블, 테클라 스트럭처스 2025 출시…“BIM 소프트웨어로 워크플로우 확장” - 프로젝트 이해관계자와 스마트 공정 자동화 모델 기반 협업 개선 - 건설 프로젝트 모든 단계 실시간 3D 모델 협업 - AI 클라우드 패브리케이션 드로잉 도입 트... file newsit 2025.03.17 735
1559 다쏘시스템, 글로벌 이니셔티브 '솔리드웍스 스킬포스' 출시…”학생들의 실무 기반 학습 역량 강화“ - 솔리드웍스 스킬포스 통해 인턴십 또는 협동 교육 프로그램에 참여하는 학생들에게 솔리드웍스 라이선스 제공 - 최신 AI 기반 버추얼 트윈 기술에 대한 접근성 ... file newsit 2025.03.17 516
목록
Board Pagination Prev 1 ... 75 76 77 78 79 80 81 82 83 84 ... 236 Next
/ 236
CLOSE