- 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원

 

2025-deepseek-r1-on-aws-3-bedrock-marketplace.png

AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생성형 AI 모델을 보다 효과적으로 활용할 수 있으며, 비용 절감과 성능 향상을 동시에 누릴 수 있다.

 

딥시크(DeepSeek)202412월 딥시크-V3(DeepSeek-V3)를 출시한 이후, 2025120일 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 또한, 127일에는 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델을 추가했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

 

AWS는 고객들이 딥시크-R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다.

 

또한, AWS 트레이니움(AWS Trainium)AWS 인퍼런시아(AWS Inferentia)를 활용하면 딥시크-R1-디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장하며, 이를 통해 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다.

 

딥시크-R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스(Amazon Bedrock Marketplace)에서는 모델 카탈로그에서 딥시크-R1을 검색하여 손쉽게 배포할 수 있으며, 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크-R1-디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크-R1-디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

 

AWS는 딥시크-R1 모델을 통해 고객들이 AI 기술을 더욱 효과적으로 활용하고, 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 적극 지원할 예정이다.

 

 

#AWS#AI#딥시크#R1

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1505 스노우플레이크, 코텍스 AI에서 ‘딥시크-R1’ 프리뷰 지원 - 대규모 강화학습만으로 훈련된 최초 오픈소스 모델 딥시크, 고급 추론·수학·코딩 성능 최상위권 기록 - SQL 함수·파이썬·REST API 모두 지원… 기존 데이터 파이... file newsit 2025.02.05 354
1504 딥엘, 기업을 위한 API 솔루션 기능 강화…“차세대 LLM 모델 탑재 및 딥엘 라이트 추가” - 워크플로우에 언어 AI 탑재, 더 효과적인 커뮤니케이션을 통한 비즈니스 성장 지원 - 확장된 API 솔루션, 향상된 번역 및 신규 글쓰기 툴 제공 글로벌 언어 AI ... file newsit 2025.02.05 341
1503 오라클, 업스테이지에 OCI 공급…“AI 솔루션 혁신 가속화” - OCI도입 활용으로 대규모 AI 워크로드 확장성과 엔터프라이즈급 보안으로 AI 모델 개발 및 배포 가속화 - 오라클과의 협력 통해 AI 시장 확장 및 경쟁력 강화 ... file newsit 2025.02.05 303
1502 구글 클라우드, 클라우드 서비스 보안인증제 ‘하’ 등급 인증 취득 - KISA, 구글 클라우드 서울 리전 운영 환경 및 주요 클라우드 서비스의 신뢰성 및 안전성 평가 - 구글 클라우드, 국내 공공 분야 고객과 협업 확장하며 AI 혁신 ... file newsit 2025.02.03 342
» AWS, DeepSeek-R1 모델 제공 시작…생성형 AI 활용 확장 지원 - 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원 AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마... file newsit 2025.02.03 404
1500 EDB, 한국 지사에 김희배 신임 지사장 선임…“포스트그레스 및 AI 기반 데이터 혁신의 새 시대 열 것” - 28년 이상 데이터와 분석 테크놀로지, 기술 생태계 조성에 앞장선 전문가 - 오픈소스 포스트그레스 데이터베이스와 AI 솔루션의 적용 범위를 넓히고, 도입 고객... file newsit 2025.02.03 325
1499 사이오닉에이아이, OCI 기반으로 생성형 AI 솔루션 사업 가속화 - OCI 도입으로 안정성과 성능을 강화한 생성형 AI RAG 솔루션 제공… 글로벌 사업 확장 및 비용 효율성 확보 목표 오라클은 국내 AI 솔루션 전문 기업 사이오닉에... file newsit 2025.02.03 350
1498 지멘스, IDC 마켓스케이프 MES 부문 리더로 선정 - Siemens Xcelerator 산업용 소프트웨어 포트폴리오의 솔루션들과 통합된 MES용 Opcenter로 TCO 절감 - 클라우드 기반 Opcenter X로 중소기업 디지털 전환 지원 ... file newsit 2025.01.24 335
1497 데이터브릭스, 150억 달러 규모의 자금 조달 완료…AI 인재 유치 및 글로벌 확장 가속화 - 100억 달러 규모의 시리즈 J 투자 유치 및 52억 5천만 달러 규모의 추가 자금 조달 완료 데이터브릭스(Databricks)가 시리즈 J 투자 유치를 최종 마무리했다고 ... file newsit 2025.01.23 357
1496 델, ‘업무용 PC 사용 현황 및 AI PC 전망’ 보고서 발표 - AI 워크로드 처리를 위해 일반 업무용 PC를 사용한다는 응답은 3.2%에서 7.1%로, 워크스테이션을 사용한다는 응답은 9.8%에서 13.1%로 증가 - AI PC의 가장 큰 ... file newsit 2025.01.23 571
목록
Board Pagination Prev 1 ... 63 64 65 66 67 68 69 70 71 72 ... 218 Next
/ 218
CLOSE