- 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원

 

2025-deepseek-r1-on-aws-3-bedrock-marketplace.png

AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생성형 AI 모델을 보다 효과적으로 활용할 수 있으며, 비용 절감과 성능 향상을 동시에 누릴 수 있다.

 

딥시크(DeepSeek)202412월 딥시크-V3(DeepSeek-V3)를 출시한 이후, 2025120일 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 또한, 127일에는 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델을 추가했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

 

AWS는 고객들이 딥시크-R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다.

 

또한, AWS 트레이니움(AWS Trainium)AWS 인퍼런시아(AWS Inferentia)를 활용하면 딥시크-R1-디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장하며, 이를 통해 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다.

 

딥시크-R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스(Amazon Bedrock Marketplace)에서는 모델 카탈로그에서 딥시크-R1을 검색하여 손쉽게 배포할 수 있으며, 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크-R1-디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크-R1-디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

 

AWS는 딥시크-R1 모델을 통해 고객들이 AI 기술을 더욱 효과적으로 활용하고, 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 적극 지원할 예정이다.

 

 

#AWS#AI#딥시크#R1

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1503 오라클, 업스테이지에 OCI 공급…“AI 솔루션 혁신 가속화” - OCI도입 활용으로 대규모 AI 워크로드 확장성과 엔터프라이즈급 보안으로 AI 모델 개발 및 배포 가속화 - 오라클과의 협력 통해 AI 시장 확장 및 경쟁력 강화 ... file newsit 2025.02.05 306
1502 구글 클라우드, 클라우드 서비스 보안인증제 ‘하’ 등급 인증 취득 - KISA, 구글 클라우드 서울 리전 운영 환경 및 주요 클라우드 서비스의 신뢰성 및 안전성 평가 - 구글 클라우드, 국내 공공 분야 고객과 협업 확장하며 AI 혁신 ... file newsit 2025.02.03 350
» AWS, DeepSeek-R1 모델 제공 시작…생성형 AI 활용 확장 지원 - 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원 AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마... file newsit 2025.02.03 414
1500 EDB, 한국 지사에 김희배 신임 지사장 선임…“포스트그레스 및 AI 기반 데이터 혁신의 새 시대 열 것” - 28년 이상 데이터와 분석 테크놀로지, 기술 생태계 조성에 앞장선 전문가 - 오픈소스 포스트그레스 데이터베이스와 AI 솔루션의 적용 범위를 넓히고, 도입 고객... file newsit 2025.02.03 326
1499 사이오닉에이아이, OCI 기반으로 생성형 AI 솔루션 사업 가속화 - OCI 도입으로 안정성과 성능을 강화한 생성형 AI RAG 솔루션 제공… 글로벌 사업 확장 및 비용 효율성 확보 목표 오라클은 국내 AI 솔루션 전문 기업 사이오닉에... file newsit 2025.02.03 350
1498 지멘스, IDC 마켓스케이프 MES 부문 리더로 선정 - Siemens Xcelerator 산업용 소프트웨어 포트폴리오의 솔루션들과 통합된 MES용 Opcenter로 TCO 절감 - 클라우드 기반 Opcenter X로 중소기업 디지털 전환 지원 ... file newsit 2025.01.24 335
1497 데이터브릭스, 150억 달러 규모의 자금 조달 완료…AI 인재 유치 및 글로벌 확장 가속화 - 100억 달러 규모의 시리즈 J 투자 유치 및 52억 5천만 달러 규모의 추가 자금 조달 완료 데이터브릭스(Databricks)가 시리즈 J 투자 유치를 최종 마무리했다고 ... file newsit 2025.01.23 357
1496 델, ‘업무용 PC 사용 현황 및 AI PC 전망’ 보고서 발표 - AI 워크로드 처리를 위해 일반 업무용 PC를 사용한다는 응답은 3.2%에서 7.1%로, 워크스테이션을 사용한다는 응답은 9.8%에서 13.1%로 증가 - AI PC의 가장 큰 ... file newsit 2025.01.23 572
1495 사이냅소프트, AI기술 혁신 선도 ‘이머징 AI+X 톱100’ 선정 - 도큐먼트 AI로 주목받는 사이냅소프트 - 딥러닝 AI OCR에서, LLM을 활용한 AI 서비스까지 ~AI기술력과 혁신성 인정 사이냅소프트는 한국인공지능산업협회의 "20... file newsit 2025.01.23 334
1494 라이언로켓, '젠버스 알파(Genvas Alpha)' 공식 출시…프로 웹툰 작가 위한 파운더스 클럽 운영 시작 - 젠버스 알파, 27일(월) 서비스 오픈…작가의 창작 파트너로 반복 작업 줄이고 창작 과정 지원 - 프로 웹툰 작가 대상 파운더스 클럽 운영...무료 사용 및 독점 ... file newsit 2025.01.23 552
목록
Board Pagination Prev 1 ... 64 65 66 67 68 69 70 71 72 73 ... 219 Next
/ 219
CLOSE