- 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원

 

2025-deepseek-r1-on-aws-3-bedrock-marketplace.png

AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생성형 AI 모델을 보다 효과적으로 활용할 수 있으며, 비용 절감과 성능 향상을 동시에 누릴 수 있다.

 

딥시크(DeepSeek)202412월 딥시크-V3(DeepSeek-V3)를 출시한 이후, 2025120일 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 또한, 127일에는 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델을 추가했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

 

AWS는 고객들이 딥시크-R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다.

 

또한, AWS 트레이니움(AWS Trainium)AWS 인퍼런시아(AWS Inferentia)를 활용하면 딥시크-R1-디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장하며, 이를 통해 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다.

 

딥시크-R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스(Amazon Bedrock Marketplace)에서는 모델 카탈로그에서 딥시크-R1을 검색하여 손쉽게 배포할 수 있으며, 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크-R1-디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크-R1-디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

 

AWS는 딥시크-R1 모델을 통해 고객들이 AI 기술을 더욱 효과적으로 활용하고, 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 적극 지원할 예정이다.

 

 

#AWS#AI#딥시크#R1

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1576 [GTC 2025] 엔비디아, ‘RTX PRO 6000 블랙웰 서버 에디션’ 발표…“AI와 그래픽 융합 가속화” - 블랙웰 범용 데이터센터 GPU로 고성능 엔터프라이즈 워크로드 지원 - AI, 반도체, 생명과학 등 다양한 산업에서 워크로드 가속화 - 5월부터 시스템 파트너와 클... file newsit 2025.03.21 528
1575 [GTC 2025] 엔비디아, 세계 최대 프랜차이즈 ‘얌 브랜드’와 요식산업 혁신 가속 - KFC, 타코벨, 피자헛 모회사 얌 브랜드, 엔비디아 AI 적용해 주문 간소화와 운영 최적화 실현 - 올해 최대 500개 이상 매장에 AI 솔루션 확대 적용으로 레스토... file newsit 2025.03.21 574
1574 [GTC 2025] 엔비디아, 대규모 데이터 분석 자동 가속화 ‘프로젝트 에테르’ 출시…“가속 아파치 스파크로 기업 비용 절감 입증” - 엔비디아 가속화 아파치 스파크로 수백만 달러 절약, 데이터센터 분석 워크로드 자동화 - 호주 최대 금융기관 CBA, 아파치 스파크용 래피즈 액셀러레이터로 63... file newsit 2025.03.20 635
1573 가트너, "AI 에이전트, 계정 탈취 시간 2년 내 50% 줄일 것” - AI 에이전트, 범죄 자동화로 2027년까지 사용자 계정 탈취(ATO) 시간 50% 줄일 것 - 다양한 방법으로 수집한 비밀번호를 자동화 봇을 통해 로그인… 다중 인증(M... file newsit 2025.03.20 658
1572 [GTC 2025] 엔비디아-오라클, 기업 에이전트 AI 추론 가속화 협력 - 오라클 데이터베이스와 엔비디아 AI 기술 통합해 에이전트 AI 활용 가속화 - 데이터센터, 퍼블릭 클라우드, 엣지 등 다양한 환경에서 AI 배포 지원 - OCI AI 블... file newsit 2025.03.20 500
1571 [GTC 2025] 엔비디아, 가속 양자 컴퓨팅 연구센터 설립 - 양자 컴퓨팅 발전 위한 기술 제공, 미국 보스턴에서 올해 하반기부터 운영 - 하드웨어 · 소프트웨어 선도 기업과 협력 양자 컴퓨팅 아키텍처와 알고리즘 개발 -... file newsit 2025.03.20 473
1570 LSK 글로벌 PS, 안전성 사례 관리 위해 오라클 아거스 도입 - 오라클 아거스 도입으로 전체 개발 라이프사이클 전반에 걸쳐 작업흐름 자동화와 규제 요구사항 해결 및 비용 절감 지원 효과 기대 LSK 글로벌 PS가 제약회사의... file newsit 2025.03.20 471
1569 [GTC 2025] 지코어, 미란티스와 AI 인프라 과제 해결 협력 발표 - 지코어의 AI 인프라와 미란티스의 오픈소스 플랫폼 관리 솔루션의 결합 - 엔비디아 주최로 개최되는 세계 최대 규모의 AI 컨퍼런스인 GTC 2025에서 솔루션 시연... file newsit 2025.03.20 497
1568 딥엘, 패스트컴퍼니 ‘2025 세계에서 가장 혁신적인 기업’에 선정 - 엔비디아·구글 웨이모 등과 함께 혁신 기업으로 선정… 비즈니스를 위한 최첨단 언어 AI 플랫폼으로 인정 글로벌 언어 AI 기업 딥엘(DeepL)이 미국 경제 매거진 ... file newsit 2025.03.19 454
1567 티유브이 슈드, ‘IEC 61508 규격 기본과정’ 교육 신규 개설 - 전기전자장치 기능 안전 국제 표준 - IEC 61508 인증 절차와 인증 준비 사항, 규격 요구사항 소개 - 4월 23일(수)에 첫 교육 진행, 티유브이슈드코리아 서울 여... file newsit 2025.03.19 462
목록
Board Pagination Prev 1 ... 74 75 76 77 78 79 80 81 82 83 ... 236 Next
/ 236
CLOSE