- 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원

 

2025-deepseek-r1-on-aws-3-bedrock-marketplace.png

AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생성형 AI 모델을 보다 효과적으로 활용할 수 있으며, 비용 절감과 성능 향상을 동시에 누릴 수 있다.

 

딥시크(DeepSeek)202412월 딥시크-V3(DeepSeek-V3)를 출시한 이후, 2025120일 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 또한, 127일에는 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델을 추가했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

 

AWS는 고객들이 딥시크-R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다.

 

또한, AWS 트레이니움(AWS Trainium)AWS 인퍼런시아(AWS Inferentia)를 활용하면 딥시크-R1-디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장하며, 이를 통해 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다.

 

딥시크-R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스(Amazon Bedrock Marketplace)에서는 모델 카탈로그에서 딥시크-R1을 검색하여 손쉽게 배포할 수 있으며, 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크-R1-디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크-R1-디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

 

AWS는 딥시크-R1 모델을 통해 고객들이 AI 기술을 더욱 효과적으로 활용하고, 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 적극 지원할 예정이다.

 

 

#AWS#AI#딥시크#R1

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1537 딥엘, 신규 기능 ‘클래리파이’ 추가…“AI와 상호작용 통해 최적의 비즈니스 번역 지원” - ‘클래리파이’ 기능은 딥엘의 언어 AI 플랫폼에 보다 업그레이드된 개인화 지원, 20만 개 이상 기업 고객의 늘어나는 요구에 부응 - 비원어민이 간과하거나 어렵... file newsit 2025.03.05 475
1536 윈드리버, 복잡한 클라우드 및 엣지 환경을 위한 AI 아키텍처 ‘인텔 제온 6’ 프로세서 지원 윈드리버는 오늘 인텔 제온 6 SoC에 대한 ‘윈드리버 스튜디오 오퍼레이터(Wind River Studio Operator)’ 지원을 발표했다. 가장 까다로운 클라우드 및 엣지 워크... file newsit 2025.03.05 409
1535 리미니스트리트, 생활문화기업 ‘LF’에 오라클 데이터베이스 및 SAP ERP 유지보수 '리미니 서포트' 제공 - 오라클 데이터베이스 및 SAP ERP 유지보수 서비스를 리미니스트리트로 전환하여, IT 운영 비용 최적화 및 비즈니스 프로세스 혁신 실현 리미니스트리트는 오늘,... file newsit 2025.03.05 514
1534 카테노이드, ‘코리아 나라장터 엑스포 2025’ 참가… 공공 부문 사업 강화 - ‘룸엑스’, ‘콜러스 라이브 커머스’ 출품… 공공 미디어 콘텐츠 운영 및 관리 혁신 - GS, CSAP 인증 획득 솔루션으로 보안∙효율∙편의 강화 국내 최대 서비스형 비... file newsit 2025.03.04 647
1533 티맥스소프트, 디지털 분야 시상식 '2024 앤어워드' 수상 - 지난해 리뉴얼 한 홈페이지로 디지털 미디어 & 서비스 부문 중견기업 분야 위너 선정 - 마케팅 및 브랜딩 강화 위해 개편한 홈페이지 메뉴 구성, 편의성, 디자... file newsit 2025.03.04 548
1532 엘앤에프, “가족 친화적 따뜻한 기업문화 조성” - 임직원 자녀 23명에게 입학 축하 선물 전달… CEO 축하 편지와 외식 상품권, 문구 세트 구성 - 2023년 가족친화인증기업 선정, "아이를 키우면서도 행복하게 일... file newsit 2025.02.28 391
1531 쿤텍-비나텍, 글로벌 탄소 규제 공동 대응 MOU 체결 - 플랜ESG 도입으로 제품 탄소 배출량 데이터 관리 시스템 고도화 협력 쿤텍은 오늘 비나텍과 글로벌 탄소 규제에 공동 대응하기 위한 업무 협약(MOU)을 체결했다... file newsit 2025.02.28 432
1530 알리바바 클라우드, AI 기반 비디오 생성 모델 ‘Wan2.1’ 오픈소스 공개 - 알리바바 클라우드, 140억(14B)·13억(1.3B) 매개변수 버전의 영상 생성 모델 ‘Wan2.1’ 오픈소스로 전격 공개 - ‘Wan2.1’, VBench리더보스에서 1위 기록… 상위 5... file newsit 2025.02.28 477
1529 딥엘, 솔트룩스이노베이션과 파트너십 체결…“국내 기업 다국어 커뮤니케이션 혁신 주도” - 딥엘의 강력하고 안전한 언어 AI 서비스, 솔트룩스 이노베이션 네트워크 상의 국내 1만5000개 기업에게 제공 딥엘(DeepL)이 인공지능(AI) 기반 번역 및 언어 서... file newsit 2025.02.26 373
1528 세일즈포스, “AI 모델 선택부터 환경 구축까지 고객 자율성 확대” - 멀티모달 기능 갖춘 제미나이 모델 에이전트포스에 도입… 200만 토큰 컨텍스트 윈도우 기반의 정확도 향상 - 버텍스 AI 연계해 실시간 인사이트·응답 기능 강화... file newsit 2025.02.26 397
목록
Board Pagination Prev 1 ... 76 77 78 79 80 81 82 83 84 85 ... 234 Next
/ 234
CLOSE