- 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원

 

2025-deepseek-r1-on-aws-3-bedrock-marketplace.png

AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생성형 AI 모델을 보다 효과적으로 활용할 수 있으며, 비용 절감과 성능 향상을 동시에 누릴 수 있다.

 

딥시크(DeepSeek)202412월 딥시크-V3(DeepSeek-V3)를 출시한 이후, 2025120일 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 또한, 127일에는 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델을 추가했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

 

AWS는 고객들이 딥시크-R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다.

 

또한, AWS 트레이니움(AWS Trainium)AWS 인퍼런시아(AWS Inferentia)를 활용하면 딥시크-R1-디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장하며, 이를 통해 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다.

 

딥시크-R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스(Amazon Bedrock Marketplace)에서는 모델 카탈로그에서 딥시크-R1을 검색하여 손쉽게 배포할 수 있으며, 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크-R1-디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크-R1-디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

 

AWS는 딥시크-R1 모델을 통해 고객들이 AI 기술을 더욱 효과적으로 활용하고, 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 적극 지원할 예정이다.

 

 

#AWS#AI#딥시크#R1

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
3765 어플라이드 머티어리얼즈, ‘세미콘 코리아 2025’ 참가…“AI 시대 반도체 기술 및 트렌드 공유” file newsit 2025.02.10 214
3764 MSI 노트북, G마켓·옥션 '빅페스타'에서 역대급 할인 혜택 제공 file newsit 2025.02.10 147
3763 마우저, 실리콘랩스의 「SiWx917」 무선 SoC 공급…“와이파이 6 및 BLE 5.4 통합 싱글칩” file newsit 2025.02.10 281
3762 델, ‘2025 파트너 프로그램’ 발표…“판매 보상 지원 범위 확대” file newsit 2025.02.07 369
3761 HS효성인포메이션시스템, 2025년 AX 및 ESG 혁신 전략 발표 file newsit 2025.02.06 109
3760 헥사곤, 클라우드 기반 ADAS 및 AD 개발 및 검증 솔루션 출시…“ADAS 소프트웨어 혁신 가속” file newsit 2025.02.06 378
3759 티맥스소프트, ‘유망 SaaS 개발·육성 지원 사업’ 우수사례 선정 file newsit 2025.02.06 836
3758 와콤, 2025년 새 학기 준비 ‘이새준’ 프로모션 진행 file newsit 2025.02.06 123
3757 노르딕, 최신 전력관리 IC ‘nPM2100’ 출시…“1차 전지 기반 블루투스 저에너지용” file newsit 2025.02.05 251
3756 스노우플레이크, 코텍스 AI에서 ‘딥시크-R1’ 프리뷰 지원 file newsit 2025.02.05 359
3755 ST, 최신 센서 평가 보드 「STEVAL-MKI109D」 출시…“MEMS 센서로 유연한 개발 지원” file newsit 2025.02.05 183
3754 딥엘, 기업을 위한 API 솔루션 기능 강화…“차세대 LLM 모델 탑재 및 딥엘 라이트 추가” file newsit 2025.02.05 346
3753 카스퍼스키, 보안 인텔리전스 서비스 ‘카스퍼스키 스레드 룩업(Kaspersky Threat Lookup)' 발표…“AI 기반 OSINT 검색 기능 강화” file newsit 2025.02.05 129
3752 오라클, 업스테이지에 OCI 공급…“AI 솔루션 혁신 가속화” file newsit 2025.02.05 306
3751 조시큐리티, 악성코드 정밀 분석 솔루션 조샌드박스 V42 ‘말라카이트’ 출시 file newsit 2025.02.05 130
3750 가트너, “삼성전자, 글로벌 반도체 시장 1위 탈환” file newsit 2025.02.05 242
3749 넷앱, ‘지능형 데이터 인프라’로 한국 기업의 AI 및 데이터 혁신 가속화 file newsit 2025.02.04 92
3748 구글 클라우드, 클라우드 서비스 보안인증제 ‘하’ 등급 인증 취득 file newsit 2025.02.03 351
3747 아수스토어, 대원씨티에스와 NAS 제품 총판 계약 체결…“국내 시장 공략 강화” file newsit 2025.02.03 87
3746 네티스, ‘와이파이6 공유기 1+1 증정’ 이벤트 file newsit 2025.02.03 129
Board Pagination Prev 1 ... 74 75 76 77 78 79 80 81 82 83 ... 267 Next
/ 267
CLOSE