- 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원

 

2025-deepseek-r1-on-aws-3-bedrock-marketplace.png

AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생성형 AI 모델을 보다 효과적으로 활용할 수 있으며, 비용 절감과 성능 향상을 동시에 누릴 수 있다.

 

딥시크(DeepSeek)202412월 딥시크-V3(DeepSeek-V3)를 출시한 이후, 2025120일 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 또한, 127일에는 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델을 추가했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

 

AWS는 고객들이 딥시크-R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다.

 

또한, AWS 트레이니움(AWS Trainium)AWS 인퍼런시아(AWS Inferentia)를 활용하면 딥시크-R1-디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장하며, 이를 통해 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다.

 

딥시크-R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스(Amazon Bedrock Marketplace)에서는 모델 카탈로그에서 딥시크-R1을 검색하여 손쉽게 배포할 수 있으며, 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크-R1-디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크-R1-디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

 

AWS는 딥시크-R1 모델을 통해 고객들이 AI 기술을 더욱 효과적으로 활용하고, 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 적극 지원할 예정이다.

 

 

#AWS#AI#딥시크#R1

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1521 세일즈포스, 현대오토에버와 ‘AI 에이전트 워크샵’ 개최…"AI 에이전트 기반의 비즈니스 패러다임 전환 정조준” - 현대오토에버, 고객사 대상 AI 혁신 지원 강화 위해 세일즈포스 ‘AI 에이전트 워크샵’ 참여 - 자율형 AI 플랫폼 '에이전트포스' 활용한 실무 중심 교육으로 AI ... file newsit 2025.02.20 501
1520 다쏘시스템, 폭스바겐 그룹에 클라우드 기반 3D익스피리언스 플랫폼 공급…“차량 개발 최적화” - 다쏘시스템의 클라우드 기반 3D익스피리언스 플랫폼, 폭스바겐 그룹 차량 개발 발전 위한 기본 기술 솔루션으로 채택 - 버추얼 트윈 경험으로 복잡한 자동차 시... file newsit 2025.02.18 366
1519 티맥스소프트, 일본 홈페이지 리뉴얼 오픈…“고객 중심 글로벌 마케팅 강화” - 개편된 홈페이지 통해 글로벌 고객에게 일관된 가치와 편리한 서비스 제공 - 일본 내 다양한 수요 고려해 메인프레임 현대화 솔루션 외 SaaS, 오픈소스 등 제품... file newsit 2025.02.18 487
1518 ​​​​애브포인트, 멀티테넌트 관리 SaaS기업 ‘와이덴틱(Ydentic)’ 인수…“AI 기반 사이버 보안 및 IT 관리 기능 강화” - MSP를 위한 AI 기반 IT 환경 관리, 최적화 및 보안 강화 지원 애브포인트(AvePoint)는 오늘, 마이크로소프트 관리형 서비스 제공업체(MSP)를 위한 중앙 집중식 ... file newsit 2025.02.17 424
1517 SAP-데이터브릭스, ‘비즈니스 데이터 클라우드’ 공개 - 데이터브릭스와의 협업으로 비즈니스 AI 가속화하는 엔터프라이즈 데이터 관리의 새로운 기준 제시… AI 에이전트의 잠재력 극대화하는 혁신도 선보여 - SAP 코... file newsit 2025.02.17 403
1516 라바웨이브-법무법인 이유, 디지털 범죄 피해자 법률지원 강화 업무협약 체결 디지털 범죄 대응 전문기업 라바웨이브는 법무법인 이유와 몸캠피싱, 딥페이크 등 디지털 범죄 피해자 법률 지원 강화를 위한 전략적 업무협약(MOU)를 체결했다고... file newsit 2025.02.14 369
1515 다쏘시스템, 제품수명주기관리(PLM) 컨설팅사 피앤피어드바이저리와 전략적 파트너십 체결 - PLM 시스템 컨설팅 서비스를 통해 제조사들의 경쟁력을 강화할 수 있는 솔루션 제공 - 제조업계 고객사들이 설계 및 생산을 최적화할 수 있도록 지원할 것 다쏘... file newsit 2025.02.13 348
1514 티맥스소프트, 강화된 ‘하이퍼프레임 매니저’ 발표…“안전하고 간편한 오픈소스 관리 지원” - 오픈소스 통합 관제하는 ‘하이퍼프레임 매니저’ 기능 전반 업데이트 - 28년간 상용 SW로 갖춰온 견고한 경쟁우위 통해 오픈소스 수요에도 면밀히 대응 - 2월 28... file newsit 2025.02.13 417
1513 델-LG CNS, “AI 인프라 비즈니스 활성화 맞손” - 델-LG CNS, 전략적 MOU 체결하고 상호 협력 기반의 엔터프라이즈 AI 사업을 위한 협의체 구성 한국 델 테크놀로지스와 LG CNS가 AI 인프라 비즈니스 활성화를 ... file newsit 2025.02.13 390
1512 세일즈포스 데이터 클라우드, IDC 마켓스케이프 ‘CDP 부문 리더’ 선정…“통합 데이터 플랫폼 역량 및 AI 에이전트 시너지 인정“ - 데이터 통합・AI・거버넌스・보안 기술 전반에서 CDP 시장 선도력 입증 -B2B・B2C 부문 모두 리더로 선정... 효과적인 데이터 활용과 혁신적인 고객경험 구현 ... file newsit 2025.02.12 332
목록
Board Pagination Prev 1 ... 65 66 67 68 69 70 71 72 73 74 ... 222 Next
/ 222
CLOSE