- 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원

 

2025-deepseek-r1-on-aws-3-bedrock-marketplace.png

AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생성형 AI 모델을 보다 효과적으로 활용할 수 있으며, 비용 절감과 성능 향상을 동시에 누릴 수 있다.

 

딥시크(DeepSeek)202412월 딥시크-V3(DeepSeek-V3)를 출시한 이후, 2025120일 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 또한, 127일에는 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델을 추가했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

 

AWS는 고객들이 딥시크-R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다.

 

또한, AWS 트레이니움(AWS Trainium)AWS 인퍼런시아(AWS Inferentia)를 활용하면 딥시크-R1-디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장하며, 이를 통해 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다.

 

딥시크-R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스(Amazon Bedrock Marketplace)에서는 모델 카탈로그에서 딥시크-R1을 검색하여 손쉽게 배포할 수 있으며, 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크-R1-디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크-R1-디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

 

AWS는 딥시크-R1 모델을 통해 고객들이 AI 기술을 더욱 효과적으로 활용하고, 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 적극 지원할 예정이다.

 

 

#AWS#AI#딥시크#R1

 

 
?

  1. 슈나이더 일렉트릭,  AI 에너지 및 지속 가능성 문제 해결 위한 엔비디아 협력 솔루션 발표

    - 고밀도 AI 클러스터 지원을 위한 액체 냉각 기반 엔비디아 협력 데이터센터 레퍼런스 디자인 공개 - 재생 가능 에너지 확보 및 현장 발전 최적화, 데이터센터 운영 효율화를 위한 포괄적인 솔루션 제공 슈나이더 일렉트릭이 AI에 대한 높은 수요로 인해 발생...
    Date2024.12.26 Bynewsit Views341
    Read More
  2. 버티브, 냉수식 냉각 솔루션버티브 「Liebert AHU」 출시

    - 최소한의 풋프린트로 높은 열 부하 지원 버티브(Vertiv)는 새롭게 업그레이드된 대용량 냉수식 냉각 솔루션 버티브 리버트 AHU(Air Handling Unit)를 출시한다고 밝혔다. Liebert AHU는 고밀도 컴퓨팅 환경에 사용하기에 적합하도록 설계되었으며, 열 관리에...
    Date2023.02.23 Bynewsit Views342
    Read More
  3. 다쏘시스템, 삼성웰스토리에 ‘3D 익스피리언스’ 플랫폼 구축

    - 삼성웰스토리, 다쏘시스템 3D 익스피리언스 플랫폼 바탕으로 라이프 사이클 전반에 생성되는 정보를 통합하여 데이터 중심의 환경 구축 - 다쏘시스템, 식음 업계에 특화된 식품 전문 PLM 솔루션 제공…B2B 식음 업계 디지털 트렌스포메이션 지원 다쏘시스템이...
    Date2023.04.03 Bynewsit Views342
    Read More
  4. 세일즈포스, ‘AI 클라우드’ 발표…“신뢰 기반의 생성형 AI의 미래 제시”

    - 아인슈타인 GPT의 트러스트 레이어 통해 데이터 레지던시, 보안, 규정준수 관련 기업 부담 완화 - 세일즈포스 연구조사 결과, 약 73%의 직원이 생성형 AI가 새로운 보안 문제 야기할 것이라 응답 세일즈포스는 기업 내 모든 애플리케이션과 워크플로우 상에...
    Date2023.06.15 Bynewsit Views342
    Read More
  5. 엔씨소프트, 자체 AI 언어 모델 ‘VARCO’ 공개

    - 국내 게임사 최초로 자체 개발한 AI 언어 모델… 생성 AI 연구 및 사업 본격화 - 이미지, 텍스트, 디지털 휴먼 콘텐츠 생성 가능한 AI 플랫폼 ‘VARCO Studio’ 선보여 - 국내 기업 언어 모델 최초 아마존 세이지메이커 점프스타트 입점…한 달 무료 이용 가능 ...
    Date2023.08.16 Bynewsit Views342
    Read More
  6. SAP, WTA의 데이터 기반 운영 효율성 제고

    - SAP, SAP 비즈니스 테크놀로지 플랫폼으로 여자 테니스 협회(WTA) 데이터 관리 일원화 및 인사이트 도출 지원 - WTA, 오는 10월 하나은행 코리아오픈 테니스대회 비롯해 다수의 대회 연내 개최하고 SAP 솔루션 적극 활용 SAP는 여자 테니스 협회(WTA)가 SAP ...
    Date2023.08.28 Bynewsit Views342
    Read More
  7. 윈드리버, 中 전기차 호존의 지능형 차량 플랫폼에 ‘윈드리버 리눅스’ 공급

    윈드리버는 중국 전기차 제조업체 ‘호존(Hozon New Energy Automobile Co., Ltd.)’이 ‘호존 오토모티브 지능형 보안 차량 플랫폼(Hozon Automotive Intelligent Security Vehicle Platform)’ 개발을 위해 ‘윈드리버 리눅스(Wind River Linux)’를 채택했다고 밝...
    Date2023.10.18 Bynewsit Views342
    Read More
  8. 슈나이더 일렉트릭 코리아, ‘지속가능한 데이터센터’ 온디멘드 캠페인 진행

    - 데이터센터의 환경·사회·지배구조(ESG) 경영, 지속가능한 데이터센터 구축과 운영 방안 확인 가능 - 5개 주제로 주 1회 이메일 및 SNS를 통해 공유, 영상 시청 이벤트 진행 슈나이더 일렉트릭 코리아가 자사 미디어 채널에서 ‘이노베이션 데이: 지속가능한 ...
    Date2023.11.27 Bynewsit Views342
    Read More
  9. BGF리테일, UiPath 자동화 및 구축형 AI 도입…“운영 효율성 강화”

    유아이패스(UiPath)는 한국의 주요 편의점 체인인 CU를 운영하는 BGF리테일이 자동화와 AI 결합을 통해 임직원 업무의 효율성을 향상시키고 운영 리스크를 줄이고 있다고 발표했다. BGF리테일은 2022년 유아이패스 솔루션을 처음 도입하고, 금번 AI 기술 기반...
    Date2024.07.15 Bynewsit Views342
    Read More
  10. SAS코리아, ‘IDC 데이터 및 AI 현황: 2024 아시아 태평양 지역’의 조사 결과 발표…“한국, AI 채택과 통합 우위 및 신뢰성 있는 AI 중요성 인지”

    - 한국, 자율주행차, 헬스케어, 스마트 제조업 등 AI 기술 적극 도입 - 신뢰할 수 있는 AI를 우선적으로 고려하는 균형 잡힌 접근 방식 채택 SAS는 <IDC 데이터 및 AI 현황: 2024 아시아 태평양 지역>의 조사 결과 발표를 발표하고, 한국은 AI 채택 및 통합에...
    Date2024.11.06 Bynewsit Views342
    Read More
목록
Board Pagination Prev 1 ... 115 116 117 118 119 120 121 122 123 124 ... 202 Next
/ 202
CLOSE