- 최대 95% 비용 절감 효과와 강화 학습 기법을 적용해 고성능 생성형 AI 활용 지원

 

2025-deepseek-r1-on-aws-3-bedrock-marketplace.png

AWS는 딥시크-R1(DeepSeek-R1) 모델을 아마존 베드록(Amazon Bedrock)과 아마존 세이지메이커 AI(Amazon SageMaker AI)에서 제공한다고 발표했다. 이를 통해 기업은 최신 생성형 AI 모델을 보다 효과적으로 활용할 수 있으며, 비용 절감과 성능 향상을 동시에 누릴 수 있다.

 

딥시크(DeepSeek)202412월 딥시크-V3(DeepSeek-V3)를 출시한 이후, 2025120일 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 또한, 127일에는 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델을 추가했다. 딥시크에 따르면, 해당 모델들은 기존 대비 90~95% 비용 절감 및 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다.

 

AWS는 고객들이 딥시크-R1모델을 다양한 방식으로 활용할 수 있도록 지원한다. 아마존 베드록에서는 API를 통해 사전 학습된 모델을 쉽게 통합할 수 있으며, 아마존 세이지메이커 AI를 통해 맞춤형 학습과 배포가 가능하다.

 

또한, AWS 트레이니움(AWS Trainium)AWS 인퍼런시아(AWS Inferentia)를 활용하면 딥시크-R1-디스틸 모델을 더욱 경제적으로 운영할 수 있다. AWS는 보안성과 확장성을 강화하기 위해 아마존 베드록 가드레일(Amazon Bedrock Guardrails)을 활용할 것을 권장하며, 이를 통해 생성형 AI 애플리케이션의 입력 및 출력 데이터를 모니터링하고 유해 콘텐츠를 필터링할 수 있다.

 

딥시크-R1모델은 현재 AWS에서 네 가지 방식으로 배포할 수 있다. 아마존 베드록 마켓플레이스(Amazon Bedrock Marketplace)에서는 모델 카탈로그에서 딥시크-R1을 검색하여 손쉽게 배포할 수 있으며, 아마존 세이지메이커 점프스타트(Amazon SageMaker JumpStart)를 통해 머신러닝 허브에서 클릭 한 번으로 배포 및 활용이 가능하다. 또한, 아마존 베드록 커스텀 모델 임포트를 활용하면 딥시크-R1-디스틸 모델을 맞춤형 모델로 가져와 활용할 수 있으며, AWS EC2 Trn1 인스턴스(AWS EC2 Trn1 Instance)를 사용하면 딥시크-R1-디스틸 모델을 AWS 트레이니움 및 AWS 인퍼런시아 기반 인프라에서 최적의 성능과 비용 효율성을 제공하며 실행할 수 있다.

 

AWS는 딥시크-R1 모델을 통해 고객들이 AI 기술을 더욱 효과적으로 활용하고, 안전하고 책임감 있는 AI 환경을 조성할 수 있도록 적극 지원할 예정이다.

 

 

#AWS#AI#딥시크#R1

 

 
?

  1. 델, 2025년 AI 기반 클라이언트 신제품 공개…“새로운 통합 브랜딩 적용”

    - AI 시대를 맞아 업무 효율과 생산성을 혁신시킬 수 있는 AI PC∙업무용 모니터 등 클라이언트 포트폴리오 전시 - 엔비디아 그레이스 블랙웰 등 최신 AI 기술을 기반으로 클라이언트 솔루션 포트폴리오 확장, 개별 사용자 환경에서부터 대규모 데이터 센터 구...
    Date2025.03.27 Bynewsit Views438
    Read More
  2. 사이냅소프트 ‘문서뷰어 2025’, 대화형 AI 에이전트 구축의 새로운 동반자로 자리매김

    - 대화형 AI 에이전트 구축에 문서뷰어 활용니즈 증가 - AI 에이전트와의 완벽한 조화, 사이냅 문서 뷰어 사이냅소프트는 최근 출시한 ‘사이냅 문서뷰어 2025’가 대화형 AI 에이전트 구축의 필수적인 도구로 자리 잡으며 많은 기업과 기관의 주목을 받고 있다...
    Date2025.03.26 Bynewsit Views440
    Read More
  3. 매스웍스-알테라, AI 활용해 5G 및 6G 무선 시스템 개발 가속화

    - AI 기반 오토인코더 사용해 채널 상태 정보 데이터 압축… 네트워크 효율성 향상 및 비용 절감 매스웍스는 인텔의 자회사인 알테라(Altera)와 함께 알테라 FPGA의 무선 개발 가속화를 위한 협력 계획을 발표했다. 이를 통해 무선 시스템 엔지니어들은 AI 기반...
    Date2025.03.25 Bynewsit Views443
    Read More
  4. 와탭랩스, ‘2025 SW 마켓 페어’에서 공공 부문 디지털 전환 옵저버빌리티 솔루션 ‘와탭’ 공개

    - 27일 국내 대표 SW 전시회 ‘2025 SW 마켓 페어’ 참가 - ‘공공기관 대규모 모니터링 도입 사례 및 장애 진단 방법론’ 주제 발표 및 솔루션 전시 옵저버빌리티 전문 기업 와탭랩스가 오는 27일 정부세종컨벤션센터에서 열리는 ‘2025년 소프트웨어 마켓 페어(20...
    Date2025.03.25 Bynewsit Views799
    Read More
  5. 위로보틱스, 윔 보행운동센터 오픈 1주년 기념 참여자 데이터 공개

    - 전국, 전 세계에서 찾는 국내 최초의 로봇 보행전문 운동센터 웨어러블 로봇 리딩기업 위로보틱스가 서울에 위치한 “윔 보행운동 센터”의 오픈 1주년을 기념해 참여자 데이터를 공개했다. 국내 최초 로봇 보행전문 운동센터인 윔 보행운동센터를 방문하여 웨...
    Date2025.03.25 Bynewsit Views797
    Read More
  6. 리미니스트리트, SAP ERP 유지 보수 서비스 ‘리미니 서포트’ KBS에 공급

    - SAP ERP 유지보수를 리미니스트리트로 전환하여, 비용 절감 및 맞춤형 지원 서비스 리미니스트리트는 오늘 대한민국 KBS가 IT 운영 효율화를 위해 자사의 3자 유지보수 서비스 ‘리미니 서포트(Rimini Support)’를 도입했다고 발표했다. KBS는 대한민국의 대...
    Date2025.03.25 Bynewsit Views722
    Read More
  7. [GTC 2025] 엔비디아, GH200·GB200 슈퍼칩 기반 쿠다-X 라이브러리로 과학·공학 혁신 가속

    - 컴퓨팅 엔지니어링 툴 최대 11배 가속, 최대 5배 큰 계산 수행 - CPU-GPU 리소스 간 통합과 조정 강화해 엔지니어링 시뮬레이션과 설계 최적화 가속 - 엔비디아 쿠퀀텀 라이브러리, 양자 컴퓨팅 프레임워크와 통합으로 시뮬레이션 성능 극대화 엔비디아는 GT...
    Date2025.03.24 Bynewsit Views575
    Read More
  8. 다쏘시스템코리아-IBCT, 버추얼 트윈과 디지털 제품 패스포트 결합해 글로벌 ESG 규제 대응 협력

    다쏘시스템코리아와 탈중앙화 ID(DID) 및 DID 기반 데이터 플랫폼 전문 기술기업 아이비씨티가 글로벌 ESG 규제 대응을 위한 혁신적 협력을 발표했다. 이번 전략적 업무협약(MOU)을 통해 양사는 기업이 ESG 규제를 준수하고 탄소 배출량을 효과적으로 분석·관...
    Date2025.03.24 Bynewsit Views522
    Read More
  9. [GTC 2025] 엔비디아, ‘RTX PRO 6000 블랙웰 서버 에디션’ 발표…“AI와 그래픽 융합 가속화”

    - 블랙웰 범용 데이터센터 GPU로 고성능 엔터프라이즈 워크로드 지원 - AI, 반도체, 생명과학 등 다양한 산업에서 워크로드 가속화 - 5월부터 시스템 파트너와 클라우드 제공업체 통해 출시 예정 엔비디아은 GTC 2025에서 엔비디아 RTX PRO 6000 블랙웰 서버 ...
    Date2025.03.21 Bynewsit Views543
    Read More
  10. [GTC 2025] 엔비디아, 세계 최대 프랜차이즈 ‘얌 브랜드’와 요식산업 혁신 가속

    - KFC, 타코벨, 피자헛 모회사 얌 브랜드, 엔비디아 AI 적용해 주문 간소화와 운영 최적화 실현 - 올해 최대 500개 이상 매장에 AI 솔루션 확대 적용으로 레스토랑 전반 서비스 향상 GTC 2025에서 엔비디아는 글로벌 외식기업 얌 브랜드(Yum! Brands)와 전략적...
    Date2025.03.21 Bynewsit Views583
    Read More
목록
Board Pagination Prev 1 ... 75 76 77 78 79 80 81 82 83 84 ... 238 Next
/ 238
CLOSE