- AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능

- AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공

- 소프트서브, 엔비디아 NIMAWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개발

 

엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화.jpg

엔비디아 아마존 웹 서비스(AWS) AI 서비스 전반에 엔비디아(NVIDIA) NIM 마이크로서비스를 확장한다고 발표했다. 생성형 AI는 산업을 빠르게 변화시키고 있으며, 점점 더 복잡해지는 모델을 효율적이고 비용 효과적으로 확장하기 위해 안전한 고성능 추론 솔루션에 대한 수요를 촉진하고 있다.

 

AWS는 지난 4일(현지시간) 열린 연례 AWS 리인벤트(re:Invent) 콘퍼런스에서 엔비디아와의 협업을 확대해 주요 AWS AI 서비스 전반에 걸쳐 엔비디아 NIM 마이크로서비스를 확장한다고 발표했다. 이를 통해 생성형 AI 애플리케이션을 위한 더 빠른 AI 추론과 짧은 지연 시간을 지원한다.

 

엔비디아 NIM 마이크로서비스는 이제 AWS 마켓플레이스(Marketplace), 아마존 베드록 마켓플레이스(Bedrock Marketplace), 아마존 세이지메이커 점프스타트(SageMaker JumpStart)에서 직접 제공된다. 이로 인해 개발자들이 일반적으로 사용되는 모델에 대해 엔비디아 최적화 추론을 대규모로 배포하는 것이 더욱 쉬워졌다.

 

엔비디아 NIM은 AWS 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼의 일부이다. 이는 개발자에게 클라우드, 데이터센터, 워크스테이션 전반에서 고성능 엔터프라이즈급 AI 모델 추론을 안전하고 안정적으로 배포하도록 설계된 사용하기 쉬운 마이크로서비스 세트를 제공한다.

 

이 사전 구축된 컨테이너는 엔비디아 트리톤 추론 서버(Triton Inference Server), 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 파이토치(PyTorch)와 같은 강력한 추론 엔진을 기반으로 구축됐다. 아울러 오픈 소스 커뮤니티 모델부터 엔비디아 AI 파운데이션(AI Foundation) 모델, 맞춤형 모델에 이르기까지 광범위한 범위의 AI 모델을 지원한다.

 

NIM 마이크로서비스는 아마존 엘라스틱 컴퓨트 클라우드(Elastic Compute Cloud, EC2), 아마존 엘라스틱 쿠버네티스 서비스(Elastic Kubernetes Service, EKS), 아마존 세이지메이커를 비롯한 다양한 AWS 서비스에 배포할 수 있다.

 

개발자들은 일반적으로 사용되는 모델과 모델 제품군으로 구축된 100개 이상의 NIM 마이크로서비스를 엔비디아 API 카탈로그에서 미리 볼 수 있다. 여기에는 메타(Meta)의 라마 3(Llama 3), 미스트랄 AI(Mistral AI)의 미스트랄과 믹스트랄(Mixtral), 엔비디아의 네모트론(Nemotron), 스태빌리티 AI(Stability AI)의 SDXL 등이 있다. 가장 일반적으로 사용되는 모델은 AWS 서비스에 배포하기 위한 자체 호스팅에 사용할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에서 실행되도록 최적화돼 있다.

 

모두를 위한 AWS의 NIM

다양한 산업 분야의 고객과 파트너들이 AWS에서 NIM을 활용하며 시장에 더 빨리 진입하고, 생성형 AI 애플리케이션과 데이터의 보안과 제어를 유지하며, 비용을 절감하고 있다.

 

IT 컨설팅과 디지털 서비스 제공업체인 소프트서브(SoftServe)는 AWS에 완전히 배포되고, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션을 개발했다. 이 솔루션은 AWS 마켓플레이스에서 제공되며, 소프트서브 생성형 AI 신약 개발(Gen AI Drug Discovery), 소프트서브 생성형 AI 산업 비서(Industrial Assistant), 디지털 컨시어지(Digital Concierge), 멀티모달 RAG 시스템(Multimodal RAG System), 콘텐츠 크리에이터(Content Creator), 음성 인식 플랫폼(Speech Recognition Platform)으로 구성된다.

 

이들 모두는 AI 애플리케이션 개발과 배포를 가속화하는 포괄적인 참조 워크플로우인 엔비디아 AI 블루프린트(Blueprint)를 기반으로 한다. 아울러 AI 에이전트, 디지털 트윈 등을 위한 엔비디아 가속 라이브러리, 소프트웨어 개발 키트, NIM 마이크로서비스가 포함된다.

 

AWS에서 NIM 시작하기

개발자는 고유한 필요와 요구사항에 따라 AWS에 엔비디아 NIM 마이크로서비스를 배포할 수 있다. 이를 통해 개발자와 기업은 다양한 AWS 서비스 전반에서 엔비디아에 최적화된 추론 컨테이너로 고성능 AI를 구현할 수 있다.

 

엔비디아 API 카탈로그를 방문해 100개 이상의 다양한 NIM 최적화 모델을 사용해 볼 수 있다. 또한, 개발자 라이선스 또는 90일 엔비디아 AI 엔터프라이즈 체험 라이선스를 요청해 AWS 서비스에 마이크로서비스 배포를 할 수 있다. 개발자는 AWS 마켓플레이스, 아마존 베드록 마켓플레이스 또는 아마존 세이지메이커 점프스타트에서 NIM 마이크로서비스를 알아볼 수도 있다.

 

#엔비디아#AWS#NIM

?

  1. 와콤, 서울 일러스트레이션 페어(SIF) Vol.18’ 참가…타블렛 특별 할인 이벤트

    - 와콤 인튜어스 및 신티크 프로 패밀리 등 전 제품 현장 특가 판매 실시 와콤코리아가 서울 코엑스에서 금일부터 오는 29일(일)까지 개최되는 ‘서울일러스트레이션페어(SIF) Vol.18’에 참가해 부스를 운영, 와콤 펜 타블렛 및 액정 타블렛 현장 특가 할인 판...
    Date2024.12.26 Bynewsit Views167
    Read More
  2. 메이머스트, 70억원 규모 프리IPO 투자 유치

    - 인공지능(AI), 데스크톱 가상화(VDI) 및 모바일가상화(VMI) 솔루션, 클라우드 기반 주요 사업 강화 AI 및 클라우드 보안 전문기업 메이머스트는 오늘 70억 원 규모의 프리 IPO 투자를 성공적으로 유치했다고 밝혔다. 이번 투자에는 기존 투자자인 키움인베스...
    Date2024.12.26 Bynewsit Views408
    Read More
  3. 카테노이드, 아리랑국제방송 온라인 라이브 스트리밍 품질 향상…“시청자 경험 개선”

    - 국가 및 지역별 네트워크 최적화, CDN 맵 분리로 캐시 히트율 향상 - QoE 시스템 도입을 통한 안정적 서비스 운영 환경 제공 - 약 430개 글로벌 방송사 및 해외 OTT 사업자 서비스 품질 개선 기여 카테노이드는 국제방송교류재단 아리랑국제방송의 글로벌 라...
    Date2024.12.26 Bynewsit Views354
    Read More
  4. 아이스아이, SAR 위성 2기 중간경사궤도 안착 성공…“지구관측 역량 확대”

    - 중간경사궤도는 지구 중위도 지역에서 더 많은 SAR 영상 촬영 가능. 아이스아이(ICEYE)는 SAR 위성군에 신규 위성 2기를 추가로 발사했다고 발표했다. 두 위성은 아이스아이의 최신 영상 촬영 기술을 활용해 25cm 고해상도 영상을 추가로 제공할 수 있다. 이...
    Date2024.12.24 Bynewsit Views107
    Read More
  5. 가민, 한 해를 돌아보는 ‘2024 가민 커넥트 데이터 보고서’ 발표

    - 2024년 한 해의 가민 커넥트 기반 건강 및 웰니스, 피트니스 지표 발표 - 웰니스 지표별 최상위, 최하위 국가 평균 및 한국 평균 점수 공개 - 훈련 및 피트니스 지표와 올 한 해 활동량 상승한 상위 활동 소개 가민은 자사의 건강 및 피트니스 활동 분석 및 ...
    Date2024.12.24 Bynewsit Views170
    Read More
  6. 케이투스, ‘액체 냉각’ 기술 탑재한 차세대 V3 서버 제품군 발표…“AI 시대 완벽 대응”

    - 케이투스 V3 서버, 포괄적인 R&D 생산 테스트 납품 아우르는 엔드투엔드 액체 냉각 솔루션 전문성 통해 효율적인 대규모 AI 배포 과제 해결 지원 케이투스(KAYTUS)가 최적화된 ‘액체 냉각’ 기술을 탑재한 차세대 V3 서버 제품군을 출시한다고 발표했다. V3 ...
    Date2024.12.23 Bynewsit Views122
    Read More
  7. MSI, 컴퓨존과 연말 맞이 인텔 콤보 패키지 특가 판매 및 PMC 추가 이벤트

    - 인텔 콤보 패키지 특가, PBM PC 추가 프로모션 등 풍성한 혜택 엠에스아이코리아는 연말을 맞아 컴퓨존에서 인텔 콤보 패키지 특가와 인텔 조립PC 연말 프로모션을 진행한다고 밝혔다. 인텔 X MSI 콤보 패키지 특가 이벤트 인텔 X MSI 콤보 패키지 특가 이벤...
    Date2024.12.23 Bynewsit Views166
    Read More
  8. 슈나이더 일렉트릭 코리아, 권지웅 신임 대표 선임…”IT·에너지 산업 전문가의 혁신적 리더십 기대“

    슈나이더 일렉트릭 코리아가 2025년 1월 1일부로 권지웅 현 전력 사업부 부사장을 신임 대표로 선임한다고 밝혔다. 권지웅 신임 대표는 2018년 슈나이더 일렉트릭 코리아에 합류하여 한국·대만·몽골 클러스터의 IT 사업부 비즈니스 부사장을 역임한 후, 2021년...
    Date2024.12.23 Bynewsit Views358
    Read More
  9. 세일즈포스, 2024년 사이버 위크 글로벌 쇼핑 데이터 분석 발표…“사상 최대 3,149억 달러 매출 기록... AI가 600억 달러 매출 견인”

    - 모바일·소셜 커머스가 새로운 쇼핑 트렌드 주도... 전년 대비 매출 6% 성장 - AI 활용 기업 구매 전환율 2% 높아... 고객 서비스 참여도 38% 증가 - 중국발 가격 경쟁 속 글로벌 기업들 서비스 차별화로 대응... 평균 할인율 오히려 1%p 감소 - AI 에이전트 ...
    Date2024.12.23 Bynewsit Views347
    Read More
  10. 카스퍼스키, 2025년 IT 공급망 위험 시나리오 분석 보고서 발표

    - AI 서비스, 위성통신, 인터넷 인프라 등 5대 IT 공급망 취약점 분석하고 대응 방안 제시 - "공급업체 다변화와 보안 강화로 IT 공급망 위험 대비해야" 조언 글로벌 보안 기업 카스퍼스키는 최근 발표한 'Kaspersky Security Bulletin' 연례 보고서에서 2025...
    Date2024.12.23 Bynewsit Views160
    Read More
  11. 캐논코리아, 여성가족부 '가족친화 우수기업' 재인증 획득

    - 2016년 신규 인증 취득 후, 재인증 위한 평가 거쳐 4회 연속 ‘가족친화 우수기업’으로 인증 - 유연근무제, 효친휴가제, 리프레시 휴가제 등 직원들의 워크라이프 밸런스 지원하는 다양한 복지 제도 운영 - 출산, 육아 지원하는 복지와 직원 소속감을 높이는 ...
    Date2024.12.23 Bynewsit Views498
    Read More
  12. 유아이패스, 2025년 AI 및 자동화 트렌드 발표

    - 사람, 로봇, 에이전트 간의 조화로운 협업 촉진할 AI 및 자동화 기반 직장 생태계 구축 유아이패스는 오늘 2025년 AI와 자동화 분야의 발전을 이끌 핵심 트렌드를 발표하고, 2025년에는 AI와 자동화가 통합되어 업무의 미래를 혁신하며 사람과 기계 간 전례 ...
    Date2024.12.23 Bynewsit Views583
    Read More
  13. MSI, AI 비즈니스 노트북 '프레스티지 16/14 AI+ Evo' 출시

    - 최대 115 TOPS와 Copilot+ PC 기능으로 강력한 AI 성능 제공 - 초경량 바디와 최대 25시간 사용 시간 배터리로 인텔 이보 에디션 획득 엠에스아이코리아는 인텔 루나레이크 프로세서를 탑재한 프리미엄 AI 비즈니스 노트북 '프레스티지 16/14 AI+ Evo'를 출...
    Date2024.12.20 Bynewsit Views165
    Read More
  14. 마우저, 산업 애플리케이션 정밀 센싱용 ADI 「MAX32675C」 마이크로컨트롤러 공급

    마우저 일렉트로닉스는 아나로그디바이스(ADI)의 초저전력 Arm Cortex-M4F 기반 MAX32675C 마이크로컨트롤러(MCU)를 공급한다고 밝혔다. 이 고집적 혼성신호 마이크로컨트롤러는 초저전력 소모를 유지하면서 우수한 성능을 제공한다. MAX32675C MCU는 산업 및 ...
    Date2024.12.20 Bynewsit Views247
    Read More
  15. 스틸시리즈, ‘스틸시리즈와 함께하는 12월의 발로란트’ 대회 개최

    - 12월 21일 (토) 19시 대회 진행 및 네이버 치지직에서 전 경기 송출 - 크리에이터들의 발로란트 게이밍 실력 성장 스토리 담아 스틸시리즈(SteelSeries)는 오늘 ‘스틸시리즈와 함께하는 12월의 발로란트’ 대회를 개최한다고 밝혔다. 스틸시리즈와 치지직 스...
    Date2024.12.20 Bynewsit Views152
    Read More
  16. 한국레노버, 상록보육원에 크리스마스 선물과 후원 물품 전달

    - 한국레노버, 지난 18일 상록보육원 후원 봉사활동 진행 - 아이를 위한 크리스마스 선물 및 생필품 등 후원 물품 전달 한국레노버가 지난 18일 서울시 관악구에 위치한 상록보육원에 아이들을 위한 크리스마스 선물과 각종 후원 물품을 전달했다고 밝혔다. 한...
    Date2024.12.20 Bynewsit Views537
    Read More
  17. 삼성전자, 비스포크 AI 스팀 ‘개인정보보호 중심 설계’ 인증 획득

    삼성전자 로봇청소기 ‘비스포크 AI 스팀’이 19일 로봇청소기 최초로 개인정보보호위원회와 한국인터넷진흥원(KISA)이 주관하는 ‘개인정보보호 중심 설계(PbD)’ 인증을 획득했다. PbD는 제품 또는 서비스의 기획·제조·폐기 등 전 과정에서 개인정보보호 요소를 ...
    Date2024.12.19 Bynewsit Views158
    Read More
  18. 캐논코리아, 미래 사진 및 영상 분야 선도할 ‘2024 미래작가상‘ 수상자 발표

    - 미래 작가로서의 소양 보여준 총 181명의 공모전 참가자 중 최종 4인(사진 2인/영상 2인)의 작품 선정 - 수상자 대상 캐논 EOS R6 Mark ll 24-105 USM KIT, 전문가 튜터링, 전시회 등 다양한 혜택 및 기회 제공 캐논코리아가 박건희문화재단과 함께 실시한 ...
    Date2024.12.19 Bynewsit Views143
    Read More
  19. 이글루코퍼레이션, AI·SIEM 특허 2건 취득

    - 이글루코퍼레이션, AI 모델 성능 및 데이터 분석 효율성 높이는 특허 획득 - 보안 효율성과 대응력 높이는 핵심 기술 토대로 상향평준화된 보안 대응 체계 구현 지원 이글루코퍼레이션은 AI 기반 보안 운영 효율성 및 정확도 향상을 위한 2건의 인공지능(AI)...
    Date2024.12.19 Bynewsit Views166
    Read More
  20. 코보, 2024년 세계반도체연맹으로부터 ‘가장 존경받는 상장 반도체 기업상’ 수상

    코보(Qorvo)는 세계반도체연맹(GSA)으로부터 2024년 ‘가장 존경받는 상장 반도체 기업상(Most Respected Public Semiconductor Company Award)’을 수상했다고 발표했다. 코보는 2022년에 동일한 부문에서 이 상을 받은 바 있으며, 이번이 두 번째 수상이다. 세...
    Date2024.12.19 Bynewsit Views216
    Read More
Board Pagination Prev 1 ... 85 86 87 88 89 90 91 92 93 94 ... 272 Next
/ 272
CLOSE