- AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능

- AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공

- 소프트서브, 엔비디아 NIMAWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개발

 

엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화.jpg

엔비디아 아마존 웹 서비스(AWS) AI 서비스 전반에 엔비디아(NVIDIA) NIM 마이크로서비스를 확장한다고 발표했다. 생성형 AI는 산업을 빠르게 변화시키고 있으며, 점점 더 복잡해지는 모델을 효율적이고 비용 효과적으로 확장하기 위해 안전한 고성능 추론 솔루션에 대한 수요를 촉진하고 있다.

 

AWS는 지난 4일(현지시간) 열린 연례 AWS 리인벤트(re:Invent) 콘퍼런스에서 엔비디아와의 협업을 확대해 주요 AWS AI 서비스 전반에 걸쳐 엔비디아 NIM 마이크로서비스를 확장한다고 발표했다. 이를 통해 생성형 AI 애플리케이션을 위한 더 빠른 AI 추론과 짧은 지연 시간을 지원한다.

 

엔비디아 NIM 마이크로서비스는 이제 AWS 마켓플레이스(Marketplace), 아마존 베드록 마켓플레이스(Bedrock Marketplace), 아마존 세이지메이커 점프스타트(SageMaker JumpStart)에서 직접 제공된다. 이로 인해 개발자들이 일반적으로 사용되는 모델에 대해 엔비디아 최적화 추론을 대규모로 배포하는 것이 더욱 쉬워졌다.

 

엔비디아 NIM은 AWS 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼의 일부이다. 이는 개발자에게 클라우드, 데이터센터, 워크스테이션 전반에서 고성능 엔터프라이즈급 AI 모델 추론을 안전하고 안정적으로 배포하도록 설계된 사용하기 쉬운 마이크로서비스 세트를 제공한다.

 

이 사전 구축된 컨테이너는 엔비디아 트리톤 추론 서버(Triton Inference Server), 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 파이토치(PyTorch)와 같은 강력한 추론 엔진을 기반으로 구축됐다. 아울러 오픈 소스 커뮤니티 모델부터 엔비디아 AI 파운데이션(AI Foundation) 모델, 맞춤형 모델에 이르기까지 광범위한 범위의 AI 모델을 지원한다.

 

NIM 마이크로서비스는 아마존 엘라스틱 컴퓨트 클라우드(Elastic Compute Cloud, EC2), 아마존 엘라스틱 쿠버네티스 서비스(Elastic Kubernetes Service, EKS), 아마존 세이지메이커를 비롯한 다양한 AWS 서비스에 배포할 수 있다.

 

개발자들은 일반적으로 사용되는 모델과 모델 제품군으로 구축된 100개 이상의 NIM 마이크로서비스를 엔비디아 API 카탈로그에서 미리 볼 수 있다. 여기에는 메타(Meta)의 라마 3(Llama 3), 미스트랄 AI(Mistral AI)의 미스트랄과 믹스트랄(Mixtral), 엔비디아의 네모트론(Nemotron), 스태빌리티 AI(Stability AI)의 SDXL 등이 있다. 가장 일반적으로 사용되는 모델은 AWS 서비스에 배포하기 위한 자체 호스팅에 사용할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에서 실행되도록 최적화돼 있다.

 

모두를 위한 AWS의 NIM

다양한 산업 분야의 고객과 파트너들이 AWS에서 NIM을 활용하며 시장에 더 빨리 진입하고, 생성형 AI 애플리케이션과 데이터의 보안과 제어를 유지하며, 비용을 절감하고 있다.

 

IT 컨설팅과 디지털 서비스 제공업체인 소프트서브(SoftServe)는 AWS에 완전히 배포되고, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션을 개발했다. 이 솔루션은 AWS 마켓플레이스에서 제공되며, 소프트서브 생성형 AI 신약 개발(Gen AI Drug Discovery), 소프트서브 생성형 AI 산업 비서(Industrial Assistant), 디지털 컨시어지(Digital Concierge), 멀티모달 RAG 시스템(Multimodal RAG System), 콘텐츠 크리에이터(Content Creator), 음성 인식 플랫폼(Speech Recognition Platform)으로 구성된다.

 

이들 모두는 AI 애플리케이션 개발과 배포를 가속화하는 포괄적인 참조 워크플로우인 엔비디아 AI 블루프린트(Blueprint)를 기반으로 한다. 아울러 AI 에이전트, 디지털 트윈 등을 위한 엔비디아 가속 라이브러리, 소프트웨어 개발 키트, NIM 마이크로서비스가 포함된다.

 

AWS에서 NIM 시작하기

개발자는 고유한 필요와 요구사항에 따라 AWS에 엔비디아 NIM 마이크로서비스를 배포할 수 있다. 이를 통해 개발자와 기업은 다양한 AWS 서비스 전반에서 엔비디아에 최적화된 추론 컨테이너로 고성능 AI를 구현할 수 있다.

 

엔비디아 API 카탈로그를 방문해 100개 이상의 다양한 NIM 최적화 모델을 사용해 볼 수 있다. 또한, 개발자 라이선스 또는 90일 엔비디아 AI 엔터프라이즈 체험 라이선스를 요청해 AWS 서비스에 마이크로서비스 배포를 할 수 있다. 개발자는 AWS 마켓플레이스, 아마존 베드록 마켓플레이스 또는 아마존 세이지메이커 점프스타트에서 NIM 마이크로서비스를 알아볼 수도 있다.

 

#엔비디아#AWS#NIM

?

  1. EDB, 한국 지사에 김희배 신임 지사장 선임…“포스트그레스 및 AI 기반 데이터 혁신의 새 시대 열 것”

    - 28년 이상 데이터와 분석 테크놀로지, 기술 생태계 조성에 앞장선 전문가 - 오픈소스 포스트그레스 데이터베이스와 AI 솔루션의 적용 범위를 넓히고, 도입 고객들이 디지털 혁신을 이어갈 수 있도록 지원 - 금융 및 공공 시장뿐만 아니라 제조, 유통 등 다양...
    Date2025.02.03 Bynewsit Views405
    Read More
  2. 엔비디아-폭스콘, 대만에서 가장 빠른 AI 슈퍼컴퓨터 구축

    - GB200 NVL72 플랫폼 기반으로 AI 연구, 헬스케어, 스마트 팩토리, 로보틱스 등 혁신 나서 - AI와 디지털 트윈 위한 엔비디아 옴니버스, 아이작 플랫폼과 통합해 제조 공정 발전 - 2025년 중반 첫 단계 가동 후 2026년 전체 배포 계획 엔비디아가 폭스콘(Foxc...
    Date2024.10.11 Bynewsit Views405
    Read More
  3. SAP 코리아-동국시스템즈, SAP MES 사업 강화 MOU 체결

    SAP 코리아는 동국시스템즈와 SAP 제조 실행 시스템(SAP MES) 사업 강화를 위한 업무협약(MOU)을 체결했다고 18일 밝혔다. 17일 SAP 코리아에서 진행된 MOU 체결식에는 SAP 코리아 신은영 대표와 동국시스템즈 김오련 대표를 비롯한 관계자들이 참석해 향후 협...
    Date2024.04.18 Bynewsit Views405
    Read More
  4. 효성인포메이션시스템, ‘히타치 밴타라-엔비디아’ 차세대 AI 솔루션 공급 위한 협력 강화 발표

    - 엔비디아 최신 AI 기술에 차세대 스토리지 플랫폼 결합된 ‘히타치iQ’ 상반기 출시 - 히타치 밴타라만의 특화된 OT 역량 및 산업 전문성 활용 - 실용적이고 솔루션 지향적인 접근 방식으로 엔터프라이즈 AI의 새로운 패러다임 제시 효성인포메이션시스템은 히...
    Date2024.04.04 Bynewsit Views405
    Read More
  5. 엠클라우드브리지, AI 바우처 지원사업 공급기업 선정

    - 오픈AI, 구글 제미나이 등의 언어 모델을 통합하는 멀티 AI 및 산업군 AI 기반 기업 맞춤 생성형 AI 업무 플랫폼 ‘Ai 365 Mesh’를 국내 법무, 유통, 제조 등 다양한 산업군에 적용 확대 - 생성형 AI를 넘어 AI 에이전트로 기업 맞춤 AI 업무 환경 구축 세미...
    Date2025.02.25 Bynewsit Views404
    Read More
  6. 엔비디아, MS와 오픈AI에 '블랙웰' 시스템 최초 공급

    - 마이크로소프트 애저, GB200 기반 서버로 최첨단 AI 인프라 구축 가속화 - 오픈AI와 함께 공식 X 계정서 블랙웰 DGX B200 플랫폼 모습 공개 엔비디아가 마이크로소프트(Microsoft)와 오픈AI(OpenAI)에 블랙웰(Blackwell) 시스템을 최초로 공급한다고 밝혔다....
    Date2024.10.11 Bynewsit Views404
    Read More
  7. 앱러빈, AI 활용 광고제작 웨비나 무료 공개  

    - 앱러빈 사내 크리에이티브 팀 스파크랩스(SparkLabs), 생성형 AI를 활용하여 창의력을 강화하고 팀 전체의 생산성을 높이는 방법 등 노하우 공개 - 10월 2탄 공개예정… AI를 활용한 아이디어 발상, 스크립트 작성, 시각적 컨셉화 등 크리에이티브 성과 극대...
    Date2024.07.23 Bynewsit Views404
    Read More
  8. 리미니스트리트, ‘IT 투자 최적화 방안’ 보고서 발표

    - IT 비용 증가를 해결하기 위해 IT 및 재무 리더가 긴밀하게 협력하여 기술 지출을 면밀히 검토하고 예산 목표를 달성하는데 주력 리미니스트리트(Rimini Street)는 오늘 시장조사기관 센서스와이드(Censuswide)가 실시한 설문조사 보고서인 <최고 경영진의 ...
    Date2024.07.16 Bynewsit Views404
    Read More
  9. 뉴렐릭, ‘금융서비스 및 보험 업계 내 옵저버빌리티 현황 보고서’ 발간

    - 금융서비스 및 보험 업계, 기술 스택 현대화와 더욱 혁신적인 서비스 제공 위해 풀스택 옵저버빌리티 확보 뉴렐릭이 <‘금융서비스 및 보험 업계 내 옵저버빌리티 현황 보고서’를 발간했다고 밝혔다. 해당 보고서는 ‘2023년 옵저버빌리티 전망보고서’와 연계...
    Date2024.01.24 Bynewsit Views404
    Read More
  10. 팀뷰어, 디지털 사이니지 통합 솔루션에 '팀뷰어 텐서'로 원격 제어 및 지원 제공

    - 인텔리안시스템즈, 원격 연결 플랫폼 ‘팀뷰어 텐서’로 전국 3만 대 기기 지원 - 원격 지원으로 고객 서비스 요청의 90% 이상 해결… 비용 절감, 효율성 및 고객 만족도 향상 팀뷰어(TeamViewer)는 국내 플랫폼 기반 디지털 사이니지 솔루션 기업 인텔리안시스...
    Date2024.08.27 Bynewsit Views403
    Read More
목록
Board Pagination Prev 1 ... 156 157 158 159 160 161 162 163 164 165 ... 237 Next
/ 237
CLOSE