- AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능

- AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공

- 소프트서브, 엔비디아 NIMAWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개발

 

엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화.jpg

엔비디아 아마존 웹 서비스(AWS) AI 서비스 전반에 엔비디아(NVIDIA) NIM 마이크로서비스를 확장한다고 발표했다. 생성형 AI는 산업을 빠르게 변화시키고 있으며, 점점 더 복잡해지는 모델을 효율적이고 비용 효과적으로 확장하기 위해 안전한 고성능 추론 솔루션에 대한 수요를 촉진하고 있다.

 

AWS는 지난 4일(현지시간) 열린 연례 AWS 리인벤트(re:Invent) 콘퍼런스에서 엔비디아와의 협업을 확대해 주요 AWS AI 서비스 전반에 걸쳐 엔비디아 NIM 마이크로서비스를 확장한다고 발표했다. 이를 통해 생성형 AI 애플리케이션을 위한 더 빠른 AI 추론과 짧은 지연 시간을 지원한다.

 

엔비디아 NIM 마이크로서비스는 이제 AWS 마켓플레이스(Marketplace), 아마존 베드록 마켓플레이스(Bedrock Marketplace), 아마존 세이지메이커 점프스타트(SageMaker JumpStart)에서 직접 제공된다. 이로 인해 개발자들이 일반적으로 사용되는 모델에 대해 엔비디아 최적화 추론을 대규모로 배포하는 것이 더욱 쉬워졌다.

 

엔비디아 NIM은 AWS 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼의 일부이다. 이는 개발자에게 클라우드, 데이터센터, 워크스테이션 전반에서 고성능 엔터프라이즈급 AI 모델 추론을 안전하고 안정적으로 배포하도록 설계된 사용하기 쉬운 마이크로서비스 세트를 제공한다.

 

이 사전 구축된 컨테이너는 엔비디아 트리톤 추론 서버(Triton Inference Server), 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 파이토치(PyTorch)와 같은 강력한 추론 엔진을 기반으로 구축됐다. 아울러 오픈 소스 커뮤니티 모델부터 엔비디아 AI 파운데이션(AI Foundation) 모델, 맞춤형 모델에 이르기까지 광범위한 범위의 AI 모델을 지원한다.

 

NIM 마이크로서비스는 아마존 엘라스틱 컴퓨트 클라우드(Elastic Compute Cloud, EC2), 아마존 엘라스틱 쿠버네티스 서비스(Elastic Kubernetes Service, EKS), 아마존 세이지메이커를 비롯한 다양한 AWS 서비스에 배포할 수 있다.

 

개발자들은 일반적으로 사용되는 모델과 모델 제품군으로 구축된 100개 이상의 NIM 마이크로서비스를 엔비디아 API 카탈로그에서 미리 볼 수 있다. 여기에는 메타(Meta)의 라마 3(Llama 3), 미스트랄 AI(Mistral AI)의 미스트랄과 믹스트랄(Mixtral), 엔비디아의 네모트론(Nemotron), 스태빌리티 AI(Stability AI)의 SDXL 등이 있다. 가장 일반적으로 사용되는 모델은 AWS 서비스에 배포하기 위한 자체 호스팅에 사용할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에서 실행되도록 최적화돼 있다.

 

모두를 위한 AWS의 NIM

다양한 산업 분야의 고객과 파트너들이 AWS에서 NIM을 활용하며 시장에 더 빨리 진입하고, 생성형 AI 애플리케이션과 데이터의 보안과 제어를 유지하며, 비용을 절감하고 있다.

 

IT 컨설팅과 디지털 서비스 제공업체인 소프트서브(SoftServe)는 AWS에 완전히 배포되고, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션을 개발했다. 이 솔루션은 AWS 마켓플레이스에서 제공되며, 소프트서브 생성형 AI 신약 개발(Gen AI Drug Discovery), 소프트서브 생성형 AI 산업 비서(Industrial Assistant), 디지털 컨시어지(Digital Concierge), 멀티모달 RAG 시스템(Multimodal RAG System), 콘텐츠 크리에이터(Content Creator), 음성 인식 플랫폼(Speech Recognition Platform)으로 구성된다.

 

이들 모두는 AI 애플리케이션 개발과 배포를 가속화하는 포괄적인 참조 워크플로우인 엔비디아 AI 블루프린트(Blueprint)를 기반으로 한다. 아울러 AI 에이전트, 디지털 트윈 등을 위한 엔비디아 가속 라이브러리, 소프트웨어 개발 키트, NIM 마이크로서비스가 포함된다.

 

AWS에서 NIM 시작하기

개발자는 고유한 필요와 요구사항에 따라 AWS에 엔비디아 NIM 마이크로서비스를 배포할 수 있다. 이를 통해 개발자와 기업은 다양한 AWS 서비스 전반에서 엔비디아에 최적화된 추론 컨테이너로 고성능 AI를 구현할 수 있다.

 

엔비디아 API 카탈로그를 방문해 100개 이상의 다양한 NIM 최적화 모델을 사용해 볼 수 있다. 또한, 개발자 라이선스 또는 90일 엔비디아 AI 엔터프라이즈 체험 라이선스를 요청해 AWS 서비스에 마이크로서비스 배포를 할 수 있다. 개발자는 AWS 마켓플레이스, 아마존 베드록 마켓플레이스 또는 아마존 세이지메이커 점프스타트에서 NIM 마이크로서비스를 알아볼 수도 있다.

 

#엔비디아#AWS#NIM

?

  1. 티맥스소프트, 강화된 ‘하이퍼프레임 매니저’ 발표…“안전하고 간편한 오픈소스 관리 지원”

    - 오픈소스 통합 관제하는 ‘하이퍼프레임 매니저’ 기능 전반 업데이트 - 28년간 상용 SW로 갖춰온 견고한 경쟁우위 통해 오픈소스 수요에도 면밀히 대응 - 2월 28일까지 출시 기념 이벤트 실시...제품 상담 완료한 선착순 20명 고객에게 경품 증정 기업용 소프...
    Date2025.02.13 Bynewsit Views475
    Read More
  2. 델-LG CNS, “AI 인프라 비즈니스 활성화 맞손”

    - 델-LG CNS, 전략적 MOU 체결하고 상호 협력 기반의 엔터프라이즈 AI 사업을 위한 협의체 구성 한국 델 테크놀로지스와 LG CNS가 AI 인프라 비즈니스 활성화를 위해 협력에 나선다고 밝혔다. 양사는 이를 위해 지난달 22일에 마곡 LG CNS 본사에서 MOU를 체결...
    Date2025.02.13 Bynewsit Views436
    Read More
  3. 세일즈포스 데이터 클라우드, IDC 마켓스케이프 ‘CDP 부문 리더’ 선정…“통합 데이터 플랫폼 역량 및 AI 에이전트 시너지 인정“

    - 데이터 통합・AI・거버넌스・보안 기술 전반에서 CDP 시장 선도력 입증 -B2B・B2C 부문 모두 리더로 선정... 효과적인 데이터 활용과 혁신적인 고객경험 구현 지원 위한 경쟁력 주목 세일즈포스는 데이터 클라우드가 IDC 마켓스케이프의 고객 데이터 플랫폼(...
    Date2025.02.12 Bynewsit Views379
    Read More
  4. 티맥스티베로, DBMS 솔루션 ‘티베로7’ 혁신장터 등록…“기술 혁신성과 공공성 인정”

    - 공공 클라우드 시장에 빠르게 확산시킬 것 데이터베이스관리시스템(DBMS) 전문기업 티맥스티베로는 자사 대표 DBMS 솔루션인 ‘티베로7(Tibero7)’이 혁신조달 종합포털인 ‘혁신장터’에 등록됐다고 11일 밝혔다. 혁신장터는 조달청에서 기술혁신성과 공공성이 ...
    Date2025.02.11 Bynewsit Views427
    Read More
  5. SAP 코리아, CWT 코리아와 기업 출장 서비스 협력 MOU 체결

    - SAP 컨커 고객을 위한 효율적인 출장 관리 프로세스 지원 및 컨설팅, 세미나 등 적극적인 협력 계획 SAP 코리아와 글로벌 비즈니스 출장 매니지먼트 기업 CWT 코리아가 기업 출장 서비스 협력 및 B2B 시장 개발을 위한 업무협약(MOU)을 체결했다. 지난 10일 ...
    Date2025.02.11 Bynewsit Views429
    Read More
  6. 오라클, 2025 IDC 마켓스케이프 <전 세계 퍼블릭 클라우드 IaaS 부문> 리더로 선정

    오라클이 2025년 IDC 마켓스케이프 ‘전 세계 퍼블릭 클라우드 IaaS 제공업체 평가’ 보고서에서 리더로 선정됐다. IDC 마켓스케이프 보고서는 13개의 퍼블릭 클라우드 IaaS(서비스형 인프라) 제공업체를 평가했으며, 각 제공업체의 대규모 서비스 제공 능력과 ...
    Date2025.02.11 Bynewsit Views482
    Read More
  7. 델, ‘2025 파트너 프로그램’ 발표…“판매 보상 지원 범위 확대”

    - 파트너 성장을 위한 판매 장려금 추가, PC교체 수요 대응을 위한 지원 범위 확대 - 주요 잠재 고객 확보에 대한 추가 보상금 프로그램 ‘컴피트 셀렉트(Compete Select)’ 도입 - 파트너의 AI 역량 강화를 위한 AI 인프라 판매 장려금 및 교육 프로그램 제공 ...
    Date2025.02.07 Bynewsit Views441
    Read More
  8. 헥사곤, 클라우드 기반 ADAS 및 AD 개발 및 검증 솔루션 출시…“ADAS 소프트웨어 혁신 가속”

    - 헥사곤, ADAS 및 자율주행 검증 위한 클라우드 기반 솔루션 'VTDx' 출시 헥사곤 매뉴팩처링 인텔리전스가 ADAS 및 자율주행 차량 시스템 검증을 위한 클라우드 기반 솔루션 '버츄얼 테스트 드라이브(VTDx)'를 출시했다. VTDx는 클라우드 컴퓨팅 기술을 통해 ...
    Date2025.02.06 Bynewsit Views505
    Read More
  9. 티맥스소프트, ‘유망 SaaS 개발·육성 지원 사업’ 우수사례 선정

    - ‘오픈프레임’ 고도화 및 사업화 과제 완수, 클라우드 서비스 적격성과 사업성 높이 평가 - 기존 대비 성능 40% 향상, 신뢰성과 안정성 확고히 입증...글로벌 경쟁력↑ - AI·클라우드 혁신 연결하는 글로벌 SaaS 비즈니스 확대 기업용 소프트웨어(SW) 전문기업...
    Date2025.02.06 Bynewsit Views979
    Read More
  10. 스노우플레이크, 코텍스 AI에서 ‘딥시크-R1’ 프리뷰 지원

    - 대규모 강화학습만으로 훈련된 최초 오픈소스 모델 딥시크, 고급 추론·수학·코딩 성능 최상위권 기록 - SQL 함수·파이썬·REST API 모두 지원… 기존 데이터 파이프라인 및 애플리케이션에 통합 가능 글로벌 AI 데이터 클라우드 기업 스노우플레이크(Snowflake...
    Date2025.02.05 Bynewsit Views461
    Read More
목록
Board Pagination Prev 1 ... 82 83 84 85 86 87 88 89 90 91 ... 238 Next
/ 238
CLOSE