- AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능

- AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공

- 소프트서브, 엔비디아 NIMAWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개발

 

엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화.jpg

엔비디아 아마존 웹 서비스(AWS) AI 서비스 전반에 엔비디아(NVIDIA) NIM 마이크로서비스를 확장한다고 발표했다. 생성형 AI는 산업을 빠르게 변화시키고 있으며, 점점 더 복잡해지는 모델을 효율적이고 비용 효과적으로 확장하기 위해 안전한 고성능 추론 솔루션에 대한 수요를 촉진하고 있다.

 

AWS는 지난 4일(현지시간) 열린 연례 AWS 리인벤트(re:Invent) 콘퍼런스에서 엔비디아와의 협업을 확대해 주요 AWS AI 서비스 전반에 걸쳐 엔비디아 NIM 마이크로서비스를 확장한다고 발표했다. 이를 통해 생성형 AI 애플리케이션을 위한 더 빠른 AI 추론과 짧은 지연 시간을 지원한다.

 

엔비디아 NIM 마이크로서비스는 이제 AWS 마켓플레이스(Marketplace), 아마존 베드록 마켓플레이스(Bedrock Marketplace), 아마존 세이지메이커 점프스타트(SageMaker JumpStart)에서 직접 제공된다. 이로 인해 개발자들이 일반적으로 사용되는 모델에 대해 엔비디아 최적화 추론을 대규모로 배포하는 것이 더욱 쉬워졌다.

 

엔비디아 NIM은 AWS 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼의 일부이다. 이는 개발자에게 클라우드, 데이터센터, 워크스테이션 전반에서 고성능 엔터프라이즈급 AI 모델 추론을 안전하고 안정적으로 배포하도록 설계된 사용하기 쉬운 마이크로서비스 세트를 제공한다.

 

이 사전 구축된 컨테이너는 엔비디아 트리톤 추론 서버(Triton Inference Server), 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 파이토치(PyTorch)와 같은 강력한 추론 엔진을 기반으로 구축됐다. 아울러 오픈 소스 커뮤니티 모델부터 엔비디아 AI 파운데이션(AI Foundation) 모델, 맞춤형 모델에 이르기까지 광범위한 범위의 AI 모델을 지원한다.

 

NIM 마이크로서비스는 아마존 엘라스틱 컴퓨트 클라우드(Elastic Compute Cloud, EC2), 아마존 엘라스틱 쿠버네티스 서비스(Elastic Kubernetes Service, EKS), 아마존 세이지메이커를 비롯한 다양한 AWS 서비스에 배포할 수 있다.

 

개발자들은 일반적으로 사용되는 모델과 모델 제품군으로 구축된 100개 이상의 NIM 마이크로서비스를 엔비디아 API 카탈로그에서 미리 볼 수 있다. 여기에는 메타(Meta)의 라마 3(Llama 3), 미스트랄 AI(Mistral AI)의 미스트랄과 믹스트랄(Mixtral), 엔비디아의 네모트론(Nemotron), 스태빌리티 AI(Stability AI)의 SDXL 등이 있다. 가장 일반적으로 사용되는 모델은 AWS 서비스에 배포하기 위한 자체 호스팅에 사용할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에서 실행되도록 최적화돼 있다.

 

모두를 위한 AWS의 NIM

다양한 산업 분야의 고객과 파트너들이 AWS에서 NIM을 활용하며 시장에 더 빨리 진입하고, 생성형 AI 애플리케이션과 데이터의 보안과 제어를 유지하며, 비용을 절감하고 있다.

 

IT 컨설팅과 디지털 서비스 제공업체인 소프트서브(SoftServe)는 AWS에 완전히 배포되고, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션을 개발했다. 이 솔루션은 AWS 마켓플레이스에서 제공되며, 소프트서브 생성형 AI 신약 개발(Gen AI Drug Discovery), 소프트서브 생성형 AI 산업 비서(Industrial Assistant), 디지털 컨시어지(Digital Concierge), 멀티모달 RAG 시스템(Multimodal RAG System), 콘텐츠 크리에이터(Content Creator), 음성 인식 플랫폼(Speech Recognition Platform)으로 구성된다.

 

이들 모두는 AI 애플리케이션 개발과 배포를 가속화하는 포괄적인 참조 워크플로우인 엔비디아 AI 블루프린트(Blueprint)를 기반으로 한다. 아울러 AI 에이전트, 디지털 트윈 등을 위한 엔비디아 가속 라이브러리, 소프트웨어 개발 키트, NIM 마이크로서비스가 포함된다.

 

AWS에서 NIM 시작하기

개발자는 고유한 필요와 요구사항에 따라 AWS에 엔비디아 NIM 마이크로서비스를 배포할 수 있다. 이를 통해 개발자와 기업은 다양한 AWS 서비스 전반에서 엔비디아에 최적화된 추론 컨테이너로 고성능 AI를 구현할 수 있다.

 

엔비디아 API 카탈로그를 방문해 100개 이상의 다양한 NIM 최적화 모델을 사용해 볼 수 있다. 또한, 개발자 라이선스 또는 90일 엔비디아 AI 엔터프라이즈 체험 라이선스를 요청해 AWS 서비스에 마이크로서비스 배포를 할 수 있다. 개발자는 AWS 마켓플레이스, 아마존 베드록 마켓플레이스 또는 아마존 세이지메이커 점프스타트에서 NIM 마이크로서비스를 알아볼 수도 있다.

 

#엔비디아#AWS#NIM

?

  1. 패스트파이브 파이브클라우드, 구글 워크스페이스 ‘프리미어 파트너’ 자격 획득…“우수한 기술력으로 국내 기업의 AI·클라우드 혁신 지원”

    - 파이브클라우드, 구글 파트너 프로그램 최고 등급 '프리미어 파트너' 자격 획득 - AWS와 구글 연속 파트너십 확보…글로벌 클라우드 생태계 내 기술력 공식 인정 - 자체 IT 인프라 구축 어려운 SMB 위한 ‘올인원 IT 파트너’ 모델로 시장 신뢰도 강화 국내 대...
    Date2025.08.20 Bynewsit Views541
    Read More
  2. 쿤텍, 효성벤처스·NH벤처투자·NH투자증권으로부터 ‘시리즈A’ 투자 유치

    - 공급망 보안, 가상화 검증 및 XDR 기술력, 성장성, 글로벌 시장 잠재력 인정 받아 투자 유치 융합보안 전문기업 쿤텍이 시리즈A 투자를 유치했다고 밝혔다. 이번 투자에는 효성벤처스, NH벤처투자, NH투자증권이 공동 투자사로 함께했다. 투자사들은 글로벌 ...
    Date2025.08.20 Bynewsit Views623
    Read More
  3. 플로우, CR홀딩스 및 전 그룹사 ‘구축형 협업툴’ 공급 계약…“보안·모바일·사용성 전방위 만족”

    - K-제조업 협업툴 1위 저력 입증… 보안·모바일 확장·사용성까지 ‘제조업 디지털 3대 난제’ 완전 해소 - 이메일·그룹웨어·카카오톡까지 통합… 1,000명 이상 대규모 제조현장 전면 디지털 전환 국내 대표 협업툴 플로우(flow) 개발사 마드라스체크는 지주사 CR...
    Date2025.08.19 Bynewsit Views536
    Read More
  4. 벡터, 차량 ‘SIL/HIL 통합 테스트 시스템’ 공급

    - SIL 테스트를 유연하게 확장함으로써 HIL 리소스 사용을 최소화하고, 끊김없는 테스트 프로세스의 운영과 개발 속도와 품질, 신뢰성 모두에서 최적의 성과 달성 가능 벡터코리아는 오늘 차량 제어 시스템 신뢰성 확보를 위해 SIL과 HIL 테스트를 통합하여 고...
    Date2025.08.19 Bynewsit Views515
    Read More
  5. 사이냅소프트, 배스킨라빈스 앱에 OCR 기술 공급… B2C 서비스로 활용 확대

    - 사이냅 OCR Pro B2C 서비스 적용, OCR 기술의 생활 밀착형 진화 - 카메라로 비추면 끝, AI OCR 기술로 더 스마트해진 구매 경험 사이냅소프트는 비알코리아의 신규 모바일 플랫폼 ‘배스킨라빈스 앱(배라앱)’에 자사의 OCR 기술이 도입되었다고 밝혔다. 이번 ...
    Date2025.08.19 Bynewsit Views514
    Read More
  6. 오라클, 데이터베이스 및 클라우드 애플리케이션 전반에 ‘오픈AI GPT-5’ 도입

    - 오라클 고객, 고성능의 비용 효율적인 GPT-5로 신뢰할 수 있는 비즈니스 데이터 및 첨단 AI 기능 활용 가능 오라클이 데이터베이스 포트폴리오 및 SaaS 애플리케이션 전반에 오픈AI GPT-5를 도입했다고 밝혔다. 이번 도입에는 오라클 퓨전 클라우드 애플리케...
    Date2025.08.19 Bynewsit Views469
    Read More
  7. 리미니스트리트, ‘범한메카텍’의 AI 디지털 전환과 오라클 시스템 유지보수 지원

    - 국내 화학공정 장비(CPE) 제조기업 ‘범한메카텍’, 리미니스트리트가 오라클 EBS및 데이터베이스 시스템에 대한 전문 지원 서비스를 제공하여 AI 및 RPA 도입 통해 생산성 향상 리미니스트리트(Rimini Street)는 오늘, 화학 공정 장비(CPE) 제조 분야의 글로...
    Date2025.08.19 Bynewsit Views539
    Read More
  8. 오라클, 구글 제미나이 모델 제공…“기업의 에이전틱 AI 여정 가속화”

    - OCI 생성형 AI 서비스 통해 고성능에 유연성 갖춘 제미나이 멀티모달 모델 제공 - 오라클, 구글 클라우드와 비즈니스 애플리케이션 전반에 걸쳐 다양한 제미나이 모델 통합 협력 오라클과 구글 클라우드는 구글의 가장 최신 AI 모델인 제미나이(Gemini) 2.5...
    Date2025.08.18 Bynewsit Views505
    Read More
  9. 레드햇 오픈시프트, ‘2025 가트너 매직 쿼드런트 컨테이너 관리’ 부문 3년 연속 리더 선정

    - 하이브리드 클라우드 전반에서 엔터프라이즈 컨테이너 전략의 핵심 역할 입증 글로벌 오픈소스 솔루션 선도기업 레드햇(Red Hat)이 ‘2025 가트너 매직 쿼드런트(Gartner Magic Quadrant) 컨테이너 관리 부문’에서 3년 연속 리더로 선정됐다고 발표했다. 이는...
    Date2025.08.14 Bynewsit Views691
    Read More
  10. 지멘스, ‘Siemens Xcelerator’ 포트폴리오로 스카이루트 에어로스페이스 디지털 전환 지원

    - 지멘스 폴라리온(Polarion)으로 소프트웨어 워크플로우 최적화·효율성 향상 - 추적성과 규제 준수 강화하고 항공우주 시스템 수명 주기 간소화 지멘스 디지털 인더스트리 소프트웨어는 인도의 선도적인 민간 우주 발사 서비스 기업인 스카이루트 에어로스페...
    Date2025.08.13 Bynewsit Views465
    Read More
목록
Board Pagination Prev 1 ... 38 39 40 41 42 43 44 45 46 47 ... 228 Next
/ 228
CLOSE