- AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능

- AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공

- 소프트서브, 엔비디아 NIMAWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개발

 

엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화.jpg

엔비디아 아마존 웹 서비스(AWS) AI 서비스 전반에 엔비디아(NVIDIA) NIM 마이크로서비스를 확장한다고 발표했다. 생성형 AI는 산업을 빠르게 변화시키고 있으며, 점점 더 복잡해지는 모델을 효율적이고 비용 효과적으로 확장하기 위해 안전한 고성능 추론 솔루션에 대한 수요를 촉진하고 있다.

 

AWS는 지난 4일(현지시간) 열린 연례 AWS 리인벤트(re:Invent) 콘퍼런스에서 엔비디아와의 협업을 확대해 주요 AWS AI 서비스 전반에 걸쳐 엔비디아 NIM 마이크로서비스를 확장한다고 발표했다. 이를 통해 생성형 AI 애플리케이션을 위한 더 빠른 AI 추론과 짧은 지연 시간을 지원한다.

 

엔비디아 NIM 마이크로서비스는 이제 AWS 마켓플레이스(Marketplace), 아마존 베드록 마켓플레이스(Bedrock Marketplace), 아마존 세이지메이커 점프스타트(SageMaker JumpStart)에서 직접 제공된다. 이로 인해 개발자들이 일반적으로 사용되는 모델에 대해 엔비디아 최적화 추론을 대규모로 배포하는 것이 더욱 쉬워졌다.

 

엔비디아 NIM은 AWS 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼의 일부이다. 이는 개발자에게 클라우드, 데이터센터, 워크스테이션 전반에서 고성능 엔터프라이즈급 AI 모델 추론을 안전하고 안정적으로 배포하도록 설계된 사용하기 쉬운 마이크로서비스 세트를 제공한다.

 

이 사전 구축된 컨테이너는 엔비디아 트리톤 추론 서버(Triton Inference Server), 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 파이토치(PyTorch)와 같은 강력한 추론 엔진을 기반으로 구축됐다. 아울러 오픈 소스 커뮤니티 모델부터 엔비디아 AI 파운데이션(AI Foundation) 모델, 맞춤형 모델에 이르기까지 광범위한 범위의 AI 모델을 지원한다.

 

NIM 마이크로서비스는 아마존 엘라스틱 컴퓨트 클라우드(Elastic Compute Cloud, EC2), 아마존 엘라스틱 쿠버네티스 서비스(Elastic Kubernetes Service, EKS), 아마존 세이지메이커를 비롯한 다양한 AWS 서비스에 배포할 수 있다.

 

개발자들은 일반적으로 사용되는 모델과 모델 제품군으로 구축된 100개 이상의 NIM 마이크로서비스를 엔비디아 API 카탈로그에서 미리 볼 수 있다. 여기에는 메타(Meta)의 라마 3(Llama 3), 미스트랄 AI(Mistral AI)의 미스트랄과 믹스트랄(Mixtral), 엔비디아의 네모트론(Nemotron), 스태빌리티 AI(Stability AI)의 SDXL 등이 있다. 가장 일반적으로 사용되는 모델은 AWS 서비스에 배포하기 위한 자체 호스팅에 사용할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에서 실행되도록 최적화돼 있다.

 

모두를 위한 AWS의 NIM

다양한 산업 분야의 고객과 파트너들이 AWS에서 NIM을 활용하며 시장에 더 빨리 진입하고, 생성형 AI 애플리케이션과 데이터의 보안과 제어를 유지하며, 비용을 절감하고 있다.

 

IT 컨설팅과 디지털 서비스 제공업체인 소프트서브(SoftServe)는 AWS에 완전히 배포되고, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션을 개발했다. 이 솔루션은 AWS 마켓플레이스에서 제공되며, 소프트서브 생성형 AI 신약 개발(Gen AI Drug Discovery), 소프트서브 생성형 AI 산업 비서(Industrial Assistant), 디지털 컨시어지(Digital Concierge), 멀티모달 RAG 시스템(Multimodal RAG System), 콘텐츠 크리에이터(Content Creator), 음성 인식 플랫폼(Speech Recognition Platform)으로 구성된다.

 

이들 모두는 AI 애플리케이션 개발과 배포를 가속화하는 포괄적인 참조 워크플로우인 엔비디아 AI 블루프린트(Blueprint)를 기반으로 한다. 아울러 AI 에이전트, 디지털 트윈 등을 위한 엔비디아 가속 라이브러리, 소프트웨어 개발 키트, NIM 마이크로서비스가 포함된다.

 

AWS에서 NIM 시작하기

개발자는 고유한 필요와 요구사항에 따라 AWS에 엔비디아 NIM 마이크로서비스를 배포할 수 있다. 이를 통해 개발자와 기업은 다양한 AWS 서비스 전반에서 엔비디아에 최적화된 추론 컨테이너로 고성능 AI를 구현할 수 있다.

 

엔비디아 API 카탈로그를 방문해 100개 이상의 다양한 NIM 최적화 모델을 사용해 볼 수 있다. 또한, 개발자 라이선스 또는 90일 엔비디아 AI 엔터프라이즈 체험 라이선스를 요청해 AWS 서비스에 마이크로서비스 배포를 할 수 있다. 개발자는 AWS 마켓플레이스, 아마존 베드록 마켓플레이스 또는 아마존 세이지메이커 점프스타트에서 NIM 마이크로서비스를 알아볼 수도 있다.

 

#엔비디아#AWS#NIM

?

  1. 유아이패스, LG유플러스의 디지털 혁신 여정 및 에이전틱 자동화 전환 지원

    유아이패스(UiPath)는 AI 기반 자동화를 통해 LG유플러스의 운영 혁신 및 자동화 역량 강화를 지원하고 있다고 발표하고, LG유플러스는 단순 반복 업무를 넘어, 비정형 데이터와 인간의 인지 판단이 필요한 복합 업무까지 자동화 영역을 확장하고 있다고 설명...
    Date2025.07.01 Bynewsit Views653
    Read More
  2. 슈나이더 일렉트릭-엔비디아, AI 팩토리 구축 인프라 개발 가속화

    - 전력, 냉각, 제어 시스템, 고밀도 랙 인프라 등 AI 데이터센터 핵심 요소에 대한 공동 연구 개발 - AI가 실현될 수 있는 기반이 되는 ‘AI 팩토리’ 구축 목표 슈나이더 일렉트릭이 엔비디아(NVIDIA)와의 협력을 통해 규모 AI 팩토리 구축을 위한 인프라 개발...
    Date2025.07.01 Bynewsit Views729
    Read More
  3. SAP 코리아, ‘SAP 나우 AI 투어 코리아’ 개최

    - SAP 고객 및 파트너사와 함께 AI 기반 비즈니스 혁신을 위한 전략 및 적용 사례 소개 - 실무 담당자를 위한 맞춤형 트랙 운영, SAP 기반 제조 현장 쇼케이스도 마련돼 풍성한 프로그램 구성 SAP 코리아는 오는 7월 15일 그랜드 인터컨티넨탈 서울 파르나스 ...
    Date2025.07.01 Bynewsit Views635
    Read More
  4. 엘앤에프, ‘2024 지속가능경영보고서’ 발간…글로벌 기준으로 ESG 실행 성과 공개

    - ESG 비전 선포 4년 맞아 ‘ESG Journey’ 신설, 주요 활동 흐름 한눈에 - 기후 리스크 분석부터 재무영향 공시까지… ISSB 기준 적용으로 신뢰성·투명성 제고 - 전 사업장 ZWTL 플래티넘 인증 유지·PPA 계약 체결, 환경·공급망 분야서 업계 리더십 입증 글로벌 ...
    Date2025.06.30 Bynewsit Views487
    Read More
  5. 오라클, 새로운 ‘소버린 에어갭 클라우드’ 솔루션으로 국가 안보 강화 지원

    - 오라클 컴퓨트 클라우드앳커스터머 아이솔레이티드, 보안 기밀 워크로드 관리로 미션 성공 지원 오라클이 보안용 소버린 컴퓨트 클라우드 서비스인 오라클 컴퓨트 클라우드앳커스터머 아이솔레이티드(Oracle Compute Cloud@Customer Isolated)를 발표했다. ...
    Date2025.06.30 Bynewsit Views453
    Read More
  6. AWS, 싱가폴에 ‘이노베이션 허브’ 개소…아태 지역의 클라우드 및 AI 혁신 가속화

    - 수백만 달러 규모의 시설에 AWS, 아마존, 전 세계 파트너의 최첨단 기술 집약 - 매년 아시아 태평양 지역의 C-레벨 리더 1,000명 이상, 싱가포르 고등교육기관 학생 200명 초청 예정 아마존웹서비스(AWS)가 오늘 싱가포르 도심에 위치한 AWS 오피스에 아시아...
    Date2025.06.27 Bynewsit Views488
    Read More
  7. 티맥스소프트, ‘프로프레임 6.0’ 개발 완료…“AI·클라우드 시대, 다양한 애플리케이션 프레임워크 수요 대응”

    - C 버전 프레임워크 ‘프로프레임’ 신규 버전 6.0, 성능·안정성·편의성 향상... 3분기 정식 출시 - 높은 수요 예상되는 금융권 프레임워크 사업 대응 위해 제품 로드맵 면밀히 수립 예정 - 자바 버전 ‘프로오브젝트’와 함께 금융 프레임워크 시장 리더십 지속 ...
    Date2025.06.27 Bynewsit Views647
    Read More
  8. 스플렁크, 스플렁크 리더십 포럼(Splunk Leadership Forum) 성료

    스플렁크는 ‘스플렁크 리더십 포럼’을 26일 오늘 개최했다고 밝혔다. 스플렁크 AI 부문 총괄 하오 양(Hao Yang) 부사장은 글로벌 AI 기술과 사이버 보안에 대한 최신 트렌드를, 스플렁크 코리아 최원식 지사장은 스플렁크 기술의 한국 시장 기여도를 주요 고객...
    Date2025.06.27 Bynewsit Views741
    Read More
  9. 레노버, 가트너 선정 ‘2025 공급망 선도 기업’ 8위 차지

    레노버가 2025년 ‘가트너 공급망 선도 상위 25개 기업(Gartner Supply Chain Top 25)’에서 8위에 오르며 공급망 운영의 우수성을 또다시 인정받았다. 이는 전년 대비 두 단계 상승한 순위다. 가트너는 제약, 자동차, 소비재, 기술 등 다양한 산업군의 기업들을...
    Date2025.06.26 Bynewsit Views447
    Read More
  10. 티맥스티베로, KT 통합고객정보시스템(ICIS-TR) 현대화 사업 성료

    - KT의 3대 핵심 시스템 중 하나인 빌링 시스템에 티베로(Tibero) 적용 - Oracle RAC를 대체해 티베로의 액티브-액티브 클러스터링(TAC)으로 무중단 운영 환경 구현 티맥스티베로는 KT의 핵심 업무 시스템인 통합고객정보시스템(ICIS-TR)의 현대화 프로젝트를 ...
    Date2025.06.26 Bynewsit Views514
    Read More
목록
Board Pagination Prev 1 ... 54 55 56 57 58 59 60 61 62 63 ... 235 Next
/ 235
CLOSE