- AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능

- AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공

- 소프트서브, 엔비디아 NIMAWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개발

 

엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화.jpg

엔비디아 아마존 웹 서비스(AWS) AI 서비스 전반에 엔비디아(NVIDIA) NIM 마이크로서비스를 확장한다고 발표했다. 생성형 AI는 산업을 빠르게 변화시키고 있으며, 점점 더 복잡해지는 모델을 효율적이고 비용 효과적으로 확장하기 위해 안전한 고성능 추론 솔루션에 대한 수요를 촉진하고 있다.

 

AWS는 지난 4일(현지시간) 열린 연례 AWS 리인벤트(re:Invent) 콘퍼런스에서 엔비디아와의 협업을 확대해 주요 AWS AI 서비스 전반에 걸쳐 엔비디아 NIM 마이크로서비스를 확장한다고 발표했다. 이를 통해 생성형 AI 애플리케이션을 위한 더 빠른 AI 추론과 짧은 지연 시간을 지원한다.

 

엔비디아 NIM 마이크로서비스는 이제 AWS 마켓플레이스(Marketplace), 아마존 베드록 마켓플레이스(Bedrock Marketplace), 아마존 세이지메이커 점프스타트(SageMaker JumpStart)에서 직접 제공된다. 이로 인해 개발자들이 일반적으로 사용되는 모델에 대해 엔비디아 최적화 추론을 대규모로 배포하는 것이 더욱 쉬워졌다.

 

엔비디아 NIM은 AWS 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼의 일부이다. 이는 개발자에게 클라우드, 데이터센터, 워크스테이션 전반에서 고성능 엔터프라이즈급 AI 모델 추론을 안전하고 안정적으로 배포하도록 설계된 사용하기 쉬운 마이크로서비스 세트를 제공한다.

 

이 사전 구축된 컨테이너는 엔비디아 트리톤 추론 서버(Triton Inference Server), 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 파이토치(PyTorch)와 같은 강력한 추론 엔진을 기반으로 구축됐다. 아울러 오픈 소스 커뮤니티 모델부터 엔비디아 AI 파운데이션(AI Foundation) 모델, 맞춤형 모델에 이르기까지 광범위한 범위의 AI 모델을 지원한다.

 

NIM 마이크로서비스는 아마존 엘라스틱 컴퓨트 클라우드(Elastic Compute Cloud, EC2), 아마존 엘라스틱 쿠버네티스 서비스(Elastic Kubernetes Service, EKS), 아마존 세이지메이커를 비롯한 다양한 AWS 서비스에 배포할 수 있다.

 

개발자들은 일반적으로 사용되는 모델과 모델 제품군으로 구축된 100개 이상의 NIM 마이크로서비스를 엔비디아 API 카탈로그에서 미리 볼 수 있다. 여기에는 메타(Meta)의 라마 3(Llama 3), 미스트랄 AI(Mistral AI)의 미스트랄과 믹스트랄(Mixtral), 엔비디아의 네모트론(Nemotron), 스태빌리티 AI(Stability AI)의 SDXL 등이 있다. 가장 일반적으로 사용되는 모델은 AWS 서비스에 배포하기 위한 자체 호스팅에 사용할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에서 실행되도록 최적화돼 있다.

 

모두를 위한 AWS의 NIM

다양한 산업 분야의 고객과 파트너들이 AWS에서 NIM을 활용하며 시장에 더 빨리 진입하고, 생성형 AI 애플리케이션과 데이터의 보안과 제어를 유지하며, 비용을 절감하고 있다.

 

IT 컨설팅과 디지털 서비스 제공업체인 소프트서브(SoftServe)는 AWS에 완전히 배포되고, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션을 개발했다. 이 솔루션은 AWS 마켓플레이스에서 제공되며, 소프트서브 생성형 AI 신약 개발(Gen AI Drug Discovery), 소프트서브 생성형 AI 산업 비서(Industrial Assistant), 디지털 컨시어지(Digital Concierge), 멀티모달 RAG 시스템(Multimodal RAG System), 콘텐츠 크리에이터(Content Creator), 음성 인식 플랫폼(Speech Recognition Platform)으로 구성된다.

 

이들 모두는 AI 애플리케이션 개발과 배포를 가속화하는 포괄적인 참조 워크플로우인 엔비디아 AI 블루프린트(Blueprint)를 기반으로 한다. 아울러 AI 에이전트, 디지털 트윈 등을 위한 엔비디아 가속 라이브러리, 소프트웨어 개발 키트, NIM 마이크로서비스가 포함된다.

 

AWS에서 NIM 시작하기

개발자는 고유한 필요와 요구사항에 따라 AWS에 엔비디아 NIM 마이크로서비스를 배포할 수 있다. 이를 통해 개발자와 기업은 다양한 AWS 서비스 전반에서 엔비디아에 최적화된 추론 컨테이너로 고성능 AI를 구현할 수 있다.

 

엔비디아 API 카탈로그를 방문해 100개 이상의 다양한 NIM 최적화 모델을 사용해 볼 수 있다. 또한, 개발자 라이선스 또는 90일 엔비디아 AI 엔터프라이즈 체험 라이선스를 요청해 AWS 서비스에 마이크로서비스 배포를 할 수 있다. 개발자는 AWS 마켓플레이스, 아마존 베드록 마켓플레이스 또는 아마존 세이지메이커 점프스타트에서 NIM 마이크로서비스를 알아볼 수도 있다.

 

#엔비디아#AWS#NIM

?

  1. 사이냅소프트, 전자공시 AI 'DartPoint AI' MCP 서버 출시..."L전자와 S전자 비교 분석, 5분 만에 보고서 완성

    사이냅소프트가 자사의 AI 기업정보 분석 플랫폼 'DartPoint AI에 'MCP 서버' 기능을 출시했다고 26일 발표했다. DartPoint AI는 금융감독원 전자공시시스템(DART)에 공시된 기업 정보를 AI로 분석해 주식 투자, 기업 분석, 취업 준비 등에 활용할 수 있는 서...
    Date2025.06.26 Bynewsit Views713
    Read More
  2. 세일즈포스, 차세대 디지털 워크포스 플랫폼 ‘에이전트포스 3’ 발표…“확장성과 연결성을 겸비한 차세대 AI 에이전트 플랫폼으로 AI 혁신 가속화”

    - AI 에이전트 활용 돕는 ‘커맨드 센터’ 기능 추가, 조직 내 AI 에이전트 관제탑 역할 수행… 가시성 및 제어력 향상 - MCP 기반 오픈 생태계 지원 및 A2A 환경 구축, AWS, 구글클라우드, IBM 등 30여 개 세일즈포스 파트너사 활용… 다양한 AI 에이전트 간 손쉬...
    Date2025.06.26 Bynewsit Views488
    Read More
  3. 엘앤에프, 자체 개발 생성형 AI '루시드' 도입…"디지털 혁신 가속화"

    - 사내 지식 기반 AI 챗봇 ‘루시드’ 도입… 스마트한 업무 환경 구축 - 4단계 AI 혁신 전략 추진… 데이터 기반 의사결정·업무 품질 향상 - 자동화 통합 AX 플랫폼 구축 목표, 사무에서 스마트팩토리까지 AI 기술 확대 적용 계획 엘앤에프가 자체 개발한 생성형 ...
    Date2025.06.25 Bynewsit Views505
    Read More
  4. 아비바, ‘2024 지속가능성 보고서’ 주요 지표 공개

    - 5년째 발간하고 있는 연례 지속가능성 보고서 통해 산업 인텔리전스가 전 세계 기후 문제 해결에 중추적인 역할을 하는 방법론 소개 - 아비바 전 제품에 대한 친환경 제품 설계 성숙도 평가 완료하며 솔루션의 85%에 대한 탄소 배출 측정 - 직접 배출 및 간...
    Date2025.06.25 Bynewsit Views445
    Read More
  5. 유니버설 로봇, ‘유니버설 로봇 스튜디오(UR Studio)’ 출시…“최적의 로봇 셀 맞춤형 설계 가능”

    글로벌 1위 협동로봇 전문 기업 ‘유니버설 로봇(Universal Robots)’이 온라인 협동로봇 시뮬레이션 도구 ‘유니버설 로봇 스튜디오(UR Studio)’를 공개했다. 유니버설 로봇 스튜디오는 현존하는 가장 진보된 개방형 AI 기반 소프트웨어 플랫폼인 폴리스코프 X(P...
    Date2025.06.25 Bynewsit Views691
    Read More
  6. 딥엘, 번역기 및 API 지원 언어 확대…“글로벌 비즈니스 커뮤니케이션·문서 번역 역량 강화”

    - 번역기·API에 베트남어·히브리어·태국어 추가…문서 번역 기능엔 중국어 번체·아랍어 지원 딥엘(DeepL)이 자사 플랫폼에 베트남어, 히브리어, 태국어(현재는 DeepL API에서만 이용 가능한 초기 제공 버전) 등 3개 언어를 새롭게 추가했다. 이번 업데이트로 딥...
    Date2025.06.25 Bynewsit Views712
    Read More
  7. 엠클라우드브리지, 폐쇄형 기업 업무 플랫폼 ‘Ai 365 Mesh’ 특허 등록…“한국형 조직도 권한 기반 Data & AI 통합”

    - 오픈AI, 코파일럿, MS패브릭 통합 폐쇄형 환경에서 한국형 조직도에 따라 지식 정보 및 분석 확인 - AD 조직도 기반 기업 중요 정보 접근 권한 관리 및 정보 유출 차단으로 AI 도입 시 보안 우려 해소 엠클라우드브리지가 한국형 조직도 권한 기반 Data & AI...
    Date2025.06.24 Bynewsit Views635
    Read More
  8. 알리바바 클라우드-유니플러스, 국내 스타트업 지원 파트너십 발표

    - 인천의 테크 스타트업 유니플러스와 협력해 지역 스타트업 대상 첨단 클라우드 및 블록체인 서비스 제공 - 알리바바 클라우드의 글로벌 인프라를 활용해 유니플러스 블록체인 솔루션의 해외 시장 확장 공동 지원 알리바바 클라우드가 인천에 본사를 둔 첨단 ...
    Date2025.06.24 Bynewsit Views480
    Read More
  9. 사이냅소프트, ‘문서 AI 기술세미나’ 개최…“문서 기반 RAG 기술 통찰 공유”

    - 고객사 보유 문서를 활용한 RAG 기반 AI 어시스턴트 구현 전략 소개 - AI 콘텐츠 크리에이터 테디노트, 협업툴 1등 잔디와 함께한 실전 세미나 사이냅소프트는 지난 6월 20일, 서울 마곡 R&D센터에서 ‘같은 LLM, 다른 결과: 데이터 품질이 만드는 압도적 차...
    Date2025.06.24 Bynewsit Views450
    Read More
  10. 한국퀀텀컴퓨팅-부산교통공사, 양자컴퓨팅을 활용한 ‘부산 도시철도 배차 최적화 연구’ 착수

    - 양자컴퓨터 활용해 대중교통 운영의 효율성을 연구하는 국내 최초 사례 - 혼잡 시간대 수요 분산, 에너지 절감, 인력 운영의 효율화 등 복잡한 변수간 상호작용을 고도화된 양자 알고리즘으로 분석 - 양자컴퓨팅 기반으로 도시철도 배차 최적화부터 재난 대...
    Date2025.06.24 Bynewsit Views482
    Read More
목록
Board Pagination Prev 1 ... 55 56 57 58 59 60 61 62 63 64 ... 235 Next
/ 235
CLOSE