- AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능

- AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공

- 소프트서브, 엔비디아 NIMAWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개발

 

엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화.jpg

엔비디아 아마존 웹 서비스(AWS) AI 서비스 전반에 엔비디아(NVIDIA) NIM 마이크로서비스를 확장한다고 발표했다. 생성형 AI는 산업을 빠르게 변화시키고 있으며, 점점 더 복잡해지는 모델을 효율적이고 비용 효과적으로 확장하기 위해 안전한 고성능 추론 솔루션에 대한 수요를 촉진하고 있다.

 

AWS는 지난 4일(현지시간) 열린 연례 AWS 리인벤트(re:Invent) 콘퍼런스에서 엔비디아와의 협업을 확대해 주요 AWS AI 서비스 전반에 걸쳐 엔비디아 NIM 마이크로서비스를 확장한다고 발표했다. 이를 통해 생성형 AI 애플리케이션을 위한 더 빠른 AI 추론과 짧은 지연 시간을 지원한다.

 

엔비디아 NIM 마이크로서비스는 이제 AWS 마켓플레이스(Marketplace), 아마존 베드록 마켓플레이스(Bedrock Marketplace), 아마존 세이지메이커 점프스타트(SageMaker JumpStart)에서 직접 제공된다. 이로 인해 개발자들이 일반적으로 사용되는 모델에 대해 엔비디아 최적화 추론을 대규모로 배포하는 것이 더욱 쉬워졌다.

 

엔비디아 NIM은 AWS 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼의 일부이다. 이는 개발자에게 클라우드, 데이터센터, 워크스테이션 전반에서 고성능 엔터프라이즈급 AI 모델 추론을 안전하고 안정적으로 배포하도록 설계된 사용하기 쉬운 마이크로서비스 세트를 제공한다.

 

이 사전 구축된 컨테이너는 엔비디아 트리톤 추론 서버(Triton Inference Server), 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 파이토치(PyTorch)와 같은 강력한 추론 엔진을 기반으로 구축됐다. 아울러 오픈 소스 커뮤니티 모델부터 엔비디아 AI 파운데이션(AI Foundation) 모델, 맞춤형 모델에 이르기까지 광범위한 범위의 AI 모델을 지원한다.

 

NIM 마이크로서비스는 아마존 엘라스틱 컴퓨트 클라우드(Elastic Compute Cloud, EC2), 아마존 엘라스틱 쿠버네티스 서비스(Elastic Kubernetes Service, EKS), 아마존 세이지메이커를 비롯한 다양한 AWS 서비스에 배포할 수 있다.

 

개발자들은 일반적으로 사용되는 모델과 모델 제품군으로 구축된 100개 이상의 NIM 마이크로서비스를 엔비디아 API 카탈로그에서 미리 볼 수 있다. 여기에는 메타(Meta)의 라마 3(Llama 3), 미스트랄 AI(Mistral AI)의 미스트랄과 믹스트랄(Mixtral), 엔비디아의 네모트론(Nemotron), 스태빌리티 AI(Stability AI)의 SDXL 등이 있다. 가장 일반적으로 사용되는 모델은 AWS 서비스에 배포하기 위한 자체 호스팅에 사용할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에서 실행되도록 최적화돼 있다.

 

모두를 위한 AWS의 NIM

다양한 산업 분야의 고객과 파트너들이 AWS에서 NIM을 활용하며 시장에 더 빨리 진입하고, 생성형 AI 애플리케이션과 데이터의 보안과 제어를 유지하며, 비용을 절감하고 있다.

 

IT 컨설팅과 디지털 서비스 제공업체인 소프트서브(SoftServe)는 AWS에 완전히 배포되고, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션을 개발했다. 이 솔루션은 AWS 마켓플레이스에서 제공되며, 소프트서브 생성형 AI 신약 개발(Gen AI Drug Discovery), 소프트서브 생성형 AI 산업 비서(Industrial Assistant), 디지털 컨시어지(Digital Concierge), 멀티모달 RAG 시스템(Multimodal RAG System), 콘텐츠 크리에이터(Content Creator), 음성 인식 플랫폼(Speech Recognition Platform)으로 구성된다.

 

이들 모두는 AI 애플리케이션 개발과 배포를 가속화하는 포괄적인 참조 워크플로우인 엔비디아 AI 블루프린트(Blueprint)를 기반으로 한다. 아울러 AI 에이전트, 디지털 트윈 등을 위한 엔비디아 가속 라이브러리, 소프트웨어 개발 키트, NIM 마이크로서비스가 포함된다.

 

AWS에서 NIM 시작하기

개발자는 고유한 필요와 요구사항에 따라 AWS에 엔비디아 NIM 마이크로서비스를 배포할 수 있다. 이를 통해 개발자와 기업은 다양한 AWS 서비스 전반에서 엔비디아에 최적화된 추론 컨테이너로 고성능 AI를 구현할 수 있다.

 

엔비디아 API 카탈로그를 방문해 100개 이상의 다양한 NIM 최적화 모델을 사용해 볼 수 있다. 또한, 개발자 라이선스 또는 90일 엔비디아 AI 엔터프라이즈 체험 라이선스를 요청해 AWS 서비스에 마이크로서비스 배포를 할 수 있다. 개발자는 AWS 마켓플레이스, 아마존 베드록 마켓플레이스 또는 아마존 세이지메이커 점프스타트에서 NIM 마이크로서비스를 알아볼 수도 있다.

 

#엔비디아#AWS#NIM

?

  1. 톰슨로이터, 생성형 AI 법률 어시스턴트 ‘코카운슬(CoCounsel)’ 국내 출시

    - Open AI, 구글 클라우드, 톰슨로이터 AI기술을 결합하여 업계 최고 수준의 콘텐츠와 법률 기술을 통합한 AI 법률 어시스턴트 제공 톰슨로이터 코리아가 법률 전문가를 위한 AI 어시스턴트 ‘코카운슬(CoCounsel)’을 국내에 출시하고 본격적인 판매에 나선다고...
    Date2024.12.19 Bynewsit Views470
    Read More
  2. 팀뷰어, 2025년 인공지능(AI) 전망 발표

    팀뷰어(TeamViewer)가 2025년 인공지능(AI)의 발전 방향을 조망하는 2025년 AI 전망을 발표했다. AI는 여전히 업무 조력자로서 확고하게 자리잡겠지만, 완전한 자동화는 아직 요원할 것이다.지난 몇 년간 AI가 조만간 모든 것을 완전히 장악할 것이라는 생각이...
    Date2024.12.19 Bynewsit Views430
    Read More
  3. SAS, ‘학습자용 SAS 바이야 워크벤치’ 발표…“빠른 데이터 분석 및 모델 구축 지원”

    - 학생과 교사 대상 무료 클라우드 기반 온디맨드 컴퓨팅 환경 제공 - SAS 언어와 파이썬 모두 지원… 학생들의 실무 역량 강화 및 취업 경쟁력 제고 지원 SAS가 학생과 교사를 위한 효율적인 개발 환경인 ‘학습자용 SAS 바이야 워크벤치(SAS Viya Workbench fo...
    Date2024.12.19 Bynewsit Views450
    Read More
  4. 사이냅소프트, 전자공시 기반 AI 기업정보 서비스 ‘DartPoint AI’ 오픈베타 출시

    - AI 어시스턴트와 함께 방대하고 복잡한 공시보고서 누구나 쉽게 분석 - 공시·기업정보 특화 LLM, 도큐먼트 AI 활용 영역 확대 - 보고서 내 모든 표 정보를 엑셀로 저장, 활용하여 기업 정보 분석 시간 단축 도큐먼트 AI 전문기업 사이냅소프트는 전자공시기...
    Date2024.12.19 Bynewsit Views367
    Read More
  5. IAS, 현대자동차그룹 글로벌 생산 관리 프로젝트에 ‘Canias ERP’ 공급

    IAS의 ERP 솔루션 카니아스(Canias) ERP가 현대자동차그룹의 글로벌 생산 관리 전략을 지원하는 핵심 솔루션으로 채택됐다. 이번 프로젝트는 Canias ERP를 통해 운영 효율성 향상, 품질 표준화, 자원 배분 최적화를 목표로 하며, 프로젝트 요건에 최적화된 표...
    Date2024.12.18 Bynewsit Views494
    Read More
  6. HS효성인포메이션시스템-테라텍, HPC 및 AI 시장 확대 업무 협약 체결

    - 맞춤형 HPC 서비스부터 운영 최적화고〮객 맞춤형 교육까지 국내 HPC 시장 확대 위한 양사 협력 강화 - 고객 니즈와 운영 환경에 적합한 실질적인 HPC/AI 구축 지원…고객 AX 혁신 위한 최적의 로드맵 제시 HS효성인포메이션시스템은 고성능 컴퓨팅(HPC) 전문...
    Date2024.12.17 Bynewsit Views437
    Read More
  7. 사이버다임, 중소기업 신규 과금형 모델 '구축과금형' 출시

    문서중앙화 솔루션 선도기업 사이버다임이 중소기업의 초기 투자 부담을 낮춘 새로운 과금형 모델 '구축과금형'을 공식 출시했다. 이 과금 모델은 자체 서버 운영이 필요한 구축형 제품에 구독형 서비스인 과금형 모델을 결합해 문서 관리 기능과 서버 운영의 ...
    Date2024.12.17 Bynewsit Views368
    Read More
  8. 샵백코리아, 신규 고객 및 활성 고객 전년 대비 약 140% 증가…“연말연시 ‘2024 홀리데이 프로모션’”

    - 여행 카테고리, 전년 대비 약 189% 증가해 가장 큰 폭으로 성장 - 12월 31일(화) 오전 11시 59분까지 스토어 3곳 이상에서 결제 시, 최대 5만원의 추가 보너스 제공 - 야놀자, 여기어때, S.I.빌리지 등 국내 플랫폼은 물론, 에스티로더 그룹, 퓨마, 쉬인 등 ...
    Date2024.12.17 Bynewsit Views480
    Read More
  9. 카테노이드, 노랑풍선 자체 라이브방송 ‘옐로LIVE’에 ‘콜러스 라이브 커머스’ 제공

    - 총 3차례 자체 라이브 방송 안정적으로 진행 - 비회원 예약 기능, 실시간 채팅 문의 등으로 라이브 방송 접근 장벽 낮춰 - 여행업계, 자체 라이브방송으로 고객 소통 및 신뢰도 강화 국내 최대 서비스형 비디오 테크놀로지(VTaaS) 기업 카테노이드가 자사의 ...
    Date2024.12.16 Bynewsit Views469
    Read More
  10. 한국레노버, 엔지니어가 직접 현장 방문하는 ‘온사이트’ 서비스 지원

    - 12월부터 ‘프리미엄 케어’ 서비스에 ‘온사이트’ 서비스 함께 지원 - 엔지니어 익일 방문실〮시간 이동 현황 등 카카오톡 알림톡으로 제공 - “외산 브랜드 서비스에 대한 신뢰 강화하고 더 나은 고객 경험 제공할 것” 한국레노버가 소비자 부담을 줄이고 편리...
    Date2024.12.13 Bynewsit Views566
    Read More
목록
Board Pagination Prev 1 ... 72 73 74 75 76 77 78 79 80 81 ... 222 Next
/ 222
CLOSE