- AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능

- AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공

- 소프트서브, 엔비디아 NIMAWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개발

 

엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화.jpg

엔비디아 아마존 웹 서비스(AWS) AI 서비스 전반에 엔비디아(NVIDIA) NIM 마이크로서비스를 확장한다고 발표했다. 생성형 AI는 산업을 빠르게 변화시키고 있으며, 점점 더 복잡해지는 모델을 효율적이고 비용 효과적으로 확장하기 위해 안전한 고성능 추론 솔루션에 대한 수요를 촉진하고 있다.

 

AWS는 지난 4일(현지시간) 열린 연례 AWS 리인벤트(re:Invent) 콘퍼런스에서 엔비디아와의 협업을 확대해 주요 AWS AI 서비스 전반에 걸쳐 엔비디아 NIM 마이크로서비스를 확장한다고 발표했다. 이를 통해 생성형 AI 애플리케이션을 위한 더 빠른 AI 추론과 짧은 지연 시간을 지원한다.

 

엔비디아 NIM 마이크로서비스는 이제 AWS 마켓플레이스(Marketplace), 아마존 베드록 마켓플레이스(Bedrock Marketplace), 아마존 세이지메이커 점프스타트(SageMaker JumpStart)에서 직접 제공된다. 이로 인해 개발자들이 일반적으로 사용되는 모델에 대해 엔비디아 최적화 추론을 대규모로 배포하는 것이 더욱 쉬워졌다.

 

엔비디아 NIM은 AWS 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼의 일부이다. 이는 개발자에게 클라우드, 데이터센터, 워크스테이션 전반에서 고성능 엔터프라이즈급 AI 모델 추론을 안전하고 안정적으로 배포하도록 설계된 사용하기 쉬운 마이크로서비스 세트를 제공한다.

 

이 사전 구축된 컨테이너는 엔비디아 트리톤 추론 서버(Triton Inference Server), 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 파이토치(PyTorch)와 같은 강력한 추론 엔진을 기반으로 구축됐다. 아울러 오픈 소스 커뮤니티 모델부터 엔비디아 AI 파운데이션(AI Foundation) 모델, 맞춤형 모델에 이르기까지 광범위한 범위의 AI 모델을 지원한다.

 

NIM 마이크로서비스는 아마존 엘라스틱 컴퓨트 클라우드(Elastic Compute Cloud, EC2), 아마존 엘라스틱 쿠버네티스 서비스(Elastic Kubernetes Service, EKS), 아마존 세이지메이커를 비롯한 다양한 AWS 서비스에 배포할 수 있다.

 

개발자들은 일반적으로 사용되는 모델과 모델 제품군으로 구축된 100개 이상의 NIM 마이크로서비스를 엔비디아 API 카탈로그에서 미리 볼 수 있다. 여기에는 메타(Meta)의 라마 3(Llama 3), 미스트랄 AI(Mistral AI)의 미스트랄과 믹스트랄(Mixtral), 엔비디아의 네모트론(Nemotron), 스태빌리티 AI(Stability AI)의 SDXL 등이 있다. 가장 일반적으로 사용되는 모델은 AWS 서비스에 배포하기 위한 자체 호스팅에 사용할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에서 실행되도록 최적화돼 있다.

 

모두를 위한 AWS의 NIM

다양한 산업 분야의 고객과 파트너들이 AWS에서 NIM을 활용하며 시장에 더 빨리 진입하고, 생성형 AI 애플리케이션과 데이터의 보안과 제어를 유지하며, 비용을 절감하고 있다.

 

IT 컨설팅과 디지털 서비스 제공업체인 소프트서브(SoftServe)는 AWS에 완전히 배포되고, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션을 개발했다. 이 솔루션은 AWS 마켓플레이스에서 제공되며, 소프트서브 생성형 AI 신약 개발(Gen AI Drug Discovery), 소프트서브 생성형 AI 산업 비서(Industrial Assistant), 디지털 컨시어지(Digital Concierge), 멀티모달 RAG 시스템(Multimodal RAG System), 콘텐츠 크리에이터(Content Creator), 음성 인식 플랫폼(Speech Recognition Platform)으로 구성된다.

 

이들 모두는 AI 애플리케이션 개발과 배포를 가속화하는 포괄적인 참조 워크플로우인 엔비디아 AI 블루프린트(Blueprint)를 기반으로 한다. 아울러 AI 에이전트, 디지털 트윈 등을 위한 엔비디아 가속 라이브러리, 소프트웨어 개발 키트, NIM 마이크로서비스가 포함된다.

 

AWS에서 NIM 시작하기

개발자는 고유한 필요와 요구사항에 따라 AWS에 엔비디아 NIM 마이크로서비스를 배포할 수 있다. 이를 통해 개발자와 기업은 다양한 AWS 서비스 전반에서 엔비디아에 최적화된 추론 컨테이너로 고성능 AI를 구현할 수 있다.

 

엔비디아 API 카탈로그를 방문해 100개 이상의 다양한 NIM 최적화 모델을 사용해 볼 수 있다. 또한, 개발자 라이선스 또는 90일 엔비디아 AI 엔터프라이즈 체험 라이선스를 요청해 AWS 서비스에 마이크로서비스 배포를 할 수 있다. 개발자는 AWS 마켓플레이스, 아마존 베드록 마켓플레이스 또는 아마존 세이지메이커 점프스타트에서 NIM 마이크로서비스를 알아볼 수도 있다.

 

#엔비디아#AWS#NIM

?

  1. LG디스플레이, 세일즈포스 ‘세일즈 클라우드’ 도입…“데이터 기반의 전략 수립 통해 프리미엄 차량용 디스플레이 시장 선도”

    - LG디스플레이 Auto 사업그룹, 세일즈 클라우드 기반 수주 프로세스 효율화 성공, 프리미엄 차량용 디스플레이 시장 1위 달성 - 업무 보고 절차 간소화로 고객 요청 회신 시간 13일 이내로 단축, B2B 수주 업무 프로세스 효율화 성과 세일즈포스는 LG디스플레...
    Date2024.12.10 Bynewsit Views404
    Read More
  2. 레노버, AI 기반 ‘CRaaS 솔루션’ 출시…“고객 보안 강화”

    - 레노버 하드웨어 리더십에 MS 보안 솔루션 접목… 비즈니스 연속성 보장∙고객 보호 기능 강화 - 디지털 자산 및 디바이스 전반에 걸쳐 사이버 보안과 탐지∙대응∙복원 기능 제공 한국레노버가 인공지능(AI) 기반 ‘구독형 사이버 복원력 서비스(CRaaS)’를 출시...
    Date2024.12.10 Bynewsit Views364
    Read More
  3. 크리테오, 연말 최대 쇼핑 시즌 대비 마케터를 위한 ‘리테일 미디어’ 활용 전략 발표

    크리테오는 9일 크리테오 코리아 본사에서 최신 디지털 광고 트렌드와 리테일 미디어를 통한 비즈니스 성장 전략을 발표했다. 크리테오 코리아 최선화 엔터프라이즈 본부장은 “오늘날 소비자들은 전통적인 마케팅 퍼널을 따라 제품을 구매하는 것이 아닌, 다양...
    Date2024.12.10 Bynewsit Views342
    Read More
  4. 레노버-아이크래프트, HPC/AI 파트너십 체결…“국내 수냉식 서버 시장 공략 박차”

    - 레노버 글로벌 테크놀로지 코리아(ISG), 아이크래프트를 HPC/AI 파트너사로 선정 - 엔비디아 GPU 및 슈퍼칩 지원하는 씽크시스템(ThinkSystem) 수냉식 서버의 국내 시장 공략 - 차세대 넵튠(Neptune) 액체 냉각 기술 기반해 고성능컴퓨팅(HPC) 및 AI 분야 혁...
    Date2024.12.09 Bynewsit Views339
    Read More
  5. 엔비디아, 베트남 R&D 센터 개소…“AI 개발 역량 강화”

    - AI 소프트웨어 개발과 베트남 STEM 엔지니어 인재 활용해 AI 도입 가속화 - 동남아시아 혁신 생태계와 첨단 산업 미래 위한 초석 마련 - 엔비디아 인셉션 프로그램 등으로 100개 이상 베트남 스타트업, 65개 대학과 지속적 협업 엔비디아가 베트남 정부와 협...
    Date2024.12.09 Bynewsit Views340
    Read More
  6. 캔바, 맞춤형 인쇄 서비스 ‘캔바 프린트’ 국내 출시

    - 디자인부터 인쇄까지 지원하는 원스탑 솔루션 입지 강화 올인원 비주얼 커뮤니케이션 플랫폼 캔바(Canva)가 맞춤형 인쇄 서비스 ‘캔바 프린트’를 국내 출시했다. 사용자는 이제 캔바를 통해 디자인한 제작물을 캔바 플랫폼 상에서 바로 인쇄 의뢰하고 문 앞...
    Date2024.12.06 Bynewsit Views457
    Read More
  7. 엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화

    - AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능 - AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공 - 소프트서브, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개...
    Date2024.12.06 Bynewsit Views304
    Read More
  8. Qt그룹, 'Qt LTS 릴리스' 지원 기간 최대 5년으로 연장

    - 사이버복원력법(CRA) 준수 위해 유지보수 지원 서비스 5년으로 연장 - CRA 규정 준수를 위해 보안 및 취약점 관리 강화하고 SBOM 문서 제공 Qt그룹이 자체 개발 솔루션인 Qt 프레임워크의 장기 지원 정책(LTS) 기간을 5년으로 연장한다고 밝혔다. 최근 유럽 ...
    Date2024.12.05 Bynewsit Views410
    Read More
  9. 생성형 AI 스타트업 트웰브랩스, AWS와 협력으로 텍스트 검색하듯 영상 검색 지원

    - 트웰브랩스, 자연어 사용해 영상 검색 가능케 해…가장 방대한 데이터 소스인 영상을 접근 가능한 정보 소스로 탈바꿈 - 대화형 쿼리 통해 수십 년 분량 영상 아카이브에서 특정 영화 장면을 찾거나 운동선수들의 경기 영상을 평가 가능 - 트웰브랩스, AWS 사...
    Date2024.12.04 Bynewsit Views319
    Read More
  10. 스노우플레이크, 내년 상반기 한국에서 ‘마이크로소프트 애저’ 지원

    - AWS에 이어 마이크로소프트 애저 환경에서 AI 데이터 클라우드 서비스 제공 - 국내 고객 대상 ‘크로스 클라우드’ 서비스 제공 예정 - 멀티 클라우드 데이터 전략을 실현하며 일관되고 유연한 관리 가능 스노우플레이크(Snowflake)가 2025년 상반기부터 국내 ...
    Date2024.12.03 Bynewsit Views314
    Read More
목록
Board Pagination Prev 1 ... 70 71 72 73 74 75 76 77 78 79 ... 218 Next
/ 218
CLOSE