- AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능

- AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공

- 소프트서브, 엔비디아 NIMAWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개발

 

엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화.jpg

엔비디아 아마존 웹 서비스(AWS) AI 서비스 전반에 엔비디아(NVIDIA) NIM 마이크로서비스를 확장한다고 발표했다. 생성형 AI는 산업을 빠르게 변화시키고 있으며, 점점 더 복잡해지는 모델을 효율적이고 비용 효과적으로 확장하기 위해 안전한 고성능 추론 솔루션에 대한 수요를 촉진하고 있다.

 

AWS는 지난 4일(현지시간) 열린 연례 AWS 리인벤트(re:Invent) 콘퍼런스에서 엔비디아와의 협업을 확대해 주요 AWS AI 서비스 전반에 걸쳐 엔비디아 NIM 마이크로서비스를 확장한다고 발표했다. 이를 통해 생성형 AI 애플리케이션을 위한 더 빠른 AI 추론과 짧은 지연 시간을 지원한다.

 

엔비디아 NIM 마이크로서비스는 이제 AWS 마켓플레이스(Marketplace), 아마존 베드록 마켓플레이스(Bedrock Marketplace), 아마존 세이지메이커 점프스타트(SageMaker JumpStart)에서 직접 제공된다. 이로 인해 개발자들이 일반적으로 사용되는 모델에 대해 엔비디아 최적화 추론을 대규모로 배포하는 것이 더욱 쉬워졌다.

 

엔비디아 NIM은 AWS 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼의 일부이다. 이는 개발자에게 클라우드, 데이터센터, 워크스테이션 전반에서 고성능 엔터프라이즈급 AI 모델 추론을 안전하고 안정적으로 배포하도록 설계된 사용하기 쉬운 마이크로서비스 세트를 제공한다.

 

이 사전 구축된 컨테이너는 엔비디아 트리톤 추론 서버(Triton Inference Server), 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 파이토치(PyTorch)와 같은 강력한 추론 엔진을 기반으로 구축됐다. 아울러 오픈 소스 커뮤니티 모델부터 엔비디아 AI 파운데이션(AI Foundation) 모델, 맞춤형 모델에 이르기까지 광범위한 범위의 AI 모델을 지원한다.

 

NIM 마이크로서비스는 아마존 엘라스틱 컴퓨트 클라우드(Elastic Compute Cloud, EC2), 아마존 엘라스틱 쿠버네티스 서비스(Elastic Kubernetes Service, EKS), 아마존 세이지메이커를 비롯한 다양한 AWS 서비스에 배포할 수 있다.

 

개발자들은 일반적으로 사용되는 모델과 모델 제품군으로 구축된 100개 이상의 NIM 마이크로서비스를 엔비디아 API 카탈로그에서 미리 볼 수 있다. 여기에는 메타(Meta)의 라마 3(Llama 3), 미스트랄 AI(Mistral AI)의 미스트랄과 믹스트랄(Mixtral), 엔비디아의 네모트론(Nemotron), 스태빌리티 AI(Stability AI)의 SDXL 등이 있다. 가장 일반적으로 사용되는 모델은 AWS 서비스에 배포하기 위한 자체 호스팅에 사용할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에서 실행되도록 최적화돼 있다.

 

모두를 위한 AWS의 NIM

다양한 산업 분야의 고객과 파트너들이 AWS에서 NIM을 활용하며 시장에 더 빨리 진입하고, 생성형 AI 애플리케이션과 데이터의 보안과 제어를 유지하며, 비용을 절감하고 있다.

 

IT 컨설팅과 디지털 서비스 제공업체인 소프트서브(SoftServe)는 AWS에 완전히 배포되고, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션을 개발했다. 이 솔루션은 AWS 마켓플레이스에서 제공되며, 소프트서브 생성형 AI 신약 개발(Gen AI Drug Discovery), 소프트서브 생성형 AI 산업 비서(Industrial Assistant), 디지털 컨시어지(Digital Concierge), 멀티모달 RAG 시스템(Multimodal RAG System), 콘텐츠 크리에이터(Content Creator), 음성 인식 플랫폼(Speech Recognition Platform)으로 구성된다.

 

이들 모두는 AI 애플리케이션 개발과 배포를 가속화하는 포괄적인 참조 워크플로우인 엔비디아 AI 블루프린트(Blueprint)를 기반으로 한다. 아울러 AI 에이전트, 디지털 트윈 등을 위한 엔비디아 가속 라이브러리, 소프트웨어 개발 키트, NIM 마이크로서비스가 포함된다.

 

AWS에서 NIM 시작하기

개발자는 고유한 필요와 요구사항에 따라 AWS에 엔비디아 NIM 마이크로서비스를 배포할 수 있다. 이를 통해 개발자와 기업은 다양한 AWS 서비스 전반에서 엔비디아에 최적화된 추론 컨테이너로 고성능 AI를 구현할 수 있다.

 

엔비디아 API 카탈로그를 방문해 100개 이상의 다양한 NIM 최적화 모델을 사용해 볼 수 있다. 또한, 개발자 라이선스 또는 90일 엔비디아 AI 엔터프라이즈 체험 라이선스를 요청해 AWS 서비스에 마이크로서비스 배포를 할 수 있다. 개발자는 AWS 마켓플레이스, 아마존 베드록 마켓플레이스 또는 아마존 세이지메이커 점프스타트에서 NIM 마이크로서비스를 알아볼 수도 있다.

 

#엔비디아#AWS#NIM

?

  1. 마에스트로 포렌식, 모바일 포렌식 및 악성코드 분석 통합플랫폼 ‘마에스트로 모바일 포렌식’ 출시

    - 모바일 기기의 디지털 데이터 추출과 악성코드 분석을 동시에 처리할 수 있는 업계 유일한 솔루션 마에스트로 포렌식은 오늘 모바일 데이터 추출과 악성코드 탐지 분석을 동시에 수행할 수 있는 ‘마에스트로 모바일 포렌식(MAESTRO Mobile Forensics)’을 출...
    Date2024.12.12 Bynewsit Views132
    Read More
  2. 레드 일렉트릭카, 다쏘시스템의 3D익스피리언스 플랫폼으로 설계 프로세스 및 협업 방식 혁신

    - 스페인 송전 시스템 운영업체, 클라우드에서 다쏘시스템의3D익스피리언스 플랫폼 사용해 스마트 그리드 에너지 네트워크 설계 조정 - 1,500명 이상의 사용자, ‘멀티스케일’ 버추얼 트윈 통해 연결되어 전기 자산 생태계 시각화 가능해져 - 클라우드 기반 협...
    Date2024.12.12 Bynewsit Views390
    Read More
  3. 헥사곤, AI 기반 CAM 프로그래밍 툴 공개…“공작기계 프로그래밍 시간 75% 단축”

    - 헥사곤 ‘프로플랜AI’, 공작기계 프로그래밍 자동화 및 지식 베이스 리소스 액세스 속도 강화 - 기업 내부 데이터 학습 통해 프로그래밍 속도 및 효율성 개선… 전문 인력 생산성 제고 - ‘헥사곤 코파일럿’ 기능, CAM 소프트웨어 상에서 ▲모범 사례 ▲사용자 맞...
    Date2024.12.12 Bynewsit Views408
    Read More
  4. 사이냅소프트, 서울형 R&D 지원사업 AI 부문 1위!

    - 2024년 서울형 R&D 성과공유회에서 서울특별시장 표창 - 국산 도큐먼트 AI기술로 기업 경쟁력 강화에 기여 사이냅소프트는 서울경제진흥원(SBA) 주관의 '서울형 R&D 지원사업'에서 인공지능(AI) 기술사업화 지원사업 부문 최우수과제로 선정되어 서울특별시...
    Date2024.12.12 Bynewsit Views391
    Read More
  5. 래티스, 새로운 소형 및 미드레인지 FPGA 제품 출시…“저전력 FPGA 리더십 강화”

    - 래티스 Nexus 2 차세대 소형 FPGA 플랫폼 출시 - 래티스 Avant 30 및 Avant 50 디바이스로 미드레인지 포트폴리오 확장 - 애플리케이션별 솔루션 스택 및 설계 소프트웨어 툴 기능 강화 래티스 반도체는 ‘래티스 개발자 컨퍼런스 2024(Lattice Developers Co...
    Date2024.12.12 Bynewsit Views179
    Read More
  6. AWS-SAP, 클라우드 ERP 배포 간소화 위한 AWS용 ‘그로우 위드 SAP’ 출시

    - AWS 마켓플레이스에서 선보이는 ‘그로우 위드 SAP’, 고객의 신속한 클라우드 ERP 도입과 첨단 생성형 AI 솔루션 기반 혁신 가속화 아마존웹서비스(AWS)와 SAP SE는 AWS 리인벤트(re:Invent)에서 모든 규모의 고객이 세계에서 가장 널리 채택된 클라우드의 안...
    Date2024.12.11 Bynewsit Views487
    Read More
  7. 온세미, 코보의 실리콘 카바이드 JFET 기술 인수...“AI 데이터센터용 전력 포트폴리오 강화”

    - 코보의 SiC JFET 사업과 유나이티드 실리콘 카바이드 자회사 인수... 5년 내 13억 달러 규모의 시장 기회 확대 예상 - 전기차 배터리 차단기, 반도체 차단기 등 신흥 시장 확대 가속화 온세미(ON)는 코보(Qorvo)로부터 유나이티드 실리콘 카바이드 자회사를 ...
    Date2024.12.11 Bynewsit Views195
    Read More
  8. 노르딕, 「Thingy:91 X」 플랫폼 출시…“셀룰러 IoT/와이파이 위치확인 프로토타이핑 간소화”

    노르딕 세미컨덕터는 최신 IoT 프로토타이핑 플랫폼인 노르딕 Thingy:91 X를 출시했다고 밝혔다. Thingy:91 X는 포괄적인 온보드 기능 세트를 통해 IoT 프로토타이핑 프로세스를 간소화함으로써 보다 효율적으로 셀룰러 IoT 애플리케이션을 개발하고, 시장 출...
    Date2024.12.11 Bynewsit Views180
    Read More
  9. AMD, 버설 RF 시리즈 적응형 SoC 출시…“내장형 다이렉트 RF 샘플링 컨버터 탑재”

    - 고분해능의 RF 데이터 컨버터, 전용 DSP 하드 IP, AI 엔진 및 프로그래머블 로직을 단일 칩 장치에 탑재한 최초의 AMD 버설 적응형 SoC - 싱글 칩 디바이스로 업계 최고 컴퓨팅 성능 제공 AMD는 단일 칩 디바이스로 업계 최고 수준의 컴퓨팅 성능을 제공하는...
    Date2024.12.11 Bynewsit Views233
    Read More
  10. 엑스리얼, 맞춤형 시네마틱 공간 디스플레이 엑스리얼 원(XREAL One) 출시

    - 3DoF 시네마틱 공간 디스플레이 제공, 엑스리얼 개발 실리콘 칩 X1 최초 탑재되어 완전한 맞춤형 시네마틱 가상화면 체험 가능 - 새롭게 설계된 광학 엔진, 조절 가능한 동공 간 거리 옵션 탑재로 사용자의 몰입감 극대화 - USB-C 포트 통한 비디오 출력이 ...
    Date2024.12.11 Bynewsit Views121
    Read More
  11. 딥엘, 법률 업계 AI 도입 현황 조사…업계 종사자 87% “딥엘 언어 AI 플랫폼 업무 속도 높이는 데 도움”

    - 법률 산업 내 AI 활용 현황 담은 보고서 공개…산업 동향, 과제 및 2025년 전망 담아 딥엘(DeepL)이 2025년과 그 이후 AI가 법률 업계의 미래를 혁신적으로 변화시키는 방식을 담은 최신 백서 <AI와 법률 글로벌 성공 위한 필수 전략(AI and Law: Unlocking G...
    Date2024.12.11 Bynewsit Views487
    Read More
  12. 캐논 ‘파워샷 골프’, ‘2024 매경GOLF 골프브랜드 대상’ 혁신상 수상

    - 캐논 ‘파워샷 골프’, 지난 10일 개최한 ‘2024 매경GOLF 골프브랜드대상’ 시상식에서 혁신상 수상 - 업계 최초로 거리 측정과 사진 및 동영상 촬영 기능을 모두 탑재한 골프 거리측정기로 혁신성 인정 - 프로 골퍼 김효주 프로와 스폰서십 계약 체결해 다양한...
    Date2024.12.11 Bynewsit Views114
    Read More
  13. 쿤텍-ETRI, 토탈 솔루션인 이지스(AEGIS) 고도화 성공…“HW/SW 전체 공급망 보안 관리 가능”

    - ‘시스템 디바이스의 하드웨어 공급망 위협 대응 핵심기술 개발’ 과제 수행 공급망 보안 전문기업 쿤텍은 과학기술정보통신부에서 지원하고 정보통신기획평가원(IITP)이 주관하는 정보보호 핵심원천 기술개발사업인 ‘시스템 디바이스의 하드웨어 공급망 위협 ...
    Date2024.12.11 Bynewsit Views140
    Read More
  14. HS효성인포메이션시스템, AI 최적화된 인프라로 한국은행 ‘데이터 레이크 구축사업’ 성료

    - 새로운 유형 데이터의 처리∙활용 요구에 유연한 대응이 가능하도록 가상화 기반 인프라 구축 - 대용량∙고빈도 데이터 처리에 특화된 고성능 저장소 및 고속 데이터 처리 시스템 구축 - 인프라 설계부터 구축까지 全 과정 전담해 효율적이고 완성도 높은 시스...
    Date2024.12.11 Bynewsit Views404
    Read More
  15. LG디스플레이, 세일즈포스 ‘세일즈 클라우드’ 도입…“데이터 기반의 전략 수립 통해 프리미엄 차량용 디스플레이 시장 선도”

    - LG디스플레이 Auto 사업그룹, 세일즈 클라우드 기반 수주 프로세스 효율화 성공, 프리미엄 차량용 디스플레이 시장 1위 달성 - 업무 보고 절차 간소화로 고객 요청 회신 시간 13일 이내로 단축, B2B 수주 업무 프로세스 효율화 성과 세일즈포스는 LG디스플레...
    Date2024.12.10 Bynewsit Views470
    Read More
  16. 와콤, 연말 홀리데이 프로모션…네쇼라 ‘와콤 무빙크’ 특별 방송 진행

    - 와콤, 연말 맞이 홀리데이 프로모션 진행…’와콤 무빙크’ 특별 할인 혜택 및 랜덤 기프트 박스 증정 - 네이버 쇼핑 라이브에서 OLED 액정 타블렛 ‘와콤 무빙크’ 라이브 특별 할인쿠폰 및 사은품 제공 와콤코리아는 오는 24일(화)까지 ‘와콤 무빙크’ 제품 특집...
    Date2024.12.10 Bynewsit Views120
    Read More
  17. 레노버, AI 기반 ‘CRaaS 솔루션’ 출시…“고객 보안 강화”

    - 레노버 하드웨어 리더십에 MS 보안 솔루션 접목… 비즈니스 연속성 보장∙고객 보호 기능 강화 - 디지털 자산 및 디바이스 전반에 걸쳐 사이버 보안과 탐지∙대응∙복원 기능 제공 한국레노버가 인공지능(AI) 기반 ‘구독형 사이버 복원력 서비스(CRaaS)’를 출시...
    Date2024.12.10 Bynewsit Views435
    Read More
  18. 샥즈, ‘오픈핏 에어 X 잔망루피 콜라보 에디션’ 연말 특별 할인

    - 특별함과 실용성을 모두 갖춘 ‘오픈핏 에어 X 잔망루피 콜라보 에디션’으로 연말 선물 제안 - 출시 이후 첫 할인 적용… 오는 25일까지 특별 할인가에 만나볼 수 있어 - 소문내기 이벤트, 포토리뷰 이벤트 참여 고객 대상 푸짐한 경품 마련 글로벌 오픈형 이...
    Date2024.12.10 Bynewsit Views133
    Read More
  19. 캐논코리아, 소비자중심경영(CCM) 3회 연속 재인증 획득  

    - 3회 연속 CCM 인증 획득하며 고객 중심 경영 철학과 높은 서비스 품질 입증 - ‘소비자중심경영 추진위원회’ 운영, CTS 구축 통한 VOC 고도화 등으로 소비자 만족도 높인 결과 캐논코리아는 공정거래위원회로부터 3회 연속 소비자중심경영(Consumer Centered ...
    Date2024.12.10 Bynewsit Views127
    Read More
  20. 이글루코퍼레이션, ‘2025년 사이버 보안 위협 및 기술 전망 보고서’ 발표

    - AI, 딥페이크 등 신기술 악용에 따른 사이버 공격, 국가 주도 공급망 공격, 다변화된 랜섬웨어 공격, 크리덴셜 탈취 공격 증가 전망 - 자동화된 차세대 SOC, AI·OT·클라우드 보안 및 MLS 등 신보안체계를 충족하는 공급망 보안 아키텍처 등 선진 보안 기술 ...
    Date2024.12.10 Bynewsit Views137
    Read More
Board Pagination Prev 1 ... 84 85 86 87 88 89 90 91 92 93 ... 269 Next
/ 269
CLOSE