- AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능

- AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공

- 소프트서브, 엔비디아 NIMAWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개발

 

엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화.jpg

엔비디아 아마존 웹 서비스(AWS) AI 서비스 전반에 엔비디아(NVIDIA) NIM 마이크로서비스를 확장한다고 발표했다. 생성형 AI는 산업을 빠르게 변화시키고 있으며, 점점 더 복잡해지는 모델을 효율적이고 비용 효과적으로 확장하기 위해 안전한 고성능 추론 솔루션에 대한 수요를 촉진하고 있다.

 

AWS는 지난 4일(현지시간) 열린 연례 AWS 리인벤트(re:Invent) 콘퍼런스에서 엔비디아와의 협업을 확대해 주요 AWS AI 서비스 전반에 걸쳐 엔비디아 NIM 마이크로서비스를 확장한다고 발표했다. 이를 통해 생성형 AI 애플리케이션을 위한 더 빠른 AI 추론과 짧은 지연 시간을 지원한다.

 

엔비디아 NIM 마이크로서비스는 이제 AWS 마켓플레이스(Marketplace), 아마존 베드록 마켓플레이스(Bedrock Marketplace), 아마존 세이지메이커 점프스타트(SageMaker JumpStart)에서 직접 제공된다. 이로 인해 개발자들이 일반적으로 사용되는 모델에 대해 엔비디아 최적화 추론을 대규모로 배포하는 것이 더욱 쉬워졌다.

 

엔비디아 NIM은 AWS 마켓플레이스에서 제공되는 엔비디아 AI 엔터프라이즈(Enterprise) 소프트웨어 플랫폼의 일부이다. 이는 개발자에게 클라우드, 데이터센터, 워크스테이션 전반에서 고성능 엔터프라이즈급 AI 모델 추론을 안전하고 안정적으로 배포하도록 설계된 사용하기 쉬운 마이크로서비스 세트를 제공한다.

 

이 사전 구축된 컨테이너는 엔비디아 트리톤 추론 서버(Triton Inference Server), 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 파이토치(PyTorch)와 같은 강력한 추론 엔진을 기반으로 구축됐다. 아울러 오픈 소스 커뮤니티 모델부터 엔비디아 AI 파운데이션(AI Foundation) 모델, 맞춤형 모델에 이르기까지 광범위한 범위의 AI 모델을 지원한다.

 

NIM 마이크로서비스는 아마존 엘라스틱 컴퓨트 클라우드(Elastic Compute Cloud, EC2), 아마존 엘라스틱 쿠버네티스 서비스(Elastic Kubernetes Service, EKS), 아마존 세이지메이커를 비롯한 다양한 AWS 서비스에 배포할 수 있다.

 

개발자들은 일반적으로 사용되는 모델과 모델 제품군으로 구축된 100개 이상의 NIM 마이크로서비스를 엔비디아 API 카탈로그에서 미리 볼 수 있다. 여기에는 메타(Meta)의 라마 3(Llama 3), 미스트랄 AI(Mistral AI)의 미스트랄과 믹스트랄(Mixtral), 엔비디아의 네모트론(Nemotron), 스태빌리티 AI(Stability AI)의 SDXL 등이 있다. 가장 일반적으로 사용되는 모델은 AWS 서비스에 배포하기 위한 자체 호스팅에 사용할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에서 실행되도록 최적화돼 있다.

 

모두를 위한 AWS의 NIM

다양한 산업 분야의 고객과 파트너들이 AWS에서 NIM을 활용하며 시장에 더 빨리 진입하고, 생성형 AI 애플리케이션과 데이터의 보안과 제어를 유지하며, 비용을 절감하고 있다.

 

IT 컨설팅과 디지털 서비스 제공업체인 소프트서브(SoftServe)는 AWS에 완전히 배포되고, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션을 개발했다. 이 솔루션은 AWS 마켓플레이스에서 제공되며, 소프트서브 생성형 AI 신약 개발(Gen AI Drug Discovery), 소프트서브 생성형 AI 산업 비서(Industrial Assistant), 디지털 컨시어지(Digital Concierge), 멀티모달 RAG 시스템(Multimodal RAG System), 콘텐츠 크리에이터(Content Creator), 음성 인식 플랫폼(Speech Recognition Platform)으로 구성된다.

 

이들 모두는 AI 애플리케이션 개발과 배포를 가속화하는 포괄적인 참조 워크플로우인 엔비디아 AI 블루프린트(Blueprint)를 기반으로 한다. 아울러 AI 에이전트, 디지털 트윈 등을 위한 엔비디아 가속 라이브러리, 소프트웨어 개발 키트, NIM 마이크로서비스가 포함된다.

 

AWS에서 NIM 시작하기

개발자는 고유한 필요와 요구사항에 따라 AWS에 엔비디아 NIM 마이크로서비스를 배포할 수 있다. 이를 통해 개발자와 기업은 다양한 AWS 서비스 전반에서 엔비디아에 최적화된 추론 컨테이너로 고성능 AI를 구현할 수 있다.

 

엔비디아 API 카탈로그를 방문해 100개 이상의 다양한 NIM 최적화 모델을 사용해 볼 수 있다. 또한, 개발자 라이선스 또는 90일 엔비디아 AI 엔터프라이즈 체험 라이선스를 요청해 AWS 서비스에 마이크로서비스 배포를 할 수 있다. 개발자는 AWS 마켓플레이스, 아마존 베드록 마켓플레이스 또는 아마존 세이지메이커 점프스타트에서 NIM 마이크로서비스를 알아볼 수도 있다.

 

#엔비디아#AWS#NIM

?

  1. 엔비디아, AWS에 엔비디아 NIM 제공 확대…AI 추론 극대화

    - AWS 마켓플레이스, 아마존 베드록 마켓플레이스, 아마존 세이지메이커 점프스타트에서 이용 가능 - AWS에서 엔비디아 네모트론-4, 라마 3.1 8B-인스트럭트 등 4가지 NIM 제공 - 소프트서브, 엔비디아 NIM과 AWS 서비스로 가속화된 6가지 생성형 AI 솔루션 개...
    Date2024.12.06 Bynewsit Views242
    Read More
  2. HS효성인포메이션시스템, ‘VSP One Block’에 All QLC 플래시 탑재…“AI 시대 데이터 경쟁력 강화 지원”

    - 듀얼 포트 30TB QLC 미디어 VSP One Block에 탑재 - 확장성∙비용 효율성 높이고 향상된 재해복구, 하이브리드 클라우드 지원 HS효성인포메이션시스템이 ‘VSP One Block’ 스토리지 컨트롤러에 All-QLC 플래시를 탑재한다고 밝혔다. 이를 통해 손쉬운 확장과 ...
    Date2024.12.06 Bynewsit Views103
    Read More
  3. 로지텍, 클로버추얼패션 오피스에 스마트 워크플레이스 솔루션 구축

    - 로지텍 스마트 워크플레이스 솔루션 도입으로 자유롭고 창의적인 업무 및 협업 공간 마련 - 총 13개의 다양한 규모의 회의실에 올인원 화상회의 솔루션 ‘랠리 플러스’ 및 ‘랠리 바’ 설치 - ‘사이트’와 ‘Tap’ 더한 한층 완성도 있는 구성으로 회의 참여자 전...
    Date2024.12.06 Bynewsit Views97
    Read More
  4. No Image

    퓨어스토리지-키옥시아, 하이퍼스케일 데이터센터용 차세대 올플래시 스토리지 솔루션 개발

    - 퓨어스토리지의 데이터 스토리지 플랫폼과 키옥시아의 QLC 플래시 메모리 결합해 하이퍼스케일 데이터센터용 차세대 올플래시 스토리지 솔루션 개발 - 하이퍼스케일 데이터센터 확장성·효율성·성능 향상 협력 퓨어스토리지는 메모리 반도체 선도기업 키옥시...
    Date2024.12.06 Bynewsit Views102
    Read More
  5. 한국레노버, ‘아이디어센터 타워 데스크톱’ 출시…“슬림한 디자인에 높은 공간 활용성”

    - 최신 인텔 코어 i7 프로세서인〮텔 UHD 770 그래픽 탑재 - 레노버 스마트 스토리지다〮양한 연결 단자 지원…사용자 편의성 향상 - 재활용 ABS 소재 활용한 환경 친화적 제품 한국레노버가 공간 활용성이 뛰어난 타워 데스크톱 신제품 ‘아이디어센터 타워 데...
    Date2024.12.05 Bynewsit Views106
    Read More
  6. Qt그룹, 'Qt LTS 릴리스' 지원 기간 최대 5년으로 연장

    - 사이버복원력법(CRA) 준수 위해 유지보수 지원 서비스 5년으로 연장 - CRA 규정 준수를 위해 보안 및 취약점 관리 강화하고 SBOM 문서 제공 Qt그룹이 자체 개발 솔루션인 Qt 프레임워크의 장기 지원 정책(LTS) 기간을 5년으로 연장한다고 밝혔다. 최근 유럽 ...
    Date2024.12.05 Bynewsit Views333
    Read More
  7. 생성형 AI 스타트업 트웰브랩스, AWS와 협력으로 텍스트 검색하듯 영상 검색 지원

    - 트웰브랩스, 자연어 사용해 영상 검색 가능케 해…가장 방대한 데이터 소스인 영상을 접근 가능한 정보 소스로 탈바꿈 - 대화형 쿼리 통해 수십 년 분량 영상 아카이브에서 특정 영화 장면을 찾거나 운동선수들의 경기 영상을 평가 가능 - 트웰브랩스, AWS 사...
    Date2024.12.04 Bynewsit Views268
    Read More
  8. 스노우플레이크, 내년 상반기 한국에서 ‘마이크로소프트 애저’ 지원

    - AWS에 이어 마이크로소프트 애저 환경에서 AI 데이터 클라우드 서비스 제공 - 국내 고객 대상 ‘크로스 클라우드’ 서비스 제공 예정 - 멀티 클라우드 데이터 전략을 실현하며 일관되고 유연한 관리 가능 스노우플레이크(Snowflake)가 2025년 상반기부터 국내 ...
    Date2024.12.03 Bynewsit Views257
    Read More
  9. 텐스토렌트, 삼성증권과 AFWP에서 시리즈 D 투자 유치…“한국과 협력 강화”

    텐스토렌트(Tenstorrent)는 국내 대표적인 벤처캐피털 회사인 삼성증권과 AF W파트너스( AFWP)가 주도한 6억 9,300만 달러 규모의 시리즈 D 펀딩 라운드를 발표했다. 두 회사는 텐스토렌트와 깊은 관계를 유지하고 있으며, 혁신적이고 성공적인 기술 기업에 투...
    Date2024.12.03 Bynewsit Views167
    Read More
  10. 마우저, <10명의 전문가들이 제시하는 GaN 기술에 대한 고찰> 전자책 발간

    - GaN 기반 전력전자장치의 이점을 분석 마우저 일렉트로닉스는 아나로그디바이스(ADI) 및 번스(Bourns)와 협력하여 효율성과 성능, 지속가능성 측면에서 질화갈륨(GaN) 기술이 제공하는 이점과 도전 과제 등을 탐구한 새로운 전자책을 발간했다고 밝혔다. 전...
    Date2024.12.03 Bynewsit Views147
    Read More
  11. 유아이패스, 조달청 나라장터에 ‘자동화 솔루션’ 등록

    - 정부 조달시스템 통해 유아이패스 엔터프라이즈 자동화 솔루션 직접 구매 가능 유아이패스가 정보보안 선도기업 에이텍정보기술(ATEK)과 함께 조달청 나라장터에 자사의 자동화 솔루션을 등록 완료했다고 밝혔다. 이를 통해 공공기관들이 간소화된 조달 프로...
    Date2024.12.03 Bynewsit Views283
    Read More
  12. 샵백코리아, “‘여행 스토어’ 이용 유저 전년 대비 2배 증가”

    - 샵백을 경유해 여행 스토어에서 결제한 유저, 전년 대비 2배 이상 성장 - 인기 여행 플랫폼에서 결제 시 최대 28% 캐시백 제공하는 특별 프로모션 진행 - 샵백 신규 멤버가 첫 구매로 추천 여행 스토어에서 1만 원 이상 결제 시 5000원의 추가 보너스 캐시백...
    Date2024.12.02 Bynewsit Views257
    Read More
  13. 힐셔, 신규 SPE 미디어 스위치 출시

    - PROFINET, EtherNet/IP, Modbus 네트워크용 힐셔는 산업용 이더넷 네트워크에 싱글 페어 이더넷(SPE)을 내장하기 위해 설계된 신규 SPE 미디어 스위치를 출시했다고 밝혔다. 힐셔의 다중 프로토콜 지원형 netX90 통신 컨트롤러를 기반으로 하는 새로운 SPE ...
    Date2024.12.02 Bynewsit Views131
    Read More
  14. 아비바, ‘하이브리드 클라우드 MES’ 솔루션 출시

    - 하이브리드 클라우드 제조실행시스템(MES) 솔루션으로 여러 곳에 분산된 플랜트 운영에 대한 포괄적인 시각화 및 운영 최적화 지원 아비바코리아는 데이터 서비스 및 시각화 기능을 강화한 하이브리드 제조실행시스템(MES) 솔루션을 출시하고 산업용 인텔리...
    Date2024.12.02 Bynewsit Views280
    Read More
  15. 캐논코리아, RF 마운트 시네마 카메라 ‘EOS C400’ 및 ‘EOS C80’ 론칭 쇼케이스 성료

    - EOS C400·EOS C80, 이면조사 적층형 CMOS 센서와 DIGIC DV7 영상 처리 엔진으로 다양한 전문 촬영 지원 캐논코리아가 서울 용산구 ‘공간오즈’에서 전문가용 시네마 카메라 EOS C400과 EOS C80의 출시를 기념해 론칭 쇼케이스를 개최했다. 캐논코리아는 론칭 ...
    Date2024.12.02 Bynewsit Views116
    Read More
  16. 파나소닉코리아, 테크닉스 차세대 그랜드 클래스 턴테이블 SL-1300G 출시

    - 신개발 트윈 로터형 코어리스 다이렉트 드라이브 모터와 ΔΣ(델타 시그마) 드라이브로 구동력 강화 - 3층 구조 플래터・2층 구조 섀시로 정밀한 밸런스 조정과 강성을 높여 보다 안정감 있는 사운드 재생 - 멀티-스테이지 사일런트 파워 서플라이로 안정적인 ...
    Date2024.12.02 Bynewsit Views92
    Read More
  17. 티맥스소프트-메가존클라우드, 부울경 '디지털 제조 혁신 컨퍼런스' 성공 개최

    - 영남지역 제조 고객 대상 컨퍼런스 열어 - AWS, 미라콤아이앤씨까지 참여해 종합적인 비즈니스 혁신 방안 제시 - 티맥스소프트, 다양한 클라우드 기업과 협업해 제조 분야 패러다임 전환 지원 기업용 소프트웨어 전문기업 티맥스소프트는 메가존클라우드와 ...
    Date2024.12.02 Bynewsit Views271
    Read More
  18. ASUS, 비즈니스 노트북 「엑스퍼트북(ExpertBook) P5」 출시…“루나 레이크 탑재한 최초의 AI 노트북”

    - 최신 인텔 코어 울트라 프로세서(시리즈 2) 탑재…에이수스 최초의 AI 비즈니스 노트북 - ExpertBook P5, 이전 세대 대비 2배 이상 향상된 배터리 수명으로 재택, 출근 등 하이브리드 업무에 적합 - 1.65cm의 슬림한 두께 및 1.29kg의 가벼운 무게로 출장, 미...
    Date2024.12.02 Bynewsit Views109
    Read More
  19. 티피링크, 휴대용 고성능 무선 공유기 ‘TL-WR1502X’ 출시

    티피링크(TP-Link)는 휴대성과 고성능을 동시에 제공하는 와이파이6 휴대용 공유기 ‘TL-WR1502X’를 국내에 출시했다고 밝혔다. TL-WR1502X는 가방이나 주머니에 넣어 들고 나닐 수 있는 포켓 사이즈로 컴팩트한 디자인과 휴대성을 갖췄으며, 고성능 AX1500 듀...
    Date2024.12.02 Bynewsit Views120
    Read More
  20. 가민, 프리미엄 휴대용 런치 모니터 ‘어프로치 R50’ 출시…“내장형 골프 시뮬레이터 내장”

    - 3개의 고속 카메라를 활용해 15가지 이상의 클럽 및 볼 지표 제공 - 43,000개 이상의 내장 골프 코스 맵에서 가상 골프 라운딩 가능 - 훈련 모드 탑재 및 고속 임팩트 영상으로 시각적 스윙 피드백 제공 가민은 내장형 골프 시뮬레이터를 탑재한 프리미엄 휴...
    Date2024.12.02 Bynewsit Views105
    Read More
Board Pagination Prev 1 ... 66 67 68 69 70 71 72 73 74 75 ... 249 Next
/ 249
CLOSE