- 새로운 GPU 가속 엔비디아 NIM 마이크로서비스와 클라우드 엔드포인트 카탈로그 공개

- 마이크로서비스 통해 데이터 처리, LLM 맞춤화, 추론, 검색 증강 생성, 가드레일 가속화

- 케이던스, 크라우드스트라이크, SAP, 서비스나우 등 광범위한 AI 에코시스템에 채택

 

엔비디아, 생성형 AI 마이크로서비스 출시… 생성형 AI 코파일럿 배포 지원.jpg

 

엔비디아는 수십 개의 엔터프라이즈용 생성형 AI 마이크로서비스를 출시했다고 발표했다기업은 이를 통해 지적 재산에 대한 완전한 소유권과 통제권을 유지하면서 자체 플랫폼에서 맞춤형 애플리케이션을 생성하고 배포할 수 있다.

 

클라우드 네이티브 마이크로서비스 카탈로그는 엔비디아 쿠다(CUDA)플랫폼을 기반으로 구축됐으며 엔비디아 NIM 마이크로서비스를 포함한다. 엔비디아 NIMTM은 엔비디아와 파트너 에코시스템에서 제공하는 24개 이상의 인기 AI 모델에 대한 추론 최적화를 지원한다. 또한 검색 증강 생성(retrieval-augmented generation, RAG), 가드레일, 데이터 처리, HPC 등을 위한 엔비디아 가속 소프트웨어 개발 키트, 라이브러리, 툴을 엔비디아 쿠다-X 마이크로서비스로 액세스할 수 있다. 이뿐만 아니라 엔비디아는 24개 이상의 의료용 NIM과 쿠다 -X 마이크로서비스도 별도로 발표했다.

 

엄선된 마이크로서비스는 엔비디아의 풀스택 컴퓨팅 플랫폼에 새로운 계층을 추가한다. 이 계층은 모델 개발자, 플랫폼 제공업체, 기업 AI 생태계를 맞춤형 AI 모델을 실행하는 표준화된 경로로 연결한다. 이때 맞춤형 AI 모델은 클라우드, 데이터센터, 워크스테이션, PC에 탑재된 수억 개의 GPU로 구성된 엔비디아 CUDA 설치 기반에 최적화된 모델이다.

 

어도비(Adobe)케이던스(Cadence)크라우드스트라이크(CrowdStrike)게티이미지(Getty Images), SAP서비스나우(ServiceNow)셔터스톡(Shutterstock) 등 선도적인 애플리케이션, 데이터, 사이버 보안 플랫폼 제공업체들이 엔비디아 AI 엔터프라이즈 5.0(AI Enterprise 5.0)에서 제공되는 새로운 엔비디아 생성형 AI 마이크로서비스를 가장 먼저 활용하고 있다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 "기존 엔터프라이즈 플랫폼은 생성형 AI 코파일럿으로 전환할 수 있는 풍부한 데이터를 가지고 있다. 파트너 에코시스템과 함께 구축된 이러한 컨테이너화된 AI 마이크로서비스는 모든 산업 분야의 기업이 AI 기업으로 거듭나기 위한 기본 요소"라고 밝혔다. 

 

몇 주에서 몇 분으로 배포 시간을 단축하는 NIM 추론 마이크로서비스

NIM 마이크로서비스는 트리톤 추론 서버(Triton Inference Server)와 텐서RT-LLM(TensorRT-LLM)을 비롯한 엔비디아 추론 소프트웨어로 구동되는 사전 구축된 컨테이너를 제공한다. 이로써 개발자는 배포 시간을 몇 주에서 몇 분으로 단축할 수 있다.

 

해당 서비스는 언어, 음성, 신약 개발과 같은 도메인을 위한 업계 표준 API를 제공한다. 개발자는 이러한 지원을 바탕으로 자체 인프라에서 안전하게 호스팅되는 독점 데이터를 사용해 AI 애플리케이션을 빠르게 구축할 수 있다. 더불어 애플리케이션을 필요에 따라 확장 가능한 유연상과 성능도 갖췄다. 엔비디아 가속 컴퓨팅 플랫폼 상에서 프로덕션 환경 내 생성형 AI를 실행할 수 있다.

 

NIM 마이크로서비스는 엔비디아, A121어뎁트(Adept), 코히어(Cohere)게티이미지, 셔터스톡 모델과 더불어 구글(Google), 허깅페이스(Hugging Face)메타(Meta), 마이크로소프트(Microsoft), 미스트랄 AI(Mistral AI), 스태빌리티 AI(Stability AI)의 오픈 모델을 배포할 수 있는 가장 빠르고 성능이 뛰어난 프로덕션 AI 컨테이너를 제공한다.

 

서비스나우는 새로운 도메인별 코파일럿과 기타 생성형 AI 애플리케이션을 더 빠르고 비용 효율적으로 개발, 배포하기 위해 NIM을 사용한다고 발표했다.

 

고객들은 아마존 세이지메이커(Amazon SageMaker)구글 쿠버네티스 엔진(Google Kubernetes Engine), 마이크로소프트 애저 AI(Microsoft Azure AI)에서 NIM 마이크로서비스에 액세스하고 딥셋(Deepset)랭체인(LangChain)라마인덱스(LlamaIndex)와 같은 인기 AI 프레임워크와 통합할 수 있게 된다.

 

RAG, 데이터 처리, 가드레일, HPC를 위한 쿠다-X 마이크로서비스

쿠다-X 마이크로서비스는 데이터 준비, 맞춤화, 훈련을 위한 엔드투엔드 빌딩 블록을 제공해 산업 전반에서 프로덕션 AI 개발 속도를 높인다. 기업들은 AI 채택을 가속화하기 위해 맞춤형 음성 및 번역 AI를 위한 엔비디아 리바(Riva)라우팅 최적화를 위한  엔비디아 cuOpt고해상도 기후 및 날씨 시뮬레이션을 위한 엔비디아 어스-2(Earth-2) 등의 쿠다-X 마이크로서비스를 사용할 수 있다.

 

개발자는 네모 리트리버(NeMo Retriever) 마이크로서비스를 통해 텍스트, 이미지, 막대 그래프, 라인 플롯, 파이 차트 등의 시각화를 포함한 비즈니스 데이터에 AI 애플리케이션을 연결해 매우 정확하고 맥락에 맞는 응답을 생성할 수 있다. 이러한 RAG 기능을 통해 코파일럿, 챗봇, 생성형 AI 생산성 도구에 더 많은 데이터를 제공해 정확도와 인사이트를 높일 수 있다.

 

맞춤형 모델 개발을 위한 추가적인 엔비디아 네모(NeMo) 마이크로서비스도 곧 출시될 예정이다. 여기에는 훈련과 검색을 위한 정제된 데이터세트 구축 목적의 엔비디아 네모 큐레이터(Curator), 도메인별 데이터로 LLM을 미세 조정하기 위한 엔비디아 네모 커스터마이저(Customizer), AI 모델 성능 분석을 위한 엔비디아 네모 이밸류에이터(Evaluator), LLM용 엔비디아 네모 가드레일(Guardrails) 등이 포함된다.

 

에코시스템, 생성형 AI 마이크로서비스로 엔터프라이즈 플랫폼 강화

주요 애플리케이션 제공업체 외에도 엔비디아 에코시스템 전반의 데이터, 인프라, 컴퓨팅 플랫폼 제공업체들이 엔비디아 마이크로서비스와 협력해 기업에 생성형 AI를 제공하고 있다.

 

박스(Box)클라우데라(Cloudera), 코히시티(Cohesity), 데이터스택스(Datastax)드롭박스(Dropbox)와 넷앱(NetApp)을 비롯한 최고의 데이터 플랫폼 제공업체들이 엔비디아 마이크로서비스와 협력하고 있다. 이로써 고객이 RAG 파이프라인을 최적화하고 자사의 독점 데이터를 생성형 AI 애플리케이션에 통합할 수 있도록 지원한다. 스노우플레이크(Snowflake)는 네모 리트리버를 활용하여 엔터프라이즈 데이터를 AI 애플리케이션 구축에 활용한다.

 

기업은 주요 클라우드 서비스인 아마존 웹 서비스(Amazon Web Services, AWS)구글 클라우드(Google Cloud)애저오라클 클라우드 인프라스트럭쳐(Oracle Cloud Infrastructure) 등 원하는 인프라에 엔비디아 AI 엔터프라이즈 5.0에 포함된 엔비디아 마이크로서비스를 배포할 수 있다.

 

또한 엔비디아 마이크로서비스는 시스코(Cisco), 델 테크놀로지스휴렛팩커드 엔터프라이즈(HPE), HP, 레노버(Lenovo)슈퍼마이크로(Supermicro)의 서버와 워크스테이션을 포함한 400개 이상의 엔비디아 인증 시스템(NVIDIA-Certified Systems)에서 지원된다. 한편 HPE는 생성형 AI용 HPE의 엔터프라이즈 컴퓨팅 솔루션 출시를 발표했으며, NIM과 엔비디아 AI 파운데이션(AI Foundation) 모델을 HPE AI 소프트웨어에 통합할 계획이다.

 

엔비디아 AI 엔터프라이즈 마이크로서비스는 VM웨어 프라이빗 AI 파운데이션 위드 엔비디아(VMware Private AI Foundation with NVIDIA)를 포함한 인프라 소프트웨어 플랫폼에 제공될 예정이다. 레드햇 오픈시프트(Red Hat OpenShift)는 보안, 규정 준수, 제어에 최적화된 기능을 통해 기업이 생성형 AI 기능을 애플리케이션에 보다 쉽게 통합할 수 있게 하는 엔비디아 NIM 마이크로서비스를 지원한다. 캐노니컬(Canonical)은 엔비디아 AI 엔터프라이즈를 통해 엔비디아 마이크로서비스에 대한 참드 쿠버네티스(Charmed Kubernetes) 지원을 추가하고 있다.

 

엔비디아 에코시스템은 어브릿지(Abridge), 애니스케일(Anyscale), 데이터이쿠(Dataiku), 데이터로봇(DataRobot)글린(Glean), H2O.ai, 시큐리티 AI(Securiti AI)스케일.ai(Scale.ai)옥토AI(OctoAI)웨이츠 앤드 바이어시스(Weights & Biases) 등 수백 개의 AI와 MLOps 파트너로 구성됐다. 엔비디아 에코시스템은 엔비디아 AI 엔터프라이즈를 통해 엔비디아 마이크로서비스에 대한 지원을 추가하고 있다.

 

아파치 루씬(Apache Lucene), 데이터스택스파이스(Faiss), 키네티카(Kinetica), 밀버스(Milvus), 레디스(Redis), 위비에이트(Weaviate)는 기업용 반응형 RAG 기능 강화를 위해 엔비디아 네모 리트리버 마이크로서비스와 협업하는 벡터 검색 제공업체 중 하나이다.

 

개발자는 ai.nvidia.com에서 무료로 엔비디아 마이크로서비스를 실험해 볼 수 있다. 기업에서는 엔비디아 인증 시스템 및 주요 클라우드 플랫폼에서 실행되는 엔비디아 AI 엔터프라이즈 5.0을 통해 프로덕션급 NIM 마이크로서비스를 배포할 수 있다.

 

#엔비디아#GTC#2024#생성형AI#코파일럿#AI

 

?

  1. 샥즈, 세계 최대 트레일 러닝 대회 ‘UTMB 월드 시리즈’와 파트너십 체결

    - 샥즈, 세계 최대 규모 트레일 러닝 대회 ‘UTMB 월드 시리즈’와 파트너십 체결 - 거친 산악 지형을 달리는 트레일 러닝에도 최적화된 오픈형 이어폰 지원 - 음악과 함께 안전하게 달리며 개인 기록 단축 및 완주에 기여 목표 오픈형 이어폰 시장의 강자 샥즈(...
    Date2024.04.12 Bynewsit Views165
    Read More
  2. 델, “AI시대에 최적화 된 2024년 AI 기반 클라이언트 신제품 공개”

    - 혁신적인 프리미엄 노트북·워크스테이션 등 폭넓은 클라이언트 포트폴리오 발표 - 엔드-투-엔드 AI 솔루션 포트폴리오 제공하는 델, 이번 출시 통해 방대한 AI 기반 클라이언트 포트폴리오 제안 한국 델 테크놀로지스(Dell)는 오늘 AI 기술이 강조되는 비즈...
    Date2024.04.12 Bynewsit Views185
    Read More
  3. 한국레노버, 비즈니스용 AI PC ‘씽크패드 X1 시리즈’ 신제품 출시

    - AI 기반 뛰어난 생산성, 창의성, 효율성 제공 - 생생한 디스플레이와 스피커, 카메라로 하이브리드 업무 환경 지원 - 제품 개발부터 생산, 소비, 폐기, 재활용 전 과정에서 지속가능성 고려 한국레노버가 AI 기반의 씽크패드 X1 카본 12세대와 씽크패드 X1 ...
    Date2024.04.12 Bynewsit Views192
    Read More
  4. 한국화웨이, ‘WIS 2024’에서 최첨단 지능형 솔루션 공개

    한국화웨이가 오는 17일부터 19일까지 3일간 서울 코엑스에서 개최되는 ‘월드IT쇼 2024(WIS 2024)'에 참가한다고 밝혔다. 올해로 16회를 맞이한 WIS 2024는 과학기술정보통신부가 주최하고 산업통상자원부가 후원하는 국내 최대 정보통신기술(ICT) 전시회이다....
    Date2024.04.12 Bynewsit Views494
    Read More
  5. 티피링크, 배치가 자유로운 와이파이6 공유기 「Archer AX23V」 출시

    티피링크(TP-Link)는 다양한 배치 방식이 가능한 와이파이6 공유기 'Archer AX23V'를 출시했다고 밝혔다. Archer AX23V는 듀얼밴드 AX1800급의 속도를 지원해 5GHz 대역에서 1201Mbps, 2.4GHz 대역에서 574Mbps의 네트워크 속도를 제공해 원활한 스트리밍과 게...
    Date2024.04.11 Bynewsit Views183
    Read More
  6. 와콤-SBS아카데미, ‘디지털 창작 인재’ 양성 업무협약 체결

    - SBS아카데미, 2012년부터 전국 지점 내 와콤 타블렛 1,800여 대 도입…독보적인 창작 인프라 ‘구축’ - 웹툰, 디지털 드로잉, 게임 그래픽, 마야 등 전 교육 과정에서 ‘와콤 타블렛’ 활용 한국와콤이 SBS아카데미컴퓨터아트학원, SBS아카데미게임학원과 함께 ...
    Date2024.04.11 Bynewsit Views175
    Read More
  7. 카테노이드-인플루엔셜, ‘AI 배속 재생 기술’ 공동사업 제휴 계약 체결

    - 카테노이드 온라인 비디오 플랫폼 ‘콜러스’에 인플루엔셜 ‘AI 배속 재생 기술’ 적용 - 양사 공동사업 제휴로 동영상 콘텐츠의 음성 기능 혁신 및 업계 새로운 표준 제시할 것 국내 최대 서비스형 비디오 테크놀로지(VTaaS) 기업 카테노이드가 윌라 오디오북...
    Date2024.04.11 Bynewsit Views528
    Read More
  8. 세일즈포스 데이터 클라우드, 가트너 매직 쿼드런트 ‘고객 데이터 플랫폼 부문 리더“ 선정

    - 세일즈포스 데이터 클라우드, 멀티클라우드 기능・생태계 혁신 노력・강력한 파트너 네트워크 강점 - 아인슈타인 1 플랫폼에 탑재, 고객 데이터 가치 극대화 기반의 고객경험 지원 및 기업 성장 제고 세일즈포스는 자사의 데이터 클라우드가 <2024 가트너 매...
    Date2024.04.11 Bynewsit Views432
    Read More
  9. 라이언로켓, AI 웹툰 제작 파트너 ‘젠버스’ 프로모션 진행… 웹소설 웹툰화 및 창작자 웹툰 플랫폼 진입 지원

    - 4월 8일부터 30일까지 젠버스 홈페이지에서 신청 가능 - 창작자 및 웹툰 제작사 플랫폼 진입 위한 무료 샘플 테스트, 첫 작품 3화 제작 무료 지원 - IP 제공시 S급 아트디렉터가 직접 기획하고 제작한 캐릭터 샘플 제공, 다양한 화풍으로 원하는 장르 테스트...
    Date2024.04.09 Bynewsit Views450
    Read More
  10. 슈나이더 일렉트릭 코리아, 케이엠파워와 ‘2024 월드IT쇼’ 참가…“IT 인프라 솔루션 공개”

    - 대형엔〮터프라이즈 데이터센터부터 엣지, 소규모 환경에 맞는 IT 인프라 제품 제안 - 데이터센터 기반설비 전문 파트너로서, 동반성장을 위한 상생 파트너십 유지 슈나이더 일렉트릭 코리아가 케이엠파워(KM POWER)와 4월 17일(수)부터 19일(금)까지 서울 ...
    Date2024.04.09 Bynewsit Views415
    Read More
  11. 안랩 V3, 2024년 첫 AV-TEST의 PC 보안솔루션 평가에서 만점 인증 획득

    - 2월 AV-TEST의 ‘홈 유저’ 및 ‘비즈니스 유저’ 부문 테스트에 참가 - 참여한 두 부문에서 ‘Top Product(우수 제품)’로 선정 안랩의 PC용 보안 솔루션 V3가 글로벌 보안제품 테스트 기관 'AV-TEST’가 실시한 2024년 첫 PC용 백신 평가의 ‘홈 유저’ 및 ‘비즈니...
    Date2024.04.09 Bynewsit Views207
    Read More
  12. 스틸시리즈, e스포츠팀 ‘페이즈 클랜’과 콜라보 한정판 에디션 출시

    - 스틸시리즈x페이즈 클랜 에디션 Apex 9 Mini, Aerox 3 WL, Arctis Nova 7, QcK Heavy XXL 총 4개 제품으로 구성 게이밍 기어 브랜드 스틸시리즈(SteelSeries)가 글로벌 인기 e스포츠 팀 ‘페이즈 클랜’(FaZe Clan)과 콜라보한 한정판 에디션을 4월 8일(월) 출...
    Date2024.04.09 Bynewsit Views148
    Read More
  13. 위로보틱스, 보행보조 웨어러블 로봇 윔(WIM) B2C 제품 출시

    웨어러블 로봇 스타트업 위로보틱스(WIRobotics)가 보행보조 웨어러블 로봇 윔(WIM) B2C 제품을 출시했다고 9일 밝혔다. 이번 B2C 제품은 지난 2월 출시한 B2B 제품(기관용) 출시 2개월만에 공개됐으며, 본격적인 아웃도어 활동 시즌을 맞아 보다 업그레이드된...
    Date2024.04.09 Bynewsit Views494
    Read More
  14. 이글루코퍼레이션, 프라이빗테크놀로지와 제로 트러스트 사업 협업 MOU 체결

    - 이글루코퍼레이션, 제로 트러스트 보안 모델 실현을 위한 핵심 요소 확보 박차 - 양사 고유의 노하우 결합해 제로 트러스트 분야 사업 기회 발굴 확대 이글루코퍼레이션은 제로 트러스트 통신 보안 기업 프라이빗테크놀로지와 ‘제로 트러스트 사업 협업을 위...
    Date2024.04.09 Bynewsit Views185
    Read More
  15. 다쏘시스템, 2024 독일 하노버 산업박람회 참여…”버추얼 트윈과 로봇기반 자동화 제조환경”

    - 2024년 4월 22일-26일(현지시간), 2024 독일 하노버 산업박람회 참가, 17 홀 E16번 부스… 글로벌 자동화 기업 오므론(OMRON)과 공동 쇼케이스에서 자율 모바일 로봇과 버추얼 트윈 통합 시연 - 산업 디지털 트윈 협회(IDTA) 자산관리 셸(AAS) 소개, 3D익스피...
    Date2024.04.09 Bynewsit Views483
    Read More
  16. 팔로알토 네트웍스, 코어텍스 오퍼링 제공…“레거시 엔드포인트 솔루션 마이그레이션 지원”

    - 비용 부담 없이 포인트 솔루션에서 플랫폼 접근 방식으로 전환할 수 있도록 코어텍스 오퍼링 제공 팔로알토 네트웍스는 엔드포인트 보호 환경을 강화하고 빠르게 플랫폼으로 전환할 수 있도록 돕는 ‘코어텍스(Cortex)’ 오퍼링을 신규 제공한다고 밝혔다. 점...
    Date2024.04.09 Bynewsit Views184
    Read More
  17. 쿤텍-시큐어아이씨, ‘임베디드 분야 보안 강화 지원’ 파트너십 체결

    - 시큐어아이씨의 사이버 보안 평가 도구 및 서비스를 통해 임베디드 전체 보안 수명 주기에 대한 보안 강화 지원 - 다양한 산업 분야의 보안 요구사항 지원 및 설계 라이프 사이클을 통해 광범위한 보안 서비스 제공 쿤텍은 엔드 투 엔드 임베디드 사이버보안...
    Date2024.04.08 Bynewsit Views165
    Read More
  18. 캐논코리아, ‘대한안과학회 학술대회’에서 망막 검사 광간섭단층촬영 장비 「OCT-S1」 호평

    - 단 한 번의 촬영으로 23x20mm 광각 OCT 이미지 획득해 보다 정밀한 분석과 측정 가능 - 초당 10만 번의 스캔·1,060nm파장·심도 5.3mm로 더욱 높은 투과율과 해상도 자랑 - AI 노이즈 저감 처리 기능·조이스틱 적용으로 보다 선명한 이미지 제공 및 사용자 편...
    Date2024.04.08 Bynewsit Views148
    Read More
  19. ST, 파나소닉 사이클 테크놀로지의 전기 보조 자전거 AI 도입 지원

    - 새로운 타이어 공기압 모니터링 시스템으로 안전성 및 사용자 경험 향상 - ST의 소프트웨어 에코시스템 툴인 STM32Cube.AI로 STM32 마이크로컨트롤러에서 동작하는 엣지 AI 기능 개발 가속 ST마이크로일렉트로닉스는 파나소닉 사이클 테크놀로지가 자사의 티...
    Date2024.04.08 Bynewsit Views482
    Read More
  20. 매스웍스, 매트랩 및 시뮬링크 ‘릴리즈 2024a’ 발표

    - 위성 통신 툴박스를 업데이트 통해 시나리오 모델링 및 시스템과 링크 분석 가능 - 컴퓨터 비전 툴박스, 딥러닝 툴박스, 계측기 제어 툴박스를 포함한 주요 툴박스도 함께 업데이트 매스웍스는 오늘 자사의 매트랩(MATLAB) 및 시뮬링크(Simulink) 제품군의 ‘...
    Date2024.04.05 Bynewsit Views514
    Read More
Board Pagination Prev 1 ... 134 135 136 137 138 139 140 141 142 143 ... 273 Next
/ 273
CLOSE