- 새로운 GPU 가속 엔비디아 NIM 마이크로서비스와 클라우드 엔드포인트 카탈로그 공개

- 마이크로서비스 통해 데이터 처리, LLM 맞춤화, 추론, 검색 증강 생성, 가드레일 가속화

- 케이던스, 크라우드스트라이크, SAP, 서비스나우 등 광범위한 AI 에코시스템에 채택

 

엔비디아, 생성형 AI 마이크로서비스 출시… 생성형 AI 코파일럿 배포 지원.jpg

 

엔비디아는 수십 개의 엔터프라이즈용 생성형 AI 마이크로서비스를 출시했다고 발표했다기업은 이를 통해 지적 재산에 대한 완전한 소유권과 통제권을 유지하면서 자체 플랫폼에서 맞춤형 애플리케이션을 생성하고 배포할 수 있다.

 

클라우드 네이티브 마이크로서비스 카탈로그는 엔비디아 쿠다(CUDA)플랫폼을 기반으로 구축됐으며 엔비디아 NIM 마이크로서비스를 포함한다. 엔비디아 NIMTM은 엔비디아와 파트너 에코시스템에서 제공하는 24개 이상의 인기 AI 모델에 대한 추론 최적화를 지원한다. 또한 검색 증강 생성(retrieval-augmented generation, RAG), 가드레일, 데이터 처리, HPC 등을 위한 엔비디아 가속 소프트웨어 개발 키트, 라이브러리, 툴을 엔비디아 쿠다-X 마이크로서비스로 액세스할 수 있다. 이뿐만 아니라 엔비디아는 24개 이상의 의료용 NIM과 쿠다 -X 마이크로서비스도 별도로 발표했다.

 

엄선된 마이크로서비스는 엔비디아의 풀스택 컴퓨팅 플랫폼에 새로운 계층을 추가한다. 이 계층은 모델 개발자, 플랫폼 제공업체, 기업 AI 생태계를 맞춤형 AI 모델을 실행하는 표준화된 경로로 연결한다. 이때 맞춤형 AI 모델은 클라우드, 데이터센터, 워크스테이션, PC에 탑재된 수억 개의 GPU로 구성된 엔비디아 CUDA 설치 기반에 최적화된 모델이다.

 

어도비(Adobe)케이던스(Cadence)크라우드스트라이크(CrowdStrike)게티이미지(Getty Images), SAP서비스나우(ServiceNow)셔터스톡(Shutterstock) 등 선도적인 애플리케이션, 데이터, 사이버 보안 플랫폼 제공업체들이 엔비디아 AI 엔터프라이즈 5.0(AI Enterprise 5.0)에서 제공되는 새로운 엔비디아 생성형 AI 마이크로서비스를 가장 먼저 활용하고 있다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 "기존 엔터프라이즈 플랫폼은 생성형 AI 코파일럿으로 전환할 수 있는 풍부한 데이터를 가지고 있다. 파트너 에코시스템과 함께 구축된 이러한 컨테이너화된 AI 마이크로서비스는 모든 산업 분야의 기업이 AI 기업으로 거듭나기 위한 기본 요소"라고 밝혔다. 

 

몇 주에서 몇 분으로 배포 시간을 단축하는 NIM 추론 마이크로서비스

NIM 마이크로서비스는 트리톤 추론 서버(Triton Inference Server)와 텐서RT-LLM(TensorRT-LLM)을 비롯한 엔비디아 추론 소프트웨어로 구동되는 사전 구축된 컨테이너를 제공한다. 이로써 개발자는 배포 시간을 몇 주에서 몇 분으로 단축할 수 있다.

 

해당 서비스는 언어, 음성, 신약 개발과 같은 도메인을 위한 업계 표준 API를 제공한다. 개발자는 이러한 지원을 바탕으로 자체 인프라에서 안전하게 호스팅되는 독점 데이터를 사용해 AI 애플리케이션을 빠르게 구축할 수 있다. 더불어 애플리케이션을 필요에 따라 확장 가능한 유연상과 성능도 갖췄다. 엔비디아 가속 컴퓨팅 플랫폼 상에서 프로덕션 환경 내 생성형 AI를 실행할 수 있다.

 

NIM 마이크로서비스는 엔비디아, A121어뎁트(Adept), 코히어(Cohere)게티이미지, 셔터스톡 모델과 더불어 구글(Google), 허깅페이스(Hugging Face)메타(Meta), 마이크로소프트(Microsoft), 미스트랄 AI(Mistral AI), 스태빌리티 AI(Stability AI)의 오픈 모델을 배포할 수 있는 가장 빠르고 성능이 뛰어난 프로덕션 AI 컨테이너를 제공한다.

 

서비스나우는 새로운 도메인별 코파일럿과 기타 생성형 AI 애플리케이션을 더 빠르고 비용 효율적으로 개발, 배포하기 위해 NIM을 사용한다고 발표했다.

 

고객들은 아마존 세이지메이커(Amazon SageMaker)구글 쿠버네티스 엔진(Google Kubernetes Engine), 마이크로소프트 애저 AI(Microsoft Azure AI)에서 NIM 마이크로서비스에 액세스하고 딥셋(Deepset)랭체인(LangChain)라마인덱스(LlamaIndex)와 같은 인기 AI 프레임워크와 통합할 수 있게 된다.

 

RAG, 데이터 처리, 가드레일, HPC를 위한 쿠다-X 마이크로서비스

쿠다-X 마이크로서비스는 데이터 준비, 맞춤화, 훈련을 위한 엔드투엔드 빌딩 블록을 제공해 산업 전반에서 프로덕션 AI 개발 속도를 높인다. 기업들은 AI 채택을 가속화하기 위해 맞춤형 음성 및 번역 AI를 위한 엔비디아 리바(Riva)라우팅 최적화를 위한  엔비디아 cuOpt고해상도 기후 및 날씨 시뮬레이션을 위한 엔비디아 어스-2(Earth-2) 등의 쿠다-X 마이크로서비스를 사용할 수 있다.

 

개발자는 네모 리트리버(NeMo Retriever) 마이크로서비스를 통해 텍스트, 이미지, 막대 그래프, 라인 플롯, 파이 차트 등의 시각화를 포함한 비즈니스 데이터에 AI 애플리케이션을 연결해 매우 정확하고 맥락에 맞는 응답을 생성할 수 있다. 이러한 RAG 기능을 통해 코파일럿, 챗봇, 생성형 AI 생산성 도구에 더 많은 데이터를 제공해 정확도와 인사이트를 높일 수 있다.

 

맞춤형 모델 개발을 위한 추가적인 엔비디아 네모(NeMo) 마이크로서비스도 곧 출시될 예정이다. 여기에는 훈련과 검색을 위한 정제된 데이터세트 구축 목적의 엔비디아 네모 큐레이터(Curator), 도메인별 데이터로 LLM을 미세 조정하기 위한 엔비디아 네모 커스터마이저(Customizer), AI 모델 성능 분석을 위한 엔비디아 네모 이밸류에이터(Evaluator), LLM용 엔비디아 네모 가드레일(Guardrails) 등이 포함된다.

 

에코시스템, 생성형 AI 마이크로서비스로 엔터프라이즈 플랫폼 강화

주요 애플리케이션 제공업체 외에도 엔비디아 에코시스템 전반의 데이터, 인프라, 컴퓨팅 플랫폼 제공업체들이 엔비디아 마이크로서비스와 협력해 기업에 생성형 AI를 제공하고 있다.

 

박스(Box)클라우데라(Cloudera), 코히시티(Cohesity), 데이터스택스(Datastax)드롭박스(Dropbox)와 넷앱(NetApp)을 비롯한 최고의 데이터 플랫폼 제공업체들이 엔비디아 마이크로서비스와 협력하고 있다. 이로써 고객이 RAG 파이프라인을 최적화하고 자사의 독점 데이터를 생성형 AI 애플리케이션에 통합할 수 있도록 지원한다. 스노우플레이크(Snowflake)는 네모 리트리버를 활용하여 엔터프라이즈 데이터를 AI 애플리케이션 구축에 활용한다.

 

기업은 주요 클라우드 서비스인 아마존 웹 서비스(Amazon Web Services, AWS)구글 클라우드(Google Cloud)애저오라클 클라우드 인프라스트럭쳐(Oracle Cloud Infrastructure) 등 원하는 인프라에 엔비디아 AI 엔터프라이즈 5.0에 포함된 엔비디아 마이크로서비스를 배포할 수 있다.

 

또한 엔비디아 마이크로서비스는 시스코(Cisco), 델 테크놀로지스휴렛팩커드 엔터프라이즈(HPE), HP, 레노버(Lenovo)슈퍼마이크로(Supermicro)의 서버와 워크스테이션을 포함한 400개 이상의 엔비디아 인증 시스템(NVIDIA-Certified Systems)에서 지원된다. 한편 HPE는 생성형 AI용 HPE의 엔터프라이즈 컴퓨팅 솔루션 출시를 발표했으며, NIM과 엔비디아 AI 파운데이션(AI Foundation) 모델을 HPE AI 소프트웨어에 통합할 계획이다.

 

엔비디아 AI 엔터프라이즈 마이크로서비스는 VM웨어 프라이빗 AI 파운데이션 위드 엔비디아(VMware Private AI Foundation with NVIDIA)를 포함한 인프라 소프트웨어 플랫폼에 제공될 예정이다. 레드햇 오픈시프트(Red Hat OpenShift)는 보안, 규정 준수, 제어에 최적화된 기능을 통해 기업이 생성형 AI 기능을 애플리케이션에 보다 쉽게 통합할 수 있게 하는 엔비디아 NIM 마이크로서비스를 지원한다. 캐노니컬(Canonical)은 엔비디아 AI 엔터프라이즈를 통해 엔비디아 마이크로서비스에 대한 참드 쿠버네티스(Charmed Kubernetes) 지원을 추가하고 있다.

 

엔비디아 에코시스템은 어브릿지(Abridge), 애니스케일(Anyscale), 데이터이쿠(Dataiku), 데이터로봇(DataRobot)글린(Glean), H2O.ai, 시큐리티 AI(Securiti AI)스케일.ai(Scale.ai)옥토AI(OctoAI)웨이츠 앤드 바이어시스(Weights & Biases) 등 수백 개의 AI와 MLOps 파트너로 구성됐다. 엔비디아 에코시스템은 엔비디아 AI 엔터프라이즈를 통해 엔비디아 마이크로서비스에 대한 지원을 추가하고 있다.

 

아파치 루씬(Apache Lucene), 데이터스택스파이스(Faiss), 키네티카(Kinetica), 밀버스(Milvus), 레디스(Redis), 위비에이트(Weaviate)는 기업용 반응형 RAG 기능 강화를 위해 엔비디아 네모 리트리버 마이크로서비스와 협업하는 벡터 검색 제공업체 중 하나이다.

 

개발자는 ai.nvidia.com에서 무료로 엔비디아 마이크로서비스를 실험해 볼 수 있다. 기업에서는 엔비디아 인증 시스템 및 주요 클라우드 플랫폼에서 실행되는 엔비디아 AI 엔터프라이즈 5.0을 통해 프로덕션급 NIM 마이크로서비스를 배포할 수 있다.

 

#엔비디아#GTC#2024#생성형AI#코파일럿#AI

 

?

  1. No Image

    코드마인드, “코요테 C++로 단위 테스트 자동화율 90% 달성”

    코드마인드는 자체 개발한 자동 단위 테스팅 도구 코요테 C++(Coyote C++)가 최근 특허받은 테스트케이스 자동 생성 기술을 기반으로 기존 기술의 한계를 뛰어넘은 자동화율(커버리지)을 달성했다고 밝혔다. 코요테 C++는 소프트웨어 검증에서 가장 엄밀한 단...
    Date2024.03.19 Bynewsit Views259
    Read More
  2. ST, 고성능 마이크로컨트롤러 「STM32H7R/S」 출시…“스마트 홈 및 산업용 시스템의 새로운 혁신”

    - 임베디드 애플리케이션 성능을 획기적으로 향상 - 공장, 빌딩, 인프라, e헬스(eHealth) 분야의 차세대 스마트 기기 지원 ST마이크로일렉트로닉스는 마이크로프로세서 기반 시스템의 성능과 확장성, 보안 기능에 마이크로컨트롤러(MCU)의 단순성 및 통합 이점...
    Date2024.03.19 Bynewsit Views155
    Read More
  3. [GTC 2024] 엔비디아, 생성형 AI 마이크로서비스 출시… "생성형 AI 코파일럿 배포" 지원

    - 새로운 GPU 가속 엔비디아 NIM 마이크로서비스와 클라우드 엔드포인트 카탈로그 공개 - 마이크로서비스 통해 데이터 처리, LLM 맞춤화, 추론, 검색 증강 생성, 가드레일 가속화 - 케이던스, 크라우드스트라이크, SAP, 서비스나우 등 광범위한 AI 에코시스템...
    Date2024.03.19 Bynewsit Views297
    Read More
  4. 알리바바, ‘온라인 글로벌 수학 경시대회’ 개최

    - 4월 11일까지 참가 신청 접수, 4월 13일부터 15일까지 예전 진행 - 결승전은 6월 22일 진행되며 상위 5명에게 금상 $30,000 상금 지급 - 2024년 대회에 AI 개발 가속화를 위한 AI 모델 트랙 처음으로 포함 알리바바 그룹이 전 세계의 수학 애호가와 개발자들...
    Date2024.03.19 Bynewsit Views238
    Read More
  5. 티맥스그룹, '2024 SW 마켓 페어' 참여…“'디지털 플랫폼 정부' 실현 로드맵 제시”

    - 티베로·클라우드·가이아 오는 21일 진행되는 'SW 마켓 페어' 참여 - 공공기관과 SW산업계 대상으로 각종 신제품과 솔루션 소개 예정 티맥스그룹 계열사들이 디지털 플랫폼 정부 실현을 위한 솔루션을 공개한다. 티맥스그룹은 계열사 티맥스티베로·티맥스클라...
    Date2024.03.19 Bynewsit Views292
    Read More
  6. 지코어, ‘지코어 AI 자동 음성인식 서비스’ 출시…”100개 이상의 언어 빠르게 지원“

    - 100개 이상의 언어 지원하는 관리형 클라우드 서비스로, 빠르고 정확한 자막 생성 및 고객 비용 부담 완화 - 최상의 모델 조합으로 자막 정확도 높일 수 있어 산업별 용어나 여러 언어를 사용하는 콘텐츠 제작에 유리 지코어는 빠른 속도는 물론 비용 효율성...
    Date2024.03.19 Bynewsit Views157
    Read More
  7. 마우저, 스마트공장·자동화산업전(SFAW 2024) 참가

    - 공장 자동화 분야 실무자 대상으로 마우저의 온라인 도구 및 서비스 소개 확대 마우저 일렉트로닉스(Mouser Electronics)는 3월 27일(수)부터 29일(금)까지 3일 동안 삼성동 코엑스에서 개최되는 스마트공장·자동화산업전(Smart Factory + Automation World ...
    Date2024.03.18 Bynewsit Views161
    Read More
  8. 한국오키시스템즈, 스마트공장∙자동화산업전(SFAW 2024) 참가

    한국오키시스템즈의 자동화 라벨 전문 채널 비엠시스솔루션은 코엑스에서 열리는 ‘SFAW 2024’에 참가한다고 밝혔다. SFAW 2024는 국내 최대 스마트공장 자동화 관련 산업의 최대 전시회로 자동화를 위한 혁신제품과 솔루션등 다양한 관련 정보를 제공하는 인쇄...
    Date2024.03.18 Bynewsit Views221
    Read More
  9. 인포빕, 넥슨에 이메일 서비스 품질 향상 위한 API 제공

    - 인포빕, 190여 개 국가, 19억 명의 글로벌 이용자와 이메일로 소통하는 넥슨 지원 - 2주 만에 전환 완료 후 이메일 반송률 89% 개선, 전송률은 99%까지 끌어올려 - 인포빕 HTTP API, 넥슨의 이메일 발신자 평판 개선, 전송률 향상 지원 인포빕이 넥슨에 이메...
    Date2024.03.18 Bynewsit Views200
    Read More
  10. ASUS, 새로워진 ‘에이수스 개런티(ASUS Guarantee)’ 시행 발표…“보증 기간 연장 등 대대적 서비스 개편”

    - 2024년 3월부터 한층 더 업그레이드된 사후 관리 서비스 ‘에이수스 개런티(ASUS Guarantee)’ 프로그램 시행 - 전국 340여 개 롯데 하이마트 점포에서 A/S 방문 접수 가능 ··· 접근성 극대화 - 신촌 직영 서비스 센터 ‘로얄 클럽’ 포함 전국 12개의 내방 센터...
    Date2024.03.18 Bynewsit Views105
    Read More
  11. 포티넷, 엔터프라이즈 유무선 LAN 인프라 부문 ‘2024 가트너 매직 쿼드런트’ 리더 기업으로 선정

    - 포티넷, 데이터 센터, 스마트 캠퍼스, 가상 물리, SD-브랜치, SASE 기반 마이크로브랜치, 하이브리드 비즈니스 환경 등 다양한 환경에 최적화된 통합 WLAN/LAN 솔루션 제공 포티넷 코리아는 오늘, 엔터프라이즈 유무선 LAN 인프라 부문 ‘2024 가트너 매직 쿼...
    Date2024.03.18 Bynewsit Views130
    Read More
  12. 캐논코리아, 21년 연속 1위 기념 RF 렌즈 22종 정품등록 프로모션 실시

    - 2003년부터 2023년까지 21년 연속 전세계 및 국내 렌즈 교환식 카메라 시장 1위 수성 - RF 렌즈 22종 구매 고객 대상 정품등록 프로모션 진행 - 5월 13일(월)까지 제품 구매, 5월 20일(월)까지 정품등록한 고객 대상 백화점 상품권 제공 캐논코리아가 전 세...
    Date2024.03.18 Bynewsit Views83
    Read More
  13. 옵스왓, SE랩스 ‘콘텐츠 무해화(CDR) 재구성 테스트’에서 업계 최초 파일 무결성 보장 100% 최고점 획득

    - 탐지에 의존하지 않고 유입되는 모든 파일 구조를 분해 및 분석하여 악성 요소만 제거하고 안전한 파일로 재생성하는 옵스왓 Deep CDR로 업계 최초 100% 보호 및 정확도 기록 인섹시큐리티는 오늘, 옵스왓(OPSWAT)이 보안 제품 및 서비스 평가를 위한 독립 ...
    Date2024.03.18 Bynewsit Views90
    Read More
  14. 인텔, 세계에서 가장 빠른 데스크톱 프로세서 14세대 인텔 코어 「i9-14900KS」 출시

    - i9-14900KS, 최대 6.2 GHz 클럭 속도로 PC 매니아들을 위한 최상급 데스크탑 시스템 제공 인텔은 인텔 코어 i9-14900KS의 전체 사양 및 출시를 발표하며 전 세계에서 가장 빠른 데스크톱 프로세서1 타이틀을 다시 한번 갱신했다고 밝혔다. 새로운 i9-14900KS...
    Date2024.03.15 Bynewsit Views127
    Read More
  15. 티맥스AI, 육군 규정 교육 챗봇 시스템 '하이퍼챗봇' 최종 버전 공개

    - 지난해 10월 KES 2023서 데모버전으로 공개된 대화형 AI 챗봇 시스템 '하이퍼챗봇' - 민·군기술협력사업 성과발표회서 기술 개발 마친 최종 버전 공개하며 시연 나서 티맥스AI가 육군 규정 교육 챗봇 시스템 ‘하이퍼챗봇’ 최종 버전을 공개했다. 티맥스AI는 ...
    Date2024.03.15 Bynewsit Views252
    Read More
  16. TI, ‘임베디드 월드 2024’에서 안전하고 스마트하며 지속 가능한 미래를 위한 기술 소개

    텍사스 인스트루먼트(TI)는 오늘 4월 9일부터 11일까지 독일 뉘른베르크에서 열리는 임베디드 월드 2024에서 더 안전하고 스마트하며 지속 가능한 미래를 구현하기 위한 새로운 임베디드 프로세싱 및 연결 제품을 시연한다고 발표했다. TI는 3A홀 131번 부스에...
    Date2024.03.15 Bynewsit Views224
    Read More
  17. 로지텍, 플래그십 무선 게이밍 헤드셋 ‘A50 X’ 출시

    - 플레이스테이션 5, 엑스박스 시리즈 X|S 및 PC와 뛰어난 호환성 갖춰 멀티 플랫폼에 최적화 - PRO-G 40mm 그래핀 오디오 드라이버 및 24비트 LIGHTSPEED 무선 기술 탑재, 게이머에게 최상의 오디오 환경 제공 로지텍은 무선 게이밍 헤드셋 ‘A50 X’를 국내 정...
    Date2024.03.15 Bynewsit Views91
    Read More
  18. [GDC 2024] 엔비디아, 최첨단 RTX 기술 관련 소식 발표

    - 검은 신화: 오공, 나라카: 블레이드포인트에 풀 레이 트레이싱, DLSS 3.5 탑재 - 올해 말, 스타워즈 아웃로즈에 DLSS 3와 레이 트레이싱 적용 - 포탈 위드 RTX, DLSS 3.5로 업그레이드해 레이 리컨스트럭션과 RTX IO 지원 엔비디아는 글로벌 게임 개발자 콘...
    Date2024.03.15 Bynewsit Views265
    Read More
  19. [SECON 2024] QNAP, 제23회 세계 보안 엑스포 ‘SECON 2024’ 참가

    큐냅 코리아가 3월 20일부터 22일까지 일산 킨텍스에서 개최되는 ‘세계 보안 엑스포(SECON) & 전자정부 정보보호 솔루션 페어(eGISEC) 2024(SECON 2024)’에 참가한다고 밝혔다. ‘SECON 2024’는 국내 유일 물리보안과 사이버 보안 솔루션을 한자리에서 경험할 ...
    Date2024.03.15 Bynewsit Views102
    Read More
  20. [SECON 2024] 티피링크, 제23회 세계 보안 엑스포 2024 참가...“통합 네트워크 및 영상 보안 감시 솔루션 전시”

    티피링크(TP-Link)가 3월20일부터 22일까지 개최되는 세계보안엑스포 ‘SECON 2024’에 참가한다. 이번 행사에서 티피링크는 최신 영상 보안감시 솔루션, 차세대 엔터프라이즈 및 중소기업 네트워킹을 위한 클라우드 솔루션을 대거 선보일 예정이다. 이번 SECON...
    Date2024.03.15 Bynewsit Views98
    Read More
Board Pagination Prev 1 ... 115 116 117 118 119 120 121 122 123 124 ... 249 Next
/ 249
CLOSE