- 새로운 GPU 가속 엔비디아 NIM 마이크로서비스와 클라우드 엔드포인트 카탈로그 공개

- 마이크로서비스 통해 데이터 처리, LLM 맞춤화, 추론, 검색 증강 생성, 가드레일 가속화

- 케이던스, 크라우드스트라이크, SAP, 서비스나우 등 광범위한 AI 에코시스템에 채택

 

엔비디아, 생성형 AI 마이크로서비스 출시… 생성형 AI 코파일럿 배포 지원.jpg

 

엔비디아는 수십 개의 엔터프라이즈용 생성형 AI 마이크로서비스를 출시했다고 발표했다기업은 이를 통해 지적 재산에 대한 완전한 소유권과 통제권을 유지하면서 자체 플랫폼에서 맞춤형 애플리케이션을 생성하고 배포할 수 있다.

 

클라우드 네이티브 마이크로서비스 카탈로그는 엔비디아 쿠다(CUDA)플랫폼을 기반으로 구축됐으며 엔비디아 NIM 마이크로서비스를 포함한다. 엔비디아 NIMTM은 엔비디아와 파트너 에코시스템에서 제공하는 24개 이상의 인기 AI 모델에 대한 추론 최적화를 지원한다. 또한 검색 증강 생성(retrieval-augmented generation, RAG), 가드레일, 데이터 처리, HPC 등을 위한 엔비디아 가속 소프트웨어 개발 키트, 라이브러리, 툴을 엔비디아 쿠다-X 마이크로서비스로 액세스할 수 있다. 이뿐만 아니라 엔비디아는 24개 이상의 의료용 NIM과 쿠다 -X 마이크로서비스도 별도로 발표했다.

 

엄선된 마이크로서비스는 엔비디아의 풀스택 컴퓨팅 플랫폼에 새로운 계층을 추가한다. 이 계층은 모델 개발자, 플랫폼 제공업체, 기업 AI 생태계를 맞춤형 AI 모델을 실행하는 표준화된 경로로 연결한다. 이때 맞춤형 AI 모델은 클라우드, 데이터센터, 워크스테이션, PC에 탑재된 수억 개의 GPU로 구성된 엔비디아 CUDA 설치 기반에 최적화된 모델이다.

 

어도비(Adobe)케이던스(Cadence)크라우드스트라이크(CrowdStrike)게티이미지(Getty Images), SAP서비스나우(ServiceNow)셔터스톡(Shutterstock) 등 선도적인 애플리케이션, 데이터, 사이버 보안 플랫폼 제공업체들이 엔비디아 AI 엔터프라이즈 5.0(AI Enterprise 5.0)에서 제공되는 새로운 엔비디아 생성형 AI 마이크로서비스를 가장 먼저 활용하고 있다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 "기존 엔터프라이즈 플랫폼은 생성형 AI 코파일럿으로 전환할 수 있는 풍부한 데이터를 가지고 있다. 파트너 에코시스템과 함께 구축된 이러한 컨테이너화된 AI 마이크로서비스는 모든 산업 분야의 기업이 AI 기업으로 거듭나기 위한 기본 요소"라고 밝혔다. 

 

몇 주에서 몇 분으로 배포 시간을 단축하는 NIM 추론 마이크로서비스

NIM 마이크로서비스는 트리톤 추론 서버(Triton Inference Server)와 텐서RT-LLM(TensorRT-LLM)을 비롯한 엔비디아 추론 소프트웨어로 구동되는 사전 구축된 컨테이너를 제공한다. 이로써 개발자는 배포 시간을 몇 주에서 몇 분으로 단축할 수 있다.

 

해당 서비스는 언어, 음성, 신약 개발과 같은 도메인을 위한 업계 표준 API를 제공한다. 개발자는 이러한 지원을 바탕으로 자체 인프라에서 안전하게 호스팅되는 독점 데이터를 사용해 AI 애플리케이션을 빠르게 구축할 수 있다. 더불어 애플리케이션을 필요에 따라 확장 가능한 유연상과 성능도 갖췄다. 엔비디아 가속 컴퓨팅 플랫폼 상에서 프로덕션 환경 내 생성형 AI를 실행할 수 있다.

 

NIM 마이크로서비스는 엔비디아, A121어뎁트(Adept), 코히어(Cohere)게티이미지, 셔터스톡 모델과 더불어 구글(Google), 허깅페이스(Hugging Face)메타(Meta), 마이크로소프트(Microsoft), 미스트랄 AI(Mistral AI), 스태빌리티 AI(Stability AI)의 오픈 모델을 배포할 수 있는 가장 빠르고 성능이 뛰어난 프로덕션 AI 컨테이너를 제공한다.

 

서비스나우는 새로운 도메인별 코파일럿과 기타 생성형 AI 애플리케이션을 더 빠르고 비용 효율적으로 개발, 배포하기 위해 NIM을 사용한다고 발표했다.

 

고객들은 아마존 세이지메이커(Amazon SageMaker)구글 쿠버네티스 엔진(Google Kubernetes Engine), 마이크로소프트 애저 AI(Microsoft Azure AI)에서 NIM 마이크로서비스에 액세스하고 딥셋(Deepset)랭체인(LangChain)라마인덱스(LlamaIndex)와 같은 인기 AI 프레임워크와 통합할 수 있게 된다.

 

RAG, 데이터 처리, 가드레일, HPC를 위한 쿠다-X 마이크로서비스

쿠다-X 마이크로서비스는 데이터 준비, 맞춤화, 훈련을 위한 엔드투엔드 빌딩 블록을 제공해 산업 전반에서 프로덕션 AI 개발 속도를 높인다. 기업들은 AI 채택을 가속화하기 위해 맞춤형 음성 및 번역 AI를 위한 엔비디아 리바(Riva)라우팅 최적화를 위한  엔비디아 cuOpt고해상도 기후 및 날씨 시뮬레이션을 위한 엔비디아 어스-2(Earth-2) 등의 쿠다-X 마이크로서비스를 사용할 수 있다.

 

개발자는 네모 리트리버(NeMo Retriever) 마이크로서비스를 통해 텍스트, 이미지, 막대 그래프, 라인 플롯, 파이 차트 등의 시각화를 포함한 비즈니스 데이터에 AI 애플리케이션을 연결해 매우 정확하고 맥락에 맞는 응답을 생성할 수 있다. 이러한 RAG 기능을 통해 코파일럿, 챗봇, 생성형 AI 생산성 도구에 더 많은 데이터를 제공해 정확도와 인사이트를 높일 수 있다.

 

맞춤형 모델 개발을 위한 추가적인 엔비디아 네모(NeMo) 마이크로서비스도 곧 출시될 예정이다. 여기에는 훈련과 검색을 위한 정제된 데이터세트 구축 목적의 엔비디아 네모 큐레이터(Curator), 도메인별 데이터로 LLM을 미세 조정하기 위한 엔비디아 네모 커스터마이저(Customizer), AI 모델 성능 분석을 위한 엔비디아 네모 이밸류에이터(Evaluator), LLM용 엔비디아 네모 가드레일(Guardrails) 등이 포함된다.

 

에코시스템, 생성형 AI 마이크로서비스로 엔터프라이즈 플랫폼 강화

주요 애플리케이션 제공업체 외에도 엔비디아 에코시스템 전반의 데이터, 인프라, 컴퓨팅 플랫폼 제공업체들이 엔비디아 마이크로서비스와 협력해 기업에 생성형 AI를 제공하고 있다.

 

박스(Box)클라우데라(Cloudera), 코히시티(Cohesity), 데이터스택스(Datastax)드롭박스(Dropbox)와 넷앱(NetApp)을 비롯한 최고의 데이터 플랫폼 제공업체들이 엔비디아 마이크로서비스와 협력하고 있다. 이로써 고객이 RAG 파이프라인을 최적화하고 자사의 독점 데이터를 생성형 AI 애플리케이션에 통합할 수 있도록 지원한다. 스노우플레이크(Snowflake)는 네모 리트리버를 활용하여 엔터프라이즈 데이터를 AI 애플리케이션 구축에 활용한다.

 

기업은 주요 클라우드 서비스인 아마존 웹 서비스(Amazon Web Services, AWS)구글 클라우드(Google Cloud)애저오라클 클라우드 인프라스트럭쳐(Oracle Cloud Infrastructure) 등 원하는 인프라에 엔비디아 AI 엔터프라이즈 5.0에 포함된 엔비디아 마이크로서비스를 배포할 수 있다.

 

또한 엔비디아 마이크로서비스는 시스코(Cisco), 델 테크놀로지스휴렛팩커드 엔터프라이즈(HPE), HP, 레노버(Lenovo)슈퍼마이크로(Supermicro)의 서버와 워크스테이션을 포함한 400개 이상의 엔비디아 인증 시스템(NVIDIA-Certified Systems)에서 지원된다. 한편 HPE는 생성형 AI용 HPE의 엔터프라이즈 컴퓨팅 솔루션 출시를 발표했으며, NIM과 엔비디아 AI 파운데이션(AI Foundation) 모델을 HPE AI 소프트웨어에 통합할 계획이다.

 

엔비디아 AI 엔터프라이즈 마이크로서비스는 VM웨어 프라이빗 AI 파운데이션 위드 엔비디아(VMware Private AI Foundation with NVIDIA)를 포함한 인프라 소프트웨어 플랫폼에 제공될 예정이다. 레드햇 오픈시프트(Red Hat OpenShift)는 보안, 규정 준수, 제어에 최적화된 기능을 통해 기업이 생성형 AI 기능을 애플리케이션에 보다 쉽게 통합할 수 있게 하는 엔비디아 NIM 마이크로서비스를 지원한다. 캐노니컬(Canonical)은 엔비디아 AI 엔터프라이즈를 통해 엔비디아 마이크로서비스에 대한 참드 쿠버네티스(Charmed Kubernetes) 지원을 추가하고 있다.

 

엔비디아 에코시스템은 어브릿지(Abridge), 애니스케일(Anyscale), 데이터이쿠(Dataiku), 데이터로봇(DataRobot)글린(Glean), H2O.ai, 시큐리티 AI(Securiti AI)스케일.ai(Scale.ai)옥토AI(OctoAI)웨이츠 앤드 바이어시스(Weights & Biases) 등 수백 개의 AI와 MLOps 파트너로 구성됐다. 엔비디아 에코시스템은 엔비디아 AI 엔터프라이즈를 통해 엔비디아 마이크로서비스에 대한 지원을 추가하고 있다.

 

아파치 루씬(Apache Lucene), 데이터스택스파이스(Faiss), 키네티카(Kinetica), 밀버스(Milvus), 레디스(Redis), 위비에이트(Weaviate)는 기업용 반응형 RAG 기능 강화를 위해 엔비디아 네모 리트리버 마이크로서비스와 협업하는 벡터 검색 제공업체 중 하나이다.

 

개발자는 ai.nvidia.com에서 무료로 엔비디아 마이크로서비스를 실험해 볼 수 있다. 기업에서는 엔비디아 인증 시스템 및 주요 클라우드 플랫폼에서 실행되는 엔비디아 AI 엔터프라이즈 5.0을 통해 프로덕션급 NIM 마이크로서비스를 배포할 수 있다.

 

#엔비디아#GTC#2024#생성형AI#코파일럿#AI

 

?

  1. 마우저, ‘Empowering Innovation Together’ 시리즈 최신호 공개…“머신 비전의 잠재력 탐구”

    마우저 일렉트로닉스는 산업용 머신 비전의 기술 세계를 탐구한 ‘함께 만드는 혁신(Empowering Innovation Together)’ 기술 시리즈를 공개했다. 이번 EIT 기술 콘텐츠 시리즈 최신호는 실제 제조 애플리케이션을 심층적으로 분석하여 머신 비전에 필요한 시스...
    Date2024.04.05 Bynewsit Views481
    Read More
  2. MSI 노트북, 나라장터 B2G 조달 사업 본격 시작···“공공시장 공략”

    - MSI 노트북 공공기관 조달 사업에 진출 - 다컴시스템과 손잡고 나라장터에 제품 등록 완료 - 행정 업무에 최적화된 노트북 2종(모던 15H1GI5P, 크리에이터 프로 AiProi9HX3KADA) 조달 엠에스아이코리아는 조달청 나라장터 종합쇼핑몰에 MSI 노트북 2종을 등...
    Date2024.04.05 Bynewsit Views175
    Read More
  3. ST, 새로운 「100V 트렌치 쇼트키 정류기 다이오드」 출시…“향상된 효율과 전력밀도”

    - 통신, 서버, 스마트 계량기용 전원공급장치는 물론 자동차용 LED 조명 또는 저전압 DC/DC 컨버터 애플리케이션 등에 적합 ST마이크로일렉트로닉스가 높은 스위칭 주파수 동작으로 전력변환장치의 효율을 높여주는 100V 트렌치 쇼트키(Schottky) 정류기 다이...
    Date2024.04.05 Bynewsit Views484
    Read More
  4. 트림블코리아-현대엔지니어링, BIM 공정관리 프로그램 개발 업무협약 체결

    - 4월 3일 트림블 ‘BIM 이노베이션 컨퍼런스’ 진행 및 MOU 체결 - 현대엔지니어링 현장정보와 피드백 기반 맞춤형 BIM 공정관리 프로그램 개발… 시공효율성 향상 - 트림블, 국내 BIM 기반 공정관리 표준화와 BIM 생태계 확장 노력 이어 나갈 것 건설 3D BIM 기...
    Date2024.04.04 Bynewsit Views411
    Read More
  5. 효성인포메이션시스템, ‘히타치 밴타라-엔비디아’ 차세대 AI 솔루션 공급 위한 협력 강화 발표

    - 엔비디아 최신 AI 기술에 차세대 스토리지 플랫폼 결합된 ‘히타치iQ’ 상반기 출시 - 히타치 밴타라만의 특화된 OT 역량 및 산업 전문성 활용 - 실용적이고 솔루션 지향적인 접근 방식으로 엔터프라이즈 AI의 새로운 패러다임 제시 효성인포메이션시스템은 히...
    Date2024.04.04 Bynewsit Views349
    Read More
  6. 씨젠, 세일즈포스 서비스 클라우드 및 태블로 도입…“글로벌 디지털 기업 도약 발판 마련”

    - 세일즈포스 도입 1년만에 최초 고객 문의 대응 처리 시간 30%가량 감소 - 데이터 분석 및 가시화 기반의 조직내 데이터 연결성 확보 및 데이터 문화 정립 세일즈포스는 분자진단 토탈솔루션 기업 씨젠이 고객 서비스 부문의 디지털 혁신 가속화 및 데이터 문...
    Date2024.04.04 Bynewsit Views389
    Read More
  7. 엠클라우드브리지, 국내 홈쇼핑 및 제약사에 AI 데이터통합 플랫폼 ‘마이크로소프트 패브릭’ 사전 적용 완료

    - Microsoft 패브릭 기반 데이터 통합 플랫폼 구축을 통한 AI 활용 환경 마련 - 최대 90% 이상 데이터 처리 속도 향상 및 99% 이상 업무 절감 달성 엠클라우드브리지가 국내 유수 홈쇼핑 및 제약사에 AI 기반 데이터 통합 플랫폼인 ‘마이크로소프트 패브릭(Fab...
    Date2024.04.04 Bynewsit Views351
    Read More
  8. 리미니스트리트, 공공기관 엔터프라이즈 소프트웨어 유지보수 혁신 지원…“디지털 정부 구현 협력”

    리미니스트리트(Rimini Street)가 공공 기관들의 소프트웨어 유지보수 혁신 지원에 나선다. 이를 위해 공공기관 고객들을 대상으로 지난 3월 21일 소공동 롯데호텔에서 심층 세미나를 개최해 공공기관 IT 담당자들의 높은 호응을 얻었다. 공공기관은 한정된 예...
    Date2024.04.04 Bynewsit Views386
    Read More
  9. 인텔, 파운드리 사업 재무 구조 개편 및 수익성 확대 방안 발표

    - 새로운 재무 보고 구조, 비용 절감 및 성장 촉진을 위한 인텔의 파운드리 운영 모델로의 전환 반영 인텔은 기존에 발표한 2024년 이후 파운드리 운영 모델에 맞춰 조정된 새로운 재무 보고 구조의 아웃라인을 발표했다. 이 새로운 구조는 비즈니스 전반에 걸...
    Date2024.04.04 Bynewsit Views463
    Read More
  10. 스틸시리즈, ‘2024 다나와 게임리그’ 공식 파트너십 참여

    - 총 상금 200만원의 ‘2024 다나와 게임리그’ 4월 1일 (월)~ 4월 10일 (수)까지 온라인 참가 신청 진행 - 스틸시리즈, Apex Pro TKL 게이밍 키보드, Arctis Nova Pro WL 게이밍 헤드셋, Aerox 3 WL ONYX게이밍 마우스, QcK Heavy Large마우스패드 경품 증정 게...
    Date2024.04.03 Bynewsit Views123
    Read More
  11. 뉴렐릭, ‘오픈텔레메트리용 원스텝 옵저버빌리티’ 프로그램으로 오픈소스 통합 강화

    - 클라우드 데이터와 IT 스택 전반의 통합 지원 - 호스트 및 쿠버네티스 대상 프로메테우스 및 오픈텔레메트리 계측 간소화 뉴렐릭이 오픈소스 오픈텔레메트리(OpenTelemetry)와 프로메테우스(Prometheus)로 계측되는 호스트 및 쿠버네티스(Kubernetes) 클러스...
    Date2024.04.03 Bynewsit Views471
    Read More
  12. 팔로알토 네트웍스, ‘랜섬웨어 공격 분석 보고서’ 공개…“랜섬웨어에 의한 데이터 유출 건수 지난해 대비 49% 증가”

    팔로알토 네트웍스는 위협 연구 기관 유닛42(Unit42)의 조사를 바탕으로, 2023년 랜섬웨어 유출 사이트에 등록된 기업이 총 3,998개로 전년 대비 49% 증가하며 전세계가 랜섬웨어 대응에 상당한 도전과제를 경험했다고 밝혔다. 팔로알토 네트웍스는 랜섬웨어의...
    Date2024.04.03 Bynewsit Views186
    Read More
  13. 큐브리드, 행정안전부 정책연구관리시스템 ‘클라우드 네이티브 전환 사업’에 DBMS 공급

    큐브리드는 행정안전부와 한국지능정보사회진흥원이 추진하는 클라우드 네이티브 기반의 시스템 시범 전환사업에 자사의 오픈소스 DBMS ‘CUBRID(큐브리드)’가 적용된다고 밝혔다. 정부에서는 지난해부터 신규시스템 구축 및 기존시스템 고도화시 민간 클라우드...
    Date2024.04.03 Bynewsit Views315
    Read More
  14. 삼성전자, 신형 피트니스 밴드 ‘갤럭시 핏3’ 국내 출시

    - 전작 대비 45% 커진 디스플레이, 1회 완전 충전으로 최대 13일까지 사용 가능 - 100종류 이상의 운동 기록, 수면 측정 등 건강 모니터링 기능 제공 - 그레이, 실버, 핑크 골드 3가지 색상으로 출시 삼성전자가 신형 피트니스 밴드 ‘갤럭시 핏3(Galaxy Fit3)’...
    Date2024.04.02 Bynewsit Views153
    Read More
  15. ST, 새로운 올인원 MEMS 스튜디오 데스크톱 소프트웨어 솔루션 출시…”창의적 센싱 개발 지원“

    - 사용이 쉽고 효율적인 통합 툴로 차세대 첨단 MEMS 센서 제품 기반 애플리케이션 개발 지원 ST마이크로일렉트로닉스가 MEMS 센서를 평가 및 개발할 수 있는 새로운 MEMS 스튜디오(MEMS Studio) 올인원 툴을 출시했다. 이 툴은 STM32 마이크로컨트롤러 에코시...
    Date2024.04.02 Bynewsit Views479
    Read More
  16. 티맥스소프트, 클라우드 네이티브 SaaS ‘TSP’ 무료 체험 프로모션

    - 8월까지 유연성·확장성·편의성 등 미들웨어 SaaS 도입 효과 체험할 수 있는 이벤트 진행 - 목적에 맞는 클라우드 네이티브 기반 비즈니스 환경 구현 편리하게 지원 - TSP의 차별화된 특장점을 바탕으로 국내 스타트업, 중소·중견기업 등 적극 공략할 것 티맥...
    Date2024.04.02 Bynewsit Views399
    Read More
  17. 버티브, 신임 한국 사장으로 「김성엽 대표」 선임

    버티브(Vertiv)는 한국 사업을 총괄할 버티브 코리아 수장으로 김성엽 신임 사장을 선임했다고 발표했다. 25년의 경력을 갖춘 김성엽 사장은 국내 시장을 관통하는 디지털 트렌드, 4차 산업혁명 및 ESG에 대한 해박한 지식과 이해를 갖춘 업계 베테랑이다. 버...
    Date2024.04.02 Bynewsit Views467
    Read More
  18. 사이냅소프트,​​​ '사이냅 도큐애널라이저' 출시…​​“문서의 시각정 정보와 문서 구조 정보 분석”

    - 기업과 기관의 디지털 문서 자산화에 필수적인 솔루션 - 5월 AI EXPO 2024에서 '사이냅 도큐애널라이저' 공개 사이냅소프트는 다양한 문서에서 표, 그래프와 같은 시각적 정보와 문서 구조 정보를 분석해 주는 ‘사이냅 도큐애널라이저’를 출시한다고 밝혔다....
    Date2024.04.02 Bynewsit Views371
    Read More
  19. 헥사곤-스맥, 국내 항공·방산·반도체 분야 ‘스마트 제조 기술 개발’ MOU 체결

    - 국내 항공·방산·반도체 산업에 적용 가능한 공동 기술개발 위해 협력 모색 - 헥사곤의 기술과 솔루션을 활용해 스맥의 공작기계 및 제조솔루션 전문성 강화 헥사곤 매뉴팩처링 인텔리전스는 공작기계·로봇 자동화 솔루션 전문기업 스맥(SMEC)과 함께 인더스...
    Date2024.04.02 Bynewsit Views381
    Read More
  20. 한국지멘스, 스마트공장·자동화산업전 2024 전시회 성료

    - 스마트공장·자동화산업전 2024 전시회 통해 지멘스의 최신 스마트 제조 기술 및 산업 트렌드 제시 - 국내 제조업의 디지털 전환을 가속화하고 고객의 혁신이 실현될 수 있도록 적극 지원할 것 한국지멘스 디지털 인더스트리(DI) 부문이 지난 3월 27일부터 29...
    Date2024.04.01 Bynewsit Views435
    Read More
Board Pagination Prev 1 ... 134 135 136 137 138 139 140 141 142 143 ... 272 Next
/ 272
CLOSE