- 새로운 GPU 가속 엔비디아 NIM 마이크로서비스와 클라우드 엔드포인트 카탈로그 공개

- 마이크로서비스 통해 데이터 처리, LLM 맞춤화, 추론, 검색 증강 생성, 가드레일 가속화

- 케이던스, 크라우드스트라이크, SAP, 서비스나우 등 광범위한 AI 에코시스템에 채택

 

엔비디아, 생성형 AI 마이크로서비스 출시… 생성형 AI 코파일럿 배포 지원.jpg

 

엔비디아는 수십 개의 엔터프라이즈용 생성형 AI 마이크로서비스를 출시했다고 발표했다기업은 이를 통해 지적 재산에 대한 완전한 소유권과 통제권을 유지하면서 자체 플랫폼에서 맞춤형 애플리케이션을 생성하고 배포할 수 있다.

 

클라우드 네이티브 마이크로서비스 카탈로그는 엔비디아 쿠다(CUDA)플랫폼을 기반으로 구축됐으며 엔비디아 NIM 마이크로서비스를 포함한다. 엔비디아 NIMTM은 엔비디아와 파트너 에코시스템에서 제공하는 24개 이상의 인기 AI 모델에 대한 추론 최적화를 지원한다. 또한 검색 증강 생성(retrieval-augmented generation, RAG), 가드레일, 데이터 처리, HPC 등을 위한 엔비디아 가속 소프트웨어 개발 키트, 라이브러리, 툴을 엔비디아 쿠다-X 마이크로서비스로 액세스할 수 있다. 이뿐만 아니라 엔비디아는 24개 이상의 의료용 NIM과 쿠다 -X 마이크로서비스도 별도로 발표했다.

 

엄선된 마이크로서비스는 엔비디아의 풀스택 컴퓨팅 플랫폼에 새로운 계층을 추가한다. 이 계층은 모델 개발자, 플랫폼 제공업체, 기업 AI 생태계를 맞춤형 AI 모델을 실행하는 표준화된 경로로 연결한다. 이때 맞춤형 AI 모델은 클라우드, 데이터센터, 워크스테이션, PC에 탑재된 수억 개의 GPU로 구성된 엔비디아 CUDA 설치 기반에 최적화된 모델이다.

 

어도비(Adobe)케이던스(Cadence)크라우드스트라이크(CrowdStrike)게티이미지(Getty Images), SAP서비스나우(ServiceNow)셔터스톡(Shutterstock) 등 선도적인 애플리케이션, 데이터, 사이버 보안 플랫폼 제공업체들이 엔비디아 AI 엔터프라이즈 5.0(AI Enterprise 5.0)에서 제공되는 새로운 엔비디아 생성형 AI 마이크로서비스를 가장 먼저 활용하고 있다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 "기존 엔터프라이즈 플랫폼은 생성형 AI 코파일럿으로 전환할 수 있는 풍부한 데이터를 가지고 있다. 파트너 에코시스템과 함께 구축된 이러한 컨테이너화된 AI 마이크로서비스는 모든 산업 분야의 기업이 AI 기업으로 거듭나기 위한 기본 요소"라고 밝혔다. 

 

몇 주에서 몇 분으로 배포 시간을 단축하는 NIM 추론 마이크로서비스

NIM 마이크로서비스는 트리톤 추론 서버(Triton Inference Server)와 텐서RT-LLM(TensorRT-LLM)을 비롯한 엔비디아 추론 소프트웨어로 구동되는 사전 구축된 컨테이너를 제공한다. 이로써 개발자는 배포 시간을 몇 주에서 몇 분으로 단축할 수 있다.

 

해당 서비스는 언어, 음성, 신약 개발과 같은 도메인을 위한 업계 표준 API를 제공한다. 개발자는 이러한 지원을 바탕으로 자체 인프라에서 안전하게 호스팅되는 독점 데이터를 사용해 AI 애플리케이션을 빠르게 구축할 수 있다. 더불어 애플리케이션을 필요에 따라 확장 가능한 유연상과 성능도 갖췄다. 엔비디아 가속 컴퓨팅 플랫폼 상에서 프로덕션 환경 내 생성형 AI를 실행할 수 있다.

 

NIM 마이크로서비스는 엔비디아, A121어뎁트(Adept), 코히어(Cohere)게티이미지, 셔터스톡 모델과 더불어 구글(Google), 허깅페이스(Hugging Face)메타(Meta), 마이크로소프트(Microsoft), 미스트랄 AI(Mistral AI), 스태빌리티 AI(Stability AI)의 오픈 모델을 배포할 수 있는 가장 빠르고 성능이 뛰어난 프로덕션 AI 컨테이너를 제공한다.

 

서비스나우는 새로운 도메인별 코파일럿과 기타 생성형 AI 애플리케이션을 더 빠르고 비용 효율적으로 개발, 배포하기 위해 NIM을 사용한다고 발표했다.

 

고객들은 아마존 세이지메이커(Amazon SageMaker)구글 쿠버네티스 엔진(Google Kubernetes Engine), 마이크로소프트 애저 AI(Microsoft Azure AI)에서 NIM 마이크로서비스에 액세스하고 딥셋(Deepset)랭체인(LangChain)라마인덱스(LlamaIndex)와 같은 인기 AI 프레임워크와 통합할 수 있게 된다.

 

RAG, 데이터 처리, 가드레일, HPC를 위한 쿠다-X 마이크로서비스

쿠다-X 마이크로서비스는 데이터 준비, 맞춤화, 훈련을 위한 엔드투엔드 빌딩 블록을 제공해 산업 전반에서 프로덕션 AI 개발 속도를 높인다. 기업들은 AI 채택을 가속화하기 위해 맞춤형 음성 및 번역 AI를 위한 엔비디아 리바(Riva)라우팅 최적화를 위한  엔비디아 cuOpt고해상도 기후 및 날씨 시뮬레이션을 위한 엔비디아 어스-2(Earth-2) 등의 쿠다-X 마이크로서비스를 사용할 수 있다.

 

개발자는 네모 리트리버(NeMo Retriever) 마이크로서비스를 통해 텍스트, 이미지, 막대 그래프, 라인 플롯, 파이 차트 등의 시각화를 포함한 비즈니스 데이터에 AI 애플리케이션을 연결해 매우 정확하고 맥락에 맞는 응답을 생성할 수 있다. 이러한 RAG 기능을 통해 코파일럿, 챗봇, 생성형 AI 생산성 도구에 더 많은 데이터를 제공해 정확도와 인사이트를 높일 수 있다.

 

맞춤형 모델 개발을 위한 추가적인 엔비디아 네모(NeMo) 마이크로서비스도 곧 출시될 예정이다. 여기에는 훈련과 검색을 위한 정제된 데이터세트 구축 목적의 엔비디아 네모 큐레이터(Curator), 도메인별 데이터로 LLM을 미세 조정하기 위한 엔비디아 네모 커스터마이저(Customizer), AI 모델 성능 분석을 위한 엔비디아 네모 이밸류에이터(Evaluator), LLM용 엔비디아 네모 가드레일(Guardrails) 등이 포함된다.

 

에코시스템, 생성형 AI 마이크로서비스로 엔터프라이즈 플랫폼 강화

주요 애플리케이션 제공업체 외에도 엔비디아 에코시스템 전반의 데이터, 인프라, 컴퓨팅 플랫폼 제공업체들이 엔비디아 마이크로서비스와 협력해 기업에 생성형 AI를 제공하고 있다.

 

박스(Box)클라우데라(Cloudera), 코히시티(Cohesity), 데이터스택스(Datastax)드롭박스(Dropbox)와 넷앱(NetApp)을 비롯한 최고의 데이터 플랫폼 제공업체들이 엔비디아 마이크로서비스와 협력하고 있다. 이로써 고객이 RAG 파이프라인을 최적화하고 자사의 독점 데이터를 생성형 AI 애플리케이션에 통합할 수 있도록 지원한다. 스노우플레이크(Snowflake)는 네모 리트리버를 활용하여 엔터프라이즈 데이터를 AI 애플리케이션 구축에 활용한다.

 

기업은 주요 클라우드 서비스인 아마존 웹 서비스(Amazon Web Services, AWS)구글 클라우드(Google Cloud)애저오라클 클라우드 인프라스트럭쳐(Oracle Cloud Infrastructure) 등 원하는 인프라에 엔비디아 AI 엔터프라이즈 5.0에 포함된 엔비디아 마이크로서비스를 배포할 수 있다.

 

또한 엔비디아 마이크로서비스는 시스코(Cisco), 델 테크놀로지스휴렛팩커드 엔터프라이즈(HPE), HP, 레노버(Lenovo)슈퍼마이크로(Supermicro)의 서버와 워크스테이션을 포함한 400개 이상의 엔비디아 인증 시스템(NVIDIA-Certified Systems)에서 지원된다. 한편 HPE는 생성형 AI용 HPE의 엔터프라이즈 컴퓨팅 솔루션 출시를 발표했으며, NIM과 엔비디아 AI 파운데이션(AI Foundation) 모델을 HPE AI 소프트웨어에 통합할 계획이다.

 

엔비디아 AI 엔터프라이즈 마이크로서비스는 VM웨어 프라이빗 AI 파운데이션 위드 엔비디아(VMware Private AI Foundation with NVIDIA)를 포함한 인프라 소프트웨어 플랫폼에 제공될 예정이다. 레드햇 오픈시프트(Red Hat OpenShift)는 보안, 규정 준수, 제어에 최적화된 기능을 통해 기업이 생성형 AI 기능을 애플리케이션에 보다 쉽게 통합할 수 있게 하는 엔비디아 NIM 마이크로서비스를 지원한다. 캐노니컬(Canonical)은 엔비디아 AI 엔터프라이즈를 통해 엔비디아 마이크로서비스에 대한 참드 쿠버네티스(Charmed Kubernetes) 지원을 추가하고 있다.

 

엔비디아 에코시스템은 어브릿지(Abridge), 애니스케일(Anyscale), 데이터이쿠(Dataiku), 데이터로봇(DataRobot)글린(Glean), H2O.ai, 시큐리티 AI(Securiti AI)스케일.ai(Scale.ai)옥토AI(OctoAI)웨이츠 앤드 바이어시스(Weights & Biases) 등 수백 개의 AI와 MLOps 파트너로 구성됐다. 엔비디아 에코시스템은 엔비디아 AI 엔터프라이즈를 통해 엔비디아 마이크로서비스에 대한 지원을 추가하고 있다.

 

아파치 루씬(Apache Lucene), 데이터스택스파이스(Faiss), 키네티카(Kinetica), 밀버스(Milvus), 레디스(Redis), 위비에이트(Weaviate)는 기업용 반응형 RAG 기능 강화를 위해 엔비디아 네모 리트리버 마이크로서비스와 협업하는 벡터 검색 제공업체 중 하나이다.

 

개발자는 ai.nvidia.com에서 무료로 엔비디아 마이크로서비스를 실험해 볼 수 있다. 기업에서는 엔비디아 인증 시스템 및 주요 클라우드 플랫폼에서 실행되는 엔비디아 AI 엔터프라이즈 5.0을 통해 프로덕션급 NIM 마이크로서비스를 배포할 수 있다.

 

#엔비디아#GTC#2024#생성형AI#코파일럿#AI

 

?

  1. 한국레노버, 씽크패드 X1 카본 출시 기념 프로모션…선착순 100명 대상 파격 혜택

    - 정품 파우치, 무선 마우스, 헬리녹스 캠핑 의자, 타이틀리스트 골프공 등 푸짐한 사은품 제공 - 구매 후기 작성 이벤트… 스카티 카메론 퍼터 2024 팬텀 5 증정 한국레노버가 씽크패드 X1 카본 12세대 출시 기념으로 5월 19일까지 네이버, 지마켓, 11번가, 컴...
    Date2024.04.29 Bynewsit Views187
    Read More
  2. 쿠도커뮤니케이션, AWS CPPO 통해 클라우드 인프라 & 보안 사업 본격 가동

    - AWS CPPO(Channel Partner Private Offer) 사업 통해 메이저 ISV솔루션에 대한 최상의 보안 및 인프라 구축 해법 제공 - 클라우드 인프라 & 보안 솔루션의 제품 컨설팅 및 계약부터 기술 지원까지 원스톱 서비스 제공 쿠도커뮤니케이션이 AWS의 채널 파트너...
    Date2024.04.29 Bynewsit Views213
    Read More
  3. 델, ‘S 시리즈’ 홈오피스용 모니터 신제품 3종 공개…“높은 생산성과 시청각 경험 구현”

    - FHD와 QHD 디스플레이 옵션 갖춘 24, 27형 모니터, - TUV 라인란드의 ‘아이 컴포트’ 부문 4스타 인증으로 장시간 사용에도 눈의 편안함 유지 - 최대 100Hz 가변 주사율과 QHD, FHD 해상도 옵션을 제공해 일상 업무 및 콘텐츠 감상에 모두 최적화 - 깊고 강력...
    Date2024.04.29 Bynewsit Views161
    Read More
  4. ASUS, 차세대 AMD 라이젠 프로세서 지원 메인보드 바이오스 업데이트 발표

    - AMD 라이젠 8000, 7000 시리즈 및 차세대 라이젠 프로세서까지 지원 - 버튼 하나로 쉽게 바이오스 업데이트할 수 있는 USB 바이오스 플래시백 지원 에이수스 코리아가 차세대 AMD 라이젠 프로세서 지원하는 메인보드 바이오스 업데이트를 발표했다. 이번 바...
    Date2024.04.26 Bynewsit Views178
    Read More
  5. 마우저, “2024년 1분기에 1만 종 이상의 신제품 추가”

    마우저 일렉트로닉스는 고객이 제품 출시시간을 단축하고, 경쟁 우위에 설 수 있도록 신속하게 최신 제품과 신기술을 제공하는데 주력하고 있다. 현재 1,200개 이상의 반도체 및 전자부품 제조사들이 마우저를 통해 자사 제품을 글로벌 시장에 공급하고 있다. ...
    Date2024.04.26 Bynewsit Views237
    Read More
  6. 블루투스 SIG, 2024 블루투스 시장 동향 업데이트 공개…“2028년까지 블루투스 디바이스 연간 총 출하량 75억 대 전망”

    - 앰비언트 IoT 및 채널 사운딩과 같은 새로운 시장 동인 등장 블루투스 SIG는 매년 블루투스 시장 업데이트를 통해 최신 기술 동향과 다양한 시장에 걸친 트렌드 등에 대해 발표하고 있다. 2024년 연례 보고서에는 다양한 애플리케이션을 통해 일상 생활에서 ...
    Date2024.04.26 Bynewsit Views442
    Read More
  7. 가민, 해양 라이프스타일 프리미엄 GPS 스마트워치 ‘쿼틱스 7 프로’ 출시

    - 쿼틱스 7 프로, 선명한 1.3인치 AMOLED 터치스크린 디스플레이와 버튼 컨트롤 겸비 - 트롤링 모터 원격 제어 앱과 최적의 낚시 시간을 찾아주는 앱 신규 추가 - 해안에서는 프리미엄 연안도와 내륙 지도, 육지에서는 토포액티브 지도가 탐험을 지원 - 다양한...
    Date2024.04.26 Bynewsit Views169
    Read More
  8. 지멘스, IC 검증 솔루션 ‘벨로체 CS’ 3종 발표…“에뮬레이션 및 프로토타이핑 혁신”

    - 벨로체 CS(Veloce CS) 아키텍처, 하드웨어 에뮬레이션, 엔터프라이즈 프로토타이핑 및 소프트웨어 프로토타이핑을 통합. 검증 주기를 10배까지 가속화하고 총 소요 비용을 최대 5배까지 절감 지원 - 벨로체 CS 소프트웨어는 모든 플랫폼에서 재사용이 가능하...
    Date2024.04.26 Bynewsit Views315
    Read More
  9. 마우저, IoT 및 에너지 하베스팅 설계 세미나 개최

    마우저 일렉트로닉스는 5월 2일(목) 오후 1시부터 코엑스 컨퍼런스룸(327호)에서 사물 인터넷(IoT)과 에너지 하베스팅 설계를 주제로 한 세미나를 개최한다고 밝혔다. IoT 기술의 확산은 디바이스의 배터리 수명을 연장할 수 있는 초저전력 기술과, 더욱 지속...
    Date2024.04.25 Bynewsit Views268
    Read More
  10. ST, 6축 관성 모듈 「LSM6DSV32X」 출시…“집약적 움직임 분석 지원”

    - 웨어러블, 자산추적, 활동 모니터링 기기의 배터리 런타임 연장 ST마이크로일렉트로닉스가 32G의 넓은 풀스케일 범위를 가진 가속도 센서와 4,000dps의 자이로스코프를 갖춘 6축 관성 모듈(IMU) LSM6DSV32X를 출시했다고 밝히고, 이 모듈은 자유낙하 높이 추...
    Date2024.04.25 Bynewsit Views324
    Read More
  11. SAP 코리아, ‘SAP 이노베이션 데이 포 CX’ 개최…“AI가 혁신하는 고객 경험 실사례 공유“

    SAP 코리아는 오늘 ‘SAP 이노베이션 데이 포 CX(SAP Innovation Day for CX)’를 오늘 개최한다고 밝혔다. 이번 행사는 국내 기업의 마케팅 및 세일즈 분야 임직원을 대상으로 보코서울강남 호텔에서 진행된다. AI 기술이 비약적으로 발전하고 고객 데이터 접근...
    Date2024.04.25 Bynewsit Views411
    Read More
  12. 지코어, 엔비디아 파트너 네트워크 어워드에서 ‘산업 혁신기업 부문’ 수상

    - 지코어, 엔비디아로부터 AI 음성-텍스트 솔루션의 성공적인 출시로 혁신에 대한 노력 인정받아 - 향후 프랑스어와 독일어 등 언어 추가해 음성-텍스트 변환 기능을 언어를 초월한 의사소통 도구로 확대해 나갈 계획 지코어(Gcore)는 2024 EMEA 엔비디아 파트...
    Date2024.04.25 Bynewsit Views437
    Read More
  13. 티맥스티베로, DBMS 전문가 ‘이희상 신임 대표’ 선임… “국내외 시장 경쟁력 강화”

    - 35년 경력 DBMS 전문가 이희상 대표… “IT업계서 신임 두터워” 티맥스그룹의 데이터베이스(DBMS) 전문 기업 티맥스티베로가 새 수장으로 이희상 대표를 선임했다. 티맥스티베로는 지난 22일 경기도 성남시 본사에서 이희상 대표 취임식을 진행했다고 25일 밝...
    Date2024.04.25 Bynewsit Views385
    Read More
  14. 효성인포메이션시스템, ‘히타치 밴타라’ 2023년 국내 하이엔드 스토리지 시장 점유율 42.2%로 10년 연속 1위…“국내 하이엔드 스토리지 시장 리더십 입증”

    - 데이터 안정성, 독보적 기술력, 국내 최적화 기술 지원 기반으로 국내 스토리지 시장 성장 견인 - VSP ONE, HIS STaaS 등 미래 혁신 위한 데이터 인프라 구축 방향 제시 효성인포메이션시스템은 IDC의 <분기별 외장형 스토리지 시스템 시장조사(IDC Quarterl...
    Date2024.04.25 Bynewsit Views211
    Read More
  15. 마이크로스트레티지 코리아, KB증권에 ‘MicroStrategy BI 플랫폼’ 기반 데이터포털(Self BI) 시스템 구축

    - 데이터 포털(Self BI) 구축을 통해 전사적 데이터 활용 증대를 위한 기반 마련 - 다양한 관점의 내부 보고서를 적시성 있게 제공하고 신속한 데이터 기반의 의사결정 체계 확립 마이크로스트레티지 코리아는 KB증권이 자사의 ‘MicroStrategy BI 플랫폼’을 기...
    Date2024.04.25 Bynewsit Views410
    Read More
  16. 리미니스트리트, ‘2024 리미니스트리트 써밋’ 개최…“엔터프라이즈 소프트웨어 유지보수 혁신 지원”

    - 유지보수 혁신을 통해 엔터프라이즈 소프트웨어에 대한 전략적 유연성을 확보하고 벤더 락인으로부터 탈피, IT 로드맵에 대한 주도권을 확보하고 기업의 사업 우선순위에 따라 리소스를 최적화 하는 방안 소개 리미니스트리트(Rimini Street)는 지난 4월 17...
    Date2024.04.25 Bynewsit Views287
    Read More
  17. 매스웍스코리아, ‘제4회 매트랩 대학생 AI 경진대회’ 개최…“다양한 분야의 AI 인재 발굴”

    - AI 적용한 프로젝트 구현하고자 하는 국내 대학생∙대학원생 누구나 참가 가능 매스웍스(MathWorks)는 국내 대학생들이 인공지능(AI) 기술 활용 능력을 개발하고, 전문 분야별 경쟁력을 강화할 수 있도록 ‘제4회 매트랩(MATLAB) 대학생 AI 경진대회’를 개최한...
    Date2024.04.25 Bynewsit Views407
    Read More
  18. 다쏘시스템, HD현대중공업 맞손…“버추얼 트윈 기반 설계-생산 일관화 통합 플랫폼 구축”

    - 다쏘시스템, HD현대중공업과 HD한국조선해양과 전략적 업무 협력으로 버추얼 트윈 기반 설계-생산 일관화 통합 플랫폼 구축으로 생산성 향상과 지속가능성 정조준 - 다쏘시스템, 대한민국 선박제조의 디지털화와 지속가능성 두 가지 목표를 동시에 지원할 것...
    Date2024.04.25 Bynewsit Views425
    Read More
  19. 원프레딕트, 산업 AI 설비관리 솔루션으로 ‘국제전기전력전시회’ 참가

    - 국내 최대 전기전력 산업 전시회서 예지보전 솔루션 ‘가디원’ 제품군 전시 - 산업 AI로 모터, 변압기, 회전기기 등 산업 설비 고장 사전 예측… 다운타임 최소화 - K-스타트업 기술력으로 다양한 국내·글로벌 산업군 생산 효율 최대화 지원 산업 AI 기반 설비...
    Date2024.04.24 Bynewsit Views368
    Read More
  20. ams OSRAM-도미넌트 옵토 테크놀로지스, ‘지능형 RGB LED’로 스마트 자동차 실내 조명 구현

    - 2023년 출시된 ams OSRAM의 OSP, 많은 자동차 실내용 집적 회로(IC) 및 LED 제조 회사들로부터 관심 고조 - 도미넌트 옵토 테크놀로지스, 자사의 차세대 지능형 RGB LED에 OSP를 적용하여 이 미래지향적 통신 기술에 대한 중요한 독립적 검증 제공 예정 - am...
    Date2024.04.24 Bynewsit Views312
    Read More
Board Pagination Prev 1 ... 146 147 148 149 150 151 152 153 154 155 ... 288 Next
/ 288
CLOSE