- 새로운 GPU 가속 엔비디아 NIM 마이크로서비스와 클라우드 엔드포인트 카탈로그 공개

- 마이크로서비스 통해 데이터 처리, LLM 맞춤화, 추론, 검색 증강 생성, 가드레일 가속화

- 케이던스, 크라우드스트라이크, SAP, 서비스나우 등 광범위한 AI 에코시스템에 채택

 

엔비디아, 생성형 AI 마이크로서비스 출시… 생성형 AI 코파일럿 배포 지원.jpg

 

엔비디아는 수십 개의 엔터프라이즈용 생성형 AI 마이크로서비스를 출시했다고 발표했다기업은 이를 통해 지적 재산에 대한 완전한 소유권과 통제권을 유지하면서 자체 플랫폼에서 맞춤형 애플리케이션을 생성하고 배포할 수 있다.

 

클라우드 네이티브 마이크로서비스 카탈로그는 엔비디아 쿠다(CUDA)플랫폼을 기반으로 구축됐으며 엔비디아 NIM 마이크로서비스를 포함한다. 엔비디아 NIMTM은 엔비디아와 파트너 에코시스템에서 제공하는 24개 이상의 인기 AI 모델에 대한 추론 최적화를 지원한다. 또한 검색 증강 생성(retrieval-augmented generation, RAG), 가드레일, 데이터 처리, HPC 등을 위한 엔비디아 가속 소프트웨어 개발 키트, 라이브러리, 툴을 엔비디아 쿠다-X 마이크로서비스로 액세스할 수 있다. 이뿐만 아니라 엔비디아는 24개 이상의 의료용 NIM과 쿠다 -X 마이크로서비스도 별도로 발표했다.

 

엄선된 마이크로서비스는 엔비디아의 풀스택 컴퓨팅 플랫폼에 새로운 계층을 추가한다. 이 계층은 모델 개발자, 플랫폼 제공업체, 기업 AI 생태계를 맞춤형 AI 모델을 실행하는 표준화된 경로로 연결한다. 이때 맞춤형 AI 모델은 클라우드, 데이터센터, 워크스테이션, PC에 탑재된 수억 개의 GPU로 구성된 엔비디아 CUDA 설치 기반에 최적화된 모델이다.

 

어도비(Adobe)케이던스(Cadence)크라우드스트라이크(CrowdStrike)게티이미지(Getty Images), SAP서비스나우(ServiceNow)셔터스톡(Shutterstock) 등 선도적인 애플리케이션, 데이터, 사이버 보안 플랫폼 제공업체들이 엔비디아 AI 엔터프라이즈 5.0(AI Enterprise 5.0)에서 제공되는 새로운 엔비디아 생성형 AI 마이크로서비스를 가장 먼저 활용하고 있다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 "기존 엔터프라이즈 플랫폼은 생성형 AI 코파일럿으로 전환할 수 있는 풍부한 데이터를 가지고 있다. 파트너 에코시스템과 함께 구축된 이러한 컨테이너화된 AI 마이크로서비스는 모든 산업 분야의 기업이 AI 기업으로 거듭나기 위한 기본 요소"라고 밝혔다. 

 

몇 주에서 몇 분으로 배포 시간을 단축하는 NIM 추론 마이크로서비스

NIM 마이크로서비스는 트리톤 추론 서버(Triton Inference Server)와 텐서RT-LLM(TensorRT-LLM)을 비롯한 엔비디아 추론 소프트웨어로 구동되는 사전 구축된 컨테이너를 제공한다. 이로써 개발자는 배포 시간을 몇 주에서 몇 분으로 단축할 수 있다.

 

해당 서비스는 언어, 음성, 신약 개발과 같은 도메인을 위한 업계 표준 API를 제공한다. 개발자는 이러한 지원을 바탕으로 자체 인프라에서 안전하게 호스팅되는 독점 데이터를 사용해 AI 애플리케이션을 빠르게 구축할 수 있다. 더불어 애플리케이션을 필요에 따라 확장 가능한 유연상과 성능도 갖췄다. 엔비디아 가속 컴퓨팅 플랫폼 상에서 프로덕션 환경 내 생성형 AI를 실행할 수 있다.

 

NIM 마이크로서비스는 엔비디아, A121어뎁트(Adept), 코히어(Cohere)게티이미지, 셔터스톡 모델과 더불어 구글(Google), 허깅페이스(Hugging Face)메타(Meta), 마이크로소프트(Microsoft), 미스트랄 AI(Mistral AI), 스태빌리티 AI(Stability AI)의 오픈 모델을 배포할 수 있는 가장 빠르고 성능이 뛰어난 프로덕션 AI 컨테이너를 제공한다.

 

서비스나우는 새로운 도메인별 코파일럿과 기타 생성형 AI 애플리케이션을 더 빠르고 비용 효율적으로 개발, 배포하기 위해 NIM을 사용한다고 발표했다.

 

고객들은 아마존 세이지메이커(Amazon SageMaker)구글 쿠버네티스 엔진(Google Kubernetes Engine), 마이크로소프트 애저 AI(Microsoft Azure AI)에서 NIM 마이크로서비스에 액세스하고 딥셋(Deepset)랭체인(LangChain)라마인덱스(LlamaIndex)와 같은 인기 AI 프레임워크와 통합할 수 있게 된다.

 

RAG, 데이터 처리, 가드레일, HPC를 위한 쿠다-X 마이크로서비스

쿠다-X 마이크로서비스는 데이터 준비, 맞춤화, 훈련을 위한 엔드투엔드 빌딩 블록을 제공해 산업 전반에서 프로덕션 AI 개발 속도를 높인다. 기업들은 AI 채택을 가속화하기 위해 맞춤형 음성 및 번역 AI를 위한 엔비디아 리바(Riva)라우팅 최적화를 위한  엔비디아 cuOpt고해상도 기후 및 날씨 시뮬레이션을 위한 엔비디아 어스-2(Earth-2) 등의 쿠다-X 마이크로서비스를 사용할 수 있다.

 

개발자는 네모 리트리버(NeMo Retriever) 마이크로서비스를 통해 텍스트, 이미지, 막대 그래프, 라인 플롯, 파이 차트 등의 시각화를 포함한 비즈니스 데이터에 AI 애플리케이션을 연결해 매우 정확하고 맥락에 맞는 응답을 생성할 수 있다. 이러한 RAG 기능을 통해 코파일럿, 챗봇, 생성형 AI 생산성 도구에 더 많은 데이터를 제공해 정확도와 인사이트를 높일 수 있다.

 

맞춤형 모델 개발을 위한 추가적인 엔비디아 네모(NeMo) 마이크로서비스도 곧 출시될 예정이다. 여기에는 훈련과 검색을 위한 정제된 데이터세트 구축 목적의 엔비디아 네모 큐레이터(Curator), 도메인별 데이터로 LLM을 미세 조정하기 위한 엔비디아 네모 커스터마이저(Customizer), AI 모델 성능 분석을 위한 엔비디아 네모 이밸류에이터(Evaluator), LLM용 엔비디아 네모 가드레일(Guardrails) 등이 포함된다.

 

에코시스템, 생성형 AI 마이크로서비스로 엔터프라이즈 플랫폼 강화

주요 애플리케이션 제공업체 외에도 엔비디아 에코시스템 전반의 데이터, 인프라, 컴퓨팅 플랫폼 제공업체들이 엔비디아 마이크로서비스와 협력해 기업에 생성형 AI를 제공하고 있다.

 

박스(Box)클라우데라(Cloudera), 코히시티(Cohesity), 데이터스택스(Datastax)드롭박스(Dropbox)와 넷앱(NetApp)을 비롯한 최고의 데이터 플랫폼 제공업체들이 엔비디아 마이크로서비스와 협력하고 있다. 이로써 고객이 RAG 파이프라인을 최적화하고 자사의 독점 데이터를 생성형 AI 애플리케이션에 통합할 수 있도록 지원한다. 스노우플레이크(Snowflake)는 네모 리트리버를 활용하여 엔터프라이즈 데이터를 AI 애플리케이션 구축에 활용한다.

 

기업은 주요 클라우드 서비스인 아마존 웹 서비스(Amazon Web Services, AWS)구글 클라우드(Google Cloud)애저오라클 클라우드 인프라스트럭쳐(Oracle Cloud Infrastructure) 등 원하는 인프라에 엔비디아 AI 엔터프라이즈 5.0에 포함된 엔비디아 마이크로서비스를 배포할 수 있다.

 

또한 엔비디아 마이크로서비스는 시스코(Cisco), 델 테크놀로지스휴렛팩커드 엔터프라이즈(HPE), HP, 레노버(Lenovo)슈퍼마이크로(Supermicro)의 서버와 워크스테이션을 포함한 400개 이상의 엔비디아 인증 시스템(NVIDIA-Certified Systems)에서 지원된다. 한편 HPE는 생성형 AI용 HPE의 엔터프라이즈 컴퓨팅 솔루션 출시를 발표했으며, NIM과 엔비디아 AI 파운데이션(AI Foundation) 모델을 HPE AI 소프트웨어에 통합할 계획이다.

 

엔비디아 AI 엔터프라이즈 마이크로서비스는 VM웨어 프라이빗 AI 파운데이션 위드 엔비디아(VMware Private AI Foundation with NVIDIA)를 포함한 인프라 소프트웨어 플랫폼에 제공될 예정이다. 레드햇 오픈시프트(Red Hat OpenShift)는 보안, 규정 준수, 제어에 최적화된 기능을 통해 기업이 생성형 AI 기능을 애플리케이션에 보다 쉽게 통합할 수 있게 하는 엔비디아 NIM 마이크로서비스를 지원한다. 캐노니컬(Canonical)은 엔비디아 AI 엔터프라이즈를 통해 엔비디아 마이크로서비스에 대한 참드 쿠버네티스(Charmed Kubernetes) 지원을 추가하고 있다.

 

엔비디아 에코시스템은 어브릿지(Abridge), 애니스케일(Anyscale), 데이터이쿠(Dataiku), 데이터로봇(DataRobot)글린(Glean), H2O.ai, 시큐리티 AI(Securiti AI)스케일.ai(Scale.ai)옥토AI(OctoAI)웨이츠 앤드 바이어시스(Weights & Biases) 등 수백 개의 AI와 MLOps 파트너로 구성됐다. 엔비디아 에코시스템은 엔비디아 AI 엔터프라이즈를 통해 엔비디아 마이크로서비스에 대한 지원을 추가하고 있다.

 

아파치 루씬(Apache Lucene), 데이터스택스파이스(Faiss), 키네티카(Kinetica), 밀버스(Milvus), 레디스(Redis), 위비에이트(Weaviate)는 기업용 반응형 RAG 기능 강화를 위해 엔비디아 네모 리트리버 마이크로서비스와 협업하는 벡터 검색 제공업체 중 하나이다.

 

개발자는 ai.nvidia.com에서 무료로 엔비디아 마이크로서비스를 실험해 볼 수 있다. 기업에서는 엔비디아 인증 시스템 및 주요 클라우드 플랫폼에서 실행되는 엔비디아 AI 엔터프라이즈 5.0을 통해 프로덕션급 NIM 마이크로서비스를 배포할 수 있다.

 

#엔비디아#GTC#2024#생성형AI#코파일럿#AI

 

?

  1. 한국레노버, 소외계층 위한 ‘사랑의 밥퍼 나눔’ 무료 급식 봉사 진행

    - 임직원 자발적 참여…무료 급식소 방문 어르신에 한끼 대접 - 밥퍼나눔운동본부의 원활한 운영을 위한 아이디어패드 노트북 기부 한국레노버 임직원들이 ESG 활동의 일환으로 서울 동대문구 밥퍼나눔운동본부에서 ‘밥퍼’ 무료급식 나눔 봉사활동을 진행했다. ...
    Date2024.03.28 Bynewsit Views417
    Read More
  2. 노르딕 세미컨덕터, CSA의 IoT 기기 보안 사양 1.0 및 인증 프로그램 지원

    노르딕 세미컨덕터는 CSA(Connectivity Standards Alliance)가 최근 발표한 ‘IoT 기기 보안 사양 1.0’과 이와 관련한 인증 프로그램 및 ‘제품 보안 인증 마크(Product Security Verified Mark)’를 지원한다고 밝혔다. 이를 통해 노르딕은 무선 IoT 제품을 위한...
    Date2024.03.27 Bynewsit Views211
    Read More
  3. 포브스, 베스트 게이밍 헤드셋으로 「스틸시리즈 아크티스 노바 프로 무선」 선정

    - 아크티스 노바 프로 무선 혁신적인 기능과 편안함, 최상의 오디오 사운드까지 게이밍 기어 브랜드 스틸시리즈(SteelSeries)의 아크티스 노바 프로 무선’ 게이밍 헤드셋이 미국 경제지 포브스가 24년 2월에 발표한 '베스트 게이밍 헤드셋’에 선정되었다. 포브...
    Date2024.03.27 Bynewsit Views126
    Read More
  4. 가민, 국내 코스 그린 등고선과 함께 더욱 강력해진 ‘어프로치 S70’ 재출시

    - 어프로치 S70, 국내 코스 그린 등고선 데이터 탑재 모델로 재출시 - 전 세계 43,000개 이상의 골프 코스 풀컬러 지도와 다양한 골프 및 필드 데이터 제공 - 가상 캐디 기능과 풍속·풍향 데이터를 통해 더욱 쉽게 정확한 샷 구사 가능 - 강력한 배터리 수명을...
    Date2024.03.27 Bynewsit Views154
    Read More
  5. 리미니스트리트, 오라클 데이터베이스 이용 현황 조사 <데이터베이스 로드맵의 미래를 주도하는 힘> 발표

    - 현재 버전에 만족하지만 유지보수에 필요한 비용과 시스템 관리, 정기적인 업그레이드에 어려움 리미니스트리트(Rimini Street)는 오늘, 미국 IT 관리자들을 대상으로 오라클 데이터베이스 이용 현황을 조사한 <오라클 데이터베이스 로드맵의 미래를 주도하...
    Date2024.03.27 Bynewsit Views358
    Read More
  6. SAP 석세스팩터스, ‘SAP HR 커넥트 2024’ 성료

    - 온프레미스 HCM 솔루션을 클라우드로 이전해 기업 민첩성, 운영 효율성, 혁신성 확보 - LG CNS, LG 이노텍, 한독, 두산디지털이노베이션 등 국내 고객 사례 공개 SAP는 클라우드 HCM(인적자본관리) 솔루션 SAP 석세스팩터스(SAP SuccessFactors)가 국내 기업...
    Date2024.03.27 Bynewsit Views422
    Read More
  7. 마이크로스트레티지, 뉴질랜드 오클랜드 대학교에 BI 분석 플랫폼 구축

    - 6,000명 이상의 사용자가 마이크로스트레티지 클라우드 분석을 통해 최고의 사용자 경험 구현 마이크로스트레티지 코리아는 오늘, 뉴질랜드 오클랜드 대학교에 자사의 비즈니스 인텔리전스(BI) 분석 플랫폼을 구축했다고 밝혔다. 오클랜드 대학교는 뉴질랜드...
    Date2024.03.27 Bynewsit Views336
    Read More
  8. 한국레노버, 「씽크스테이션 P8」 출시!…“AMD 라이젠 스레드리퍼 프로 7000 WX 시리즈 탑재”

    - 싱글 CPU로 최대 96개 코어, 192개 스레드...AI 워크로드를 위한 솔루션 제공 - 최대 3개 엔비디아 RTX 6000 에이다 제너레이션 GPU 지원 한국레노버가 AMD와 엔비디아의 혁신적 컴퓨팅 아키텍처에 레노버의 탁월한 신뢰성과 혁신을 더한 ‘씽크스테이션 P8’ ...
    Date2024.03.26 Bynewsit Views164
    Read More
  9. 서비스나우, 국내 금융 업계의 AI 기반 플랫폼 IT 혁신 지원 본격화

    - 서비스나우, EY한영 -메가존클라우드와 파트너 네트워크 강화 더 나은 업무 환경을 제공하는 디지털 비즈니스 플랫폼 서비스나우(ServiceNow)가 국내 금융 업계를 지원하기 위해 파트너십을 강화한다고 밝혔다. 파트너십 강화를 위해, 서비스나우는 EY한영 ...
    Date2024.03.26 Bynewsit Views300
    Read More
  10. 다쏘시스템, 아레나에 ‘3D익스피리언스 웍스 솔루션’ 적용…“빠르고 지속가능한 프로토타입 제작 지원”

    - 아레나, 협업, 생산성 및 품질 향상위해 다쏘시스템 3D익스피리언스 웍스 적용… 클라우드 기반 설계 및 시뮬레이션 기능으로 아레나 수경 프로토타입 제작 주기 70% 단축, 탄소배출량 감소 - 중소기업에 최적화된 3D익스피리언스 웍스, 클라우드 기반 버추얼...
    Date2024.03.26 Bynewsit Views281
    Read More
  11. 헥사곤, 신규 구조광 스캐너 ‘스마트 스캔 VR800’ SIMTOS 2024에서 공개…“업계 최초 스마트 줌 기능 탑재”

    - 13회째 SIMTOS 2024 참가...글로벌 제조 특화 디지털 리얼리티 솔루션 및 신제품 데모 제공 - 이달 출시한 공정별 맞춤 스캐너 및 스캐닝 솔루션도 전시 헥사곤 매뉴팩처링 인텔리전스가 2024년 4월 1일부터 5일까지 일산 킨텍스에서 열리는 국내 최대 생산 ...
    Date2024.03.26 Bynewsit Views383
    Read More
  12. 델, 합리적인 노트북 ‘인스피론16/14’ 신제품 공개…“신규 보안 모듈 탑재”

    - ‘인스피론 16 5640’, 강력한 하드웨어 신규 보안 기능을 갖춘 메인스트림급 16인치 대화면 노트북 - ‘인스피론 16 5645’, 일상적인 업무를 안심하고 처리할 수 있는 AI 기반의 합리적인 16인치 AMD 노트북 - '인스피론 14 5440', 이동이 잦은 사용자에게 최...
    Date2024.03.26 Bynewsit Views155
    Read More
  13. 카테노이드, 숏폼 비디오 플랫폼 ‘찰나’에 ‘숏폼 모아보기’ 기능 신규 출시

    - 자사몰 숏폼 콘텐츠로만 구성한 재생목록…브랜드 인지도 향상 및 시청자 이탈 방지 - 다양한 PCž모바일 디바이스의 디스플레이별 맞춤형 레이아웃 제공 - 제품 구매 링크로 연동되는 상품 배너… 시청자 구매 전환율↑ 국내 최대 서비스형 비디오 테크놀로지(V...
    Date2024.03.26 Bynewsit Views408
    Read More
  14. 테스트웍스, '전국 도로시설물 영상정보 데이터' 구축 성공 수행…“AI 학습용 데이터 구축사업 우수 평가”

    테스트웍스는 오늘, '인공지능(AI) 학습용 데이터 구축 사업'에서 '전국 도로시설물 영상정보 데이터' 구축을 성공적으로 수행했다고 밝혔다. 테스트웍스가 주관기업으로 참여한 '전국 도로시설물 영상정보 데이터' 과제는 다양한 도로 환경에서의 도로시설물 ...
    Date2024.03.26 Bynewsit Views416
    Read More
  15. 유아이패스, ‘AI 서밋 2024’서 기업의 AI 혁신 가속화 지원 발표..."차세대 LLM 제품군 공개"

    - 유아이패스 AI 트러스트 레이어의 신기능 ‘컨텍스트 그라운딩’ 출시 - 비즈니스별 세부 데이터, IBM 왓슨X AI 커넥터, 오토파일럿 업데이트 통해 생성형 AI 모델 고도화 유아이패스가 3월 19일 진행된 ‘AI 서밋’에서 AI의 잠재력을 극대화하는 생성형 AI 신...
    Date2024.03.25 Bynewsit Views284
    Read More
  16. No Image

    미르, AI 기반 ‘MiR1200 팔레트 잭’ 자율이동로봇으로 혁신적인 팔레트 물류 자동화 지원

    자율이동로봇(AMR) 시장의 선도 제조업체인 미르(MiR)는 새로운 자율이동로봇인 ‘MiR1200 팔레트 잭(Pallet Jack)’을 출시한다고 밝혔다. 엔비디아 젯슨 AGX 오린(NVIDIA Jetson AGX Orin)으로 구동되는 첨단 AI 기반 팔레트 감지 기능이 적용된 MiR1200 팔레...
    Date2024.03.25 Bynewsit Views345
    Read More
  17. 가민코리아, 봄 시즌 맞아 ‘SPRING SALE’ 프로모션 이벤트

    - 3월 25일부터 4월 8일까지 15일간 봄 시즌 ‘SPRING SALE’ 프로모션, 최대 40% 할인 혜택 - 웰니스 스마트워치 ‘베뉴 3’와 ‘비보액티브 5’, 러기드 스마트워치 ‘인스팅트 2X 솔라’ 등 웰니스와 아웃도어 액티비티에 특화된 제품 세일 진행 가민은 본격 봄 시...
    Date2024.03.25 Bynewsit Views164
    Read More
  18. ASUS, 990g 초경량 14인치 비즈니스 노트북 ‘ExpertBook B9 OLED’ 출시

    - ExpertBook B9 OLED, 세계에서 가장 가벼운 14인치 프리미엄 비즈니스 노트북 - 990g의 초경량 바디로 우수한 휴대성에 미국 밀리터리 등급 표준을 충족하는 견고한 내구성 겸비 - 최대 400 니트의 밝기와 sRGB 100%의 색 재현력 갖춘 14인치 OLED 디스플레...
    Date2024.03.25 Bynewsit Views197
    Read More
  19. 로지텍, 왼손용 인체공학 버티컬 마우스 ‘Lift Left’& 인체공학 웨이브 키보드 ‘Wave Keys’ 신규 컬러 출시

    - 인체공학 키보드 · 마우스의 새로운 옵션 공개, 소비자 선택지 확대 - 국내 사무용 마우스 판매 1위 ‘Lift’의 왼손용 버전 ‘Lift Left’ 출시, 사용자 편의성 높여 - 인체공학적 웨이브 디자인과 일체형 키 프레임의 Wave Keys, 로즈핑크 컬러 추가 로지텍은 ...
    Date2024.03.25 Bynewsit Views130
    Read More
  20. 잘만, 디지털 CPU온도계 탑재한 CPU쿨러 「CNPS13X DS」 블랙 출시

    잘만테크가 CPU온도 표시 탑커버를 갖춘 신제품 공랭쿨러 CNPS13X DS를 출시했다고 밝혔다. CNPS13X DS 쿨러는 5개의 6mm급 히트파이프의 RDTH타입 베이스 히트싱크와 새롭게 개발한 신형 팬 ZM-AF120 PWM 슈라우드링 샤크핀팬을 적용했다. CNPS13X DS 쿨러의 ...
    Date2024.03.22 Bynewsit Views125
    Read More
Board Pagination Prev 1 ... 135 136 137 138 139 140 141 142 143 144 ... 271 Next
/ 271
CLOSE