- 기업 맞춤 생성형 AI 개발과 튜닝 강화하는 엔드 투 엔드 솔루션 제공

- SAP, 암독스, 게티 이미지 등 선두업체들, LLM 구축 위해 AI 파운드리 서비스 적극 활용

엔비디아, 마이크로소프트 애저에서 생성형 AI 파운드리 서비스 제공.jpg

 

엔비디아가 마이크로소프트 애저(Microsoft Azure) AI 파운드리 서비스를 제공한다고 밝혔다. 이는 스타트업을 포함한 기업들에게 맞춤 생성형 AI 애플리케이션의 개발과 튜닝 강화를 제공한다.

 

엔비디아(NVIDIA) AI 파운드리 서비스는 엔비디아 AI 파운데이션 모델(AI Foundation Models), 엔비디아 네모 프레임워크(NeMo Framework), 엔비디아 DGX 클라우드(DGX Cloud) AI 슈퍼컴퓨팅 서비스를 통합해 기업이 맞춤 생성형 AI 모델을 제작할 수 있는 엔드 투 엔드 솔루션을 제공한다. 이를 통해 기업들은 지능형 검색, 요약, 콘텐츠 생성 등을 지원하는 생성형 AI 애플리케이션의 구동을 위해 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어와 함께 맞춤형 모델을 배포할 수 있다.

 

업계 선두주자인 SAP SE, 암독스(Amdocs), 게티 이미지(Getty Images)는 해당 서비스를 사용해 맞춤형 모델을 구축하고 있다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 “기업들은 각 기업의 고유한 DNA, 즉 데이터를 기반으로 훈련된 전문 기술을 수행하기 위한 맞춤형 모델이 필요하다”고 설명하고, “엔비디아 AI 파운드리 서비스는 엔비디아의 생성형 AI 모델 기술, 대규모 언어 모델(LLM) 트레이닝 전문성, 대규모 AI 팩토리를 통합한다. 우리는 이것을 마이크로소프트 애저에 구축해 전 세계 기업들이 맞춤형 모델을 마이크로소프트의 세계 최고 클라우드 서비스와 연결할 수 있도록 했다"고 밝혔다. 

 

마이크로소프트 CEO 사티아 나델라(Satya Nadella)는 “엔비디아와의 파트너십은 실리콘부터 소프트웨어까지 코파일럿(Copilot) 스택의 모든 계층을 아우르며, 새로운 AI 시대를 위해 함께 혁신하고 있다. 엔비디아의 생성형 AI 파운드리 서비스를 통해 마이크로소프트 애저에서 스타트업을 포함한 기업이 클라우드를 기반으로 AI 애플리케이션을 구축하고 배포할 수 있는 새로운 기능을 제공한다”고 덧붙였다.

 

적절한 시기에 맞춤형 LLM을 구축하는 업계 리더들

엔비디아 AI 파운드리 서비스는 엔터프라이즈 소프트웨어, 통신, 미디어를 비롯한 산업 전반에서 생성형 AI 기반 애플리케이션용 모델을 맞춤 설정하는 데 사용 가능하다. 배포 준비가 완료되면 기업은 RAG(Retrieval Augmented Generation: 검색 증강 생성) 기술을 사용해 모델을 엔터프라이즈 데이터와 연결하고 새로운 인사이트에 접근할 수 있다.

 

 

SAP는 마이크로소프트 애저 기반 엔비디아 DGX 클라우드의 첫 번째 고객이다. SAP는 이 서비스와 최적화된 RAG 워크플로우를 엔비디아 DGX 클라우드, 엔비디아 AI 엔터프라이즈 소프트웨어와 함께 사용할 계획이다. 이들은 애저에서 실행되어 새로운 자연어 생성 AI 코파일럿인 쥴(Joule)을 맞춤화하고 배포하도록 지원한다.

 

SAP SE의 CEO 크리스찬 클라인(Christian Klein)은 “쥴은 비즈니스와 기술의 접점에서 SAP의 독보적인 입지를 활용하고, 비즈니스 AI에 대해 적절하고 신뢰할 수 있으며 책임감 있는 접근 방식을 기반으로 제작됐다. 쥴은 엔비디아와의 파트너십을 통해 오랜 시간이 소요되는 작업을 자동화하고 데이터를 빠르게 분석해 보다 지능적이고 개인화된 경험을 제공한다. 이로써 고객이 비즈니스에 생성형 AI의 잠재력을 실현할 수 있도록 지원한다”고 밝혔다.

 

통신, 미디어 기업에 소프트웨어와 서비스를 제공하는 선도적 기업인 암독스는 전 세계 통신업체의 생성형 AI 애플리케이션과 서비스 채택을 가속화하기 위해 암독스 어메이즈(amAIz) 프레임워크에 대한 모델을 최적화하고 있다.

 

암독스 회장 겸 CEO인 슈키 셰퍼(Shuky Sheffer)는 "생성형 AI는 서비스 공급업체가 고객과의 소통 방식을 재창조할 수 있는 놀라운 기회를 제공한다. 엔비디아와 마이크로소프트의 기술을 활용해 암독스 어메이즈 프레임워크를 강화함으로써 새로운 생성형 AI 기반 애플리케이션을 고객에게 더 빠르게 제공할 수 있다. 또한, 엔터프라이즈급 보안, 안정성, 성능 등을 제공하는 동시에 생성형 AI의 엄청난 잠재력을 활용할 수 있게 될 것"이라고 강조했다.

 

맞춤 생성형AI를 위해 엄선된 최적화 모델

엔비디아 파운드리 서비스를 사용하는 고객은 애저 AI 모델 카탈로그에서 제공되는 여러 엔비디아 AI 파운데이션 모델 중에서 모델을 선택할 수 있다. 여기에는 새로운 엔비디아 네모트론-3 8B 모델(Nemotron-3 8B models) 제품군이 포함된다. 개발자는 엔비디아 NGC 카탈로그에서 네모트론-3 8B 모델에 접속 가능하다. 아울러 가속 컴퓨팅을 위해 엔비디아에 최적화된 메타(Meta)의 라마2(Llama 2)와 같은 커뮤니티 모델도 애저 AI 모델 카탈로그에 곧 제공될 예정이다.

 

80억 개의 파라미터로 최적화된 네모트론-3 8B 제품군에는 다양한 사용 사례에 맞게 설정된 버전이 포함돼 있다. 또한, 맞춤형 엔터프라이즈 생성형 AI 애플리케이션을 구축할 수 있는 다국어 기능도 갖추고 있다.

 

마이크로소프트 애저 마켓플레이스에서 엔비디아 DGX 클라우드 이용 가능

엔비디아 DGX 클라우드 AI 슈퍼컴퓨팅은 현재 애저 마켓플레이스에서 이용 가능하다. 사용자가 대여할 수 있는 인스턴스를 통해 수천 개의 엔비디아 텐서 코어 GPU(Tensor Core GPUs)로 확장 가능하다. 더불어, LLM 맞춤 설정을 가속화할 수 있도록 네모를 포함한 엔비디아 AI 엔터프라이즈 소프트웨어가 함께 제공된다.

 

애저 마켓플레이스에 DGX 클라우드가 추가됨에 따라 애저 고객은 기존 마이크로소프트 애저 소비 약정 크레딧으로 엔비디아 AI 슈퍼컴퓨팅과 소프트웨어을 활용해 모델 개발 속도를 높일 수 있다.

 

엔비디아 AI 엔터프라이즈 소프트웨어가 애저 머신 러닝에 통합되면서 안전하고 안정적이며 지원 가능한 엔비디아 AI, 데이터 사이언스 소프트웨어 플랫폼이 추가됐다. 이로써 네모와 엔비디아 트리톤 추론 서버(Triton Inference Server)가 애저의 엔터프라이즈급 AI 서비스에 포함됐다.

 

아울러 전 세계 기업들에게 제작 준비가 완료된 AI 개발과 맞춤 생성형 AI 애플리케이션 배포를 위해 폭넓은 옵션을 제공하는 엔비디아 AI 엔터프라이즈를 애저 마켓플레이스에서 사용할 수 있다.

 

#엔비디아#MS#애저#AI#네모트론#트리톤#추론#

?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
781 다쏘시스템, 솔리드웍스(SOLIDWORKS) 2024 출시…“보다 빠르고 스마트한 협업 경험 제공” - 솔리드웍스 2024, 데이터 관리 및 공유, 협업 효율성 향상에 집중 - 3D익스피리언스 플랫폼 연결하는 클라우드 서비스 제공으로 매끄러운 협업 환경 제공 - 많... file newsit 2023.11.27 589
780 유니버설 로봇, 울산대학교 유니버설 로봇 공인인증 트레이닝센터 지정…“협동로봇 교육으로 경남지역 로봇 전문가 양성” - 국내 협동로봇 교육 통해 로봇 및 AI 시대의 주역이 될 차세대 미래 인재 양성 협동로봇 전문 기업 ‘유니버설 로봇(Universal Robots)’은 울산대학교가 유니버... file newsit 2023.11.27 508
779 유아이패스-LG CNS, AI 기반 자동화 구축 위한 전략적 파트너십 체결 글로벌 엔터프라이즈용 자동화 소프트웨어 기업 유아이패스가 DX전문기업 LG CNS와 파트너십을 강화하고 고객사들을 대상으로 제공하는 자동화 서비스를 확대한다... file newsit 2023.11.24 449
778 아스펜테크, aspenOne 최신기능 업데이트 V14.2 출시…“오퍼레이셔널 엑설런스 달성 지원” - 지속가능성 혁신, AI 기반 산업 모델, 산업 데이터 관리, 새로운 제품 통합 아스펜테크가 자산 최적화 솔루션 포트폴리오 aspenONE에서 사용할 수 있는 새로운 ... file newsit 2023.11.23 451
777 큐브리드, “클라우드 기반의 사용자 확산 및 개방형 생태계 구축에 집중” 큐브리드가 자사의 DBMS ‘큐브리드(CUBRID)’의 오픈소스 전환 15주년을 맞아 기념식을 열고 클라우드 기반의 사용자 확산 및 개방형 생태계 구축에 집중할 계획이... file newsit 2023.11.23 440
776 애드저스트, ‘2023 모바일 앱 성장 리포트’ 발간…“아시아 태평양, 모바일 앱 성장 기회의 땅” - 애드저스트, 모바일 앱 마케터와 개발자의 글로벌 사용자 획득 기회 확대 정조준 - 2,500개 앱 실적 기반으로 앱과 앱 마케팅 성과의 객관적 측정 가능한 ‘성장... file newsit 2023.11.23 568
775 지코어, AI/ML 추론 가속화 인프라 ‘엣지 AI’ 발표 - 지코어코리아, '엔비디아 H100' 기반 퍼블릭 및 프라이빗 클라우드 서비스 제공 가능한 국내 유일한 클라우드 서비스 제공 기업 지코어는 오늘, AI/ML 추론을 ... file newsit 2023.11.22 603
774 엔비디아, 새로운 스펙트럼-X 이더넷 네트워킹으로 기업 AI 워크로드 가속화 지원 - 델, HPE, 레노버 서버 라인업에 새로운 AI용 이더넷 네트워킹 기술 최초 통합 - 스펙트럼-4, 엔비디아 블루필드-3 슈퍼NIC, 가속 소프트웨어 결합해 AI 워크로... file newsit 2023.11.22 575
773 서비스나우, 나우 플랫폼의 모든 워크플로우에 생성형 AI 도입 - 나우 플랫폼 밴쿠버 릴리스의 나우 어시스트, 생성형 AI 탑재해 생산성 가속화, 경험 개선 및 민첩성 향상 - 나우 어시스트 신기능, 서비스나우 도메인 특화 LL... file newsit 2023.11.22 507
772 테스트웍스, 인공지능 데이터 검증 전문 솔루션 ‘에이디큐(ADQ)’ GS인증 1등급 획득 인공지능 데이터 검증 전문기업 테스트웍스는 인공지능 데이터 검증 전문 솔루션 ‘에이디큐(ADQ)’가 GS(Good Software) 인증 1등급을 획득했다고 22일 밝혔다. GS... file newsit 2023.11.22 566
목록
Board Pagination Prev 1 ... 139 140 141 142 143 144 145 146 147 148 ... 222 Next
/ 222
CLOSE