- 기업 맞춤 생성형 AI 개발과 튜닝 강화하는 엔드 투 엔드 솔루션 제공

- SAP, 암독스, 게티 이미지 등 선두업체들, LLM 구축 위해 AI 파운드리 서비스 적극 활용

엔비디아, 마이크로소프트 애저에서 생성형 AI 파운드리 서비스 제공.jpg

 

엔비디아가 마이크로소프트 애저(Microsoft Azure) AI 파운드리 서비스를 제공한다고 밝혔다. 이는 스타트업을 포함한 기업들에게 맞춤 생성형 AI 애플리케이션의 개발과 튜닝 강화를 제공한다.

 

엔비디아(NVIDIA) AI 파운드리 서비스는 엔비디아 AI 파운데이션 모델(AI Foundation Models), 엔비디아 네모 프레임워크(NeMo Framework), 엔비디아 DGX 클라우드(DGX Cloud) AI 슈퍼컴퓨팅 서비스를 통합해 기업이 맞춤 생성형 AI 모델을 제작할 수 있는 엔드 투 엔드 솔루션을 제공한다. 이를 통해 기업들은 지능형 검색, 요약, 콘텐츠 생성 등을 지원하는 생성형 AI 애플리케이션의 구동을 위해 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어와 함께 맞춤형 모델을 배포할 수 있다.

 

업계 선두주자인 SAP SE, 암독스(Amdocs), 게티 이미지(Getty Images)는 해당 서비스를 사용해 맞춤형 모델을 구축하고 있다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 “기업들은 각 기업의 고유한 DNA, 즉 데이터를 기반으로 훈련된 전문 기술을 수행하기 위한 맞춤형 모델이 필요하다”고 설명하고, “엔비디아 AI 파운드리 서비스는 엔비디아의 생성형 AI 모델 기술, 대규모 언어 모델(LLM) 트레이닝 전문성, 대규모 AI 팩토리를 통합한다. 우리는 이것을 마이크로소프트 애저에 구축해 전 세계 기업들이 맞춤형 모델을 마이크로소프트의 세계 최고 클라우드 서비스와 연결할 수 있도록 했다"고 밝혔다. 

 

마이크로소프트 CEO 사티아 나델라(Satya Nadella)는 “엔비디아와의 파트너십은 실리콘부터 소프트웨어까지 코파일럿(Copilot) 스택의 모든 계층을 아우르며, 새로운 AI 시대를 위해 함께 혁신하고 있다. 엔비디아의 생성형 AI 파운드리 서비스를 통해 마이크로소프트 애저에서 스타트업을 포함한 기업이 클라우드를 기반으로 AI 애플리케이션을 구축하고 배포할 수 있는 새로운 기능을 제공한다”고 덧붙였다.

 

적절한 시기에 맞춤형 LLM을 구축하는 업계 리더들

엔비디아 AI 파운드리 서비스는 엔터프라이즈 소프트웨어, 통신, 미디어를 비롯한 산업 전반에서 생성형 AI 기반 애플리케이션용 모델을 맞춤 설정하는 데 사용 가능하다. 배포 준비가 완료되면 기업은 RAG(Retrieval Augmented Generation: 검색 증강 생성) 기술을 사용해 모델을 엔터프라이즈 데이터와 연결하고 새로운 인사이트에 접근할 수 있다.

 

 

SAP는 마이크로소프트 애저 기반 엔비디아 DGX 클라우드의 첫 번째 고객이다. SAP는 이 서비스와 최적화된 RAG 워크플로우를 엔비디아 DGX 클라우드, 엔비디아 AI 엔터프라이즈 소프트웨어와 함께 사용할 계획이다. 이들은 애저에서 실행되어 새로운 자연어 생성 AI 코파일럿인 쥴(Joule)을 맞춤화하고 배포하도록 지원한다.

 

SAP SE의 CEO 크리스찬 클라인(Christian Klein)은 “쥴은 비즈니스와 기술의 접점에서 SAP의 독보적인 입지를 활용하고, 비즈니스 AI에 대해 적절하고 신뢰할 수 있으며 책임감 있는 접근 방식을 기반으로 제작됐다. 쥴은 엔비디아와의 파트너십을 통해 오랜 시간이 소요되는 작업을 자동화하고 데이터를 빠르게 분석해 보다 지능적이고 개인화된 경험을 제공한다. 이로써 고객이 비즈니스에 생성형 AI의 잠재력을 실현할 수 있도록 지원한다”고 밝혔다.

 

통신, 미디어 기업에 소프트웨어와 서비스를 제공하는 선도적 기업인 암독스는 전 세계 통신업체의 생성형 AI 애플리케이션과 서비스 채택을 가속화하기 위해 암독스 어메이즈(amAIz) 프레임워크에 대한 모델을 최적화하고 있다.

 

암독스 회장 겸 CEO인 슈키 셰퍼(Shuky Sheffer)는 "생성형 AI는 서비스 공급업체가 고객과의 소통 방식을 재창조할 수 있는 놀라운 기회를 제공한다. 엔비디아와 마이크로소프트의 기술을 활용해 암독스 어메이즈 프레임워크를 강화함으로써 새로운 생성형 AI 기반 애플리케이션을 고객에게 더 빠르게 제공할 수 있다. 또한, 엔터프라이즈급 보안, 안정성, 성능 등을 제공하는 동시에 생성형 AI의 엄청난 잠재력을 활용할 수 있게 될 것"이라고 강조했다.

 

맞춤 생성형AI를 위해 엄선된 최적화 모델

엔비디아 파운드리 서비스를 사용하는 고객은 애저 AI 모델 카탈로그에서 제공되는 여러 엔비디아 AI 파운데이션 모델 중에서 모델을 선택할 수 있다. 여기에는 새로운 엔비디아 네모트론-3 8B 모델(Nemotron-3 8B models) 제품군이 포함된다. 개발자는 엔비디아 NGC 카탈로그에서 네모트론-3 8B 모델에 접속 가능하다. 아울러 가속 컴퓨팅을 위해 엔비디아에 최적화된 메타(Meta)의 라마2(Llama 2)와 같은 커뮤니티 모델도 애저 AI 모델 카탈로그에 곧 제공될 예정이다.

 

80억 개의 파라미터로 최적화된 네모트론-3 8B 제품군에는 다양한 사용 사례에 맞게 설정된 버전이 포함돼 있다. 또한, 맞춤형 엔터프라이즈 생성형 AI 애플리케이션을 구축할 수 있는 다국어 기능도 갖추고 있다.

 

마이크로소프트 애저 마켓플레이스에서 엔비디아 DGX 클라우드 이용 가능

엔비디아 DGX 클라우드 AI 슈퍼컴퓨팅은 현재 애저 마켓플레이스에서 이용 가능하다. 사용자가 대여할 수 있는 인스턴스를 통해 수천 개의 엔비디아 텐서 코어 GPU(Tensor Core GPUs)로 확장 가능하다. 더불어, LLM 맞춤 설정을 가속화할 수 있도록 네모를 포함한 엔비디아 AI 엔터프라이즈 소프트웨어가 함께 제공된다.

 

애저 마켓플레이스에 DGX 클라우드가 추가됨에 따라 애저 고객은 기존 마이크로소프트 애저 소비 약정 크레딧으로 엔비디아 AI 슈퍼컴퓨팅과 소프트웨어을 활용해 모델 개발 속도를 높일 수 있다.

 

엔비디아 AI 엔터프라이즈 소프트웨어가 애저 머신 러닝에 통합되면서 안전하고 안정적이며 지원 가능한 엔비디아 AI, 데이터 사이언스 소프트웨어 플랫폼이 추가됐다. 이로써 네모와 엔비디아 트리톤 추론 서버(Triton Inference Server)가 애저의 엔터프라이즈급 AI 서비스에 포함됐다.

 

아울러 전 세계 기업들에게 제작 준비가 완료된 AI 개발과 맞춤 생성형 AI 애플리케이션 배포를 위해 폭넓은 옵션을 제공하는 엔비디아 AI 엔터프라이즈를 애저 마켓플레이스에서 사용할 수 있다.

 

#엔비디아#MS#애저#AI#네모트론#트리톤#추론#

?

  1. 에미레이트 항공, 롤스로이스 ‘트렌트 XWB-84’ 탑재 에어버스 A350-900 15대 발주

    롤스로이스(Rolls-Royce)는 에미레이트 항공(Emirates)이 자사의 트렌트(Trent) XWB-84 엔진을 탑재한 A350-900기 15대를 발주했다고 밝혔다. 이로써 트렌트 XWB 제품군의 총 수주량은 130대로 증가했으며, 금번 수주분의 납품은 2025년부터 시작될 예정이다. ...
    Date2023.11.20 Bynewsit Views157
    Read More
  2. SAP 석세스팩터스, ‘SAP HR 커넥트 서울 2023’ 성료

    - 생성형 AI 코파일럿 ‘쥴(Joule)’ 적용으로 직원 경험 향상 및 HR 업무 생산성 강화 - 현대자동차그룹 싱가폴 글로벌 혁신센터, LG에너지솔루션, GC녹십자,㈜씨젠, 우미건설, 등 고객 사례 공개 - SAP 석세스팩터스 코리아 유저 그룹(Korea SAP SuccessFactor...
    Date2023.11.17 Bynewsit Views401
    Read More
  3. 마우저, FIRST 설립자 ‘딘 케이먼’과의 단독 인터뷰 공개

    - 마우저, 2014년부터 FIRST 후원, 2022년부터 2년 연속으로 FIRST 한국 대표팀 선발하는 KRC 후원 마우저 일렉트로닉스(Mouser Electronics)는 매년 수십만 명의 청소년들을 대상으로 과학, 기술, 공학 및 수학(STEM) 분야의 인재를 육성하고, 일상의 기술 발...
    Date2023.11.17 Bynewsit Views339
    Read More
  4. 벤큐, 2024 수능 대박 기원 스크린바 모니터 조명 시리즈 반짝 이벤트 진행

    - 벤큐 네이버 브랜드 스토어, 벤큐 온라인 자사몰 단독 진행 - 벤큐 스크린바, 스크린바 헤일로 1만원 할인 (11.17~11.23) 벤큐는 지난 16일 마무리된 2024 수능을 응원하는 마음으로 벤큐 아이케어 스크린바 시리즈 반짝 이벤트를 진행한다고 밝혔다. 2024 ...
    Date2023.11.17 Bynewsit Views176
    Read More
  5. 로지텍, 전국 이마트 및 일렉트로마트 127개 지점에서 ‘로지텍 G 럭키박스 이벤트’ 진행

    - 17일부터 전국 이마트 및 일렉트로마트 127개 지점에서 오프라인 이벤트 진행 - 럭키박스 당첨 시 최신 무선 게이밍 마우스 ‘PRO X SUPERLIGHT 2’를 얻을 수 있는 기회 제공 - 공식 페이스북 채널을 통해 럭키박스 구매 인증 시 추첨을 통해 30만원 상당의 ...
    Date2023.11.17 Bynewsit Views273
    Read More
  6. 델, AI 워크로드용 96코어 고성능 워크스테이션 「델 프리시전 7875 타워」 공개

    - 최대 96코어의 AMD 라이젠 스레드리퍼 프로 7900 WX 시리즈 프로세서를 탑재해 AI 워크로드 수행하는 강력한 성능과 확장성 제공 - 6개의 PCIe 슬롯을 지원해 강력한 멀티 GPU 역량을 지원하고 델 프리시전 타워형 제품 최초로 통합 Wi-Fi 슬롯 탑재 - TPM 2...
    Date2023.11.17 Bynewsit Views220
    Read More
  7. 엔비디아, MS 애저에서 생성형 AI 파운드리 서비스 제공

    - 기업 맞춤 생성형 AI 개발과 튜닝 강화하는 엔드 투 엔드 솔루션 제공 - SAP, 암독스, 게티 이미지 등 선두업체들, LLM 구축 위해 AI 파운드리 서비스 적극 활용 엔비디아가 마이크로소프트 애저(Microsoft Azure)에 AI 파운드리 서비스를 제공한다고 밝혔다...
    Date2023.11.16 Bynewsit Views463
    Read More
  8. [지스타 2023] 벤큐 모비우스, ‘지스타 2023’ 게이밍 모니터 협찬

    - 벤큐 모비우스 EX3210U/EX2710Q/EX270M 3종 후원 벤큐는 자사의 프리미엄 게이밍 모니터 브랜드 모비우스(MOBIUZ) 제품을 오는 16일부터 열리는 국제 게임 전시회 ‘지스타 2023’의 협력사 부스에 협찬 참여를 통해 선보인다고 밝혔다. 이번 전시에서 벤큐는 ...
    Date2023.11.16 Bynewsit Views165
    Read More
  9. 사피온, 데이터센터용 AI 반도체 ‘X330’ 출시…“4배 빨라진 추론 성능을 바탕으로 시장공략 본격화”

    - 기존 X220 대비 성능을 4배이상 향상시킨 추론용 AI반도체, 글로벌 탑티어 NPU성능 글로벌 AI 반도체 기업 사피온은 오늘, 전작 대비 속도가 4배 향상된 데이터센터용 AI반도체 ‘X330’ 을 출시한다고 밝혔다. X330은 TSMC의 7나노공정을 통해 생산된 제품이...
    Date2023.11.16 Bynewsit Views307
    Read More
  10. [지스타 2023] 삼성전자, 오디세이 게이밍 모니터 신제품 3종 체험존 구성

    삼성전자는 오디세이 모니터를 통해 16일부터 19일까지 나흘간 부산 벡스코에서 열리는 국내 최대 게임쇼 ‘지스타(G-STAR) 2023’에서 다양한 게임들을 경험할 수 있다고 밝혔다. 삼성전자는 게임 파트너사들과 함께 오디세이 체험존을 마련하고, 올해 출시한 ...
    Date2023.11.16 Bynewsit Views131
    Read More
  11. Arm, 업계 리더들과 협력 통해 미래의 AI 기반 구축

    인공지능(AI)의 확산은 하드웨어와 소프트웨어 혁신 간의 지속적인 조율에 달려 있다. 이러한 결합은 엣지에서 워크로드를 실행하는 가장 작은 센서부터 대형 언어 모델(LLMs) 학습을 위해 복잡한 워크로드를 처리하는 가장 큰 서버에 이르기까지 모든 기술의 ...
    Date2023.11.16 Bynewsit Views333
    Read More
  12. 어플라이드 머티어리얼즈 코리아, GPTW 선정 ‘2023-2024 밀레니얼이 가장 일하기 좋은 기업’ 수상

    - 지난 9월 ‘2023년 대한민국 일하기 좋은 일터’ 인증… 좋은 기업문화 입증 어플라이드 머티어리얼즈 코리아가 글로벌 신뢰경영 평가 기관 GPTW(Great Place to Work Institute) 선정 ‘2023-2024 밀레니얼이 가장 일하기 좋은 기업'을 수상했다. GPTW가 주관하...
    Date2023.11.16 Bynewsit Views266
    Read More
  13. 지멘스, ‘인사이트EDA’ 인수…“캘리버(Calibre) IC 신뢰성 검증 제품군 강화”  

    - 인사이트EDA 인수로 고객은 설계 신뢰성 검증 및 분석 능력을 IC 설계 업무 전반에 손쉽게 추가 가능 지멘스 EDA 사업부는 오늘, 인사이트 EDA(Insight EDA)를 인수 완료했다고 발표했다. 인사이트 EDA는 세계 유수의 IC 설계 팀들에 획기적인 회로 신뢰성 ...
    Date2023.11.16 Bynewsit Views212
    Read More
  14. 슈퍼마이크로, 글로벌 제조 시설 통해 랙 솔루션 생산 월 5000개로 확대

    - 랙 당 최대 100kW의 최신 AI 및 맞춤형 HPC 기술 제공, 생산 및 배송 시간 단축 - 최신 수냉식 냉각 솔루션 지원 및 생산 시설 확장 슈퍼마이크로컴퓨터(SMCI)가 AI 및 HPC 랙 공급량과 최신 수랭식 냉각 솔루션을 강화한다고 밝혔다. 슈퍼마이크로의 랙 스...
    Date2023.11.16 Bynewsit Views215
    Read More
  15. No Image

    이글루코퍼레이션, ‘SPiDER SOAR’ 국내 1호 국정원 인증 SOAR 솔루션

    - SOAR 솔루션 최초 국가정보원 보안기능확인서 획득 - SPiDER SOAR, 사이버 위협 대응 자동화 구현해 보안 운영 효율성 증대 - 이글루코퍼레이션, 고유의 SOAR 특허 기술과 활용도 높은 플레이북 토대로 SOAR 공급 확대 이글루코퍼레이션이 보안기능확인서 인...
    Date2023.11.16 Bynewsit Views165
    Read More
  16. 엔비디아, 40개 이상 AI 슈퍼컴퓨터에 '엔비디아 그레이스 호퍼' 슈퍼칩 탑재 전망

    - SC23서 엔비디아 그레이스 호퍼 슈퍼칩 탑재한 HPE 크레이 EX2500 슈퍼컴퓨터 출시 발표 - 람다, 벌쳐 등 클라우드 서비스 제공업체에서 GH200 얼리 액세스로 이용 가능 엔비디아는 '엔비디아 GH200 그레이스 호퍼 슈퍼칩'을 탑재한 슈퍼컴퓨터 수십 대가 온...
    Date2023.11.15 Bynewsit Views505
    Read More
  17. 가민, 손목 위 든든한 건강 피트니스 코치 '베뉴 3/비보액티브 5' 웰니스 출시

    - 베뉴 3 시리즈와 비보액티브 5, 밝고 다채로운 컬러의 AMOLED 터치스크린 탑재 - 개인화된 웰니스 인사이트와 고급 피트니스 기능을 통해 건강한 라이프스타일 지원 - 새롭게 추가된 수면 코치와 낮잠 감지 기능을 통해 수면 건강 관리에 특화 - 긴 배터리 ...
    Date2023.11.15 Bynewsit Views211
    Read More
  18. 네이버, ‘세종’ 슈퍼컴퓨터에 엔비디아 A100 텐서 코어 GPU 탑재

    - 슈퍼컴퓨터 ‘세종’, 엔비디아 A100 텐서 코어 GPU 2,240개로 구성 - 전 세계 슈퍼컴퓨터 순위 발표하는 ‘톱 500’에서 22위 차지 - 23년 11월 기준, 국내 슈퍼컴퓨터 중 최고 성능, 최고 랭킹 수준 기록 엔비디아는 ’엔비디아 A100 텐서 코어 GPU’가 네이버 ...
    Date2023.11.15 Bynewsit Views479
    Read More
  19. 안랩, 글로벌 보안제품 대상 ‘마이터어택 평가’에서 상위권 위협 차단율 기록

    - 2023 마이터어택(Round 5) 평가: 공격 그룹 ‘툴라(Turla)’의 실제 공격 기법과 전술 기반으로 탐지(Detection) 및 차단(Protection) 부문으로 나눠 세분화된 공격 단계에 대한 ▲차단 및 탐지 여부 ▲상세 분석 정보 수준 등을 다면적으로 평가 - ‘안랩 EPP’: ...
    Date2023.11.15 Bynewsit Views163
    Read More
  20. 스펙트럼 인스트루먼트, 디지털 파형 발생기 기능 출시…“초고속 디지타이저 및 AWG에 적용”

    - 초고속 제품군 신규 옵션 제공으로 스펙트럼 전 제품군에 DPG 옵션 도입 - 자극 및 트리거 신호를 생성을 위한 4개의 독립적인 디지털 소스 추가 스펙트럼 인스트루먼트가 초고속 디지타이저(최대 10GS/s)와 AWG(Arbitrary Waveform Generator)에 디지털파형...
    Date2023.11.15 Bynewsit Views337
    Read More
Board Pagination Prev 1 ... 139 140 141 142 143 144 145 146 147 148 ... 249 Next
/ 249
CLOSE