- 기업 맞춤 생성형 AI 개발과 튜닝 강화하는 엔드 투 엔드 솔루션 제공

- SAP, 암독스, 게티 이미지 등 선두업체들, LLM 구축 위해 AI 파운드리 서비스 적극 활용

엔비디아, 마이크로소프트 애저에서 생성형 AI 파운드리 서비스 제공.jpg

 

엔비디아가 마이크로소프트 애저(Microsoft Azure) AI 파운드리 서비스를 제공한다고 밝혔다. 이는 스타트업을 포함한 기업들에게 맞춤 생성형 AI 애플리케이션의 개발과 튜닝 강화를 제공한다.

 

엔비디아(NVIDIA) AI 파운드리 서비스는 엔비디아 AI 파운데이션 모델(AI Foundation Models), 엔비디아 네모 프레임워크(NeMo Framework), 엔비디아 DGX 클라우드(DGX Cloud) AI 슈퍼컴퓨팅 서비스를 통합해 기업이 맞춤 생성형 AI 모델을 제작할 수 있는 엔드 투 엔드 솔루션을 제공한다. 이를 통해 기업들은 지능형 검색, 요약, 콘텐츠 생성 등을 지원하는 생성형 AI 애플리케이션의 구동을 위해 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어와 함께 맞춤형 모델을 배포할 수 있다.

 

업계 선두주자인 SAP SE, 암독스(Amdocs), 게티 이미지(Getty Images)는 해당 서비스를 사용해 맞춤형 모델을 구축하고 있다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 “기업들은 각 기업의 고유한 DNA, 즉 데이터를 기반으로 훈련된 전문 기술을 수행하기 위한 맞춤형 모델이 필요하다”고 설명하고, “엔비디아 AI 파운드리 서비스는 엔비디아의 생성형 AI 모델 기술, 대규모 언어 모델(LLM) 트레이닝 전문성, 대규모 AI 팩토리를 통합한다. 우리는 이것을 마이크로소프트 애저에 구축해 전 세계 기업들이 맞춤형 모델을 마이크로소프트의 세계 최고 클라우드 서비스와 연결할 수 있도록 했다"고 밝혔다. 

 

마이크로소프트 CEO 사티아 나델라(Satya Nadella)는 “엔비디아와의 파트너십은 실리콘부터 소프트웨어까지 코파일럿(Copilot) 스택의 모든 계층을 아우르며, 새로운 AI 시대를 위해 함께 혁신하고 있다. 엔비디아의 생성형 AI 파운드리 서비스를 통해 마이크로소프트 애저에서 스타트업을 포함한 기업이 클라우드를 기반으로 AI 애플리케이션을 구축하고 배포할 수 있는 새로운 기능을 제공한다”고 덧붙였다.

 

적절한 시기에 맞춤형 LLM을 구축하는 업계 리더들

엔비디아 AI 파운드리 서비스는 엔터프라이즈 소프트웨어, 통신, 미디어를 비롯한 산업 전반에서 생성형 AI 기반 애플리케이션용 모델을 맞춤 설정하는 데 사용 가능하다. 배포 준비가 완료되면 기업은 RAG(Retrieval Augmented Generation: 검색 증강 생성) 기술을 사용해 모델을 엔터프라이즈 데이터와 연결하고 새로운 인사이트에 접근할 수 있다.

 

 

SAP는 마이크로소프트 애저 기반 엔비디아 DGX 클라우드의 첫 번째 고객이다. SAP는 이 서비스와 최적화된 RAG 워크플로우를 엔비디아 DGX 클라우드, 엔비디아 AI 엔터프라이즈 소프트웨어와 함께 사용할 계획이다. 이들은 애저에서 실행되어 새로운 자연어 생성 AI 코파일럿인 쥴(Joule)을 맞춤화하고 배포하도록 지원한다.

 

SAP SE의 CEO 크리스찬 클라인(Christian Klein)은 “쥴은 비즈니스와 기술의 접점에서 SAP의 독보적인 입지를 활용하고, 비즈니스 AI에 대해 적절하고 신뢰할 수 있으며 책임감 있는 접근 방식을 기반으로 제작됐다. 쥴은 엔비디아와의 파트너십을 통해 오랜 시간이 소요되는 작업을 자동화하고 데이터를 빠르게 분석해 보다 지능적이고 개인화된 경험을 제공한다. 이로써 고객이 비즈니스에 생성형 AI의 잠재력을 실현할 수 있도록 지원한다”고 밝혔다.

 

통신, 미디어 기업에 소프트웨어와 서비스를 제공하는 선도적 기업인 암독스는 전 세계 통신업체의 생성형 AI 애플리케이션과 서비스 채택을 가속화하기 위해 암독스 어메이즈(amAIz) 프레임워크에 대한 모델을 최적화하고 있다.

 

암독스 회장 겸 CEO인 슈키 셰퍼(Shuky Sheffer)는 "생성형 AI는 서비스 공급업체가 고객과의 소통 방식을 재창조할 수 있는 놀라운 기회를 제공한다. 엔비디아와 마이크로소프트의 기술을 활용해 암독스 어메이즈 프레임워크를 강화함으로써 새로운 생성형 AI 기반 애플리케이션을 고객에게 더 빠르게 제공할 수 있다. 또한, 엔터프라이즈급 보안, 안정성, 성능 등을 제공하는 동시에 생성형 AI의 엄청난 잠재력을 활용할 수 있게 될 것"이라고 강조했다.

 

맞춤 생성형AI를 위해 엄선된 최적화 모델

엔비디아 파운드리 서비스를 사용하는 고객은 애저 AI 모델 카탈로그에서 제공되는 여러 엔비디아 AI 파운데이션 모델 중에서 모델을 선택할 수 있다. 여기에는 새로운 엔비디아 네모트론-3 8B 모델(Nemotron-3 8B models) 제품군이 포함된다. 개발자는 엔비디아 NGC 카탈로그에서 네모트론-3 8B 모델에 접속 가능하다. 아울러 가속 컴퓨팅을 위해 엔비디아에 최적화된 메타(Meta)의 라마2(Llama 2)와 같은 커뮤니티 모델도 애저 AI 모델 카탈로그에 곧 제공될 예정이다.

 

80억 개의 파라미터로 최적화된 네모트론-3 8B 제품군에는 다양한 사용 사례에 맞게 설정된 버전이 포함돼 있다. 또한, 맞춤형 엔터프라이즈 생성형 AI 애플리케이션을 구축할 수 있는 다국어 기능도 갖추고 있다.

 

마이크로소프트 애저 마켓플레이스에서 엔비디아 DGX 클라우드 이용 가능

엔비디아 DGX 클라우드 AI 슈퍼컴퓨팅은 현재 애저 마켓플레이스에서 이용 가능하다. 사용자가 대여할 수 있는 인스턴스를 통해 수천 개의 엔비디아 텐서 코어 GPU(Tensor Core GPUs)로 확장 가능하다. 더불어, LLM 맞춤 설정을 가속화할 수 있도록 네모를 포함한 엔비디아 AI 엔터프라이즈 소프트웨어가 함께 제공된다.

 

애저 마켓플레이스에 DGX 클라우드가 추가됨에 따라 애저 고객은 기존 마이크로소프트 애저 소비 약정 크레딧으로 엔비디아 AI 슈퍼컴퓨팅과 소프트웨어을 활용해 모델 개발 속도를 높일 수 있다.

 

엔비디아 AI 엔터프라이즈 소프트웨어가 애저 머신 러닝에 통합되면서 안전하고 안정적이며 지원 가능한 엔비디아 AI, 데이터 사이언스 소프트웨어 플랫폼이 추가됐다. 이로써 네모와 엔비디아 트리톤 추론 서버(Triton Inference Server)가 애저의 엔터프라이즈급 AI 서비스에 포함됐다.

 

아울러 전 세계 기업들에게 제작 준비가 완료된 AI 개발과 맞춤 생성형 AI 애플리케이션 배포를 위해 폭넓은 옵션을 제공하는 엔비디아 AI 엔터프라이즈를 애저 마켓플레이스에서 사용할 수 있다.

 

#엔비디아#MS#애저#AI#네모트론#트리톤#추론#

?

  1. 클라우드플레어, 2024년 클라우드‧ AI‧보안 주요 전망 발표

    클라우드플레어(Cloudflare)가 전 세계 최고정보책임자(CIO), 최고보안책임자(CSO) 및 IT실무진을 위한 2024년 트렌드 전망을 발표했다. 클라우드플레어는 ’AI 지식 격차’가 기업의 생산성과 수익을 판가름할 것이며, 사이버 공격이 나날이 진화하고 심화됨에 ...
    Date2023.12.06 Bynewsit Views500
    Read More
  2. 딥엘, 전 세계 가장 빠른 슈퍼컴퓨터 시스템 톱500 중 34위 차지

    - 최대 규모의 엔비디아 DGX 슈퍼팟(SuperPOD)과 DGX H100 시스템으로 연구 및 신경망 트레이닝 강화 딥엘(DeepL)이 자사의 엔비디아 기반 시스템이 슈퍼컴퓨팅 2023(SC23)에서 공개된 ‘톱500(TOP500)’에서 34위를 차지했다고 발표했다. 딥엘 시스템의 연산 능...
    Date2023.12.06 Bynewsit Views533
    Read More
  3. 세일즈포스, “국내 IT 리더 중 70%, 데이터 기반 비즈니스 운영에 어려움”

    - 한국 포함 전 세계 18개국 고객 10,000명 이상의 IT, 데이터 분석 및 비즈니스 리더 대상 조사 - 국내 IT, 분석 리더의 76%가 데이터 관리를 최우선 순위로 꼽았으나 충분히 활용하지 못해 - 70%가 데이터를 기반의 비즈니스 운영에 어려움 겪어, 30%만이 데...
    Date2023.12.05 Bynewsit Views648
    Read More
  4. SAP, 지속가능성 솔루션에 대한 국내 투자 증가세 다룬 연구 결과 발표

    - 국내 기업의 56%, 지속가능성과 경쟁력 및 수익성 사이에 긍정적인 관계가 있다고 답했으며, 이는 투자를 늘리는 기업 24%p 증가로 이어져 SAP의 최근 연구에 따르면 국내 기업들은 전반적인 비즈니스 성과가 지속가능성을 전략적 우선순위로 다루는 것과 본...
    Date2023.12.05 Bynewsit Views731
    Read More
  5. 마우저, 스마트 홈 기기 개발자를 위한 기술 리소스 사이트 공개

    마우저 일렉트로닉스(Mouser Electronics)는 모든 가정용 기기에 대한 원활한 연결, 제어 및 자동화 방법을 모색할 수 있는 포괄적인 스마트 홈 리소스 센터를 운영한다고 밝혔다. 마우저는 매터(Matter), 스레드(Thread), 와이파이 6(Wi-Fi 6) 등과 같은 복잡...
    Date2023.12.04 Bynewsit Views320
    Read More
  6. 트렌드마이크로, ‘Trend Vision One’에 클라우드 위험 관리 기능 추가

    - ‘트렌드 비전 원’ 클라우드 위험 관리 기능 추가 업데이트…위험 우선순위 자동 식별 - 외부 공격 표면 관리 확장으로 조직 공용 자산 식별, 클라우드 보안과 거버넌스 개선 트렌드마이크로가 자사의 주력 사이버 보안 플랫폼 ‘트렌드 비전 원(Trend Vision O...
    Date2023.12.04 Bynewsit Views254
    Read More
  7. MSI, MSI 「Z790 맥스」 메인보드 구매 고객 이벤트

    - 최대 12만원 상당 이벤트 진행해 겨울방학 풍성한 게이밍 라이프 응원 엠에스아이코리아는 MSI Z790 맥스 메인보드를 구매한 고객을 대상으로 최신 게임과 함께 최대 12만원 상당의 혜택을 증정하는 구매 이벤트를 진행한다고 밝혔다. 본 이벤트는 12월 중에...
    Date2023.12.04 Bynewsit Views236
    Read More
  8. 캐논코리아, 연말 맞이 ‘겨울 정품등록 프로모션’ 이벤트

    - 풀프레임 및 APS-C 타입 EOS R 시리즈 카메라 총 6종 구매 고객 대상 정품등록 이벤트 캐논코리아가 연말을 맞아 인기 EOS R 시리즈 카메라 6종 구매 고객 대상 ‘겨울 정품등록 프로모션’을 실시한다고 밝혔다. 캐논코리아는 연말 시즌을 맞아 고객 성원에 ...
    Date2023.12.04 Bynewsit Views292
    Read More
  9. 소니코리아, 뉴에라와 함께 ‘겨울의 완성 1000XM5 선물 프로모션’ 진행

    - 12월 4일(월)부터 2024년 1월 14일(일)까지 뉴에라와 함께 무선 노이즈 캔슬링 헤드폰 WH-1000XM5 및 이어폰 WF-1000XM5 구매자 대상 겨울 프로모션 진행 - 행사 기간 내 제품 구매 후 오는 1월 23일(화)까지 정품등록 및 사은품 신청 완료 시, 뉴에라 온라...
    Date2023.12.04 Bynewsit Views294
    Read More
  10. 오나인솔루션즈,‘2023 딜로이트 테크놀로지 패스트 500’ 선정

    - o9 디지털 브레인 기반으로 지난 3년간 304%의 성장 AI 소프트웨어 플랫폼 제공업체 오나인솔루션즈 코리아는 본사가 ‘2023 딜로이트 Fast Tech 500(the 2023 Deloitte Fast Tech 500)’에서 탁월한 성장 여정과 혁신에 대한 노력을 인정받아 405위에 선정되...
    Date2023.12.04 Bynewsit Views540
    Read More
  11. 뷰소닉, 300인치 대화면 프로젝터 「PX704HD」 출시

    - TI 0.65”DMD칩으로 더 밝고 선명한 화면제공 - 4,000안시루멘 고광량의 홈 & 비즈니스 빔프로젝터 - 최대 300인치의 대화면으로 더 커진 몰입감 뷰소닉은 가정과 비즈니스에서 모두 사용할 수 있는 4,000안시루멘 Full HD(1920x1080) 빔프로젝터 PX704HD를 ...
    Date2023.12.02 Bynewsit Views267
    Read More
  12. 사피온, 자율주행 추론용 오토모티브 NPU IP로 ISO 26262 인증 획득

    - 자율주행 추론용 Automotive 향 NPU IP로 ISO 26262 인증 사피온은 오늘 자율주행 추론용 오토모티브 향 NPU IP가 제3자 국제 평가인증기관인 DNV(Det Norske Veritas)로부터 ISO 26262 인증을 획득했다고 밝혔다. 사피온은 자율주행 차량이 요구하는 추론 ...
    Date2023.12.01 Bynewsit Views430
    Read More
  13. 마우저, 인피니언 「BGT60ATR24C XENSIV」 60GHz 레이더 MMIC 공급…“차량 내 승객유무 감지”

    마우저 일렉트로닉스는 인피니언 테크놀로지스의 BGT60ATR24C XENSIV 60GHz 레이더 MMIC를 공급한다고 밝혔다. 초광대역 FMCW 동작을 이용하는 BGT60ATR24C는 미세한 움직임까지 시각적으로 감지할 수 있어 어린이 감지, 운전자 모니터링 및 승객유무 감지와 ...
    Date2023.11.30 Bynewsit Views297
    Read More
  14. 헥사곤, 동계 한국유체기계학회 학술대회에서 유체 역학 솔루션 ‘크래들 CFD’와 음향 솔루션 ‘액트란’ 공개

    - 세계적인 선박, 항공, 자동차 등 제조에 투입되는 솔루션과 실전 기술로 국내 산학연계 연구에 적극적으로 참여 헥사곤 매뉴팩처링 인텔리전스가 11월 29일부터 12월 1일 동안 제주 ICC에서 열린 2023 한국유체기계학회 동계학술대회에 참가해 자사 전산 유...
    Date2023.11.30 Bynewsit Views555
    Read More
  15. 트렌드마이크로, 글로벌 위협 피드와 생성형 AI 기반 플랫폼 통합…“사이버 킬 체인 전체 가시성 제공”

    - 트렌드 비전 원, 수백만 개 센서 및 50만 고객사서 수조 건의 위협 쿼리 수집, 위협 인사이트 포착 - 세계 최고 수준 보안 데이터 보유…최상의 데이터가 AI 엔진 가치 결정 트렌드마이크로가 자사의 선도적인 글로벌 위협 인텔리전스와 수백만 개의 다양한 ...
    Date2023.11.30 Bynewsit Views211
    Read More
  16. 팔로알토 네트웍스 유닛42, “북한 해킹 조직, IT 구인 구직 활동 노리는 멀웨어 배포”

    - 북한과 관련된 위협 행위자들이 화상 면접 과정에서 구직자에게 멀웨어 설치를 유도하거나, 원격 근무자로 일하는 프리랜서로 위장해 다운스트림 공격망 공격 노리는 등의 시도 발견 팔로알토 네트웍스는 위협 연구 기관 유닛42(Unit42)의 조사를 바탕으로, ...
    Date2023.11.30 Bynewsit Views214
    Read More
  17. 티맥스티베로-SKT, ‘Tmax DBAS’ 서비스 시장 확대 MOU 체결

    - 티맥스티베로, AWS 지원 통해 SKT와 손잡고 만든 완전관리형 DB 서비스 ‘Tmas DBAS’ - AWS 리인벤트에서 공개 후 SKT와 업무협약식 진행 티맥스티베로와 SKT가 완전관리형 데이터베이스 서비스 ‘Tmax DBAS’(DB All Services) 비즈니스 확대를 위해 두 손을 ...
    Date2023.11.30 Bynewsit Views536
    Read More
  18. 이글루코퍼레이션, 공격 표면 관리 서비스 ‘클루 에이에스엠’ 출시…“위협 인텔리전스 기반 전문 브랜드 ‘클루(KLU:)’ 라인업 확장”

    - 이글루코퍼레이션, CTI 기반 공격 표면 관리 서비스 ‘KLU: ASM’ 출시 - CTI 서비스 ‘KLU:’ 라인업 확장 통해 CTI 사업 다각화 이글루코퍼레이션은 외부에 노출된 IT 자산 정보를 실시간 파악·관리하는 공격 표면 관리(ASM) 서비스인 ‘클루 에이에스엠(KLU: A...
    Date2023.11.30 Bynewsit Views211
    Read More
  19. 버티브, “2024년 데이터센터 업계의 화두는 인공지능과 지속 가능성”

    - AI 구현과 에너지 관리를 2024년에 주목할 데이터센터 업계 핵심 동향으로 전망 버티브(Vertiv)는 2024년에 주목해야 할 데이터센터 업계 핵심 동향으로 인공지능(AI) 구현과 에너지 관리를 꼽았다. 버티브는 2024년 데이터센터 업계가 AI 기능에 대한 강렬...
    Date2023.11.29 Bynewsit Views506
    Read More
  20. 트렐릭스, CISO 대부분 반복된 사이버 공격에 노출…“이사회 차원의 인식 개선 필요”

    - 트렐릭스의 새로운 연구, 63%의 조직이 반복적인 사이버 공격에 노출 미래형 XDR 솔루션을 제공하는 사이버 보안 기업 트렐릭스(Trellix)가 ‘CISO의 마인드(Mind of the CISO)’ 이니셔티브의 일환으로 신규 연구 결과를 발표했다. 트렐릭스는 사이버 공격 이...
    Date2023.11.29 Bynewsit Views235
    Read More
Board Pagination Prev 1 ... 158 159 160 161 162 163 164 165 166 167 ... 271 Next
/ 271
CLOSE