- 클라우드 서비스 제공업체 코어위브(CoreWeave)3,584H100 GPU 클러스터, 11분 만에 대규모 GPT-3 기반 모델 훈련 가능

 

엔비디아 H100 GPU, MLPerf 벤치마크에서 생성형 AI 표준 설정 (1).png

​​​​

엔비디아 MLPerf 벤치마크에서 엔비디아 H100 텐서 코어 GPU(NVIDIA H100 Tensore Core GPU)생성형 AI를 구동하는 대규모 언어 모델(LLM)에서 최고의 AI 성능을 제공한다고 밝혔다.

 

최신 MLPerf 트레이닝 벤치마크에서 H100 GPU 8개의 테스트 모두에서 신기록을 세웠으며, 생성형 Al를 위한 새로운 MLPerf 테스트에서 탁월한 성능을 발휘했다. 이러한 우수성은 개별 가속기와 대규모 서버에서 모두 제공된다.

 

스타트업 인플렉션(Inflection) AI가 공동 개발하고 GPU 가속 워크로드 전문 클라우드 서비스 제공업체인 코어위브(CoreWeave)가 운영하는 3,584개의 H100 GPU로 구성된 상용 클러스터에서 이 시스템은 11분 이내에 대규모 GPT-3트레이닝 벤치마크를 달성했다.

 

코어위브 공동설립자 겸 CTO 브라이언 벤투로(Brian Venturo) "우리 고객들은 오늘날 빠르고 지연 시간이 짧은 인피니밴드 네트워크에서 수천 개의 H100 GPU를 통해 최첨단 생성형 AI LLM을 대규모로 구축하고 있다. 엔비디아와 공동으로 제출한 MLPerf는 우리 고객들이 누리고 있는 뛰어난 성능을 명확하게 보여준다"고 밝혔다. 

 

현존하는 최고의 성능

인플렉션 AI는 이러한 성능을 활용해 최초의 개인용 AIPi(Personal Intelligence)의 기반이 되는 고급 LLM을 구축했다. 인플렉션은 사용자가 간단하고 자연스러운 방식으로 상호 작용할 수 있는 개인용 AI를 개발하는 AI 스튜디오 역할을 하게 된다.

 

인플렉션 AI CEO 무스타파 설리만(Mustafa Suleyman)은 “코어위브의 강력한 H100 GPU 네트워크에서 훈련된 최첨단 대규모 언어 모델을 기반으로 누구나 개인용 AI의 힘을 경험할 수 있다"고 밝혔다. 2022년 초 딥마인드(DeepMind)의 무스타파와 카렌 사이모니언(Karén Simonyan), 리드 호프먼(Reid Hoffman)이 공동 설립한 인플렉션 AI는 코어위브와 협력해 엔비디아 GPU를 사용하는 세계 최대 규모의 컴퓨팅 클러스터 중 하나를 구축하는 것을 목표로 한다.

 

경쟁 제품 대비 뛰어난 성능

이러한 사용자 경험은 이번 MLPerf 벤치마크에서 입증된 성능을 반영한다. H100 GPU는 대규모 언어 모델, 추천자, 컴퓨터 비전, 의학 이미지 및 음성 인식을 포함한 모든 벤치마크에서 최고의 성능을 선보였다. H100 GPU 8개의 테스트를 모두 실행한 유일한 칩으로, 엔비디아 AI 플랫폼의 뛰어난 활용성을 입증했다.

엔비디아 H100 GPU, MLPerf 벤치마크에서 생성형 AI 표준 설정 (2).jpg

대규모 운영에서도 유지되는 우수성

트레이닝은 일반적으로 많은 GPU가 함께 작동해 대규모로 실행되는 작업이다. 모든 MLPerf 테스트에서 H100 GPUAI 훈련을 위한 새로운 대규모 성능을 기록했다H100 GPU 서버의 전체 스택에 걸친 최적화를 통해 제출물이 수백 대에서 수천 대의 H100 GPU로 확장됐다. 이에 따라 까다로운 LLM 테스트에서도 거의 선형에 가까운 성능 확장이 가능했다.

엔비디아 H100 GPU, MLPerf 벤치마크에서 생성형 AI 표준 설정 (1).jpg

또한, 코어위브는 클라우드에서 로컬 데이터센터에서 실행되는 AI 슈퍼컴퓨터와 유사한 성능을 제공했다. 이는 코어위브가 사용하는 엔비디아 퀀텀 인피니밴드(Quantum InfiniBand) 네트워킹의 저지연 네트워킹을 입증하는 결과다이번 라운드에서 MLPerf는 추천 시스템에 대한 벤치마크도 업데이트했다새로운 테스트는 클라우드 서비스 제공 업체가 직면한 과제를 보다 잘 반영하기 위해 더 큰 데이터 세트와 최신의 AI 모델을 사용했다. 엔비디아는 강화된 벤치마크에 대해 결과를 내놓은 유일한 기업이다.

 

확장되는 엔비디아 AI 에코시스템

이번 라운드에는 약 12개의 기업이 엔비디아 플랫폼에 대한 결과를 제출했다. 이들의 연구는 엔비디아 AI가 업계에서 가장 광범위한 머신 러닝 에코시스템의 지원을 받고 있음을 보여준다에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), 레노버(Lenovo), QCT를 비롯한 주요 시스템 제조업체에서 제출한 30개 이상의 출품작이 H100 GPU에서 실행됐다이러한 참여 수준은 사용자들이 클라우드와 자체 데이터 센터에서 실행되는 서버 모두에서 엔비디아 AI를 통해 뛰어난 성능을 얻을 수 있다는 것을 입증한다.

 

모든 워크로드에 걸친 성능

엔비디아의 에코시스템 파트너들은 MLPerf AI 플랫폼 및 공급업체를 평가하는 고객에게 유용한 도구라는 것을 인식하고 이에 참여하고 있다이 벤치마크는 컴퓨터 비전, 번역 및 강화 훈련, 생성형 AI 추천 시스템 등 사용자가 중요하게 생각하는 워크로드를 다룬다.

 

MLPerf는 공정하고 객관적인 테스트이기 때문에 사용자는 그 결과를 바탕으로 정보에 입각한 구매 결정을 내릴 수 있다. 이러한 벤치마크는 암(Arm), 바이두(Baidu), 페이스북 AI(Facebook AI), 구글(Google), 하버드, 인텔(Intel), 마이크로소프트(Microsoft), 스탠퍼드, 토론토 대학교를 포함한 광범위한 그룹의 지지를 받고 있다MLPerf 결과는 H100, L4 및 엔비디아 젯슨(Jetson) 플랫폼에서 AI 트레이닝, 추론 및 HPC 벤치마크를 통해 오늘부터 확인할 수 있다. 또한 향후 MLPerf 라운드에서도 엔비디아 그레이스 호퍼 시스템에서 제출할 예정이다.

 

에너지 효율의 중요성

AI의 성능 요구사항이 증가하고 있다. 따라서 그 성능을 효율적으로 달성하는 방법을 더욱 개선해야 하며 이것이 바로 가속컴퓨팅이 하는 일이다엔비디아 GPU로 가속화된 데이터 센터는 더 적은 수의 서버 노드를 사용하므로 랙(rack) 공간과 에너지를 절약할 수 있다. 또한 가속화된 네트워킹은 효율성과 성능을 향상시키며, 지속적인 소프트웨어 최적화로 인해 동일한 하드웨어에서 뛰어난 성능 향상을 이끌어 낼 수 있다.

 

에너지 효율적인 성능은 환경과 비즈니스에도 유익하다. 성능이 향상되면 시장 출시가 단축되고 기업은 더 고급 애플리케이션을 구축할 수 있으며 에너지 효율은 비용을 절감한다. 엔비디아는 실제로 최신 그린 500 리스트(Green500 list)의 상위 30개 슈퍼컴퓨터 중 22개 슈퍼컴퓨터를 지원하고 있다.

 

누구나 사용할 수 있는 소프트웨어

엔비디아 AI 플랫폼의 소프트웨어 계층인 엔비디아 AI 엔터프라이즈(AI Enterprise)는 업계를 선도하는 가속 컴퓨팅 인프라에서 최적화된 성능을 구현한다. 이 소프트웨어는 기업 데이터 센터에서 AI를 실행하는 데 필요한 엔터프라이즈급 지원, 보안 및 안정성이 함께 제공된다.

 

이 테스트에 사용된 모든 소프트웨어는 MLPerf 저장소에서 사용할 수 있으므로 누구나 글로벌 수준의 결과를 얻을 수 있다최적화는 엔비디아의 GPU 가속 소프트웨어 카탈로그인 NGC에서 사용할 수 있는 컨테이너에 지속적으로 반영된다.

 

#엔비디아#AI#MLPerf#H100#GPU

?

  1. 캐논코리아, RF렌즈 사상 가장 작은 팬케이크 렌즈 ‘RF28mm F2.8 STM’ 출시

    - 길이 약 24.7mm, 무게 약 120g로 스냅·동영상 촬영 시 휴대성이 좋은 팬케이크 렌즈 RF28mm F2.8 STM 판매 개시 - 초소형 렌즈임에도 고화질과 F2.8의 밝은 조리개 탑재, 범용적인 28mm 초점거리로 어떤 촬영에도 어울리는 렌즈 - APS-C 미러리스와 결합 시 ...
    Date2023.07.03 Bynewsit Views145
    Read More
  2. 가민, 디즈니 100주년 기념 스페셜 걷기 챌린지 진행

    - 디즈니 100주년 기념 스페셜 걷기 챌린지, 가민 커넥트 앱을 통해 바로 챌린지 참여 가능 - 7월 한 달 내에 10일 연속 하루 만보 걸음 수를 기록하면 디즈니 배지 및 가민 공식 온라인몰 비보핏 주니어 제품군 25% 할인 혜택 제공 - 추가 챌린지 참여를 통해...
    Date2023.07.03 Bynewsit Views298
    Read More
  3. 와콤, 펜타블렛 ‘인튜어스’ 할인 기획전 실시

    - 와콤, 금일부터 오는 8월 13일(일)까지 ‘와콤 인튜어스’ 대상 가격 할인 이벤트 - 와콤 공식 카카오톡스토어와 전 온라인 마켓에서 인튜어스 최대 30% 할인 판매 한국와콤은 금일부터 오는 8월 13일까지 와콤 카카오톡스토어 및 온라인 마켓 등 공식 온/오프...
    Date2023.07.03 Bynewsit Views206
    Read More
  4. 베리타스, 제조 및 바이오 분야 랜섬웨어 대응 및 비즈니스 연속성 강화 사례 발표

    - 자동차 부품 제조 경창산업, 넷백업 어플라이언스 통해 랜섬웨어 공격으로부터 수차례 데이터 완벽 복구, 시스템 장애 시에도 비즈니스 연속성 유지 - AI 진단 플랫폼 기업 노을, 넷백업 어플라이언스 도입을 통한 기업 핵심 데이터 보호 체계 강화 베리타스...
    Date2023.07.03 Bynewsit Views225
    Read More
  5. 락인컴퍼니, 보안 솔루션 서비스 LIAPP 개편...“이용자 편의성 대폭 개선”

    사이버 보안서비스 전문기업 ‘락인컴퍼니’가 6월 30일 이용자 편의성 개선에 중심을 두고 자사 앱 보안 솔루션 서비스 LIAPP을 대폭 개편했다고 밝혔다, 락인컴퍼니의 모바일 앱 보안 솔루션 LIAPP은 개발 완료된 앱을 업로드하기만 하면 추가적인 코딩 없이 ...
    Date2023.06.30 Bynewsit Views254
    Read More
  6. 마우저, 온세미 ‘NCN26010’ 이더넷 컨트롤러 공급…“배선 및 설치 비용 절감”

    마우저 일렉트로닉스는 온세미(onsemi)의 NCN26010 산업용 이더넷 컨트롤러 제품을 공급한다고 밝혔다. 이 새로운 10BASE-T1S 이더넷 컨트롤러는 산업 환경에서 신뢰할 수 있는 멀티포인트 통신을 제공하도록 설계되었다. 온세미 NCN26010 제품은 10Mb/s, IEEE...
    Date2023.06.30 Bynewsit Views393
    Read More
  7. 천재교과서, 휴대용 올인원 문제집 앱 ‘디북’ 안드로이드 버전 출시

    - 초∙중∙고 5개 과목 교재 400권 이상 대거 탑재 - 우등생 해법∙ 중학 체크체크 시리즈 등 천재교육 인기 문제집 다수 포함 천재교육 관계사 천재교과서는 자사의 인기 교재가 대거 탑재된 초∙중∙고 전용 올인원 문제집 앱 ‘디북’의 안드로이드 버전을 정식 출...
    Date2023.06.30 Bynewsit Views333
    Read More
  8. MSI, ‘지포스 RTX 4060’이 적용된 게이밍 벤투스 시리즈 출시

    엠에스아이코리아는 혁신적인 NVIDIA 에이다 러브레이스(Ada Lovelace) 아키텍쳐를 기반의 차세대 기술을 탑재한 ‘MSI 지포스 RTX 4060’ 시리즈 그래픽카드를 출시한다고 밝혔다. ‘MSI 지포스 RTX 4060 게이밍 X 8GB 트윈프로져9’은 MSI의 특허 기술인 2개의 ‘...
    Date2023.06.30 Bynewsit Views232
    Read More
  9. 캐논코리아-홀트아동복지회, ‘mom(맘) 편한 가족앨범’ 사회공헌 협약 체결

    - 캐논코리아와 홀트아동복지회, 한부모가정 사진 촬영 프로그램 ‘mom(맘) 편한 가족앨범’ 사회공헌 4년간 지속 - 올해는 참여 가능 대상 및 지역 확대로 더 많은 한부모가정에 특별한 추억 선사 예정 캐논코리아와 홀트아동복지회가 한부모가정 사진 촬영 프...
    Date2023.06.30 Bynewsit Views212
    Read More
  10. 온세미, 전력 효율적 자산 추적 지원 엔드 투 엔드 시스템 출시

    - 우니키에(Unikie)와 코어HW(CoreHW) 협력으로 창고 ∙ 소매점 ∙ 기타 건물의 자산 추적 솔루션을 쉽게 개발할 수 있는 시스템 제공 온세미는 보다 정확하고 비용 및 전력 효율이 높은 자산 추적 솔루션을 간단하고 빠르게 개발할 수 있는 엔드 투 엔드 포지셔...
    Date2023.06.30 Bynewsit Views333
    Read More
  11. 사이냅소프트, ‘사이냅 오피스’ 올해 3분기 공개 예정…“사용자 편의성 대폭 향상”

    - 사이냅 오피스, 생성형 AI 적용으로 문서 작성 및 편집에 따른 사용자 편의성 대폭 향상 - 구글 드라이브, 드롭박스, 원드라이브 등 다양한 클라우드 스토리지 연동 지원 - 네이버와 공동 개발한 네이버 오피스와 동일한 사용자 경험 제공 사이냅소프트는 오...
    Date2023.06.29 Bynewsit Views366
    Read More
  12. 캐논코리아, 차세대 신진 작가들의 5인 5색 사진·영상 전시회 ‘2022 미래작가상展’ 개최

    - 캐논갤러리에서 오는 7월 23일(일)까지 2022 미래작가상 수상자 5인의 '2022 미래작가상展' 전시회 개최 - 2022 미래작가상 수상자 김예원·김혜지·이우선·이도현·정예준, 6개월간 튜터링 과정 수료 - 미래작가상, 영상부문 신설로 확대 모집하며 차세대 작가...
    Date2023.06.29 Bynewsit Views176
    Read More
  13. 안랩-네이버클라우드, 게임 업계 클라우드 활용 방안∙보안 전략 세미나 개최

    - 7월 6일(목) 오후 4시 30분, 역삼동 잼라운지에서 미드 티어 게임사를 대상으로 ‘AhnLab X Naver Cloud Gamebiz: Connect & Play’ 개최 - ▲게임 시장 트렌드 및 네이버클라우드 게임사 고객 사례 발표 ▲게임 경쟁력을 높일 수 있는 ‘네이버 게임 라운지’ 소...
    Date2023.06.29 Bynewsit Views163
    Read More
  14. 화웨이, 2023 MWC 상하이 참가…“디지털 경제 활성화로 5.5G로 향하는 5G 진화 촉진”

    화웨이가 2023 MWC 상하이에 참가해 ‘지능형 세상을 위한 가이드(GUIDE to the Intelligent World)’를 테마로 한 전시관을 마련했다. 올해 화웨이는 여러 도시의 기술과 비즈니스를 한 눈에 살펴볼 수 있는 체험 투어를 비롯해 5기가그린(5GigaGreen), 5G 지능...
    Date2023.06.29 Bynewsit Views245
    Read More
  15. No Image

    VMware, ‘스프링원 투어 코리아’ 통해 국내 개발자 지원

    - 국내 개발자 대상 스프링 프레임워크의 새로운 업데이트와 모범 사례 소개 - 세계적인 자바 챔피언 조쉬 롱(Josh Long) 특별 연사로 참여, 신규 스프링 기능 소개 - 오는 8월, 미국에서 개최하는 플래그십 행사 VMware 익스플로어 라스베이거스에서 스프링원...
    Date2023.06.29 Bynewsit Views612
    Read More
  16. 한국레노버, 세계 최초 OLED 듀얼 스크린 탑재한 ‘요가북 9i’ 국내 출시  

    - 혁신적인 폼팩터의 인텔 Evo 플랫폼 인증 8세대 요가 플래그십 모델 - 레노버 ‘프리미엄 케어 서비스’ 및 ‘우발적 손상 보장’ 서비스 각각 3년 보장 - 30일 오후 7시, 유튜버 ‘잇섭’ 네이버 핫IT슈 쇼핑라이브 진행…8세대 요가 최대 18%할인 및 풍성한 경품 ...
    Date2023.06.28 Bynewsit Views267
    Read More
  17. 트렌드마이크로, “보안과 데이터 인사이트 사이 연관성 인식 못 하는 기업 많아”  

    - 기업의 68% “기업 신규 수익원 창출 위해 데이터 접근성 필수적” - 보안과 수익원 창출(48%), 비용 절감(55%) 사이 연관성 이해 못 해 트렌드마이크로는 많은 기업 리더들이 효과적인 보안이 디지털화를 가속화할 수 있다는 사실을 인지하고 있지만 데이터 ...
    Date2023.06.28 Bynewsit Views232
    Read More
  18. 데이터브릭스, 생성형 AI 플랫폼 ‘모자이크 ML’ 13억 인수

    - 대형 언어 모델(LLM) ‘MPT-7B’로 잘 알려진 모자이크ML 1조 7천억원 규모에 인수 - 두 선도 업체의 시너지 기대… 생성형 AI 모델에 대한 접근성 확대 데이터브릭스(Databricks)가 생성형 AI 플랫폼 모자이크ML(MosaicML)을 약 13억 달러(약 1조 7천억 원)에 ...
    Date2023.06.28 Bynewsit Views464
    Read More
  19. 엔비디아 H100 GPU, MLPerf 벤치마크서 생성형 AI 표준 설정

    - 클라우드 서비스 제공업체 코어위브(CoreWeave)의 3,584개 H100 GPU 클러스터, 11분 만에 대규모 GPT-3 기반 모델 훈련 가능 엔비디아가 MLPerf 벤치마크에서 엔비디아 H100 텐서 코어 GPU(NVIDIA H100 Tensore Core GPU)가 생성형 AI를 구동하는 대규모 언...
    Date2023.06.28 Bynewsit Views565
    Read More
  20. 버티브, 데이터센터 최적화 서비스 ‘Vertiv EnerSav’’ 제공

    - 데이터센터 사업자의 에너지 사용 저감을 지원하는 열 관리 최적화 서비스 제공 - Vertiv EnerSav 서비스, 주요 인프라 전반을 점검하지 않고도 에너지 사용을 더욱 줄일 수 있는 영역들 파악 버티브(Vertiv)는 새로운 데이터센터 최적화 서비스인 ‘Vertiv E...
    Date2023.06.28 Bynewsit Views325
    Read More
Board Pagination Prev 1 ... 187 188 189 190 191 192 193 194 195 196 ... 266 Next
/ 266
CLOSE