소프트웨어·컴퓨팅

2023.06.28 17:22

엔비디아 H100 GPU, MLPerf 벤치마크서 생성형 AI 표준 설정

newsit

https://hwlab.com/SW_Computing/5194 조회 수 704 추천 수 0 댓글 0

Extra Form
참조#1	https://www.nvidia.com/en-us/data-center/h100/
참조#2	https://www.nvidia.com/en-us/ai-data-science/generative-ai/
참조#3	https://www.coreweave.com/

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

- 클라우드 서비스 제공업체 코어위브(CoreWeave)의 3,584개 H100 GPU 클러스터, 11분 만에 대규모 GPT-3 기반 모델 훈련 가능

엔비디아 H100 GPU, MLPerf 벤치마크에서 생성형 AI 표준 설정 (1).png

엔비디아가 MLPerf 벤치마크에서 엔비디아 H100 텐서 코어 GPU(NVIDIA H100 Tensore Core GPU)가 생성형 AI를 구동하는 대규모 언어 모델(LLM)에서 최고의 AI 성능을 제공한다고 밝혔다.

최신 MLPerf 트레이닝 벤치마크에서 H100 GPU는 8개의 테스트 모두에서 신기록을 세웠으며, 생성형 Al를 위한 새로운 MLPerf 테스트에서 탁월한 성능을 발휘했다. 이러한 우수성은 개별 가속기와 대규모 서버에서 모두 제공된다.

스타트업 인플렉션(Inflection) AI가 공동 개발하고 GPU 가속 워크로드 전문 클라우드 서비스 제공업체인 코어위브(CoreWeave)가 운영하는 3,584개의 H100 GPU로 구성된 상용 클러스터에서 이 시스템은 11분 이내에 대규모 GPT-3트레이닝 벤치마크를 달성했다.

코어위브 공동설립자 겸 CTO 브라이언 벤투로(Brian Venturo)는 "우리 고객들은 오늘날 빠르고 지연 시간이 짧은 인피니밴드 네트워크에서 수천 개의 H100 GPU를 통해 최첨단 생성형 AI 및 LLM을 대규모로 구축하고 있다. 엔비디아와 공동으로 제출한 MLPerf는 우리 고객들이 누리고 있는 뛰어난 성능을 명확하게 보여준다"고 밝혔다.

현존하는 최고의 성능

인플렉션 AI는 이러한 성능을 활용해 최초의 개인용 AI인 Pi(Personal Intelligence)의 기반이 되는 고급 LLM을 구축했다. 인플렉션은 사용자가 간단하고 자연스러운 방식으로 상호 작용할 수 있는 개인용 AI를 개발하는 AI 스튜디오 역할을 하게 된다.

인플렉션 AI CEO 무스타파 설리만(Mustafa Suleyman)은 “코어위브의 강력한 H100 GPU 네트워크에서 훈련된 최첨단 대규모 언어 모델을 기반으로 누구나 개인용 AI의 힘을 경험할 수 있다"고 밝혔다. 2022년 초 딥마인드(DeepMind)의 무스타파와 카렌 사이모니언(Karén Simonyan), 리드 호프먼(Reid Hoffman)이 공동 설립한 인플렉션 AI는 코어위브와 협력해 엔비디아 GPU를 사용하는 세계 최대 규모의 컴퓨팅 클러스터 중 하나를 구축하는 것을 목표로 한다.

경쟁 제품 대비 뛰어난 성능

이러한 사용자 경험은 이번 MLPerf 벤치마크에서 입증된 성능을 반영한다. H100 GPU는 대규모 언어 모델, 추천자, 컴퓨터 비전, 의학 이미지 및 음성 인식을 포함한 모든 벤치마크에서 최고의 성능을 선보였다. H100 GPU는 8개의 테스트를 모두 실행한 유일한 칩으로, 엔비디아 AI 플랫폼의 뛰어난 활용성을 입증했다.

엔비디아 H100 GPU, MLPerf 벤치마크에서 생성형 AI 표준 설정 (2).jpg

대규모 운영에서도 유지되는 우수성

트레이닝은 일반적으로 많은 GPU가 함께 작동해 대규모로 실행되는 작업이다. 모든 MLPerf 테스트에서 H100 GPU는 AI 훈련을 위한 새로운 대규모 성능을 기록했다. H100 GPU 서버의 전체 스택에 걸친 최적화를 통해 제출물이 수백 대에서 수천 대의 H100 GPU로 확장됐다. 이에 따라 까다로운 LLM 테스트에서도 거의 선형에 가까운 성능 확장이 가능했다.

엔비디아 H100 GPU, MLPerf 벤치마크에서 생성형 AI 표준 설정 (1).jpg

또한, 코어위브는 클라우드에서 로컬 데이터센터에서 실행되는 AI 슈퍼컴퓨터와 유사한 성능을 제공했다. 이는 코어위브가 사용하는 엔비디아 퀀텀 인피니밴드(Quantum InfiniBand) 네트워킹의 저지연 네트워킹을 입증하는 결과다. 이번 라운드에서 MLPerf는 추천 시스템에 대한 벤치마크도 업데이트했다. 새로운 테스트는 클라우드 서비스 제공 업체가 직면한 과제를 보다 잘 반영하기 위해 더 큰 데이터 세트와 최신의 AI 모델을 사용했다. 엔비디아는 강화된 벤치마크에 대해 결과를 내놓은 유일한 기업이다.

확장되는 엔비디아 AI 에코시스템

이번 라운드에는 약 12개의 기업이 엔비디아 플랫폼에 대한 결과를 제출했다. 이들의 연구는 엔비디아 AI가 업계에서 가장 광범위한 머신 러닝 에코시스템의 지원을 받고 있음을 보여준다. 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), 레노버(Lenovo), QCT를 비롯한 주요 시스템 제조업체에서 제출한 30개 이상의 출품작이 H100 GPU에서 실행됐다. 이러한 참여 수준은 사용자들이 클라우드와 자체 데이터 센터에서 실행되는 서버 모두에서 엔비디아 AI를 통해 뛰어난 성능을 얻을 수 있다는 것을 입증한다.

모든 워크로드에 걸친 성능

엔비디아의 에코시스템 파트너들은 MLPerf가 AI 플랫폼 및 공급업체를 평가하는 고객에게 유용한 도구라는 것을 인식하고 이에 참여하고 있다. 이 벤치마크는 컴퓨터 비전, 번역 및 강화 훈련, 생성형 AI 및 추천 시스템 등 사용자가 중요하게 생각하는 워크로드를 다룬다.

MLPerf는 공정하고 객관적인 테스트이기 때문에 사용자는 그 결과를 바탕으로 정보에 입각한 구매 결정을 내릴 수 있다. 이러한 벤치마크는 암(Arm), 바이두(Baidu), 페이스북 AI(Facebook AI), 구글(Google), 하버드, 인텔(Intel), 마이크로소프트(Microsoft), 스탠퍼드, 토론토 대학교를 포함한 광범위한 그룹의 지지를 받고 있다. MLPerf 결과는 H100, L4 및 엔비디아 젯슨(Jetson) 플랫폼에서 AI 트레이닝, 추론 및 HPC 벤치마크를 통해 오늘부터 확인할 수 있다. 또한 향후 MLPerf 라운드에서도 엔비디아 그레이스 호퍼 시스템에서 제출할 예정이다.

에너지 효율의 중요성

AI의 성능 요구사항이 증가하고 있다. 따라서 그 성능을 효율적으로 달성하는 방법을 더욱 개선해야 하며 이것이 바로 가속컴퓨팅이 하는 일이다. 엔비디아 GPU로 가속화된 데이터 센터는 더 적은 수의 서버 노드를 사용하므로 랙(rack) 공간과 에너지를 절약할 수 있다. 또한 가속화된 네트워킹은 효율성과 성능을 향상시키며, 지속적인 소프트웨어 최적화로 인해 동일한 하드웨어에서 뛰어난 성능 향상을 이끌어 낼 수 있다.

에너지 효율적인 성능은 환경과 비즈니스에도 유익하다. 성능이 향상되면 시장 출시가 단축되고 기업은 더 고급 애플리케이션을 구축할 수 있으며 에너지 효율은 비용을 절감한다. 엔비디아는 실제로 최신 그린 500 리스트(Green500 list)의 상위 30개 슈퍼컴퓨터 중 22개 슈퍼컴퓨터를 지원하고 있다.

누구나 사용할 수 있는 소프트웨어

엔비디아 AI 플랫폼의 소프트웨어 계층인 엔비디아 AI 엔터프라이즈(AI Enterprise)는 업계를 선도하는 가속 컴퓨팅 인프라에서 최적화된 성능을 구현한다. 이 소프트웨어는 기업 데이터 센터에서 AI를 실행하는 데 필요한 엔터프라이즈급 지원, 보안 및 안정성이 함께 제공된다.

이 테스트에 사용된 모든 소프트웨어는 MLPerf 저장소에서 사용할 수 있으므로 누구나 글로벌 수준의 결과를 얻을 수 있다. 최적화는 엔비디아의 GPU 가속 소프트웨어 카탈로그인 NGC에서 사용할 수 있는 컨테이너에 지속적으로 반영된다.

#엔비디아#AI#MLPerf#H100#GPU

Facebook Twitter Google Pinterest KakaoStory Band

Atachment
첨부 '3'	엔비디아 H100 GPU, MLPerf 벤치마크에서 생성형 AI 표준 설정 (1).png, 엔비디아 H100 GPU, MLPerf 벤치마크에서 생성형 AI 표준 설정 (2).jpg, 엔비디아 H100 GPU, MLPerf 벤치마크에서 생성형 AI 표준 설정 (1).jpg,

위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

댓글 쓰기

에디터 사용하기 닫기

소프트웨어·컴퓨팅

List of Articles
번호	제목	글쓴이	날짜	조회 수
616	Veeam, 7회 연속 가트너 ‘백업 및 복구 솔루션 리더’로 선정 - 빔, 실행 능력서 4년 연속 최고 기업 인정받으며 가트너 매직 쿼드런트 리더로 선정 - 빔 데이터 플랫폼, 모든 IT 환경에서 랜섬웨어로부터 안정적 비즈니스 위...	newsit	2023.08.14	748
615	효성인포메이션시스템 , ‘2023 KSC’ 참가…“HPC 인프라 전략 제시” - 8월 21일~23일 서울 더케이호텔 ‘2023 한국 슈퍼컴퓨팅 콘퍼런스(KSC)’ 부스 참가 - GPU 최적화부터 초고성능 데이터 저장 및 활용까지… HPC 인프라 위한 최상...	newsit	2023.08.11	688
614	오라클, ‘컴퓨트 클라우드앳커스터머’로 어디에서나 OCI 컴퓨트 서비스 제공 - 업계 최초의 분산형 클라우드 포트폴리오에 추가된 최신 제품으로 고객 데이터센터 내에서 단일 랙으로 제공 오라클이 랙 규모의 클라우드 인프라스트럭처 제품...	newsit	2023.08.11	620
613	엔비디아 옴니버스 클라우드, 덴자-WPP 첨단 자동차 컨피규레이터 구축과 배포에 채택 - 엔비디아, 고급 전기차 제조업체의 컨피규레이터과 마케팅, 생성형 AI에 활용 엔비디아 CEO 젠슨 황(Jensen Huang)은 시그래프(SIGGRAPH)에서 엔비디아 옴니버...	newsit	2023.08.11	746
612	윈드리버, 호라이즌과 협력…“현지 특화형 자율 주행 솔루션 개발 지원” 윈드리버는 오늘 스마트 주행 솔루션의 향상을 위해 ‘호라이즌 로보틱스(Horizon Robotics)’와 전략적 협력을 체결했다고 밝혔다. 호라이즌은 중국 소재의 ADAS ...	newsit	2023.08.11	691
611	베리타스, 베리타스 MSP 프로그램 발표…“맞춤형 프로그램 통해 MSP 파트너 동반 성장 지원 가속화” - MSP를 위한 리소스 및 리워드 프로그램을 통해 보다 완성도 높은 솔루션 개발을 장려하고 수익성을 강화하며 기업고객들이 데이터 관리를 주도적으로 수행할 수...	newsit	2023.08.10	644
610	엔비디아, 허깅페이스와 파트너십 발표…"AI 슈퍼컴퓨팅 제공" - 허깅페이스 플랫폼에 엔비디아 DGX 클라우드 통합 - AI 모델 LLM 훈련과 조정 속도 향상, 모델 맞춤화 간소화 엔비디아는 허깅페이스(Hugging Face)와 협력한다...	newsit	2023.08.10	622
609	엔비디아 젠슨 황, 시그래프 기조연설서 '생성형 AI' 소개 - LA에서 열린 시그래프에서 수천 명의 개발자, 그래픽 전문가 대상 특별 연설 - 업데이트된 GH200 그레이스 호퍼 슈퍼칩, 엔비디아 AI 워크벤치, 생성형 AI로 강...	newsit	2023.08.10	636
608	엔비디아, 가속 컴퓨팅과 생성형 AI 위한 차세대 ‘GH200 그레이스 호퍼 슈퍼칩’ 공개 - 세계 최초 HBM3e 프로세서로 혁신적인 메모리와 대역폭 제공 - 쉽게 확장 가능한 서버 디자인과 뛰어난 성능 발휘 위한 다중 GPU 연결 기능 탑재 엔비디아가 가...	newsit	2023.08.10	692
607	VMware NSX, 국가정보원 보안기능 확인서 취득 - 국가정보원 보안적합성 검증을 위한 보안기능 확인서 취득 - 국내 공공기관에 신뢰할 수 있고 안전한 네트워크 및 보안 가상화 솔루션 공급 계획 VMware는 네트...	newsit	2023.08.10	698

태그 쓰기

안랩, 정책·보조금 위장 광고 앱 주의…악성 기능 추가 ...	04-07
마우저, 암페놀 윌콕슨 VDS130 공급… IEPE 진동 데이터...	04-07
힐셔, HIMA와 SIL 3 대응 안전 통신 평가키트 공개… HI...	04-07
윈드리버, AMD와 오픈랜·AI-RAN 통합 플랫폼 공개…단일...	04-07
오토폼, K-제조 위한 디지털 금형 전략 발표… 숙련 기...	04-07
삼성전자·ETRI·프라임마스, CXL 기반 메모리 중심 컴퓨...	04-06
카스퍼스키, 2025 한국 보안 위협 보고서 발표…웹 공격...	04-06
알리바바, Qwen3.6-Plus·Qwen3.5-Omni 공개…에이전틱 ...	04-06
델, 2026년형 에일리언웨어 게이밍 노트북 3종 공개…OL...	04-06
한국레노버, 산업용 AI 엣지 컴퓨팅 ‘씽크엣지’ 2종 출...	04-06