- LLM부터 추천 시스템·그래프 신경망까지 전 영역에서 탁월한 성능과 범용성 입증

- 라마 3.1 405B 사전 훈련에서 이전 세대 대비 2.2배 성능 향상

- 수랭식 설계, 13.4TB 메모리, 네트워킹 등 기술 혁신 구현

 

엔비디아, 최신 MLPerf 훈련에서 블랙웰 아키텍처로 획기적 성능 입증.jpg

엔비디아가 엔비디아 블랙웰(NVIDIA Blackwell) 아키텍처 기반 AI 플랫폼으로 최신 MLPerf 훈련(MLPerf Training) 벤치마크 전 항목에서 최고 성능을 달성했다고 밝혔다.

 

엔비디아는 전 세계 기업들과 협력해 AI 팩토리를 구축하고 있으며, 최신 훈련, 추론 기술을 기반으로 차세대 AI 애플리케이션의 훈련과 배포 속도를 높이고 있다.

 

엔비디아 블랙웰 아키텍처는 이러한 새로운 애플리케이션의 고도화된 성능 요구사항을 충족하도록 설계됐다. 2018년 벤치마크가 도입된 이래 12번째로 진행된 최신 MLPerf 훈련 라운드에서, 엔비디아 AI 플랫폼은 모든 벤치마크 항목에서 최고 수준의 성능을 입증했다. 또한 가장 까다로운 거대 언어 모델(LLM) 중심 테스트인 라마 3.1 405B(Llama 3.1 405B) 사전 훈련에서 제출된 모든 결과도 엔비디아 플랫폼 위에서 실행됐다.

 

엔비디아 플랫폼은 유일하게 MLPerf 훈련 v5.0의 모든 벤치마크 항목에 결과를 제출했다. 엔비디아는 LLM, 추천 시스템, 멀티모달 LLM, 객체 감지, 그래프 신경망을 아우르는 광범위한 AI 워크로드에서 탁월한 성능과 범용성을 입증했다.

 

대규모 출품에는 엔비디아 블랙웰 플랫폼으로 구동되는 두 대의 AI 슈퍼컴퓨터가 사용됐다. 이는 각각 엔비디아 GB200 NVL72 랙 스케일 시스템으로 구성된 티케(Tyche), 엔비디아 DGX B200 시스템을 기반으로 한 닉스(Nyx)이다. 또한 엔비디아는 코어위브(CoreWeave), IBM과 협력해 총 2,496개의 블랙웰 GPU와 1,248개의 엔비디아 그레이스(Grace) CPU를 사용한 GB200 NVL72 결과도 제출했다.

 

새로운 라마 3.1 405B 사전 훈련 벤치마크에서 블랙웰 아키텍처는 동일한 규모의 이전 세대 대비 2.2배 향상된 성능을 기록했다.

 

라마 2 70B LoRA 미세 조정 벤치마크에서는 블랙웰 GPU 8개가 탑재된 엔비디아 DGX B200 시스템이 이전 라운드에서 동일 GPU 수로 제출한 결과보다 2.5배 더 높은 성능을 달성했다.

 

이러한 성능 도약은 블랙웰 아키텍처의 기술적 진보를 잘 보여준다. 여기에는 고밀도 수랭식 랙, 랙당 13.4 테라바이트(TB)의 코히어런트 메모리, 스케일업(scale-up)을 위한 5세대 엔비디아 NV링크(NVLink)와 엔비디아 NV링크 스위치(Switch) 상호연결 기술, 그리고 스케일 아웃(scale-out)을 위한 엔비디아 퀀텀-2 인피니밴드(Quantum-2 InfiniBand) 네트워킹 등이 포함된다. 또한 엔비디아 네모 프레임워크(NeMo Framework) 소프트웨어 스택의 혁신은 에이전틱 AI 애플리케이션 실현에 핵심적인 기반이 되는 차세대 멀티모달 LLM 훈련의 기준을 높였다.

 

이러한 에이전틱 AI 기반 애플리케이션은 미래의 AI 팩토리에서 작동하게 되며, 이는 곧 에이전틱 AI 경제의 핵심 엔진으로 자리잡을 전망이다. 이러한 새로운 애플리케이션은 토큰과 지능 정보를 생성하며, 거의 모든 산업과 학문 분야에 걸쳐 가치를 창출할 수 있다.

 

엔비디아 데이터센터 플랫폼에는 GPU, CPU, 고속 패브릭, 네트워킹은 물론 엔비디아 쿠다-X(CUDA-X) 라이브러리, 네모 프레임워크, 엔비디아 텐서RT-LLM(TensorRT-LLM), 엔비디아 다이나모(Dynamo)와 같은 방대한 소프트웨어가 포함된다. 이처럼 정밀한 하드웨어와 소프트웨어 기술 조합은 조직이 AI 모델을 더 빠르게 훈련하고 배포할 수 있게 해 가치 실현 시간을 획기적으로 단축시킨다.

 

이번 MLPerf 라운드에는 코어위브와 IBM 외에도 다양한 엔비디아 파트너사들이 참여했다. 에이수스(ASUS), 시스코(Cisco), 델 테크놀로지스(Dell Technologies), 기가컴퓨팅(Giga Computing), 구글 클라우드(Google Cloud), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE), 람다(Lambda), 레노버(Lenovo), 네비우스(Nebius), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure, OCI), 퀀타 클라우드 테크놀로지(Quanta Cloud Technology), 슈퍼마이크로(Supermicro) 등이 다양한 벤치마크 결과를 제출했다.

 

#엔비디아#MLPerf#라마#블랙웰#

?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
4472 카테노이드, 헤지스닷컴에 숏폼 플랫폼 ‘찰나’ 도입…“브랜드 콘텐츠 경험 강화” file newsit 2025.07.17 435
4471 벡터-QNX, 차량 SW 플랫폼 공동 개발 MOU 체결 file newsit 2025.07.17 444
4470   AWS, 에이전트형 AI IDE ‘키로(Kiro)’ 프리뷰 공개 file newsit 2025.07.16 610
4469 델, 최고급 컨슈머 노트북 ‘델 14∙16 프리미엄’ 첫 공개 file newsit 2025.07.16 186
4468 노르딕, 퓨처 일렉트로닉스와 글로벌 유통 파트너십 체결 file newsit 2025.07.16 482
4467 TI, 폭스바겐 그룹 어워드 2025에서 ‘운영 우수상’ 수상 file newsit 2025.07.16 281
4466 테스토코리아, HK와 국내 공식 대리점 계약 체결…“식품 안전 부문 시장 확대” file newsit 2025.07.16 680
4465 레노버, ‘ESG 연례 보고서’ 발표…ESG 성과로 업계 리더십 입증 file newsit 2025.07.16 414
4464 Qt그룹, 온코소프트에 Qt 플랫폼 활용한 'OncoStudio 2.0' 고도화 지원…의료 AI 시장 공략 강화 file newsit 2025.07.16 451
4463 다쏘시스템, ‘아스콘 큐브’ 기술 인수…“공장 버추얼 트윈 전략 실행 가속화” file newsit 2025.07.15 476
4462 AWS, 엔비디아 블랙웰 기반 AI 인프라 공개…차세대 AI용 컴퓨팅 솔루션 출시 file newsit 2025.07.15 442
4461 지멘스, 국내 대표 연례 EDA 행사 ‘Siemens EDA Forum 2025’ 개최 file newsit 2025.07.15 453
4460 SK키파운드리-지멘스, 130nm 차량용 전력 반도체 공정 기반 ‘PERC PDK’ 출시 file newsit 2025.07.15 433
4459 엠클라우드브리지, AOAI & Fabric 기반 데이터 분석 플랫폼 ‘Ai 365 데이터 에이전트’ 출시 file newsit 2025.07.15 491
4458 스틸시리즈, 티켓 증정 이벤트 진행…“스틸시리즈 제품 구매하고 T1 홈그라운드 가자” file newsit 2025.07.15 165
4457 델, 한국 정부기관 생성형 AI 투자 증가 전망…“소버린 AI는 선택적 접근” file newsit 2025.07.15 434
4456 딥엘, 국내 직장인 대상 AI 활용 실태조사 결과 발표…10명 중 약 7명 “AI 번역기 사용한다” file newsit 2025.07.15 681
4455 톰슨로이터, AI시대 ‘전문직 미래 전망 2025’ 보고서 발표 file newsit 2025.07.15 583
4454 Ceva, 차세대 모션 제어 소프트웨어 솔루션 ‘모션 엔진 헥스’ 공개 file newsit 2025.07.14 314
4453 지멘스, NX 최신 업데이트 발표…“AI 코파일럿과 몰입형 설계, 통합 시뮬레이션 기능 추가” file newsit 2025.07.14 606
Board Pagination Prev 1 ... 48 49 50 51 52 53 54 55 56 57 ... 276 Next
/ 276
CLOSE