- LLM부터 추천 시스템·그래프 신경망까지 전 영역에서 탁월한 성능과 범용성 입증

- 라마 3.1 405B 사전 훈련에서 이전 세대 대비 2.2배 성능 향상

- 수랭식 설계, 13.4TB 메모리, 네트워킹 등 기술 혁신 구현

 

엔비디아, 최신 MLPerf 훈련에서 블랙웰 아키텍처로 획기적 성능 입증.jpg

엔비디아가 엔비디아 블랙웰(NVIDIA Blackwell) 아키텍처 기반 AI 플랫폼으로 최신 MLPerf 훈련(MLPerf Training) 벤치마크 전 항목에서 최고 성능을 달성했다고 밝혔다.

 

엔비디아는 전 세계 기업들과 협력해 AI 팩토리를 구축하고 있으며, 최신 훈련, 추론 기술을 기반으로 차세대 AI 애플리케이션의 훈련과 배포 속도를 높이고 있다.

 

엔비디아 블랙웰 아키텍처는 이러한 새로운 애플리케이션의 고도화된 성능 요구사항을 충족하도록 설계됐다. 2018년 벤치마크가 도입된 이래 12번째로 진행된 최신 MLPerf 훈련 라운드에서, 엔비디아 AI 플랫폼은 모든 벤치마크 항목에서 최고 수준의 성능을 입증했다. 또한 가장 까다로운 거대 언어 모델(LLM) 중심 테스트인 라마 3.1 405B(Llama 3.1 405B) 사전 훈련에서 제출된 모든 결과도 엔비디아 플랫폼 위에서 실행됐다.

 

엔비디아 플랫폼은 유일하게 MLPerf 훈련 v5.0의 모든 벤치마크 항목에 결과를 제출했다. 엔비디아는 LLM, 추천 시스템, 멀티모달 LLM, 객체 감지, 그래프 신경망을 아우르는 광범위한 AI 워크로드에서 탁월한 성능과 범용성을 입증했다.

 

대규모 출품에는 엔비디아 블랙웰 플랫폼으로 구동되는 두 대의 AI 슈퍼컴퓨터가 사용됐다. 이는 각각 엔비디아 GB200 NVL72 랙 스케일 시스템으로 구성된 티케(Tyche), 엔비디아 DGX B200 시스템을 기반으로 한 닉스(Nyx)이다. 또한 엔비디아는 코어위브(CoreWeave), IBM과 협력해 총 2,496개의 블랙웰 GPU와 1,248개의 엔비디아 그레이스(Grace) CPU를 사용한 GB200 NVL72 결과도 제출했다.

 

새로운 라마 3.1 405B 사전 훈련 벤치마크에서 블랙웰 아키텍처는 동일한 규모의 이전 세대 대비 2.2배 향상된 성능을 기록했다.

 

라마 2 70B LoRA 미세 조정 벤치마크에서는 블랙웰 GPU 8개가 탑재된 엔비디아 DGX B200 시스템이 이전 라운드에서 동일 GPU 수로 제출한 결과보다 2.5배 더 높은 성능을 달성했다.

 

이러한 성능 도약은 블랙웰 아키텍처의 기술적 진보를 잘 보여준다. 여기에는 고밀도 수랭식 랙, 랙당 13.4 테라바이트(TB)의 코히어런트 메모리, 스케일업(scale-up)을 위한 5세대 엔비디아 NV링크(NVLink)와 엔비디아 NV링크 스위치(Switch) 상호연결 기술, 그리고 스케일 아웃(scale-out)을 위한 엔비디아 퀀텀-2 인피니밴드(Quantum-2 InfiniBand) 네트워킹 등이 포함된다. 또한 엔비디아 네모 프레임워크(NeMo Framework) 소프트웨어 스택의 혁신은 에이전틱 AI 애플리케이션 실현에 핵심적인 기반이 되는 차세대 멀티모달 LLM 훈련의 기준을 높였다.

 

이러한 에이전틱 AI 기반 애플리케이션은 미래의 AI 팩토리에서 작동하게 되며, 이는 곧 에이전틱 AI 경제의 핵심 엔진으로 자리잡을 전망이다. 이러한 새로운 애플리케이션은 토큰과 지능 정보를 생성하며, 거의 모든 산업과 학문 분야에 걸쳐 가치를 창출할 수 있다.

 

엔비디아 데이터센터 플랫폼에는 GPU, CPU, 고속 패브릭, 네트워킹은 물론 엔비디아 쿠다-X(CUDA-X) 라이브러리, 네모 프레임워크, 엔비디아 텐서RT-LLM(TensorRT-LLM), 엔비디아 다이나모(Dynamo)와 같은 방대한 소프트웨어가 포함된다. 이처럼 정밀한 하드웨어와 소프트웨어 기술 조합은 조직이 AI 모델을 더 빠르게 훈련하고 배포할 수 있게 해 가치 실현 시간을 획기적으로 단축시킨다.

 

이번 MLPerf 라운드에는 코어위브와 IBM 외에도 다양한 엔비디아 파트너사들이 참여했다. 에이수스(ASUS), 시스코(Cisco), 델 테크놀로지스(Dell Technologies), 기가컴퓨팅(Giga Computing), 구글 클라우드(Google Cloud), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE), 람다(Lambda), 레노버(Lenovo), 네비우스(Nebius), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure, OCI), 퀀타 클라우드 테크놀로지(Quanta Cloud Technology), 슈퍼마이크로(Supermicro) 등이 다양한 벤치마크 결과를 제출했다.

 

#엔비디아#MLPerf#라마#블랙웰#

?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
4274 자브라 코리아, '에티버스 이피에이'와 엔터프라이즈 사업부 국내 총판 계약 체결 file newsit 2025.06.09 64
4273 와콤, 2025 신제품 ‘신티크16/24’ 및 ‘신티크 24 터치’ 출시 file newsit 2025.06.05 69
» 엔비디아, 최신 MLPerf 훈련에서 블랙웰 아키텍처로 획기적 성능 입증 file newsit 2025.06.05 271
4271 레노버-모토로라, ‘FIFA 클럽 월드컵 2025’ 공식 파트너십 체결 file newsit 2025.06.05 515
4270 어플라이드 머티어리얼즈 코리아, ‘환경의 날’ 맞아 환경부 장관 표창 수상 file newsit 2025.06.05 276
4269 티머니모빌리티, 업계 최초 'PCI-DSS' 최고 레벨 획득…‘생활밀착형 모빌리티 핀테크&플랫폼’ 최고 보안성 입증 file newsit 2025.06.04 70
4268 노르딕 세미컨덕터, 5G ‘NB-IoT’ 위성 데모 성공적으로 시연 file newsit 2025.06.04 259
4267 스노우플레이크 ‘코텍스 AISQL’ 및 ‘스노우컨버트 AI’ 공개… 자사 AI 분석 기능 강화 file newsit 2025.06.04 388
4266 마에스트로 포렌식, ‘디지털 포렌식 & 침해사고 포렌식 세미나’ 개최…“침해사고 대응 및 디지털 증거 분석” file newsit 2025.06.04 100
4265 로지텍, 무선 마우스·키보드 사용자 위한 ‘로지 볼트’ USB-C 리시버 출시…“유연한 업무 환경 지원” file newsit 2025.06.04 65
4264 MSI, 스테디셀러 메인보드 ‘MAG B850M 박격포’ 출시 file newsit 2025.05.31 70
4263 마우저, 마이크로칩의 PIC32A 고성능 32비트 마이크로컨트롤러 공급 file newsit 2025.05.30 262
4262 비트센싱, IKIO 테크놀로지스와 MOU 체결…“인도 뭄바이–뉴델리 고속도로 AI 기반 교통 모니터링 구축” file newsit 2025.05.30 282
4261 EDB코리아, 오픈소스DBMS 활용한 ‘불황 타개 위한 IT 전략’ 발표   file newsit 2025.05.30 307
4260 티피링크, 6.5Gbps 지원 와이파이7 공유기 「Archer BE400」 출시 file newsit 2025.05.30 113
4259 ST, 다채널 구성 가능한 자동차 드라이버 신제품 「L9026」 출시  file newsit 2025.05.30 275
4258 캐논코리아, 초소형·초경량 휴대용 프린터 「PIXMA TR160」 출시 file newsit 2025.05.30 63
4257 벡터, 전기차 메가와트 충전용 통신 컨트롤러(vSECC.MCS) 출시 file newsit 2025.05.30 146
4256 알리바바 그룹–SAP, ‘AI 기반 디지털 전환 가속화’ 전략적 파트너십 체결 file newsit 2025.05.29 342
4255 샌디스크, 콘텐츠 크리에이터용 스토리지 솔루션 ‘샌디스크 크리에이터 시리즈’ 국내 출시 file newsit 2025.05.29 66
Board Pagination Prev 1 ... 31 32 33 34 35 36 37 38 39 40 ... 249 Next
/ 249
CLOSE