- 블랙웰 B200, 텐서RT LLM v1.0과 병렬화·추측 디코딩 기술로 처리량 3배 증가

- GB200 NVL72 5백만 달러 투자로 75백만 달러 수익15ROI 달성

 

엔비디아, 새로운 인퍼런스MAX 벤치마크서 압도적인 블랙웰 성능 입증.jpg

 

 

엔비디아는 차세대 AI 플랫폼 블랙웰(NVIDIA Blackwell)이 새로 발표된 인퍼런스MAX(InferenceMAX) v1 벤치마크에서 최고 성능을 기록했다고 밝혔다. 이번 결과는 블랙웰이 AI 추론 분야에서 높은 처리량과 효율성, 비용 경쟁력을 동시에 갖췄음을 보여주며, 풀스택 하드웨어·소프트웨어 공동 설계를 기반으로 AI 데이터센터의 생산성과 투자수익률(ROI)을 크게 향상시켰음을 입증했다.

 

엔비디아 GB200 NVL72 시스템에 5백만 달러를 투자하면 75백만 달러의 토큰 수익을 창출할 수 있어 15ROI를 달성한다. 블랙웰 B200 시스템은 텐서RT LLM v1.0, 고급 병렬화 기술, 추측 디코딩 방식을 활용해 gpt-oss-120b 모델의 처리량을 3배 향상시키며 GPU6TPS를 기록했다. 라마 3.3 70B 등 밀집형 AI 모델에서도 인퍼런스MAX v1 벤치마크를 통해 새로운 성능 표준을 제시했다.

 5백만 달러 규모의 GB200 NVL72 투자로 7천5백만 달러의 토큰 수익 창출 가능.jpg

 

블랙웰은 GPU1TPS 이상, 사용자당 상호작용성 기준 50 TPS를 제공하며, 엔비디아 H200 대비 GPU 당 처리량이 4배 향상됐다. 와트당 토큰 수, 백만 토큰당 비용, 사용자당 TPS 등 효율성 지표에서도 탁월한 성과를 보이며, 전력이 제한된 AI 팩토리 환경에서도 토큰 수익과 처리량을 극대화한다.

 

엔비디아는 하드웨어와 소프트웨어 공동 설계, 텐서RT-LLM, 다이나모(Dynamo), SGLang, vLLM 등 오픈소스 추론 프레임워크, NV링크 스위치와 NVFP4 저정밀도 포맷 등 기술을 통해 지속적인 성능 향상을 실현했다. 또한, 오픈AI, 메타, 딥시크 AI 등과 협업해 최신 모델이 대규모 AI 인프라에서 최적 성능을 발휘하도록 지원한다.

 엔비디아 블랙웰 B200 NVL8, GPU당 최대 6만 TPS 처리량 달성.jpg

인퍼런스MAX v1 벤치마크는 데이터센터 처리량과 반응성, 비용, 에너지 효율성을 종합적으로 평가하며, 블랙웰의 풀스택 설계가 실제 AI 배포에서 최고의 ROI를 제공함을 입증했다. 엔비디아는 이러한 성과를 통해 AI 추론의 경제성과 성능, 확장성을 동시에 향상시키는 플랫폼 리더십을 강화하고 있다.

 

#엔비디아 #블랙웰 #InferenceMAX #AI추론 #텐서RT #B200 #GPU #AI데이터센터 #ROI #추측디코딩 #AI성능

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
4859 Arm-Meta, AI 효율성 극대화 위한 전략적 협력 강화 file newsit 2025.10.17 222
4858 오라클-AMD, 차세대 AI 슈퍼클러스터 구축 위해 파트너십 확대 file newsit 2025.10.17 182
4857 오라클, ‘멀티클라우드 유니버설 크레딧’ 공개 file newsit 2025.10.17 186
4856 캐논코리아, 고속·고품질 잉크젯 복합기 ‘PIXMA TS’ 시리즈 출시 file newsit 2025.10.17 107
4855 엔비디아, ‘아크 레이더스’·‘팍스 데이’ 등 신작 6종에 DLSS 4 지원 file newsit 2025.10.16 118
4854 유아이패스, 에이전틱 플랫폼에 마이크로소프트 애저 AI 파운드리 통합 file newsit 2025.10.16 174
4853 오라클, 차세대 OCI ‘제타스케일10 AI 클러스터’ 공개 file newsit 2025.10.16 173
4852 카스퍼스키, 3분기 국내 보안 위협 트렌드 공개…로컬 공격 245만 건 돌파 file newsit 2025.10.16 101
4851 쿤텍, ETRI와 온디바이스 AI 보안 난독화 기술 공동 개발 추진 file newsit 2025.10.16 99
4850 지멘스, ‘Simcenter Testlab’에 AI 기능 추가…모달 테스트 및 분석 프로세스 혁신 file newsit 2025.10.16 196
4849 넷앱, AI 혁신 가속하는 엔터프라이즈급 데이터 플랫폼 공개 file newsit 2025.10.16 153
4848 이글루코퍼레이션-소프트캠프, N2SF 전환 사업 협력 MOU 체결 file newsit 2025.10.16 103
4847 슈나이더 일렉트릭, 실시간 모터 관리 솔루션 ‘테시스 테라’로 해양산업 효율성 극대화 file newsit 2025.10.16 195
4846 엑시스, ‘엑시스 솔루션 컨퍼런스 2025’ 성료…AI 기반 보안 혁신 제시 file newsit 2025.10.16 92
4845 레인보우로보틱스-디스펙터, 4족보행 순찰로봇 공동 개발 협력…공공 인프라 안전 관리 혁신 file newsit 2025.10.15 191
4844 AMD, 메타 기반 오픈 컴퓨트 프로젝트(OCP) AI용 ‘헬리오스’ 랙 스케일 플랫폼 공개 file newsit 2025.10.15 202
4843 티머니모빌리티, 한국관광공사와 손잡고 가을여행 프로모션 진행 file newsit 2025.10.15 132
4842 캐논코리아, 카메라 구매 고객 대상 ‘연말맞이 정품등록 프로모션’ 실시 file newsit 2025.10.15 107
4841 마우저, 설계 엔지니어와 구매 담당자를 위해 르네사스 최신 기술 공급 확대 file newsit 2025.10.15 154
4840 세일즈포스, 에이전틱 AI 기반 통합 플랫폼 ‘에이전트포스 360’ 발표 file newsit 2025.10.15 211
Board Pagination Prev 1 ... 28 29 30 31 32 33 34 35 36 37 ... 275 Next
/ 275
CLOSE