- 블랙웰 B200, 텐서RT LLM v1.0과 병렬화·추측 디코딩 기술로 처리량 3배 증가

- GB200 NVL72 5백만 달러 투자로 75백만 달러 수익15ROI 달성

 

엔비디아, 새로운 인퍼런스MAX 벤치마크서 압도적인 블랙웰 성능 입증.jpg

 

 

엔비디아는 차세대 AI 플랫폼 블랙웰(NVIDIA Blackwell)이 새로 발표된 인퍼런스MAX(InferenceMAX) v1 벤치마크에서 최고 성능을 기록했다고 밝혔다. 이번 결과는 블랙웰이 AI 추론 분야에서 높은 처리량과 효율성, 비용 경쟁력을 동시에 갖췄음을 보여주며, 풀스택 하드웨어·소프트웨어 공동 설계를 기반으로 AI 데이터센터의 생산성과 투자수익률(ROI)을 크게 향상시켰음을 입증했다.

 

엔비디아 GB200 NVL72 시스템에 5백만 달러를 투자하면 75백만 달러의 토큰 수익을 창출할 수 있어 15ROI를 달성한다. 블랙웰 B200 시스템은 텐서RT LLM v1.0, 고급 병렬화 기술, 추측 디코딩 방식을 활용해 gpt-oss-120b 모델의 처리량을 3배 향상시키며 GPU6TPS를 기록했다. 라마 3.3 70B 등 밀집형 AI 모델에서도 인퍼런스MAX v1 벤치마크를 통해 새로운 성능 표준을 제시했다.

 5백만 달러 규모의 GB200 NVL72 투자로 7천5백만 달러의 토큰 수익 창출 가능.jpg

 

블랙웰은 GPU1TPS 이상, 사용자당 상호작용성 기준 50 TPS를 제공하며, 엔비디아 H200 대비 GPU 당 처리량이 4배 향상됐다. 와트당 토큰 수, 백만 토큰당 비용, 사용자당 TPS 등 효율성 지표에서도 탁월한 성과를 보이며, 전력이 제한된 AI 팩토리 환경에서도 토큰 수익과 처리량을 극대화한다.

 

엔비디아는 하드웨어와 소프트웨어 공동 설계, 텐서RT-LLM, 다이나모(Dynamo), SGLang, vLLM 등 오픈소스 추론 프레임워크, NV링크 스위치와 NVFP4 저정밀도 포맷 등 기술을 통해 지속적인 성능 향상을 실현했다. 또한, 오픈AI, 메타, 딥시크 AI 등과 협업해 최신 모델이 대규모 AI 인프라에서 최적 성능을 발휘하도록 지원한다.

 엔비디아 블랙웰 B200 NVL8, GPU당 최대 6만 TPS 처리량 달성.jpg

인퍼런스MAX v1 벤치마크는 데이터센터 처리량과 반응성, 비용, 에너지 효율성을 종합적으로 평가하며, 블랙웰의 풀스택 설계가 실제 AI 배포에서 최고의 ROI를 제공함을 입증했다. 엔비디아는 이러한 성과를 통해 AI 추론의 경제성과 성능, 확장성을 동시에 향상시키는 플랫폼 리더십을 강화하고 있다.

 

#엔비디아 #블랙웰 #InferenceMAX #AI추론 #텐서RT #B200 #GPU #AI데이터센터 #ROI #추측디코딩 #AI성능

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1998 아마존, 2031년까지 한국 클라우드 인프라에 7조 원 추가 투자 - 글로벌 클라우드 사업자 국내 투자 계획 중 역대 최대 규모 - 2031년까지 국내 총 누적 투자 12조 6,000억 원 전망 아마존웹서비스(AWS)는 2025년부터 2031년까... file newsit 2025.10.29 161
1997 델, AI 성과 가속화 위한 ‘델 AI 데이터 플랫폼’ 대규모 업데이트 발표 – 데이터 사일로 해소 및 실시간 인사이트 제공으로 AI 워크로드 최적화 – 엔비디아·엘라스틱·스타버스트와 협력해 데이터 엔진 기능 확장 델(Dell)이 AI 성과를 ... file newsit 2025.10.29 170
1996 데클라, 관세 불확실성 극복 위한 AI 기반 공급망 분석 플랫폼 공개 - ‘글로벌 무역로 위험 계획 AI 플랫폼’ 통해 운영 리스크 정량화·무역로 재설계 지원 AI 기반 글로벌 공급망 의사결정 솔루션 기업 데클라(Decklar)가 미국의 관... file newsit 2025.10.29 160
1995 HPE, 오크리지 국립연구소에 차세대 엑사스케일 슈퍼컴퓨터 ‘디스커버리’ 및 AI 클러스터 ‘럭스’ 구축 - AI·HPC 융합시대 위한 GX5000 및 K3000 플랫폼 기반, 과학 연구·AI 혁신 가속 HPE는 미국 에너지부(DOE) 산하 오크리지 국립연구소(ORNL)에 차세대 엑사스케일 ... file newsit 2025.10.28 189
1994 사이버다임, ‘AI Assistant’ 출시…문서중앙화에 AI 결합으로 지식 활용 혁신 가속 문서중앙화 및 데이터 보안 전문기업 사이버다임이 기업의 지식 활용 효율을 높이고 업무 혁신을 지원하는 AI 기반 기능 ‘AI Assistant’를 출시했다고 밝혔다. 이... file newsit 2025.10.28 188
1993 레드햇, ‘레드햇 서밋 커넥트 서울 2025’ 성료...오픈소스 기반 혁신 전략과 AI 플랫폼 비전 공유 - 클라우드에서 생성형 AI 시대로 레드햇(Red Hat)은 오늘 <레드햇 서밋: 커넥트 서울 2025(Red Hat Summit: Connect Seoul 2025)>를 성황리에 마무리하고, 클라... file newsit 2025.10.28 204
1992 데이터독, ‘데이터독 서밋 서울 2025’ 개최…AI 옵저버빌리티·보안 혁신 사례 공유 - AI 시대의 옵저버빌리티와 보안 혁신을 주제로 국내 첫 커뮤니티 컨퍼런스 개최 클라우드 애플리케이션 모니터링 및 보안 플랫폼 기업 데이터독(Datadog, NASDA... file newsit 2025.10.28 186
1991 슈나이더 일렉트릭, ‘그린쉽 솔루션’으로 해운업계 탄소중립 가속화 – PME 기반 통합 전력 관리로 선박 에너지 효율·안정성 강화 슈나이더 일렉트릭이 선박의 에너지 효율을 극대화하고 탄소 배출을 저감할 수 있는 통합 전력 관리 ... file newsit 2025.10.28 179
1990 티맥스티베로, 전 제품군 브랜드 아이덴티티 리뉴얼…AI 시대 데이터 혁신 기업으로 재도약 – 새 BI 공개와 핵심 철학, AI 시대 데이터 전략 강화, 글로벌 확장 비전 티맥스티베로가 자사 대표 솔루션 티베로 DB(Tibero DB)를 포함한 전 제품군의 브랜드 ... file newsit 2025.10.27 206
1989 다쏘시스템, 국내 최초 LCA·DPP Cofinity X 연계 프로젝트 수주 - 데이터 기반 협업으로 한국 기업의 글로벌 지속가능성 경쟁력 강화 국내 최초 LCA·DPP 통합 프로젝트 AI 버추얼 트윈 기업 다쏘시스템이 바이오소재 스타트업 ... file newsit 2025.10.27 154
목록
Board Pagination Prev 1 ... 29 30 31 32 33 34 35 36 37 38 ... 233 Next
/ 233
CLOSE