- 블랙웰 B200, 텐서RT LLM v1.0과 병렬화·추측 디코딩 기술로 처리량 3배 증가

- GB200 NVL72 5백만 달러 투자로 75백만 달러 수익15ROI 달성

 

엔비디아, 새로운 인퍼런스MAX 벤치마크서 압도적인 블랙웰 성능 입증.jpg

 

 

엔비디아는 차세대 AI 플랫폼 블랙웰(NVIDIA Blackwell)이 새로 발표된 인퍼런스MAX(InferenceMAX) v1 벤치마크에서 최고 성능을 기록했다고 밝혔다. 이번 결과는 블랙웰이 AI 추론 분야에서 높은 처리량과 효율성, 비용 경쟁력을 동시에 갖췄음을 보여주며, 풀스택 하드웨어·소프트웨어 공동 설계를 기반으로 AI 데이터센터의 생산성과 투자수익률(ROI)을 크게 향상시켰음을 입증했다.

 

엔비디아 GB200 NVL72 시스템에 5백만 달러를 투자하면 75백만 달러의 토큰 수익을 창출할 수 있어 15ROI를 달성한다. 블랙웰 B200 시스템은 텐서RT LLM v1.0, 고급 병렬화 기술, 추측 디코딩 방식을 활용해 gpt-oss-120b 모델의 처리량을 3배 향상시키며 GPU6TPS를 기록했다. 라마 3.3 70B 등 밀집형 AI 모델에서도 인퍼런스MAX v1 벤치마크를 통해 새로운 성능 표준을 제시했다.

 5백만 달러 규모의 GB200 NVL72 투자로 7천5백만 달러의 토큰 수익 창출 가능.jpg

 

블랙웰은 GPU1TPS 이상, 사용자당 상호작용성 기준 50 TPS를 제공하며, 엔비디아 H200 대비 GPU 당 처리량이 4배 향상됐다. 와트당 토큰 수, 백만 토큰당 비용, 사용자당 TPS 등 효율성 지표에서도 탁월한 성과를 보이며, 전력이 제한된 AI 팩토리 환경에서도 토큰 수익과 처리량을 극대화한다.

 

엔비디아는 하드웨어와 소프트웨어 공동 설계, 텐서RT-LLM, 다이나모(Dynamo), SGLang, vLLM 등 오픈소스 추론 프레임워크, NV링크 스위치와 NVFP4 저정밀도 포맷 등 기술을 통해 지속적인 성능 향상을 실현했다. 또한, 오픈AI, 메타, 딥시크 AI 등과 협업해 최신 모델이 대규모 AI 인프라에서 최적 성능을 발휘하도록 지원한다.

 엔비디아 블랙웰 B200 NVL8, GPU당 최대 6만 TPS 처리량 달성.jpg

인퍼런스MAX v1 벤치마크는 데이터센터 처리량과 반응성, 비용, 에너지 효율성을 종합적으로 평가하며, 블랙웰의 풀스택 설계가 실제 AI 배포에서 최고의 ROI를 제공함을 입증했다. 엔비디아는 이러한 성과를 통해 AI 추론의 경제성과 성능, 확장성을 동시에 향상시키는 플랫폼 리더십을 강화하고 있다.

 

#엔비디아 #블랙웰 #InferenceMAX #AI추론 #텐서RT #B200 #GPU #AI데이터센터 #ROI #추측디코딩 #AI성능

 
?

  1. 오나인솔루션즈, ‘2025 Gartner Peer Insights 고객의 선택’ 선정..."고객 94%가 'o9 Digital Brain' 플랫폼 추천"

    – 공급망 계획 솔루션 부문 유일한 Customers’ Choice 기업 엔터프라이즈 AI SaaS 플랫폼 기업 오나인솔루션즈(o9 Solutions)는 ‘2025 Gartner Peer Insights 공급망 계획 솔루션(Supply Chain Planning Solutions)’ 부문에서 유일하게 ‘고객의 선택(Customers...
    Date2025.10.20 Bynewsit Views157
    Read More
  2. 오라클, ‘OCI 전용 리전25’ 공개… 신속한 AI·클라우드 서비스 배포 지원

    - 최소 3개 랙 구성으로 단 몇 주 만에 200여 개 AI·클라우드 서비스 제공 - 데이터 주권 강화 및 소규모 환경에서도 전용 클라우드 구현 지원 오라클(Oracle)은 기업이 퍼블릭 클라우드의 민첩성과 경제성을 자사 환경에서도 누릴 수 있도록 ‘오라클 클라우드...
    Date2025.10.20 Bynewsit Views157
    Read More
  3. 윈드리버-블랙박스, 지능형 엣지·프라이빗 클라우드 혁신 전략적 파트너십 체결

    - 산업·제조·금융 등 주요 산업군 대상 차세대 디지털 인프라 전환 가속 윈드리버(Wind River)가 디지털 인프라 전문기업 블랙박스(Black Box)와 전략적 파트너십을 체결했다. 양사는 이번 협력을 통해 산업, 제조, 소매, 금융, 자동차, 통신 등 다양한 시장에...
    Date2025.10.20 Bynewsit Views146
    Read More
  4. 비트센싱·코리아와이드, 500대 버스 대상 ADAS 실증 프로젝트 본격화

    - 비트센싱, 코리아와이드 경북고속·진안고속과 협력해 상용차용 운전자 보조 시스템 실증 - 레이더·카메라 통합 ADAS Kit 설치, 전방·측면·차선·보행자 감지 기능 제공 - 10월 22~25일 ‘FIX 2025’에서 버스 실증 운행 및 체험 기회 제공 최첨단 레이더 솔루션...
    Date2025.10.17 Bynewsit Views160
    Read More
  5. 마젠타로보틱스, FAST 솔루션 설명회 성료… 도장 자동화 혁신 제시

    - 레인보우로보틱스 협동로봇과 AI 기술 결합한 고객 맞춤형 솔루션 공개 - 중대재해처벌법 대응·인건비 절감·안전사고 제로화를 위한 최적 해법 제시 20도장 자동화 SI 전문기업 마젠타로보틱스가 10월 13일 대전컨벤션센터(DCC)에서 ‘마젠타로보틱스 FAST 솔...
    Date2025.10.17 Bynewsit Views161
    Read More
  6. Arm-Meta, AI 효율성 극대화 위한 전략적 협력 강화

    - 메가와트급 데이터센터부터 밀리와트급 디바이스까지… 전 영역서 AI 성능 최적화 Arm이 Meta와의 전략적 파트너십을 확대하며 AI 컴퓨팅 효율성 강화를 위한 협력 범위를 넓힌다. 양사는 AI 소프트웨어부터 데이터센터 인프라까지 전 영역에서 협업을 강화해...
    Date2025.10.17 Bynewsit Views184
    Read More
  7. 오라클-AMD, 차세대 AI 슈퍼클러스터 구축 위해 파트너십 확대

    오라클과 AMD가 차세대 AI 워크로드 확장을 위한 전략적 협력을 강화한다. 양사는 2026년 3분기부터 AMD 인스팅트 MI450 시리즈 GPU 5만 개로 구동되는 공개형 AI 슈퍼클러스터를 OCI에 제공하며, 이는 하이퍼스케일러 최초의 시도다. 이번 협력은 2024년 AMD ...
    Date2025.10.17 Bynewsit Views161
    Read More
  8. 오라클, ‘멀티클라우드 유니버설 크레딧’ 공개

    오라클이 업계 최초로 크로스-클라우드 사용 모델을 지원하는 ‘멀티클라우드 유니버설 크레딧(Oracle Multicloud Universal Credits)’을 발표했다. 이 라이선스 옵션을 통해 기업은 AWS, 구글 클라우드, 마이크로소프트 애저, 그리고 OCI 환경에서 오라클 AI ...
    Date2025.10.17 Bynewsit Views169
    Read More
  9. 유아이패스, 에이전틱 플랫폼에 마이크로소프트 애저 AI 파운드리 통합

    - 양사 협력 통해 마이크로소프트 고객에 산업 전반 에이전트·자동화·오케스트레이션 기능 제공 - 의료 영상 분석 등 실제 워크플로우 중심의 AI 에이전트 활용 사례 확장 유아이패스는 자사 에이전틱 자동화·오케스트레이션 플랫폼에 마이크로소프트 애저 AI ...
    Date2025.10.16 Bynewsit Views162
    Read More
  10. 오라클, 차세대 OCI ‘제타스케일10 AI 클러스터’ 공개

    - 클라우드 환경 내 최대 규모의 AI 슈퍼컴퓨터… 기존 대비 10배 향상된 제타플롭스급 성능 제공 - 엔비디아 AI 인프라 기반 오라클 액셀러론 RoCE 네트워킹 아키텍처로 멀티 기가와트급 AI 워크로드 처리·확장성 구현 오라클이 차세대 오라클 클라우드 인프라...
    Date2025.10.16 Bynewsit Views152
    Read More
목록
Board Pagination Prev 1 ... 20 21 22 23 24 25 26 27 28 29 ... 222 Next
/ 222
CLOSE