- 블랙웰 B200, 텐서RT LLM v1.0과 병렬화·추측 디코딩 기술로 처리량 3배 증가

- GB200 NVL72 5백만 달러 투자로 75백만 달러 수익15ROI 달성

 

엔비디아, 새로운 인퍼런스MAX 벤치마크서 압도적인 블랙웰 성능 입증.jpg

 

 

엔비디아는 차세대 AI 플랫폼 블랙웰(NVIDIA Blackwell)이 새로 발표된 인퍼런스MAX(InferenceMAX) v1 벤치마크에서 최고 성능을 기록했다고 밝혔다. 이번 결과는 블랙웰이 AI 추론 분야에서 높은 처리량과 효율성, 비용 경쟁력을 동시에 갖췄음을 보여주며, 풀스택 하드웨어·소프트웨어 공동 설계를 기반으로 AI 데이터센터의 생산성과 투자수익률(ROI)을 크게 향상시켰음을 입증했다.

 

엔비디아 GB200 NVL72 시스템에 5백만 달러를 투자하면 75백만 달러의 토큰 수익을 창출할 수 있어 15ROI를 달성한다. 블랙웰 B200 시스템은 텐서RT LLM v1.0, 고급 병렬화 기술, 추측 디코딩 방식을 활용해 gpt-oss-120b 모델의 처리량을 3배 향상시키며 GPU6TPS를 기록했다. 라마 3.3 70B 등 밀집형 AI 모델에서도 인퍼런스MAX v1 벤치마크를 통해 새로운 성능 표준을 제시했다.

 5백만 달러 규모의 GB200 NVL72 투자로 7천5백만 달러의 토큰 수익 창출 가능.jpg

 

블랙웰은 GPU1TPS 이상, 사용자당 상호작용성 기준 50 TPS를 제공하며, 엔비디아 H200 대비 GPU 당 처리량이 4배 향상됐다. 와트당 토큰 수, 백만 토큰당 비용, 사용자당 TPS 등 효율성 지표에서도 탁월한 성과를 보이며, 전력이 제한된 AI 팩토리 환경에서도 토큰 수익과 처리량을 극대화한다.

 

엔비디아는 하드웨어와 소프트웨어 공동 설계, 텐서RT-LLM, 다이나모(Dynamo), SGLang, vLLM 등 오픈소스 추론 프레임워크, NV링크 스위치와 NVFP4 저정밀도 포맷 등 기술을 통해 지속적인 성능 향상을 실현했다. 또한, 오픈AI, 메타, 딥시크 AI 등과 협업해 최신 모델이 대규모 AI 인프라에서 최적 성능을 발휘하도록 지원한다.

 엔비디아 블랙웰 B200 NVL8, GPU당 최대 6만 TPS 처리량 달성.jpg

인퍼런스MAX v1 벤치마크는 데이터센터 처리량과 반응성, 비용, 에너지 효율성을 종합적으로 평가하며, 블랙웰의 풀스택 설계가 실제 AI 배포에서 최고의 ROI를 제공함을 입증했다. 엔비디아는 이러한 성과를 통해 AI 추론의 경제성과 성능, 확장성을 동시에 향상시키는 플랫폼 리더십을 강화하고 있다.

 

#엔비디아 #블랙웰 #InferenceMAX #AI추론 #텐서RT #B200 #GPU #AI데이터센터 #ROI #추측디코딩 #AI성능

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1978 레노버, 에이전트 AI 통합한 ‘AI 지원 인력 포트폴리오’로 업무 혁신 가속화 레노버(Lenovo)가 에이전트 AI(Agentic AI) 기술을 통합한 ‘AI 지원 인력 포트폴리오(AI-Powered Workforce Portfolio)’를 공개하며 기업의 업무 혁신을 가속화한... file newsit 2025.10.21 209
1977 티맥스티베로, ‘K-OpenSource X AI in Seoul 2025’ 참가...데이터·오픈소스 기반 AI 전략 제시 데이터베이스 관리 시스템(DBMS) 전문 기업 티맥스티베로가 오는 27일 서울 과학기술회관에서 열리는 ‘K-OpenSource X AI in Seoul 2025’에서 AI 시대의 데이터베... file newsit 2025.10.21 208
1976 유아이패스, 구글 제미나이 기반 음성 에이전트로 에이전틱 자동화 혁신 가속화 에이전틱 자동화 분야의 글로벌 리더 유아이패스(UiPath) 가 구글 제미나이(Gemini) 모델을 기반으로 음성 대화를 지원하는 유아이패스 대화형 에이전트(UiPath C... file newsit 2025.10.21 229
1975 가트너, 2026년 10대 전략 기술 트렌드 발표… AI·보안·신뢰의 삼각축 부상 - AI 초연결 시대, ‘책임감 있는 혁신’이 관건 AI 기술이 산업의 중심축으로 자리잡은 가운데, 가트너(Gartner)가 발표한 ‘2026년 10대 전략 기술 트렌드’는 단순... file newsit 2025.10.21 214
1974 슈나이더 일렉트릭, 스마트십 특화 ‘프로페이스 HMI GP6000’ 시리즈로 선박 자동화 강화 - 극한 해양 환경에 최적화된 견고한 설계…진동·염분·습기 등 외부 요인에도 안정적 운영 - 에너지 절감·친환경 설계로 IMO 환경 규제 대응 슈나이더 일렉트릭이 ... file newsit 2025.10.21 183
1973 EDB코리아, 재난 상황 대비 ‘무중단 서비스’ 구현 방안 발표 – 분산형 DBMS ‘EDB Postgres Distributed(PGD) 6.0’으로 공공·금융 DR 혁신 지원 – 찾아가는 맞춤형 컨설팅·세미나로 국내 고객 기술 지원 강화 글로벌 오픈소스... file newsit 2025.10.21 203
1972 오나인솔루션즈, ‘2025 Gartner Peer Insights 고객의 선택’ 선정..."고객 94%가 'o9 Digital Brain' 플랫폼 추천" – 공급망 계획 솔루션 부문 유일한 Customers’ Choice 기업 엔터프라이즈 AI SaaS 플랫폼 기업 오나인솔루션즈(o9 Solutions)는 ‘2025 Gartner Peer Insights 공... file newsit 2025.10.20 185
1971 오라클, ‘OCI 전용 리전25’ 공개… 신속한 AI·클라우드 서비스 배포 지원 - 최소 3개 랙 구성으로 단 몇 주 만에 200여 개 AI·클라우드 서비스 제공 - 데이터 주권 강화 및 소규모 환경에서도 전용 클라우드 구현 지원 오라클(Oracle)은 ... file newsit 2025.10.20 192
1970 윈드리버-블랙박스, 지능형 엣지·프라이빗 클라우드 혁신 전략적 파트너십 체결 - 산업·제조·금융 등 주요 산업군 대상 차세대 디지털 인프라 전환 가속 윈드리버(Wind River)가 디지털 인프라 전문기업 블랙박스(Black Box)와 전략적 파트너십... file newsit 2025.10.20 186
1969 비트센싱·코리아와이드, 500대 버스 대상 ADAS 실증 프로젝트 본격화 - 비트센싱, 코리아와이드 경북고속·진안고속과 협력해 상용차용 운전자 보조 시스템 실증 - 레이더·카메라 통합 ADAS Kit 설치, 전방·측면·차선·보행자 감지 기... file newsit 2025.10.17 211
목록
Board Pagination Prev 1 ... 31 32 33 34 35 36 37 38 39 40 ... 233 Next
/ 233
CLOSE