- 블랙웰 B200, 텐서RT LLM v1.0과 병렬화·추측 디코딩 기술로 처리량 3배 증가

- GB200 NVL72 5백만 달러 투자로 75백만 달러 수익15ROI 달성

 

엔비디아, 새로운 인퍼런스MAX 벤치마크서 압도적인 블랙웰 성능 입증.jpg

 

 

엔비디아는 차세대 AI 플랫폼 블랙웰(NVIDIA Blackwell)이 새로 발표된 인퍼런스MAX(InferenceMAX) v1 벤치마크에서 최고 성능을 기록했다고 밝혔다. 이번 결과는 블랙웰이 AI 추론 분야에서 높은 처리량과 효율성, 비용 경쟁력을 동시에 갖췄음을 보여주며, 풀스택 하드웨어·소프트웨어 공동 설계를 기반으로 AI 데이터센터의 생산성과 투자수익률(ROI)을 크게 향상시켰음을 입증했다.

 

엔비디아 GB200 NVL72 시스템에 5백만 달러를 투자하면 75백만 달러의 토큰 수익을 창출할 수 있어 15ROI를 달성한다. 블랙웰 B200 시스템은 텐서RT LLM v1.0, 고급 병렬화 기술, 추측 디코딩 방식을 활용해 gpt-oss-120b 모델의 처리량을 3배 향상시키며 GPU6TPS를 기록했다. 라마 3.3 70B 등 밀집형 AI 모델에서도 인퍼런스MAX v1 벤치마크를 통해 새로운 성능 표준을 제시했다.

 5백만 달러 규모의 GB200 NVL72 투자로 7천5백만 달러의 토큰 수익 창출 가능.jpg

 

블랙웰은 GPU1TPS 이상, 사용자당 상호작용성 기준 50 TPS를 제공하며, 엔비디아 H200 대비 GPU 당 처리량이 4배 향상됐다. 와트당 토큰 수, 백만 토큰당 비용, 사용자당 TPS 등 효율성 지표에서도 탁월한 성과를 보이며, 전력이 제한된 AI 팩토리 환경에서도 토큰 수익과 처리량을 극대화한다.

 

엔비디아는 하드웨어와 소프트웨어 공동 설계, 텐서RT-LLM, 다이나모(Dynamo), SGLang, vLLM 등 오픈소스 추론 프레임워크, NV링크 스위치와 NVFP4 저정밀도 포맷 등 기술을 통해 지속적인 성능 향상을 실현했다. 또한, 오픈AI, 메타, 딥시크 AI 등과 협업해 최신 모델이 대규모 AI 인프라에서 최적 성능을 발휘하도록 지원한다.

 엔비디아 블랙웰 B200 NVL8, GPU당 최대 6만 TPS 처리량 달성.jpg

인퍼런스MAX v1 벤치마크는 데이터센터 처리량과 반응성, 비용, 에너지 효율성을 종합적으로 평가하며, 블랙웰의 풀스택 설계가 실제 AI 배포에서 최고의 ROI를 제공함을 입증했다. 엔비디아는 이러한 성과를 통해 AI 추론의 경제성과 성능, 확장성을 동시에 향상시키는 플랫폼 리더십을 강화하고 있다.

 

#엔비디아 #블랙웰 #InferenceMAX #AI추론 #텐서RT #B200 #GPU #AI데이터센터 #ROI #추측디코딩 #AI성능

 
?

  1. [AW2026] 슈나이더 일렉트릭 코리아, AI 기반 통합 자동화 전략 공개

    - 개방형 플랫폼 기반 산업 데이터 통합·분석 구조 제시 - 디지털 트윈·AI 데이터 분석으로 자율제조 경쟁력 강화 슈나이더 일렉트릭 코리아가 ‘2026 스마트공장·자동화산업전(AW 2026)’에서 AI 기반 통합 자동화 플랫폼 전략을 공개하며 데이터 중심 산업 운...
    Date2026.03.05 Bynewsit Views63
    Read More
  2. SAP, FC 바이에른 뮌헨 클라우드 전환… 950만 팬 데이터 통합 운영

    - 온프레미스 ERP 클라우드 전환 통해 AI 기반 운영 체계 구축 - 950만 팬 데이터·2만5000 제품 데이터 통합 관리 SAP가 독일 프로축구 구단 FC 바이에른 뮌헨(Bayern Munich)의 ‘RISE with SAP’ 기반 클라우드 전환 프로젝트를 완료했다고 밝혔다. 이번 전환...
    Date2026.03.05 Bynewsit Views96
    Read More
  3. 벡터, 소프트웨어 타이밍 분석 기술 ‘록스탯’ 인수… 안전 필수 시스템 검증 강화

    - VectorCAST 툴체인에 통합해 WCET 추정·타이밍 분석 기능 확대 - SDV 등 소프트웨어 정의 시스템에서 요구되는 타이밍 안전 대응 차량 네트워크와 임베디드 시스템 개발 솔루션을 제공하는 벡터코리아가 타이밍 안전 분석 기술 ‘록스탯(RocqStat)’을 인수해 ...
    Date2026.03.05 Bynewsit Views77
    Read More
  4. 아비바, 유니파이드 엔지니어링에 산업용 AI 대거 추가…설계 자동화·프로젝트 협업 강화

    - 산업용 AI 어시스턴트·생성형 설계 AI 등 신규 기능 공개 - 데이터 중심 1D·2D·3D 통합 설계 환경 기반 엔지니어링 효율 향상 아비바가 자사의 엔지니어링 통합 플랫폼 아비바 유니파이드 엔지니어링에 산업용 AI 도구를 대거 추가했다. 프로젝트 설계와 협...
    Date2026.03.05 Bynewsit Views78
    Read More
  5. 옥타브, 헥사곤 소프트웨어 사업 분사 추진…산업 자산 전주기 플랫폼 전략 출범

    - 헥사곤 ALI·SIG 사업부와 브릭시스, ETQ, 프로젝트메이츠 통합 - 설계·구축·운영·보호 전 단계를 연결하는 산업 인프라 소프트웨어 포트폴리오 구축 옥타브가 헥사곤 소프트웨어 사업을 통합해 독립 브랜드로 출범하며 산업 및 인프라 자산 관리 플랫폼 전략...
    Date2026.03.04 Bynewsit Views98
    Read More
  6. 서비스나우, 생각하고 행동하는 ‘자율 인력’ 출시… 워크플로우 기반 AI 실행 구조 제시

    - 역할·권한·거버넌스 갖춘 AI 전문가 투입… ‘임플로이웍스’로 약 2억 명 직원 지원 서비스나우가 기업 업무에 필요한 역할과 권한, 거버넌스를 갖추고 자율적으로 업무를 수행하는 AI 전문가 조직 ‘자율 인력(Autonomous Workforce)’을 출시했다. 무브웍스 기...
    Date2026.02.27 Bynewsit Views97
    Read More
  7. 피아이이, ‘2026 스마트공장·자동화산업전’ 참가… 자율제조·AX 전환 엔드 투 엔드 역량 공개

    - 피지컬·인텔리전스·엔터프라이즈 AI 3대 존 구성… 설계부터 통합 관제까지 전주기 구현 피아이이가 3월 4일부터 6일까지 서울 코엑스에서 열리는 ‘2026 스마트공장·자동화산업전(AW 2026)’에 참가해 자율제조 및 AX 전환을 위한 엔드 투 엔드 스마트 팩토리 ...
    Date2026.02.27 Bynewsit Views89
    Read More
  8. 사이냅소프트, 사이냅 OCR IX 분당 500장 처리… 금융·공공 대량 트래픽 대응 구조 공개

    - 처리 속도·정확도·보안 3요건 충족… 금융·공공 200건 레퍼런스로 현장 검증 도큐먼트 AI 전문 기업 사이냅소프트 전경헌 대표가 1월 출시한 ‘사이냅 OCR IX’의 구체적인 성능 수치를 공개하며 온프레미스 환경에서 처리 속도와 정확도, 보안을 동시에 충족하...
    Date2026.02.27 Bynewsit Views101
    Read More
  9. 티유브이 슈드 코리아, 하우엔지니어링웍스와 기능안전·A-SPICE 통합 지원… 차량 반도체 글로벌 대응 체계 구축

    - ISO 26262·A-SPICE 기반 기술 자문부터 인증까지 연계… 국내 기업 국제 표준 경쟁력 강화 전동화와 자율주행 확산으로 자동차 산업이 소프트웨어 중심 구조로 빠르게 이동하는 가운데, 기능안전과 개발 프로세스 역량이 글로벌 협업의 핵심 요건으로 자리 잡...
    Date2026.02.27 Bynewsit Views101
    Read More
  10. 가트너, 메모리 130% 급등… PC·스마트폰 시장 ‘출하 축소 기반 수익 방어’ 체제로 전환

    - 원가 비중 23%로 상승·저가 세그먼트 급격 위축… 2026년 상반기 가격 전략 분기점 가트너가 메모리 가격 급등 영향으로 2026년 글로벌 PC 출하량이 전년 대비 10.4%, 스마트폰 출하량은 8.4% 감소할 것으로 전망했다. 2026년 말까지 D램과 SSD 가격이 합산 ...
    Date2026.02.27 Bynewsit Views95
    Read More
목록
Board Pagination Prev 1 ... 3 4 5 6 7 8 9 10 11 12 ... 235 Next
/ 235
CLOSE