- 블랙웰 B200, 텐서RT LLM v1.0과 병렬화·추측 디코딩 기술로 처리량 3배 증가

- GB200 NVL72 5백만 달러 투자로 75백만 달러 수익15ROI 달성

 

엔비디아, 새로운 인퍼런스MAX 벤치마크서 압도적인 블랙웰 성능 입증.jpg

 

 

엔비디아는 차세대 AI 플랫폼 블랙웰(NVIDIA Blackwell)이 새로 발표된 인퍼런스MAX(InferenceMAX) v1 벤치마크에서 최고 성능을 기록했다고 밝혔다. 이번 결과는 블랙웰이 AI 추론 분야에서 높은 처리량과 효율성, 비용 경쟁력을 동시에 갖췄음을 보여주며, 풀스택 하드웨어·소프트웨어 공동 설계를 기반으로 AI 데이터센터의 생산성과 투자수익률(ROI)을 크게 향상시켰음을 입증했다.

 

엔비디아 GB200 NVL72 시스템에 5백만 달러를 투자하면 75백만 달러의 토큰 수익을 창출할 수 있어 15ROI를 달성한다. 블랙웰 B200 시스템은 텐서RT LLM v1.0, 고급 병렬화 기술, 추측 디코딩 방식을 활용해 gpt-oss-120b 모델의 처리량을 3배 향상시키며 GPU6TPS를 기록했다. 라마 3.3 70B 등 밀집형 AI 모델에서도 인퍼런스MAX v1 벤치마크를 통해 새로운 성능 표준을 제시했다.

 5백만 달러 규모의 GB200 NVL72 투자로 7천5백만 달러의 토큰 수익 창출 가능.jpg

 

블랙웰은 GPU1TPS 이상, 사용자당 상호작용성 기준 50 TPS를 제공하며, 엔비디아 H200 대비 GPU 당 처리량이 4배 향상됐다. 와트당 토큰 수, 백만 토큰당 비용, 사용자당 TPS 등 효율성 지표에서도 탁월한 성과를 보이며, 전력이 제한된 AI 팩토리 환경에서도 토큰 수익과 처리량을 극대화한다.

 

엔비디아는 하드웨어와 소프트웨어 공동 설계, 텐서RT-LLM, 다이나모(Dynamo), SGLang, vLLM 등 오픈소스 추론 프레임워크, NV링크 스위치와 NVFP4 저정밀도 포맷 등 기술을 통해 지속적인 성능 향상을 실현했다. 또한, 오픈AI, 메타, 딥시크 AI 등과 협업해 최신 모델이 대규모 AI 인프라에서 최적 성능을 발휘하도록 지원한다.

 엔비디아 블랙웰 B200 NVL8, GPU당 최대 6만 TPS 처리량 달성.jpg

인퍼런스MAX v1 벤치마크는 데이터센터 처리량과 반응성, 비용, 에너지 효율성을 종합적으로 평가하며, 블랙웰의 풀스택 설계가 실제 AI 배포에서 최고의 ROI를 제공함을 입증했다. 엔비디아는 이러한 성과를 통해 AI 추론의 경제성과 성능, 확장성을 동시에 향상시키는 플랫폼 리더십을 강화하고 있다.

 

#엔비디아 #블랙웰 #InferenceMAX #AI추론 #텐서RT #B200 #GPU #AI데이터센터 #ROI #추측디코딩 #AI성능

 
?

  1. 클라우드플레어, 오라클과 손잡고 AI 워크로드 가속화 및 멀티클라우드 보안 강화

    클라우드플레어(Cloudflare)가 오라클 클라우드 인프라스트럭처(OCI)와 통합을 공식 발표했다. 이번 협력을 통해 클라우드플레어의 커넥티비티 클라우드 플랫폼이 오라클 클라우드 환경에 네이티브 형태로 제공되며, 전 세계 고객은 OCI 콘솔과 API를 통해 보...
    Date2025.10.14 Bynewsit Views97
    Read More
  2. 구글 클라우드, 통합 AI 플랫폼 ‘제미나이 엔터프라이즈’ 공개

    - 직관적 인터페이스로 모든 임직원이 AI 활용 가능 - 워크스페이스, 데이터, 고객 경험 통합해 전체 업무 자동화 지원 구글 클라우드는 모든 기업이 AI 에이전트를 활용해 생산성, 고객 경험, 혁신을 재정의할 수 있도록 지원하는 새로운 플랫폼 ‘제미나이 엔...
    Date2025.10.13 Bynewsit Views89
    Read More
  3. “엔비디아 블랙웰, AI 추론 처리량 3배 향상·ROI 15배 달성”

    - 블랙웰 B200, 텐서RT LLM v1.0과 병렬화·추측 디코딩 기술로 처리량 3배 증가 - GB200 NVL72 5백만 달러 투자로 7천5백만 달러 수익… 15배 ROI 달성 엔비디아는 차세대 AI 플랫폼 블랙웰(NVIDIA Blackwell)이 새로 발표된 인퍼런스MAX(InferenceMAX) v1 벤치...
    Date2025.10.13 Bynewsit Views78
    Read More
  4. 엘리먼트14, 스마트 제조 혁신을 위한 통합 플랫폼 ‘스마트 인더스트리’ 공개

    - IIoT·로보틱스·예지 정비까지… 엔지니어 위한 스마트 산업 전환 지원 허브 엘리먼트14(element14)가 스마트 제조와 산업 자동화 혁신을 위한 통합 플랫폼 ‘스마트 인더스트리(Smart Industry)’ 캠페인을 발표했다. 이번 캠페인은 엔지니어들이 지능형·연결형...
    Date2025.10.13 Bynewsit Views83
    Read More
  5. 트림블, BIM 실무형 자격시험 정례화…국내 인재 양성 강화

    트림블(Trimble) 코리아는 자사의 BIM 소프트웨어 테클라(Tekla)를 기반으로 한 ‘BIM 전문가 2급’ 자격증 시험이 오는 11월 1일 2차 수시 시험으로 진행될 예정이라고 밝혔다. 해당 자격시험은 한국BIM학회와 한국디지털교육원이 공동 주관하며, 국내에서는 처...
    Date2025.10.13 Bynewsit Views95
    Read More
  6. SAP, ‘SAP 커넥트’ 개최…AI와 데이터, 애플리케이션 결합한 차세대 비즈니스 스위트 공개

    SAP가 10월 6일부터 3일간 미국 라스베이거스에서 연례행사 ‘SAP 커넥트(SAP Connect)’ 를 개최하고, AI 중심의 차세대 비즈니스 스위트를 공개했다. 이번 행사는 AI, 데이터, 애플리케이션의 통합을 통해 비즈니스 가치 창출을 가속화하는 SAP의 전략을 집중...
    Date2025.10.13 Bynewsit Views104
    Read More
  7. 매스웍스, 생성형 AI 기반 ‘매트랩 코파일럿’ 출시…엔지니어링 혁신 플랫폼으로 진화

    매스웍스(MathWorks)가 엔지니어, 과학자, 연구원의 생산성을 높이고 개발 속도를 향상시키는 생성형 AI 어시스턴트 ‘매트랩 코파일럿(MATLAB Copilot)’을 공식 출시했다. 이번 신기능은 매트랩 및 시뮬링크 릴리즈 2025b(R2025b) 에 포함되어 제공되며, 매트...
    Date2025.10.13 Bynewsit Views83
    Read More
  8. 버카다, 김기훈 신임 한국 지사장 선임…AI 기반 물리 보안 시장 공략 강화

    AI 물리 보안 기술 선도 기업 버카다(Verkada)가 김기훈 신임 한국 지사장을 선임하며 한국 시장 내 입지 강화를 위한 행보에 나섰다. 김 지사장은 앞으로 버카다의 시장 확장, 영업 운영, 파트너 생태계 구축 등 한국 내 비즈니스 전반을 총괄하게 된다. 버카...
    Date2025.10.13 Bynewsit Views76
    Read More
  9. 리미니스트리트, 김계영 한국 총괄 CTO 선임…현지 기술 리더십 강화로 디지털 혁신 지원 가속화

    리미니스트리트(Rimini Street)가 김계영 한국 지역 총괄 CTO를 선임하며 국내 시장 공략을 강화한다. 이번 인사는 리미니스트리트가 한국 고객에게 현지화된 기술 지원과 차별화된 고객 경험을 제공하고, 기업들의 디지털 혁신 여정을 가속화하기 위한 전략적...
    Date2025.10.13 Bynewsit Views77
    Read More
  10. 옴디아, “2026년 AI 글래스 시장 1000만 대 돌파 전망…2030년 3,500만 대 규모로 성장”

    옴디아(Omdia)는 최신 보고서를 통해 AI 글래스 시장이 폭발적인 성장을 앞두고 있다고 전망했다. 2025년 글로벌 AI 글래스 출하량은 전년 대비 158% 증가한 510만 대에 이를 것으로 예상되며, 2026년에는 구글, 샤오미 등 주요 IT 기업의 진입으로 1,000만 대...
    Date2025.10.02 Bynewsit Views93
    Read More
목록
Board Pagination Prev 1 ... 3 4 5 6 7 8 9 10 11 12 ... 202 Next
/ 202
CLOSE