- 블랙웰 B200, 텐서RT LLM v1.0과 병렬화·추측 디코딩 기술로 처리량 3배 증가

- GB200 NVL72 5백만 달러 투자로 75백만 달러 수익15ROI 달성

 

엔비디아, 새로운 인퍼런스MAX 벤치마크서 압도적인 블랙웰 성능 입증.jpg

 

 

엔비디아는 차세대 AI 플랫폼 블랙웰(NVIDIA Blackwell)이 새로 발표된 인퍼런스MAX(InferenceMAX) v1 벤치마크에서 최고 성능을 기록했다고 밝혔다. 이번 결과는 블랙웰이 AI 추론 분야에서 높은 처리량과 효율성, 비용 경쟁력을 동시에 갖췄음을 보여주며, 풀스택 하드웨어·소프트웨어 공동 설계를 기반으로 AI 데이터센터의 생산성과 투자수익률(ROI)을 크게 향상시켰음을 입증했다.

 

엔비디아 GB200 NVL72 시스템에 5백만 달러를 투자하면 75백만 달러의 토큰 수익을 창출할 수 있어 15ROI를 달성한다. 블랙웰 B200 시스템은 텐서RT LLM v1.0, 고급 병렬화 기술, 추측 디코딩 방식을 활용해 gpt-oss-120b 모델의 처리량을 3배 향상시키며 GPU6TPS를 기록했다. 라마 3.3 70B 등 밀집형 AI 모델에서도 인퍼런스MAX v1 벤치마크를 통해 새로운 성능 표준을 제시했다.

 5백만 달러 규모의 GB200 NVL72 투자로 7천5백만 달러의 토큰 수익 창출 가능.jpg

 

블랙웰은 GPU1TPS 이상, 사용자당 상호작용성 기준 50 TPS를 제공하며, 엔비디아 H200 대비 GPU 당 처리량이 4배 향상됐다. 와트당 토큰 수, 백만 토큰당 비용, 사용자당 TPS 등 효율성 지표에서도 탁월한 성과를 보이며, 전력이 제한된 AI 팩토리 환경에서도 토큰 수익과 처리량을 극대화한다.

 

엔비디아는 하드웨어와 소프트웨어 공동 설계, 텐서RT-LLM, 다이나모(Dynamo), SGLang, vLLM 등 오픈소스 추론 프레임워크, NV링크 스위치와 NVFP4 저정밀도 포맷 등 기술을 통해 지속적인 성능 향상을 실현했다. 또한, 오픈AI, 메타, 딥시크 AI 등과 협업해 최신 모델이 대규모 AI 인프라에서 최적 성능을 발휘하도록 지원한다.

 엔비디아 블랙웰 B200 NVL8, GPU당 최대 6만 TPS 처리량 달성.jpg

인퍼런스MAX v1 벤치마크는 데이터센터 처리량과 반응성, 비용, 에너지 효율성을 종합적으로 평가하며, 블랙웰의 풀스택 설계가 실제 AI 배포에서 최고의 ROI를 제공함을 입증했다. 엔비디아는 이러한 성과를 통해 AI 추론의 경제성과 성능, 확장성을 동시에 향상시키는 플랫폼 리더십을 강화하고 있다.

 

#엔비디아 #블랙웰 #InferenceMAX #AI추론 #텐서RT #B200 #GPU #AI데이터센터 #ROI #추측디코딩 #AI성능

 
?

  1. 사이냅소프트, ‘사이냅 문서뷰어 SaaS’로 소규모 지자체 디지털 혁신 견인

    - 예산·IT 인력 부족한 지자체, 구독형 서비스로 디지털 전환·포용 행정 동시 실현 - 초기 구축비·유지보수 부담 ‘제로’… 정보 취약계층 접근성 대폭 개선 사이냅소프트는 11일 자사의 ‘사이냅 문서뷰어 SaaS’가 예산과 IT 인력이 부족한 소규모 지자체의 디지...
    Date2025.11.11 Bynewsit Views148
    Read More
  2. SAP코리아, 창립 30주년 맞아 “비즈니스 AI로 한국 기업의 글로벌 경쟁력 강화”

    - 30년간 한국 기업의 디지털 전환 동반자로 성장 - 한국, 아태지역 내 핵심 전략 시장으로 부상 - 파트너·고객·AI 정책 중심의 3대 성장 전략 발표 SAP코리아는 11일 창립 30주년 기념 행사에서 지난 30년간 한국 기업의 디지털 전환을 지원해온 성과를 공유...
    Date2025.11.11 Bynewsit Views137
    Read More
  3. 코헤시티 “생성형 AI 확산 속도, 리스크 대응 능력 앞서가… 사이버 공격 영향도 심화”

    - 국내 기업 86% “AI 발전 속도, 리스크 관리 역량 초월” - 코헤시티 “AI-ready 데이터 인프라가 보안·경영 모두의 핵심 기반” AI 확산의 속도가 기업의 리스크 대응 능력을 넘어섰다는 경고가 나왔다. AI 기반 데이터 보안 기업 코헤시티가 10일 발표한 글로...
    Date2025.11.11 Bynewsit Views135
    Read More
  4. 쿤텍, 오토모티브 월드 도쿄·나고야서 임베디드 가상화 솔루션 ‘패스트브이랩스’ 전시

    - 일본 완성차·부품 업계로부터 기술력 인정… 글로벌 시장 주목 DX보안 전문 기업 쿤텍은 지난 9월 일본 마쿠하리 멧세와 10월 포트 멧세 나고야에서 열린 ‘오토모티브 월드(AUTOMOTIVE WORLD) 2025 시리즈’에 연이어 참가하며 일본 시장 공략을 강화하고 있다...
    Date2025.11.10 Bynewsit Views152
    Read More
  5. 액세스 그룹, 퓨어스토리지와 함께 글로벌 데이터 복원력 강화

    - 퓨어스토리지 플랫폼으로 글로벌 SaaS 환경의 복잡성 해소 및 안정성 확보 퓨어스토리지는 영국의 대표적 비즈니스 관리 소프트웨어 기업 액세스 그룹(The Access Group)이 자사의 플랫폼을 도입해 글로벌 서비스형 소프트웨어(SaaS) 환경의 복원력과 안정성...
    Date2025.11.10 Bynewsit Views155
    Read More
  6. 리미니스트리트, 차세대 ‘Agentic AI ERP’ 백서 발간

    - 비용 부담 없이 ERP 혁신 가속… “중단 없는 디지털 전환” 제시 리미니스트리트(Rimini Street)가 ERP의 새로운 패러다임을 제시하는 백서 ‘에이전트형 AI ERP의 등장(The Rise of Agentic AI ERP)’을 발간했다고 10일 밝혔다. 이번 백서는 기존 ERP 업그레이...
    Date2025.11.10 Bynewsit Views155
    Read More
  7. 지멘스, NEC와 협력 통해 스마트 공장 혁신 가속화

    - 로봇 시뮬레이션과 태스크 플래닝 결합해 생산성 향상·사실 기반 관리 구현 지멘스 디지털 인더스트리 소프트웨어가 NEC와 기술 파트너십 협약을 체결하고 로봇 3D 시뮬레이션 분야의 글로벌 협력을 강화한다고 10일 밝혔다. 양사는 지멘스의 테크노 매트릭...
    Date2025.11.10 Bynewsit Views147
    Read More
  8. AWS, 제인 구달 연구소와 손잡고 65년 영장류 연구 기록 디지털화 추진

    – 100만 달러 AI 혁신 펀드 투자로 연구 아카이브 디지털 전환 및 보존 연구 현대화 지원 AWS가 제인 구달 연구소와 협력해 65년에 걸친 영장류 연구 기록을 디지털화하고, AI를 통한 보존 연구 혁신에 나선다. AWS는 이번 프로젝트를 위해 생성형 AI 혁신 펀...
    Date2025.11.07 Bynewsit Views173
    Read More
  9. 위로보틱스, 아동용 보행보조 로봇 ‘윔 키즈’로 CES 2026 혁신상 수상

    웨어러블 로봇 전문기업 위로보틱스(WIRobotics)가 미국 라스베이거스에서 열리는 CES 2026에서 ‘디지털 헬스(Digital Health)’ 부문 혁신상(Innovation Awards)을 수상했다. 위로보틱스는 2024년부터 3년 연속 CES 혁신상을 수상하며 글로벌 웨어러블 로봇 리...
    Date2025.11.06 Bynewsit Views175
    Read More
  10. 레노버, 차세대 데이터 센터 인프라 전략 제시…AMD 기반 서버로 성능·효율·확장성 강화

    - AMD 기반 씽크시스템 SR665 V3 서버로 AI·클라우드 환경의 성능·효율·확장성 강화 레노버 글로벌 테크놀로지 코리아(ISG)는 지난 5일 부산에서 열린 ‘레드햇 x 아이웍스 오픈 인프라 데이(Red Hat x iWORKS Open Infra Day)’에서 차세대 데이터 센터를 위한 ...
    Date2025.11.06 Bynewsit Views180
    Read More
목록
Board Pagination Prev 1 ... 29 30 31 32 33 34 35 36 37 38 ... 236 Next
/ 236
CLOSE