- 블랙웰 B200, 텐서RT LLM v1.0과 병렬화·추측 디코딩 기술로 처리량 3배 증가

- GB200 NVL72 5백만 달러 투자로 75백만 달러 수익15ROI 달성

 

엔비디아, 새로운 인퍼런스MAX 벤치마크서 압도적인 블랙웰 성능 입증.jpg

 

 

엔비디아는 차세대 AI 플랫폼 블랙웰(NVIDIA Blackwell)이 새로 발표된 인퍼런스MAX(InferenceMAX) v1 벤치마크에서 최고 성능을 기록했다고 밝혔다. 이번 결과는 블랙웰이 AI 추론 분야에서 높은 처리량과 효율성, 비용 경쟁력을 동시에 갖췄음을 보여주며, 풀스택 하드웨어·소프트웨어 공동 설계를 기반으로 AI 데이터센터의 생산성과 투자수익률(ROI)을 크게 향상시켰음을 입증했다.

 

엔비디아 GB200 NVL72 시스템에 5백만 달러를 투자하면 75백만 달러의 토큰 수익을 창출할 수 있어 15ROI를 달성한다. 블랙웰 B200 시스템은 텐서RT LLM v1.0, 고급 병렬화 기술, 추측 디코딩 방식을 활용해 gpt-oss-120b 모델의 처리량을 3배 향상시키며 GPU6TPS를 기록했다. 라마 3.3 70B 등 밀집형 AI 모델에서도 인퍼런스MAX v1 벤치마크를 통해 새로운 성능 표준을 제시했다.

 5백만 달러 규모의 GB200 NVL72 투자로 7천5백만 달러의 토큰 수익 창출 가능.jpg

 

블랙웰은 GPU1TPS 이상, 사용자당 상호작용성 기준 50 TPS를 제공하며, 엔비디아 H200 대비 GPU 당 처리량이 4배 향상됐다. 와트당 토큰 수, 백만 토큰당 비용, 사용자당 TPS 등 효율성 지표에서도 탁월한 성과를 보이며, 전력이 제한된 AI 팩토리 환경에서도 토큰 수익과 처리량을 극대화한다.

 

엔비디아는 하드웨어와 소프트웨어 공동 설계, 텐서RT-LLM, 다이나모(Dynamo), SGLang, vLLM 등 오픈소스 추론 프레임워크, NV링크 스위치와 NVFP4 저정밀도 포맷 등 기술을 통해 지속적인 성능 향상을 실현했다. 또한, 오픈AI, 메타, 딥시크 AI 등과 협업해 최신 모델이 대규모 AI 인프라에서 최적 성능을 발휘하도록 지원한다.

 엔비디아 블랙웰 B200 NVL8, GPU당 최대 6만 TPS 처리량 달성.jpg

인퍼런스MAX v1 벤치마크는 데이터센터 처리량과 반응성, 비용, 에너지 효율성을 종합적으로 평가하며, 블랙웰의 풀스택 설계가 실제 AI 배포에서 최고의 ROI를 제공함을 입증했다. 엔비디아는 이러한 성과를 통해 AI 추론의 경제성과 성능, 확장성을 동시에 향상시키는 플랫폼 리더십을 강화하고 있다.

 

#엔비디아 #블랙웰 #InferenceMAX #AI추론 #텐서RT #B200 #GPU #AI데이터센터 #ROI #추측디코딩 #AI성능

 
?

  1. 지멘스, ‘Simcenter Testlab’에 AI 기능 추가…모달 테스트 및 분석 프로세스 혁신

    - AI 기반 모달 분석으로 프로세스 속도 최대 7배 향상 - 지능형 센서 배치·자동 히트(hit) 선택 기능으로 단독 테스트 수행 가능 - 전달 경로 분석(Transfer Path Analysis) 엔드 투 엔드 프로세스 최대 40% 가속 - ISO 20270 준수 자동 컴포넌트 모델 추출 ...
    Date2025.10.16 Bynewsit Views161
    Read More
  2. 슈나이더 일렉트릭, 실시간 모터 관리 솔루션 ‘테시스 테라’로 해양산업 효율성 극대화

    - AI·디지털 기반 실시간 모니터링으로 조선·해양 산업 설비의 안정성과 생산성 강화 슈나이더 일렉트릭이 조선·해양 산업의 설비 효율성과 안정성을 높여주는 실시간 모터 관리 솔루션 ‘테시스 테라(TeSys Tera)’를 공개했다. 조선·해양 산업에서 모터는 전체...
    Date2025.10.16 Bynewsit Views165
    Read More
  3. 레인보우로보틱스-디스펙터, 4족보행 순찰로봇 공동 개발 협력…공공 인프라 안전 관리 혁신

    - 한국지역난방공사 수원 건설현장서 자율순찰 로봇 실증 개시 - 공공 인프라 디지털 전환 가속…건설·보안 분야 로봇 활용 본격화 기대 로봇 플랫폼 전문기업 레인보우로보틱스가 피지컬 AI 플랫폼 기업 디스펙터와 4족보행 순찰로봇 사업 협력을 위한 양해각...
    Date2025.10.15 Bynewsit Views162
    Read More
  4. AMD, 메타 기반 오픈 컴퓨트 프로젝트(OCP) AI용 ‘헬리오스’ 랙 스케일 플랫폼 공개

    - 2025년 OCP 글로벌 서밋서 헬리오스 랙 스케일 디자인 첫 공개 - AMD 인스팅트 GPU와 에픽 CPU, 고급 네트워킹 기반으로 차세대 AI 워크로드 지원 AMD는 산호세에서 열린 OCP 글로벌 서밋에서 자사의 AI용 헬리오스(Helios) 랙 스케일 플랫폼을 공개했다. 메...
    Date2025.10.15 Bynewsit Views166
    Read More
  5. 세일즈포스, 에이전틱 AI 기반 통합 플랫폼 ‘에이전트포스 360’ 발표

    세일즈포스가 14일부터 16일까지 미국 샌프란시스코에서 열린 연례 최대 글로벌 IT 컨퍼런스 ‘드림포스 2025’에서 차세대 AI 에이전트 플랫폼 ‘에이전트포스 360’을 공개했다. 이번 발표는 AI와 인간이 협업하는 ‘에이전틱 엔터프라이즈(Agentic Enterprise)’ ...
    Date2025.10.15 Bynewsit Views192
    Read More
  6. 세일포인트, ‘적응형 아이덴티티’ 시대 선언… AI 중심 보안 플랫폼 공개

    - CVS·엔비디아 등 글로벌 파트너와 협력, AI 인텔리전스로 아이덴티티·데이터·보안 통합 세일포인트가 연례 글로벌 컨퍼런스 ‘네비게이트 2025’에서 AI 기반 지능형 보안 플랫폼 ‘세일포인트 플랫폼’을 공개하며, 인간과 머신, AI 에이전트를 아우르는 ‘적응...
    Date2025.10.15 Bynewsit Views188
    Read More
  7. Oracle-AMD, 차세대 AI 슈퍼클러스터 공개…OCI에 50,000 GPU 배치 계획

    Oracle과 AMD가 고객의 AI 워크로드 확장을 위해 장기 협력을 확대한다고 밝혔다. OCI는 AMD Instinct MI450 GPU 기반 공개 AI 슈퍼클러스터를 2026년 3분기부터 제공하며, 2027년 이후까지 총 50,000 GPU를 배치할 계획이다. 슈퍼클러스터는 AMD Instinct MI4...
    Date2025.10.15 Bynewsit Views175
    Read More
  8. 오라클, ‘오라클 AI 데이터베이스 26ai’ 공개… AI 중심 데이터 혁신 전략 강화

    - AI 설계 내장형 차세대 데이터베이스 공개, 주요 데이터 유형과 워크로드 전반에 AI 매끄럽게 통합 - 멀티클라우드·온프레미스 전반에서 데이터 인사이트·혁신·생산성 극대화 - 아파치 아이스버그 지원 자율운영 AI 레이크하우스 도입, 개방형 AI 생태계 강...
    Date2025.10.15 Bynewsit Views186
    Read More
  9. 한국퀀텀컴퓨팅-한국생명정보학회, 양자컴퓨팅 기반 바이오 연구 협력 MOU 체결

    - AI바이오·디지털바이오 분야 양자 알고리즘 공동 개발 - 신약개발·유전체 분석 등 생명정보학에 양자컴퓨팅 본격 도입 한국퀀텀컴퓨팅은 한국생명정보학회(KSB)와 양자컴퓨팅을 활용한 생명정보학 연구 협력 강화를 위한 업무협약(MOU)을 체결했다고 밝혔다....
    Date2025.10.15 Bynewsit Views176
    Read More
  10. 지멘스, 두카티와 기술 협력 연장…MotoGP 기술 혁신에 박차

    - 모터사이클 업체 두카티와 기술 파트너십 확대… Siemens Xcelerator 통한 연구개발 통합·최적화 지멘스 디지털 인더스트리 소프트웨어가 두카티 코르세(Ducati Corse)와 기술 파트너십을 향후 2년간 연장한다고 발표했다. 이번 협약을 통해 양사는 지멘스 엑...
    Date2025.10.15 Bynewsit Views177
    Read More
목록
Board Pagination Prev 1 ... 20 21 22 23 24 25 26 27 28 29 ... 221 Next
/ 221
CLOSE