- 블랙웰 B200, 텐서RT LLM v1.0과 병렬화·추측 디코딩 기술로 처리량 3배 증가

- GB200 NVL72 5백만 달러 투자로 75백만 달러 수익15ROI 달성

 

엔비디아, 새로운 인퍼런스MAX 벤치마크서 압도적인 블랙웰 성능 입증.jpg

 

 

엔비디아는 차세대 AI 플랫폼 블랙웰(NVIDIA Blackwell)이 새로 발표된 인퍼런스MAX(InferenceMAX) v1 벤치마크에서 최고 성능을 기록했다고 밝혔다. 이번 결과는 블랙웰이 AI 추론 분야에서 높은 처리량과 효율성, 비용 경쟁력을 동시에 갖췄음을 보여주며, 풀스택 하드웨어·소프트웨어 공동 설계를 기반으로 AI 데이터센터의 생산성과 투자수익률(ROI)을 크게 향상시켰음을 입증했다.

 

엔비디아 GB200 NVL72 시스템에 5백만 달러를 투자하면 75백만 달러의 토큰 수익을 창출할 수 있어 15ROI를 달성한다. 블랙웰 B200 시스템은 텐서RT LLM v1.0, 고급 병렬화 기술, 추측 디코딩 방식을 활용해 gpt-oss-120b 모델의 처리량을 3배 향상시키며 GPU6TPS를 기록했다. 라마 3.3 70B 등 밀집형 AI 모델에서도 인퍼런스MAX v1 벤치마크를 통해 새로운 성능 표준을 제시했다.

 5백만 달러 규모의 GB200 NVL72 투자로 7천5백만 달러의 토큰 수익 창출 가능.jpg

 

블랙웰은 GPU1TPS 이상, 사용자당 상호작용성 기준 50 TPS를 제공하며, 엔비디아 H200 대비 GPU 당 처리량이 4배 향상됐다. 와트당 토큰 수, 백만 토큰당 비용, 사용자당 TPS 등 효율성 지표에서도 탁월한 성과를 보이며, 전력이 제한된 AI 팩토리 환경에서도 토큰 수익과 처리량을 극대화한다.

 

엔비디아는 하드웨어와 소프트웨어 공동 설계, 텐서RT-LLM, 다이나모(Dynamo), SGLang, vLLM 등 오픈소스 추론 프레임워크, NV링크 스위치와 NVFP4 저정밀도 포맷 등 기술을 통해 지속적인 성능 향상을 실현했다. 또한, 오픈AI, 메타, 딥시크 AI 등과 협업해 최신 모델이 대규모 AI 인프라에서 최적 성능을 발휘하도록 지원한다.

 엔비디아 블랙웰 B200 NVL8, GPU당 최대 6만 TPS 처리량 달성.jpg

인퍼런스MAX v1 벤치마크는 데이터센터 처리량과 반응성, 비용, 에너지 효율성을 종합적으로 평가하며, 블랙웰의 풀스택 설계가 실제 AI 배포에서 최고의 ROI를 제공함을 입증했다. 엔비디아는 이러한 성과를 통해 AI 추론의 경제성과 성능, 확장성을 동시에 향상시키는 플랫폼 리더십을 강화하고 있다.

 

#엔비디아 #블랙웰 #InferenceMAX #AI추론 #텐서RT #B200 #GPU #AI데이터센터 #ROI #추측디코딩 #AI성능

 
?

  1. 사이버다임-한국건축가협회, 건축사사무소 문서보안 및 인프라 강화 위한 업무협약 체결

    - 중소 규모 건축사사무소 대상 문서중앙화·정보보호 체계 구축 지원 확대 사이버다임이 한국건축가협회와 건축사사무소의 인프라 및 정보보호 강화를 위한 전략적 업무협약(MOU)을 체결하며, 건축·설계 분야의 디지털 전환을 지원하는 협력 기반을 확대했다고...
    Date2025.11.18 Bynewsit Views137
    Read More
  2. 사이냅소프트, ‘2025 대한민국 Digital Innovation Award’ 부총리 겸 장관표창 수상

    - AI 기반 문서 처리 기술로 디지털 전환·경쟁력 강화 이끌어 사이냅소프트가 14일 열린 ‘2025 대한민국 Digital Innovation Award’에서 부총리 겸 장관표창을 수상하며, 핵심 문서 처리 기술을 기반으로 디지털 경제·사회 구현에 기여한 공로를 인정받았다고 ...
    Date2025.11.17 Bynewsit Views136
    Read More
  3. [CES 2026] AMD–STRADVISION, 자율주행 고도화 비전 AI 공동 혁신…CES 2026서 첫 공개 예고

    - STRADVISION 멀티비전 비전 인식, AMD Versal AI Edge Gen 2 VEK385 플랫폼 탑재 - L2에서 L3 자율주행까지 확장 가능한 스케일러블 아키텍처 구현 - 소프트웨어 정의 차량(SDV) 가속 위한 저지연·고효율 연산 플랫폼 제공 AMD와 스트라드비전(STRADVISION)...
    Date2025.11.13 Bynewsit Views122
    Read More
  4. 엔비디아, RTX AI PC에 넥사 AI ‘하이퍼링크’ 공식 지원… 로컬 기반 초고속 AI 검색·생성 가속

    - 로컬 문서·PDF·이미지 자동 인덱싱으로 즉각적 검색·응답 - RAG 인덱싱 속도 3배, LLM 추론 속도 2배… 워크플로우 전반 생산성 향상 - 회의 준비·보고서 분석·콘텐츠 제작·학습·디버깅 등 폭넓은 활용 엔비디아가 넥사 AI(NEXA AI)와 협력해 로컬 AI 에이전...
    Date2025.11.13 Bynewsit Views121
    Read More
  5. 데클라, 공급망 실시간 의사결정 플랫폼 ‘디시전 AI’ 발표… “추적에서 행동으로 전환”

    - SCM솔루션페어2025에서 디시전 AI 공개 - 실시간 데이터 분석 기반 ‘즉각적 행동 지침’ 제공 - ETA 편차 30% 감소, 자산 활용률 15~20% 향상, 클레임 20~25% 감소 데클라는 12일 서울 코엑스에서 열린 ‘SCM솔루션페어2025’에서 공급망 실시간 의사결정 플랫...
    Date2025.11.13 Bynewsit Views144
    Read More
  6. 사이냅 문서뷰어 2025, 소프트웨어 접근성(SA) 인증 획득… 공공·기업 디지털 포용성 강화 기대

    - 소프트웨어 접근성(SA) 인증 취득… 전문가·사용자 전 평가 항목 100% 준수 - 웹 환경 전반에서 문서 접근성 강화… 공공·지자체 도입 확대 기대 AI 전문 기업 사이냅소프트는 자사의 문서 열람 솔루션 ‘사이냅 문서뷰어 2025’가 한국시각장애인연합회(KBU)와 ...
    Date2025.11.13 Bynewsit Views136
    Read More
  7. 매스웍스코리아, 제5회 매트랩 대학생 AI 경진대회 시상식 개최

    - 드론 추적·로봇 제어·이상 감지 등 산업 현장형 AI 프로젝트 눈길 매스웍스(MathWorks)가 국내 대학생들의 인공지능(AI) 실무 역량 강화를 위한 ‘제5회 매트랩(MATLAB) 대학생 AI 경진대회’ 시상식을 개최했다고 밝혔다. 올해로 5회째를 맞은 이번 대회는 대...
    Date2025.11.12 Bynewsit Views118
    Read More
  8. 티맥스소프트 ‘오픈프레임’, 글로벌 상용SW 명품대상 과기정통부 장관상 수상

    - 메인프레임 현대화 기술력·글로벌 경쟁력 인정받아 티맥스소프트가 메인프레임 현대화 솔루션 ‘오픈프레임(OpenFrame)’으로 ‘2025 제11회 글로벌 상용SW 명품대상’에서 과학기술정보통신부 장관상을 수상했다고 밝혔다. 글로벌 상용SW 명품대상은 국내 소프...
    Date2025.11.12 Bynewsit Views170
    Read More
  9. 사이냅소프트, ‘사이냅 문서뷰어 SaaS’로 소규모 지자체 디지털 혁신 견인

    - 예산·IT 인력 부족한 지자체, 구독형 서비스로 디지털 전환·포용 행정 동시 실현 - 초기 구축비·유지보수 부담 ‘제로’… 정보 취약계층 접근성 대폭 개선 사이냅소프트는 11일 자사의 ‘사이냅 문서뷰어 SaaS’가 예산과 IT 인력이 부족한 소규모 지자체의 디지...
    Date2025.11.11 Bynewsit Views148
    Read More
  10. SAP코리아, 창립 30주년 맞아 “비즈니스 AI로 한국 기업의 글로벌 경쟁력 강화”

    - 30년간 한국 기업의 디지털 전환 동반자로 성장 - 한국, 아태지역 내 핵심 전략 시장으로 부상 - 파트너·고객·AI 정책 중심의 3대 성장 전략 발표 SAP코리아는 11일 창립 30주년 기념 행사에서 지난 30년간 한국 기업의 디지털 전환을 지원해온 성과를 공유...
    Date2025.11.11 Bynewsit Views137
    Read More
목록
Board Pagination Prev 1 ... 30 31 32 33 34 35 36 37 38 39 ... 238 Next
/ 238
CLOSE