- GB300 NVL72, 호퍼 대비 메가와트당 처리량 최대 50배 향상저지연 환경 100만 토큰당 비용 35배 절감

 엔비디아, 블랙웰 울트라로 에이전틱 AI 추론 경쟁 본격화…성능 50배↑·토큰 비용 35배↓.jpg

 

 

 

엔비디아가 차세대 블랙웰 울트라 플랫폼을 공개하고 에이전틱 AI 추론 인프라 경쟁을 본격화했다. GB300 NVL72 시스템은 기존 호퍼 플랫폼 대비 메가와트당 처리량을 최대 50배 향상시키고, 저지연 환경에서 100만 토큰당 비용을 최대 35배 절감했다. 처리량과 토큰 비용을 동시에 낮추며 대규모 추론 환경의 총소유비용 구조를 크게 바꿨다.

 

에이전틱 AI 확산, 추론 인프라가 경쟁력 좌우

OpenRouter‘State of Inference’ 보고서에 따르면 AI 에이전트와 코딩 어시스턴트 확산으로 소프트웨어 프로그래밍 관련 AI 쿼리는 지난해 11%에서 약 50% 수준으로 급증했다. 다단계 워크플로 전반에서 실시간 반응성을 유지하려면 저지연 처리와 긴 컨텍스트 대응 역량이 필수 요건으로 자리 잡고 있다.

 엔비디아, 블랙웰 울트라로 에이전틱 AI 시대 가속… 성능 최대 50배↑·비용 35배↓.jpg

SemiAnalysis InferenceX 데이터는 블랙웰 울트라와 엔비디아 소프트웨어 최적화 기술의 결합이 성능과 비용을 동시에 개선했다고 분석했다. GB300 NVL72는 호퍼 대비 메가와트당 처리량을 최대 50배 향상시키고, 토큰당 비용을 최대 35배 절감했다. 총소유비용(TCO) 관점에서도 추론 워크로드의 경제성을 크게 높였다.

 

GB300 NVL72, 저지연 워크로드 성능 구조 개선

엔비디아 텐서RT-LLM, 다이나모, 문케이크, SGLang 등으로 구성된 공동 설계 소프트웨어 스택은 전문가 혼합(MoE) 추론 처리량을 전 구간에서 끌어올렸다. 최근 4개월 사이 저지연 워크로드 성능은 최대 5배 개선됐다.

 엔비디아 GB300 NVL72, 엔비디아 다이나모, 텐서RT-LLM 등으로 구성된 공동 설계 소프트웨어 스택은 엔비디아 호퍼 플랫폼 대비 토큰당 비용을 35배 절감한다.jpg

고성능 GPU 커널 최적화, NV링크 시메트릭 메모리, 프로그래매틱 디펜던트 런치 기술은 GPU 간 통신 효율을 높이고 유휴 시간을 줄였다. 칩과 시스템 아키텍처, 소프트웨어를 함께 설계하는 전략이 에너지 효율과 처리량을 동시에 끌어올렸다. 그 결과 GB300 NVL72는 지연 시간 전 구간에서 호퍼 대비 우수한 비용 구조를 구현했다.

 

긴 컨텍스트 환경에서 토큰 경제성 강화

GB300 NVL72128,000 토큰 입력과 8,000 토큰 출력을 처리하는 긴 컨텍스트 워크로드에서 강점을 보인다. GB200 NVL72 대비 토큰당 비용을 최대 1.5배 낮췄다. NVFP4 연산 성능은 1.5배 향상됐고 어텐션 처리 속도는 2배 빨라졌다. 대규모 코드베이스를 추론하는 에이전트 환경에서 처리 효율과 응답 속도를 동시에 확보할 수 있다.

 

 

클라우드 사업자, GB300 도입 확대

MS, 코어위브, OCI 등 주요 클라우드 사업자는 GB300 NVL72를 에이전틱 코딩과 긴 컨텍스트 활용 사례에 적용하고 있다. 토큰 비용을 낮추면서 대규모 코드베이스를 실시간으로 추론하는 환경을 구축하고 있다는 설명이다. 코어위브 첸 골드버그 엔지니어링 총괄 부사장은 긴 컨텍스트 처리 성능과 토큰 효율성이 AI 프로덕션 환경의 핵심 요소로 자리 잡았으며, GB300 시스템은 대규모 워크로드에서도 예측 가능한 성능과 비용 구조를 제공한다고 밝혔다.

 

차세대 루빈 플랫폼, 추가 도약 예고

엔비디아는 차세대 루빈(Rubin)’ 플랫폼을 통해 또 한 번의 성능 도약을 예고했다. 루빈은 6개의 신규 칩을 통합해 AI 슈퍼컴퓨터를 구성하며, MoE 추론에서 블랙웰 대비 메가와트당 최대 10배 높은 처리량과 100만 토큰당 10분의 1 수준 비용을 목표로 한다.

 

블랙웰 울트라와 루빈 플랫폼은 에이전틱 AI 시대에 필요한 대규모 추론 인프라 경쟁을 본격화하는 핵심 축으로 자리 잡을 전망이다.

 

#엔비디아 #BlackwellUltra #GB300NVL72 #에이전틱AI #AI추론 #MoE #TensorRTLLM #루빈

 

 
?

  1. 알리바바, Qwen3.6-Plus·Qwen3.5-Omni 공개…에이전틱 실행과 옴니모달 처리 동시 확장

    - 에이전틱 코딩·멀티모달 추론·음성·영상 통합 처리 기반 AI 실행 범위 확대 알리바바(Alibaba)가 에이전틱 실행 기반 코딩 모델 Qwen3.6-Plus와 텍스트·음성·이미지·영상 데이터를 통합 처리하는 옴니모달 모델 Qwen3.5-Omni를 공개했다. 복합 작업을 단계적...
    Date2026.04.06 Bynewsit Views86
    Read More
  2. 한국레노버, 산업용 AI 엣지 컴퓨팅 ‘씽크엣지’ 2종 출시…온디바이스 처리로 지연 최소화

    - 씽크엣지 SE30n·SE60n, 최대 97 TOPS 기반 실시간 산업 데이터 분석 지원 한국레노버가 산업 환경에 최적화된 AI 엣지 컴퓨팅 솔루션 씽크엣지(ThinkEdge) 2종을 출시했다. 온디바이스 AI 기반 데이터 처리를 통해 클라우드 의존도를 낮추고 데이터가 생성되...
    Date2026.04.06 Bynewsit Views53
    Read More
  3. 사이냅소프트, 문서 AI·RAG 기반 도서관 AX 전환 지원

    - 문서 AI 4종으로 학술 데이터 지식화 및 검색 자동화 기능 공개 사이냅소프트가 제24차 한국학술정보협의회 콘퍼런스에서 문서 AI(Document AI) 기반 도서관 업무 자동화 솔루션을 공개했다. 학술 데이터를 지식 자산으로 변환하고 검색 증강 생성(RAG) 기반...
    Date2026.04.03 Bynewsit Views55
    Read More
  4.   EDB, 엔비디아 GPU 결합…Postgres 분석 최대 100배 가속

    - Apache Spark용 NVIDIA cuDF 통합 확대, 3TB 이상 데이터 분석 50~100배 처리 향상 EDB가 엔비디아 GPU 가속 기술을 포스트그레스(Postgres) AI 플랫폼에 결합하며 에이전틱 AI 환경에서 요구되는 대규모 데이터 분석 처리 속도를 최대 100배 높였다. 아파치...
    Date2026.04.03 Bynewsit Views66
    Read More
  5. 유아이패스, 구매-지급(P2P) 에이전틱 AI 솔루션 공개… 재무 워크플로우 자동화 적용

    - AI 에이전트 기반 오케스트레이션… 구매 승인·청구서 검증·예외 처리 흐름 자동화 유아이패스가 구매부터 지급까지 이어지는 P2P(Purchase-to-Pay) 전 과정에 에이전틱 AI를 적용한 자동화 솔루션을 공개했다. ERP와 협업 시스템 전반에 AI 에이전트 실행 계...
    Date2026.04.02 Bynewsit Views54
    Read More
  6. 사이냅소프트, OCR IX CPU 출시… GPU 없이 AI OCR 실행 지원

    - 양자화 적용 모델 경량화…기존 서버에서 문서 인식 자동화 운영 사이냅소프트가 GPU 없이 실행 가능한 AI OCR 솔루션 ‘사이냅 OCR IX’ CPU 버전을 공개했다. 기존 온프레미스 서버 환경에서 문서 인식 자동화를 수행하며, 양자화 기반 모델 경량화를 통해 연...
    Date2026.04.02 Bynewsit Views49
    Read More
  7. AIWORKX, 생성형 AI 기반 비대면 기업카드 심사 자동화 프로젝트 수주

    - OCR·LLM·RAG 적용 신청·심사·발급 전 과정 자동화 AIWORKX가 국내 주요 카드사의 비대면 기업카드 신청 및 심사 프로세스 고도화 프로젝트를 수주했다. 비대면 기업카드 신청 수요가 증가하고 있지만 기존 심사와 발급 절차는 대면 중심 업무 구조를 유지하...
    Date2026.04.02 Bynewsit Views68
    Read More
  8. 데이터브릭스, 레이크하우스 기반 엔터프라이즈 AI 확산… 국내 비즈니스 100% 성장

    - AI Days Seoul 개최… 3년간 데이터·AI 전문 인력 1만 명 양성 추진 데이터브릭스가 오프라인 컨퍼런스 ‘AI Days Seoul’을 개최하고 지난 회계연도 국내 비즈니스가 전년 대비 100% 이상 성장했다고 밝혔다. 기업들의 생성형 AI 도입 확대와 데이터 통합 수요...
    Date2026.04.01 Bynewsit Views52
    Read More
  9. 티맥스소프트, 제우스 11 국내 최초 자카르타 EE 11 인증 획득

    - 자바 21 기반 차세대 WAS… AI·클라우드 환경 대응 플랫폼 강화 티맥스소프트가 애플리케이션 서버 ‘제우스 11(JEUS 11)’으로 국내 최초 자카르타 EE 11 인증을 획득했다. 자바 21 기반 기술을 적용해 AI·클라우드 환경에서 요구되는 엔터프라이즈 애플리케이...
    Date2026.04.01 Bynewsit Views56
    Read More
  10. 레노버, 데이비드 베컴과 글로벌 파트너십 체결… AI 스포츠 혁신 협력 확대

    - 2026 FIFA 월드컵 기술 파트너십 연계… 경기력·팬 경험 고도화 추진 레노버가 글로벌 스포츠 영향력을 보유한 데이비드 베컴(David Beckham)과 파트너십을 체결하고 AI 기반 경기 데이터 분석 및 디지털 팬 경험 기술 협력을 확대한다. 2026 FIFA 월드컵 공...
    Date2026.04.01 Bynewsit Views48
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 238 Next
/ 238
CLOSE