소프트웨어·컴퓨팅

2026.02.23 15:44

엔비디아, 블랙웰 울트라로 에이전틱 AI 추론 경쟁 본격화…성능 50배↑·토큰 비용 35배↓

newsit

https://hwlab.com/SW_Computing/19060 조회 수 125 추천 수 0 댓글 0

Extra Form
참조#1	https://blogs.nvidia.com/blog/inference-...per-token/
참조#2	https://openrouter.ai/state-of-ai
참조#3	https://inferencex.semianalysis.com/

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

- GB300 NVL72, 호퍼 대비 메가와트당 처리량 최대 50배 향상…저지연 환경 100만 토큰당 비용 35배 절감

엔비디아, 블랙웰 울트라로 에이전틱 AI 추론 경쟁 본격화…성능 50배↑·토큰 비용 35배↓.jpg

엔비디아가 차세대 블랙웰 울트라 플랫폼을 공개하고 에이전틱 AI 추론 인프라 경쟁을 본격화했다. GB300 NVL72 시스템은 기존 호퍼 플랫폼 대비 메가와트당 처리량을 최대 50배 향상시키고, 저지연 환경에서 100만 토큰당 비용을 최대 35배 절감했다. 처리량과 토큰 비용을 동시에 낮추며 대규모 추론 환경의 총소유비용 구조를 크게 바꿨다.

에이전틱 AI 확산, 추론 인프라가 경쟁력 좌우

OpenRouter의 ‘State of Inference’ 보고서에 따르면 AI 에이전트와 코딩 어시스턴트 확산으로 소프트웨어 프로그래밍 관련 AI 쿼리는 지난해 11%에서 약 50% 수준으로 급증했다. 다단계 워크플로 전반에서 실시간 반응성을 유지하려면 저지연 처리와 긴 컨텍스트 대응 역량이 필수 요건으로 자리 잡고 있다.

엔비디아, 블랙웰 울트라로 에이전틱 AI 시대 가속… 성능 최대 50배↑·비용 35배↓.jpg

SemiAnalysis InferenceX 데이터는 블랙웰 울트라와 엔비디아 소프트웨어 최적화 기술의 결합이 성능과 비용을 동시에 개선했다고 분석했다. GB300 NVL72는 호퍼 대비 메가와트당 처리량을 최대 50배 향상시키고, 토큰당 비용을 최대 35배 절감했다. 총소유비용(TCO) 관점에서도 추론 워크로드의 경제성을 크게 높였다.

GB300 NVL72, 저지연 워크로드 성능 구조 개선

엔비디아 텐서RT-LLM, 다이나모, 문케이크, SGLang 등으로 구성된 공동 설계 소프트웨어 스택은 전문가 혼합(MoE) 추론 처리량을 전 구간에서 끌어올렸다. 최근 4개월 사이 저지연 워크로드 성능은 최대 5배 개선됐다.

엔비디아 GB300 NVL72, 엔비디아 다이나모, 텐서RT-LLM 등으로 구성된 공동 설계 소프트웨어 스택은 엔비디아 호퍼 플랫폼 대비 토큰당 비용을 35배 절감한다.jpg

고성능 GPU 커널 최적화, NV링크 시메트릭 메모리, 프로그래매틱 디펜던트 런치 기술은 GPU 간 통신 효율을 높이고 유휴 시간을 줄였다. 칩과 시스템 아키텍처, 소프트웨어를 함께 설계하는 전략이 에너지 효율과 처리량을 동시에 끌어올렸다. 그 결과 GB300 NVL72는 지연 시간 전 구간에서 호퍼 대비 우수한 비용 구조를 구현했다.

긴 컨텍스트 환경에서 토큰 경제성 강화

GB300 NVL72는 128,000 토큰 입력과 8,000 토큰 출력을 처리하는 긴 컨텍스트 워크로드에서 강점을 보인다. GB200 NVL72 대비 토큰당 비용을 최대 1.5배 낮췄다. NVFP4 연산 성능은 1.5배 향상됐고 어텐션 처리 속도는 2배 빨라졌다. 대규모 코드베이스를 추론하는 에이전트 환경에서 처리 효율과 응답 속도를 동시에 확보할 수 있다.

클라우드 사업자, GB300 도입 확대

MS, 코어위브, OCI 등 주요 클라우드 사업자는 GB300 NVL72를 에이전틱 코딩과 긴 컨텍스트 활용 사례에 적용하고 있다. 토큰 비용을 낮추면서 대규모 코드베이스를 실시간으로 추론하는 환경을 구축하고 있다는 설명이다. 코어위브 첸 골드버그 엔지니어링 총괄 부사장은 “긴 컨텍스트 처리 성능과 토큰 효율성이 AI 프로덕션 환경의 핵심 요소로 자리 잡았으며, GB300 시스템은 대규모 워크로드에서도 예측 가능한 성능과 비용 구조를 제공한다”고 밝혔다.

차세대 루빈 플랫폼, 추가 도약 예고

엔비디아는 차세대 ‘루빈(Rubin)’ 플랫폼을 통해 또 한 번의 성능 도약을 예고했다. 루빈은 6개의 신규 칩을 통합해 AI 슈퍼컴퓨터를 구성하며, MoE 추론에서 블랙웰 대비 메가와트당 최대 10배 높은 처리량과 100만 토큰당 10분의 1 수준 비용을 목표로 한다.

블랙웰 울트라와 루빈 플랫폼은 에이전틱 AI 시대에 필요한 대규모 추론 인프라 경쟁을 본격화하는 핵심 축으로 자리 잡을 전망이다.

#엔비디아 #BlackwellUltra #GB300NVL72 #에이전틱AI #AI추론 #MoE #TensorRTLLM #루빈

Facebook Twitter Google Pinterest KakaoStory Band

Atachment
첨부 '4'	엔비디아, 블랙웰 울트라로 에이전틱 AI 시대 가속… 성능 최대 50배↑·비용 35배↓.jpg, 엔비디아 GB300 NVL72, 엔비디아 다이나모, 텐서RT-LLM 등으로 구성된 공동 설계 소프트웨어 스택은 엔비디아 호퍼 플랫폼 대비 토큰당 비용을 35배 절감한다.jpg, 엔비디아 GB300 NVL72는 저지연, 긴 컨텍스트 워크로드에 최적화된 시스템이다.jpg, 엔비디아, 블랙웰 울트라로 에이전틱 AI 추론 경쟁 본격화…성능 50배↑·토큰 비용 35배↓.jpg,

위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

댓글 쓰기

에디터 사용하기 닫기

소프트웨어·컴퓨팅

헥사곤, SIMTOS 2026 참가…정밀 측정·AI 기반 제조 솔루션 공개

- 3차원 측정기·대형 구조물 자동화 검사·AI CAM 기술 전시, 데이터 기반 제조 품질 관리 구조 제시 헥사곤이 SIMTOS 2026에서 정밀 측정 장비와 자동화 검사 시스템, AI 기반 CAM 소프트웨어를 공개한다. 측정 데이터와 제조 공정을 연결하는 제조 인텔리전스...

Date2026.03.26 Bynewsit Views31

Read More
세일포인트, AWS 협력 에이전틱 AI 보안 확장…통합 아이덴티티 거버넌스 레이어 구축

- 인간·머신·AI 에이전트 통합 관리 구조 적용, 지속적 권한 제어 기반 보안 체계 확장 세일포인트가 AWS와 전략적 협력 계약(SCA)을 체결하고 에이전틱 AI 환경을 위한 통합 아이덴티티 거버넌스 레이어 구축을 추진한다. AWS 환경에서 인간과 머신, AI 에이...

Date2026.03.26 Bynewsit Views36

Read More
옥타브, IDC 마켓스케이프 EAM 리더 선정… AI 기반 자산 생애주기 관리 구조 평가

- 자산 계획·정비·운영 데이터 연결하는 EAM 플랫폼 역량 반영 옥타브가 IDC가 발표한 ‘IDC 마켓스케이프: 2025-2026년 전 세계 AI 기반 자산집약 산업용 엔터프라이즈 자산 관리(EAM) 애플리케이션 제공업체 평가’에서 리더로 선정됐다. 자산 계획부터 유지보...

Date2026.03.25 Bynewsit Views25

Read More
한국퀀텀컴퓨팅, 에어큐브와 PQC 기반 패스워드리스 인증 PoC 추진

- 양자내성암호와 IAM 결합해 NPE 키 관리 구조 검증 한국퀀텀컴퓨팅(KQC)이 에어큐브와 PQC(Post-Quantum Cryptography) 기반 패스워드리스 인증 모델 공동 검증에 나선다. 양자내성암호와 통합 인증·접근관리(IAM)를 결합해 비밀번호 없이 동작하는 인증 구...

Date2026.03.25 Bynewsit Views27

Read More
넷앱, NVIDIA 기반 AI Data Engine 공개…메타데이터 중심 AI 데이터 파이프라인 구조 제시

- 글로벌 메타데이터 카탈로그 기반 데이터 탐색·거버넌스 통합, 에이전틱 AI 워크플로우 지원 넷앱이 NVIDIA AI Data Platform 레퍼런스 아키텍처와 결합한 AI 데이터 플랫폼 ‘NetApp AI Data Engine(AIDE)’을 공개했다. 글로벌 메타데이터 카탈로그와 시맨틱...

Date2026.03.24 Bynewsit Views40

Read More
스트라타시스, TrueDent CE Class IIa 획득…3D 프린팅 의치 적용 범위 확대

- 모놀리식 다색 의치·임시 수복 적용, 유럽 디지털 보철 워크플로우 확장 스트라타시스 트루덴트(TrueDent) 레진이 CE Class IIa 의료기기 인증을 획득하며 3D 프린팅 의치 적용 범위를 확장했다. 폴리크로매틱 모놀리식 구조 기반 완전 의치와 부분 의치, 크...

Date2026.03.24 Bynewsit Views47

Read More
EDB, EPAS 네이티브 TDE로 WAL·임시파일까지 암호화

- 커널 I/O 레벨 통합 방식으로 인덱스·임시파일·WAL까지 보호 범위 확장 EDB가 PostgreSQL 커널 레벨에 통합된 네이티브 TDE(Transparent Data Encryption)를 적용한 EPAS를 공개하며 데이터 저장 전 영역 암호화 구조를 제시했다. 인덱스와 임시 파일, WAL(W...

Date2026.03.23 Bynewsit Views28

Read More
[GTC 2026] 레노버, AI 추론부터 AI 팩토리까지 확장…하이브리드 AI 전주기 실행 구조 공개

- 워크스테이션·엣지·데이터센터·AI 팩토리로 이어지는 추론 중심 인프라 구성 레노버가 GTC 2026에서 AI 추론부터 AI 팩토리까지 이어지는 하이브리드 AI 실행 구조를 공개했다. 온프레미스와 클라우드를 결합해 추론 워크로드를 분산 처리하고 토큰 처리 효...

Date2026.03.20 Bynewsit Views56

Read More
아웃시스템즈, G2 AI 에이전트 빌더 리더 선정…NPS 95점 기록

- 관리 편의성 100%·맥락 인식 95%, 엔터프라이즈 AI 에이전트 평가 상위권 확보 아웃시스템즈가 G2 ‘2026 Grid Report’에서 AI 에이전트 빌더 부문 리더로 선정됐다. 관리 편의성 100%와 NPS 95점을 기록하며 엔터프라이즈 AI 에이전트 플랫폼 평가에서 높은 ...

Date2026.03.20 Bynewsit Views55

Read More
지멘스, 에이전틱 AI 기반 반도체 검증 플랫폼 ‘퀘스타 원 에이전틱 툴킷’ 공개

- RTL 사인오프 가속, 설계·검증 워크플로우를 AI 기반으로 재구성 지멘스가 ‘퀘스타 원 에이전틱 툴킷’을 통해 반도체 설계 검증 전 과정을 에이전틱 AI 기반 워크플로우로 전환하고, RTL 생성부터 클로저까지 이어지는 흐름을 하나로 연결하면서 사인오프 속...

Date2026.03.20 Bynewsit Views46

Read More

태그 쓰기

안랩, 정책·보조금 위장 광고 앱 주의…악성 기능 추가 ...	04-07
마우저, 암페놀 윌콕슨 VDS130 공급… IEPE 진동 데이터...	04-07
힐셔, HIMA와 SIL 3 대응 안전 통신 평가키트 공개… HI...	04-07
윈드리버, AMD와 오픈랜·AI-RAN 통합 플랫폼 공개…단일...	04-07
오토폼, K-제조 위한 디지털 금형 전략 발표… 숙련 기...	04-07
삼성전자·ETRI·프라임마스, CXL 기반 메모리 중심 컴퓨...	04-06
카스퍼스키, 2025 한국 보안 위협 보고서 발표…웹 공격...	04-06
알리바바, Qwen3.6-Plus·Qwen3.5-Omni 공개…에이전틱 ...	04-06
델, 2026년형 에일리언웨어 게이밍 노트북 3종 공개…OL...	04-06
한국레노버, 산업용 AI 엣지 컴퓨팅 ‘씽크엣지’ 2종 출...	04-06

소프트웨어·컴퓨팅

소프트웨어·컴퓨팅

엔비디아, 블랙웰 울트라로 에이전틱 AI 추론 경쟁 본격화…성능 50배↑·토큰 비용 35배↓

단축키

단축키

소프트웨어·컴퓨팅

헥사곤, SIMTOS 2026 참가…정밀 측정·AI 기반 제조 솔루션 공개

세일포인트, AWS 협력 에이전틱 AI 보안 확장…통합 아이덴티티 거버넌스 레이어 구축

옥타브, IDC 마켓스케이프 EAM 리더 선정… AI 기반 자산 생애주기 관리 구조 평가

한국퀀텀컴퓨팅, 에어큐브와 PQC 기반 패스워드리스 인증 PoC 추진

넷앱, NVIDIA 기반 AI Data Engine 공개…메타데이터 중심 AI 데이터 파이프라인 구조 제시

스트라타시스, TrueDent CE Class IIa 획득…3D 프린팅 의치 적용 범위 확대

EDB, EPAS 네이티브 TDE로 WAL·임시파일까지 암호화

[GTC 2026] 레노버, AI 추론부터 AI 팩토리까지 확장…하이브리드 AI 전주기 실행 구조 공개

아웃시스템즈, G2 AI 에이전트 빌더 리더 선정…NPS 95점 기록

지멘스, 에이전틱 AI 기반 반도체 검증 플랫폼 ‘퀘스타 원 에이전틱 툴킷’ 공개