- 7종 칩·5개 랙 통합 설계로 학습·추론·에이전트 전 과정 처리

 

[GTC 2026] 엔비디아, ‘베라 루빈’ 공개… NVL72·LPU 기반 AI 팩토리 전환.jpg

엔비디아가 GTC 2026에서 차세대 AI 플랫폼 베라 루빈을 공개하고, AI 인프라를 랙·POD 기반 ‘AI 팩토리구조로 확장한다고 밝혔다. GPU 중심 연산 구조에서 벗어나 학습과 추론, 에이전트 실행을 하나의 시스템으로 통합한 점이 핵심이다.

 

GPU 중심 구조에서 팩토리형 인프라로 이동

AI 인프라는 GPU 성능과 서버 확장 중심으로 발전해왔다. 모델 규모 확대와 에이전틱 워크로드 증가로 연산, 검증, 추론, 메모리를 동시에 처리하는 구조가 요구되고 있다. 베라 루빈은 칩 단위가 아닌 랙·POD 단위로 설계된 플랫폼이다. 베라 CPU, 루빈 GPU, NV링크 6, 커넥트X-9, 블루필드-4, 스펙트럼-6, 그록 3 LPU를 통합해 여러 랙이 하나의 시스템처럼 동작한다. 학습과 사후 학습, 테스트 시점 확장, 추론까지 전 과정을 단일 인프라에서 처리한다.

 

NVL72, 학습 효율과 비용 구조 동시 개선

NVL72 랙은 72GPU36CPUNV링크 6로 연결한 통합 시스템이다. 대규모 MoE 모델 학습을 수행하면서 GPU 수를 기존 대비 4분의 1 수준으로 줄였고, 토큰당 비용을 10분의 1 수준으로 낮췄다. 와트당 추론 처리량은 최대 10배까지 향상됐다. 인피니밴드와 이더넷을 통해 대규모 클러스터로 확장되며, 학습 시간 단축과 총소유비용 절감을 동시에 달성한다. GPU 수 증가 대신 효율 중심으로 학습 인프라를 재구성하는 구조다.

 

CPU , 강화학습·검증 루프 처리

베라 CPU 랙은 256CPU 기반 고밀도 액체 냉각 구조로, 강화학습과 시뮬레이션, 검증 워크로드를 처리한다. GPU가 생성한 결과를 테스트하고 반복 학습하는 과정에서 활용되며, 스펙트럼-X 네트워크로 대규모 환경을 동기화한다. 모델 생성 이후 검증과 실행 단계를 처리하는 CPU 비중이 확대되며, 학습 중심 구조에서 학습+검증통합 구조로 전환하는 기반을 형성한다.

 

LPX, 저지연 추론 성능 확보

그록 3 LPU 기반 LPX 랙은 추론 전용 인프라다. 256LPU와 온칩 SRAM, 초당 640TB 대역폭을 기반으로 메가와트당 최대 35배 수준의 추론 처리량을 제공한다GPULPU가 공동으로 토큰 연산을 수행해 디코딩 속도를 높이고, 1조 파라미터·100만 토큰 컨텍스트 기반 모델에 대응한다. 대규모 모델에서 발생하는 추론 지연을 줄인다.

 

STX, KV 캐시 기반 메모리 확장 구조

블루필드-4 STX 랙은 KV 캐시 데이터를 저장·검색하는 AI 전용 스토리지 계층이다. GPU 메모리를 POD 전체로 확장하며, 도카 메모스 기반으로 추론 처리량을 최대 5배까지 높인다. 대규모 컨텍스트와 멀티턴 상호작용 환경에서 메모리 병목을 줄인다.

 

SPX, 랙 간 데이터 흐름 최적화

스펙트럼-6 SPX 이더넷은 AI 팩토리 내부의 동서 트래픽을 처리한다. 광학 모듈 통합 구조를 통해 기존 대비 최대 5배 높은 전력 효율과 10배 높은 복원력을 제공한다. 대규모 클러스터 환경에서 네트워크 병목을 줄이고 안정적인 확장성을 확보한다.

 

전력·운영까지 포함된 인프라 설계

엔비디아는 DSX 플랫폼을 통해 전력 제약 환경에서도 데이터센터 인프라 밀도를 높이는 방식을 제시했다. DSX는 동적 전력 프로비저닝을 적용해 최대 30% 추가 시스템 구축을 지원한다. AI 인프라 설계는 연산 성능 중심에서 전력과 운영 효율까지 포함하는 구조로 확장된다.

 

클라우드·AI 생태계 확산

베라 루빈 기반 인프라는 AWS, 구글 클라우드, 마이크로소프트 애저, 오라클 등을 통해 제공될 예정이다. 오픈AI, 앤트로픽, 미스트랄 등 주요 AI 기업들도 해당 플랫폼을 기반으로 대규모 모델과 에이전트 시스템을 확장할 계획이다.

 

엔비디아 젠슨 황 CEO베라 루빈은 7개 칩과 5개 랙으로 구성된 통합 인프라로 AI 전 단계를 지원하며, 에이전틱 AI 전환을 본격화하는 기반이라고 밝혔다.

 

#GTC2026 #엔비디아 #베라루빈 #AI팩토리 #NVL72 #LPU #블루필드4 #스펙트럼6 #AI인프라 #데이터센터

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
2332 넷앱, NVIDIA 기반 AI Data Engine 공개…메타데이터 중심 AI 데이터 파이프라인 구조 제시 - 글로벌 메타데이터 카탈로그 기반 데이터 탐색·거버넌스 통합, 에이전틱 AI 워크플로우 지원 넷앱이 NVIDIA AI Data Platform 레퍼런스 아키텍처와 결합한 AI ... file newsit 2026.03.24 37
2331 스트라타시스, TrueDent CE Class IIa 획득…3D 프린팅 의치 적용 범위 확대 - 모놀리식 다색 의치·임시 수복 적용, 유럽 디지털 보철 워크플로우 확장 스트라타시스 트루덴트(TrueDent) 레진이 CE Class IIa 의료기기 인증을 획득하며 3D ... file newsit 2026.03.24 40
2330 EDB, EPAS 네이티브 TDE로 WAL·임시파일까지 암호화 - 커널 I/O 레벨 통합 방식으로 인덱스·임시파일·WAL까지 보호 범위 확장 EDB가 PostgreSQL 커널 레벨에 통합된 네이티브 TDE(Transparent Data Encryption)를 적... file newsit 2026.03.23 23
2329 [GTC 2026] 레노버, AI 추론부터 AI 팩토리까지 확장…하이브리드 AI 전주기 실행 구조 공개 - 워크스테이션·엣지·데이터센터·AI 팩토리로 이어지는 추론 중심 인프라 구성 레노버가 GTC 2026에서 AI 추론부터 AI 팩토리까지 이어지는 하이브리드 AI 실행 ... file newsit 2026.03.20 51
2328 아웃시스템즈, G2 AI 에이전트 빌더 리더 선정…NPS 95점 기록 - 관리 편의성 100%·맥락 인식 95%, 엔터프라이즈 AI 에이전트 평가 상위권 확보 아웃시스템즈가 G2 ‘2026 Grid Report’에서 AI 에이전트 빌더 부문 리더로 선정... file newsit 2026.03.20 51
2327 지멘스, 에이전틱 AI 기반 반도체 검증 플랫폼 ‘퀘스타 원 에이전틱 툴킷’ 공개 - RTL 사인오프 가속, 설계·검증 워크플로우를 AI 기반으로 재구성 지멘스가 ‘퀘스타 원 에이전틱 툴킷’을 통해 반도체 설계 검증 전 과정을 에이전틱 AI 기반 워... file newsit 2026.03.20 44
2326 아비바-엔비디아, 기가와트급 AI 팩토리 디지털 트윈 공개…설계·운영 통합 구조 구축 - 옴니버스 DSX 기반 아키텍처, GPU 효율·토큰 처리 속도 동시 개선 아비바가 엔비디아와 협력해 기가와트급 AI 팩토리 구축을 위한 라이프사이클 디지털 트윈 아... file newsit 2026.03.20 31
2325 코헤시티, NH농협은행 클라우드 백업 구축…TCO 28억 절감·복구시간 94% 단축 - 퍼블릭 클라우드 기반 소산백업 전환, 자동화 검증으로 금융 데이터 보호 강화 코헤시티가 NH농협은행에 퍼블릭 클라우드 기반 원격 소산백업 시스템을 구축하... file newsit 2026.03.19 42
2324 [GTC 2026] HPE, 엔비디아와 AI 인프라 확장…GPU 128개 규모·인증 스토리지 적용 - 프라이빗 클라우드 기반 대규모 AI 처리 성능·운영 안정성 확보 HPE가 엔비디아와 협력해 최대 128개 GPU를 동시에 활용하는 대규모 AI 인프라를 공개했다. 엔... file newsit 2026.03.19 44
2323 [GTC 2026] 엔비디아, 오라클과 벡터 검색 가속…GPU 인덱싱 협력 확대 - cuVS·오라클 AI DB 결합, 대규모 데이터 검색·의료 AI 활용 속도 개선 엔비디아가 GTC 2026에서 오라클과 협력해 GPU 기반 벡터 인덱스 구축 기술을 실제 워크... file newsit 2026.03.19 42
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 236 Next
/ 236
CLOSE