- 7종 칩·5개 랙 통합 설계로 학습·추론·에이전트 전 과정 처리

 

[GTC 2026] 엔비디아, ‘베라 루빈’ 공개… NVL72·LPU 기반 AI 팩토리 전환.jpg

엔비디아가 GTC 2026에서 차세대 AI 플랫폼 베라 루빈을 공개하고, AI 인프라를 랙·POD 기반 ‘AI 팩토리구조로 확장한다고 밝혔다. GPU 중심 연산 구조에서 벗어나 학습과 추론, 에이전트 실행을 하나의 시스템으로 통합한 점이 핵심이다.

 

GPU 중심 구조에서 팩토리형 인프라로 이동

AI 인프라는 GPU 성능과 서버 확장 중심으로 발전해왔다. 모델 규모 확대와 에이전틱 워크로드 증가로 연산, 검증, 추론, 메모리를 동시에 처리하는 구조가 요구되고 있다. 베라 루빈은 칩 단위가 아닌 랙·POD 단위로 설계된 플랫폼이다. 베라 CPU, 루빈 GPU, NV링크 6, 커넥트X-9, 블루필드-4, 스펙트럼-6, 그록 3 LPU를 통합해 여러 랙이 하나의 시스템처럼 동작한다. 학습과 사후 학습, 테스트 시점 확장, 추론까지 전 과정을 단일 인프라에서 처리한다.

 

NVL72, 학습 효율과 비용 구조 동시 개선

NVL72 랙은 72GPU36CPUNV링크 6로 연결한 통합 시스템이다. 대규모 MoE 모델 학습을 수행하면서 GPU 수를 기존 대비 4분의 1 수준으로 줄였고, 토큰당 비용을 10분의 1 수준으로 낮췄다. 와트당 추론 처리량은 최대 10배까지 향상됐다. 인피니밴드와 이더넷을 통해 대규모 클러스터로 확장되며, 학습 시간 단축과 총소유비용 절감을 동시에 달성한다. GPU 수 증가 대신 효율 중심으로 학습 인프라를 재구성하는 구조다.

 

CPU , 강화학습·검증 루프 처리

베라 CPU 랙은 256CPU 기반 고밀도 액체 냉각 구조로, 강화학습과 시뮬레이션, 검증 워크로드를 처리한다. GPU가 생성한 결과를 테스트하고 반복 학습하는 과정에서 활용되며, 스펙트럼-X 네트워크로 대규모 환경을 동기화한다. 모델 생성 이후 검증과 실행 단계를 처리하는 CPU 비중이 확대되며, 학습 중심 구조에서 학습+검증통합 구조로 전환하는 기반을 형성한다.

 

LPX, 저지연 추론 성능 확보

그록 3 LPU 기반 LPX 랙은 추론 전용 인프라다. 256LPU와 온칩 SRAM, 초당 640TB 대역폭을 기반으로 메가와트당 최대 35배 수준의 추론 처리량을 제공한다GPULPU가 공동으로 토큰 연산을 수행해 디코딩 속도를 높이고, 1조 파라미터·100만 토큰 컨텍스트 기반 모델에 대응한다. 대규모 모델에서 발생하는 추론 지연을 줄인다.

 

STX, KV 캐시 기반 메모리 확장 구조

블루필드-4 STX 랙은 KV 캐시 데이터를 저장·검색하는 AI 전용 스토리지 계층이다. GPU 메모리를 POD 전체로 확장하며, 도카 메모스 기반으로 추론 처리량을 최대 5배까지 높인다. 대규모 컨텍스트와 멀티턴 상호작용 환경에서 메모리 병목을 줄인다.

 

SPX, 랙 간 데이터 흐름 최적화

스펙트럼-6 SPX 이더넷은 AI 팩토리 내부의 동서 트래픽을 처리한다. 광학 모듈 통합 구조를 통해 기존 대비 최대 5배 높은 전력 효율과 10배 높은 복원력을 제공한다. 대규모 클러스터 환경에서 네트워크 병목을 줄이고 안정적인 확장성을 확보한다.

 

전력·운영까지 포함된 인프라 설계

엔비디아는 DSX 플랫폼을 통해 전력 제약 환경에서도 데이터센터 인프라 밀도를 높이는 방식을 제시했다. DSX는 동적 전력 프로비저닝을 적용해 최대 30% 추가 시스템 구축을 지원한다. AI 인프라 설계는 연산 성능 중심에서 전력과 운영 효율까지 포함하는 구조로 확장된다.

 

클라우드·AI 생태계 확산

베라 루빈 기반 인프라는 AWS, 구글 클라우드, 마이크로소프트 애저, 오라클 등을 통해 제공될 예정이다. 오픈AI, 앤트로픽, 미스트랄 등 주요 AI 기업들도 해당 플랫폼을 기반으로 대규모 모델과 에이전트 시스템을 확장할 계획이다.

 

엔비디아 젠슨 황 CEO베라 루빈은 7개 칩과 5개 랙으로 구성된 통합 인프라로 AI 전 단계를 지원하며, 에이전틱 AI 전환을 본격화하는 기반이라고 밝혔다.

 

#GTC2026 #엔비디아 #베라루빈 #AI팩토리 #NVL72 #LPU #블루필드4 #스펙트럼6 #AI인프라 #데이터센터

 

 
?

  1. [GTC 2026] TI, 엔비디아와 800V DC 전력 아키텍처 공개… AI 데이터센터 전력 구조 전환

    - 2단 변환 구조 기반 고효율·고밀도 전력 설계 제시 TI가 엔비디아와 협력한 800V DC 기반 AI 데이터센터 전력 아키텍처를 공개하고 전력 효율과 밀도를 동시에 높이는 고전압 D#GTC2026C 설계를 제시했다. 엔비디아의 800V 레퍼런스를 기반으로 아날로그·임...
    Date2026.03.18 Bynewsit Views46
    Read More
  2. MSI, 서강대 체험 행사 개최… ‘프레스티지 2026’ 첫 공개

    - 팬서레이크·RTX 50 기반 신제품 전시… 대학생 대상 체험 중심 운영 MSI가 서강대학교에서 노트북·UMPC 체험 행사를 열고 ‘프레스티지 2026’ 시리즈를 처음 공개한다. 팬서레이크 기반 신제품과 RTX 50 노트북을 통해 새학기 수요를 겨냥한 체험 중심 운영 전...
    Date2026.03.18 Bynewsit Views58
    Read More
  3. 스플렁크, ‘스플렁크 고 2026 서울’ 개최… 에이전틱 AI 옵저버빌리티 전략 공개

    - 시스코 데이터 패브릭 결합…AI 스택 전반 가시성·보안·제어 통합 스플렁크가 ‘스플렁크 고 2026 서울’을 개최하고 AI 스택 전반의 가시성과 보안·제어를 통합하는 운영 전략을 공개했다. 머신 데이터와 AI를 결합해 보안 운영과 옵저버빌리티를 동시에 강화...
    Date2026.03.18 Bynewsit Views49
    Read More
  4. NXP, 엔비디아와 로보틱스 솔루션 출시…피지컬 AI 데이터 처리 구조 통합

    - 센서 융합·모터 제어 통합 제품 공개…저지연 데이터 처리·전송 기반 구축 NXP가 엔비디아와 협력해 로보틱스 솔루션을 출시하며 피지컬 AI 환경에서 요구되는 실시간 데이터 처리 구조를 제시했다. 센서 융합과 머신 비전, 정밀 모터 제어를 하나의 시스템으...
    Date2026.03.18 Bynewsit Views50
    Read More
  5. [GTC 2026] SAP, 폭스콘과 ‘AI 팩토리’ 협력…제조·공급망 구조 통합 추진

    - GTC 2026서 파트너십 발표…엔터프라이즈 AI·스마트 제조 결합 모델 구축 SAP가 폭스콘과 협력해 ‘AI 팩토리’ 기반 제조·공급망 통합 구조를 구축하며 아시아태평양 지역 엔터프라이즈 AI 도입을 확대한다. 이번 파트너십은 GTC 2026에서 공개됐으며, 폭스콘...
    Date2026.03.18 Bynewsit Views47
    Read More
  6. 알리바바, 에이전틱 플랫폼 ‘우콩’ 공개…기업용 AI 업무 자동화 구조 제시

    - 멀티 에이전트 오케스트레이션 기반 업무 처리…딩톡 연동·보안 중심 설계 알리바바가 기업 업무에 특화된 AI 네이티브 에이전틱 플랫폼 ‘우콩’을 공개하며 멀티 에이전트 기반 업무 자동화 구조를 제시했다.이번 플랫폼은 하나의 인터페이스에서 여러 AI 에...
    Date2026.03.18 Bynewsit Views45
    Read More
  7. 델, 엔비디아 기반 AI 데이터 플랫폼 확대…데이터 병목 해소·AI 처리 구조 통합

    - 데이터 라이프사이클 자동화·초고성능 스토리지 결합…에이전틱 AI 워크로드 대응 델이 ‘엔비디아 기반 AI 데이터 플랫폼’을 확대하며 데이터 준비부터 추론까지 이어지는 AI 데이터 처리 구조를 통합했다. 이번 업데이트는 데이터 탐색과 활용을 자동화하고,...
    Date2026.03.18 Bynewsit Views51
    Read More
  8. 티오리, NDSS 채택 ‘DirtyFree’ 공개…리눅스 커널 공격·방어 구조 제시

    - DOP 기반 공격 단순화 기법 제안…성능 저하 0.28% 수준 방어 기술 함께 구현 티오리가 리눅스 커널 공격 기법 ‘DirtyFree’ 연구를 NDSS에 발표하며 공격 경로 단순화와 이를 차단하는 방어 구조를 동시에 제시했다. NDSS(Network and Distributed System Sec...
    Date2026.03.18 Bynewsit Views68
    Read More
  9. 마스터카드, AI 에이전트 ‘국내 첫 결제’…에이전틱 커머스 실증

    - 공항 이동 서비스 예약부터 결제까지 전 과정 자동 수행 마스터카드가 AI 에이전트가 검색부터 결제까지 전 과정을 수행하는 실거래를 국내에서 처음 구현하며 에이전틱 커머스 상용화 가능성을 확인했다. 인천공항에서 서울 광화문 호텔까지 이동하는 차량 ...
    Date2026.03.17 Bynewsit Views39
    Read More
  10. [GTC 2026] ADI, 피지컬 인텔리전스 로보틱스 공개…촉각·디지털 트윈 결합

    - 촉각 센서·디지털 트윈 기반 휴머노이드 조작 데모 진행 아나로그디바이스가 GTC 2026에서 피지컬 인텔리전스 기반 로보틱스 기술을 시연하며 휴머노이드 손 조작 플랫폼과 산업용 평가 기준을 공개했다. 촉각 센서와 디지털 트윈, AI 제어를 결합한 데모를 ...
    Date2026.03.17 Bynewsit Views47
    Read More
  11. [GTC 2026] 엔비디아, 다이나모 공개…AI 팩토리용 추론 운영체제 제시

    - GPU·메모리 자원 오케스트레이션으로 추론 성능·비용 구조 개선 엔비디아가 GTC 2026에서 대규모 생성형·에이전틱 추론을 위한 오픈소스 소프트웨어 ‘다이나모 1.0’을 공개하며 AI 팩토리 운영 구조를 제시했다. 분산된 GPU와 메모리 자원을 통합 관리해 추...
    Date2026.03.17 Bynewsit Views42
    Read More
  12. 타포, 듀얼 렌즈 홈캠 ‘C245D’ 출시…넓은 실내 모니터링 강화

    - 광각·망원 결합과 AI 추적으로 사각지대 최소화 티피링크 스마트홈 브랜드 타포가 듀얼 렌즈 구조를 적용한 실내 보안 카메라 ‘Tapo C245D’를 출시하며 넓은 공간을 동시에 모니터링하는 방식을 제시했다. 하나의 장치로 시야 확보와 추적 기능을 함께 처리...
    Date2026.03.17 Bynewsit Views57
    Read More
  13. [GTC 2026] 엔비디아, 베라 CPU 공개…에이전틱 AI 처리 구조 확장

    - CPU 역할 확장해 추론·오케스트레이션 성능과 효율 동시 개선 엔비디아가 GTC 2026에서 에이전틱 AI와 강화학습을 위한 ‘베라 CPU’를 공개하며 AI 인프라 구조를 확장한다. 보조 연산에 머물던 CPU를 실행과 제어 중심으로 끌어올리면서, 대규모 에이전틱 워...
    Date2026.03.17 Bynewsit Views62
    Read More
  14. [GTC 2026] 델, AI 팩토리 업데이트…엔터프라이즈 AI ROI 경로 제시

    - 데이터·인프라·서비스 통합해 파일럿에서 운영까지 확장 지원 델이 ‘엔비디아 기반 델 AI 팩토리’ 2주년을 맞아 AI 데이터 플랫폼과 인프라, 솔루션 전반을 업데이트하며 엔터프라이즈 AI의 투자수익률(ROI)을 확보하는 구조를 제시했다. 파일럿 단계에 머물...
    Date2026.03.17 Bynewsit Views42
    Read More
  15. [GTC 2026] 엔비디아, IGX 토르 출시…산업 현장에 실시간 피지컬 AI 구현

    - 센서·추론·제어 통합 플랫폼으로 안전성과 생산성 동시 확보 엔비디아가 GTC 2026에서 산업용 AI 플랫폼 ‘IGX 토르’를 출시하며 피지컬 AI 기반 실시간 연산 환경을 산업 현장에 적용한다. 고속 센서 처리와 엔터프라이즈급 신뢰성, 기능적 안전성을 결합해 ...
    Date2026.03.17 Bynewsit Views67
    Read More
  16. [GTC 2026] 엔비디아, 스페이스 컴퓨팅 공개…궤도 데이터센터로 AI 확장

    - SWaP 제약 넘는 AI 플랫폼, 우주·지상 연산 구조 통합 엔비디아가 GTC 2026에서 스페이스 컴퓨팅 플랫폼을 공개하며 궤도 데이터센터(ODC) 기반 AI 실행 구조를 확장한다. 지상에 머물던 연산을 우주로 끌어올리면서, 실시간 처리와 자율 운영을 하나의 흐름...
    Date2026.03.17 Bynewsit Views51
    Read More
  17. 로지텍, RS H-시프터 출시…홀 효과 센서 기반 수동 변속 정밀도 강화

    - H패턴·비접촉 구조 결합해 조작 감각과 내구성 동시에 확보 로지텍이 게이밍 레이싱 기어 ‘RS H-시프터’를 국내에 출시하고 수동 변속 기반 레이싱 경험을 강화한다. 7단+후진 구조와 비접촉 센서를 적용해 조작 정밀도와 내구성을 함께 끌어올렸다. 실차 감...
    Date2026.03.17 Bynewsit Views68
    Read More
  18. [GTC 2026] 엔비디아, 현대차·기아와 협력 확대… DRIVE 하이페리온 기반 자율주행 개발 가속

    - SDV·플릿 데이터 결합해 레벨2~4 자율주행 시스템 확장 엔비디아가 현대차·기아와 협력을 확대하고 DRIVE 하이페리온 플랫폼을 기반으로 데이터 중심 자율주행 시스템 개발을 추진한다. 소프트웨어 정의 차량과 대규모 차량 데이터, AI 컴퓨팅을 결합해 자율...
    Date2026.03.17 Bynewsit Views39
    Read More
  19. [GTC 2026] 엔비디아, 블루필드-4 STX 공개… 컨텍스트 메모리 기반 AI 스토리지 확장

    - 토큰 처리량 5배·에너지 효율 4배… 장문 추론 대응 인프라 제시 엔비디아가 GTC 2026에서 블루필드-4 기반 STX 스토리지 아키텍처를 공개하고, 에이전틱 AI 환경에 대응하는 컨텍스트 메모리 중심 인프라를 제시했다. 긴 컨텍스트 기반 추론에서 발생하는 데...
    Date2026.03.17 Bynewsit Views42
    Read More
  20. 스틸시리즈, 컨트롤프릭 기획전 진행… 전 제품 15% 할인

    - 네이버 공식스토어서 2주간 할인·리뷰 이벤트 운영 스틸시리즈가 컨트롤프릭 기획전을 열고 콘솔 게이밍 액세서리 할인 프로모션을 시작한다. 네이버 공식스토어에서 3월 16일부터 29일까지 전 제품 15% 할인과 리뷰 이벤트를 함께 진행한다. 2주간 할인·경...
    Date2026.03.17 Bynewsit Views38
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 287 Next
/ 287
CLOSE