- 7종 칩·5개 랙 통합 설계로 학습·추론·에이전트 전 과정 처리

 

[GTC 2026] 엔비디아, ‘베라 루빈’ 공개… NVL72·LPU 기반 AI 팩토리 전환.jpg

엔비디아가 GTC 2026에서 차세대 AI 플랫폼 베라 루빈을 공개하고, AI 인프라를 랙·POD 기반 ‘AI 팩토리구조로 확장한다고 밝혔다. GPU 중심 연산 구조에서 벗어나 학습과 추론, 에이전트 실행을 하나의 시스템으로 통합한 점이 핵심이다.

 

GPU 중심 구조에서 팩토리형 인프라로 이동

AI 인프라는 GPU 성능과 서버 확장 중심으로 발전해왔다. 모델 규모 확대와 에이전틱 워크로드 증가로 연산, 검증, 추론, 메모리를 동시에 처리하는 구조가 요구되고 있다. 베라 루빈은 칩 단위가 아닌 랙·POD 단위로 설계된 플랫폼이다. 베라 CPU, 루빈 GPU, NV링크 6, 커넥트X-9, 블루필드-4, 스펙트럼-6, 그록 3 LPU를 통합해 여러 랙이 하나의 시스템처럼 동작한다. 학습과 사후 학습, 테스트 시점 확장, 추론까지 전 과정을 단일 인프라에서 처리한다.

 

NVL72, 학습 효율과 비용 구조 동시 개선

NVL72 랙은 72GPU36CPUNV링크 6로 연결한 통합 시스템이다. 대규모 MoE 모델 학습을 수행하면서 GPU 수를 기존 대비 4분의 1 수준으로 줄였고, 토큰당 비용을 10분의 1 수준으로 낮췄다. 와트당 추론 처리량은 최대 10배까지 향상됐다. 인피니밴드와 이더넷을 통해 대규모 클러스터로 확장되며, 학습 시간 단축과 총소유비용 절감을 동시에 달성한다. GPU 수 증가 대신 효율 중심으로 학습 인프라를 재구성하는 구조다.

 

CPU , 강화학습·검증 루프 처리

베라 CPU 랙은 256CPU 기반 고밀도 액체 냉각 구조로, 강화학습과 시뮬레이션, 검증 워크로드를 처리한다. GPU가 생성한 결과를 테스트하고 반복 학습하는 과정에서 활용되며, 스펙트럼-X 네트워크로 대규모 환경을 동기화한다. 모델 생성 이후 검증과 실행 단계를 처리하는 CPU 비중이 확대되며, 학습 중심 구조에서 학습+검증통합 구조로 전환하는 기반을 형성한다.

 

LPX, 저지연 추론 성능 확보

그록 3 LPU 기반 LPX 랙은 추론 전용 인프라다. 256LPU와 온칩 SRAM, 초당 640TB 대역폭을 기반으로 메가와트당 최대 35배 수준의 추론 처리량을 제공한다GPULPU가 공동으로 토큰 연산을 수행해 디코딩 속도를 높이고, 1조 파라미터·100만 토큰 컨텍스트 기반 모델에 대응한다. 대규모 모델에서 발생하는 추론 지연을 줄인다.

 

STX, KV 캐시 기반 메모리 확장 구조

블루필드-4 STX 랙은 KV 캐시 데이터를 저장·검색하는 AI 전용 스토리지 계층이다. GPU 메모리를 POD 전체로 확장하며, 도카 메모스 기반으로 추론 처리량을 최대 5배까지 높인다. 대규모 컨텍스트와 멀티턴 상호작용 환경에서 메모리 병목을 줄인다.

 

SPX, 랙 간 데이터 흐름 최적화

스펙트럼-6 SPX 이더넷은 AI 팩토리 내부의 동서 트래픽을 처리한다. 광학 모듈 통합 구조를 통해 기존 대비 최대 5배 높은 전력 효율과 10배 높은 복원력을 제공한다. 대규모 클러스터 환경에서 네트워크 병목을 줄이고 안정적인 확장성을 확보한다.

 

전력·운영까지 포함된 인프라 설계

엔비디아는 DSX 플랫폼을 통해 전력 제약 환경에서도 데이터센터 인프라 밀도를 높이는 방식을 제시했다. DSX는 동적 전력 프로비저닝을 적용해 최대 30% 추가 시스템 구축을 지원한다. AI 인프라 설계는 연산 성능 중심에서 전력과 운영 효율까지 포함하는 구조로 확장된다.

 

클라우드·AI 생태계 확산

베라 루빈 기반 인프라는 AWS, 구글 클라우드, 마이크로소프트 애저, 오라클 등을 통해 제공될 예정이다. 오픈AI, 앤트로픽, 미스트랄 등 주요 AI 기업들도 해당 플랫폼을 기반으로 대규모 모델과 에이전트 시스템을 확장할 계획이다.

 

엔비디아 젠슨 황 CEO베라 루빈은 7개 칩과 5개 랙으로 구성된 통합 인프라로 AI 전 단계를 지원하며, 에이전틱 AI 전환을 본격화하는 기반이라고 밝혔다.

 

#GTC2026 #엔비디아 #베라루빈 #AI팩토리 #NVL72 #LPU #블루필드4 #스펙트럼6 #AI인프라 #데이터센터

 

 
?

  1. ST, 모션 제어용 고속 GaN 게이트 드라이버 출시…전력 효율·보호 기능 통합

    - STDRIVEG212·STDRIVEG612, 220V·600V 하이사이드 지원 - SmartSD 보호 기능·고속 전파 지연 특성으로 모션 제어 효율 개선 ST가 모션 제어와 전력 애플리케이션을 위한 고속 GaN 하프 브리지 게이트 드라이버 STDRIVEG212와 STDRIVEG612를 출시했다. GaN HEM...
    Date2026.04.14 Bynewsit Views55
    Read More
  2. 카스퍼스키, AI 캐리커처 열풍 속 개인정보 노출 위험 경고

    - 개인 맥락 정보 입력 과정에서 신원 사칭·사회공학 공격 가능성 증가 - 이미지 생성 과정에서 텍스트·행동 데이터까지 수집될 수 있어 주의 필요 카스퍼스키가 AI 캐리커처 생성 트렌드에서 개인 맥락 정보를 입력하는 과정이 신원 사칭과 사회공학 공격에 ...
    Date2026.04.14 Bynewsit Views58
    Read More
  3. 엔비디아, ‘네모트론 디벨로퍼 데이즈 서울 2026’ 첫 개최

    - 네모트론 오픈 모델 기반 소버린 AI 개발 전략 공유 - 기술 마스터클래스·48시간 해커톤·AI 에이전트 실습 프로그램 운영 엔비디아가 ‘네모트론 디벨로퍼 데이즈 서울 2026(NVIDIA Nemotron Developer Days Seoul 2026)’을 한국에서 처음 개최한다. 네모트론...
    Date2026.04.13 Bynewsit Views64
    Read More
  4. 로지텍, 앰배서더 프로그램 ‘로지텍 G 히어로즈’ 1기 모집

    - 제품 체험 기반 콘텐츠 제작 참여 프로그램 운영 - 어필리에이트·제품 지원·오프라인 이벤트 등 전용 혜택 제공 로지텍이 게이밍 기어 브랜드 로지텍 G 공식 앰배서더 프로그램 ‘로지텍 G 히어로즈’를 론칭하고 1기 참가자 모집을 시작했다. 제품 체험과 콘...
    Date2026.04.13 Bynewsit Views68
    Read More
  5. 마우저, 일상 속 AI 적용 사례 조명…EIT 기술 시리즈 공개

    - 소비가전·웨어러블·디지털 서비스 중심 AI 활용 사례 소개 - 엔지니어 관점에서 설계·적용 방법과 기술 과제 제시 마우저가 ‘일상 생활을 위한 AI 엔지니어링(Engineering AI for Daily Life)’을 주제로 함께 만드는 혁신(Empowering Innovation Together, E...
    Date2026.04.13 Bynewsit Views71
    Read More
  6. 코어시스템즈, 태양광 E-Ink 버스정보안내기 광명시 설치

    - 전자종이 기반 초저전력 구조로 외부 전력 없이 운영 - 무선 통신 기반 설치 방식으로 공사 부담 최소화 코어시스템즈가 광명시에 태양광 기반 E-Ink(전자종이) 버스정보안내기(BIT)를 설치하고 운영을 시작했다. 전자종이 디스플레이와 태양광 자가 발전 구...
    Date2026.04.13 Bynewsit Views40
    Read More
  7. 안랩, CPS 보안 플랫폼 ‘안랩 CPS 플러스’ 공개

    - OT 엔드포인트 보호 솔루션 ‘안랩 EPS’ 중심 CPS 보안 전략 소개 - 경량 설계 기반 구형 설비 보호 대응 제시 안랩이 Japan IT Week Spring 2026에서 CPS(사이버물리시스템) 보안 플랫폼 안랩 CPS 플러스와 OT 엔드포인트 보안 솔루션 안랩 EPS를 공개하고 O...
    Date2026.04.13 Bynewsit Views70
    Read More
  8. 레드햇, RHEL 14년 지원 ‘익스텐디드 라이프 사이클 프리미엄’ 출시

    - 단일 구독으로 장기 지원 체계 통합 - 금융·의료·공공 등 규제 산업 인프라 운영 기간 확대 레드햇이 레드햇 엔터프라이즈 리눅스 익스텐디드 라이프 사이클 프리미엄(Red Hat Enterprise Linux Extended Life Cycle Premium)을 출시하며 주요 레드햇 엔터프...
    Date2026.04.13 Bynewsit Views77
    Read More
  9. 그룹아이비, 북한 IT 인력 ‘AI 기반 가짜 신분 취업’ 캠페인 적발

    - 합성 신원과 생성형 AI 활용해 글로벌 기업 원격 채용 침투 시도 - 깃허브·프리랜서 플랫폼 기반 장기간 조직적 활동 확인 그룹아이비(Group-IB)가 북한(DPRK) 연계 IT 인력이 합성 신원(Synthetic Identity)과 생성형 AI 기반 입사 지원서를 활용해 글로벌 ...
    Date2026.04.13 Bynewsit Views81
    Read More
  10. 뉴타닉스, 멀티테넌트 클라우드 기능 확대… 파트너 서비스 경쟁력 지원

    - NCP 기반 멀티테넌트 IaaS 운영 환경 제공 - VM웨어 전환 지원 프로그램과 검증 서비스 체계 확대 뉴타닉스가 서비스 제공업체를 위한 멀티테넌시 기능과 마이그레이션 지원 프로그램을 발표하며 파트너 기반 클라우드 서비스 확장 전략을 강화했다. 멀티테...
    Date2026.04.13 Bynewsit Views61
    Read More
  11. 가트너, “재고 확보 영향으로 1분기 글로벌 PC 출하량 4% 증가”

    - 멤플레이션 대비 선제 재고 확보가 출하량 증가 견인 - 레노버·HP·델·애플 1~4위 유지… 에이수스 5위 상승 가트너가 2026년 1분기 전 세계 PC 출하량이 6,280만 대를 기록하며 전년 동기 대비 4% 증가했다고 발표했다. 메모리 가격 상승, 이른바 멤플레이션(...
    Date2026.04.13 Bynewsit Views51
    Read More
  12. 스틸시리즈, ‘에어록스 3 Gen 2’ 출시 기념 에임 마스터 대회 개최

    - 3D Aim Trainer 기반 FPS 에이밍 기록 경쟁 이벤트 운영 - 에어록스 3 Gen 2·Prime·QcK Pro 등 게이밍 기어 경품 제공 스틸시리즈가 ‘에어록스 3 무선 Gen 2(Aerox 3 Wireless Gen 2)’ 출시를 기념해 3D 에이밍 훈련 소프트웨어 기반 기록 경쟁 이벤트 ‘에임...
    Date2026.04.13 Bynewsit Views55
    Read More
  13. 매스웍스, 엣지 AI 파운데이션 합류…임베디드 AI 워크플로우 확장

    - 매트랩·시뮬링크 기반 모델 설계부터 시뮬레이션·디바이스 배포까지 연결 매스웍스가 엣지 AI 파운데이션(EDGE AI FOUNDATION)에 합류하며, 매트랩(MATLAB)과 시뮬링크(Simulink) 기반 임베디드 AI 모델 설계부터 시뮬레이션, 디바이스 배포까지 이어지는 개...
    Date2026.04.13 Bynewsit Views61
    Read More
  14. 히타치 밴타라, Agentic AI 운영 통합하는 Hitachi iQ Studio 공개

    - 노코드 에이전트 빌더와 온프레미스 RAG 환경으로 기업 AI 구축 흐름 단순화 HS효성인포메이션시스템이 히타치 밴타라의 Hitachi iQ Studio를 공개하며, RAG와 MCP 기반 Agentic AI 구축과 운영 거버넌스를 하나의 환경으로 통합했다. 에이전트 개발 전 과정...
    Date2026.04.13 Bynewsit Views74
    Read More
  15. 로지텍, 현대백화점 무역센터점 팝업스토어 오픈...업무·게이밍 체험 공간 운영

    - MX Master 4·PRO X SUPERLIGHT 2 등 주요 라인업 직접 체험 제공 로지텍이 현대백화점 무역센터점에 체험형 팝업스토어를 오픈하고 방문객이 실제 사용 환경 기반 체험존에서 업무용·게이밍 주요 제품 성능을 직접 체험할 수 있는 공간을 마련했다. 업무·게...
    Date2026.04.10 Bynewsit Views63
    Read More
  16. 인텔, 구글과 AI 인프라 협력 확대...Xeon·IPU로 이기종 컴퓨팅 효율 개선

    - CPU·인프라 가속 분담 방식으로 학습·추론·데이터 처리 최적화 인텔이 구글과 다년 협력을 확대하며 제온(Xeon) 프로세서와 IPU(인프라 처리 장치) 기반 이기종 컴퓨팅 적용 범위를 넓힌다. CPU 제어와 인프라 가속 기능을 분리해 AI 학습과 추론, 데이터 처...
    Date2026.04.10 Bynewsit Views88
    Read More
  17. 서비스나우, 전 제품 AI 네이티브 전환…컨텍스트 엔진으로 워크플로우 의사결정 통합

    - 데이터·거버넌스·실행 기능 기본 포함, 별도 애드온 없이 AI 운영 시작 서비스나우가 컨텍스트 엔진(Context Engine)을 중심으로 AI 네이티브 플랫폼 전략을 공개하며 전 제품에 데이터 연결, 워크플로우 실행, 보안 및 거버넌스를 기본 포함하는 방식으로 ...
    Date2026.04.10 Bynewsit Views88
    Read More
  18. 닷핵 컨퍼런스 2026 성료, LLM 기반 취약점 분석·AI 레드팀 전략 공유

    - 코엑스서 600여 명 참가, 드림핵 인비테이셔널 해킹방어대회 결승 진행 닷핵 컨퍼런스 2026(.HACK Conference 2026)가 코엑스에서 이틀간 진행되며 LLM기반 취약점 분석과 AI 레드팀(AI Red Team) 운영 등 최신 보안 기술 적용 사례를 공유했다. AI·LLM 기반...
    Date2026.04.09 Bynewsit Views94
    Read More
  19. 신한카드, 스테이블코인·블록체인 6대 PoC 완료…웹3 결제 적용 가능성 확인

    - P2P 결제·크로스보더 정산·하드월렛 카드 등 웹3 기반 결제 모델 테스트 신한카드가 스테이블코인과 블록체인 기반 6대 핵심 기술 과제 개념 검증(PoC)을 진행하며 디지털자산 결제와 기존 카드 인프라를 연계하는 웹3 기반 결제 적용 가능성을 확인했다. 스...
    Date2026.04.09 Bynewsit Views66
    Read More
  20. MSI, 숙명여대서 RTX AI PC 캠퍼스 세미나 개최…RTX 기반 AI 활용 환경 소개

    - RTX GPU 기반 AI PC 활용 사례 및 체험 전시 운영 MSI가 엔비디아와 공동으로 숙명여자대학교에서 ‘RTX AI PC 캠퍼스 세미나’를 개최하고 GPU 기반 AI 기술 활용 사례와 AI PC 환경을 소개했다. RTX GPU 기반 AI 활용 사례 발표 행사는 숙명여자대학교 눈꽃...
    Date2026.04.09 Bynewsit Views73
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 288 Next
/ 288
CLOSE