- CPU 역할 확장해 추론·오케스트레이션 성능과 효율 동시 개선

 

[GTC 2026] 엔비디아, 베라 CPU 공개…에이전틱 AI 처리 구조 확장.jpg

엔비디아가 GTC 2026에서 에이전틱 AI와 강화학습을 위한 베라 CPU’를 공개하며 AI 인프라 구조를 확장한다. 보조 연산에 머물던 CPU를 실행과 제어 중심으로 끌어올리면서, 대규모 에이전틱 워크로드를 안정적으로 처리하는 기반을 제시했다.

 

CPU 중심으로 재편되는 AI 실행 구조

에이전틱 AI는 작업 계획과 도구 실행, 데이터 처리, 결과 검증이 동시에 이어지는 복합 연산 환경이다. 베라 CPU는 이러한 과정을 직접 처리하도록 설계돼 CPU가 실행 흐름 전반에 관여하는 구조를 만든다. 기존 랙 스케일 CPU 대비 2배 높은 효율과 최대 50% 향상된 성능으로 처리량과 응답 속도를 끌어올릴 수 있다.

 

GPU와 결합해 데이터 이동 병목 완화

NVLink-C2C 인터커넥트를 통해 GPU와 직접 연결되며 1.8TB/s 대역폭을 제공한다. PCIe Gen6 대비 최대 7배 빠른 전송 속도를 바탕으로 CPUGPU 간 데이터 이동 병목을 줄인다. HGX 루빈 NVL8 시스템에서는 호스트 CPU로 동작해 데이터 흐름과 시스템 제어를 함께 맡는다.

 

대규모 워크로드 대응 위한 구조 설계

88개 올림푸스 코어와 고대역폭 메모리 구조를 결합해 다중 작업 환경에서도 안정적인 성능을 유지한다. 공간적 멀티스레딩을 적용해 코어당 두 개의 작업을 동시에 처리하며, 다중 테넌트 환경에서도 일관된 처리 특성을 확보했다. LPDDR5X 기반 메모리는 최대 1.2TB/s 대역폭으로 데이터 처리 속도를 뒷받침한다.

 

클라우드·OEM 중심으로 도입 확대

알리바바, 메타, OCI, 코어위브 등 주요 클라우드 사업자들이 베라 CPU 도입을 추진하고 있으며, , HPE, 레노버, 슈퍼마이크로 등 제조사들도 베라 기반 서버 설계를 진행하고 있다. 데이터센터와 클라우드 환경에서 CPU 중심 AI 워크로드 구성이 빠르게 확산되는 모습이다.

 

AI 서비스와 연구 환경에서 활용 확대

커서는 AI 코딩 에이전트 처리 성능 향상을 위해 베라를 적용하고 있으며, 레드판다는 스트리밍 워크로드에서 지연 시간을 줄이는 데 활용하고 있다. CERNTACC 등 연구기관도 대규모 과학 연산 환경에 적용을 검토하며 성능 검증을 이어가는 상황이다.

 

엔비디아 젠슨 황 CEO“AI 시스템에서 CPU의 역할이 확장되면서 모델 실행과 오케스트레이션을 동시에 담당하는 구조가 중요해지고 있다베라는 이러한 요구에 맞춰 성능과 효율을 함께 제공하는 기반이라고 설명했다.

 

#엔비디아 #GTC2026 #베라CPU #AgenticAI #AI인프라 #NVLink #데이터센터 #AI컴퓨팅

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
2323 [GTC 2026] 엔비디아, 오라클과 벡터 검색 가속…GPU 인덱싱 협력 확대 - cuVS·오라클 AI DB 결합, 대규모 데이터 검색·의료 AI 활용 속도 개선 엔비디아가 GTC 2026에서 오라클과 협력해 GPU 기반 벡터 인덱스 구축 기술을 실제 워크... newfile newsit 2026.03.19 18
2322 [GTC 2026] 엔비디아, 단백질 데이터셋 확장…170만 복합체·3,000만 구조 공개 - 딥마인드·EMBL 협력, 단백질 상호작용 분석·신약 연구 활용 확대 엔비디아가 GTC 2026에서 구글 딥마인드, EMBL-EBI, 서울대학교 연구진과 함께 알파폴드 단백... newfile newsit 2026.03.19 17
2321 [GTC 2026] 엔비디아, 한국 기업과 AI 협력 확대…메모리·자율주행 전방위 확장 - 삼성전자·SK하이닉스·현대차, AI 인프라부터 SDV까지 협력 사례 공개 엔비디아가 GTC 2026에서 삼성전자, SK하이닉스, 현대자동차그룹 등과의 협력 사례를 공개... newfile newsit 2026.03.19 9
2320 [GTC 2026] 엔비디아, 금융 AI 확산 가속…마스터카드·레볼루트·아디옌 도입 확대 - 트랜잭션 파운데이션 모델로 사기 탐지·신용 예측·결제 최적화 강화 엔비디아가 GTC 2026에서 글로벌 금융 기업들이 자사 기반 트랜잭션 파운데이션 모델을 도... newfile newsit 2026.03.19 18
2319 스플렁크, ‘스플렁크 고 2026 서울’ 개최… 에이전틱 AI 옵저버빌리티 전략 공개 - 시스코 데이터 패브릭 결합…AI 스택 전반 가시성·보안·제어 통합 스플렁크가 ‘스플렁크 고 2026 서울’을 개최하고 AI 스택 전반의 가시성과 보안·제어를 통합하... file newsit 2026.03.18 22
2318 NXP, 엔비디아와 로보틱스 솔루션 출시…피지컬 AI 데이터 처리 구조 통합 - 센서 융합·모터 제어 통합 제품 공개…저지연 데이터 처리·전송 기반 구축 NXP가 엔비디아와 협력해 로보틱스 솔루션을 출시하며 피지컬 AI 환경에서 요구되는 ... file newsit 2026.03.18 21
2317 [GTC 2026] SAP, 폭스콘과 ‘AI 팩토리’ 협력…제조·공급망 구조 통합 추진 - GTC 2026서 파트너십 발표…엔터프라이즈 AI·스마트 제조 결합 모델 구축 SAP가 폭스콘과 협력해 ‘AI 팩토리’ 기반 제조·공급망 통합 구조를 구축하며 아시아태... file newsit 2026.03.18 27
2316 알리바바, 에이전틱 플랫폼 ‘우콩’ 공개…기업용 AI 업무 자동화 구조 제시 - 멀티 에이전트 오케스트레이션 기반 업무 처리…딩톡 연동·보안 중심 설계 알리바바가 기업 업무에 특화된 AI 네이티브 에이전틱 플랫폼 ‘우콩’을 공개하며 멀티... file newsit 2026.03.18 24
2315 델, 엔비디아 기반 AI 데이터 플랫폼 확대…데이터 병목 해소·AI 처리 구조 통합 - 데이터 라이프사이클 자동화·초고성능 스토리지 결합…에이전틱 AI 워크로드 대응 델이 ‘엔비디아 기반 AI 데이터 플랫폼’을 확대하며 데이터 준비부터 추론까지... file newsit 2026.03.18 25
2314 마스터카드, AI 에이전트 ‘국내 첫 결제’…에이전틱 커머스 실증 - 공항 이동 서비스 예약부터 결제까지 전 과정 자동 수행 마스터카드가 AI 에이전트가 검색부터 결제까지 전 과정을 수행하는 실거래를 국내에서 처음 구현하며 ... file newsit 2026.03.17 19
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 233 Next
/ 233
CLOSE