- CPU 역할 확장해 추론·오케스트레이션 성능과 효율 동시 개선

 

[GTC 2026] 엔비디아, 베라 CPU 공개…에이전틱 AI 처리 구조 확장.jpg

엔비디아가 GTC 2026에서 에이전틱 AI와 강화학습을 위한 베라 CPU’를 공개하며 AI 인프라 구조를 확장한다. 보조 연산에 머물던 CPU를 실행과 제어 중심으로 끌어올리면서, 대규모 에이전틱 워크로드를 안정적으로 처리하는 기반을 제시했다.

 

CPU 중심으로 재편되는 AI 실행 구조

에이전틱 AI는 작업 계획과 도구 실행, 데이터 처리, 결과 검증이 동시에 이어지는 복합 연산 환경이다. 베라 CPU는 이러한 과정을 직접 처리하도록 설계돼 CPU가 실행 흐름 전반에 관여하는 구조를 만든다. 기존 랙 스케일 CPU 대비 2배 높은 효율과 최대 50% 향상된 성능으로 처리량과 응답 속도를 끌어올릴 수 있다.

 

GPU와 결합해 데이터 이동 병목 완화

NVLink-C2C 인터커넥트를 통해 GPU와 직접 연결되며 1.8TB/s 대역폭을 제공한다. PCIe Gen6 대비 최대 7배 빠른 전송 속도를 바탕으로 CPUGPU 간 데이터 이동 병목을 줄인다. HGX 루빈 NVL8 시스템에서는 호스트 CPU로 동작해 데이터 흐름과 시스템 제어를 함께 맡는다.

 

대규모 워크로드 대응 위한 구조 설계

88개 올림푸스 코어와 고대역폭 메모리 구조를 결합해 다중 작업 환경에서도 안정적인 성능을 유지한다. 공간적 멀티스레딩을 적용해 코어당 두 개의 작업을 동시에 처리하며, 다중 테넌트 환경에서도 일관된 처리 특성을 확보했다. LPDDR5X 기반 메모리는 최대 1.2TB/s 대역폭으로 데이터 처리 속도를 뒷받침한다.

 

클라우드·OEM 중심으로 도입 확대

알리바바, 메타, OCI, 코어위브 등 주요 클라우드 사업자들이 베라 CPU 도입을 추진하고 있으며, , HPE, 레노버, 슈퍼마이크로 등 제조사들도 베라 기반 서버 설계를 진행하고 있다. 데이터센터와 클라우드 환경에서 CPU 중심 AI 워크로드 구성이 빠르게 확산되는 모습이다.

 

AI 서비스와 연구 환경에서 활용 확대

커서는 AI 코딩 에이전트 처리 성능 향상을 위해 베라를 적용하고 있으며, 레드판다는 스트리밍 워크로드에서 지연 시간을 줄이는 데 활용하고 있다. CERNTACC 등 연구기관도 대규모 과학 연산 환경에 적용을 검토하며 성능 검증을 이어가는 상황이다.

 

엔비디아 젠슨 황 CEO“AI 시스템에서 CPU의 역할이 확장되면서 모델 실행과 오케스트레이션을 동시에 담당하는 구조가 중요해지고 있다베라는 이러한 요구에 맞춰 성능과 효율을 함께 제공하는 기반이라고 설명했다.

 

#엔비디아 #GTC2026 #베라CPU #AgenticAI #AI인프라 #NVLink #데이터센터 #AI컴퓨팅

 

 
?

  1. 안랩, CPS 보안 플랫폼 ‘안랩 CPS 플러스’ 공개

    - OT 엔드포인트 보호 솔루션 ‘안랩 EPS’ 중심 CPS 보안 전략 소개 - 경량 설계 기반 구형 설비 보호 대응 제시 안랩이 Japan IT Week Spring 2026에서 CPS(사이버물리시스템) 보안 플랫폼 안랩 CPS 플러스와 OT 엔드포인트 보안 솔루션 안랩 EPS를 공개하고 O...
    Date2026.04.13 Bynewsit Views67
    Read More
  2. 레드햇, RHEL 14년 지원 ‘익스텐디드 라이프 사이클 프리미엄’ 출시

    - 단일 구독으로 장기 지원 체계 통합 - 금융·의료·공공 등 규제 산업 인프라 운영 기간 확대 레드햇이 레드햇 엔터프라이즈 리눅스 익스텐디드 라이프 사이클 프리미엄(Red Hat Enterprise Linux Extended Life Cycle Premium)을 출시하며 주요 레드햇 엔터프...
    Date2026.04.13 Bynewsit Views77
    Read More
  3. 그룹아이비, 북한 IT 인력 ‘AI 기반 가짜 신분 취업’ 캠페인 적발

    - 합성 신원과 생성형 AI 활용해 글로벌 기업 원격 채용 침투 시도 - 깃허브·프리랜서 플랫폼 기반 장기간 조직적 활동 확인 그룹아이비(Group-IB)가 북한(DPRK) 연계 IT 인력이 합성 신원(Synthetic Identity)과 생성형 AI 기반 입사 지원서를 활용해 글로벌 ...
    Date2026.04.13 Bynewsit Views80
    Read More
  4. 뉴타닉스, 멀티테넌트 클라우드 기능 확대… 파트너 서비스 경쟁력 지원

    - NCP 기반 멀티테넌트 IaaS 운영 환경 제공 - VM웨어 전환 지원 프로그램과 검증 서비스 체계 확대 뉴타닉스가 서비스 제공업체를 위한 멀티테넌시 기능과 마이그레이션 지원 프로그램을 발표하며 파트너 기반 클라우드 서비스 확장 전략을 강화했다. 멀티테...
    Date2026.04.13 Bynewsit Views61
    Read More
  5. 가트너, “재고 확보 영향으로 1분기 글로벌 PC 출하량 4% 증가”

    - 멤플레이션 대비 선제 재고 확보가 출하량 증가 견인 - 레노버·HP·델·애플 1~4위 유지… 에이수스 5위 상승 가트너가 2026년 1분기 전 세계 PC 출하량이 6,280만 대를 기록하며 전년 동기 대비 4% 증가했다고 발표했다. 메모리 가격 상승, 이른바 멤플레이션(...
    Date2026.04.13 Bynewsit Views50
    Read More
  6. 스틸시리즈, ‘에어록스 3 Gen 2’ 출시 기념 에임 마스터 대회 개최

    - 3D Aim Trainer 기반 FPS 에이밍 기록 경쟁 이벤트 운영 - 에어록스 3 Gen 2·Prime·QcK Pro 등 게이밍 기어 경품 제공 스틸시리즈가 ‘에어록스 3 무선 Gen 2(Aerox 3 Wireless Gen 2)’ 출시를 기념해 3D 에이밍 훈련 소프트웨어 기반 기록 경쟁 이벤트 ‘에임...
    Date2026.04.13 Bynewsit Views54
    Read More
  7. 매스웍스, 엣지 AI 파운데이션 합류…임베디드 AI 워크플로우 확장

    - 매트랩·시뮬링크 기반 모델 설계부터 시뮬레이션·디바이스 배포까지 연결 매스웍스가 엣지 AI 파운데이션(EDGE AI FOUNDATION)에 합류하며, 매트랩(MATLAB)과 시뮬링크(Simulink) 기반 임베디드 AI 모델 설계부터 시뮬레이션, 디바이스 배포까지 이어지는 개...
    Date2026.04.13 Bynewsit Views58
    Read More
  8. 히타치 밴타라, Agentic AI 운영 통합하는 Hitachi iQ Studio 공개

    - 노코드 에이전트 빌더와 온프레미스 RAG 환경으로 기업 AI 구축 흐름 단순화 HS효성인포메이션시스템이 히타치 밴타라의 Hitachi iQ Studio를 공개하며, RAG와 MCP 기반 Agentic AI 구축과 운영 거버넌스를 하나의 환경으로 통합했다. 에이전트 개발 전 과정...
    Date2026.04.13 Bynewsit Views71
    Read More
  9. 로지텍, 현대백화점 무역센터점 팝업스토어 오픈...업무·게이밍 체험 공간 운영

    - MX Master 4·PRO X SUPERLIGHT 2 등 주요 라인업 직접 체험 제공 로지텍이 현대백화점 무역센터점에 체험형 팝업스토어를 오픈하고 방문객이 실제 사용 환경 기반 체험존에서 업무용·게이밍 주요 제품 성능을 직접 체험할 수 있는 공간을 마련했다. 업무·게...
    Date2026.04.10 Bynewsit Views62
    Read More
  10. 인텔, 구글과 AI 인프라 협력 확대...Xeon·IPU로 이기종 컴퓨팅 효율 개선

    - CPU·인프라 가속 분담 방식으로 학습·추론·데이터 처리 최적화 인텔이 구글과 다년 협력을 확대하며 제온(Xeon) 프로세서와 IPU(인프라 처리 장치) 기반 이기종 컴퓨팅 적용 범위를 넓힌다. CPU 제어와 인프라 가속 기능을 분리해 AI 학습과 추론, 데이터 처...
    Date2026.04.10 Bynewsit Views87
    Read More
  11. 서비스나우, 전 제품 AI 네이티브 전환…컨텍스트 엔진으로 워크플로우 의사결정 통합

    - 데이터·거버넌스·실행 기능 기본 포함, 별도 애드온 없이 AI 운영 시작 서비스나우가 컨텍스트 엔진(Context Engine)을 중심으로 AI 네이티브 플랫폼 전략을 공개하며 전 제품에 데이터 연결, 워크플로우 실행, 보안 및 거버넌스를 기본 포함하는 방식으로 ...
    Date2026.04.10 Bynewsit Views88
    Read More
  12. 닷핵 컨퍼런스 2026 성료, LLM 기반 취약점 분석·AI 레드팀 전략 공유

    - 코엑스서 600여 명 참가, 드림핵 인비테이셔널 해킹방어대회 결승 진행 닷핵 컨퍼런스 2026(.HACK Conference 2026)가 코엑스에서 이틀간 진행되며 LLM기반 취약점 분석과 AI 레드팀(AI Red Team) 운영 등 최신 보안 기술 적용 사례를 공유했다. AI·LLM 기반...
    Date2026.04.09 Bynewsit Views94
    Read More
  13. 신한카드, 스테이블코인·블록체인 6대 PoC 완료…웹3 결제 적용 가능성 확인

    - P2P 결제·크로스보더 정산·하드월렛 카드 등 웹3 기반 결제 모델 테스트 신한카드가 스테이블코인과 블록체인 기반 6대 핵심 기술 과제 개념 검증(PoC)을 진행하며 디지털자산 결제와 기존 카드 인프라를 연계하는 웹3 기반 결제 적용 가능성을 확인했다. 스...
    Date2026.04.09 Bynewsit Views66
    Read More
  14. MSI, 숙명여대서 RTX AI PC 캠퍼스 세미나 개최…RTX 기반 AI 활용 환경 소개

    - RTX GPU 기반 AI PC 활용 사례 및 체험 전시 운영 MSI가 엔비디아와 공동으로 숙명여자대학교에서 ‘RTX AI PC 캠퍼스 세미나’를 개최하고 GPU 기반 AI 기술 활용 사례와 AI PC 환경을 소개했다. RTX GPU 기반 AI 활용 사례 발표 행사는 숙명여자대학교 눈꽃...
    Date2026.04.09 Bynewsit Views73
    Read More
  15. 사이냅소프트, NIPA ‘2026 AX 원스톱 바우처’ 공급기업 선정…Document AI 기반 AX 구축 지원 확대

    - 자체 데이터 학습·프롬프트 엔지니어링 기술 검증 통과 사이냅소프트가 정보통신산업진흥원(NIPA)이 주관하는 ‘2026년 AX 원스톱 바우처 지원사업’ 공급기업으로 선정되며 Document AI 기반 전사적 인공지능 전환(AX) 구축 지원 범위를 확대한다. Document A...
    Date2026.04.09 Bynewsit Views71
    Read More
  16. DJI, 8K 360° FPV 드론 Avata 360 국내 출시…몰입형 항공 촬영 지원 확대

    - 듀얼 센서 기반 8K 360° 영상·O4+ 전송 시스템 적용 DJI가 8K 360° 촬영을 지원하는 FPV 드론 Avata 360을 국내 출시하며 360° 영상 기록과 FPV 비행을 결합한 몰입형 항공 촬영 환경을 제공한다. 8K 360° 촬영 기반 몰입형 콘텐츠 제작 지원 아바타 360(Ava...
    Date2026.04.09 Bynewsit Views65
    Read More
  17. 스틸시리즈, 4K 폴링레이트 지원 Aerox 3 Wireless Gen 2 출시…QcK Heavy 신규 컬러 공개

    - 최대 4,000Hz 폴링레이트 및 최대 200시간 배터리, FPS 환경 대응 성능 강화 스틸시리즈가 4K 폴링레이트를 지원하는 무선 게이밍 마우스 Aerox 3 Wireless Gen 2와 QcK Heavy 게이밍 마우스패드를 국내 출시한다. 4K 폴링레이트 기반 입력 지연 감소 Aerox ...
    Date2026.04.09 Bynewsit Views58
    Read More
  18. 뉴타닉스, 에이전틱 AI 멀티테넌트 기능 공개…네오클라우드 AI 서비스 운영 지원

    - AI 관리 포털 기반 GPUaaS·KaaS 등 서비스형 AI 플랫폼 구축 뉴타닉스가 에이전틱 AI(Agentic AI) 솔루션에 멀티테넌트와 관리 포털 기능을 추가하고 네오클라우드 사업자가 AI 서비스를 운영할 수 있는 플랫폼 범위를 확대한다. GPU 자원 활용 수요가 증가...
    Date2026.04.09 Bynewsit Views73
    Read More
  19. 팔로알토 네트웍스, Vertex AI 인증정보 접근 가능성 공개…AI 에이전트 권한 관리 이슈

    - 서비스 계정 권한 범위 통해 데이터 접근 가능성 확인 팔로알토 네트웍스가 구글 클라우드 Vertex AI 에이전트 환경에서 서비스 계정 권한 구조를 악용할 수 있는 보안 리스크를 공개했다. AI 에이전트가 내부 인증 정보를 활용해 추가 권한을 획득할 수 있...
    Date2026.04.09 Bynewsit Views73
    Read More
  20. 세일즈포스, 맞춤형 AI 에이전트 슬랙봇 공개… 에이전틱 엔터프라이즈 비전 제시

    - 슬랙 중심 사람·에이전트·데이터 협업 구조 제시 세일즈포스가 맞춤형 AI 에이전트 슬랙봇(Slackbot)을 국내에 공개하고 슬랙을 중심으로 한 에이전틱 엔터프라이즈(Agentic Enterprise) 비전과 전략을 제시했다. 세일즈포스 코리아 박세진 대표는 슬랙을 사...
    Date2026.04.08 Bynewsit Views58
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 288 Next
/ 288
CLOSE