- 토큰 처리량 5·에너지 효율 4장문 추론 대응 인프라 제시

 

[GTC 2026] 엔비디아, 블루필드-4 STX 공개… 컨텍스트 메모리 기반 AI 스토리지 확장.jpg

엔비디아가 GTC 2026에서 블루필드-4 기반 STX 스토리지 아키텍처를 공개하고, 에이전틱 AI 환경에 대응하는 컨텍스트 메모리 중심 인프라를 제시했다. 긴 컨텍스트 기반 추론에서 발생하는 데이터 접근 지연과 GPU 활용 저하 문제를 스토리지 구조에서 해결하는 데 초점을 맞췄다.

 

컨텍스트 메모리 중심 스토리지 구조 전환

기존 데이터센터 스토리지는 대용량 저장에는 최적화돼 있지만, 여러 단계와 세션을 거치는 에이전틱 AI 워크로드에서는 응답성이 제한되는 구조였다. 대규모 컨텍스트를 기반으로 한 추론 환경에서는 데이터 접근 지연이 누적되면서 GPU 활용도가 떨어지고 처리 속도 저하로 이어진다. STXGPU 메모리를 확장하는 컨텍스트 메모리 계층을 중심으로 설계되며, 데이터 접근 경로를 단축해 추론 과정에서 필요한 데이터를 빠르게 공급하는 구조를 갖춘다.

 

CMX 플랫폼, 토큰 처리량 5배 확대

STX에는 랙 단위 구현을 위한 CMX 컨텍스트 메모리 스토리지 플랫폼이 포함된다. GPU 메모리를 확장하는 고성능 컨텍스트 레이어를 통해 기존 스토리지 대비 초당 최대 5배 수준의 토큰 처리량을 제공한다. 에이전틱 AI와 대규모 추론 환경에서 필요한 장문 컨텍스트를 안정적으로 처리할 수 있도록 설계됐다.

 

블루필드-4 기반 가속 스토리지 아키텍처

STX는 블루필드-4 프로세서를 중심으로 베라 CPU와 커넥트X-9 슈퍼NIC을 결합한 구조로 구성된다. 여기에 스펙트럼-X 이더넷과 도카, AI 엔터프라이즈 소프트웨어를 함께 적용해 스토리지, 네트워크, 컴퓨팅을 통합한 형태로 구성된다. 기존 CPU 기반 스토리지 대비 최대 4배 높은 에너지 효율을 확보하며, 엔터프라이즈 데이터 처리에서는 초당 2배 더 많은 페이지 처리가 가능하다.

 

클라우드·스토리지 파트너 공동 설계 확장

STX 아키텍처는 클라우디안, DDN, , 히타치 밴타라, HPE, IBM, 넷앱, 뉴타닉스, 바스트 데이터, 웨카 등 주요 스토리지 기업이 공동 설계에 참여한다. AIC, 슈퍼마이크로, QCT 등 제조 파트너가 시스템 구축을 맡으며, 코어위브, 크루소, 람다, 미스트랄 AI, 네비우스, OCI, 벌처 등 클라우드 및 AI 기업이 도입을 추진하고 있다.

 

엔비디아 젠슨 황 CEO에이전틱 AI는 방대한 컨텍스트 기반 추론을 요구하며, 이를 위해 새로운 스토리지 구조가 필요하다“STXAI 네이티브 인프라를 위한 모듈형 기반을 제공한다고 밝혔다.

 

STX 기반 플랫폼은 올해 하반기부터 파트너사를 통해 제공될 예정이다.

 

#GTC2026 #엔비디아 #STX #블루필드4 #AI스토리지 #컨텍스트메모리 #데이터센터 #AI인프라 #GPU #에이전틱AI

 

 
?

  1. 카스퍼스키, 2025 한국 보안 위협 보고서 발표…웹 공격 650만건·로컬 위협 919만건 탐지

    - KSN 기반 웹·이동식 매체 위협 동시 증가 카스퍼스키(Kaspersky)가 ‘2025년 한국 사이버 위협 현황’ 보고서를 발표했다. 카스퍼스키 시큐리티 네트워크(KSN) 분석 결과 웹 기반 공격 650만건, 로컬 위협 919만건이 탐지되며 웹과 이동식 매체를 통한 악성코...
    Date2026.04.06 Bynewsit Views52
    Read More
  2. 알리바바, Qwen3.6-Plus·Qwen3.5-Omni 공개…에이전틱 실행과 옴니모달 처리 동시 확장

    - 에이전틱 코딩·멀티모달 추론·음성·영상 통합 처리 기반 AI 실행 범위 확대 알리바바(Alibaba)가 에이전틱 실행 기반 코딩 모델 Qwen3.6-Plus와 텍스트·음성·이미지·영상 데이터를 통합 처리하는 옴니모달 모델 Qwen3.5-Omni를 공개했다. 복합 작업을 단계적...
    Date2026.04.06 Bynewsit Views48
    Read More
  3. 델, 2026년형 에일리언웨어 게이밍 노트북 3종 공개…OLED·RTX 50 기반 성능 강화

    - 에일리언웨어 에어리어-51·오로라, 안티글레어 OLED와 차세대 GPU로 고사양 게임 환경 지원 델이 2026년형 에일리언웨어(Alienware) 게이밍 노트북 신제품 3종을 공개했다. 안티글레어 OLED 디스플레이와 차세대 인텔 코어 울트라 200HX(Intel Core Ultra 20...
    Date2026.04.06 Bynewsit Views48
    Read More
  4. 한국레노버, 산업용 AI 엣지 컴퓨팅 ‘씽크엣지’ 2종 출시…온디바이스 처리로 지연 최소화

    - 씽크엣지 SE30n·SE60n, 최대 97 TOPS 기반 실시간 산업 데이터 분석 지원 한국레노버가 산업 환경에 최적화된 AI 엣지 컴퓨팅 솔루션 씽크엣지(ThinkEdge) 2종을 출시했다. 온디바이스 AI 기반 데이터 처리를 통해 클라우드 의존도를 낮추고 데이터가 생성되...
    Date2026.04.06 Bynewsit Views37
    Read More
  5. 지멘스, 엔비디아와 FPGA 기반 AI 시스템온칩 검증 가속…수조 사이클 프리실리콘 처리

    - 벨로체 프로FPGA CS(Veloce proFPGA CS)로 대규모 AI 워크로드 사전 검증 지원 지멘스 디지털 인더스트리 소프트웨어 지멘스 EDA 사업부가 엔비디아와 협력해 FPGA 기반 하드웨어 가속 검증 시스템인 벨로체 프로FPGA CS(Veloce proFPGA CS)를 통해 수조 단...
    Date2026.04.06 Bynewsit Views48
    Read More
  6. 마우저, 디지 커넥트 센서 XRT-M 공급...원격 센서 모니터링 지원

    - MQTT·엣지 프로세싱 기반 원격 센서 모니터링 및 산업 데이터 수집 지원 마우저가 디지 인터내셔널(Digi International)의 디지 커넥트 센서(Digi Connect Sensor) XRT-M을 공급한다. LTE-M 기반 셀룰러 연결과 엣지 프로세싱(Edge Processing)을 결합해 별...
    Date2026.04.03 Bynewsit Views40
    Read More
  7. 사이냅소프트, 문서 AI·RAG 기반 도서관 AX 전환 지원

    - 문서 AI 4종으로 학술 데이터 지식화 및 검색 자동화 기능 공개 사이냅소프트가 제24차 한국학술정보협의회 콘퍼런스에서 문서 AI(Document AI) 기반 도서관 업무 자동화 솔루션을 공개했다. 학술 데이터를 지식 자산으로 변환하고 검색 증강 생성(RAG) 기반...
    Date2026.04.03 Bynewsit Views36
    Read More
  8.   EDB, 엔비디아 GPU 결합…Postgres 분석 최대 100배 가속

    - Apache Spark용 NVIDIA cuDF 통합 확대, 3TB 이상 데이터 분석 50~100배 처리 향상 EDB가 엔비디아 GPU 가속 기술을 포스트그레스(Postgres) AI 플랫폼에 결합하며 에이전틱 AI 환경에서 요구되는 대규모 데이터 분석 처리 속도를 최대 100배 높였다. 아파치...
    Date2026.04.03 Bynewsit Views37
    Read More
  9. 유아이패스, 구매-지급(P2P) 에이전틱 AI 솔루션 공개… 재무 워크플로우 자동화 적용

    - AI 에이전트 기반 오케스트레이션… 구매 승인·청구서 검증·예외 처리 흐름 자동화 유아이패스가 구매부터 지급까지 이어지는 P2P(Purchase-to-Pay) 전 과정에 에이전틱 AI를 적용한 자동화 솔루션을 공개했다. ERP와 협업 시스템 전반에 AI 에이전트 실행 계...
    Date2026.04.02 Bynewsit Views43
    Read More
  10. 사이냅소프트, OCR IX CPU 출시… GPU 없이 AI OCR 실행 지원

    - 양자화 적용 모델 경량화…기존 서버에서 문서 인식 자동화 운영 사이냅소프트가 GPU 없이 실행 가능한 AI OCR 솔루션 ‘사이냅 OCR IX’ CPU 버전을 공개했다. 기존 온프레미스 서버 환경에서 문서 인식 자동화를 수행하며, 양자화 기반 모델 경량화를 통해 연...
    Date2026.04.02 Bynewsit Views35
    Read More
  11. 마에스트로 포렌식, DFIR 대응 파이프라인 세미나 개최…취약점 진단부터 침해사고 대응까지 통합 실습

    - RAPID7·FORTRA·WiSDOM 연계 공격 재현·포렌식 분석 절차 구성 마에스트로 포렌식이 취약점 진단과 모의해킹, 디지털 포렌식 대응까지 이어지는 DFIR(Digital Forensics and Incident Response) 운영 절차를 다루는 실습형 세미나를 4월 29일 서울 독산동 인...
    Date2026.04.02 Bynewsit Views56
    Read More
  12. AIWORKX, 생성형 AI 기반 비대면 기업카드 심사 자동화 프로젝트 수주

    - OCR·LLM·RAG 적용 신청·심사·발급 전 과정 자동화 AIWORKX가 국내 주요 카드사의 비대면 기업카드 신청 및 심사 프로세스 고도화 프로젝트를 수주했다. 비대면 기업카드 신청 수요가 증가하고 있지만 기존 심사와 발급 절차는 대면 중심 업무 구조를 유지하...
    Date2026.04.02 Bynewsit Views48
    Read More
  13. 한국공작기계산업협회, 이탈리아 초감가상각제도 EU산 요건 폐지 환영

    - 통상 대응 통해 비관세 장벽 해소, 공작기계 수출 불확실성 완화 한국공작기계산업협회가 이탈리아 투자 촉진 정책인 초감가상각제도(Hyper-depreciation) 적용 요건에서 ‘EU산’ 제한이 폐지된 것과 관련해 국내 공작기계 기업의 유럽 수출 환경이 개선됐다...
    Date2026.04.02 Bynewsit Views39
    Read More
  14. 티머니, 기후동행카드 10% T마일리지 페이백 프로모션 운영

    - 신규 이용 고객 대상 충전 금액 10% 환급, 4월 30일까지 적용 티머니가 기후동행카드 신규 이용 고객 대상 충전 금액의 10%를 T마일리지로 환급하는 프로모션을 4월 30일까지 운영하며 대중교통 이용 비용 부담 완화를 지원한다. 이번 이벤트는 기간 내 기후...
    Date2026.04.02 Bynewsit Views37
    Read More
  15. MSI, RTX50 DLSS4 기반 ‘바이오하자드 레퀴엠’ 번들 프로모션 연장

    - RTX50 구매 고객 대상 게임 코드 제공, 4월 13일까지 신청 가능 엠에스아이코리아가 RTX50 그래픽카드 구매 고객 대상 ‘바이오하자드 레퀴엠’ 게임 번들 프로모션을 4월 13일까지 연장하며 DLSS4 기반 고사양 게임 환경 지원 범위를 확대했다. 이번 프로모션...
    Date2026.04.02 Bynewsit Views39
    Read More
  16. 데이터브릭스, 레이크하우스 기반 엔터프라이즈 AI 확산… 국내 비즈니스 100% 성장

    - AI Days Seoul 개최… 3년간 데이터·AI 전문 인력 1만 명 양성 추진 데이터브릭스가 오프라인 컨퍼런스 ‘AI Days Seoul’을 개최하고 지난 회계연도 국내 비즈니스가 전년 대비 100% 이상 성장했다고 밝혔다. 기업들의 생성형 AI 도입 확대와 데이터 통합 수요...
    Date2026.04.01 Bynewsit Views30
    Read More
  17. 엑시스, 통합 안전·운영 플랫폼 전략 공개… AI 엣지 기반 비즈니스 인사이트 확대

    - Unite & Ignite·LEAP 2030 통해 영상 데이터 활용 범위 확장 엑시스가 AI 영상 분석과 네트워크 오디오, 접근제어 기술을 결합한 통합 플랫폼 전략을 발표하고 영상 데이터를 운영 효율과 비즈니스 인사이트 영역으로 확장한다고 밝혔다. 파트너 중심 성장 ...
    Date2026.04.01 Bynewsit Views50
    Read More
  18. 티맥스소프트, 제우스 11 국내 최초 자카르타 EE 11 인증 획득

    - 자바 21 기반 차세대 WAS… AI·클라우드 환경 대응 플랫폼 강화 티맥스소프트가 애플리케이션 서버 ‘제우스 11(JEUS 11)’으로 국내 최초 자카르타 EE 11 인증을 획득했다. 자바 21 기반 기술을 적용해 AI·클라우드 환경에서 요구되는 엔터프라이즈 애플리케이...
    Date2026.04.01 Bynewsit Views43
    Read More
  19. 온세미, SiC 하이브리드 전력 모듈로 시능전기 태양광·ESS 인버터 효율 향상

    - EliteSiC 기반 PIM 적용… 전력 밀도 32% 개선·효율 최대 0.1% 향상 온세미가 실리콘 카바이드(SiC) 기반 하이브리드 전력 통합 모듈(PIM)을 시능전기의 차세대 430kW 액체 냉각 에너지 저장 시스템(ESS)과 320kW 유틸리티급 태양광 인버터에 공급한다. 재생...
    Date2026.04.01 Bynewsit Views51
    Read More
  20. 레노버, 데이비드 베컴과 글로벌 파트너십 체결… AI 스포츠 혁신 협력 확대

    - 2026 FIFA 월드컵 기술 파트너십 연계… 경기력·팬 경험 고도화 추진 레노버가 글로벌 스포츠 영향력을 보유한 데이비드 베컴(David Beckham)과 파트너십을 체결하고 AI 기반 경기 데이터 분석 및 디지털 팬 경험 기술 협력을 확대한다. 2026 FIFA 월드컵 공...
    Date2026.04.01 Bynewsit Views38
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 287 Next
/ 287
CLOSE