- 토큰 처리량 5·에너지 효율 4장문 추론 대응 인프라 제시

 

[GTC 2026] 엔비디아, 블루필드-4 STX 공개… 컨텍스트 메모리 기반 AI 스토리지 확장.jpg

엔비디아가 GTC 2026에서 블루필드-4 기반 STX 스토리지 아키텍처를 공개하고, 에이전틱 AI 환경에 대응하는 컨텍스트 메모리 중심 인프라를 제시했다. 긴 컨텍스트 기반 추론에서 발생하는 데이터 접근 지연과 GPU 활용 저하 문제를 스토리지 구조에서 해결하는 데 초점을 맞췄다.

 

컨텍스트 메모리 중심 스토리지 구조 전환

기존 데이터센터 스토리지는 대용량 저장에는 최적화돼 있지만, 여러 단계와 세션을 거치는 에이전틱 AI 워크로드에서는 응답성이 제한되는 구조였다. 대규모 컨텍스트를 기반으로 한 추론 환경에서는 데이터 접근 지연이 누적되면서 GPU 활용도가 떨어지고 처리 속도 저하로 이어진다. STXGPU 메모리를 확장하는 컨텍스트 메모리 계층을 중심으로 설계되며, 데이터 접근 경로를 단축해 추론 과정에서 필요한 데이터를 빠르게 공급하는 구조를 갖춘다.

 

CMX 플랫폼, 토큰 처리량 5배 확대

STX에는 랙 단위 구현을 위한 CMX 컨텍스트 메모리 스토리지 플랫폼이 포함된다. GPU 메모리를 확장하는 고성능 컨텍스트 레이어를 통해 기존 스토리지 대비 초당 최대 5배 수준의 토큰 처리량을 제공한다. 에이전틱 AI와 대규모 추론 환경에서 필요한 장문 컨텍스트를 안정적으로 처리할 수 있도록 설계됐다.

 

블루필드-4 기반 가속 스토리지 아키텍처

STX는 블루필드-4 프로세서를 중심으로 베라 CPU와 커넥트X-9 슈퍼NIC을 결합한 구조로 구성된다. 여기에 스펙트럼-X 이더넷과 도카, AI 엔터프라이즈 소프트웨어를 함께 적용해 스토리지, 네트워크, 컴퓨팅을 통합한 형태로 구성된다. 기존 CPU 기반 스토리지 대비 최대 4배 높은 에너지 효율을 확보하며, 엔터프라이즈 데이터 처리에서는 초당 2배 더 많은 페이지 처리가 가능하다.

 

클라우드·스토리지 파트너 공동 설계 확장

STX 아키텍처는 클라우디안, DDN, , 히타치 밴타라, HPE, IBM, 넷앱, 뉴타닉스, 바스트 데이터, 웨카 등 주요 스토리지 기업이 공동 설계에 참여한다. AIC, 슈퍼마이크로, QCT 등 제조 파트너가 시스템 구축을 맡으며, 코어위브, 크루소, 람다, 미스트랄 AI, 네비우스, OCI, 벌처 등 클라우드 및 AI 기업이 도입을 추진하고 있다.

 

엔비디아 젠슨 황 CEO에이전틱 AI는 방대한 컨텍스트 기반 추론을 요구하며, 이를 위해 새로운 스토리지 구조가 필요하다“STXAI 네이티브 인프라를 위한 모듈형 기반을 제공한다고 밝혔다.

 

STX 기반 플랫폼은 올해 하반기부터 파트너사를 통해 제공될 예정이다.

 

#GTC2026 #엔비디아 #STX #블루필드4 #AI스토리지 #컨텍스트메모리 #데이터센터 #AI인프라 #GPU #에이전틱AI

 

 
?

  1. 스틸시리즈, 4K 폴링레이트 지원 Aerox 3 Wireless Gen 2 출시…QcK Heavy 신규 컬러 공개

    - 최대 4,000Hz 폴링레이트 및 최대 200시간 배터리, FPS 환경 대응 성능 강화 스틸시리즈가 4K 폴링레이트를 지원하는 무선 게이밍 마우스 Aerox 3 Wireless Gen 2와 QcK Heavy 게이밍 마우스패드를 국내 출시한다. 4K 폴링레이트 기반 입력 지연 감소 Aerox ...
    Date2026.04.09 Bynewsit Views58
    Read More
  2. 뉴타닉스, 에이전틱 AI 멀티테넌트 기능 공개…네오클라우드 AI 서비스 운영 지원

    - AI 관리 포털 기반 GPUaaS·KaaS 등 서비스형 AI 플랫폼 구축 뉴타닉스가 에이전틱 AI(Agentic AI) 솔루션에 멀티테넌트와 관리 포털 기능을 추가하고 네오클라우드 사업자가 AI 서비스를 운영할 수 있는 플랫폼 범위를 확대한다. GPU 자원 활용 수요가 증가...
    Date2026.04.09 Bynewsit Views73
    Read More
  3. 팔로알토 네트웍스, Vertex AI 인증정보 접근 가능성 공개…AI 에이전트 권한 관리 이슈

    - 서비스 계정 권한 범위 통해 데이터 접근 가능성 확인 팔로알토 네트웍스가 구글 클라우드 Vertex AI 에이전트 환경에서 서비스 계정 권한 구조를 악용할 수 있는 보안 리스크를 공개했다. AI 에이전트가 내부 인증 정보를 활용해 추가 권한을 획득할 수 있...
    Date2026.04.09 Bynewsit Views73
    Read More
  4. 세일즈포스, 맞춤형 AI 에이전트 슬랙봇 공개… 에이전틱 엔터프라이즈 비전 제시

    - 슬랙 중심 사람·에이전트·데이터 협업 구조 제시 세일즈포스가 맞춤형 AI 에이전트 슬랙봇(Slackbot)을 국내에 공개하고 슬랙을 중심으로 한 에이전틱 엔터프라이즈(Agentic Enterprise) 비전과 전략을 제시했다. 세일즈포스 코리아 박세진 대표는 슬랙을 사...
    Date2026.04.08 Bynewsit Views58
    Read More
  5. 인텔, 산토쉬 비스와나탄 APJ 총괄 선임…아시아태평양·일본 지역 리더십 확대

    - 인도 총괄에서 APJ 지역 총괄로 역할 확대…고객·파트너 협력 강화 - 글로벌 영업 운영 경험 기반 지역 성장 전략 추진 인텔이 산토쉬 비스와나탄(Santhosh Viswanathan) 인도 총괄을 아시아 태평양 및 일본(APJ) 지역 총괄로 선임했다. 통합된 리더십 체계 ...
    Date2026.04.08 Bynewsit Views59
    Read More
  6. 후지소프트, AMD Embedded+ 기반 AI 영상 보안 구현…CPU·FPGA 이종 컴퓨팅 적용

    - Ryzen Embedded와 Versal AI Edge 결합…실시간 객체 인식 기반 영상 분석 수행 후지소프트가 AMD 임베디드+(Embedded+) 플랫폼 기반 AI 영상 보안 시스템 적용 사례를 공개했다. 라이젠 임베디드(Ryzen Embedded) 프로세서와 버설 AI 엣지(Versal AI Edge) ...
    Date2026.04.08 Bynewsit Views72
    Read More
  7. 안랩, 정책·보조금 위장 광고 앱 주의…악성 기능 추가 가능성  

    - 정부 정책·공모주·대출 정보 제공 앱으로 위장해 광고 반복 노출 안랩이 공식 앱스토어에서 정책 정보 제공 앱으로 위장한 광고 기반 앱 다수를 발견하고 사용자 주의를 당부했다. 해당 앱은 정부 정책·보조금, 공모주, 대출 정보 제공을 표방하지만 실제 사...
    Date2026.04.07 Bynewsit Views70
    Read More
  8. 마우저, 암페놀 윌콕슨 VDS130 공급… IEPE 진동 데이터를 MQTT 기반 IIoT로 변환

    - 4채널 IEPE 입력 기반 진동 데이터 분석·클라우드 연동 지원 마우저가 암페놀 윌콕슨의 4채널 디지털 컨버터 VDS130 진동 데이터 소스를 공급한다. IEPE 기반 아날로그 진동 신호를 MQTT 형식으로 변환해 설비 상태 데이터를 클라우드 분석 시스템으로 전달...
    Date2026.04.07 Bynewsit Views87
    Read More
  9. 힐셔, HIMA와 SIL 3 대응 안전 통신 평가키트 공개… HICore 1·netX 90 통합

    - 단일 하드웨어에서 기능 안전·산업용 네트워크 통합 구현 힐셔가 HIMA와 협력해 기능 안전 통신 구현을 위한 통합 평가키트를 공개했다. HIMA의 안전 SoC ‘하이코어 1(HICore 1)’과 힐셔의 멀티프로토콜 통신 컨트롤러 ‘넷엑스 90(netX 90)’을 단일 하드웨어...
    Date2026.04.07 Bynewsit Views86
    Read More
  10. 윈드리버, AMD와 오픈랜·AI-RAN 통합 플랫폼 공개…단일 인프라로 RAN·AI 동시 운영

    - AMD EPYC 기반 단일 하드웨어에서 가상화 RAN과 AI 추론 워크로드 통합 윈드리버가 AMD와 협력해 오픈랜(Open RAN)과 AI-RAN 워크로드를 단일 인프라에서 통합 운영할 수 있는 상용 플랫폼을 공개했다. RAN 기능과 AI 애플리케이션을 별도 시스템에서 운영하...
    Date2026.04.07 Bynewsit Views67
    Read More
  11. 오토폼, K-제조 위한 디지털 금형 전략 발표… 숙련 기술 AI 전환

    오토폼이 AI 시뮬레이션과 디지털 트윈 기반 금형 로드맵을 공개하며 제조 현장의 숙련 기술을 데이터 자산으로 전환해 공정 예측 정확도와 품질 일관성을 높인다. AI 기반 금형 설계 판단 기준 데이터 축적 제조 산업은 숙련 인력 감소로 공정 판단 기준이 개...
    Date2026.04.07 Bynewsit Views65
    Read More
  12. 삼성전자·ETRI·프라임마스, CXL 기반 메모리 중심 컴퓨팅 구조 공동 개발

    - 칩렛 CXL 컨트롤러·대용량 DRAM·시스템 통합으로 초거대 메모리 확장 구현 삼성전자와 한국전자통신연구원(ETRI), 프라임마스(Primemas)가 CXL 기반 초거대용량 메모리 확장 솔루션 공동 개발에 착수했다. 메모리 풀링과 패브릭 인터커넥트를 결합한 메모리 ...
    Date2026.04.06 Bynewsit Views74
    Read More
  13. 카스퍼스키, 2025 한국 보안 위협 보고서 발표…웹 공격 650만건·로컬 위협 919만건 탐지

    - KSN 기반 웹·이동식 매체 위협 동시 증가 카스퍼스키(Kaspersky)가 ‘2025년 한국 사이버 위협 현황’ 보고서를 발표했다. 카스퍼스키 시큐리티 네트워크(KSN) 분석 결과 웹 기반 공격 650만건, 로컬 위협 919만건이 탐지되며 웹과 이동식 매체를 통한 악성코...
    Date2026.04.06 Bynewsit Views106
    Read More
  14. 알리바바, Qwen3.6-Plus·Qwen3.5-Omni 공개…에이전틱 실행과 옴니모달 처리 동시 확장

    - 에이전틱 코딩·멀티모달 추론·음성·영상 통합 처리 기반 AI 실행 범위 확대 알리바바(Alibaba)가 에이전틱 실행 기반 코딩 모델 Qwen3.6-Plus와 텍스트·음성·이미지·영상 데이터를 통합 처리하는 옴니모달 모델 Qwen3.5-Omni를 공개했다. 복합 작업을 단계적...
    Date2026.04.06 Bynewsit Views86
    Read More
  15. 델, 2026년형 에일리언웨어 게이밍 노트북 3종 공개…OLED·RTX 50 기반 성능 강화

    - 에일리언웨어 에어리어-51·오로라, 안티글레어 OLED와 차세대 GPU로 고사양 게임 환경 지원 델이 2026년형 에일리언웨어(Alienware) 게이밍 노트북 신제품 3종을 공개했다. 안티글레어 OLED 디스플레이와 차세대 인텔 코어 울트라 200HX(Intel Core Ultra 20...
    Date2026.04.06 Bynewsit Views110
    Read More
  16. 한국레노버, 산업용 AI 엣지 컴퓨팅 ‘씽크엣지’ 2종 출시…온디바이스 처리로 지연 최소화

    - 씽크엣지 SE30n·SE60n, 최대 97 TOPS 기반 실시간 산업 데이터 분석 지원 한국레노버가 산업 환경에 최적화된 AI 엣지 컴퓨팅 솔루션 씽크엣지(ThinkEdge) 2종을 출시했다. 온디바이스 AI 기반 데이터 처리를 통해 클라우드 의존도를 낮추고 데이터가 생성되...
    Date2026.04.06 Bynewsit Views53
    Read More
  17. 지멘스, 엔비디아와 FPGA 기반 AI 시스템온칩 검증 가속…수조 사이클 프리실리콘 처리

    - 벨로체 프로FPGA CS(Veloce proFPGA CS)로 대규모 AI 워크로드 사전 검증 지원 지멘스 디지털 인더스트리 소프트웨어 지멘스 EDA 사업부가 엔비디아와 협력해 FPGA 기반 하드웨어 가속 검증 시스템인 벨로체 프로FPGA CS(Veloce proFPGA CS)를 통해 수조 단...
    Date2026.04.06 Bynewsit Views61
    Read More
  18. 마우저, 디지 커넥트 센서 XRT-M 공급...원격 센서 모니터링 지원

    - MQTT·엣지 프로세싱 기반 원격 센서 모니터링 및 산업 데이터 수집 지원 마우저가 디지 인터내셔널(Digi International)의 디지 커넥트 센서(Digi Connect Sensor) XRT-M을 공급한다. LTE-M 기반 셀룰러 연결과 엣지 프로세싱(Edge Processing)을 결합해 별...
    Date2026.04.03 Bynewsit Views70
    Read More
  19. 사이냅소프트, 문서 AI·RAG 기반 도서관 AX 전환 지원

    - 문서 AI 4종으로 학술 데이터 지식화 및 검색 자동화 기능 공개 사이냅소프트가 제24차 한국학술정보협의회 콘퍼런스에서 문서 AI(Document AI) 기반 도서관 업무 자동화 솔루션을 공개했다. 학술 데이터를 지식 자산으로 변환하고 검색 증강 생성(RAG) 기반...
    Date2026.04.03 Bynewsit Views55
    Read More
  20.   EDB, 엔비디아 GPU 결합…Postgres 분석 최대 100배 가속

    - Apache Spark용 NVIDIA cuDF 통합 확대, 3TB 이상 데이터 분석 50~100배 처리 향상 EDB가 엔비디아 GPU 가속 기술을 포스트그레스(Postgres) AI 플랫폼에 결합하며 에이전틱 AI 환경에서 요구되는 대규모 데이터 분석 처리 속도를 최대 100배 높였다. 아파치...
    Date2026.04.03 Bynewsit Views66
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 288 Next
/ 288
CLOSE