- 토큰 처리량 5·에너지 효율 4장문 추론 대응 인프라 제시

 

[GTC 2026] 엔비디아, 블루필드-4 STX 공개… 컨텍스트 메모리 기반 AI 스토리지 확장.jpg

엔비디아가 GTC 2026에서 블루필드-4 기반 STX 스토리지 아키텍처를 공개하고, 에이전틱 AI 환경에 대응하는 컨텍스트 메모리 중심 인프라를 제시했다. 긴 컨텍스트 기반 추론에서 발생하는 데이터 접근 지연과 GPU 활용 저하 문제를 스토리지 구조에서 해결하는 데 초점을 맞췄다.

 

컨텍스트 메모리 중심 스토리지 구조 전환

기존 데이터센터 스토리지는 대용량 저장에는 최적화돼 있지만, 여러 단계와 세션을 거치는 에이전틱 AI 워크로드에서는 응답성이 제한되는 구조였다. 대규모 컨텍스트를 기반으로 한 추론 환경에서는 데이터 접근 지연이 누적되면서 GPU 활용도가 떨어지고 처리 속도 저하로 이어진다. STXGPU 메모리를 확장하는 컨텍스트 메모리 계층을 중심으로 설계되며, 데이터 접근 경로를 단축해 추론 과정에서 필요한 데이터를 빠르게 공급하는 구조를 갖춘다.

 

CMX 플랫폼, 토큰 처리량 5배 확대

STX에는 랙 단위 구현을 위한 CMX 컨텍스트 메모리 스토리지 플랫폼이 포함된다. GPU 메모리를 확장하는 고성능 컨텍스트 레이어를 통해 기존 스토리지 대비 초당 최대 5배 수준의 토큰 처리량을 제공한다. 에이전틱 AI와 대규모 추론 환경에서 필요한 장문 컨텍스트를 안정적으로 처리할 수 있도록 설계됐다.

 

블루필드-4 기반 가속 스토리지 아키텍처

STX는 블루필드-4 프로세서를 중심으로 베라 CPU와 커넥트X-9 슈퍼NIC을 결합한 구조로 구성된다. 여기에 스펙트럼-X 이더넷과 도카, AI 엔터프라이즈 소프트웨어를 함께 적용해 스토리지, 네트워크, 컴퓨팅을 통합한 형태로 구성된다. 기존 CPU 기반 스토리지 대비 최대 4배 높은 에너지 효율을 확보하며, 엔터프라이즈 데이터 처리에서는 초당 2배 더 많은 페이지 처리가 가능하다.

 

클라우드·스토리지 파트너 공동 설계 확장

STX 아키텍처는 클라우디안, DDN, , 히타치 밴타라, HPE, IBM, 넷앱, 뉴타닉스, 바스트 데이터, 웨카 등 주요 스토리지 기업이 공동 설계에 참여한다. AIC, 슈퍼마이크로, QCT 등 제조 파트너가 시스템 구축을 맡으며, 코어위브, 크루소, 람다, 미스트랄 AI, 네비우스, OCI, 벌처 등 클라우드 및 AI 기업이 도입을 추진하고 있다.

 

엔비디아 젠슨 황 CEO에이전틱 AI는 방대한 컨텍스트 기반 추론을 요구하며, 이를 위해 새로운 스토리지 구조가 필요하다“STXAI 네이티브 인프라를 위한 모듈형 기반을 제공한다고 밝혔다.

 

STX 기반 플랫폼은 올해 하반기부터 파트너사를 통해 제공될 예정이다.

 

#GTC2026 #엔비디아 #STX #블루필드4 #AI스토리지 #컨텍스트메모리 #데이터센터 #AI인프라 #GPU #에이전틱AI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
2311 [GTC 2026] 델, AI 팩토리 업데이트…엔터프라이즈 AI ROI 경로 제시 - 데이터·인프라·서비스 통합해 파일럿에서 운영까지 확장 지원 델이 ‘엔비디아 기반 델 AI 팩토리’ 2주년을 맞아 AI 데이터 플랫폼과 인프라, 솔루션 전반을 업... file newsit 2026.03.17 20
2310 [GTC 2026] 엔비디아, IGX 토르 출시…산업 현장에 실시간 피지컬 AI 구현 - 센서·추론·제어 통합 플랫폼으로 안전성과 생산성 동시 확보 엔비디아가 GTC 2026에서 산업용 AI 플랫폼 ‘IGX 토르’를 출시하며 피지컬 AI 기반 실시간 연산 환... file newsit 2026.03.17 29
2309 [GTC 2026] 엔비디아, 스페이스 컴퓨팅 공개…궤도 데이터센터로 AI 확장 - SWaP 제약 넘는 AI 플랫폼, 우주·지상 연산 구조 통합 엔비디아가 GTC 2026에서 스페이스 컴퓨팅 플랫폼을 공개하며 궤도 데이터센터(ODC) 기반 AI 실행 구조를... file newsit 2026.03.17 28
2308 [GTC 2026] 엔비디아, 현대차·기아와 협력 확대… DRIVE 하이페리온 기반 자율주행 개발 가속 - SDV·플릿 데이터 결합해 레벨2~4 자율주행 시스템 확장 엔비디아가 현대차·기아와 협력을 확대하고 DRIVE 하이페리온 플랫폼을 기반으로 데이터 중심 자율주행 ... file newsit 2026.03.17 15
» [GTC 2026] 엔비디아, 블루필드-4 STX 공개… 컨텍스트 메모리 기반 AI 스토리지 확장 - 토큰 처리량 5배·에너지 효율 4배… 장문 추론 대응 인프라 제시 엔비디아가 GTC 2026에서 블루필드-4 기반 STX 스토리지 아키텍처를 공개하고, 에이전틱 AI 환... file newsit 2026.03.17 21
2306 솔트웨어, 레드햇 프리미어 파트너 선정… MSP·현대화 기반 클라우드 확장 - 공공·엔터프라이즈 환경서 설계·구축·운영 통합 지원 강화 솔트웨어가 레드햇 프리미어 파트너로 선정되며 클라우드 구축·운영 역량을 강화하고, MSP 기반 운영... file newsit 2026.03.17 26
2305 이미지스, 시마AI와 협력… 촉각 센싱·MLSoC로 피지컬 AI 확장 - 휴머노이드·산업·디바이스까지 로보틱스 인터페이스 구조 구축 이미지스테크놀로지가 시마AI와 전략적 파트너십을 체결하고 로보틱스와 산업용 피지컬 AI 시장 ... file newsit 2026.03.17 23
2304 [GTC 2026] 엔비디아, 네모트론·코스모스 공개… 에이전틱·피지컬·헬스케어 AI 확장 - 오픈 모델 포트폴리오로 언어 넘어 로봇·신약개발까지 적용 영역 확대 엔비디아가 GTC 2026에서 오픈 모델 제품군을 확장하고, 에이전틱 AI를 넘어 로봇·자율주... file newsit 2026.03.17 19
2303 [GTC 2026] 엔비디아, ‘베라 루빈’ 공개… NVL72·LPU 기반 AI 팩토리 전환 - 7종 칩·5개 랙 통합 설계로 학습·추론·에이전트 전 과정 처리 엔비디아가 GTC 2026에서 차세대 AI 플랫폼 ‘베라 루빈’을 공개하고, AI 인프라를 랙·POD 기반 ‘A... file newsit 2026.03.17 26
2302 사이냅소프트, ‘사이냅 문서뷰어’로 AI 문서 활용 확대 - EDMS·KMS·문서중앙화 시스템 연동으로 기업 문서 활용 환경 강화 사이냅소프트가 기업 문서 인프라와 연동되는 ‘사이냅 문서뷰어’를 앞세워 AI 기반 문서 활용 ... file newsit 2026.03.16 20
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 233 Next
/ 233
CLOSE