- GPU·메모리 자원 오케스트레이션으로 추론 성능·비용 구조 개선

 

[GTC 2026] 엔비디아, 다이나모 공개…AI 팩토리용 추론 운영체제 제시.jpg

엔비디아가 GTC 2026에서 대규모 생성형·에이전틱 추론을 위한 오픈소스 소프트웨어 다이나모 1.0’을 공개하며 AI 팩토리 운영 구조를 제시했다. 분산된 GPU와 메모리 자원을 통합 관리해 추론 성능과 비용 효율을 동시에 개선하는 데 초점을 맞췄다.

 

AI 추론을 위한 분산 운영 구조 설계

에이전틱 AI 확산으로 데이터센터 내 추론 요청은 규모와 유형이 동시에 증가하고 있다. 다이나모는 이러한 환경에서 GPU와 메모리 자원을 유기적으로 조율하는 분산 운영 계층으로 설계됐다. 클러스터 전반의 리소스를 통합 관리해 복잡한 추론 워크로드를 안정적으로 처리할 수 있다.

 

GPU 자원 활용 최적화로 성능 최대 7배 향상

다이나모는 추론 작업을 여러 GPU에 분산 배치하고 메모리 사용을 효율적으로 관리한다. 필요에 따라 데이터를 저비용 스토리지로 이동시키고, 요청 특성에 맞춰 적절한 GPU로 라우팅하는 구조를 적용했다. 엔비디아 블랙웰 기준 최대 7배 수준의 추론 성능 향상을 확인했다.

 

오픈소스 프레임워크와 네이티브 통합 확대

텐서RT-LLM 최적화 기능은 랭체인, LMCache, SGLang, vLLM 등 주요 프레임워크에 통합됐다. 메모리 관리와 데이터 이동 기능은 모듈 형태로 제공돼 다양한 환경에서 확장 적용이 가능하다. 개발자는 기존 오픈소스 생태계를 유지하면서 성능 최적화를 적용할 수 있다.

 

클라우드부터 엔터프라이즈까지 채택 확대

AWS, 마이크로소프트 애저, 구글 클라우드, OCI 등 주요 클라우드 사업자가 다이나모 기반 추론 플랫폼을 도입하고 있다. 코어위브, 네비우스, 투게더 AI 등 인프라 기업과 퍼플렉시티, 커서 같은 AI 기업도 해당 구조를 적용해 서비스 성능을 개선하고 있다. 대규모 프로덕션 환경에서 추론 운영 방식이 빠르게 표준화되는 상황이다.

 

엔비디아 젠슨 황 CEO추론은 모든 AI 애플리케이션을 구동하는 핵심 요소라며 다이나모는 AI 팩토리를 위한 운영 계층으로 GPU 자원을 효율적으로 활용할 수 있도록 설계됐다고 설명했다.

 

코어위브 첸 골드버그 수석 부사장은 대규모 AI 배포 환경에서는 안정성과 오케스트레이션 능력이 핵심이라며 다이나모를 통해 복잡한 워크로드를 안정적으로 운영할 수 있는 기반을 확보했다고 언급했다.

 

네비우스 다닐라 슈탄 CTO“AI 추론 성능은 하드웨어뿐 아니라 이를 제어하는 소프트웨어에 의해 결정된다엔비디아 소프트웨어 스택은 예측 가능한 성능과 빠른 배포를 가능하게 한다고 덧붙였다.

 

#엔비디아 #GTC2026 #다이나모 #AI추론 #TensorRT #AgenticAI #AI인프라 #GPU클러스터

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
5618 티오리, NDSS 채택 ‘DirtyFree’ 공개…리눅스 커널 공격·방어 구조 제시 file newsit 2026.03.18 42
5617 마스터카드, AI 에이전트 ‘국내 첫 결제’…에이전틱 커머스 실증 file newsit 2026.03.17 28
5616 [GTC 2026] ADI, 피지컬 인텔리전스 로보틱스 공개…촉각·디지털 트윈 결합 file newsit 2026.03.17 33
» [GTC 2026] 엔비디아, 다이나모 공개…AI 팩토리용 추론 운영체제 제시 file newsit 2026.03.17 28
5614 타포, 듀얼 렌즈 홈캠 ‘C245D’ 출시…넓은 실내 모니터링 강화 file newsit 2026.03.17 40
5613 [GTC 2026] 엔비디아, 베라 CPU 공개…에이전틱 AI 처리 구조 확장 file newsit 2026.03.17 48
5612 [GTC 2026] 델, AI 팩토리 업데이트…엔터프라이즈 AI ROI 경로 제시 file newsit 2026.03.17 34
5611 [GTC 2026] 엔비디아, IGX 토르 출시…산업 현장에 실시간 피지컬 AI 구현 file newsit 2026.03.17 45
5610 [GTC 2026] 엔비디아, 스페이스 컴퓨팅 공개…궤도 데이터센터로 AI 확장 file newsit 2026.03.17 41
5609 로지텍, RS H-시프터 출시…홀 효과 센서 기반 수동 변속 정밀도 강화 file newsit 2026.03.17 54
5608 [GTC 2026] 엔비디아, 현대차·기아와 협력 확대… DRIVE 하이페리온 기반 자율주행 개발 가속 file newsit 2026.03.17 28
5607 [GTC 2026] 엔비디아, 블루필드-4 STX 공개… 컨텍스트 메모리 기반 AI 스토리지 확장 file newsit 2026.03.17 34
5606 스틸시리즈, 컨트롤프릭 기획전 진행… 전 제품 15% 할인 file newsit 2026.03.17 34
5605 솔트웨어, 레드햇 프리미어 파트너 선정… MSP·현대화 기반 클라우드 확장 file newsit 2026.03.17 36
5604 이미지스, 시마AI와 협력… 촉각 센싱·MLSoC로 피지컬 AI 확장 file newsit 2026.03.17 41
5603 [GTC 2026] 엔비디아, 네모트론·코스모스 공개… 에이전틱·피지컬·헬스케어 AI 확장 file newsit 2026.03.17 32
5602 [GTC 2026] 엔비디아, ‘베라 루빈’ 공개… NVL72·LPU 기반 AI 팩토리 전환 file newsit 2026.03.17 38
5601 안랩·안랩클라우드메이트, ‘AI 바우처 지원사업’ 참여…AI 보안 솔루션 공급 file newsit 2026.03.16 28
5600 티머니, 서울 시내버스 ‘태그리스 결제’ 프로모션…승차 때마다 500원 적립 file newsit 2026.03.16 36
5599 마우저, 자율주행 설계 리소스 센터 확대…AV 시스템 아키텍처 정보 제공 file newsit 2026.03.16 42
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 283 Next
/ 283
CLOSE