- GPU·메모리 자원 오케스트레이션으로 추론 성능·비용 구조 개선

 

[GTC 2026] 엔비디아, 다이나모 공개…AI 팩토리용 추론 운영체제 제시.jpg

엔비디아가 GTC 2026에서 대규모 생성형·에이전틱 추론을 위한 오픈소스 소프트웨어 다이나모 1.0’을 공개하며 AI 팩토리 운영 구조를 제시했다. 분산된 GPU와 메모리 자원을 통합 관리해 추론 성능과 비용 효율을 동시에 개선하는 데 초점을 맞췄다.

 

AI 추론을 위한 분산 운영 구조 설계

에이전틱 AI 확산으로 데이터센터 내 추론 요청은 규모와 유형이 동시에 증가하고 있다. 다이나모는 이러한 환경에서 GPU와 메모리 자원을 유기적으로 조율하는 분산 운영 계층으로 설계됐다. 클러스터 전반의 리소스를 통합 관리해 복잡한 추론 워크로드를 안정적으로 처리할 수 있다.

 

GPU 자원 활용 최적화로 성능 최대 7배 향상

다이나모는 추론 작업을 여러 GPU에 분산 배치하고 메모리 사용을 효율적으로 관리한다. 필요에 따라 데이터를 저비용 스토리지로 이동시키고, 요청 특성에 맞춰 적절한 GPU로 라우팅하는 구조를 적용했다. 엔비디아 블랙웰 기준 최대 7배 수준의 추론 성능 향상을 확인했다.

 

오픈소스 프레임워크와 네이티브 통합 확대

텐서RT-LLM 최적화 기능은 랭체인, LMCache, SGLang, vLLM 등 주요 프레임워크에 통합됐다. 메모리 관리와 데이터 이동 기능은 모듈 형태로 제공돼 다양한 환경에서 확장 적용이 가능하다. 개발자는 기존 오픈소스 생태계를 유지하면서 성능 최적화를 적용할 수 있다.

 

클라우드부터 엔터프라이즈까지 채택 확대

AWS, 마이크로소프트 애저, 구글 클라우드, OCI 등 주요 클라우드 사업자가 다이나모 기반 추론 플랫폼을 도입하고 있다. 코어위브, 네비우스, 투게더 AI 등 인프라 기업과 퍼플렉시티, 커서 같은 AI 기업도 해당 구조를 적용해 서비스 성능을 개선하고 있다. 대규모 프로덕션 환경에서 추론 운영 방식이 빠르게 표준화되는 상황이다.

 

엔비디아 젠슨 황 CEO추론은 모든 AI 애플리케이션을 구동하는 핵심 요소라며 다이나모는 AI 팩토리를 위한 운영 계층으로 GPU 자원을 효율적으로 활용할 수 있도록 설계됐다고 설명했다.

 

코어위브 첸 골드버그 수석 부사장은 대규모 AI 배포 환경에서는 안정성과 오케스트레이션 능력이 핵심이라며 다이나모를 통해 복잡한 워크로드를 안정적으로 운영할 수 있는 기반을 확보했다고 언급했다.

 

네비우스 다닐라 슈탄 CTO“AI 추론 성능은 하드웨어뿐 아니라 이를 제어하는 소프트웨어에 의해 결정된다엔비디아 소프트웨어 스택은 예측 가능한 성능과 빠른 배포를 가능하게 한다고 덧붙였다.

 

#엔비디아 #GTC2026 #다이나모 #AI추론 #TensorRT #AgenticAI #AI인프라 #GPU클러스터

 

 
?

  1. 한국퀀텀컴퓨팅, 에어큐브와 PQC 기반 패스워드리스 인증 PoC 추진

    - 양자내성암호와 IAM 결합해 NPE 키 관리 구조 검증 한국퀀텀컴퓨팅(KQC)이 에어큐브와 PQC(Post-Quantum Cryptography) 기반 패스워드리스 인증 모델 공동 검증에 나선다. 양자내성암호와 통합 인증·접근관리(IAM)를 결합해 비밀번호 없이 동작하는 인증 구...
    Date2026.03.25 Bynewsit Views57
    Read More
  2. 넷앱, NVIDIA 기반 AI Data Engine 공개…메타데이터 중심 AI 데이터 파이프라인 구조 제시

    - 글로벌 메타데이터 카탈로그 기반 데이터 탐색·거버넌스 통합, 에이전틱 AI 워크플로우 지원 넷앱이 NVIDIA AI Data Platform 레퍼런스 아키텍처와 결합한 AI 데이터 플랫폼 ‘NetApp AI Data Engine(AIDE)’을 공개했다. 글로벌 메타데이터 카탈로그와 시맨틱...
    Date2026.03.24 Bynewsit Views69
    Read More
  3. 스트라타시스, TrueDent CE Class IIa 획득…3D 프린팅 의치 적용 범위 확대

    - 모놀리식 다색 의치·임시 수복 적용, 유럽 디지털 보철 워크플로우 확장 스트라타시스 트루덴트(TrueDent) 레진이 CE Class IIa 의료기기 인증을 획득하며 3D 프린팅 의치 적용 범위를 확장했다. 폴리크로매틱 모놀리식 구조 기반 완전 의치와 부분 의치, 크...
    Date2026.03.24 Bynewsit Views65
    Read More
  4. ST, AI 데이터 센터용 800 VDC 전력 솔루션 확장…12V·6V 아키텍처 공개

    - GTC 2026 공개, AI 데이터센터용 800V DC 전력 변환 포트폴리오 확대 ST마이크로일렉트로닉스가 엔비디아와 협력해 AI 데이터센터용 800 VDC 전력 변환 포트폴리오를 확장하고 800 VDC-12V 및 800 VDC-6V 신규 아키텍처를 공개했다. NVIDIA 800 VDC 레퍼런스...
    Date2026.03.24 Bynewsit Views53
    Read More
  5. TI, IsoShield 절연 전원 모듈 공개…전력 밀도 3배 향상

    - 데이터센터·전기차 전력 설계 적용, 솔루션 크기 최대 70% 감소 TI가 IsoShield 멀티칩 패키징 기술로 평면 변압기와 절연 전력계를 단일 패키지에 통합한 절연 전원 모듈 UCC34141-Q1과 UCC33420을 공개했다. 멀티칩 패키징 기반 전력 밀도 향상 IsoShield ...
    Date2026.03.24 Bynewsit Views59
    Read More
  6. MSI, 코스트코 전용 게이밍 데스크탑 MAG CODEX 판매…라이젠 7500X3D·RTX 5060 구성

    - DDR5 메모리·NVMe SSD·전용 쿨링 적용 MSI가 AMD 라이젠5 7500X3D 프로세서와 RTX 5060 그래픽카드를 결합한 게이밍 데스크탑 ‘MAG CODEX’를 코스트코 매장에서 판매한다. CPU와 GPU 성능 균형을 중심으로 메모리와 스토리지, 전원, 냉각 구성을 결합해 고사...
    Date2026.03.24 Bynewsit Views70
    Read More
  7. 마우저, ST MCU·센서·전력반도체 1만8000종 공급 확대

    - STM32·MOSFET·모션센서·모터드라이버 설계 포트폴리오 운영 마우저가 ST 반도체 제품군 공급 범위를 확대하며 MCU와 센서, 전력반도체, 모터 제어 솔루션을 포함한 1만8000종 이상의 포트폴리오를 제공한다. 이 가운데 1만3000종 이상을 상시 재고로 운영해 ...
    Date2026.03.24 Bynewsit Views86
    Read More
  8. 로지텍, ‘Logi Work Korea’ 개최… 하이브리드 협업 환경 구성 전략 제시

    - 회의실·개인 워크스페이스 연결하는 협업 디바이스 구조 공개 로지텍이 국내 주요 기업 고객과 파트너를 대상으로 미래 업무 환경 변화와 협업 기술 방향을 공유하는 ‘Logi Work Korea’를 개최하며 회의실과 개인 업무 공간을 연결하는 하이브리드 협업 환경...
    Date2026.03.23 Bynewsit Views64
    Read More
  9. ams 오스람, 차량 조명 네트워크 OSP ISO 국제표준화 착수

    - 10BASE-T1S 기반 지능형 조명 제어 프로토콜 표준화 진행 ams 오스람이 차량 조명 및 센서 네트워크 제어를 위한 OSP(Open System Protocol) 기술의 ISO 국제표준화 절차에 착수하며 소프트웨어 정의 차량(SDV) 환경에서 조명·센서·액추에이터를 연결하는 라...
    Date2026.03.23 Bynewsit Views59
    Read More
  10. 카스퍼스키, QKS SPARK Matrix 기업 보안 리더 선정

    - XDR·SIEM·TI 결합 구조로 통합 탐지 대응 역량 평가 카스퍼스키가 시장조사기관 QKS(Quadrant Knowledge Solutions)의 SPARK Matrix 보고서에서 기업용 사이버보안 주요 부문 리더로 선정됐다. XDR, SIEM, 위협 인텔리전스, MDR 서비스를 결합한 통합 탐지·...
    Date2026.03.23 Bynewsit Views57
    Read More
  11. EDB, EPAS 네이티브 TDE로 WAL·임시파일까지 암호화

    - 커널 I/O 레벨 통합 방식으로 인덱스·임시파일·WAL까지 보호 범위 확장 EDB가 PostgreSQL 커널 레벨에 통합된 네이티브 TDE(Transparent Data Encryption)를 적용한 EPAS를 공개하며 데이터 저장 전 영역 암호화 구조를 제시했다. 인덱스와 임시 파일, WAL(W...
    Date2026.03.23 Bynewsit Views53
    Read More
  12. [GTC 2026] 레노버, AI 추론부터 AI 팩토리까지 확장…하이브리드 AI 전주기 실행 구조 공개

    - 워크스테이션·엣지·데이터센터·AI 팩토리로 이어지는 추론 중심 인프라 구성 레노버가 GTC 2026에서 AI 추론부터 AI 팩토리까지 이어지는 하이브리드 AI 실행 구조를 공개했다. 온프레미스와 클라우드를 결합해 추론 워크로드를 분산 처리하고 토큰 처리 효...
    Date2026.03.20 Bynewsit Views83
    Read More
  13. 노르딕, nRF54L 시리즈 공개…NPU 기반 초저전력 엣지 AI 확장

    - 온디바이스 추론 구조 도입, 배터리 기기에서도 실시간 인텔리전스 구현 노르딕 세미컨덕터가 NPU를 탑재한 nRF54LM20B를 출시하고 차세대 초저전력 SoC 포트폴리오를 확장했다. NPU 기반 연산 구조로 성능·전력 효율 동시 확보 nRF54LM20B에 통합된 NPU는 ...
    Date2026.03.20 Bynewsit Views66
    Read More
  14. ADI, 태국 생산시설 구축…패키징·테스트 역량 확대

    - 하이브리드 제조 전략 기반, 공급망 회복력과 생산 유연성 강화 아나로그디바이스가 태국에 신규 생산 시설을 구축하고 패키징과 테스트 공정을 중심으로 글로벌 제조 네트워크를 확장했다. 자체 공장과 외부 파운드리, OSAT 파트너를 결합한 하이브리드 제...
    Date2026.03.20 Bynewsit Views59
    Read More
  15. 넷스카우트 코리아, AI 기반 DDoS 대응 체계 공개…탐지·분석·완화 흐름 통합

    - 네트워크 가시성 중심 구조, AED·Sightline·TMS 연동 운영 방식 제시 넷스카우트 코리아가 ‘솔루션데이 2026’에서 AI·ML 기반 DDoS 대응 전략을 공개하고, 네트워크 가시성을 중심으로 탐지와 분석, 완화까지 이어지는 보안 운영 흐름을 하나의 구조로 통합...
    Date2026.03.20 Bynewsit Views84
    Read More
  16. 아웃시스템즈, G2 AI 에이전트 빌더 리더 선정…NPS 95점 기록

    - 관리 편의성 100%·맥락 인식 95%, 엔터프라이즈 AI 에이전트 평가 상위권 확보 아웃시스템즈가 G2 ‘2026 Grid Report’에서 AI 에이전트 빌더 부문 리더로 선정됐다. 관리 편의성 100%와 NPS 95점을 기록하며 엔터프라이즈 AI 에이전트 플랫폼 평가에서 높은 ...
    Date2026.03.20 Bynewsit Views81
    Read More
  17. 지멘스, 에이전틱 AI 기반 반도체 검증 플랫폼 ‘퀘스타 원 에이전틱 툴킷’ 공개

    - RTL 사인오프 가속, 설계·검증 워크플로우를 AI 기반으로 재구성 지멘스가 ‘퀘스타 원 에이전틱 툴킷’을 통해 반도체 설계 검증 전 과정을 에이전틱 AI 기반 워크플로우로 전환하고, RTL 생성부터 클로저까지 이어지는 흐름을 하나로 연결하면서 사인오프 속...
    Date2026.03.20 Bynewsit Views67
    Read More
  18. 아비바-엔비디아, 기가와트급 AI 팩토리 디지털 트윈 공개…설계·운영 통합 구조 구축

    - 옴니버스 DSX 기반 아키텍처, GPU 효율·토큰 처리 속도 동시 개선 아비바가 엔비디아와 협력해 기가와트급 AI 팩토리 구축을 위한 라이프사이클 디지털 트윈 아키텍처를 구축했다. 옴니버스 DSX 블루프린트를 기반으로 설계와 시뮬레이션, 운영을 하나의 흐...
    Date2026.03.20 Bynewsit Views51
    Read More
  19. 코헤시티, NH농협은행 클라우드 백업 구축…TCO 28억 절감·복구시간 94% 단축

    - 퍼블릭 클라우드 기반 소산백업 전환, 자동화 검증으로 금융 데이터 보호 강화 코헤시티가 NH농협은행에 퍼블릭 클라우드 기반 원격 소산백업 시스템을 구축하며, 5년 총소유비용(TCO) 약 28억 원 절감과 복구 시간 94% 단축 성과를 확보했다. 테이프 기반 ...
    Date2026.03.19 Bynewsit Views74
    Read More
  20. [GTC 2026] HPE, 엔비디아와 AI 인프라 확장…GPU 128개 규모·인증 스토리지 적용

    - 프라이빗 클라우드 기반 대규모 AI 처리 성능·운영 안정성 확보 HPE가 엔비디아와 협력해 최대 128개 GPU를 동시에 활용하는 대규모 AI 인프라를 공개했다. 엔비디아 인증 스토리지와 통합 데이터 파이프라인을 적용해 프라이빗 클라우드 환경에서 AI 학습과...
    Date2026.03.19 Bynewsit Views80
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 288 Next
/ 288
CLOSE