- GPU·메모리 자원 오케스트레이션으로 추론 성능·비용 구조 개선

 

[GTC 2026] 엔비디아, 다이나모 공개…AI 팩토리용 추론 운영체제 제시.jpg

엔비디아가 GTC 2026에서 대규모 생성형·에이전틱 추론을 위한 오픈소스 소프트웨어 다이나모 1.0’을 공개하며 AI 팩토리 운영 구조를 제시했다. 분산된 GPU와 메모리 자원을 통합 관리해 추론 성능과 비용 효율을 동시에 개선하는 데 초점을 맞췄다.

 

AI 추론을 위한 분산 운영 구조 설계

에이전틱 AI 확산으로 데이터센터 내 추론 요청은 규모와 유형이 동시에 증가하고 있다. 다이나모는 이러한 환경에서 GPU와 메모리 자원을 유기적으로 조율하는 분산 운영 계층으로 설계됐다. 클러스터 전반의 리소스를 통합 관리해 복잡한 추론 워크로드를 안정적으로 처리할 수 있다.

 

GPU 자원 활용 최적화로 성능 최대 7배 향상

다이나모는 추론 작업을 여러 GPU에 분산 배치하고 메모리 사용을 효율적으로 관리한다. 필요에 따라 데이터를 저비용 스토리지로 이동시키고, 요청 특성에 맞춰 적절한 GPU로 라우팅하는 구조를 적용했다. 엔비디아 블랙웰 기준 최대 7배 수준의 추론 성능 향상을 확인했다.

 

오픈소스 프레임워크와 네이티브 통합 확대

텐서RT-LLM 최적화 기능은 랭체인, LMCache, SGLang, vLLM 등 주요 프레임워크에 통합됐다. 메모리 관리와 데이터 이동 기능은 모듈 형태로 제공돼 다양한 환경에서 확장 적용이 가능하다. 개발자는 기존 오픈소스 생태계를 유지하면서 성능 최적화를 적용할 수 있다.

 

클라우드부터 엔터프라이즈까지 채택 확대

AWS, 마이크로소프트 애저, 구글 클라우드, OCI 등 주요 클라우드 사업자가 다이나모 기반 추론 플랫폼을 도입하고 있다. 코어위브, 네비우스, 투게더 AI 등 인프라 기업과 퍼플렉시티, 커서 같은 AI 기업도 해당 구조를 적용해 서비스 성능을 개선하고 있다. 대규모 프로덕션 환경에서 추론 운영 방식이 빠르게 표준화되는 상황이다.

 

엔비디아 젠슨 황 CEO추론은 모든 AI 애플리케이션을 구동하는 핵심 요소라며 다이나모는 AI 팩토리를 위한 운영 계층으로 GPU 자원을 효율적으로 활용할 수 있도록 설계됐다고 설명했다.

 

코어위브 첸 골드버그 수석 부사장은 대규모 AI 배포 환경에서는 안정성과 오케스트레이션 능력이 핵심이라며 다이나모를 통해 복잡한 워크로드를 안정적으로 운영할 수 있는 기반을 확보했다고 언급했다.

 

네비우스 다닐라 슈탄 CTO“AI 추론 성능은 하드웨어뿐 아니라 이를 제어하는 소프트웨어에 의해 결정된다엔비디아 소프트웨어 스택은 예측 가능한 성능과 빠른 배포를 가능하게 한다고 덧붙였다.

 

#엔비디아 #GTC2026 #다이나모 #AI추론 #TensorRT #AgenticAI #AI인프라 #GPU클러스터

 

 
?

  1. 넷스카우트 코리아, AI 기반 DDoS 대응 체계 공개…탐지·분석·완화 흐름 통합

    - 네트워크 가시성 중심 구조, AED·Sightline·TMS 연동 운영 방식 제시 넷스카우트 코리아가 ‘솔루션데이 2026’에서 AI·ML 기반 DDoS 대응 전략을 공개하고, 네트워크 가시성을 중심으로 탐지와 분석, 완화까지 이어지는 보안 운영 흐름을 하나의 구조로 통합...
    Date2026.03.20 Bynewsit Views44
    Read More
  2. 아웃시스템즈, G2 AI 에이전트 빌더 리더 선정…NPS 95점 기록

    - 관리 편의성 100%·맥락 인식 95%, 엔터프라이즈 AI 에이전트 평가 상위권 확보 아웃시스템즈가 G2 ‘2026 Grid Report’에서 AI 에이전트 빌더 부문 리더로 선정됐다. 관리 편의성 100%와 NPS 95점을 기록하며 엔터프라이즈 AI 에이전트 플랫폼 평가에서 높은 ...
    Date2026.03.20 Bynewsit Views43
    Read More
  3. 지멘스, 에이전틱 AI 기반 반도체 검증 플랫폼 ‘퀘스타 원 에이전틱 툴킷’ 공개

    - RTL 사인오프 가속, 설계·검증 워크플로우를 AI 기반으로 재구성 지멘스가 ‘퀘스타 원 에이전틱 툴킷’을 통해 반도체 설계 검증 전 과정을 에이전틱 AI 기반 워크플로우로 전환하고, RTL 생성부터 클로저까지 이어지는 흐름을 하나로 연결하면서 사인오프 속...
    Date2026.03.20 Bynewsit Views35
    Read More
  4. 아비바-엔비디아, 기가와트급 AI 팩토리 디지털 트윈 공개…설계·운영 통합 구조 구축

    - 옴니버스 DSX 기반 아키텍처, GPU 효율·토큰 처리 속도 동시 개선 아비바가 엔비디아와 협력해 기가와트급 AI 팩토리 구축을 위한 라이프사이클 디지털 트윈 아키텍처를 구축했다. 옴니버스 DSX 블루프린트를 기반으로 설계와 시뮬레이션, 운영을 하나의 흐...
    Date2026.03.20 Bynewsit Views26
    Read More
  5. 코헤시티, NH농협은행 클라우드 백업 구축…TCO 28억 절감·복구시간 94% 단축

    - 퍼블릭 클라우드 기반 소산백업 전환, 자동화 검증으로 금융 데이터 보호 강화 코헤시티가 NH농협은행에 퍼블릭 클라우드 기반 원격 소산백업 시스템을 구축하며, 5년 총소유비용(TCO) 약 28억 원 절감과 복구 시간 94% 단축 성과를 확보했다. 테이프 기반 ...
    Date2026.03.19 Bynewsit Views36
    Read More
  6. [GTC 2026] HPE, 엔비디아와 AI 인프라 확장…GPU 128개 규모·인증 스토리지 적용

    - 프라이빗 클라우드 기반 대규모 AI 처리 성능·운영 안정성 확보 HPE가 엔비디아와 협력해 최대 128개 GPU를 동시에 활용하는 대규모 AI 인프라를 공개했다. 엔비디아 인증 스토리지와 통합 데이터 파이프라인을 적용해 프라이빗 클라우드 환경에서 AI 학습과...
    Date2026.03.19 Bynewsit Views34
    Read More
  7. [GTC 2026] 엔비디아, 오라클과 벡터 검색 가속…GPU 인덱싱 협력 확대

    - cuVS·오라클 AI DB 결합, 대규모 데이터 검색·의료 AI 활용 속도 개선 엔비디아가 GTC 2026에서 오라클과 협력해 GPU 기반 벡터 인덱스 구축 기술을 실제 워크로드에 적용한다고 공개했다. 엔비디아 cuVS와 오라클 프라이빗 AI 서비스 컨테이너를 결합해 대...
    Date2026.03.19 Bynewsit Views34
    Read More
  8. [GTC 2026] 엔비디아, 단백질 데이터셋 확장…170만 복합체·3,000만 구조 공개

    - 딥마인드·EMBL 협력, 단백질 상호작용 분석·신약 연구 활용 확대 엔비디아가 GTC 2026에서 구글 딥마인드, EMBL-EBI, 서울대학교 연구진과 함께 알파폴드 단백질 구조 데이터베이스를 확장했다고 공개했다. 약 170만 개의 단백질 복합체와 3,000만 개의 추가...
    Date2026.03.19 Bynewsit Views31
    Read More
  9. [GTC 2026] 엔비디아, 한국 기업과 AI 협력 확대…메모리·자율주행 전방위 확장

    - 삼성전자·SK하이닉스·현대차, AI 인프라부터 SDV까지 협력 사례 공개 엔비디아가 GTC 2026에서 삼성전자, SK하이닉스, 현대자동차그룹 등과의 협력 사례를 공개하며 한국 기업과의 AI 생태계 확장을 강화했다. AI 인프라부터 자율주행까지 다양한 영역에서 ...
    Date2026.03.19 Bynewsit Views22
    Read More
  10. [GTC 2026] 엔비디아, 금융 AI 확산 가속…마스터카드·레볼루트·아디옌 도입 확대

    - 트랜잭션 파운데이션 모델로 사기 탐지·신용 예측·결제 최적화 강화 엔비디아가 GTC 2026에서 글로벌 금융 기업들이 자사 기반 트랜잭션 파운데이션 모델을 도입하고 있다고 공개하며 금융 AI 적용 범위를 확대했다. 사용자 행동 데이터 분석과 금융 범죄 대...
    Date2026.03.19 Bynewsit Views34
    Read More
  11. F5, AI·제로트러스트·PQC 통합 보안 공개…ADSP 기반 멀티클라우드 보호 강화

    - 애플리케이션 보안 기능 통합, 위협 대응부터 접근 제어까지 단일 흐름 구현 F5가 AI 기반 위협 대응과 제로트러스트 접근 제어, 포스트 양자 암호(PQC) 대응 기능을 통합한 보안 기능을 공개했다. ADSP(Application Delivery and Security Platform)를 중심...
    Date2026.03.19 Bynewsit Views34
    Read More
  12. 옵스왓, AI 샌드박스 ‘메타디펜더 이더’ 출시…제로데이 탐지·SOC 자동화 강화

    - 다계층 AI 분석 구조로 99.9% 탐지율·100배 자원 효율 구현 옵스왓이 네트워크 경계에서 제로데이 위협을 선제적으로 차단하는 AI 기반 샌드박스 엔진 ‘메타디펜더 이더’를 출시하며 파일 유입 단계 보안 구조를 재정의했다. 다계층 분석 파이프라인과 단일 ...
    Date2026.03.19 Bynewsit Views30
    Read More
  13. 카스퍼스키, NDR 강화 ‘KATA 8.0’ 출시…네트워크 가시성·탐지 정확도 확대

    - 이상 탐지·섀도우 IT 식별·통합 대응 기능으로 타깃 공격 대응 고도화 카스퍼스키가 네트워크 탐지 및 대응(NDR) 기능을 강화한 ‘KATA 8.0’을 출시하며 기업의 네트워크 가시성과 위협 탐지 정확도를 높였다고 밝혔다. 확장된 탐지 기술과 통합 보안 구조를 ...
    Date2026.03.19 Bynewsit Views29
    Read More
  14. 그룹아이비, 인터폴 ‘시너지아 III’ 지원…45,000개 악성 인프라 차단 기여

    - 글로벌 사이버범죄 대응 작전 참여, 위협 인텔리전스로 수사 협력 확대 그룹아이비가 인터폴 주도의 글로벌 사이버범죄 대응 작전 ‘시너지아 III(Operation Synergia III)’에 참여해 위협 인텔리전스를 제공하며 국제 공조 수사를 지원했다고 밝혔다. 피싱·...
    Date2026.03.19 Bynewsit Views40
    Read More
  15. [GTC 2026] TI, 엔비디아와 800V DC 전력 아키텍처 공개… AI 데이터센터 전력 구조 전환

    - 2단 변환 구조 기반 고효율·고밀도 전력 설계 제시 TI가 엔비디아와 협력한 800V DC 기반 AI 데이터센터 전력 아키텍처를 공개하고 전력 효율과 밀도를 동시에 높이는 고전압 D#GTC2026C 설계를 제시했다. 엔비디아의 800V 레퍼런스를 기반으로 아날로그·임...
    Date2026.03.18 Bynewsit Views30
    Read More
  16. MSI, 서강대 체험 행사 개최… ‘프레스티지 2026’ 첫 공개

    - 팬서레이크·RTX 50 기반 신제품 전시… 대학생 대상 체험 중심 운영 MSI가 서강대학교에서 노트북·UMPC 체험 행사를 열고 ‘프레스티지 2026’ 시리즈를 처음 공개한다. 팬서레이크 기반 신제품과 RTX 50 노트북을 통해 새학기 수요를 겨냥한 체험 중심 운영 전...
    Date2026.03.18 Bynewsit Views44
    Read More
  17. 스플렁크, ‘스플렁크 고 2026 서울’ 개최… 에이전틱 AI 옵저버빌리티 전략 공개

    - 시스코 데이터 패브릭 결합…AI 스택 전반 가시성·보안·제어 통합 스플렁크가 ‘스플렁크 고 2026 서울’을 개최하고 AI 스택 전반의 가시성과 보안·제어를 통합하는 운영 전략을 공개했다. 머신 데이터와 AI를 결합해 보안 운영과 옵저버빌리티를 동시에 강화...
    Date2026.03.18 Bynewsit Views37
    Read More
  18. NXP, 엔비디아와 로보틱스 솔루션 출시…피지컬 AI 데이터 처리 구조 통합

    - 센서 융합·모터 제어 통합 제품 공개…저지연 데이터 처리·전송 기반 구축 NXP가 엔비디아와 협력해 로보틱스 솔루션을 출시하며 피지컬 AI 환경에서 요구되는 실시간 데이터 처리 구조를 제시했다. 센서 융합과 머신 비전, 정밀 모터 제어를 하나의 시스템으...
    Date2026.03.18 Bynewsit Views34
    Read More
  19. [GTC 2026] SAP, 폭스콘과 ‘AI 팩토리’ 협력…제조·공급망 구조 통합 추진

    - GTC 2026서 파트너십 발표…엔터프라이즈 AI·스마트 제조 결합 모델 구축 SAP가 폭스콘과 협력해 ‘AI 팩토리’ 기반 제조·공급망 통합 구조를 구축하며 아시아태평양 지역 엔터프라이즈 AI 도입을 확대한다. 이번 파트너십은 GTC 2026에서 공개됐으며, 폭스콘...
    Date2026.03.18 Bynewsit Views35
    Read More
  20. 알리바바, 에이전틱 플랫폼 ‘우콩’ 공개…기업용 AI 업무 자동화 구조 제시

    - 멀티 에이전트 오케스트레이션 기반 업무 처리…딩톡 연동·보안 중심 설계 알리바바가 기업 업무에 특화된 AI 네이티브 에이전틱 플랫폼 ‘우콩’을 공개하며 멀티 에이전트 기반 업무 자동화 구조를 제시했다.이번 플랫폼은 하나의 인터페이스에서 여러 AI 에...
    Date2026.03.18 Bynewsit Views32
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 283 Next
/ 283
CLOSE