- GPU·메모리 자원 오케스트레이션으로 추론 성능·비용 구조 개선

 

[GTC 2026] 엔비디아, 다이나모 공개…AI 팩토리용 추론 운영체제 제시.jpg

엔비디아가 GTC 2026에서 대규모 생성형·에이전틱 추론을 위한 오픈소스 소프트웨어 다이나모 1.0’을 공개하며 AI 팩토리 운영 구조를 제시했다. 분산된 GPU와 메모리 자원을 통합 관리해 추론 성능과 비용 효율을 동시에 개선하는 데 초점을 맞췄다.

 

AI 추론을 위한 분산 운영 구조 설계

에이전틱 AI 확산으로 데이터센터 내 추론 요청은 규모와 유형이 동시에 증가하고 있다. 다이나모는 이러한 환경에서 GPU와 메모리 자원을 유기적으로 조율하는 분산 운영 계층으로 설계됐다. 클러스터 전반의 리소스를 통합 관리해 복잡한 추론 워크로드를 안정적으로 처리할 수 있다.

 

GPU 자원 활용 최적화로 성능 최대 7배 향상

다이나모는 추론 작업을 여러 GPU에 분산 배치하고 메모리 사용을 효율적으로 관리한다. 필요에 따라 데이터를 저비용 스토리지로 이동시키고, 요청 특성에 맞춰 적절한 GPU로 라우팅하는 구조를 적용했다. 엔비디아 블랙웰 기준 최대 7배 수준의 추론 성능 향상을 확인했다.

 

오픈소스 프레임워크와 네이티브 통합 확대

텐서RT-LLM 최적화 기능은 랭체인, LMCache, SGLang, vLLM 등 주요 프레임워크에 통합됐다. 메모리 관리와 데이터 이동 기능은 모듈 형태로 제공돼 다양한 환경에서 확장 적용이 가능하다. 개발자는 기존 오픈소스 생태계를 유지하면서 성능 최적화를 적용할 수 있다.

 

클라우드부터 엔터프라이즈까지 채택 확대

AWS, 마이크로소프트 애저, 구글 클라우드, OCI 등 주요 클라우드 사업자가 다이나모 기반 추론 플랫폼을 도입하고 있다. 코어위브, 네비우스, 투게더 AI 등 인프라 기업과 퍼플렉시티, 커서 같은 AI 기업도 해당 구조를 적용해 서비스 성능을 개선하고 있다. 대규모 프로덕션 환경에서 추론 운영 방식이 빠르게 표준화되는 상황이다.

 

엔비디아 젠슨 황 CEO추론은 모든 AI 애플리케이션을 구동하는 핵심 요소라며 다이나모는 AI 팩토리를 위한 운영 계층으로 GPU 자원을 효율적으로 활용할 수 있도록 설계됐다고 설명했다.

 

코어위브 첸 골드버그 수석 부사장은 대규모 AI 배포 환경에서는 안정성과 오케스트레이션 능력이 핵심이라며 다이나모를 통해 복잡한 워크로드를 안정적으로 운영할 수 있는 기반을 확보했다고 언급했다.

 

네비우스 다닐라 슈탄 CTO“AI 추론 성능은 하드웨어뿐 아니라 이를 제어하는 소프트웨어에 의해 결정된다엔비디아 소프트웨어 스택은 예측 가능한 성능과 빠른 배포를 가능하게 한다고 덧붙였다.

 

#엔비디아 #GTC2026 #다이나모 #AI추론 #TensorRT #AgenticAI #AI인프라 #GPU클러스터

 

 
?

  1. NEW

    마스터카드, AI 에이전트 ‘국내 첫 결제’…에이전틱 커머스 실증

    - 공항 이동 서비스 예약부터 결제까지 전 과정 자동 수행 마스터카드가 AI 에이전트가 검색부터 결제까지 전 과정을 수행하는 실거래를 국내에서 처음 구현하며 에이전틱 커머스 상용화 가능성을 확인했다. 인천공항에서 서울 광화문 호텔까지 이동하는 차량 ...
    Date2026.03.17 Bynewsit Views14
    Read More
  2. NEW

    [GTC 2026] ADI, 피지컬 인텔리전스 로보틱스 공개…촉각·디지털 트윈 결합

    - 촉각 센서·디지털 트윈 기반 휴머노이드 조작 데모 진행 아나로그디바이스가 GTC 2026에서 피지컬 인텔리전스 기반 로보틱스 기술을 시연하며 휴머노이드 손 조작 플랫폼과 산업용 평가 기준을 공개했다. 촉각 센서와 디지털 트윈, AI 제어를 결합한 데모를 ...
    Date2026.03.17 Bynewsit Views18
    Read More
  3. NEW

    [GTC 2026] 엔비디아, 다이나모 공개…AI 팩토리용 추론 운영체제 제시

    - GPU·메모리 자원 오케스트레이션으로 추론 성능·비용 구조 개선 엔비디아가 GTC 2026에서 대규모 생성형·에이전틱 추론을 위한 오픈소스 소프트웨어 ‘다이나모 1.0’을 공개하며 AI 팩토리 운영 구조를 제시했다. 분산된 GPU와 메모리 자원을 통합 관리해 추...
    Date2026.03.17 Bynewsit Views13
    Read More
  4. NEW

    타포, 듀얼 렌즈 홈캠 ‘C245D’ 출시…넓은 실내 모니터링 강화

    - 광각·망원 결합과 AI 추적으로 사각지대 최소화 티피링크 스마트홈 브랜드 타포가 듀얼 렌즈 구조를 적용한 실내 보안 카메라 ‘Tapo C245D’를 출시하며 넓은 공간을 동시에 모니터링하는 방식을 제시했다. 하나의 장치로 시야 확보와 추적 기능을 함께 처리...
    Date2026.03.17 Bynewsit Views26
    Read More
  5. NEW

    [GTC 2026] 엔비디아, 베라 CPU 공개…에이전틱 AI 처리 구조 확장

    - CPU 역할 확장해 추론·오케스트레이션 성능과 효율 동시 개선 엔비디아가 GTC 2026에서 에이전틱 AI와 강화학습을 위한 ‘베라 CPU’를 공개하며 AI 인프라 구조를 확장한다. 보조 연산에 머물던 CPU를 실행과 제어 중심으로 끌어올리면서, 대규모 에이전틱 워...
    Date2026.03.17 Bynewsit Views25
    Read More
  6. NEW

    [GTC 2026] 델, AI 팩토리 업데이트…엔터프라이즈 AI ROI 경로 제시

    - 데이터·인프라·서비스 통합해 파일럿에서 운영까지 확장 지원 델이 ‘엔비디아 기반 델 AI 팩토리’ 2주년을 맞아 AI 데이터 플랫폼과 인프라, 솔루션 전반을 업데이트하며 엔터프라이즈 AI의 투자수익률(ROI)을 확보하는 구조를 제시했다. 파일럿 단계에 머물...
    Date2026.03.17 Bynewsit Views18
    Read More
  7. NEW

    [GTC 2026] 엔비디아, IGX 토르 출시…산업 현장에 실시간 피지컬 AI 구현

    - 센서·추론·제어 통합 플랫폼으로 안전성과 생산성 동시 확보 엔비디아가 GTC 2026에서 산업용 AI 플랫폼 ‘IGX 토르’를 출시하며 피지컬 AI 기반 실시간 연산 환경을 산업 현장에 적용한다. 고속 센서 처리와 엔터프라이즈급 신뢰성, 기능적 안전성을 결합해 ...
    Date2026.03.17 Bynewsit Views25
    Read More
  8. NEW

    [GTC 2026] 엔비디아, 스페이스 컴퓨팅 공개…궤도 데이터센터로 AI 확장

    - SWaP 제약 넘는 AI 플랫폼, 우주·지상 연산 구조 통합 엔비디아가 GTC 2026에서 스페이스 컴퓨팅 플랫폼을 공개하며 궤도 데이터센터(ODC) 기반 AI 실행 구조를 확장한다. 지상에 머물던 연산을 우주로 끌어올리면서, 실시간 처리와 자율 운영을 하나의 흐름...
    Date2026.03.17 Bynewsit Views25
    Read More
  9. NEW

    로지텍, RS H-시프터 출시…홀 효과 센서 기반 수동 변속 정밀도 강화

    - H패턴·비접촉 구조 결합해 조작 감각과 내구성 동시에 확보 로지텍이 게이밍 레이싱 기어 ‘RS H-시프터’를 국내에 출시하고 수동 변속 기반 레이싱 경험을 강화한다. 7단+후진 구조와 비접촉 센서를 적용해 조작 정밀도와 내구성을 함께 끌어올렸다. 실차 감...
    Date2026.03.17 Bynewsit Views24
    Read More
  10. NEW

    [GTC 2026] 엔비디아, 현대차·기아와 협력 확대… DRIVE 하이페리온 기반 자율주행 개발 가속

    - SDV·플릿 데이터 결합해 레벨2~4 자율주행 시스템 확장 엔비디아가 현대차·기아와 협력을 확대하고 DRIVE 하이페리온 플랫폼을 기반으로 데이터 중심 자율주행 시스템 개발을 추진한다. 소프트웨어 정의 차량과 대규모 차량 데이터, AI 컴퓨팅을 결합해 자율...
    Date2026.03.17 Bynewsit Views13
    Read More
  11. NEW

    [GTC 2026] 엔비디아, 블루필드-4 STX 공개… 컨텍스트 메모리 기반 AI 스토리지 확장

    - 토큰 처리량 5배·에너지 효율 4배… 장문 추론 대응 인프라 제시 엔비디아가 GTC 2026에서 블루필드-4 기반 STX 스토리지 아키텍처를 공개하고, 에이전틱 AI 환경에 대응하는 컨텍스트 메모리 중심 인프라를 제시했다. 긴 컨텍스트 기반 추론에서 발생하는 데...
    Date2026.03.17 Bynewsit Views20
    Read More
  12. NEW

    스틸시리즈, 컨트롤프릭 기획전 진행… 전 제품 15% 할인

    - 네이버 공식스토어서 2주간 할인·리뷰 이벤트 운영 스틸시리즈가 컨트롤프릭 기획전을 열고 콘솔 게이밍 액세서리 할인 프로모션을 시작한다. 네이버 공식스토어에서 3월 16일부터 29일까지 전 제품 15% 할인과 리뷰 이벤트를 함께 진행한다. 2주간 할인·경...
    Date2026.03.17 Bynewsit Views11
    Read More
  13. NEW

    솔트웨어, 레드햇 프리미어 파트너 선정… MSP·현대화 기반 클라우드 확장

    - 공공·엔터프라이즈 환경서 설계·구축·운영 통합 지원 강화 솔트웨어가 레드햇 프리미어 파트너로 선정되며 클라우드 구축·운영 역량을 강화하고, MSP 기반 운영을 바탕으로 시스템 현대화와 AI 인프라 전환까지 사업 범위를 확장한다. 프리미어 파트너 선정,...
    Date2026.03.17 Bynewsit Views22
    Read More
  14. NEW

    이미지스, 시마AI와 협력… 촉각 센싱·MLSoC로 피지컬 AI 확장

    - 휴머노이드·산업·디바이스까지 로보틱스 인터페이스 구조 구축 이미지스테크놀로지가 시마AI와 전략적 파트너십을 체결하고 로보틱스와 산업용 피지컬 AI 시장 확대에 나선다. 센싱·제어 기술과 MLSoC 기반 연산을 결합해, 물리 환경에서 동작하는 AI 인터페...
    Date2026.03.17 Bynewsit Views20
    Read More
  15. NEW

    [GTC 2026] 엔비디아, 네모트론·코스모스 공개… 에이전틱·피지컬·헬스케어 AI 확장

    - 오픈 모델 포트폴리오로 언어 넘어 로봇·신약개발까지 적용 영역 확대 엔비디아가 GTC 2026에서 오픈 모델 제품군을 확장하고, 에이전틱 AI를 넘어 로봇·자율주행·생명과학까지 적용 범위를 넓힌다고 밝혔다. 개별 모델 성능을 넘어서 역할별 모델을 조합하...
    Date2026.03.17 Bynewsit Views17
    Read More
  16. NEW

    [GTC 2026] 엔비디아, ‘베라 루빈’ 공개… NVL72·LPU 기반 AI 팩토리 전환

    - 7종 칩·5개 랙 통합 설계로 학습·추론·에이전트 전 과정 처리 엔비디아가 GTC 2026에서 차세대 AI 플랫폼 ‘베라 루빈’을 공개하고, AI 인프라를 랙·POD 기반 ‘AI 팩토리’ 구조로 확장한다고 밝혔다. GPU 중심 연산 구조에서 벗어나 학습과 추론, 에이전트 실...
    Date2026.03.17 Bynewsit Views23
    Read More
  17. 안랩·안랩클라우드메이트, ‘AI 바우처 지원사업’ 참여…AI 보안 솔루션 공급

    - 중소·중견기업·소상공인 대상 AI 기반 보안 플랫폼 지원 안랩과 안랩클라우드메이트가 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 추진하는 ‘2026년 AI 바우처 지원사업’에서 기업 대상 AI 보안 솔루션 공급에 나선다. 중소·중견기업과 소상공인의 보...
    Date2026.03.16 Bynewsit Views19
    Read More
  18. 티머니, 서울 시내버스 ‘태그리스 결제’ 프로모션…승차 때마다 500원 적립

    - BLE 기반 자동 결제 서비스 체험 확대 티머니가 서울 시내버스 태그리스 결제 시범 서비스 활성화를 위해 승차 때마다 500원을 적립하는 프로모션을 진행한다. 시민 체험 기회를 확대하고 서비스 인지도를 높이기 위한 이벤트다. 서울 시내버스 태그리스 결...
    Date2026.03.16 Bynewsit Views20
    Read More
  19. 마우저, 자율주행 설계 리소스 센터 확대…AV 시스템 아키텍처 정보 제공

    - 센싱·차량 네트워크·V2X 기반 자율주행 설계 기술 자료 제공 마우저가 자율주행 시스템 설계와 실제 도로 환경 배포를 지원하기 위한 온라인 리소스 센터를 확장했다. 센싱 기술과 차량 내 네트워킹, 차량-대-모든 것(V2X) 통신 구조 등 자율주행 시스템 아...
    Date2026.03.16 Bynewsit Views31
    Read More
  20. 노르딕 세미컨덕터, 블루투스 LE SoC ‘nRF54LS05A·B’ 공개…저전력 IoT 기기 겨냥

    - 센서·태그·비콘 등 저전력 블루투스 제품 개발 위한 nRF54L 시리즈 확장 노르딕 세미컨덕터가 엔트리급 블루투스 LE SoC ‘nRF54LS05A’와 ‘nRF54LS05B’를 공개하며 nRF54L 시리즈 제품군을 확장했다. 가격 경쟁력이 중요한 블루투스 LE 제품을 겨냥한 칩으로 ...
    Date2026.03.16 Bynewsit Views18
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 281 Next
/ 281
CLOSE