- GPU·메모리 자원 오케스트레이션으로 추론 성능·비용 구조 개선

 

[GTC 2026] 엔비디아, 다이나모 공개…AI 팩토리용 추론 운영체제 제시.jpg

엔비디아가 GTC 2026에서 대규모 생성형·에이전틱 추론을 위한 오픈소스 소프트웨어 다이나모 1.0’을 공개하며 AI 팩토리 운영 구조를 제시했다. 분산된 GPU와 메모리 자원을 통합 관리해 추론 성능과 비용 효율을 동시에 개선하는 데 초점을 맞췄다.

 

AI 추론을 위한 분산 운영 구조 설계

에이전틱 AI 확산으로 데이터센터 내 추론 요청은 규모와 유형이 동시에 증가하고 있다. 다이나모는 이러한 환경에서 GPU와 메모리 자원을 유기적으로 조율하는 분산 운영 계층으로 설계됐다. 클러스터 전반의 리소스를 통합 관리해 복잡한 추론 워크로드를 안정적으로 처리할 수 있다.

 

GPU 자원 활용 최적화로 성능 최대 7배 향상

다이나모는 추론 작업을 여러 GPU에 분산 배치하고 메모리 사용을 효율적으로 관리한다. 필요에 따라 데이터를 저비용 스토리지로 이동시키고, 요청 특성에 맞춰 적절한 GPU로 라우팅하는 구조를 적용했다. 엔비디아 블랙웰 기준 최대 7배 수준의 추론 성능 향상을 확인했다.

 

오픈소스 프레임워크와 네이티브 통합 확대

텐서RT-LLM 최적화 기능은 랭체인, LMCache, SGLang, vLLM 등 주요 프레임워크에 통합됐다. 메모리 관리와 데이터 이동 기능은 모듈 형태로 제공돼 다양한 환경에서 확장 적용이 가능하다. 개발자는 기존 오픈소스 생태계를 유지하면서 성능 최적화를 적용할 수 있다.

 

클라우드부터 엔터프라이즈까지 채택 확대

AWS, 마이크로소프트 애저, 구글 클라우드, OCI 등 주요 클라우드 사업자가 다이나모 기반 추론 플랫폼을 도입하고 있다. 코어위브, 네비우스, 투게더 AI 등 인프라 기업과 퍼플렉시티, 커서 같은 AI 기업도 해당 구조를 적용해 서비스 성능을 개선하고 있다. 대규모 프로덕션 환경에서 추론 운영 방식이 빠르게 표준화되는 상황이다.

 

엔비디아 젠슨 황 CEO추론은 모든 AI 애플리케이션을 구동하는 핵심 요소라며 다이나모는 AI 팩토리를 위한 운영 계층으로 GPU 자원을 효율적으로 활용할 수 있도록 설계됐다고 설명했다.

 

코어위브 첸 골드버그 수석 부사장은 대규모 AI 배포 환경에서는 안정성과 오케스트레이션 능력이 핵심이라며 다이나모를 통해 복잡한 워크로드를 안정적으로 운영할 수 있는 기반을 확보했다고 언급했다.

 

네비우스 다닐라 슈탄 CTO“AI 추론 성능은 하드웨어뿐 아니라 이를 제어하는 소프트웨어에 의해 결정된다엔비디아 소프트웨어 스택은 예측 가능한 성능과 빠른 배포를 가능하게 한다고 덧붙였다.

 

#엔비디아 #GTC2026 #다이나모 #AI추론 #TensorRT #AgenticAI #AI인프라 #GPU클러스터

 

 
?

  1. 티머니, 기후동행카드 10% T마일리지 페이백 프로모션 운영

    - 신규 이용 고객 대상 충전 금액 10% 환급, 4월 30일까지 적용 티머니가 기후동행카드 신규 이용 고객 대상 충전 금액의 10%를 T마일리지로 환급하는 프로모션을 4월 30일까지 운영하며 대중교통 이용 비용 부담 완화를 지원한다. 이번 이벤트는 기간 내 기후...
    Date2026.04.02 Bynewsit Views60
    Read More
  2. MSI, RTX50 DLSS4 기반 ‘바이오하자드 레퀴엠’ 번들 프로모션 연장

    - RTX50 구매 고객 대상 게임 코드 제공, 4월 13일까지 신청 가능 엠에스아이코리아가 RTX50 그래픽카드 구매 고객 대상 ‘바이오하자드 레퀴엠’ 게임 번들 프로모션을 4월 13일까지 연장하며 DLSS4 기반 고사양 게임 환경 지원 범위를 확대했다. 이번 프로모션...
    Date2026.04.02 Bynewsit Views48
    Read More
  3. 데이터브릭스, 레이크하우스 기반 엔터프라이즈 AI 확산… 국내 비즈니스 100% 성장

    - AI Days Seoul 개최… 3년간 데이터·AI 전문 인력 1만 명 양성 추진 데이터브릭스가 오프라인 컨퍼런스 ‘AI Days Seoul’을 개최하고 지난 회계연도 국내 비즈니스가 전년 대비 100% 이상 성장했다고 밝혔다. 기업들의 생성형 AI 도입 확대와 데이터 통합 수요...
    Date2026.04.01 Bynewsit Views40
    Read More
  4. 엑시스, 통합 안전·운영 플랫폼 전략 공개… AI 엣지 기반 비즈니스 인사이트 확대

    - Unite & Ignite·LEAP 2030 통해 영상 데이터 활용 범위 확장 엑시스가 AI 영상 분석과 네트워크 오디오, 접근제어 기술을 결합한 통합 플랫폼 전략을 발표하고 영상 데이터를 운영 효율과 비즈니스 인사이트 영역으로 확장한다고 밝혔다. 파트너 중심 성장 ...
    Date2026.04.01 Bynewsit Views65
    Read More
  5. 티맥스소프트, 제우스 11 국내 최초 자카르타 EE 11 인증 획득

    - 자바 21 기반 차세대 WAS… AI·클라우드 환경 대응 플랫폼 강화 티맥스소프트가 애플리케이션 서버 ‘제우스 11(JEUS 11)’으로 국내 최초 자카르타 EE 11 인증을 획득했다. 자바 21 기반 기술을 적용해 AI·클라우드 환경에서 요구되는 엔터프라이즈 애플리케이...
    Date2026.04.01 Bynewsit Views50
    Read More
  6. 온세미, SiC 하이브리드 전력 모듈로 시능전기 태양광·ESS 인버터 효율 향상

    - EliteSiC 기반 PIM 적용… 전력 밀도 32% 개선·효율 최대 0.1% 향상 온세미가 실리콘 카바이드(SiC) 기반 하이브리드 전력 통합 모듈(PIM)을 시능전기의 차세대 430kW 액체 냉각 에너지 저장 시스템(ESS)과 320kW 유틸리티급 태양광 인버터에 공급한다. 재생...
    Date2026.04.01 Bynewsit Views61
    Read More
  7. 레노버, 데이비드 베컴과 글로벌 파트너십 체결… AI 스포츠 혁신 협력 확대

    - 2026 FIFA 월드컵 기술 파트너십 연계… 경기력·팬 경험 고도화 추진 레노버가 글로벌 스포츠 영향력을 보유한 데이비드 베컴(David Beckham)과 파트너십을 체결하고 AI 기반 경기 데이터 분석 및 디지털 팬 경험 기술 협력을 확대한다. 2026 FIFA 월드컵 공...
    Date2026.04.01 Bynewsit Views43
    Read More
  8. 카스퍼스키, 2025년 글로벌 보안 테스트 최다 1위 기록… TOP3 성과로 기술 경쟁력 입증

    - 기업·개인 보안 전 영역에서 90회 1위 달성… 2013년 이후 누적 861회 1위 기록 카스퍼스키가 2025년 독립 보안 평가에서 총 100건의 테스트에 참여해 90회 1위를 기록하면서 글로벌 보안 경쟁력을 재확인했다. AV-Comparatives, AV-TEST, SE Labs 등 주요 기...
    Date2026.04.01 Bynewsit Views55
    Read More
  9. 데이터이쿠, APJ 총괄에 앤드류 보이드 선임…기업 AI 성과 확산 전략 강화

    - 파일럿 단계 넘어 전사 운영 체계 확장 지원…거버넌스 기반 AI 도입 가속 데이터이쿠가 아시아태평양·일본(APJ) 지역 수석 부사장 겸 총괄책임자로 앤드류 보이드를 선임하며 기업 AI 도입을 파일럿 단계에서 실제 비즈니스 성과로 확장하는 운영 전략을 강...
    Date2026.03.31 Bynewsit Views49
    Read More
  10. ST, 중국서 STM32 양산… 40nm eNVM 기반 이중 공급망 구축

    - 화홍 협력 생산 체계로 글로벌 동일 설계 MCU 현지 공급 확대 ST가 중국 제조 시설에서 STM32 마이크로컨트롤러 양산을 시작하며 40nm eNVM 공정 기반 이중 공급망 체계를 확장했다. 글로벌 동일 설계를 적용해 생산 거점이 달라도 동일한 품질 기준을 유지...
    Date2026.03.31 Bynewsit Views70
    Read More
  11. F5, ADSP에 통합 가시성·Agentic AI·양자내성암호 적용 확대

    - Insight·BIG-IP·NGINX·Distributed Cloud 연계로 AI 워크로드 대응 구조 강화 F5가 애플리케이션 전송 및 보안 플랫폼(ADSP)에 통합 가시성, 에이전틱 AI 지원, 양자내성암호(PQC) 기능을 추가하며 분산 애플리케이션 환경 대응 구조를 확장했다. 멀티클라우...
    Date2026.03.31 Bynewsit Views47
    Read More
  12. 스틸시리즈, 붉은사막 스팀 코드 번들…아크티스·에이펙스 구매 프로모션

    - 네이버 공식몰서 4월 30일까지 진행 스틸시리즈가 오픈월드 액션 어드벤처 게임 ‘붉은사막’ 스팀 코드를 제공하는 번들 프로모션을 4월 30일까지 진행하며 아크티스 노바 시리즈와 에이펙스 프로 키보드 등 주요 게이밍 기어 구매 고객에게 코드를 증정한다....
    Date2026.03.31 Bynewsit Views45
    Read More
  13. 샥즈, 오픈 이어 노이즈 리덕션 적용 ‘오픈핏 프로’ 출시

    - 트리플 마이크·귀 적응형 알고리즘 결합… 돌비 애트모스·최대 50시간 재생 지원 샥즈가 오픈 이어 노이즈 리덕션 기술을 적용한 프리미엄 오픈형 이어폰 ‘오픈핏 프로’를 국내에 출시하며 개방형 착용 상태에서도 주변 소음을 실시간으로 분석해 청취 집중도...
    Date2026.03.31 Bynewsit Views68
    Read More
  14. 넷앱·컴볼트, 사이버 복원력 협력…ONTAP·위협 인지 복구 워크플로우 통합

    - 하이브리드 환경 전반에서 데이터 보호와 자동 복구 흐름 연계 넷앱과 컴볼트가 전략적 파트너십을 체결하고 ONTAP 기반 데이터 관리 기술과 위협 인지 백업·복구 워크플로우를 결합한 하이브리드 환경 사이버 복원력을 통합한다. 양사는 넷앱 스토리지 계층...
    Date2026.03.30 Bynewsit Views50
    Read More
  15. 티오리-아톤, AI 보안 협력 체결… RSAC 2026서 LLM 기반 SAST 글로벌 확대

    - Xint Code 중심 글로벌 판로 확대 추진, 코드 맥락 분석 기반 취약점 탐지 구조 적용 티오리와 아톤이 RSAC 2026 현장에서 전략적 업무협약(MOU)을 체결하고 LLM 기반 정적 애플리케이션 보안 점검(SAST) 솔루션 ‘Xint Code’의 글로벌 시장 확대를 추진한다....
    Date2026.03.30 Bynewsit Views43
    Read More
  16. HPE, 첫 사이버 위협 보고서 발표… 자동화 공격 인프라·AI 악용 범죄 확산 확인

    - 1,186건 실제 공격 분석, 조직형 범죄 운영 구조 변화 확인 HPE가 첫 사이버 위협 보고서 ‘인 더 와일드(In the Wild)’를 발표하고 자동화 기반 공격 인프라 확산과 생성형 AI 악용 범죄 증가 흐름을 공개했다. 2025년 한 해 동안 전 세계에서 발생한 1,186...
    Date2026.03.30 Bynewsit Views59
    Read More
  17. 로지텍, 포켓몬 ‘메타몽’ 에디션 키보드·마우스 굿즈 출시… 한정 프로모션 진행

    - 네이버 브랜드 스토어 통해 굿즈 세트 증정, 키캡·파우치·데스크매트 구성 로지텍 코리아가 포켓몬스터 캐릭터 ‘메타몽’ 디자인을 적용한 ‘서툴러도 변신! 메타몽 에디션’ 키보드·마우스 굿즈 세트를 출시하고 네이버 브랜드 스토어에서 한정 기간 프로모션...
    Date2026.03.30 Bynewsit Views71
    Read More
  18. 카스퍼스키, AV-Comparatives OT 보안 인증 획득… KICS 실행 기반 오프라인 공격 차단 검증

    - AV-Comparatives 평가 통과, 오탐 없이 침해 이후 공격 시나리오 대응 성능 확인 카스퍼스키가 산업용 보안 플랫폼 KICS(Kaspersky Industrial Cyber Security)가 AV-Comparatives 운영기술(OT) 보안 인증을 획득하고 오프라인 환경에서 실행되는 침해 이후 ...
    Date2026.03.30 Bynewsit Views51
    Read More
  19. 벡터코리아, AI 요구사항 기반 테스트 자동화 ‘VectorCAST 2026’ 출시… 단위 테스트 생성·추적성 통합

    - Reqs2x 적용, 요구사항 기반 단위 테스트 자동 생성과 인증 대응 프로세스 단순화 벡터코리아가 AI 요구사항 기반 테스트 생성 기능을 적용한 임베디드 소프트웨어 테스트 자동화 플랫폼 ‘VectorCAST 2026’을 출시하고, 요구사항 기반 단위 테스트 생성과 추...
    Date2026.03.30 Bynewsit Views48
    Read More
  20. SAP코리아, 아이아이컴바인드 글로벌 HR 통합 시스템 구축… SAP 석세스팩터스 기반 인사 데이터 일원화

    - LG CNS 협력 구축, 글로벌 조직 운영 위한 HR 데이터 표준 체계 적용 SAP코리아가 아이아이컴바인드에 SAP 석세스팩터스 기반 글로벌 인사 관리 시스템을 구축했다. LG CNS와 협력해 국가별로 분산된 HR 데이터를 하나의 체계로 통합하고 글로벌 조직 운영 ...
    Date2026.03.30 Bynewsit Views56
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 288 Next
/ 288
CLOSE