- GPU·메모리 자원 오케스트레이션으로 추론 성능·비용 구조 개선

 

[GTC 2026] 엔비디아, 다이나모 공개…AI 팩토리용 추론 운영체제 제시.jpg

엔비디아가 GTC 2026에서 대규모 생성형·에이전틱 추론을 위한 오픈소스 소프트웨어 다이나모 1.0’을 공개하며 AI 팩토리 운영 구조를 제시했다. 분산된 GPU와 메모리 자원을 통합 관리해 추론 성능과 비용 효율을 동시에 개선하는 데 초점을 맞췄다.

 

AI 추론을 위한 분산 운영 구조 설계

에이전틱 AI 확산으로 데이터센터 내 추론 요청은 규모와 유형이 동시에 증가하고 있다. 다이나모는 이러한 환경에서 GPU와 메모리 자원을 유기적으로 조율하는 분산 운영 계층으로 설계됐다. 클러스터 전반의 리소스를 통합 관리해 복잡한 추론 워크로드를 안정적으로 처리할 수 있다.

 

GPU 자원 활용 최적화로 성능 최대 7배 향상

다이나모는 추론 작업을 여러 GPU에 분산 배치하고 메모리 사용을 효율적으로 관리한다. 필요에 따라 데이터를 저비용 스토리지로 이동시키고, 요청 특성에 맞춰 적절한 GPU로 라우팅하는 구조를 적용했다. 엔비디아 블랙웰 기준 최대 7배 수준의 추론 성능 향상을 확인했다.

 

오픈소스 프레임워크와 네이티브 통합 확대

텐서RT-LLM 최적화 기능은 랭체인, LMCache, SGLang, vLLM 등 주요 프레임워크에 통합됐다. 메모리 관리와 데이터 이동 기능은 모듈 형태로 제공돼 다양한 환경에서 확장 적용이 가능하다. 개발자는 기존 오픈소스 생태계를 유지하면서 성능 최적화를 적용할 수 있다.

 

클라우드부터 엔터프라이즈까지 채택 확대

AWS, 마이크로소프트 애저, 구글 클라우드, OCI 등 주요 클라우드 사업자가 다이나모 기반 추론 플랫폼을 도입하고 있다. 코어위브, 네비우스, 투게더 AI 등 인프라 기업과 퍼플렉시티, 커서 같은 AI 기업도 해당 구조를 적용해 서비스 성능을 개선하고 있다. 대규모 프로덕션 환경에서 추론 운영 방식이 빠르게 표준화되는 상황이다.

 

엔비디아 젠슨 황 CEO추론은 모든 AI 애플리케이션을 구동하는 핵심 요소라며 다이나모는 AI 팩토리를 위한 운영 계층으로 GPU 자원을 효율적으로 활용할 수 있도록 설계됐다고 설명했다.

 

코어위브 첸 골드버그 수석 부사장은 대규모 AI 배포 환경에서는 안정성과 오케스트레이션 능력이 핵심이라며 다이나모를 통해 복잡한 워크로드를 안정적으로 운영할 수 있는 기반을 확보했다고 언급했다.

 

네비우스 다닐라 슈탄 CTO“AI 추론 성능은 하드웨어뿐 아니라 이를 제어하는 소프트웨어에 의해 결정된다엔비디아 소프트웨어 스택은 예측 가능한 성능과 빠른 배포를 가능하게 한다고 덧붙였다.

 

#엔비디아 #GTC2026 #다이나모 #AI추론 #TensorRT #AgenticAI #AI인프라 #GPU클러스터

 

 
?

  1. 레노버, 데이비드 베컴과 글로벌 파트너십 체결… AI 스포츠 혁신 협력 확대

    - 2026 FIFA 월드컵 기술 파트너십 연계… 경기력·팬 경험 고도화 추진 레노버가 글로벌 스포츠 영향력을 보유한 데이비드 베컴(David Beckham)과 파트너십을 체결하고 AI 기반 경기 데이터 분석 및 디지털 팬 경험 기술 협력을 확대한다. 2026 FIFA 월드컵 공...
    Date2026.04.01 Bynewsit Views34
    Read More
  2. 카스퍼스키, 2025년 글로벌 보안 테스트 최다 1위 기록… TOP3 성과로 기술 경쟁력 입증

    - 기업·개인 보안 전 영역에서 90회 1위 달성… 2013년 이후 누적 861회 1위 기록 카스퍼스키가 2025년 독립 보안 평가에서 총 100건의 테스트에 참여해 90회 1위를 기록하면서 글로벌 보안 경쟁력을 재확인했다. AV-Comparatives, AV-TEST, SE Labs 등 주요 기...
    Date2026.04.01 Bynewsit Views37
    Read More
  3. 데이터이쿠, APJ 총괄에 앤드류 보이드 선임…기업 AI 성과 확산 전략 강화

    - 파일럿 단계 넘어 전사 운영 체계 확장 지원…거버넌스 기반 AI 도입 가속 데이터이쿠가 아시아태평양·일본(APJ) 지역 수석 부사장 겸 총괄책임자로 앤드류 보이드를 선임하며 기업 AI 도입을 파일럿 단계에서 실제 비즈니스 성과로 확장하는 운영 전략을 강...
    Date2026.03.31 Bynewsit Views32
    Read More
  4. ST, 중국서 STM32 양산… 40nm eNVM 기반 이중 공급망 구축

    - 화홍 협력 생산 체계로 글로벌 동일 설계 MCU 현지 공급 확대 ST가 중국 제조 시설에서 STM32 마이크로컨트롤러 양산을 시작하며 40nm eNVM 공정 기반 이중 공급망 체계를 확장했다. 글로벌 동일 설계를 적용해 생산 거점이 달라도 동일한 품질 기준을 유지...
    Date2026.03.31 Bynewsit Views39
    Read More
  5. F5, ADSP에 통합 가시성·Agentic AI·양자내성암호 적용 확대

    - Insight·BIG-IP·NGINX·Distributed Cloud 연계로 AI 워크로드 대응 구조 강화 F5가 애플리케이션 전송 및 보안 플랫폼(ADSP)에 통합 가시성, 에이전틱 AI 지원, 양자내성암호(PQC) 기능을 추가하며 분산 애플리케이션 환경 대응 구조를 확장했다. 멀티클라우...
    Date2026.03.31 Bynewsit Views37
    Read More
  6. 스틸시리즈, 붉은사막 스팀 코드 번들…아크티스·에이펙스 구매 프로모션

    - 네이버 공식몰서 4월 30일까지 진행 스틸시리즈가 오픈월드 액션 어드벤처 게임 ‘붉은사막’ 스팀 코드를 제공하는 번들 프로모션을 4월 30일까지 진행하며 아크티스 노바 시리즈와 에이펙스 프로 키보드 등 주요 게이밍 기어 구매 고객에게 코드를 증정한다....
    Date2026.03.31 Bynewsit Views31
    Read More
  7. 샥즈, 오픈 이어 노이즈 리덕션 적용 ‘오픈핏 프로’ 출시

    - 트리플 마이크·귀 적응형 알고리즘 결합… 돌비 애트모스·최대 50시간 재생 지원 샥즈가 오픈 이어 노이즈 리덕션 기술을 적용한 프리미엄 오픈형 이어폰 ‘오픈핏 프로’를 국내에 출시하며 개방형 착용 상태에서도 주변 소음을 실시간으로 분석해 청취 집중도...
    Date2026.03.31 Bynewsit Views49
    Read More
  8. 넷앱·컴볼트, 사이버 복원력 협력…ONTAP·위협 인지 복구 워크플로우 통합

    - 하이브리드 환경 전반에서 데이터 보호와 자동 복구 흐름 연계 넷앱과 컴볼트가 전략적 파트너십을 체결하고 ONTAP 기반 데이터 관리 기술과 위협 인지 백업·복구 워크플로우를 결합한 하이브리드 환경 사이버 복원력을 통합한다. 양사는 넷앱 스토리지 계층...
    Date2026.03.30 Bynewsit Views37
    Read More
  9. 티오리-아톤, AI 보안 협력 체결… RSAC 2026서 LLM 기반 SAST 글로벌 확대

    - Xint Code 중심 글로벌 판로 확대 추진, 코드 맥락 분석 기반 취약점 탐지 구조 적용 티오리와 아톤이 RSAC 2026 현장에서 전략적 업무협약(MOU)을 체결하고 LLM 기반 정적 애플리케이션 보안 점검(SAST) 솔루션 ‘Xint Code’의 글로벌 시장 확대를 추진한다....
    Date2026.03.30 Bynewsit Views37
    Read More
  10. HPE, 첫 사이버 위협 보고서 발표… 자동화 공격 인프라·AI 악용 범죄 확산 확인

    - 1,186건 실제 공격 분석, 조직형 범죄 운영 구조 변화 확인 HPE가 첫 사이버 위협 보고서 ‘인 더 와일드(In the Wild)’를 발표하고 자동화 기반 공격 인프라 확산과 생성형 AI 악용 범죄 증가 흐름을 공개했다. 2025년 한 해 동안 전 세계에서 발생한 1,186...
    Date2026.03.30 Bynewsit Views52
    Read More
  11. 로지텍, 포켓몬 ‘메타몽’ 에디션 키보드·마우스 굿즈 출시… 한정 프로모션 진행

    - 네이버 브랜드 스토어 통해 굿즈 세트 증정, 키캡·파우치·데스크매트 구성 로지텍 코리아가 포켓몬스터 캐릭터 ‘메타몽’ 디자인을 적용한 ‘서툴러도 변신! 메타몽 에디션’ 키보드·마우스 굿즈 세트를 출시하고 네이버 브랜드 스토어에서 한정 기간 프로모션...
    Date2026.03.30 Bynewsit Views53
    Read More
  12. 카스퍼스키, AV-Comparatives OT 보안 인증 획득… KICS 실행 기반 오프라인 공격 차단 검증

    - AV-Comparatives 평가 통과, 오탐 없이 침해 이후 공격 시나리오 대응 성능 확인 카스퍼스키가 산업용 보안 플랫폼 KICS(Kaspersky Industrial Cyber Security)가 AV-Comparatives 운영기술(OT) 보안 인증을 획득하고 오프라인 환경에서 실행되는 침해 이후 ...
    Date2026.03.30 Bynewsit Views47
    Read More
  13. 벡터코리아, AI 요구사항 기반 테스트 자동화 ‘VectorCAST 2026’ 출시… 단위 테스트 생성·추적성 통합

    - Reqs2x 적용, 요구사항 기반 단위 테스트 자동 생성과 인증 대응 프로세스 단순화 벡터코리아가 AI 요구사항 기반 테스트 생성 기능을 적용한 임베디드 소프트웨어 테스트 자동화 플랫폼 ‘VectorCAST 2026’을 출시하고, 요구사항 기반 단위 테스트 생성과 추...
    Date2026.03.30 Bynewsit Views38
    Read More
  14. SAP코리아, 아이아이컴바인드 글로벌 HR 통합 시스템 구축… SAP 석세스팩터스 기반 인사 데이터 일원화

    - LG CNS 협력 구축, 글로벌 조직 운영 위한 HR 데이터 표준 체계 적용 SAP코리아가 아이아이컴바인드에 SAP 석세스팩터스 기반 글로벌 인사 관리 시스템을 구축했다. LG CNS와 협력해 국가별로 분산된 HR 데이터를 하나의 체계로 통합하고 글로벌 조직 운영 ...
    Date2026.03.30 Bynewsit Views43
    Read More
  15. 델, 온디바이스 AI 및 보안 기능 통합 기업용 PC ‘델 프로’ 공개

    - AI 연산·엔터프라이즈 보안·원격 관리 기능 결합한 클라이언트 포트폴리오 제시 델이 온디바이스 AI 처리 성능과 보안 기능을 결합한 기업용 PC 포트폴리오 ‘델 프로(Dell Pro)’ 신제품을 공개하고 브라우저 기반 협업 환경 변화에 맞춰 AI 연산, 엔터프라이...
    Date2026.03.30 Bynewsit Views38
    Read More
  16. 팔로알토네트웍스, ‘프리즈마 브라우저 for Business’ 출시…중소기업 업무 환경 보호 범위 확장

    - AI 통제 결합 보안 브라우저, 브라우저 기반 업무 접근·데이터 보호 통합 관리 지원 팔로알토네트웍스가 보안 정책과 AI 데이터 통제를 결합한 업무용 브라우저 ‘프리즈마 브라우저 for Business’를 출시하며 브라우저 환경에서 애플리케이션 접근과 데이터 ...
    Date2026.03.30 Bynewsit Views45
    Read More
  17. 티피링크 타포, 배터리 기반 실외 보안 카메라 ‘Tapo C400’ 출시

    - 5200mAh 배터리·AI 감지·컬러 나이트 비전 기반 실외 보안 환경 구성 티피링크 스마트홈 브랜드 타포가 배터리 기반 실외 보안 카메라 ‘Tapo C400’을 출시하고 전원선 없이 설치 가능한 무선 CCTV 환경 구성을 지원한다. 배터리 기반 무선 설치 구조 Tapo C4...
    Date2026.03.27 Bynewsit Views33
    Read More
  18. [GTC 2026] 엔비디아, ‘코리아 AI 엑스퍼트 데이’ 개최…에이전틱·피지컬 AI 산업 적용 공유

    - GTC 발표 핵심 기술 방향 소개…국내 기업·개발자 300여 명 참석 엔비디아가 GTC 2026에서 국내 AI 산업 관계자를 대상으로 ‘코리아 AI 엑스퍼트 데이(Korea AI Expert Day)’를 개최하고 에이전틱 AI와 피지컬 AI 중심 기술 방향과 산업 적용 사례를 공유했다...
    Date2026.03.27 Bynewsit Views35
    Read More
  19. NXP, 옴록스 스타터 키트 공개…UWB 기반 RTLS 실내 위치 추적 지원

    - 트리멘션 SR048 기반 앵커·태그·미들웨어 통합 구성으로 산업용 위치 데이터 활용 지원 NXP가 싱크로닉IT(SynchronicIT), 플로케이트(Flowcate)와 협력해 개발한 ‘옴록스 스타터 키트(omlox Starter Kit)’를 공개하며 초광대역(UWB) 기반 실시간 위치 추적 ...
    Date2026.03.27 Bynewsit Views58
    Read More
  20. 스틸시리즈, ‘아크티스 노바 엘리트’ 롤링스톤 오디오 어워즈 수상

    - 액티브 노이즈 캔슬링·LC3+ 코덱·듀얼 배터리 기반 최대 60시간 사용 지원 스틸시리즈가 ‘롤링스톤 2026 오디오 어워즈(Rolling Stone Audio Awards 2026)’에서 무선 게이밍 헤드셋 ‘아크티스 노바 엘리트(Arctis Nova Elite)’가 베스트 게이밍 헤드폰 부문...
    Date2026.03.27 Bynewsit Views46
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 286 Next
/ 286
CLOSE