- 윈도우 ML 기반 ‘RTX용 엔비디아 텐서RT’AI 성능 대폭 강화

- 새로운 엔비디아 NIM 마이크로서비스와 AI 블루프린트로 개발자 워크플로우 혁신

- 프로젝트 G-어시스트 통해 코딩 없이도 AI 기능 개발 지원

 

엔비디아, 마이크로소프트와 함께 RTX AI PC 생태계 확장.jpg

 

엔비디아가 마이크로소프트(Microsoft)와 협력해 RTX AI PC를 위한 다양한 기능과 개발자 도구를 통해 AI 생태계 전반을 확장하고 있다고 밝혔다. RTX AI PC용으로 새롭게 설계된 엔비디아 텐서RT(NVIDIA TensorRT)는 윈도우 ML(Windows ML)을 통해 제공되며, 고성능 AI 실행 환경을 지원한다.

 

생성형 AI는 디지털 휴먼부터 글쓰기 도우미, 지능형 에이전트, 크리에이티브 도구에 이르기까지 PC 소프트웨어를 획기적인 경험으로 변화시키고 있으며, 엔비디아 RTX AI PC는 생성형 AI 실험을 더 쉽게 시작하고, 윈도우 11에서 더 뛰어난 성능을 발휘할 수 있도록 지원하는 기술로 이러한 변화를 주도하고 있다.

 

엔비디아 텐서RT가 RTX AI PC를 위해 새롭게 설계됐다. 업계 최고 수준의 텐서RT 성능과 함께 적시 온디바이스 엔진 구축과 기존 대비 8배 더 작은 패키지 크기를 통해 1억 대 이상의 RTX AI PC에 AI를 원활하게 배포할 수 있도록 돕는다.

 

마이크로소프트 빌드(Microsoft Bulid)에서 발표된 RTX용 텐서RT는 앱 개발자에게 광범위한 하드웨어 호환성과 최첨단 성능을 모두 제공하는 새로운 추론 스택인 윈도우 ML에서 기본적으로 지원된다.

 

엔비디아는 AI 기능을 통합하려는 개발자를 위해 엔비디아 DLSS부터 엔비디아 RTX 비디오(RTX Video)와 같은 멀티미디어 향상 기능까지 다양한 소프트웨어 개발 키트(software development kits, SDKs) 옵션을 제공한다. 이번 달에는 오토데스크(Autodesk), 빌리빌리(Bilibili), 카오스(Chaos), LM 스튜디오(LM Studio), 토파즈 랩스(Topaz Labs)의 인기 소프트웨어 애플리케이션에서 RTX AI 기능과 가속화를 위한 업데이트를 출시할 예정이다.

 

AI 애호가와 개발자는 엔비디아 NIM을 사용해 AI를 쉽게 시작할 수 있다. 이는 애니띵LLM(AnythingLLM), 마이크로소프트 VS 코드(VS Code), 컴피UI(ComfyUI)와 같은 인기 앱에서 실행 가능한 사전 패키징, 최적화된 AI 모델이다. 이번 주에 출시되는 플럭스.1-쉬넬(FLUX.1-schnell) 이미지 생성 모델은 NIM 마이크로서비스로 제공되며, 인기 있는 플럭스.1-데브(dev) NIM 마이크로서비스는 더 많은 RTX GPU를 지원하도록 업데이트됐다.

 

엔비디아 앱 내 RTX PC AI 어시스턴트인 프로젝트 G-어시스트(Project G-Assist)는 코딩 없이 간단한 AI 개발을 시작하고자 하는 사용자들을 지원한다. 이를 통해 자연어 기반 AI로 PC 앱과 주변기기를 제어하는 플러그인을 직접 구축할 수 있다. 아울러 구글 제미나이(Google Gemini) 웹 검색, 스포티파이(Spotify), 트위치(Twitch), IFTTT, 시그널RGB(SignalRGB)등 새로운 커뮤니티 플러그인도 현재 제공되고 있다.

 

RTX용 텐서RT로 가속화된 AI 추론

오늘날의 AI PC 소프트웨어 스택을 사용하려면 성능을 타협하거나 특정 하드웨어에 대한 사용자 지정 최적화에 투자해야 한다.

 

윈도우 ML은 이러한 문제를 해결하기 위해 개발됐다. 윈도우 ML은 ONNX 런타임(ONNX Runtime) 기반으로 구동되며, 각 하드웨어 제조업체에서 제공하고 유지 관리하는 최적화된 AI 실행 레이어에 원활하게 연결된다.

 

지포스(GeForce) RTX GPU의 경우, 윈도우 ML은 높은 성능과 빠른 배포를 위해 RTX용 텐서RT 추론 라이브러리를 자동으로 사용한다. 다이렉트ML(DirectML)과 비교했을 때, 텐서RT는 PC에서 AI 워크로드를 처리하는 데 50% 이상 빠른 성능을 제공한다.

텐서RT는 PC에서 AI 워크로드에 다이렉트ML보다 50_ 이상 빠른 성능을 제공한다. 성능은 지포스 RTX 5090에서 측정됐다.jpg

 

텐서RT는 PC에서 AI 워크로드에 다이렉트ML보다 50% 이상 빠른 성능을 제공한다. 성능은 지포스 RTX 5090에서 측정됐다.

 

또한 윈도우 ML은 개발자의 QoL(Quality of Life) 측면에서도 다양한 이점을 제공한다. 각 AI 기능을 실행하는 데 가장 적합한 하드웨어(GPU, CPU, NPU)를 자동으로 선택하고, 해당 하드웨어에 맞는 실행 공급자를 다운로드해 해당 파일을 앱에서 패키징할 필요가 없게 한다. 이로써 최신 텐서RT 성능 최적화가 준비되는 즉시 사용자에게 제공될 수 있다.

텐서RT 성능 최적화는 준비되는 즉시 사용자에게 제공된다.jpg

 

                                                                                 텐서RT 성능 최적화는 준비되는 즉시 사용자에게 제공된다.

 

텐서RT는 원래 데이터센터용으로 구축된 라이브러리였지만, RTX AI PC를 위해 새롭게 설계됐다. RTX용 텐서RT는 텐서RT 엔진을 사전 생성해 앱과 함께 패키징하는 대신, 적시에 온디바이스 엔진을 구축해 사용자의 특정 RTX GPU에 최적화된 AI 모델 실행을 수 초 내에 처리할 수 있다. 또한 라이브러리 패키징 방식이 간소화돼 파일 크기가 기존 대비 8배까지 크게 줄었다.

 

RTX용 텐서RT는 현재 윈도우 ML 프리뷰를 통해 제공되고 있으며, 6월부터는 엔비디아 개발자(NVIDIA Developer) 포털에서 독립형 SDK로 제공될 예정이다.

 

#엔비디아#RTX#텐서RT#AIPC#

 

?

  1. 위로보틱스, 보행보조 웨어러블 로봇 ‘윔(WIM)’ 효과 입증한 국제 논문 발표…”웨어러블 로봇 착용 시 낙상예방 운동 효과 입증”

    - 네이처 자매지 ‘사이언티픽 리포트’ 게재, 1.6kg 초경량 웨어러블 로봇 윔(WIM), 고령자 보행 능력 및 젊은 층 보행 에너지 효율 개선 효과 입증 - 고관절 역 위상(anti-phase) 토크 대칭성 활용한 단일 구동 매커니즘 기술력 인정 위로보틱스(WIRobotics)가...
    Date2025.05.26 Bynewsit Views335
    Read More
  2. 서비스나우, AI 기반 CRM 플랫폼 공개…판매부터 주문 처리, 서비스까지 전 과정 아우르는 통합 플랫폼

    - AI 기반 CRM 플랫폼이 부서 간 업무 조율해 고객 생애주기 전반에 걸쳐 빠르고 원활한 경험 제공… 생산성 높이고 성장 이끌어 - CRM용 AI 에이전트, 자율적 작업 완료로 퓨어스토리지와 같은 고객 대상 진정한 셀프서비스 지원 서비스나우(ServiceNow)가 기...
    Date2025.05.26 Bynewsit Views509
    Read More
  3. 엔비디아, ‘스타게이트 UAE’에 그레이스 블랙웰 GB300 시스템 공급

    - G42, 오픈AI, 오라클, 소프트뱅크그룹, 시스코와 손잡고 초대형 AI 인프라 구축 - 아부다비 5기가와트 규모 ‘UAE-미국 AI 캠퍼스’ 내 차세대 AI 컴퓨팅 클러스터 가동 - 첫 200메가와트 AI 클러스터, 2026년 가동 예정…대규모 AI 수요 대응 엔비디아는 지난 ...
    Date2025.05.26 Bynewsit Views292
    Read More
  4. 큐브리드, 전국 지자체 평생학습플랫폼 구축에 DBMS 공급

    큐브리드가 대구광역시, 부산광역시, 대전시, 성남시, 아산시, 광명시, 의정부시, 당진시 등 전국 지자체 8곳의 평생학습플랫폼 구축사업에 자사의 오픈소스 DBMS ‘큐브리드(CUBRID)’를 공급했다고 밝혔다. 지자체 평생학습플랫폼은 「평생교육법」에 근거하여...
    Date2025.05.23 Bynewsit Views333
    Read More
  5. 매스웍스-KISTI, 고성능 컴퓨팅 인프라 구축 위한 협약 체결

    - 매트랩 병렬 서버 호스팅으로 국가슈퍼컴퓨팅센터 연구 생산성 향상 지원… 대규모 데이터 처리 및 AI 연구 가속화 기대 매스웍스(MathWorks)는 한국과학기술정보연구원(KISTI)과 매트랩(MATLAB) 및 매트랩 병렬 서버(MATLAB Parallel Server) 호스팅 서비스 ...
    Date2025.05.23 Bynewsit Views484
    Read More
  6. 리미니스트리트, 인천국제공항공사에 '리미니 서포트' 지원…“SAP S/4HANA 유지보수”

    - SAP S/4HANA ERP 유지보수 서비스를 리미니스트리트로 전환, IT 비용 절감 및 비즈니스 프로세스 혁신 실현 리미니스트리트(RMNI)는 오늘, 대한민국의 대표적인 항공 관문인 인천국제공항을 운영하는 인천국제공항공사( SAP S/4HANA ERP시스템의 유지보수 최...
    Date2025.05.22 Bynewsit Views414
    Read More
  7. 인텔 가우디 3, 델 AI 플랫폼에 탑재…“대규모 AI 혁신 위한 가용성 확대”

    - 델 AI 팩토리를 통해 제공되는 인텔 가우디 3 AI 가속기, 고성능, 오픈 소스 유연성 및 엔터프라이즈급 인프라를 제공하여 AI 도입 속도 향상 인텔은 델(Dell)이 델 AI 팩토리(Dell AI Factory) 최신 포트폴리오에 인텔 가우디 3 AI 가속기를 탑재한 인텔 기...
    Date2025.05.21 Bynewsit Views328
    Read More
  8. 엔비디아, MS와 함께 RTX AI PC 생태계 확장

    - 윈도우 ML 기반 ‘RTX용 엔비디아 텐서RT’로 AI 성능 대폭 강화 - 새로운 엔비디아 NIM 마이크로서비스와 AI 블루프린트로 개발자 워크플로우 혁신 - 프로젝트 G-어시스트 통해 코딩 없이도 AI 기능 개발 지원 엔비디아가 마이크로소프트(Microsoft)와 협력해...
    Date2025.05.21 Bynewsit Views280
    Read More
  9. SAP, 연례 콘퍼런스 ‘SAP사파이어 2025’ 개최…“AI 혁신으로 업무 생산성 최대 30% 향상”

    - 기업 운영 방식 재정의할 비즈니스 AI 공개 - 퍼플렉시티 및 팔란티어와의 파트너십 통해 고객의 잠재력 극대화 SAP가 20일 미국 플로리다 올랜도에서 SAP의 연례 콘퍼런스 ‘SAP 사파이어(SAP Sapphire)‘를 개최했다. SAP는 이번 행사에서 모든 사용자에게 ...
    Date2025.05.21 Bynewsit Views346
    Read More
  10. 피아이이, 판교 위든타워에 ‘PIE AI R&D Campus’ 설립…“서강대와 산학협력 본격화”

    - ‘AI+X’ 융합 기술 중심 연구 거점 구축…이차전지 넘어 첨단 산업 맞춤형 AI 솔루션 확대 - 서강대와 산학협력으로 최신 AI 기술의 산업 적용 가속화 및 실용적 기술 생태계 조성 기대 AI 전문기업 피아이이는 서강대학교와 함께 AI 산업화 기술에 관한 연구 ...
    Date2025.05.21 Bynewsit Views298
    Read More
목록
Board Pagination Prev 1 ... 28 29 30 31 32 33 34 35 36 37 ... 202 Next
/ 202
CLOSE