- 윈도우 ML 기반 ‘RTX용 엔비디아 텐서RT’AI 성능 대폭 강화

- 새로운 엔비디아 NIM 마이크로서비스와 AI 블루프린트로 개발자 워크플로우 혁신

- 프로젝트 G-어시스트 통해 코딩 없이도 AI 기능 개발 지원

 

엔비디아, 마이크로소프트와 함께 RTX AI PC 생태계 확장.jpg

 

엔비디아가 마이크로소프트(Microsoft)와 협력해 RTX AI PC를 위한 다양한 기능과 개발자 도구를 통해 AI 생태계 전반을 확장하고 있다고 밝혔다. RTX AI PC용으로 새롭게 설계된 엔비디아 텐서RT(NVIDIA TensorRT)는 윈도우 ML(Windows ML)을 통해 제공되며, 고성능 AI 실행 환경을 지원한다.

 

생성형 AI는 디지털 휴먼부터 글쓰기 도우미, 지능형 에이전트, 크리에이티브 도구에 이르기까지 PC 소프트웨어를 획기적인 경험으로 변화시키고 있으며, 엔비디아 RTX AI PC는 생성형 AI 실험을 더 쉽게 시작하고, 윈도우 11에서 더 뛰어난 성능을 발휘할 수 있도록 지원하는 기술로 이러한 변화를 주도하고 있다.

 

엔비디아 텐서RT가 RTX AI PC를 위해 새롭게 설계됐다. 업계 최고 수준의 텐서RT 성능과 함께 적시 온디바이스 엔진 구축과 기존 대비 8배 더 작은 패키지 크기를 통해 1억 대 이상의 RTX AI PC에 AI를 원활하게 배포할 수 있도록 돕는다.

 

마이크로소프트 빌드(Microsoft Bulid)에서 발표된 RTX용 텐서RT는 앱 개발자에게 광범위한 하드웨어 호환성과 최첨단 성능을 모두 제공하는 새로운 추론 스택인 윈도우 ML에서 기본적으로 지원된다.

 

엔비디아는 AI 기능을 통합하려는 개발자를 위해 엔비디아 DLSS부터 엔비디아 RTX 비디오(RTX Video)와 같은 멀티미디어 향상 기능까지 다양한 소프트웨어 개발 키트(software development kits, SDKs) 옵션을 제공한다. 이번 달에는 오토데스크(Autodesk), 빌리빌리(Bilibili), 카오스(Chaos), LM 스튜디오(LM Studio), 토파즈 랩스(Topaz Labs)의 인기 소프트웨어 애플리케이션에서 RTX AI 기능과 가속화를 위한 업데이트를 출시할 예정이다.

 

AI 애호가와 개발자는 엔비디아 NIM을 사용해 AI를 쉽게 시작할 수 있다. 이는 애니띵LLM(AnythingLLM), 마이크로소프트 VS 코드(VS Code), 컴피UI(ComfyUI)와 같은 인기 앱에서 실행 가능한 사전 패키징, 최적화된 AI 모델이다. 이번 주에 출시되는 플럭스.1-쉬넬(FLUX.1-schnell) 이미지 생성 모델은 NIM 마이크로서비스로 제공되며, 인기 있는 플럭스.1-데브(dev) NIM 마이크로서비스는 더 많은 RTX GPU를 지원하도록 업데이트됐다.

 

엔비디아 앱 내 RTX PC AI 어시스턴트인 프로젝트 G-어시스트(Project G-Assist)는 코딩 없이 간단한 AI 개발을 시작하고자 하는 사용자들을 지원한다. 이를 통해 자연어 기반 AI로 PC 앱과 주변기기를 제어하는 플러그인을 직접 구축할 수 있다. 아울러 구글 제미나이(Google Gemini) 웹 검색, 스포티파이(Spotify), 트위치(Twitch), IFTTT, 시그널RGB(SignalRGB)등 새로운 커뮤니티 플러그인도 현재 제공되고 있다.

 

RTX용 텐서RT로 가속화된 AI 추론

오늘날의 AI PC 소프트웨어 스택을 사용하려면 성능을 타협하거나 특정 하드웨어에 대한 사용자 지정 최적화에 투자해야 한다.

 

윈도우 ML은 이러한 문제를 해결하기 위해 개발됐다. 윈도우 ML은 ONNX 런타임(ONNX Runtime) 기반으로 구동되며, 각 하드웨어 제조업체에서 제공하고 유지 관리하는 최적화된 AI 실행 레이어에 원활하게 연결된다.

 

지포스(GeForce) RTX GPU의 경우, 윈도우 ML은 높은 성능과 빠른 배포를 위해 RTX용 텐서RT 추론 라이브러리를 자동으로 사용한다. 다이렉트ML(DirectML)과 비교했을 때, 텐서RT는 PC에서 AI 워크로드를 처리하는 데 50% 이상 빠른 성능을 제공한다.

텐서RT는 PC에서 AI 워크로드에 다이렉트ML보다 50_ 이상 빠른 성능을 제공한다. 성능은 지포스 RTX 5090에서 측정됐다.jpg

 

텐서RT는 PC에서 AI 워크로드에 다이렉트ML보다 50% 이상 빠른 성능을 제공한다. 성능은 지포스 RTX 5090에서 측정됐다.

 

또한 윈도우 ML은 개발자의 QoL(Quality of Life) 측면에서도 다양한 이점을 제공한다. 각 AI 기능을 실행하는 데 가장 적합한 하드웨어(GPU, CPU, NPU)를 자동으로 선택하고, 해당 하드웨어에 맞는 실행 공급자를 다운로드해 해당 파일을 앱에서 패키징할 필요가 없게 한다. 이로써 최신 텐서RT 성능 최적화가 준비되는 즉시 사용자에게 제공될 수 있다.

텐서RT 성능 최적화는 준비되는 즉시 사용자에게 제공된다.jpg

 

                                                                                 텐서RT 성능 최적화는 준비되는 즉시 사용자에게 제공된다.

 

텐서RT는 원래 데이터센터용으로 구축된 라이브러리였지만, RTX AI PC를 위해 새롭게 설계됐다. RTX용 텐서RT는 텐서RT 엔진을 사전 생성해 앱과 함께 패키징하는 대신, 적시에 온디바이스 엔진을 구축해 사용자의 특정 RTX GPU에 최적화된 AI 모델 실행을 수 초 내에 처리할 수 있다. 또한 라이브러리 패키징 방식이 간소화돼 파일 크기가 기존 대비 8배까지 크게 줄었다.

 

RTX용 텐서RT는 현재 윈도우 ML 프리뷰를 통해 제공되고 있으며, 6월부터는 엔비디아 개발자(NVIDIA Developer) 포털에서 독립형 SDK로 제공될 예정이다.

 

#엔비디아#RTX#텐서RT#AIPC#

 

?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1771 뱅크웨어글로벌, 혁신적인 블록체인 미들웨어 ‘BXB’ 7월 정식 출시 - 스마트 컨트랙트 API 변환 기술로 시장 혁신 예고 - 증권형 토큰과 스테이블코인 플랫폼 구축 지원 뱅크웨어글로벌이 스마트 컨트랙트 포맷 변환을 통한 API 제... file newsit 2025.07.01 720
1770 유아이패스, LG유플러스의 디지털 혁신 여정 및 에이전틱 자동화 전환 지원 유아이패스(UiPath)는 AI 기반 자동화를 통해 LG유플러스의 운영 혁신 및 자동화 역량 강화를 지원하고 있다고 발표하고, LG유플러스는 단순 반복 업무를 넘어, ... file newsit 2025.07.01 657
1769 슈나이더 일렉트릭-엔비디아, AI 팩토리 구축 인프라 개발 가속화 - 전력, 냉각, 제어 시스템, 고밀도 랙 인프라 등 AI 데이터센터 핵심 요소에 대한 공동 연구 개발 - AI가 실현될 수 있는 기반이 되는 ‘AI 팩토리’ 구축 목표 슈... file newsit 2025.07.01 729
1768 SAP 코리아, ‘SAP 나우 AI 투어 코리아’ 개최 - SAP 고객 및 파트너사와 함께 AI 기반 비즈니스 혁신을 위한 전략 및 적용 사례 소개 - 실무 담당자를 위한 맞춤형 트랙 운영, SAP 기반 제조 현장 쇼케이스도 ... file newsit 2025.07.01 636
1767 엘앤에프, ‘2024 지속가능경영보고서’ 발간…글로벌 기준으로 ESG 실행 성과 공개 - ESG 비전 선포 4년 맞아 ‘ESG Journey’ 신설, 주요 활동 흐름 한눈에 - 기후 리스크 분석부터 재무영향 공시까지… ISSB 기준 적용으로 신뢰성·투명성 제고 - 전... file newsit 2025.06.30 494
1766 오라클, 새로운 ‘소버린 에어갭 클라우드’ 솔루션으로 국가 안보 강화 지원 - 오라클 컴퓨트 클라우드앳커스터머 아이솔레이티드, 보안 기밀 워크로드 관리로 미션 성공 지원 오라클이 보안용 소버린 컴퓨트 클라우드 서비스인 오라클 컴퓨... file newsit 2025.06.30 453
1765 AWS, 싱가폴에 ‘이노베이션 허브’ 개소…아태 지역의 클라우드 및 AI 혁신 가속화 - 수백만 달러 규모의 시설에 AWS, 아마존, 전 세계 파트너의 최첨단 기술 집약 - 매년 아시아 태평양 지역의 C-레벨 리더 1,000명 이상, 싱가포르 고등교육기관 ... file newsit 2025.06.27 498
1764 티맥스소프트, ‘프로프레임 6.0’ 개발 완료…“AI·클라우드 시대, 다양한 애플리케이션 프레임워크 수요 대응” - C 버전 프레임워크 ‘프로프레임’ 신규 버전 6.0, 성능·안정성·편의성 향상... 3분기 정식 출시 - 높은 수요 예상되는 금융권 프레임워크 사업 대응 위해 제품 ... file newsit 2025.06.27 656
1763 스플렁크, 스플렁크 리더십 포럼(Splunk Leadership Forum) 성료 스플렁크는 ‘스플렁크 리더십 포럼’을 26일 오늘 개최했다고 밝혔다. 스플렁크 AI 부문 총괄 하오 양(Hao Yang) 부사장은 글로벌 AI 기술과 사이버 보안에 대한 ... file newsit 2025.06.27 743
1762 레노버, 가트너 선정 ‘2025 공급망 선도 기업’ 8위 차지 레노버가 2025년 ‘가트너 공급망 선도 상위 25개 기업(Gartner Supply Chain Top 25)’에서 8위에 오르며 공급망 운영의 우수성을 또다시 인정받았다. 이는 전년 ... file newsit 2025.06.26 460
목록
Board Pagination Prev 1 ... 56 57 58 59 60 61 62 63 64 65 ... 238 Next
/ 238
CLOSE