기술 데모로 RTX GPU 가진 윈도우 PC 모든 사람에게 개인화된 GPT 챗봇 성능 제공

검색 증강생성(RAG), 텐서RT-LLM 소프트웨어, RTX 가속화 통해 생성형 AI 기능 제공

3자 공유 혹은 인터넷 연결 없이도 민감한 데이터 처리 가능

 

엔비디아, 챗 위드 RTX로 엔비디아 RTX 기반 AI PC에 맞춤형 챗봇 제공.jpg

 

엔비디아가 사용자만의 콘텐츠로 챗봇을 개인화 할 수 있는 챗 위드 RTX(Chat With RXT)를 윈도우 PC에서 제공한다고 밝혔다. 매일 전 세계 수백만명의 사람들이 엔비디아(NVIDIA) GPU 기반 클라우드 서버로 구동되는 챗봇을 사용하고 있다. 이제 이 획기적인 도구를 고속의 로컬 맞춤 생성형 AI를 지원하는 엔비디아 RTX 기반 윈도우 PC에서 만나볼 수 있다.

 

챗 위드 RTX는 사용자가 자신만의 콘텐츠로 챗봇을 개인화 할 수 있는 기술 데모이다. 최소 8GB의 비디오 랜덤 액세스 메모리 또는 VRAM을 갖춘 로컬 엔비디아 지포스 RTX 30(GeForce RTX 30) 시리즈 GPU 이상으로 가속되며 현재 무료로 다운로드가 가능하다.

 

무엇이든 물어보세요

챗 위드 RTX는 검색 증강생성(RAG)엔비디아 텐서RT-LLM(TensorRT-LLM) 소프트웨어, 엔비디아 RTX 가속화 등을 사용해 로컬 지포스 기반 윈도우 PC에 생성형 AI 기능을 제공한다. 사용자는 PC의 로컬 파일을 데이터셋으로 미스트랄(Mistral)이나 라마 2(Llama 2)와 같은 오픈소스 LLM(대규모 언어 모델)에 빠르고 쉽게 연결해 상황에 맞는 빠른 답변을 얻을 수 있다.

엔비디아, 챗 위드 RTX로 엔비디아 RTX 기반 AI PC에 맞춤형 챗봇 제공 (2).jpg

사용자들은 메모나 저장해둔 콘텐츠를 검색하는 대신 간단한 검색어를 입력해 챗봇을 이용할 수 있다. 예를 들어 "라스베가스에 있을 때 내 친구가 추천한 레스토랑이 어디야?"라고 질문하면, 챗 위드 RTX가 사용자가 지정한 로컬 파일을 스캔해 상황에 맞는 답변을 제공한다.

 

이 도구는 .txt, .pdf, .doc/.docx, .xml 등 다양한 파일 형식을 지원한다. 애플리케이션에서 해당 형식의 파일들을 포함한 폴더를 가리키면 몇 초 만에 이 파일들은 라이브러리에 로드된다.

 

사용자는 유튜브(YouTube) 동영상 혹은 재생 목록의 정보도 포함할 수 있다. 챗 위드 RTX에 동영상 URL을 추가하면 사용자는 해당 정보를 챗봇에 통합해 상황에 맞는 질문을 할 수 있다. 예를 들어, 좋아하는 인플루언서 동영상의 콘텐츠를 기반으로 여행 추천을 요청하거나, 우수한 교육 자료를 기반으로 빠른 튜토리얼과 사용법을 안내를 받을 수 있다.

 

챗 위드 RTX는 윈도우 RTX PC와 워크스테이션에서 로컬로 실행되므로 결과가 빠르게 제공되고, 사용자의 데이터는 디바이스에 그대로 유지된다. 또한, 클라우드 기반 LLM 서비스 대신 챗 위드 RTX를 사용하면 민감한 데이터를 제3자와 공유하거나 인터넷에 연결하지 않고도 처리할 수 있다. 챗 위드 RTX는 최소 8GB의 VRAM이 탑재된 지포스 RTX 30 시리즈 이상의 GPU와 윈도우 10, 11 그리고 최신 엔비디아 GPU 드라이버에서 사용 가능하다.

 

RTX로 LLM 기반 애플리케이션 개발

챗 위드 RTX는 RTX GPU로 LLM을 가속화할 수 있는 잠재력을 보여준다. 이 애플리케이션은 깃허브(GitHub)에서 이용할  있는 텐서RT-LLM RAG 개발자 레퍼런스 프로젝트를 기반으로 제작됐다. 개발자들은 이 레퍼런스 프로젝트를 통해 텐서RT-LLM으로 가속화된 RTX용 RAG 기반 애플리케이션을 직접 개발하고 배포할 수 있다. 

 

2월 23일까지 진행되는 엔비디아 RTX PC 기반 생성형 AI 개발자 콘테스트에서 생성형 AI 기반 윈도우 앱 또는 플러그인을 등록할 수 있다. 참여자들에게는 지포스 RTX 4090 GPU, 엔비디아 GTC 오프라인 콘퍼런스 입장권 등의 경품 당첨의 기회가 주어진다.

 

#엔비디아#RTX#GPU#RAG#생성형AI

?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
993 오토스토어, <물류 자동화 시스템의 경제적 효과 연구 보고서> 발표…“3년 내 ROI 79% 달성” - 오토스토어 물류 자동화 시스템 도입 대표 기업 5곳, 3년 내 ROI 79% 달성 및 총 156억 7천만 원 상당의 경제적 효과 경험 - 고밀도 저장 공간, 개선된 피킹 방... file newsit 2024.04.01 474
992 아비바, ‘스마트팩토리+오토메이션월드 2024’ 전시 참여…“스마트팩토리 지능형 솔루션 소개” - ‘스마트팩토리+오토메이션월드 2024’ 전시 참여해 스마트팩토리 운영 최적화를 위한 솔루션 소개 아비바가 지난 3월 27일부터 29일까지 코엑스에서 개최된 아시... file newsit 2024.04.01 493
991  크리테오, 미국 미디어 등급위원회(MRC) 인증 최초 획득 - 데스크톱, 모바일 웹, 모바일 인앱 환경에서의 노출 및 클릭 지표에 대한 인증 획득…신뢰할 수 있는 측정 역량을 입증하는 중요한 성과 - 크리테오, 수년간 광... file newsit 2024.04.01 589
990 슈나이더 일렉트릭-인텔-레드햇, “차세대 개방형 자동화 인프라 협력” - 새로운 분산 제어 노드(DCN) 소프트웨어 프레임워크로 개방형 자동화 추진 - 상호 운용성과 이식성을 통해 산업 혁신 지원 및 노후화 감소 슈나이더 일렉트릭이... file newsit 2024.03.28 385
989 디지서트, ‘2024 디지털 신뢰(Digital Trust) 현황 보고서’ 아태 지역 결과 발표 - 기업, 디지털 신뢰 구현 '우수’하지만 ‘매우 우수”에는 미치지 못해 - 선두 그룹과 하위 그룹 간 디지털 신뢰 관리 격차 커져… 선두 그룹은 수익 및 생산성 향... file newsit 2024.03.28 399
988 한국레노버, 소외계층 위한 ‘사랑의 밥퍼 나눔’ 무료 급식 봉사 진행 - 임직원 자발적 참여…무료 급식소 방문 어르신에 한끼 대접 - 밥퍼나눔운동본부의 원활한 운영을 위한 아이디어패드 노트북 기부 한국레노버 임직원들이 ESG 활... file newsit 2024.03.28 440
987 리미니스트리트, 오라클 데이터베이스 이용 현황 조사 <데이터베이스 로드맵의 미래를 주도하는 힘> 발표 - 현재 버전에 만족하지만 유지보수에 필요한 비용과 시스템 관리, 정기적인 업그레이드에 어려움 리미니스트리트(Rimini Street)는 오늘, 미국 IT 관리자들을 대... file newsit 2024.03.27 391
986 SAP 석세스팩터스, ‘SAP HR 커넥트 2024’ 성료 - 온프레미스 HCM 솔루션을 클라우드로 이전해 기업 민첩성, 운영 효율성, 혁신성 확보 - LG CNS, LG 이노텍, 한독, 두산디지털이노베이션 등 국내 고객 사례 공... file newsit 2024.03.27 476
985 마이크로스트레티지, 뉴질랜드 오클랜드 대학교에 BI 분석 플랫폼 구축 - 6,000명 이상의 사용자가 마이크로스트레티지 클라우드 분석을 통해 최고의 사용자 경험 구현 마이크로스트레티지 코리아는 오늘, 뉴질랜드 오클랜드 대학교에 ... file newsit 2024.03.27 374
984 서비스나우, 국내 금융 업계의 AI 기반 플랫폼 IT 혁신 지원 본격화 - 서비스나우, EY한영 -메가존클라우드와 파트너 네트워크 강화 더 나은 업무 환경을 제공하는 디지털 비즈니스 플랫폼 서비스나우(ServiceNow)가 국내 금융 업계... file newsit 2024.03.26 360
목록
Board Pagination Prev 1 ... 134 135 136 137 138 139 140 141 142 143 ... 238 Next
/ 238
CLOSE