- 텐서코어 GPU, LLM, RTX PC, 워크스테이션용 툴로 수백만 명에게 생성형 AI 제공

- 새로운 지포스 RTX 슈퍼 GPU, AI 노트북 등 통해 RTX로 가속화된 AI 플랫폼 성능 제공

 

엔비디아, 새로운 지포스 시리즈, AI 툴 등 발표…생성형 AI 활용 확대.jpg

엔비디아가 텐서 코어 GPU, LLM, RTX PC와 워크스테이션용 툴을 통해 수백만 명에 생성형 AI를 제공한다고 밝혔다. 엔비디아(NVIDIA)는 초고성능 생성형 AI 성능을 위한 지포스 RTX 슈퍼 데스크톱 GPU, 주요 제조업체의 새로운 AI 노트북, 개발자와 소비자 모두를 위한 새로운 엔비디아 RT로 가속화된 AI 소프트웨어와 툴을 발표했다.

 

엔비디아는 수십 년 동안 쌓아온 PC 분야의 리더십과 1억 개 이상의 RTX GPU AI PC 시대를 이끌어 왔다. 그리고 이제 엔비디아는 생성형 AI PC 경험을 향상시키는 도구를 제공한다. 여기에는 텍스트-이미지 워크플로우를 지원하는 인기 모델 ‘스테이블 디퓨전 XL(Stable Diffusion XL)’의 엔비디아 텐서 RT 가속, 생성형 AI 텍스처 툴이 포함된 엔비디아 RTX 리믹스(RTX Remix), DLSS 3 프레임 제너레이션(Frame Generation)을 사용하는 게임과 엔비디아 ACE 마이크로서비스가 포함된다.

 

AI 개발자를 위한 사용하기 쉬운 통합 툴킷인 엔비디아 AI 워크벤치(AI Workbench)는 이달 말 베타버전으로 출시될 예정이다. 또한 최신 대규모 언어 모델(LLM)의 추론 성능을 가속화하고 최적화하는 오픈소스 라이브러리인 엔비디아 텐서RT-LLM은 이제 PC에 더 많은 사전 최적화된 모델을 지원한다. 이번 달에 출시되는 엔비디아의 기술 데모 위드 RTX(Chat with RTX)는 텐서RT-LLM의 가속화를 통해 AI 애호가들이 자신의 메모, 문서, 기타 콘텐츠와 상호 작용할 수 있도록 지원한다.

 

엔비디아 CEO 젠슨 황(Jensen Huang) "생성형 AI는 컴퓨팅 역사상 가장 중요한 플랫폼 전환이며, 게임을 포함한 모든 산업을 변화시킬 것이다. 1억 대 이상의 RTX AI PC와 워크스테이션을 보유한 엔비디아는 개발자와 게이머가 생성형 AI의 마법을 즐길 수 있는 대규모 설치 기반을 갖추고 있다"고 밝혔다. 

 

개인정보와 지연 시간, 비용에 민감한 애플리케이션의 경우 PC에서 로컬로 생성형 AI를 실행하는 것이 중요하다. 이를 위해 대규모 AI 지원 시스템 설치 기반은 물론, PC 플랫폼에 맞게 AI 모델을 조정하고 최적화하는 데 적합한 개발자 도구가 필요하다이러한 요구를 충족하기 위해 엔비디아는 전체 기술 스택에 걸쳐 혁신을 구현하고, 새로운 경험을 주도하며, 이미 엔비디아 RTX 기술로 가속화된 500개 이상의 AI 지원 PC 애플리케이션과 게임을 제공하고 있다.

 

RTX AI PC와 워크스테이션

다양한 애플리케이션을 최고 성능으로 실행할 수 있는 엔비디아 RTX GPU PC에서 생성형 AI의 잠재력을 최대한 끌어올린다. GPU의 텐서 코어는 가장 복잡한 업무용, 엔터테인먼트용 애플리케이션에서 AI 성능을 획기적으로 향상시킨다.

 

이번 CES에서 발표된 새로운 지포스 RTX 40 슈퍼 시리즈 그래픽 카드는 최고의 AI 성능을 위한 지포스 RTX 4080 슈퍼, 4070 Ti 슈퍼와 4070 슈퍼를 포함한다. 지포스 RTX 4080 슈퍼는 지포스 RTX 3080 Ti GPU보다 1.5배 빠른 AI 비디오와 1.7배 빠른 이미지를 생성한다. 슈퍼 GPU의 텐서 코어는 초당 최대 836조 회의 연산을 수행해 게임, 크리에이티브는 물론 일상적인 생산성에 혁신적인 AI 기능을 제공한다.

 

에이서(Acer), 에이수스(ASUS), , HP, 레노버(Lenovo), MSI, 레이저(Razer), 삼성 등 선도적인 제조업체들은 새로운 RTX AI 노트북을 출시해 바로 사용할 수 있는 생성형 AI 기능 풀세트를 사용자에게 제공한다. 신경망처리장치(NPU) 사용 대비 20배에서 60배까지 성능이 향상되는 새로운 시스템은 이번 달에 출하가 시작된다.

 

RTX GPU가 탑재된 모바일 워크스테이션은 간소화되고 안전한 생성형 AI와 데이터 사이언스 개발을 위해 텐서RT엔비디아 래피즈(RAPIDS)가 포함된 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어를 실행할 수 있다. 모든 엔비디아 A800 40GB 액티브 GPU에는 엔비디아 AI 엔터프라이즈 3년 라이센스가 포함돼 AI와 데이터 사이언스를 위한 이상적인 워크스테이션 개발 플랫폼을 제공한다.

 

AI 모델 구축을 위한 새로운 PC 개발자 도구

개발자가 PC급 성능과 메모리 공간을 사용해 사전 학습된 생성형 AI 모델과 LLM을 빠르게 생성, 테스트, 사용자 맞춤화 할 수 있도록 지원하기 위해, 엔비디아는 최근 엔비디아 AI 워크벤치를 발표했다.

 

AI 워크벤치는 이달 말 베타 버전으로 출시된다. 허깅 페이스(Hugging Face), 깃허브(GitHub), 엔비디아 NGC와 같은 인기 리포지토리에 대한 간소화된 액세스를 제공할 계획이다. 또한, 개발자가 프로젝트를 쉽게 재현, 협업, 마이그레이션할 수 있는 간소화된 사용자 인터페이스도 함께 제공한다.

 

프로젝트는 데이터센터, 퍼블릭 클라우드 또는 엔비디아 DGX 클라우드 등 거의 모든 곳으로 확장 가능하다. 추론과 가벼운 맞춤화를 위해 PC 또는 워크스테이션의 로컬 RTX 시스템으로 다시 가져올 수도 있다또한, 엔비디아는 HP와 협력을 통해 AI 모델 개발을 간소화하고 있다. 이는 데이터 사이언스를 위한 중앙 집중식 플랫폼인 HP AI 스튜디오 RTX 가속 AI 모델과 소프트웨어 개발 키트를 포함하는 엔비디아 AI 파운데이션 모델과 엔드포인트를 통합해 이뤄지고 있다. 이를 통해 사용자는 PC와 클라우드에서 최적화된 모델을 쉽게 검색, 가져오기, 배포 등을 수 있다.

 

개발자는 PC 사용 사례에 맞는 AI 모델을 구축한 후, 엔비디아 텐서RT 로 최적화해 RTX GPU의 텐서 코어의 이점을 최대한 활용할 수 있다.

 

엔비디아는 최근 LLM 가속화를 위한 오픈소스 라이브러리인 윈도우용 텐서RT-LLM을 통해 텍스트 기반 애플리케이션으로 텐서RT를 확장했다. 현재 사용 가능한 텐서RT-LLM의 최신 업데이트를 통해 파이-2(Phi-2) 와 제퍼 7B(Zephyr 7B) PC용 사전 최적화 모델 목록에 추가됐다.

 

 

#CES#2024#엔비디아#지포스#RTX#AI#

?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
893 헥사곤 아담스, 영남대 자율운항선박 연구 시간 단축 및 투입 자원 절감 효과 - 실물로 검증하기 어려운 대형 선박 및 해양 환경을 디지털로 구현 - 다양한 변수를 적용한 시뮬레이션으로 성능 검증 가능 헥사곤 매뉴팩처링 인텔리전스는 영... file newsit 2024.02.06 478
892 레노버, 딥브레인AI와 파트너십 강화…“가상 인간 구현 위한 엣지 서버 제공” - 레노버, 스마터 리테일을 위한 반응형 AI 키오스크 제공 - 1억 달러 투자 약속한 레노버 AI 이노베이터 프로그램의 일환 - 레노버 씽크시스템 SE350 엣지 서버... file newsit 2024.02.06 305
891 오라클 호스피탈리티 오페라 클라우드, 메리어트 인터내셔널의 계열사 지원을 위한 자산 관리 플랫폼으로 선정 오라클은 메리어트 인터내셔널(Marriott International)이 오라클 호스피탈리티 오페라 클라우드 자산 관리 시스템 및 영업 및 이벤트 관리를 자사의 럭셔리, 프... file newsit 2024.02.05 285
890 데이터브릭스, AI 기반 데이터 플랫폼 ‘아인블릭’ 인수…“기업의 AI 애플리케이션 개발 지원“ - 아인블릭 인수로 데이터 및 AI 역량 확대 및 시너지 기대 - 전략적 확장을 통해 비전문가도 손쉽게 활용할 수 있도록 데이터 인텔리전스 보편화 데이터브릭스(D... file newsit 2024.02.05 274
889 엠클라우드브리지-인브레인, 오픈AI 기반 챗GPT 플랫폼용 ‘AI 빌딩 블록’ 개발에 1단계로 10억 투자 - AI 및 데이터 분석 전문기업 인브레인과 10억원대 1단계 투자 계약 - 오픈AI 기반 챗GPT 국내 기업 적용 가속화 위해 AI 빌딩 블록 개발 엠클라우드브리지는 MS... file newsit 2024.02.05 424
888 다쏘시스템, 다쏘 에비에이션과 협력 강화...”클라우드에서 MRO 지원” - 다쏘 에비에이션, 3D익스피리언스 플랫폼에서 다쏘시스템의 소버린 클라우드 기반 데이터 과학 및 협업 기능을 사용해 프랑스 국방부의 군용기 가용성 최적화 -... file newsit 2024.02.05 348
887 더존비즈온, ‘동아오츠카 차세대 통합시스템’ 구축 완료 - ERP 10 기반 식음료업종 맞춤형 구축…FoEX 구축방법론·AI 기술 접목으로 AX 생태계 선도 - ERP 모바일 플랫폼과 그룹웨어 연동 등 확장 기능 탑재…마감체계 시... file newsit 2024.02.02 307
886 알리바바 클라우드, 기업의 생성용 AI 활용 돕는 ‘서버리스 솔루션’ 공개 - LLM통해 글로벌 고객의 맞춤형 AI 애플리케이션을 개발 지원 - 알리바바 AI 및 빅데이터 서밋에서 자사 플랫폼의 서버리스 버전 공개 - 자세 데이터웨어하우스,... file newsit 2024.02.02 402
885 서비스나우-EY, ‘생성형 AI’ 전략적 제휴 확대 - 조직 내 생성형 AI 거버넌스 개선 지원 및 중요 비즈니스 요구 사항 해결 - EY, 서비스나우 나우 어시스트 생성형 AI 기능으로 EY직원 및 고객 경험 개선 서비... file newsit 2024.02.02 409
884 애드저스트, ‘모바일 앱 어트리뷰션 핵심가이드: 기초부터 심화까지’ 발표 모바일 마케팅 애널리틱스 플랫폼 애드저스트는 오늘 마케팅에 대해 필요 불가결한 어트리뷰션을 해설한 가이드 「모바일 앱 어트리뷰션 핵심 가이드」를 발표했... file newsit 2024.02.02 266
목록
Board Pagination Prev 1 ... 141 142 143 144 145 146 147 148 149 150 ... 235 Next
/ 235
CLOSE