엔비디아 GH200, L4 GPU 등 클라우드에서 네트워크 엣지까지 AI 실행 성능과 다용성 선보여

- H100 GPU의 추론 성능 두배로 가속화하는 새로운 소프트웨어 텐서RT-LLM 발표

 

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).jpg

 

​​​​​엔비디아가 MLPerf 벤치마크에서 엔비디아 GH200 그레이스 호퍼 슈퍼칩(NVIDIA GH200 Grace Hopper Superchip)이 우수한 성능을 입증했다고 밝혔다. MLPerf에서 처음으로 선보인 엔비디아 GH200 그레이스 호퍼 슈퍼칩은 모든 데이터센터 추론 테스트를 성공적으로 수행하며 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPUs)의 뛰어난 성능을 확장했다.

 

아울러 전반적인 평가 결과에서 클라우드부터 네트워크 엣지까지 엔비디아 AI 플랫폼의 뛰어난 성능과 다용성이 입증됐다.이와는 별도로 엔비디아는 성능, 에너지 효율성, 총소유비용을 획기적으로 개선할 수 있는 추론 소프트웨어를 발표했다.

 

MLPerf에서 활약한 GH200 슈퍼칩

GH200은 하나의 슈퍼칩에 호퍼 GPU와 그레이스 CPU를 연결한다. 이 조합은 더 많은 메모리와 대역폭을 제공하고, CPU와 GPU 간 자동으로 전력을 전환해 성능을 최적화한다.

 

이와는 별도로, 8개의 H100 GPU를 탑재한 엔비디아 HGX H100 시스템(HGX H100 systems)은 이번 라운드의 모든 MLPerf 추론 테스트에서 가장 높은 처리량을 기록했다.

 

그레이스 호퍼 슈퍼칩과 H100 GPU는 컴퓨터 비전, 음성 인식, 의료 영상 추론은 물론, 추천 시스템과 생성형 AI에 사용되는 대규모 언어 모델(LLMs)의 더욱 복잡한 사용 사례 등 MLPerf의 모든 데이터센터 테스트에서 선두를 차지했다.

 

이번 결과는 2018년 MLPerf 벤치마크가 시작된 이래 모든 라운드에서 AI 훈련과 추론 분야에서 선도적인 성능을 입증해온 엔비디아의 기록을 이어가고 있다.

 

최신 MLPerf 라운드에는 추천 시스템에 대한 업데이트된 테스트와 함께 AI 모델의 대략적인 규모를 측정하는 60억 개의 파라미터로 구성된 대규모 언어 모델 GPT-J의 첫 번째 추론 벤치마크가 포함됐다.

 

추론를 가속화하는 텐서RT-LLM(TensorRT-LLM)

엔비디아는 모든 규모의 복잡한 워크로드를 처리하기 위해 추론을 최적화하는 생성형 AI 소프트웨어 텐서RT-LLM(TensorRT-LLM)을 개발했다. 이 오픈 소스 라이브러리는 고객이 이미 구매한 H100 GPU의 추론 성능을 두 배 이상 향상시키는 데 추가 비용 없이 이용 가능하다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (2).jpg

 

엔비디아의 내부 테스트에 따르면 H100 GPU에서 텐서RT-LLM을 사용하면 GPT-J 6B를 실행하는 이전 세대 GPU에 비해 최대 8배의 성능 속도가 향상된다.

 

이 소프트웨어는 메타(Meta), 애니스케일(AnyScale), 코히어(Cohere), 데시(Deci), 그래머리(Grammarly), 미스트럴 AI(Mistral AI), 모자이크ML(MosaicML), 옥토ML(OctoML), 탭나인(Tabnine), 투게더AI(Together AI) 등 주요 기업들과 함께 대규모 언어 모델 추론의 가속화와 최적화를 위한 엔비디아의 연구에서 출발했다.

 

현재 데이터브릭스(Databricks)에 인수된 모자이크ML은 기존의 서비스 스택에 텐서RT-LLM에 필요한 기능을 추가하고 이를 통합했다. 데이터브릭스의 엔지니어링 담당 부사장 나빈 라오(Naveen Rao)는 "텐서RT-LLM은 사용이 간편하고, 다양한 기능을 갖추고 있으며 효율적이다. 이 솔루션은 엔비디아 GPU를 사용해 대규모 언어 모델 서비스를 위한 최첨단 성능을 제공하며, 고객에게 비용 절감 효과를 전달한다"고 밝혔다.

 

텐서RT-LLM은 엔비디아의 풀스택 AI 플랫폼에서 지속적인 혁신을 보여주는 최신 기술이다. 이러한 소프트웨어의 발전은 사용자에게 추가 비용 없이 계속해서 향상된 성능을 제공하며, 오늘날의 광범위한 AI 워크로드에서 다용도로 활용할 수 있다.

 

메인스트림 서버에서 추론을 향상시키는 L4

최신 MLPerf 벤치마크에서 엔비디아 L4 GPU(L4 GPUs)는 모든 워크로드를 실행하며 전반적으로 뛰어난 성능을 선보였다. 일례로, 소형 72W 어댑터 카드에서 실행되는 L4 GPU는 약 5배 높은 전력 소비를 요구하는 CPU보다 최대 6배 이상의 성능을 제공했다. 또한, 엔비디아 테스트에서는 전용 미디어 엔진이 탑재된 L4 GPU가 쿠다(CUDA) 소프트웨어와 결합해 컴퓨터 비전 속도를 최대 120배까지 향상시키는 것으로 확인됐다.

 

L4 GPU구글 클라우드(Google Cloud)를 비롯한 많은 시스템 빌더에서 사용할 수 있다. 또한 개인용 인터넷 서비스부터 신약 개발까지 다양한 산업 분야의 고객에게 서비스를 제공하고 있다.

 

엣지에서의 성능 향상

이와 별개로 엔비디아는 새로운 모델 압축 기술을 통해 L4 GPU에서 버트(BERT) 대규모 언어 모델을 실행해 4.7배의 성능 향상을 시연했다. 그 결과 새로운 기능을 선보이는 MLPerf의 오픈 디비전 부문에서 우수한 평가를 받았다.

 

이 기술은 모든 AI 워크로드에서 활용될 것으로 예상된다. 특히, 크기와 전력 소비에 제약이 있는 엣지 디바이스에서 모델을 실행할 때 유용하게 사용될 수 있다.

 

엣지 컴퓨팅의 선도적인 입지를 보여주는 또 다른 예로, 엔비디아 젯슨 오린 시스템 모듈(Jetson Orin system-on-module)이 있다. 이는 엣지 AI와 로봇 시나리오에서 흔히 사용되는 컴퓨터 비전 사용 사례인 물체 감지 분야에서 이전 라운드에 비해 최대 84%의 성능 향상을 선보였다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).png

 

 

 

젯슨 오린의 발전에는 프로그래머블 비전 가속기, 엔비디아 암페어 아키텍처 GPU(Ampere architecture GPU), 전용 딥 러닝 가속기 등과 같은 최신 버전의 칩 코어를 이용하는 소프트웨어가 활용됐다.

 

다양한 성능, 광범위한 에코시스템

MLPerf 벤치마크는 공정하고 객관적이기 때문에 사용자는 그 결과를 바탕으로 정보에 입각한 구매 결정을 내릴 수 있다. 광범위한 사용 사례와 시나리오를 다루어 사용자는 신뢰 가능하고 유연하게 배포할 수 있는 성능을 확인한다.

 

이번 라운드에 참여한 파트너로는 클라우드 서비스 제공업체인 마이크로소프트 애저(Microsoft Azure), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure), 시스템 제조업체인 에이수스(ASUS), 커넥트 테크(Connect Tech), 델 테크놀로지스(Dell Technologies), 후지쯔(Fujitsu), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro) 등이 있다.

 

MLPerf는 알리바바(Alibaba), Arm, 시스코(Cisco), 구글(Google), 하버드 대학교, 인텔(Intel), 메타, 마이크로소프트(Microsoft), 토론토 대학교를 포함한 70개 이상의 조직이 후원하고 있다.

 

#엔비디아#MLPerf#그레이스호퍼#

?

  1. 리미니스트리트, 오라클 데이터베이스 이용 현황 조사 <데이터베이스 로드맵의 미래를 주도하는 힘> 발표

    - 현재 버전에 만족하지만 유지보수에 필요한 비용과 시스템 관리, 정기적인 업그레이드에 어려움 리미니스트리트(Rimini Street)는 오늘, 미국 IT 관리자들을 대상으로 오라클 데이터베이스 이용 현황을 조사한 <오라클 데이터베이스 로드맵의 미래를 주도하...
    Date2024.03.27 Bynewsit Views389
    Read More
  2. SAP 석세스팩터스, ‘SAP HR 커넥트 2024’ 성료

    - 온프레미스 HCM 솔루션을 클라우드로 이전해 기업 민첩성, 운영 효율성, 혁신성 확보 - LG CNS, LG 이노텍, 한독, 두산디지털이노베이션 등 국내 고객 사례 공개 SAP는 클라우드 HCM(인적자본관리) 솔루션 SAP 석세스팩터스(SAP SuccessFactors)가 국내 기업...
    Date2024.03.27 Bynewsit Views466
    Read More
  3. 마이크로스트레티지, 뉴질랜드 오클랜드 대학교에 BI 분석 플랫폼 구축

    - 6,000명 이상의 사용자가 마이크로스트레티지 클라우드 분석을 통해 최고의 사용자 경험 구현 마이크로스트레티지 코리아는 오늘, 뉴질랜드 오클랜드 대학교에 자사의 비즈니스 인텔리전스(BI) 분석 플랫폼을 구축했다고 밝혔다. 오클랜드 대학교는 뉴질랜드...
    Date2024.03.27 Bynewsit Views361
    Read More
  4. 서비스나우, 국내 금융 업계의 AI 기반 플랫폼 IT 혁신 지원 본격화

    - 서비스나우, EY한영 -메가존클라우드와 파트너 네트워크 강화 더 나은 업무 환경을 제공하는 디지털 비즈니스 플랫폼 서비스나우(ServiceNow)가 국내 금융 업계를 지원하기 위해 파트너십을 강화한다고 밝혔다. 파트너십 강화를 위해, 서비스나우는 EY한영 ...
    Date2024.03.26 Bynewsit Views360
    Read More
  5. 다쏘시스템, 아레나에 ‘3D익스피리언스 웍스 솔루션’ 적용…“빠르고 지속가능한 프로토타입 제작 지원”

    - 아레나, 협업, 생산성 및 품질 향상위해 다쏘시스템 3D익스피리언스 웍스 적용… 클라우드 기반 설계 및 시뮬레이션 기능으로 아레나 수경 프로토타입 제작 주기 70% 단축, 탄소배출량 감소 - 중소기업에 최적화된 3D익스피리언스 웍스, 클라우드 기반 버추얼...
    Date2024.03.26 Bynewsit Views329
    Read More
  6. 헥사곤, 신규 구조광 스캐너 ‘스마트 스캔 VR800’ SIMTOS 2024에서 공개…“업계 최초 스마트 줌 기능 탑재”

    - 13회째 SIMTOS 2024 참가...글로벌 제조 특화 디지털 리얼리티 솔루션 및 신제품 데모 제공 - 이달 출시한 공정별 맞춤 스캐너 및 스캐닝 솔루션도 전시 헥사곤 매뉴팩처링 인텔리전스가 2024년 4월 1일부터 5일까지 일산 킨텍스에서 열리는 국내 최대 생산 ...
    Date2024.03.26 Bynewsit Views420
    Read More
  7. 카테노이드, 숏폼 비디오 플랫폼 ‘찰나’에 ‘숏폼 모아보기’ 기능 신규 출시

    - 자사몰 숏폼 콘텐츠로만 구성한 재생목록…브랜드 인지도 향상 및 시청자 이탈 방지 - 다양한 PCž모바일 디바이스의 디스플레이별 맞춤형 레이아웃 제공 - 제품 구매 링크로 연동되는 상품 배너… 시청자 구매 전환율↑ 국내 최대 서비스형 비디오 테크놀로지(V...
    Date2024.03.26 Bynewsit Views451
    Read More
  8. 테스트웍스, '전국 도로시설물 영상정보 데이터' 구축 성공 수행…“AI 학습용 데이터 구축사업 우수 평가”

    테스트웍스는 오늘, '인공지능(AI) 학습용 데이터 구축 사업'에서 '전국 도로시설물 영상정보 데이터' 구축을 성공적으로 수행했다고 밝혔다. 테스트웍스가 주관기업으로 참여한 '전국 도로시설물 영상정보 데이터' 과제는 다양한 도로 환경에서의 도로시설물 ...
    Date2024.03.26 Bynewsit Views470
    Read More
  9. 유아이패스, ‘AI 서밋 2024’서 기업의 AI 혁신 가속화 지원 발표..."차세대 LLM 제품군 공개"

    - 유아이패스 AI 트러스트 레이어의 신기능 ‘컨텍스트 그라운딩’ 출시 - 비즈니스별 세부 데이터, IBM 왓슨X AI 커넥터, 오토파일럿 업데이트 통해 생성형 AI 모델 고도화 유아이패스가 3월 19일 진행된 ‘AI 서밋’에서 AI의 잠재력을 극대화하는 생성형 AI 신...
    Date2024.03.25 Bynewsit Views327
    Read More
  10. No Image

    미르, AI 기반 ‘MiR1200 팔레트 잭’ 자율이동로봇으로 혁신적인 팔레트 물류 자동화 지원

    자율이동로봇(AMR) 시장의 선도 제조업체인 미르(MiR)는 새로운 자율이동로봇인 ‘MiR1200 팔레트 잭(Pallet Jack)’을 출시한다고 밝혔다. 엔비디아 젯슨 AGX 오린(NVIDIA Jetson AGX Orin)으로 구동되는 첨단 AI 기반 팔레트 감지 기능이 적용된 MiR1200 팔레...
    Date2024.03.25 Bynewsit Views401
    Read More
목록
Board Pagination Prev 1 ... 132 133 134 135 136 137 138 139 140 141 ... 235 Next
/ 235
CLOSE