엔비디아 GH200, L4 GPU 등 클라우드에서 네트워크 엣지까지 AI 실행 성능과 다용성 선보여

- H100 GPU의 추론 성능 두배로 가속화하는 새로운 소프트웨어 텐서RT-LLM 발표

 

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).jpg

 

​​​​​엔비디아가 MLPerf 벤치마크에서 엔비디아 GH200 그레이스 호퍼 슈퍼칩(NVIDIA GH200 Grace Hopper Superchip)이 우수한 성능을 입증했다고 밝혔다. MLPerf에서 처음으로 선보인 엔비디아 GH200 그레이스 호퍼 슈퍼칩은 모든 데이터센터 추론 테스트를 성공적으로 수행하며 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPUs)의 뛰어난 성능을 확장했다.

 

아울러 전반적인 평가 결과에서 클라우드부터 네트워크 엣지까지 엔비디아 AI 플랫폼의 뛰어난 성능과 다용성이 입증됐다.이와는 별도로 엔비디아는 성능, 에너지 효율성, 총소유비용을 획기적으로 개선할 수 있는 추론 소프트웨어를 발표했다.

 

MLPerf에서 활약한 GH200 슈퍼칩

GH200은 하나의 슈퍼칩에 호퍼 GPU와 그레이스 CPU를 연결한다. 이 조합은 더 많은 메모리와 대역폭을 제공하고, CPU와 GPU 간 자동으로 전력을 전환해 성능을 최적화한다.

 

이와는 별도로, 8개의 H100 GPU를 탑재한 엔비디아 HGX H100 시스템(HGX H100 systems)은 이번 라운드의 모든 MLPerf 추론 테스트에서 가장 높은 처리량을 기록했다.

 

그레이스 호퍼 슈퍼칩과 H100 GPU는 컴퓨터 비전, 음성 인식, 의료 영상 추론은 물론, 추천 시스템과 생성형 AI에 사용되는 대규모 언어 모델(LLMs)의 더욱 복잡한 사용 사례 등 MLPerf의 모든 데이터센터 테스트에서 선두를 차지했다.

 

이번 결과는 2018년 MLPerf 벤치마크가 시작된 이래 모든 라운드에서 AI 훈련과 추론 분야에서 선도적인 성능을 입증해온 엔비디아의 기록을 이어가고 있다.

 

최신 MLPerf 라운드에는 추천 시스템에 대한 업데이트된 테스트와 함께 AI 모델의 대략적인 규모를 측정하는 60억 개의 파라미터로 구성된 대규모 언어 모델 GPT-J의 첫 번째 추론 벤치마크가 포함됐다.

 

추론를 가속화하는 텐서RT-LLM(TensorRT-LLM)

엔비디아는 모든 규모의 복잡한 워크로드를 처리하기 위해 추론을 최적화하는 생성형 AI 소프트웨어 텐서RT-LLM(TensorRT-LLM)을 개발했다. 이 오픈 소스 라이브러리는 고객이 이미 구매한 H100 GPU의 추론 성능을 두 배 이상 향상시키는 데 추가 비용 없이 이용 가능하다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (2).jpg

 

엔비디아의 내부 테스트에 따르면 H100 GPU에서 텐서RT-LLM을 사용하면 GPT-J 6B를 실행하는 이전 세대 GPU에 비해 최대 8배의 성능 속도가 향상된다.

 

이 소프트웨어는 메타(Meta), 애니스케일(AnyScale), 코히어(Cohere), 데시(Deci), 그래머리(Grammarly), 미스트럴 AI(Mistral AI), 모자이크ML(MosaicML), 옥토ML(OctoML), 탭나인(Tabnine), 투게더AI(Together AI) 등 주요 기업들과 함께 대규모 언어 모델 추론의 가속화와 최적화를 위한 엔비디아의 연구에서 출발했다.

 

현재 데이터브릭스(Databricks)에 인수된 모자이크ML은 기존의 서비스 스택에 텐서RT-LLM에 필요한 기능을 추가하고 이를 통합했다. 데이터브릭스의 엔지니어링 담당 부사장 나빈 라오(Naveen Rao)는 "텐서RT-LLM은 사용이 간편하고, 다양한 기능을 갖추고 있으며 효율적이다. 이 솔루션은 엔비디아 GPU를 사용해 대규모 언어 모델 서비스를 위한 최첨단 성능을 제공하며, 고객에게 비용 절감 효과를 전달한다"고 밝혔다.

 

텐서RT-LLM은 엔비디아의 풀스택 AI 플랫폼에서 지속적인 혁신을 보여주는 최신 기술이다. 이러한 소프트웨어의 발전은 사용자에게 추가 비용 없이 계속해서 향상된 성능을 제공하며, 오늘날의 광범위한 AI 워크로드에서 다용도로 활용할 수 있다.

 

메인스트림 서버에서 추론을 향상시키는 L4

최신 MLPerf 벤치마크에서 엔비디아 L4 GPU(L4 GPUs)는 모든 워크로드를 실행하며 전반적으로 뛰어난 성능을 선보였다. 일례로, 소형 72W 어댑터 카드에서 실행되는 L4 GPU는 약 5배 높은 전력 소비를 요구하는 CPU보다 최대 6배 이상의 성능을 제공했다. 또한, 엔비디아 테스트에서는 전용 미디어 엔진이 탑재된 L4 GPU가 쿠다(CUDA) 소프트웨어와 결합해 컴퓨터 비전 속도를 최대 120배까지 향상시키는 것으로 확인됐다.

 

L4 GPU구글 클라우드(Google Cloud)를 비롯한 많은 시스템 빌더에서 사용할 수 있다. 또한 개인용 인터넷 서비스부터 신약 개발까지 다양한 산업 분야의 고객에게 서비스를 제공하고 있다.

 

엣지에서의 성능 향상

이와 별개로 엔비디아는 새로운 모델 압축 기술을 통해 L4 GPU에서 버트(BERT) 대규모 언어 모델을 실행해 4.7배의 성능 향상을 시연했다. 그 결과 새로운 기능을 선보이는 MLPerf의 오픈 디비전 부문에서 우수한 평가를 받았다.

 

이 기술은 모든 AI 워크로드에서 활용될 것으로 예상된다. 특히, 크기와 전력 소비에 제약이 있는 엣지 디바이스에서 모델을 실행할 때 유용하게 사용될 수 있다.

 

엣지 컴퓨팅의 선도적인 입지를 보여주는 또 다른 예로, 엔비디아 젯슨 오린 시스템 모듈(Jetson Orin system-on-module)이 있다. 이는 엣지 AI와 로봇 시나리오에서 흔히 사용되는 컴퓨터 비전 사용 사례인 물체 감지 분야에서 이전 라운드에 비해 최대 84%의 성능 향상을 선보였다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).png

 

 

 

젯슨 오린의 발전에는 프로그래머블 비전 가속기, 엔비디아 암페어 아키텍처 GPU(Ampere architecture GPU), 전용 딥 러닝 가속기 등과 같은 최신 버전의 칩 코어를 이용하는 소프트웨어가 활용됐다.

 

다양한 성능, 광범위한 에코시스템

MLPerf 벤치마크는 공정하고 객관적이기 때문에 사용자는 그 결과를 바탕으로 정보에 입각한 구매 결정을 내릴 수 있다. 광범위한 사용 사례와 시나리오를 다루어 사용자는 신뢰 가능하고 유연하게 배포할 수 있는 성능을 확인한다.

 

이번 라운드에 참여한 파트너로는 클라우드 서비스 제공업체인 마이크로소프트 애저(Microsoft Azure), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure), 시스템 제조업체인 에이수스(ASUS), 커넥트 테크(Connect Tech), 델 테크놀로지스(Dell Technologies), 후지쯔(Fujitsu), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro) 등이 있다.

 

MLPerf는 알리바바(Alibaba), Arm, 시스코(Cisco), 구글(Google), 하버드 대학교, 인텔(Intel), 메타, 마이크로소프트(Microsoft), 토론토 대학교를 포함한 70개 이상의 조직이 후원하고 있다.

 

#엔비디아#MLPerf#그레이스호퍼#

?

  1. 우리의식탁, 제주도 ‘글로시말차’ 카페 오픈..."프리미엄 말차의 오감만족"

    - 해안도로에 위치한 약 1,000평의 넓은 문화 공간…2주 만에 방문객 1천명 넘겨 - 현지 농부 등과 협력한 100% 유기농 녹차 개발, 프리미엄 라이프스타일 브랜드로 확장 우리의식탁 제주법인 컬쳐히어로제주가 제주도에 말차 전문 카페 ‘GLOSSY MATCHA(글로시...
    Date2023.10.18 Bynewsit Views380
    Read More
  2. 윈드리버, 中 전기차 호존의 지능형 차량 플랫폼에 ‘윈드리버 리눅스’ 공급

    윈드리버는 중국 전기차 제조업체 ‘호존(Hozon New Energy Automobile Co., Ltd.)’이 ‘호존 오토모티브 지능형 보안 차량 플랫폼(Hozon Automotive Intelligent Security Vehicle Platform)’ 개발을 위해 ‘윈드리버 리눅스(Wind River Linux)’를 채택했다고 밝...
    Date2023.10.18 Bynewsit Views549
    Read More
  3. 포티넷, 구글 클라우드와의 파트너십 통해 글로벌 SASE PoP 확장  

    - 구글 클라우드 네트워크의 글로벌 네트워크 엣지 로케이션을 통해 포티넷 유니버셜 SASE(Universal SASE) 고객을 위한 POP 커버리지 확대 포티넷 코리아는 오늘, 구글 클라우드(Google Cloud)와의 파트너십을 통해 자사의 SASE POP를 새로운 로케이션으로 확...
    Date2023.10.18 Bynewsit Views341
    Read More
  4. ASUS, ‘어도비’ 무료 구독 체험 이벤트 진행…“크리에이터 혜택 강화”

    - 에이수스, 어도비 크리에이티브 클라우드에 이어 애크로뱃 스탠다드 DC, 서브스턴스 3D 무료 구독 체험 추가 지원 - 컨슈머 노트북 포함 행사 제품 구매 고객 대상으로 2024년 8월 31일까지 진행 - 에이수스 크리에이터 노트북, 고성능 프로세서 및 디스플레...
    Date2023.10.18 Bynewsit Views384
    Read More
  5. 흥국화재, “오라클 클라우드 도입으로 IFRS17 대응 디지털 역량 강화“

    - 기존 온프레미스 업무 시스템의 오라클 클라우드 전환 통해 IFRS17 대응 역량 강화 오라클은 흥국화재가 올해 초부터 시행된 국제회계기준 IFRS17 등과 같이 급변하는 금융시장 규제준수 요건에 대응하고 장기적 성장의 핵심인 디지털 역량 강화를 위해 최근...
    Date2023.10.18 Bynewsit Views592
    Read More
  6. 가트너, 2024년 10대 전략 기술 트렌드 발표

    - IT 리더, 불확실성 속 전략적 기술 투자 로드맵 수립해야 … 가트너 10대 전략 기술 트렌드, 향후 36개월 이내에 CIO와 기타 IT 리더에게 상당한 변화와 기회 가져올 것 가트너(Garnter)가 ‘2024년 기업들이 주목해야 할 10대 전략 기술 트렌드’를 발표했다. ...
    Date2023.10.17 Bynewsit Views676
    Read More
  7. 트렌드마이크로, 국내 최대 클라우드 보안 컨퍼런스 ‘CLOUDSEC 2023’ 개최

    - AWS, SK쉴더스, LG CNS, 메가존클라우드, 한국인터넷진흥원(KISA) 등 클라우드 활용과 미래 보안 전략 수립 위한 인사이트 공유 트렌드마이크로는 10월 18일(수)부터 20일(금)까지, 삼성동 그랜드 인터컨티넨탈 서울 파르나스 그랜드볼룸에서 국내 최대 규모...
    Date2023.10.17 Bynewsit Views354
    Read More
  8. 델, ‘파워플렉스’ 최신 버전과 MS 애저용 ‘에이펙스 블록 스토리지’ 출시…“멀티클라우드 환경에서 효율성과 성능 강화”  

    - 파일 스토리지 관련 성능과 기능을 대폭 강화하고, AIOps 소프트웨어인 ‘클라우드IQ(CloudIQ)’와의 통합성을 향상시킨 ‘델 파워플렉스 4.5’ 출시 - 엔터프라이즈 데이터 스토리지의 성능과 소프트웨어 기능을 퍼블릭 클라우드에서도 누릴 수 있도록 연결성을...
    Date2023.10.17 Bynewsit Views643
    Read More
  9. ASUS, 게임스컴 2023에서 ‘ROG·TUF Gaming Z790’ 메인보드 공개

    - LGA 1700 소켓용 12세대, 13세대 및 차세대 INTEL 코어 프로세서 지원 - 와이파이 Q-안테나, 와이파이 7, PCIe 5.0, 썬더볼트 4, 고속 충전 가능한 USB 20Gbps 포트 제공 - AI 오버클러킹, AI 쿨링 II, AEMP II 및 Q-안테나, M.2 Q-래치, PCIe 슬롯용 Q릴리...
    Date2023.10.16 Bynewsit Views359
    Read More
  10. NXP, S32K3 차량용 MCU에 AWS 클라우드 서비스 지원

    NXP 반도체가 차체, 영역 제어, 전기화 애플리케이션을 위한 S32K3 차량용 마이크로컨트롤러(MCU) 시리즈에 아마존웹서비스(AWS) 클라우드 서비스를 통합하고, NXP S32 차량 컴퓨팅 플랫폼 전반에서 보안 클라우드 연결 지원을 확장한다고 밝혔다. 이제 차량용...
    Date2023.10.16 Bynewsit Views580
    Read More
  11. 제스프로, 디지털 인프라 솔루션 전문 기업 ‘버티브(Vertiv)’와 파트너 계약 체결…“ 데이터센터 인프라 최적화 솔루션 공급”

    토털 IT 솔루션 전문 기업 제스프로는 오늘, 글로벌 디지털 인프라 및 연속성 솔루션 전문 기업인 버티브(Vertiv)과 파트너 계약을 체결하고 데이터센터 인프라 관리 솔루션을 공급한다고 밝혔다. 양사는 버티브의 데이터센터 인프라 관리를 위한 전원 솔루션,...
    Date2023.10.16 Bynewsit Views625
    Read More
  12. NCH코리아, 환경 캠페인 ‘플로고(PLOGGO)' 진행…”SG 경영 적극 실천”

    NCH코리아는 지난 10월 13일에 반포 한강공원에서 쓰레기를 수거하는 플로깅 활동인 환경 캠페인 '플로고(PLOGGO)'를 성료했다고 밝혔다. 올해 NCH 코리아 플로고 캠페인에는 40여 명의 임직원이 참여했으며, 당일 쓰레기를 가장 많이 수거한 직원에게는 친환...
    Date2023.10.16 Bynewsit Views621
    Read More
  13. 에지오, 고급 애플리케이션 보호 및 성능 최적화 솔루션 ‘애플리케이션 보호 및 성능 번들’ 출시…”구매 비용 맞춤형 모델로 제공”

    - 무료, 프로페셔널, 엔터프라이즈, 프리미어 등 4가지 구매 모델로 제공 - 에지오의 최신 웹 성능 강화 기능과 웹 보안 제품군 및 보안 운영 센터(SOC) 지원 서비스를 결합시켜, 예측할 수 없는 사용량 기반 비용 발생을 없애는 새로운 가격 정책으로 제공 에...
    Date2023.10.16 Bynewsit Views356
    Read More
  14. MSI, 지포스 RTX 40 시리즈 구매 이벤트…“앨런 웨이크2 게임 코드 증정”

    - MSI 지포스 RTX 4090/4080/4070Ti/4070 시리즈 그래픽카드 구매자 대상 엠에스아이코리아는 ‘MSI 지포스 RTX 40 시리즈’ 그래픽카드 구매자들에게 인기 게임인 ‘앨런 웨이크2’ 게임을 증정하는 행사를 진행한다고 밝혔다. ‘MSI 지포스 RTX 4090/RTX 4080/RTX...
    Date2023.10.13 Bynewsit Views558
    Read More
  15. 버티브, Vertiv Liebert APM2 솔루션 UPS 출시…“뛰어난 에너지 효율과 확장성”

    - 컴팩트한 Vertiv Liebert APM2 UPS, 리튬이온 및 VRLA 배터리와 호환 가능 버티브(Vertiv)는 자사의 무정전 전원공급장치(UPS) 시스템 포트폴리오에 에너지 효율과 확장성이 뛰어난 Vertiv Liebert APM2 솔루션을 새롭게 추가한다고 밝혔다. Liebert APM2는 ...
    Date2023.10.13 Bynewsit Views487
    Read More
  16. 로지텍-MS, ’로지텍 X 마이크로소프트 팀즈 데이 2023’ 행사 성료

    - ‘새로운 방식의 일하는 방법(The New Logic of Work)’을 테마로 진행 - 키노트 발표, 패널 세션 및 데모 투어 통해 화상 협업 솔루션 및 인사이트 제공 로지텍은 이달 12일 한국마이크로소프트와 함께 개최한 <로지텍 X 마이크로소프트 팀즈 데이 2023(Logit...
    Date2023.10.13 Bynewsit Views317
    Read More
  17. 캐논코리아, 줌 렌즈 ‘RF10-20mm F4 L IS STM’ 발표…“세계 최초 10mm부터 초광각과 고화질을 함께 실현”

    - 초광각임에도 주변부까지 선명한 고화질 실현하는 줌 렌즈 발표로 캐논 RF 렌즈 라인업 확충 - 광각 렌즈 특유의 주변부 손떨림 현상을 저감하는 ‘주변 통합 제어’를 새롭게 탑재해 주변부 왜곡 억제 캐논코리아는 압도적인 초광각 화각과 고화질 촬영 성능...
    Date2023.10.13 Bynewsit Views386
    Read More
  18. 레드햇, ‘2023 레드햇 APAC 이노베이션 어워드’ 한전KDN·삼성전자‧LX공사 수상

    - 한전KDN·삼성전자 네트워크 사업부, 이노베이션 어워드 수상자로 선정… 창의적인 오픈소스 활용 돋보여 - 레드햇 플랫폼을 통해 클라우드 기반 마련한 LX공사, 레드햇 서밋 커넥트 특별상 수상 레드햇은 업계 최대 오픈소스 기술 연례 행사인 ‘레드햇 서밋 ...
    Date2023.10.12 Bynewsit Views594
    Read More
  19. 스틸시리즈, 프리미엄 게이밍 마우스 ‘에어록스 3 무선 고스트 리미티드 에디션’ 재출시

    - 한정판에서 정식 출시로 검증된 인기, 68g 초경량 설계와 200시간 지속 배터리로 가벼움과 지속력 - 스틸시리즈 네이버 공식 스토어, 10월 11일(수) ~ 10월 22일(일)까지 재발매 기념 프로모션 진행 스틸시리즈(SteelSeries)가 2년 전 고객들에게 많은 관심...
    Date2023.10.12 Bynewsit Views320
    Read More
  20. SAP, 고객 혁신 가속화를 위한 클라우드 서비스 다각화

    SAP가 고객이 클라우드 기술의 이점을 극대화할 수 있도록 지원하는 다양한 새로운 서비스를 발표했다. 이번에 공개된 신규 서비스는 SAP S/4HANA 클라우드 프라이빗 에디션(SAP S/4HANA Cloud, private edition) 2023 릴리스, 라이즈 위드 SAP(RISE with SAP)...
    Date2023.10.12 Bynewsit Views634
    Read More
Board Pagination Prev 1 ... 185 186 187 188 189 190 191 192 193 194 ... 287 Next
/ 287
CLOSE