엔비디아 GH200, L4 GPU 등 클라우드에서 네트워크 엣지까지 AI 실행 성능과 다용성 선보여

- H100 GPU의 추론 성능 두배로 가속화하는 새로운 소프트웨어 텐서RT-LLM 발표

 

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).jpg

 

​​​​​엔비디아가 MLPerf 벤치마크에서 엔비디아 GH200 그레이스 호퍼 슈퍼칩(NVIDIA GH200 Grace Hopper Superchip)이 우수한 성능을 입증했다고 밝혔다. MLPerf에서 처음으로 선보인 엔비디아 GH200 그레이스 호퍼 슈퍼칩은 모든 데이터센터 추론 테스트를 성공적으로 수행하며 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPUs)의 뛰어난 성능을 확장했다.

 

아울러 전반적인 평가 결과에서 클라우드부터 네트워크 엣지까지 엔비디아 AI 플랫폼의 뛰어난 성능과 다용성이 입증됐다.이와는 별도로 엔비디아는 성능, 에너지 효율성, 총소유비용을 획기적으로 개선할 수 있는 추론 소프트웨어를 발표했다.

 

MLPerf에서 활약한 GH200 슈퍼칩

GH200은 하나의 슈퍼칩에 호퍼 GPU와 그레이스 CPU를 연결한다. 이 조합은 더 많은 메모리와 대역폭을 제공하고, CPU와 GPU 간 자동으로 전력을 전환해 성능을 최적화한다.

 

이와는 별도로, 8개의 H100 GPU를 탑재한 엔비디아 HGX H100 시스템(HGX H100 systems)은 이번 라운드의 모든 MLPerf 추론 테스트에서 가장 높은 처리량을 기록했다.

 

그레이스 호퍼 슈퍼칩과 H100 GPU는 컴퓨터 비전, 음성 인식, 의료 영상 추론은 물론, 추천 시스템과 생성형 AI에 사용되는 대규모 언어 모델(LLMs)의 더욱 복잡한 사용 사례 등 MLPerf의 모든 데이터센터 테스트에서 선두를 차지했다.

 

이번 결과는 2018년 MLPerf 벤치마크가 시작된 이래 모든 라운드에서 AI 훈련과 추론 분야에서 선도적인 성능을 입증해온 엔비디아의 기록을 이어가고 있다.

 

최신 MLPerf 라운드에는 추천 시스템에 대한 업데이트된 테스트와 함께 AI 모델의 대략적인 규모를 측정하는 60억 개의 파라미터로 구성된 대규모 언어 모델 GPT-J의 첫 번째 추론 벤치마크가 포함됐다.

 

추론를 가속화하는 텐서RT-LLM(TensorRT-LLM)

엔비디아는 모든 규모의 복잡한 워크로드를 처리하기 위해 추론을 최적화하는 생성형 AI 소프트웨어 텐서RT-LLM(TensorRT-LLM)을 개발했다. 이 오픈 소스 라이브러리는 고객이 이미 구매한 H100 GPU의 추론 성능을 두 배 이상 향상시키는 데 추가 비용 없이 이용 가능하다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (2).jpg

 

엔비디아의 내부 테스트에 따르면 H100 GPU에서 텐서RT-LLM을 사용하면 GPT-J 6B를 실행하는 이전 세대 GPU에 비해 최대 8배의 성능 속도가 향상된다.

 

이 소프트웨어는 메타(Meta), 애니스케일(AnyScale), 코히어(Cohere), 데시(Deci), 그래머리(Grammarly), 미스트럴 AI(Mistral AI), 모자이크ML(MosaicML), 옥토ML(OctoML), 탭나인(Tabnine), 투게더AI(Together AI) 등 주요 기업들과 함께 대규모 언어 모델 추론의 가속화와 최적화를 위한 엔비디아의 연구에서 출발했다.

 

현재 데이터브릭스(Databricks)에 인수된 모자이크ML은 기존의 서비스 스택에 텐서RT-LLM에 필요한 기능을 추가하고 이를 통합했다. 데이터브릭스의 엔지니어링 담당 부사장 나빈 라오(Naveen Rao)는 "텐서RT-LLM은 사용이 간편하고, 다양한 기능을 갖추고 있으며 효율적이다. 이 솔루션은 엔비디아 GPU를 사용해 대규모 언어 모델 서비스를 위한 최첨단 성능을 제공하며, 고객에게 비용 절감 효과를 전달한다"고 밝혔다.

 

텐서RT-LLM은 엔비디아의 풀스택 AI 플랫폼에서 지속적인 혁신을 보여주는 최신 기술이다. 이러한 소프트웨어의 발전은 사용자에게 추가 비용 없이 계속해서 향상된 성능을 제공하며, 오늘날의 광범위한 AI 워크로드에서 다용도로 활용할 수 있다.

 

메인스트림 서버에서 추론을 향상시키는 L4

최신 MLPerf 벤치마크에서 엔비디아 L4 GPU(L4 GPUs)는 모든 워크로드를 실행하며 전반적으로 뛰어난 성능을 선보였다. 일례로, 소형 72W 어댑터 카드에서 실행되는 L4 GPU는 약 5배 높은 전력 소비를 요구하는 CPU보다 최대 6배 이상의 성능을 제공했다. 또한, 엔비디아 테스트에서는 전용 미디어 엔진이 탑재된 L4 GPU가 쿠다(CUDA) 소프트웨어와 결합해 컴퓨터 비전 속도를 최대 120배까지 향상시키는 것으로 확인됐다.

 

L4 GPU구글 클라우드(Google Cloud)를 비롯한 많은 시스템 빌더에서 사용할 수 있다. 또한 개인용 인터넷 서비스부터 신약 개발까지 다양한 산업 분야의 고객에게 서비스를 제공하고 있다.

 

엣지에서의 성능 향상

이와 별개로 엔비디아는 새로운 모델 압축 기술을 통해 L4 GPU에서 버트(BERT) 대규모 언어 모델을 실행해 4.7배의 성능 향상을 시연했다. 그 결과 새로운 기능을 선보이는 MLPerf의 오픈 디비전 부문에서 우수한 평가를 받았다.

 

이 기술은 모든 AI 워크로드에서 활용될 것으로 예상된다. 특히, 크기와 전력 소비에 제약이 있는 엣지 디바이스에서 모델을 실행할 때 유용하게 사용될 수 있다.

 

엣지 컴퓨팅의 선도적인 입지를 보여주는 또 다른 예로, 엔비디아 젯슨 오린 시스템 모듈(Jetson Orin system-on-module)이 있다. 이는 엣지 AI와 로봇 시나리오에서 흔히 사용되는 컴퓨터 비전 사용 사례인 물체 감지 분야에서 이전 라운드에 비해 최대 84%의 성능 향상을 선보였다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).png

 

 

 

젯슨 오린의 발전에는 프로그래머블 비전 가속기, 엔비디아 암페어 아키텍처 GPU(Ampere architecture GPU), 전용 딥 러닝 가속기 등과 같은 최신 버전의 칩 코어를 이용하는 소프트웨어가 활용됐다.

 

다양한 성능, 광범위한 에코시스템

MLPerf 벤치마크는 공정하고 객관적이기 때문에 사용자는 그 결과를 바탕으로 정보에 입각한 구매 결정을 내릴 수 있다. 광범위한 사용 사례와 시나리오를 다루어 사용자는 신뢰 가능하고 유연하게 배포할 수 있는 성능을 확인한다.

 

이번 라운드에 참여한 파트너로는 클라우드 서비스 제공업체인 마이크로소프트 애저(Microsoft Azure), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure), 시스템 제조업체인 에이수스(ASUS), 커넥트 테크(Connect Tech), 델 테크놀로지스(Dell Technologies), 후지쯔(Fujitsu), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro) 등이 있다.

 

MLPerf는 알리바바(Alibaba), Arm, 시스코(Cisco), 구글(Google), 하버드 대학교, 인텔(Intel), 메타, 마이크로소프트(Microsoft), 토론토 대학교를 포함한 70개 이상의 조직이 후원하고 있다.

 

#엔비디아#MLPerf#그레이스호퍼#

?

  1. 헥사곤, 2023 KSAE 대학생 자작자동차대회 후원팀 우승…“자동차 분야 미래 인재 육성 결실”

    - 헥사곤, 7년째 KSAE 후원 참여로 자사 ‘아담스 카(Adams/Car)’ 라이선스 및 교육 제공 - 올해 65개 대학 100팀 약 2,000명 지원, 우승팀 포함 헥사곤 후원 팀 다수 입상 쾌거 헥사곤 매뉴팩처링 인텔리전스가 후원한 2023 KSAE 대학생 자작자동차대회 참가 ...
    Date2023.09.20 Bynewsit Views566
    Read More
  2. 매스웍스, 매트랩 및 시뮬링크 릴리스 2023b 발표

    - 항공우주, 자동차, 무선 통신 업계 엔지니어, 연구원을 위한 모델 기반 설계 단순화 - 시뮬링크 폴트 애널라이저 및 폴리스페이스 테스트로 체계적인 시뮬레이션 수행 가능 매스웍스가 매트랩(MATLAB) 및 시뮬링크(Simulink) 제품군의 릴리스 2023b를 발표했...
    Date2023.09.20 Bynewsit Views536
    Read More
  3. 사이냅소프트, 국내 최초 ‘동시 편집’ 에디터 연내 출시…“실시간 스마트 협업 가능“

    사이냅소프트는 오늘 AI 기반 웹콘텐츠 저작·편집 솔루션인 ‘사이냅 에디터’의 신규 버전을 연내 출시할 계획이라고 밝혔다. 사이냅 에디터 신규 버전의 공동 편집 기능은 여러 사용자가 동일한 웹 콘텐츠를 함께 보며 동시에 편집하고 작업할 수 있도록 지원...
    Date2023.09.20 Bynewsit Views595
    Read More
  4. 한국레노버, ‘이음 5G를 위한 레노버 테크데이’ 성료…“이음 5G 전용 디바이스, 기술 및 도입 사례 공유”

    - 이음5G 전용 레노버 제품 및 퀄컴 기술, 주요 구축 사례 소개 - 퀄컴∙CJ 올리브네트웍스∙세종텔레콤∙LG유플러스 세션 발표 한국레노버가 퀄컴코리아와 함께 ‘이음 5G(5G 특화망)를 위한 레노버 테크데이’를 성공적으로 마쳤다고 밝혔다. 이번 행사는 업계 최...
    Date2023.09.20 Bynewsit Views312
    Read More
  5. ASUS, 360㎜ 수랭 쿨러 장착한 「ROG Matrix GeForce RTX 4090」 그래픽 카드 출시

    - 2700㎒ 부스트 클럭 제공, 컴퓨텍스서 공개 이후 8개의 오버클럭 기록 보유 - GPU 다이에 액체 금속 화합물을 탑재, 최저 온도 및 최저 소음 달성 - 이전 모델보다 더 큰 냉각판과 강력한 펌프, 360㎜ 라디에이터 및 최적화된 열 방출 위한 데이지 체인 방식...
    Date2023.09.20 Bynewsit Views313
    Read More
  6. 샥즈, ‘오픈핏’에 멀티 포인트 페어링 기능 지원

    - 샥즈 앱에서 최신 펌웨어 업데이트 통해 오픈핏에 멀티 포인트 페어링 기능 사용 가능 - 오픈핏, 혁신적인 디바이스로 인정받으며 ‘KITAS 2023 TOP 10’에 선정 - 9월 30일까지 한가위 맞이 이벤트 진행, 제품 구매자 대상으로 다양한 혜택 제공 글로벌 오픈...
    Date2023.09.20 Bynewsit Views365
    Read More
  7. 팔로알토 네트웍스, 공격 표면 관리 분석 2023 보고서 공개

    - 매달 새롭게 식별되는 노출의 50%는 클라우드의 역동적인 특성에서 기인 팔로알토 네트웍스는 <2023 유닛42 공격 표면 위협 리포트(2023 Unit 42 Attack Surface Threat Report)> 통해 클라우드 환경의 역동적인 특성과 공격 해위자들이 새로운 취약점을 악...
    Date2023.09.20 Bynewsit Views325
    Read More
  8. 블루투스SIG, 네트워크 조명 제어를 위한 풀스택 표준 완성

    - 시장 잠재력이 높은 조명제어 분야에서의 성장을 모색하기 위한 포석 블루투스 SIG는 무선 조명 제어를 위한 최초의 풀스택 표준인 블루투스 네트워크 조명 제어(NLC)가 완성됐다고 발표했다. 블루투스 NLC는 무선 전파에서 디바이스 레이어에 이르기까지 제...
    Date2023.09.20 Bynewsit Views537
    Read More
  9. 슈나이더 일렉트릭, 대화형 AI 도구 통해 지속가능한 디지털 미래 구축

    - 대화형 인공지능 서비스 ‘코파일럿’을 에코스트럭처 리소스 어드바이저에 적용 - 데이터 분석 및 시각화, 의사 결정 지원 및 성능 최적화 기능 제공 슈나이더 일렉트릭이 대화형 AI도구 ‘에코스트럭처 리소스 어드바이저 코파일럿(Resource Advisor Copilot)...
    Date2023.09.20 Bynewsit Views564
    Read More
  10. 싸이타임, 새로운 에포크 플랫폼 출시…“정밀 타이밍 기술 혁신”  

    - 향후 10년간 20억 달러 규모의 시장 개척 - 탁월한 성능과 신뢰성으로 정밀 타이밍 분야 새로운 기준 제시 고정밀 타이밍 솔루션 전문기업 싸이타임(SiTime)은 전자기기의 가장 복잡한 타이밍 문제를 해결하고 100년 된 쿼츠(Quartz) 기반 기술을 혁신하기 ...
    Date2023.09.20 Bynewsit Views434
    Read More
  11. 코드마인드, 오픈소스 관리도구 ‘Hatter SCA’ GS인증 획득

    코드마인드는 오픈소스 관리도구 해터 에스씨에이(Hatter SCA)가 한국정보통신기술협회(TTA) 소프트웨어 시험인증연구소로부터 GS인증 1등급을 획득했다고 20일 밝혔다. GS 인증은 ISO국제 표준을 기반으로 하여 기능적합성, 성능효율성, 사용성, 신뢰성, 보안...
    Date2023.09.20 Bynewsit Views492
    Read More
  12. 캐논코리아, 2023년 상반기 국내 잉크젯 프린터 전체 시장 점유율 34.2%로 1위 달성

    - 스테디셀러인 잉크젯 프린터 PIXMA G 시리즈, MAXIFY GX시리즈 라인업 완성으로 하기 시장 적극 공략 캐논코리아가 2023년 상반기 국내 잉크젯 프린터 전체 시장 점유율 1위를 달성했다고 밝혔다. IT 시장분석 및 컨설팅 기관인 IDC가 발표한 분기별 프린터·...
    Date2023.09.20 Bynewsit Views286
    Read More
  13. AMD, 크리아 K24 SOM 및 스타터 키트 출시…“산업 및 상업용 애플리케이션의 엣지 혁신 가속화”

    - 모터 제어 및 디지털 신호 처리 애플리케이션을 위한 전력 효율적인 프로덕션-레디 솔루션을 보다 신속하게 설계할 수 있도록 지원하는 K24 SOM 및 KD240 키트 AMD는 자사의 크리아(Kria) 적응형 SOM 및 개발자 키트 포트폴리오에 새롭게 추가된 최신 AMD 크...
    Date2023.09.20 Bynewsit Views552
    Read More
  14. SAP 코리아, 하나은행과 상호협력 관계 구축 MOU 체결

    - SAP 코리아, 하나은행과 SAP BTP 기반 애플리케이션 개발 및 구축에 협력 - 잠재 성장 가능성 및 사업 기회 발굴함과 동시에 이를 실행, 확대 위한 상호협력 관계 구축 SAP 코리아는 하나은행과 ‘솔루션 구축 및 금융 사업 협력을 위한 전략적 업무협약’을 ...
    Date2023.09.19 Bynewsit Views543
    Read More
  15. SK텔레콤, AI로 실내·외 유동인구 정밀 분석하는 ‘AI유동인구’ 개발

    SK텔레콤은 자사의 AI 기반 위치 분석 플랫폼 ‘리트머스(LITMUS)’에 실내 측위 기술을 결합해 실내 유동인구를 정밀하게 파악할 수 있는 ‘AI유동인구’ 기술을 개발했다고 19일 밝혔다. 기존 유동인구 분석 기술은 특정 지역 내 기지국 접속 정보를 기반으로 해...
    Date2023.09.19 Bynewsit Views266
    Read More
  16. NH농협캐피탈, 뉴타닉스 클라우드 플랫폼 도입…“백업 복구 역량 강화”

    - 서버 백업 소요시간 67% 단축, 민첩한 백업 및 데이터 복구로 중단 없는 온라인 서비스 제공 - NH농협캐피탈, 확장성과 유연성을 갖춘 IT 인프라 구축으로 미래 경쟁력 제고 뉴타닉스는 국내 대표 금융그룹 NH농협금융의 자회사 NH농협캐피탈이 뉴타닉스 클...
    Date2023.09.19 Bynewsit Views533
    Read More
  17. 퓨어스토리지, 아시아 태평양 및 일본 지역 부사장에 네이슨 홀 선임

    - 퓨어스토리지의 풍부한 경험 갖춘 베테랑 임원, 아태지역 성장 가속화 및 고객들의 혁신적 성과 달성 지원 퓨어스토리지는 아시아 태평양 및 일본(APJ) 지역 부사장에 네이슨 홀(Nathan Hall)을 선임했다고 밝혔다. 네이슨 홀 부사장은 APJ 지역 비즈니스를 ...
    Date2023.09.19 Bynewsit Views364
    Read More
  18. ST, STM32H5 마이크로컨트롤러 디스커버리 키트 출시…“안전하고 스마트한 커넥티드 기기의 신속한 구현”

    - ST가 인증 및 유지관리하는 핵심 보안 서비스를 통합한 턴키 SoC인 보안 매니저(Secure Manager) 지원하는 첫 번째 키트 ST마이크로일렉트로닉스 STM32H5 마이크로컨트롤러(MCU)로 다양한 애플리케이션을 구현할 수 있는 풍성한 기능의 개발 보드를 출시했다...
    Date2023.09.19 Bynewsit Views484
    Read More
  19. 퀀텀, 오브젝트 스토리지 ‘액티브스케일 콜드 스토리지 번들’ 발표…“손쉽게 온프레미스 클라우드 환경으로 전환”

    - 기업이 자체 온프레미스 클라우드 리소스를 사용하여 아카이브 데이터의 가치 극대화 - 유연한 하이브리드 클라우드 워크플로우를 지원하는 퀀텀의 엔드투엔드 데이터 플랫폼의 핵심 - 모든 구성 요소가 포함된 10PB에서 최대 100PB에 이르는 4가지 표준 용...
    Date2023.09.19 Bynewsit Views263
    Read More
  20. 플로우, ‘국내 100대 기업’ 점유율 20% 돌파…“망분리 규제 강화 속 쾌거”

    - 금융권 망분리 업무 환경에 딱 맞춘 온프레미스형 수요 급증 - 포스코, 한국투자증권, 한국가스공사 등 대기업, 금융/공공기관 러브콜 확대 협업툴 플로우 개발사 마드라스체크가 국내 100대 기업 내 사내 서버 설치(온프레미스)형 협업툴 공급 점유율 20%를...
    Date2023.09.19 Bynewsit Views572
    Read More
Board Pagination Prev 1 ... 175 176 177 178 179 180 181 182 183 184 ... 272 Next
/ 272
CLOSE