엔비디아 GH200, L4 GPU 등 클라우드에서 네트워크 엣지까지 AI 실행 성능과 다용성 선보여

- H100 GPU의 추론 성능 두배로 가속화하는 새로운 소프트웨어 텐서RT-LLM 발표

 

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).jpg

 

​​​​​엔비디아가 MLPerf 벤치마크에서 엔비디아 GH200 그레이스 호퍼 슈퍼칩(NVIDIA GH200 Grace Hopper Superchip)이 우수한 성능을 입증했다고 밝혔다. MLPerf에서 처음으로 선보인 엔비디아 GH200 그레이스 호퍼 슈퍼칩은 모든 데이터센터 추론 테스트를 성공적으로 수행하며 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPUs)의 뛰어난 성능을 확장했다.

 

아울러 전반적인 평가 결과에서 클라우드부터 네트워크 엣지까지 엔비디아 AI 플랫폼의 뛰어난 성능과 다용성이 입증됐다.이와는 별도로 엔비디아는 성능, 에너지 효율성, 총소유비용을 획기적으로 개선할 수 있는 추론 소프트웨어를 발표했다.

 

MLPerf에서 활약한 GH200 슈퍼칩

GH200은 하나의 슈퍼칩에 호퍼 GPU와 그레이스 CPU를 연결한다. 이 조합은 더 많은 메모리와 대역폭을 제공하고, CPU와 GPU 간 자동으로 전력을 전환해 성능을 최적화한다.

 

이와는 별도로, 8개의 H100 GPU를 탑재한 엔비디아 HGX H100 시스템(HGX H100 systems)은 이번 라운드의 모든 MLPerf 추론 테스트에서 가장 높은 처리량을 기록했다.

 

그레이스 호퍼 슈퍼칩과 H100 GPU는 컴퓨터 비전, 음성 인식, 의료 영상 추론은 물론, 추천 시스템과 생성형 AI에 사용되는 대규모 언어 모델(LLMs)의 더욱 복잡한 사용 사례 등 MLPerf의 모든 데이터센터 테스트에서 선두를 차지했다.

 

이번 결과는 2018년 MLPerf 벤치마크가 시작된 이래 모든 라운드에서 AI 훈련과 추론 분야에서 선도적인 성능을 입증해온 엔비디아의 기록을 이어가고 있다.

 

최신 MLPerf 라운드에는 추천 시스템에 대한 업데이트된 테스트와 함께 AI 모델의 대략적인 규모를 측정하는 60억 개의 파라미터로 구성된 대규모 언어 모델 GPT-J의 첫 번째 추론 벤치마크가 포함됐다.

 

추론를 가속화하는 텐서RT-LLM(TensorRT-LLM)

엔비디아는 모든 규모의 복잡한 워크로드를 처리하기 위해 추론을 최적화하는 생성형 AI 소프트웨어 텐서RT-LLM(TensorRT-LLM)을 개발했다. 이 오픈 소스 라이브러리는 고객이 이미 구매한 H100 GPU의 추론 성능을 두 배 이상 향상시키는 데 추가 비용 없이 이용 가능하다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (2).jpg

 

엔비디아의 내부 테스트에 따르면 H100 GPU에서 텐서RT-LLM을 사용하면 GPT-J 6B를 실행하는 이전 세대 GPU에 비해 최대 8배의 성능 속도가 향상된다.

 

이 소프트웨어는 메타(Meta), 애니스케일(AnyScale), 코히어(Cohere), 데시(Deci), 그래머리(Grammarly), 미스트럴 AI(Mistral AI), 모자이크ML(MosaicML), 옥토ML(OctoML), 탭나인(Tabnine), 투게더AI(Together AI) 등 주요 기업들과 함께 대규모 언어 모델 추론의 가속화와 최적화를 위한 엔비디아의 연구에서 출발했다.

 

현재 데이터브릭스(Databricks)에 인수된 모자이크ML은 기존의 서비스 스택에 텐서RT-LLM에 필요한 기능을 추가하고 이를 통합했다. 데이터브릭스의 엔지니어링 담당 부사장 나빈 라오(Naveen Rao)는 "텐서RT-LLM은 사용이 간편하고, 다양한 기능을 갖추고 있으며 효율적이다. 이 솔루션은 엔비디아 GPU를 사용해 대규모 언어 모델 서비스를 위한 최첨단 성능을 제공하며, 고객에게 비용 절감 효과를 전달한다"고 밝혔다.

 

텐서RT-LLM은 엔비디아의 풀스택 AI 플랫폼에서 지속적인 혁신을 보여주는 최신 기술이다. 이러한 소프트웨어의 발전은 사용자에게 추가 비용 없이 계속해서 향상된 성능을 제공하며, 오늘날의 광범위한 AI 워크로드에서 다용도로 활용할 수 있다.

 

메인스트림 서버에서 추론을 향상시키는 L4

최신 MLPerf 벤치마크에서 엔비디아 L4 GPU(L4 GPUs)는 모든 워크로드를 실행하며 전반적으로 뛰어난 성능을 선보였다. 일례로, 소형 72W 어댑터 카드에서 실행되는 L4 GPU는 약 5배 높은 전력 소비를 요구하는 CPU보다 최대 6배 이상의 성능을 제공했다. 또한, 엔비디아 테스트에서는 전용 미디어 엔진이 탑재된 L4 GPU가 쿠다(CUDA) 소프트웨어와 결합해 컴퓨터 비전 속도를 최대 120배까지 향상시키는 것으로 확인됐다.

 

L4 GPU구글 클라우드(Google Cloud)를 비롯한 많은 시스템 빌더에서 사용할 수 있다. 또한 개인용 인터넷 서비스부터 신약 개발까지 다양한 산업 분야의 고객에게 서비스를 제공하고 있다.

 

엣지에서의 성능 향상

이와 별개로 엔비디아는 새로운 모델 압축 기술을 통해 L4 GPU에서 버트(BERT) 대규모 언어 모델을 실행해 4.7배의 성능 향상을 시연했다. 그 결과 새로운 기능을 선보이는 MLPerf의 오픈 디비전 부문에서 우수한 평가를 받았다.

 

이 기술은 모든 AI 워크로드에서 활용될 것으로 예상된다. 특히, 크기와 전력 소비에 제약이 있는 엣지 디바이스에서 모델을 실행할 때 유용하게 사용될 수 있다.

 

엣지 컴퓨팅의 선도적인 입지를 보여주는 또 다른 예로, 엔비디아 젯슨 오린 시스템 모듈(Jetson Orin system-on-module)이 있다. 이는 엣지 AI와 로봇 시나리오에서 흔히 사용되는 컴퓨터 비전 사용 사례인 물체 감지 분야에서 이전 라운드에 비해 최대 84%의 성능 향상을 선보였다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).png

 

 

 

젯슨 오린의 발전에는 프로그래머블 비전 가속기, 엔비디아 암페어 아키텍처 GPU(Ampere architecture GPU), 전용 딥 러닝 가속기 등과 같은 최신 버전의 칩 코어를 이용하는 소프트웨어가 활용됐다.

 

다양한 성능, 광범위한 에코시스템

MLPerf 벤치마크는 공정하고 객관적이기 때문에 사용자는 그 결과를 바탕으로 정보에 입각한 구매 결정을 내릴 수 있다. 광범위한 사용 사례와 시나리오를 다루어 사용자는 신뢰 가능하고 유연하게 배포할 수 있는 성능을 확인한다.

 

이번 라운드에 참여한 파트너로는 클라우드 서비스 제공업체인 마이크로소프트 애저(Microsoft Azure), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure), 시스템 제조업체인 에이수스(ASUS), 커넥트 테크(Connect Tech), 델 테크놀로지스(Dell Technologies), 후지쯔(Fujitsu), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro) 등이 있다.

 

MLPerf는 알리바바(Alibaba), Arm, 시스코(Cisco), 구글(Google), 하버드 대학교, 인텔(Intel), 메타, 마이크로소프트(Microsoft), 토론토 대학교를 포함한 70개 이상의 조직이 후원하고 있다.

 

#엔비디아#MLPerf#그레이스호퍼#

?

  1. 신한카드, 애플의 잔가 보장 프로그램 ‘iPhone for life’ 론칭

    신한카드가 아이폰 구매를 고려하는 소비자들의 비용 부담을 낮춘 새로운 아이폰 구매 프로그램을 선보인다. 신한카드는 신규 출시한 아이폰15부터 이용 후 반납 시 최대 45%까지 잔가(잔존가치)를 보장해주는 애플의 ‘iPhone for life’ 프로그램을 새롭게 론...
    Date2023.10.23 Bynewsit Views388
    Read More
  2. 마우저, TE 커넥티비티의 '하이보넥스' 파워튜브 커넥터 공급…“하이브리드 및 전기 자동차의 고전력 애플리케이션 지원”

    마우저 일렉트로닉스(Mouser Electronics)는 TE 커넥티비티의 하이보넥스 파워튜브(HIVONEX PowerTube) 커넥터 제품을 공급한다고 밝혔다. 대용량의 전기 부하를 처리할 수 있도록 구현된 이 파워튜브 커넥터는 모든 하이브리드 및 전기 산업용, 상업용 차량의...
    Date2023.10.23 Bynewsit Views538
    Read More
  3. 트림블, 한국폴리텍대학 인천캠퍼스서 3D BIM 인력 양성 지원

    - 트림블 코리아, 정부 정책 부응 건설 BIM 전문가 양성과 스마트 건설 활성화 지원 - 300인 이하 중소기업 재직자와 대학생 대상 이틀간 무료 오프라인 Cost-BIM 교육 진행 트림블(Trimble) 코리아가 최근 한국폴리텍대학 인천캠퍼스에서 무료 코스트 BIM 교...
    Date2023.10.23 Bynewsit Views635
    Read More
  4. 엔비디아, 폭스콘과 전기차 혁신 강화 위한 파트너십 구축

    - 폭스콘, 엔비디아 토르와 차세대 센서 아키텍처 포함한 엔비디아 드라이브 하이페리온 9 채택 - 드라이브 하이페리온 센서 아키텍처 결합 통해 안전하고 지능적인 전기차의 새로운 시대 실현 엔비디아 CEO 젠슨 황(Jensen Huang)이 대만에서 열린 제4회 연례...
    Date2023.10.23 Bynewsit Views599
    Read More
  5. 알카텔-루슨트, 대규모 코어 네트워크용 대용량 모듈형 섀시 ‘옴니스위치 9912’ 출시

    알카텔-루슨트 엔터프라이즈는 옴니 스위치 제품군의 신제품인 대용량 모듈형 섀시 OmniSwitch 9912를 출시한다고 밝혔다. 기업용 코어 네트워크와 데이터센터 네트워크에 대한 성능 요구사항이 지속적으로 커지고 있는 상황에서, OmniSwitch 9912는 고대역폭...
    Date2023.10.23 Bynewsit Views310
    Read More
  6. 퀀텀, 백업 어플라이언스 ‘DXi 엣지-코어-클라우드 번들’ 발표…”전사 데이터 보호 및 복구 지원“

    - 분산된 엔터프라이즈 인프라 전반을 완벽하게 보호 - DXi 엣지-코어-클라우드 번들, 최대 70배 향상된 스토리지 및 네트워킹 효율성으로 데이터 복제 및 클라우드 계층화 기능 최적화 퀀텀코리아는 오늘, 전사 데이터 보호를 위한 백업 어플라이언스인 ‘DXi ...
    Date2023.10.23 Bynewsit Views371
    Read More
  7. 소니코리아, 국내 사진 및 영상 아티스트 대상 ‘Sony Artisans’ 2기 공개 모집

    - 10월 31일(화)까지 소니와 함께 다양한 콜라보레이션 작품을 선보일 국내 사진 및 영상 아티스트 모집 - 2023년 11월부터 2024년 3월까지, 총 5개월 간 Sony Artisans 활동 기회 제공 - 알파 풀프레임 카메라, 시네마 라인 렌즈 등 촬영 장비 대여 혜택 및 ...
    Date2023.10.23 Bynewsit Views393
    Read More
  8. 앤시스, 삼성전자 파운드리 사업부에 ‘열 및 전력 무결성 솔루션’ 공급

    - 앤시스 다중물리 플랫폼, 이기종 2.5D/3D-IC 멀티-다이 시스템의 전력 및 열 효과 시뮬레이션 및 관리 문제를 해결하기 위한 검증된 솔루션 제공 - 앤시스 레드혹-SC(Ansys Redhawk-SC)과 앤시스 레드혹-SC 일렉트로우써멀(Ansys Redhawk-SC Electrothermal)...
    Date2023.10.23 Bynewsit Views460
    Read More
  9. 스틸시리즈, '네이버 쇼핑 페스타' 참여···“대표 인기 제품 역대급 혜택 제공”

    - 10월 21일 오후 6시, 6시간 동안 프리미엄 게이밍 키보드 Apex Pro TKL(2023) 대단한 특가 진행 - 행사 기간 제품 구매 시 전용 키보드 루프 증정 게이밍 기어 브랜드 스틸시리즈가 2023 네이버 쇼핑 페스타에 공식 참여한다. 스틸시리즈는 10월 21일 토요일...
    Date2023.10.20 Bynewsit Views429
    Read More
  10. 와콤, 신티크 프로 17 & 22 신제품 출시…“프리미엄 액정 타블렛 라인업 확대로 창작 산업 리딩”

    - 디지털 창작 분야 전문가 위한 최고 사양의 프리미엄 액정 타블렛 ‘신티크 프로’ - 창립 40주년 맞아 신제품 출시하며 와콤 신티크 프로 17, 22, 27로 라인업 확대 타블렛 전문 기업 와콤(Wacom)이 신제품 와콤 신티크 프로 17 및 신티크 프로 22 프리미엄 ...
    Date2023.10.20 Bynewsit Views439
    Read More
  11. 벤큐, 2024년 ‘에센셜 보드’ RE03A 시리즈 출시…”향상된 사운드와 밝기로 무장“

    - 안드로이드 11 기반으로 앱을 활용한 다채로운 수업, 이지라이트6를 통한 직관적인 필기, 녹화 지원 - 글로벌 인증 받은 시력보호 및 항균 기능, 클래스룸케어로 교실의 안전과 건강 배려한 점 돋보여 벤큐는 향상된 사운드와 밝기로 무장한 2024년 ‘벤큐 에...
    Date2023.10.19 Bynewsit Views436
    Read More
  12. 삼성전자, ‘S펜 크리에이터 에디션’ 출시…“프리미엄 S펜 경험을 제공“

    삼성전자가 갤럭시 제품에서 프리미엄 S펜 경험을 제공하는 ‘S펜 크리에이터 에디션’을 19일 국내 출시한다. S펜 크리에이터 에디션은 디지털 학습과 개인 창작 활동을 할 때 프리미엄 S펜이 필요한 소비자들을 위해 준비된 드로잉과 필기에 최적화된 제품이다...
    Date2023.10.19 Bynewsit Views359
    Read More
  13. 파수, AI 활용을 위한 보안 교육 프로그램 공개

    파수는 최근 대중화되고 있는 생성형 AI를 안전하게 활용하기 위한 AI 보안 교육을 새롭게 제공한다. AI 보안 교육은 파수가 기존에 제공하던 기업용 보안 교육 프로그램에 추가돼, 임직원들의 보안 의식을 향상하고 업무 시 빈번하게 마주치는 보안 위협에 대...
    Date2023.10.19 Bynewsit Views321
    Read More
  14. 클라이온-나무기술, 클라우드 네이티브 사업 확대 MOU 체결

    - 양사 클라우드 네이티브 기술/서비스 융합…클라우드 네이티브 공동사업 추진 예정 클라우드 서비스 전문기업 클라이온은 나무기술과 클라우드 네이티브 비즈니스 확대를 위한 사업제휴(MOU)를 체결했다고 19일(목) 밝혔다. 이번 업무협약을 통해 양사는 클라...
    Date2023.10.19 Bynewsit Views653
    Read More
  15. 신한투자증권, AI 스타트업 '웨이커'와 MOU 체결

    신한투자증권은 인공지능(AI) 스타트업 웨이커와 클라우드 기술 기반의 오픈 플랫폼 개발을 추진하는 MOU를 체결했다고 19일 밝혔다. 웨이커는 AI 기술을 기반으로 글로벌 증시 데이터베이스를 구축 및 활용하는데 특화된 회사로, 영국의 런던증권거래소그룹(L...
    Date2023.10.19 Bynewsit Views330
    Read More
  16. PICO, ‘모션 트래커’ 클로즈 베타 테스트 진행

    글로벌 VR 선도 기업 피코(PICO)가 내년 상반기 출시를 앞두고 있는 ‘PICO 모션 트래커’의 CBT(Closed Beta Test)를 진행한다. PICO 모션 트래커는 전신을 트래킹 하는 PICO의 전용 악세사리로, 이번 CBT를 통해 VR 핵심 유저들의 의견을 수집해 보다 향상된 V...
    Date2023.10.19 Bynewsit Views323
    Read More
  17. 노르딕, nRF54L 시리즈 출시…“업계에서 가장 효율적인 블루투스 LE 포트폴리오 확장”

    - 노르딕 세미컨덕터의 업계 선도적인 nRF52 시리즈를 계승한 새로운 혁신적인 nRF54L 시리즈, 성능과 효율성 및 보안 측면에서 새로운 기준 수립 노르딕 세미컨덕터(Nordic Semiconductor)는 자사의 4세대 블루투스 LE SoC 제품군인 nRF54 시리즈에 혁신적인 ...
    Date2023.10.19 Bynewsit Views497
    Read More
  18. 딥엑스, 국내 최대 반도체 전시회인 ‘2023 반도체대전’ 참가

    - 딥엑스가 확보한 AI 반도체 초격차 기술 5가지와 서버급 솔루션 DX-H1의 32채널 영상 동시 실시간 AI 연산 처리 데모 시연 등 4개의 제품으로 완성한 올인포 AI 반도체 토탈 솔루션과 실증 데모 전체를 국내 처음 공개할 예정 - 로봇, 스마트 카메라, 스마트...
    Date2023.10.19 Bynewsit Views424
    Read More
  19. C-Power, 바이코 팟캐스트에서 전력 모듈을 이용한 해양 설비 전력 공급 방법 공개

    - 원격 시설 파력 에너지 공급을 통한 해양 경제 활성화 바이코(Vicor)는 해양 파력 에너지 시스템 분야의 글로벌 선도 업체인 C-Power와 파력 에너지의 활용 및 저장 방법에 대해 이야기를 나눴다. C-Power의 혁신적인 해양 설비용 재생 에너지 전력 솔루션은...
    Date2023.10.19 Bynewsit Views537
    Read More
  20. ST, 고정밀 중전압 연산 증폭기 「TSB182」 출시…“산업 및 자동차 애플리케이션 센서 신호 컨디셔닝 지원”

    ST마이크로일렉트로닉스가 센서의 고정밀 신호 컨디셔닝을 지원하는 듀얼 연산 증폭기 TSB182를 출시했다. TSB182는 최대 20µV의 입력 오프셋 전압과 온도에 따른 100nV/°C 드리프트를 비롯해 중전압 애플리케이션에 적합한 4V ~ 36V에 이르는 동작 범위를 제...
    Date2023.10.19 Bynewsit Views471
    Read More
Board Pagination Prev 1 ... 185 186 187 188 189 190 191 192 193 194 ... 288 Next
/ 288
CLOSE