엔비디아 GH200, L4 GPU 등 클라우드에서 네트워크 엣지까지 AI 실행 성능과 다용성 선보여

- H100 GPU의 추론 성능 두배로 가속화하는 새로운 소프트웨어 텐서RT-LLM 발표

 

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).jpg

 

​​​​​엔비디아가 MLPerf 벤치마크에서 엔비디아 GH200 그레이스 호퍼 슈퍼칩(NVIDIA GH200 Grace Hopper Superchip)이 우수한 성능을 입증했다고 밝혔다. MLPerf에서 처음으로 선보인 엔비디아 GH200 그레이스 호퍼 슈퍼칩은 모든 데이터센터 추론 테스트를 성공적으로 수행하며 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPUs)의 뛰어난 성능을 확장했다.

 

아울러 전반적인 평가 결과에서 클라우드부터 네트워크 엣지까지 엔비디아 AI 플랫폼의 뛰어난 성능과 다용성이 입증됐다.이와는 별도로 엔비디아는 성능, 에너지 효율성, 총소유비용을 획기적으로 개선할 수 있는 추론 소프트웨어를 발표했다.

 

MLPerf에서 활약한 GH200 슈퍼칩

GH200은 하나의 슈퍼칩에 호퍼 GPU와 그레이스 CPU를 연결한다. 이 조합은 더 많은 메모리와 대역폭을 제공하고, CPU와 GPU 간 자동으로 전력을 전환해 성능을 최적화한다.

 

이와는 별도로, 8개의 H100 GPU를 탑재한 엔비디아 HGX H100 시스템(HGX H100 systems)은 이번 라운드의 모든 MLPerf 추론 테스트에서 가장 높은 처리량을 기록했다.

 

그레이스 호퍼 슈퍼칩과 H100 GPU는 컴퓨터 비전, 음성 인식, 의료 영상 추론은 물론, 추천 시스템과 생성형 AI에 사용되는 대규모 언어 모델(LLMs)의 더욱 복잡한 사용 사례 등 MLPerf의 모든 데이터센터 테스트에서 선두를 차지했다.

 

이번 결과는 2018년 MLPerf 벤치마크가 시작된 이래 모든 라운드에서 AI 훈련과 추론 분야에서 선도적인 성능을 입증해온 엔비디아의 기록을 이어가고 있다.

 

최신 MLPerf 라운드에는 추천 시스템에 대한 업데이트된 테스트와 함께 AI 모델의 대략적인 규모를 측정하는 60억 개의 파라미터로 구성된 대규모 언어 모델 GPT-J의 첫 번째 추론 벤치마크가 포함됐다.

 

추론를 가속화하는 텐서RT-LLM(TensorRT-LLM)

엔비디아는 모든 규모의 복잡한 워크로드를 처리하기 위해 추론을 최적화하는 생성형 AI 소프트웨어 텐서RT-LLM(TensorRT-LLM)을 개발했다. 이 오픈 소스 라이브러리는 고객이 이미 구매한 H100 GPU의 추론 성능을 두 배 이상 향상시키는 데 추가 비용 없이 이용 가능하다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (2).jpg

 

엔비디아의 내부 테스트에 따르면 H100 GPU에서 텐서RT-LLM을 사용하면 GPT-J 6B를 실행하는 이전 세대 GPU에 비해 최대 8배의 성능 속도가 향상된다.

 

이 소프트웨어는 메타(Meta), 애니스케일(AnyScale), 코히어(Cohere), 데시(Deci), 그래머리(Grammarly), 미스트럴 AI(Mistral AI), 모자이크ML(MosaicML), 옥토ML(OctoML), 탭나인(Tabnine), 투게더AI(Together AI) 등 주요 기업들과 함께 대규모 언어 모델 추론의 가속화와 최적화를 위한 엔비디아의 연구에서 출발했다.

 

현재 데이터브릭스(Databricks)에 인수된 모자이크ML은 기존의 서비스 스택에 텐서RT-LLM에 필요한 기능을 추가하고 이를 통합했다. 데이터브릭스의 엔지니어링 담당 부사장 나빈 라오(Naveen Rao)는 "텐서RT-LLM은 사용이 간편하고, 다양한 기능을 갖추고 있으며 효율적이다. 이 솔루션은 엔비디아 GPU를 사용해 대규모 언어 모델 서비스를 위한 최첨단 성능을 제공하며, 고객에게 비용 절감 효과를 전달한다"고 밝혔다.

 

텐서RT-LLM은 엔비디아의 풀스택 AI 플랫폼에서 지속적인 혁신을 보여주는 최신 기술이다. 이러한 소프트웨어의 발전은 사용자에게 추가 비용 없이 계속해서 향상된 성능을 제공하며, 오늘날의 광범위한 AI 워크로드에서 다용도로 활용할 수 있다.

 

메인스트림 서버에서 추론을 향상시키는 L4

최신 MLPerf 벤치마크에서 엔비디아 L4 GPU(L4 GPUs)는 모든 워크로드를 실행하며 전반적으로 뛰어난 성능을 선보였다. 일례로, 소형 72W 어댑터 카드에서 실행되는 L4 GPU는 약 5배 높은 전력 소비를 요구하는 CPU보다 최대 6배 이상의 성능을 제공했다. 또한, 엔비디아 테스트에서는 전용 미디어 엔진이 탑재된 L4 GPU가 쿠다(CUDA) 소프트웨어와 결합해 컴퓨터 비전 속도를 최대 120배까지 향상시키는 것으로 확인됐다.

 

L4 GPU구글 클라우드(Google Cloud)를 비롯한 많은 시스템 빌더에서 사용할 수 있다. 또한 개인용 인터넷 서비스부터 신약 개발까지 다양한 산업 분야의 고객에게 서비스를 제공하고 있다.

 

엣지에서의 성능 향상

이와 별개로 엔비디아는 새로운 모델 압축 기술을 통해 L4 GPU에서 버트(BERT) 대규모 언어 모델을 실행해 4.7배의 성능 향상을 시연했다. 그 결과 새로운 기능을 선보이는 MLPerf의 오픈 디비전 부문에서 우수한 평가를 받았다.

 

이 기술은 모든 AI 워크로드에서 활용될 것으로 예상된다. 특히, 크기와 전력 소비에 제약이 있는 엣지 디바이스에서 모델을 실행할 때 유용하게 사용될 수 있다.

 

엣지 컴퓨팅의 선도적인 입지를 보여주는 또 다른 예로, 엔비디아 젯슨 오린 시스템 모듈(Jetson Orin system-on-module)이 있다. 이는 엣지 AI와 로봇 시나리오에서 흔히 사용되는 컴퓨터 비전 사용 사례인 물체 감지 분야에서 이전 라운드에 비해 최대 84%의 성능 향상을 선보였다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).png

 

 

 

젯슨 오린의 발전에는 프로그래머블 비전 가속기, 엔비디아 암페어 아키텍처 GPU(Ampere architecture GPU), 전용 딥 러닝 가속기 등과 같은 최신 버전의 칩 코어를 이용하는 소프트웨어가 활용됐다.

 

다양한 성능, 광범위한 에코시스템

MLPerf 벤치마크는 공정하고 객관적이기 때문에 사용자는 그 결과를 바탕으로 정보에 입각한 구매 결정을 내릴 수 있다. 광범위한 사용 사례와 시나리오를 다루어 사용자는 신뢰 가능하고 유연하게 배포할 수 있는 성능을 확인한다.

 

이번 라운드에 참여한 파트너로는 클라우드 서비스 제공업체인 마이크로소프트 애저(Microsoft Azure), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure), 시스템 제조업체인 에이수스(ASUS), 커넥트 테크(Connect Tech), 델 테크놀로지스(Dell Technologies), 후지쯔(Fujitsu), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro) 등이 있다.

 

MLPerf는 알리바바(Alibaba), Arm, 시스코(Cisco), 구글(Google), 하버드 대학교, 인텔(Intel), 메타, 마이크로소프트(Microsoft), 토론토 대학교를 포함한 70개 이상의 조직이 후원하고 있다.

 

#엔비디아#MLPerf#그레이스호퍼#

?

  1. 캐논코리아, A0/A1 지원하는 대형 잉크젯 프린터 6종 출시…“다양한 비즈니스 환경에 대응”

    - A0 사이즈 대응 3종 ▲TM-5350, 5355, 5340, A1사이즈 대응 3종 ▲TM-5250, 5255, 5240 3종 등 총 6종 - 새로운 화상처리 엔진, 마젠타 잉크, 화상처리시스템을 탑재해 고품질 출력 환경 구축 - 캐논 대형 프린터 제품 중 최초로 스티로폼 대신 골판지 사용으...
    Date2023.09.18 Bynewsit Views148
    Read More
  2. 아카마이, 아태지역 진출 20주년 맞아 ‘미래 비전’ 선포

    - 아카마이, 올해 글로벌 창립 25주년 맞아 … 강력한 기술 헤리티지를 기반으로 증가하는 고객 수요 충족 - 클라우드 컴퓨팅, 보안 및 콘텐츠 전송 부문 전반서 전략적 인수 진행하며 완전한 기술 스택 마련해 … 파트너십 강화와 전반적 인력 확충 등 향후 계...
    Date2023.09.18 Bynewsit Views201
    Read More
  3. 노조미네트웍스-한전KDN, 산업제어시스템 보안 비즈니스 협력 MOU 체결

    노조미네트웍스는 9월 15일 전력 ICT 전문 공기업 한전KDN과 전력 인프라 보안 비즈니스 협력을 위한 업무협약을 체결했다고 밝혔다. 한전KDN 서울인천지역본부에서 진행된 협약식에는 한전KDN 김장현 사장, 김종선 기술원장과 노조미네트웍스 아마르 힌디 부...
    Date2023.09.15 Bynewsit Views210
    Read More
  4. 삼성전자, IBC 2023 참가… 버추얼 프로덕션 스튜디오 전용 ‘더 월’ 유럽 상륙

    삼성전자가 15일부터 18일까지 네덜란드 암스테르담에서 열리는 세계 최대 방송 전문 전시회 ‘IBC 2023’에서 ‘더 월 포 버추얼 프로덕션(The Wall For Virtual Production)’을 선보인다고 밝혔다. 삼성전자는 버추얼 프로덕션 스튜디오 전용 디스플레이 ‘더 월...
    Date2023.09.15 Bynewsit Views161
    Read More
  5. 천재교육•천재교과서, ‘2023 에듀테크 코리아 페어’ 참가

    - 에듀테크 기술 활용한 학습 콘텐츠 선보여 - AI 기술과 교육 현장의 빅데이터와 AI 활용 사례 체험 기회 제공 천재교육과 천재교과서는 오는 21일부터 23일까지 서울 코엑스에서 열리는 ‘2023 에듀테크 코리아 페어(EdTech Korea Fair 2023)’에 참가한다고 1...
    Date2023.09.15 Bynewsit Views410
    Read More
  6. 세일즈포스, ‘넷제로 클라우드 아인슈타인’ 및 ‘글로벌 파트너십’ 강화…”AI 기반 디지털 혁신 패러다임 전환 목표“

    - 전 세계 75명의 AI 연구자, AI 윤리 전문가와 1,500개 이상의 세션 진행, 100여 개국 40,000명 이상 오프라인 참석자 및 수백만 온라인 참가자와 함께 성황리 폐막 - ‘넷제로 클라우드 아인슈타인’ 공개, 기업의 환경적 책임 및 고객 기대치 충족 위한 기술 ...
    Date2023.09.15 Bynewsit Views638
    Read More
  7. 데이터브릭스, 5억 달러 규모 시리즈 I 투자 유치…“기업 가치 430억 달러 평가”

    - 티 로우 프라이스서 투자 라운드 주도… 캐피털 원 벤처스 및 온타리오 교사 연금이 신규 투자자로, 엔비디아가 전략적 투자자로 합류 데이터브릭스(Databricks)가 5억 달러(한화 약 6,600억 원) 규모의 시리즈 I 투자를 유치했다고 밝혔다. 이번 투자로 데이...
    Date2023.09.15 Bynewsit Views545
    Read More
  8. 로지텍, 게이머용 PRO X 마우스/키보드/헤드셋 출시

    - LIGHTFORCE 하이브리드 스위치, 신규 HERO 2 센서를 탑재한 ‘PRO X SUPERLIGHT 2’ 초경량 무선 게이밍 마우스 - LIGHTSPEED 무선 기술과 게임 플레이에 최적화된 텐키리스 레이아웃을 갖춘 ‘PRO X TKL’ 무선 게이밍 키보드 - 무선 게이밍 헤드셋 ‘PRO X 2 LI...
    Date2023.09.15 Bynewsit Views303
    Read More
  9. 마우저, CEL CMP961x 무선 모듈 공급…“와이파이 6 및 매터와 호환“

    마우저 일렉트로닉스는 CEL의 CMP961x 와이파이 및 블루투스 모듈을 공급한다고 밝혔다. 이 모듈은 NXP 반도체의 IW611 및 IW612 무선 SoC에 기반하고 있으며, 매터(Matter)와 와이파이 6 네트워크에 최적화된 기능 및 성능을 제공한다. 매터는 헬스케어, 의료...
    Date2023.09.14 Bynewsit Views316
    Read More
  10. 뱅앤올룹슨, 베오비전 하모니 97형 출시 기념 청음 서비스

    뱅앤올룹슨(Bang & Olufsen)이 B&O 스피커 시스템을 결합한 TV ‘베오비전 하모니(Beovision Harmony)’ 97형 모델을 선보이며 청음 서비스를 진행한다고 밝혔다. 베오비전 하모니 97형의 청음 서비스는 뱅앤올룹슨 압구정 플래그십 스토어에서 진행되며, 누구나...
    Date2023.09.14 Bynewsit Views290
    Read More
  11. 샵백코리아, 추석 물가 안정을 위한 ‘추석맞이 캐시백 프로모션’

    - 프로모션 기간 내 샵백을 거쳐 제휴 가맹점에서 누적 5만원 이상 구매 시 경품 이벤트 응모 가능 - 샵백을 거쳐 3만원 이상 첫 구매 시 선착순 500명에게 최대 10만원의 보너스 캐시백 제공 - 샵백을 거쳐 첫 구매인 경우 SSG, 홈플러스, 지마켓, 위메프, 롯...
    Date2023.09.14 Bynewsit Views568
    Read More
  12. 우체국물류지원단, 해킹메일 대응훈련에서 과기정통부 산하기관 중 ‘1위’ 달성

    - 과기정통부 주관, 2023년도 소속·산하기관 해킹메일 대응훈련 참여 - 사이버 공격 대비한 실전 훈련 추진으로 임직원 해킹메일 대응 역량 향상 우체국물류지원단이 과기정통부가 주관하는 ‘2023년도 소속·산하기관 해킹메일 대응훈련’에서 65개 기관 가운데 ...
    Date2023.09.14 Bynewsit Views279
    Read More
  13. 소니코리아, ‘FE 16-35mm F2.8 GM II’ 국내 정식 출시…“세계에서 가장 작고 가벼운 F2.8 광각 줌 렌즈”

    - 컴팩트한 사이즈에 G Master 화질과 첨단 고속 AF 기술 탑재한 SEL1635GM 2세대 모델 - SEL1635GM2부터 기존 SEL2470GM2·SEL70200GM2까지 2세대 F2.8 GM 줌 렌즈 트리니티(Trinity) 완성 소니코리아가 G 마스터(G Master) 프리미엄 광각 줌 렌즈 ‘FE 16-35mm...
    Date2023.09.14 Bynewsit Views245
    Read More
  14. 존슨콘트롤즈 코리아, 2024 회계년도 비즈니스 전략 발표…“지속가능하고 건강한 스마트빌딩 미래 만들기에 주력”

    - 스마트 빌딩 분야 차별화된 전문지식(Domain Knowledge), 오픈블루 (OpenBlue) 플랫폼, ESG 역량 강조 존슨콘트롤즈 코리아는 2024 회계년도 비즈니스 핵심 전략을 발표했다. 존슨콘트롤즈 코리아는 ‘존슨콘트롤즈가 제시하는 미래(Johnson Controls D.O.E.s...
    Date2023.09.13 Bynewsit Views513
    Read More
  15. 힐셔, netRAPID 90용 Open Modbus/TCP 프로토콜 스택 출시

    힐셔는 최근 초소형 칩 캐리어 제품인 netRAPID 90에 Open Modbus/TCP 프로토콜 스택을 지원한다고 밝혔다. 이를 통해 산업용 통신 기술 업체들은 기존의 유연한 멀티-프로토콜 지원형 임베디드 모듈인 netRAPID 90 제품의 지원 가능 프로토콜을 더욱 다양하게...
    Date2023.09.13 Bynewsit Views419
    Read More
  16. 스펙트럼 인스트루먼트, 현존하는 가장 넓은 4.7 GHz 대역폭의 신호 수집 및 분석 가능한 신규 디지타이저 M5i 시리즈 출시

    - 10 GS/s 샘플링 속도, 12 비트 수직 분해능, 4.7GHz 대역폭, 12.8 GB/s 데이터 스트리밍으로 정확한 수집과 분석 지원 디지타이저 및 제너레이터 전문기업 스펙트럼 인스트루먼트가 자사 플래그십 고속 PCIe 디지타이저 M5i 제품군에 M5i.3360, M5i.3367 두 ...
    Date2023.09.13 Bynewsit Views378
    Read More
  17. Moxa, 새로운 플래그십 보안 셀룰러 라우터 「OnCell G4302-LTE4」 출시…”핵심 인프라의 네트워크 보안 강화“

    Moxa는 차세대 보안 셀룰러 라우터인 OnCell 시리즈의 새로운 플래그십 모델인 OnCell G4302-LTE4를 출시했다고 밝혔다. OnCell G4302-LTE4는 고급 보안 셀룰러 라우터로 IEC 62443-4-2 표준을 준수하는 신형 보안 소프트웨어가 내장되어 있다. 또한, 더 나은 ...
    Date2023.09.13 Bynewsit Views189
    Read More
  18. 스트라타시스-울산정보산업진흥원, ‘자동차 및 조선해양 산업을 위한 3D 프린팅 활용사례’ 세미나 개최

    - 첨단 3D프린팅 기술과 전통산업의 협업 통해 비즈니스 가능성과 인사이트 공유 글로벌 3D프린팅 솔루션 선도 기업 스트라타시스(Stratasys)가 울산정보산업진흥원(UIPA)과 공동주최로 오는 9월 20일 (수) 오후 2시부터 울산 3D프린팅 벤처 집적 지식산업센터...
    Date2023.09.13 Bynewsit Views280
    Read More
  19. 가민, 휴대용 아웃도어 GPS 장치 ‘GPSMAP 67’ 출시…“뛰어난 GPS 기능과 강력한 배터리 성능”

    - 전 세계 위성을 통해 최상의 GPS 기능을 제공하는 멀티밴드 GNSS 위성 시스템 사용 - 가독성이 뛰어난 3인치의 대형 컬러 디스플레이에 사용이 편리한 버튼 디자인 탑재 - GPS 모드에서 180시간, 어드벤처 모드에서 840시간 연속 사용 가능 - 스마트폰 연동...
    Date2023.09.13 Bynewsit Views399
    Read More
  20. 퓨어스토리지, ‘퓨어//액셀러레이트 2023 서울’ 개최…”지속가능성 및 AI 혁신 발표“

    - 엔터프라이즈 클라우드 도입 가속화를 위해 마이크로소프트와 전략적 파트너십 확대 발표 퓨어스토리지가 연례 컨퍼런스 퓨어//액셀러레이트 2023 서울(Pure//Accelerate 2023 Seoul)을 개최하고 지속가능성 및 인공지능(AI) 분야에서의 퓨어스토리지의 혁신...
    Date2023.09.12 Bynewsit Views298
    Read More
Board Pagination Prev 1 ... 172 173 174 175 176 177 178 179 180 181 ... 268 Next
/ 268
CLOSE