엔비디아 GH200, L4 GPU 등 클라우드에서 네트워크 엣지까지 AI 실행 성능과 다용성 선보여

- H100 GPU의 추론 성능 두배로 가속화하는 새로운 소프트웨어 텐서RT-LLM 발표

 

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).jpg

 

​​​​​엔비디아가 MLPerf 벤치마크에서 엔비디아 GH200 그레이스 호퍼 슈퍼칩(NVIDIA GH200 Grace Hopper Superchip)이 우수한 성능을 입증했다고 밝혔다. MLPerf에서 처음으로 선보인 엔비디아 GH200 그레이스 호퍼 슈퍼칩은 모든 데이터센터 추론 테스트를 성공적으로 수행하며 엔비디아 H100 텐서 코어 GPU(H100 Tensor Core GPUs)의 뛰어난 성능을 확장했다.

 

아울러 전반적인 평가 결과에서 클라우드부터 네트워크 엣지까지 엔비디아 AI 플랫폼의 뛰어난 성능과 다용성이 입증됐다.이와는 별도로 엔비디아는 성능, 에너지 효율성, 총소유비용을 획기적으로 개선할 수 있는 추론 소프트웨어를 발표했다.

 

MLPerf에서 활약한 GH200 슈퍼칩

GH200은 하나의 슈퍼칩에 호퍼 GPU와 그레이스 CPU를 연결한다. 이 조합은 더 많은 메모리와 대역폭을 제공하고, CPU와 GPU 간 자동으로 전력을 전환해 성능을 최적화한다.

 

이와는 별도로, 8개의 H100 GPU를 탑재한 엔비디아 HGX H100 시스템(HGX H100 systems)은 이번 라운드의 모든 MLPerf 추론 테스트에서 가장 높은 처리량을 기록했다.

 

그레이스 호퍼 슈퍼칩과 H100 GPU는 컴퓨터 비전, 음성 인식, 의료 영상 추론은 물론, 추천 시스템과 생성형 AI에 사용되는 대규모 언어 모델(LLMs)의 더욱 복잡한 사용 사례 등 MLPerf의 모든 데이터센터 테스트에서 선두를 차지했다.

 

이번 결과는 2018년 MLPerf 벤치마크가 시작된 이래 모든 라운드에서 AI 훈련과 추론 분야에서 선도적인 성능을 입증해온 엔비디아의 기록을 이어가고 있다.

 

최신 MLPerf 라운드에는 추천 시스템에 대한 업데이트된 테스트와 함께 AI 모델의 대략적인 규모를 측정하는 60억 개의 파라미터로 구성된 대규모 언어 모델 GPT-J의 첫 번째 추론 벤치마크가 포함됐다.

 

추론를 가속화하는 텐서RT-LLM(TensorRT-LLM)

엔비디아는 모든 규모의 복잡한 워크로드를 처리하기 위해 추론을 최적화하는 생성형 AI 소프트웨어 텐서RT-LLM(TensorRT-LLM)을 개발했다. 이 오픈 소스 라이브러리는 고객이 이미 구매한 H100 GPU의 추론 성능을 두 배 이상 향상시키는 데 추가 비용 없이 이용 가능하다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (2).jpg

 

엔비디아의 내부 테스트에 따르면 H100 GPU에서 텐서RT-LLM을 사용하면 GPT-J 6B를 실행하는 이전 세대 GPU에 비해 최대 8배의 성능 속도가 향상된다.

 

이 소프트웨어는 메타(Meta), 애니스케일(AnyScale), 코히어(Cohere), 데시(Deci), 그래머리(Grammarly), 미스트럴 AI(Mistral AI), 모자이크ML(MosaicML), 옥토ML(OctoML), 탭나인(Tabnine), 투게더AI(Together AI) 등 주요 기업들과 함께 대규모 언어 모델 추론의 가속화와 최적화를 위한 엔비디아의 연구에서 출발했다.

 

현재 데이터브릭스(Databricks)에 인수된 모자이크ML은 기존의 서비스 스택에 텐서RT-LLM에 필요한 기능을 추가하고 이를 통합했다. 데이터브릭스의 엔지니어링 담당 부사장 나빈 라오(Naveen Rao)는 "텐서RT-LLM은 사용이 간편하고, 다양한 기능을 갖추고 있으며 효율적이다. 이 솔루션은 엔비디아 GPU를 사용해 대규모 언어 모델 서비스를 위한 최첨단 성능을 제공하며, 고객에게 비용 절감 효과를 전달한다"고 밝혔다.

 

텐서RT-LLM은 엔비디아의 풀스택 AI 플랫폼에서 지속적인 혁신을 보여주는 최신 기술이다. 이러한 소프트웨어의 발전은 사용자에게 추가 비용 없이 계속해서 향상된 성능을 제공하며, 오늘날의 광범위한 AI 워크로드에서 다용도로 활용할 수 있다.

 

메인스트림 서버에서 추론을 향상시키는 L4

최신 MLPerf 벤치마크에서 엔비디아 L4 GPU(L4 GPUs)는 모든 워크로드를 실행하며 전반적으로 뛰어난 성능을 선보였다. 일례로, 소형 72W 어댑터 카드에서 실행되는 L4 GPU는 약 5배 높은 전력 소비를 요구하는 CPU보다 최대 6배 이상의 성능을 제공했다. 또한, 엔비디아 테스트에서는 전용 미디어 엔진이 탑재된 L4 GPU가 쿠다(CUDA) 소프트웨어와 결합해 컴퓨터 비전 속도를 최대 120배까지 향상시키는 것으로 확인됐다.

 

L4 GPU구글 클라우드(Google Cloud)를 비롯한 많은 시스템 빌더에서 사용할 수 있다. 또한 개인용 인터넷 서비스부터 신약 개발까지 다양한 산업 분야의 고객에게 서비스를 제공하고 있다.

 

엣지에서의 성능 향상

이와 별개로 엔비디아는 새로운 모델 압축 기술을 통해 L4 GPU에서 버트(BERT) 대규모 언어 모델을 실행해 4.7배의 성능 향상을 시연했다. 그 결과 새로운 기능을 선보이는 MLPerf의 오픈 디비전 부문에서 우수한 평가를 받았다.

 

이 기술은 모든 AI 워크로드에서 활용될 것으로 예상된다. 특히, 크기와 전력 소비에 제약이 있는 엣지 디바이스에서 모델을 실행할 때 유용하게 사용될 수 있다.

 

엣지 컴퓨팅의 선도적인 입지를 보여주는 또 다른 예로, 엔비디아 젯슨 오린 시스템 모듈(Jetson Orin system-on-module)이 있다. 이는 엣지 AI와 로봇 시나리오에서 흔히 사용되는 컴퓨터 비전 사용 사례인 물체 감지 분야에서 이전 라운드에 비해 최대 84%의 성능 향상을 선보였다.

엔비디아 그레이스 호퍼 슈퍼칩, MLPerf 벤치마크서 우수한 성능 입증 (1).png

 

 

 

젯슨 오린의 발전에는 프로그래머블 비전 가속기, 엔비디아 암페어 아키텍처 GPU(Ampere architecture GPU), 전용 딥 러닝 가속기 등과 같은 최신 버전의 칩 코어를 이용하는 소프트웨어가 활용됐다.

 

다양한 성능, 광범위한 에코시스템

MLPerf 벤치마크는 공정하고 객관적이기 때문에 사용자는 그 결과를 바탕으로 정보에 입각한 구매 결정을 내릴 수 있다. 광범위한 사용 사례와 시나리오를 다루어 사용자는 신뢰 가능하고 유연하게 배포할 수 있는 성능을 확인한다.

 

이번 라운드에 참여한 파트너로는 클라우드 서비스 제공업체인 마이크로소프트 애저(Microsoft Azure), 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure), 시스템 제조업체인 에이수스(ASUS), 커넥트 테크(Connect Tech), 델 테크놀로지스(Dell Technologies), 후지쯔(Fujitsu), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro) 등이 있다.

 

MLPerf는 알리바바(Alibaba), Arm, 시스코(Cisco), 구글(Google), 하버드 대학교, 인텔(Intel), 메타, 마이크로소프트(Microsoft), 토론토 대학교를 포함한 70개 이상의 조직이 후원하고 있다.

 

#엔비디아#MLPerf#그레이스호퍼#

?

  1. 샤오미 로봇청소기 X10+ 연이은 완판 행진

    - 샤오미 로봇청소기 X10+가 오늘의집 온라인 채널에서 1차에 이어 2차 물량도 완판되며 이례적인 인기 - 먼지 제거, 물청소, 걸레 세척 및 건조, 먼지 통 비움 등 전자동으로 진행돼 핸즈프리 청소가 가능한 올인원 플래그십 모델로 합리적인 가격 샤오미(小...
    Date2023.09.25 Bynewsit Views319
    Read More
  2. 레드햇, 오라클과 협업 확대…오라클 클라우드 인프라스트럭처에서 레드햇 오픈시프트 지원

    - 전략적 협업 확대로 OCI 베어메탈 및 오라클 VM웨어 클라우드 워크로드에 대한 레드햇 엔터프라이즈 리눅스 지원 추가 - OCI상에서 인증 및 지원되는 레드햇 오픈시프트 구성 실행 가능 레드햇(Red Hat, Inc.)과 오라클 오라클 클라우드 인프라스트럭처(OCI)...
    Date2023.09.25 Bynewsit Views676
    Read More
  3. 엔비디아 CEO 젠슨 황, ‘엔비디아 AI 서밋’서 기조연설

    - 이스라엘 텔아비브에서 10월 15일부터 16일까지 열려 - 실시간 스트리밍으로 생성형 AI와 클라우드 컴퓨팅 최신 동향 소개 - 가속 컴퓨팅과 로보틱스 등 60개 이상 주제로 라이브 세션 제공, 엔비디아 최고 전문가들과 네트워킹 기회 엔비디아 CEO 젠슨 황이...
    Date2023.09.25 Bynewsit Views703
    Read More
  4. 캐논코리아, 가을맞이 정품등록 프로모션 ‘20년 연속 1위 캐논 어썸어텀’ 실시

    - 풀프레임 및 APS-C 타입 미러리스 카메라 총 6종 구매 고객 대상 정품등록 이벤트 진행 - 11월 30일(목)까지 해당 제품 구매 후 12월 7일(목)까지 정품등록 프로모션 응모한 모든 고객 대상 캐논코리아가 가을 시즌을 맞아 인기 EOS R 미러리스 카메라 6종 ...
    Date2023.09.25 Bynewsit Views307
    Read More
  5. NXP, 현대차‧BMW‧덴소 ‘우수 파트너’로 선정

    - 세계적 자동차 기업으로부터 혁신, 협력, 기술 차별화, 공급 능력, 연속성 보장 등 NXP 역량 인증 - NXP, 새로운 글로벌 모빌리티 트렌드 리드, 세계적 자동차 회사로부터 최고 파트너 인정받아 NXP 반도체가 글로벌 오토모티브 부문 파트너사 세 곳에서 상...
    Date2023.09.25 Bynewsit Views485
    Read More
  6. 어플라이드 머티어리얼즈 코리아 ‘2023 K-ESG 경영대상’ 종합ESG대상 수상

    - 국내 생태계 보호∙지역 아동 교육 지원 및 인재 육성∙전 세계 탄소 배출량 감축 등 다양한 활동 펼쳐 어플라이드 머티어리얼즈 코리아는 ‘2023 K-ESG 경영대상’ 종합ESG대상을 수상했다고 밝혔다. 산업통상자원부, 환경부, 공정거래위원회 등이 후원하는 ‘K-...
    Date2023.09.25 Bynewsit Views456
    Read More
  7. ASUS, 교육용 프리미엄 크롬북 CX3401/CX5601 출시

    - ASUS, 에듀테크 등 변화하는 교육 시장에 맞춰 보급형부터 프리미엄까지 다양한 크롬북 라인업 보유 - 크롬북 신제품 2종, 온·오프라인 통합 교육 및 창의성 증진을 위한 취미 활동 등 최적의 성능 제공 - CX3401, 컨버터블 폼팩터에 스타일러스 펜, 터치패...
    Date2023.09.25 Bynewsit Views444
    Read More
  8. SAP, 미래형 비즈니스 위한 기업의 회복탄력성 연구 결과 발표

    - 한국 기업, 미래형 비즈니스 위해 직원과 기술에 투자 필요 SAP 인사이트(SAP Insights)가 미래를 대비한 비즈니스 회복탄력성에 대한 연구 결과를 발표했다. 이번 연구는 국내 332개 기업을 포함한 총 4,239개의 조직들을 대상으로 진행되었다. 연구 결과에...
    Date2023.09.25 Bynewsit Views636
    Read More
  9. 와콤, 공공 및 금융 분야 전자서명용 서명용 타블렛 출시

    와콤(Wacom)은 새로운 서명 타블렛 13 펜 & 터치(DTH134) 및 서명 타블렛 12 (DTC121)를 출시하고, 디지털 거래 혁신을 이끌 새로운 전자문서 솔루션이라고 밝혔다. 와콤 서명 타블렛은 플러그 앤 플레이 기능으로 단일 케이블을 연결, 매우 간단한 방법으로 ...
    Date2023.09.25 Bynewsit Views241
    Read More
  10. 안랩, 고객사 대상 OT보안 세미나 ‘ISF SQUARE 2023 for OT’ 성료

    - 9월 22일(금), 잠실 롯데호텔 월드에서 기업 고객 OT보안 관리자 대상으로 진행 안랩이 9월 22일(금), 잠실 롯데호텔 월드에서 기업고객 OT보안 담당자를 대상으로 진행한 보안 전략 세미나 ‘안랩 ISF 스퀘어 2023 OT’를 성료했다고 밝혔다. 이번 행사에서 ...
    Date2023.09.25 Bynewsit Views319
    Read More
  11. 엔비디아, 인포시스와 전략적 협력 확대...“생성형 AI 플랫폼으로 기업 생산성 향상 지원”

    - 산업 전반에서 생성형 AI 애플리케이션과 솔루션으로 생산성 향상 - 새로운 엑설런스 센터, 인포시스 직원 5만 명에게 엔비디아 AI 기술 교육 실시 엔비디아는 차세대 디지털 서비스와 컨설팅 분야의 글로벌 선두주자인 인포시스(Infosys)와 전략적 협력을 ...
    Date2023.09.25 Bynewsit Views556
    Read More
  12. 안랩, 클라우드 운영 관리 서비스 전문기업 ‘클라우드메이트’와 MOU 체결

    - 9월 22일(금), 클라우드메이트 신도림 사옥에서 ‘안전한 Cloud Native 환경 구축 및 운영 관리를 위한 전략적 제휴 MOU’ 체결 - 안랩의 보안 프레임워크 기반 클라우드 구축·운영 역량과 클라우드메이트의 클라우드 네이티브 아키텍팅 및 애플리케이션 현대...
    Date2023.09.25 Bynewsit Views334
    Read More
  13. 퓨어스토리지, 2023 가트너 매직 쿼드런트 ‘프라이머리 스토리지 부문’ 리더 선정…“10년 연속 선정 기록”

    퓨어스토리지가 가트너의 매직 쿼드런트(Gartner Magic Quadrant) 보고서 프라이머리 스토리지(Primary Storage) 부문 리더로 선정됐다. 이로써 퓨어스토리지는 가트너 매직 쿼드런트 보고서에서 10년 연속 리더로 선정되는 쾌거를 얻었으며, 비전 완성도와 실...
    Date2023.09.21 Bynewsit Views345
    Read More
  14. 마우저, 센시리온의 새로운 SHT4xA 상대습도 및 온도 센서 공급

    마우저 일렉트로닉스(Mouser Electronics)는 센시리온(Sensirion)의 상대습도 및 온도 센서인 SHT4xA를 공급한다고 밝혔다. 16비트의 높은 정확도를 제공하는 자동차 등급 디지털 센서인 SHT4xA는 서로 다른 정확도 등급으로 상대습도 및 온도를 측정할 수 있...
    Date2023.09.21 Bynewsit Views664
    Read More
  15. 티맥스소프트, ‘대한민국 디지털 미래혁신대전 2023’ 참가… “클라우드·SaaS·AI 중심의 중장기 성장 비전 발표”

    - 25일부터 27일까지 전시관에서 미래 성장동력, 클라우드 솔루션 등 알려 - 디지털 가상홍보관 가입 및 SNS 채널 팔로우 시 경품 증정 이벤트도 실시 - 방문객들에게 티맥스소프트의 지속가능한 성장 비전과 차별적 강점 피력 시스템 소프트웨어(SW) 전문기업...
    Date2023.09.21 Bynewsit Views670
    Read More
  16. 소니코리아, 원핸드 컴팩트 풀프레임 카메라 ‘A7C2’, ‘A7CR’ 국내 정식 출시

    - 514g의 가벼운 무게, 사진과 영상 모두 충족시키는 약 3,300만 화소 풀프레임 센서, AI 프로세싱으로 더욱 진화된 AF 성능을 탑재한 원핸드 컴팩트 풀프레임 카메라 ‘A7C2’ - 초고화질 풀프레임 A7R 시리즈의 컴팩트한 변화, 약 6,100만 화소의 이면조사형 ...
    Date2023.09.21 Bynewsit Views388
    Read More
  17. 이글루코퍼레이션, AI·SOAR 관련 특허 3건 취득…“보안 운영 효율성 높이는 핵심 기술 확보”

    - 보안위협 탐지 보고서 자동 작성하는 AI 특허 기술 개발 - 위협 대응 역량 높이는 특허 적용 통해, SOAR 성능 향상 이글루코퍼레이션은 3건의 인공지능(AI) 및 보안 운영·위협 대응 자동화(SOAR) 관련 특허 등록을 완료했다고 밝혔다. 이글루코퍼레이션은 이...
    Date2023.09.21 Bynewsit Views298
    Read More
  18. 레노버, ‘Lenovo TruScale for Edge and AI’ 출시… “인텔리전트 트랜스포메이션 실현”

    - 비즈니스를 운영하는 어느 기업에서나 차세대 AI를 사용할 수 있도록 확장 가능하고 즉각적인 액세스 제공 - ‘레노버 씽크엣지 SE455 V3(Lenovo ThinkEdge SE455 V3)’ 서버 출시…AMD EPYC 8004 시리즈 프로세서 기반의 획기적인 효율성으로 까다로운 엣지 AI...
    Date2023.09.21 Bynewsit Views377
    Read More
  19. 트렌드마이크로, 포레스터 보고서 ‘클라우드 워크로드 보안 환경’ 핵심 주자로 선정

    - 클라우드 워크로드 보안 제품 오퍼링 이해 돕기 위한 포레스터 보고서에서 상위 6개 수익 창출 벤더 중 하나로 트렌드마이크로 언급 - 트렌드마이크로 ‘트렌드 비전 원’, 단일 플랫폼서 IT/OT 환경 가시성·제어·위험 관리 제공 트렌드마이크로는 포레스터가 ...
    Date2023.09.20 Bynewsit Views306
    Read More
  20. 헥사곤, 2023 KSAE 대학생 자작자동차대회 후원팀 우승…“자동차 분야 미래 인재 육성 결실”

    - 헥사곤, 7년째 KSAE 후원 참여로 자사 ‘아담스 카(Adams/Car)’ 라이선스 및 교육 제공 - 올해 65개 대학 100팀 약 2,000명 지원, 우승팀 포함 헥사곤 후원 팀 다수 입상 쾌거 헥사곤 매뉴팩처링 인텔리전스가 후원한 2023 KSAE 대학생 자작자동차대회 참가 ...
    Date2023.09.20 Bynewsit Views562
    Read More
Board Pagination Prev 1 ... 173 174 175 176 177 178 179 180 181 182 ... 271 Next
/ 271
CLOSE