- 엔비디아 H100 L4 GPU, 생성형 AI 및 기타 모든 워크로드 새로운 수준으로 향상

- 젯슨 AGX 오린 성능 및 효율성 향상

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (2).jpg

엔비디아 최신 MLPerf 결과에서 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다고 밝혔다. MLPerf는 독립적인 타사 벤치마크로서 AI 성능에 대한 최종적인 측정치로 남아 있다. 엔비디아의 AI 플랫폼은 MLPerf 추론 3.0 벤치마크를 포함해 MLPerf가 시작된 이래 훈련과 추론 모두에서 지속적으로 리더십을 보여 왔다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 "3년 전 A100을 출시했을 때 AI 세계는 컴퓨터 비전이 지배를 했다. 하지만 이제는 생성형 AI가 등장했다. 이것이 바로 우리가 트랜스포머 엔진(Transformer Engine)을 통해 GPT에 특별히 최적화된 호퍼(Hopper)를 개발한 이유이다. MLPerf 3.0은 A100보다 4배 더 높은 성능을 제공하는 호퍼를 강조한다"고 밝히고, "다음 단계 생성형 AI는 뛰어난 에너지 효율로 대규모 언어 모델을 훈련할 수 있는 새로운 AI 인프라를 필요로 한다. 고객은 수만 개의 호퍼 GPU를 엔비디아 NV링크(NVLink)와 인피니밴드(InfiniBand)로 연결해 AI 인프라를 구축하면서 대규모로 호퍼를 확장하고 있다. 업계는 안전하고 신뢰할 수 있는 생성형 AI의 새로운 발전을 위해 열심히 노력하고 있다. 호퍼는 이러한 필수적인 작업을 가능하게 한다"고 덧붙였다.

 

최신 MLPerf 결과에 따르면 엔비디아는 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다. 특히, DGX H100 시스템에서 실행되는 엔비디아 H100 텐서 코어(Tensor Core) GPU는 생산에서 신경망을 실행하는 작업인 AI 추론의 모든 테스트에서 최고 성능을 제공했다. 소프트웨어 최적화 덕분에 GPU는 9월에 출시된 제품 대비 최대 54%의 성능 향상을 달성했다. 의료 분야에서 H100 GPU는 의료 영상용 MLPerf 벤치마크인 3D-UNet에서 9월 이후 31%의 성능 향상을 달성했다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (3).jpg

트랜스포머 엔진으로 구동되는 호퍼 아키텍처 기반 H100 GPU는 트랜스포머 기반 대규모 언어 모델인 BERT에서 탁월한 성능을 발휘해 생성형 AI의 광범위한 사용의 토대를 마련했다.

 

생성형 AI를 통해 사용자는 텍스트, 이미지, 3D 모델 등을 빠르게 만들 수 있다. 이는 스타트업부터 클라우드 서비스 제공업체에 이르기까지 다양한 기업이 새로운 비즈니스 모델을 구현하고 기존 비즈니스 모델을 가속화하기 위해 빠르게 도입하고 있는 기능이다. 현재 수억 명의 사람들이 즉각적인 응답을 기대하며 트랜스포머 모델인 챗GPT와 같은 생성형 AI 도구를 사용하고 있다. 이러한 AI의 시대에는 추론 성능이 매우 중요하다. 딥러닝은 이제 거의 모든 곳에 배포되고 있으며 공장 현장부터 온라인 추천 시스템에 이르기까지 추론 성능에 대한 요구가 끊임없이 증가하고 있다.

 

L4 GPU의 빠른 속도

엔비디아 L4 텐서 코어 GPU는 이전 세대 T4 GPU보다 3배 이상 빠른 속도로 MLPerf 테스트에 데뷔했다. 프로파일이 낮은 폼 팩터(low-profile form factor)로 패키징된 가속기는 거의 모든 서버에서 높은 처리량과 짧은 지연 시간을 제공하도록 설계됐다.

 

L4 GPU는 모든 MLPerf 워크로드를 실행했다. 주요 FP8 형식을 지원하므로 성능에 민감한 BERT 모델에서 특히 뛰어난 결과를 보였다.

 

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (4).jpg

L4 GPU는 탁월한 AI 성능 외에도 최대 10배 빠른 이미지 디코드, 최대 3.2배 빠른 영상 처리, 4배 이상 빠른 그래픽 및 실시간 렌더링 성능을 제공한다.

 

GTC 2023에서 발표된 이 가속기는 이미 주요 시스템 제조업체와 클라우드 서비스 제공업체에서 사용할 수 있다. L4 GPU는 GTC 2023에서 발표된 엔비디아의 AI 추론 플랫폼 포트폴리오에 가장 최근에 추가된 제품이다.

 

시스템 테스트에서 빛나는 소프트웨어, 네트워크

엔비디아의 풀스택 AI 플랫폼이 새로운 MLPerf 테스트에서 리더십을 입증했다. 이른바 네트워크 분할 벤치마크는 데이터를 원격 추론 서버로 스트리밍한다. 이 테스트는 기업 방화벽 뒤에 데이터를 저장한 채 클라우드에서 AI 작업을 실행하는 기업 사용자의 일반적인 시나리오를 반영한다.

 

BERT에서 원격 엔비디아 DGX A100 시스템은 최대 로컬 성능의 96%까지 제공했으며, 일부 작업의 경우 CPU가 완료될 때까지 기다려야 하기 때문에 부분적으로 속도가 느려졌다. GPU로만 처리되는 컴퓨터 비전을 위한 ResNet-50 테스트에서는 100%를 기록했다.

 

두 결과 모두 엔비디아 퀀텀 인피니밴드(Quantum Infiniband) 네트워킹, 엔비디아 커넥트X(ConnectX) 스마트NIC(SmartNIC)엔비디아 GPU다이렉트(GPUDirect)와 같은 소프트웨어 덕분이다.

 

엣지에서 3.2배의 성능 향상을 보여준 오린

이와는 별도로 엔비디아 젯슨 AGX 오린(Orin) 시스템 온 모듈은 1년 전 결과에 비해 에너지 효율성은 최대 63%, 성능은 81% 향상됐다. 젯슨 AGX 오린은 배터리로 구동되는 시스템을 포함해 저전력 수준의 제한된 공간에서 AI가 필요할 때 추론을 제공한다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (1).jpg

더 적은 전력을 소비하는 더 작은 모듈을 필요로 하는 애플리케이션의 경우, 벤치마크에서 첫 선을 보인 젯슨 오린 NX 16G가 빛을 발했다. 이전 세대 젯슨 자비에(Jetson Xavier) NX 프로세서보다 최대 3.2배의 성능을 제공했다.

 

광범위한 엔비디아 AI 생태계

MLPerf 결과는 엔비디아 AI가 업계에서 가장 광범위한 머신 러닝 생태계의 지원을 받고 있음을 보여준다. 이번 라운드에는 10개 기업이 엔비디아 플랫폼에 대한 결과를 제출했다. 여기에는 마이크로소프트 애저(Microsoft Azure) 클라우드 서비스 및 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), H3C, 레노버(Lenovo), 네트릭스(Nettrix), 슈퍼마이크로(Supermicro) 및 엑스퓨젼(xFusion)을 비롯한 시스템 제조업체가 포함됐다.

 

이들의 연구는 사용자가 클라우드와 자체 데이터센터에서 실행되는 서버 모두에서 엔비디아 AI를 통해 뛰어난 성능을 얻을 수 있음을 보여준다. 엔비디아 파트너는 MLPerf가 AI 플랫폼 및 공급업체를 평가하는 고객에게 유용한 도구라는 것을 알고 있기 때문에 MLPerf에 참여한다. 최신 라운드의 결과는 그들이 현재 제공하는 성능이 엔비디아 플랫폼과 함께 성장할 것임을 입증한다.

 

사용자에게 필요한 다목적 성능

엔비디아 AI는 데이터센터 및 엣지 컴퓨팅에서 모든 MLPerf 추론 워크로드 및 시나리오를 실행할 수 있는 유일한 플랫폼이다. 다재다능한 성능과 효율성은 사용자를 진정한 승자로 만든다.실제 애플리케이션은 일반적으로 실시간으로 답을 제공해야 하는 다양한 종류의 신경망을 많이 사용한다.

 

예를 들어, AI 애플리케이션은 사용자의 음성 요청을 이해하고, 이미지를 분류하고, 추천한 후 사람 목소리가 담긴 음성 메시지로 응답을 전달해야 할 수 있다. 따라서 각 단계마다 다른 유형의 AI 모델이 필요하다.

 

MLPerf 벤치마크는 이러한 워크로드 및 기타 인기있는 AI 워크로드를 다룬다. 따라서 IT 의사 결정권자는 이 테스트를 통해 신뢰할 수 있고 유연하게 배포할 수 있는 성능을 얻을 수 있다.

 

테스트는 투명하고 객관적이기 때문에 사용자는 정보에 입각한 구매 결정을 내릴 때 MLPerf 결과를 신뢰할 수 있다. 이 벤치마크는 암(Arm), 바이두(Baidu), 페이스북 AI(Facebook AI), 구글, 하버드(Harvard), 인텔(Intel), 마이크로소프트(Microsoft), 스탠포드(Stanford) 및 토론토 대학교(University of Toronto)를 포함한 광범위한 그룹의 지원을 받고 있다.

 

사용 가능한 소프트웨어

엔비디아 AI 플랫폼의 소프트웨어 계층인 엔비디아AI 엔터프라이즈(Enterprise)는 사용자가 인프라 투자에서 최적화된 성능을 얻을 수 있도록 보장할 뿐만 아니라 기업 데이터센터에서 AI를 실행하는 데 필요한 엔터프라이즈급 지원, 보안 및 안정성을 제공한다.

 

이 테스트에 사용된 모든 소프트웨어는 MLPerf 리포지토리에서 사용할 수 있으므로 누구나 이러한 세계적 수준의 결과를 얻을 수 있다.

 

최적화는 엔비디아의 GPU 가속 소프트웨어용 카탈로그인 NGC에서 사용할 수 있는 컨테이너에 지속적으로 접혀 있다. 이 카탈로그에는 이번 라운드의 모든 출품작에서 AI 추론을 최적화하는 데 사용되는 엔비디아 텐서RT가 호스팅된다.

 

 

#엔비디아#AI#MLPerf#호퍼#젯슨#오린

?

  1. 에버, 최신 PTZ 카메라 「CAM520 Pro3」 출시… “화상회의 효율성과 편의성 증대“

    글로벌 화상 통합 솔루션 업체 에버 인포메이션(AVer)은 최신 PTZ 카메라 제품 'CAM520 Pro3'을 출시했다고 밝혔다. 최첨단 기술이 집약된 ‘CAM520 Pro3’는 차별화된 에버 AI 기능 '스마트 컴포지션’을 통해 새로운 화상 회의 경험을 제공한다. 참여자들의 얼...
    Date2023.05.23 Bynewsit Views293
    Read More
  2. ASUS, 초슬림∙초경량 고성능 노트북 「젠북 S13/ 젠북 15 OLED」 출시

    - 글로벌 런칭 행사 ‘Thincredible’에서 선보인 초경량∙초슬림 신제품 노트북 2종 공식 출시 - 젠북 S 13 OLED, 10.9mm의 초슬림 두께, 1kg의 초경량 무게··· ASUS의 혁신적인 최고 품질 디스플레이 ASUS 루미나(Lumina) OLED 탑재한 초경량 13인치 OLED 노트...
    Date2023.05.22 Bynewsit Views402
    Read More
  3. 다쏘시스템, ‘3D 익스피리언스 컨퍼런스 2023’ 개최…“버추얼 트윈을 활용한 교류의 장 마련”

    - ‘시각화와 모델링, 시뮬레이션을 활용한 지속가능한 세계’ 주제로 디지털 혁신 방향성 제시 - 자동차, 건설, 스마트팩토리, 항공우주, 산업장비, 하이테크 산업군을 대표하는 국내 선도기업 혁신사례 소개 다쏘시스템이 오는 6월 15일 국내 연례 컨퍼런스인 ...
    Date2023.05.22 Bynewsit Views639
    Read More
  4. 엔비디아-서비스나우, '엔터프라이즈 I의 생성형 AI 구축'  파트너십 체결

    - 서비스나우 플랫폼에 엔비디아 AI 소프트웨어, DGX 인프라, 맞춤형 LLM 구축해 지능형 워크플로우 자동화 제공 엔비디아는 강력한 엔터프라이즈급 생성형 AI 기능을 개발하기 위해 서비스나우(ServiceNow)와 파트너십을 체결한다고 발표했다. 이번 파트너십...
    Date2023.05.22 Bynewsit Views721
    Read More
  5. 로지텍, 무소음 무선 마우스 'M240' 출시

    - 로지텍의 스테디셀러 무소음 무선 마우스 ‘M221’의 블루투스 리뉴얼 버전 - 컴팩트한 사이즈, 가벼운 무게, 그래파이트, 퓨어화이트, 파우더핑크 3개 컬러 옵션 - 합리적 가격 대비 알찬 성능, 다양한 OS 호환 및 블루투스 연결 통한 작업 효율 향상 로지텍...
    Date2023.05.22 Bynewsit Views414
    Read More
  6. 아카마이, 아태지역 금융 서비스 ‘API 공격’ 2.5배 증가

    - 웹 애플리케이션과 API 공격 증가율, 아태지역이 전 세계 평균 보다 훨씬 높아 …. 호주와 일본 등 아태지역의 금융 허브가 최대 표적 아카마이는 인터넷 보안의 최신 현황을 다룬 보고서 <‘보안 격차의 허점: 애플리케이션 공격과 API 공격의 증가>를 발표하...
    Date2023.05.22 Bynewsit Views333
    Read More
  7. 스틸시리즈, <롤링스톤 2023 오디오 어워즈 베스트 게이밍 헤드셋, 게이밍 스피커 부분> 수상

    - 스틸시리즈, 아크티스 노바 프로 무선 게이밍 헤드셋, 아레나7 게이밍 스피커 롤링스톤 2023 오디오 어워즈 수상 스틸시리즈가 미국 음악 전문지에서 진행하는 ‘롤링스톤 2023 오디오 어워즈’ (Rolling Stone 2023 Audio Awards)에서 베스트 게이밍 헤드셋, ...
    Date2023.05.19 Bynewsit Views434
    Read More
  8. 엔비디아, 지포스 RTX 4060 GPU 제품군 출시

    - 혁신적인 에이다 러브레이스 아키텍처 성능 제공 - AI로 더욱 강력해진 최신 GPU, 최신 게임 콘솔보다 2배 높은 성능 제공 엔비디아가 새로운 지포스 RTX 4060 GPU 제품군을 발표했다. 이번에 발표된 지포스 RTX 4060 Ti/4060은 DLSS 3 뉴럴 렌더링과 3세대 ...
    Date2023.05.19 Bynewsit Views385
    Read More
  9. 어플라이드 머티어리얼즈, 2023년 2분기 실적 발표…“전년 대비 6% 증가한 66억3000만 달러 기록”  

    어플라이드 머티어리얼즈가 4월 30일 마감한 회계연도 2023년 2분기 실적을 발표했다. 어플라이드 머티어리얼즈 회계연도 2023년 2분기 전 세계 매출은 미국 회계기준으로 66억3000만 달러, 매출총이익률 46.7%를 기록했다. 영업이익과 영업이익률은 각각 19억...
    Date2023.05.19 Bynewsit Views485
    Read More
  10. 온세미, 펜실베이니아 주립대와 SiC 연구 MOU 체결

    온세미(ON)는 실리콘 카바이드 연구를 활성화하기 위해 미국 펜실베이니아 주립대학교와 800만 달러 규모의 전략적 협력을 위한 양해각서(MOU)를 체결했다고 발표했다. 이번 협력을 통해 펜실베이니아 주립대 재료 연구 기관(MRI)에 온세미 실리콘 카바이드 크...
    Date2023.05.19 Bynewsit Views485
    Read More
  11. 화웨이, 차세대 스마트 안경 ‘화웨이 아이웨어’ 한국 정식 출시

    화웨이 아이웨어는 오픈 어쿠스틱(open acoustic) 디자인으로 설계돼 장시간 편안하게 착용할 수 있으며, 간단한 터치만으로 전화를 수신할 수 있어 여행, 운전, 운동 등 다양한 상황에서 안전하고 효과적으로 음성 및 영상 통화를 지원한다. 국내에 출시된 화...
    Date2023.05.19 Bynewsit Views436
    Read More
  12. 인텔-SAP, 클라우드 역량 확대 위한 전략적 협력 발표

    - 인텔, SAP와 함께 미래의 민첩한 비즈니스 운영에 필요한 성능과 총소유비용, 보안 및 효율성 개선에 협력 인텔과 SAP는 현지시간 17일 클라우드에서 더욱 강력하고 지속 가능한 SAP® 소프트웨어 환경을 제공하기 위한 전략적 협력을 발표했다. 고객이 기존 ...
    Date2023.05.18 Bynewsit Views787
    Read More
  13. 마우저, 마이크로칩 테크놀로지 8비트 AVR 마이크로컨트롤러  「AVR64EA」 제품 공급

    마우저 일렉트로닉스는 마이크로칩 테크놀로지의 AVR64EA 8비트 AVR 마이크로컨트롤러 제품을 공급한다고 밝혔다. AVR64EA 마이크로컨트롤러(MCU)는 산업, 컨슈머 및 자동차 애플리케이션에 사용되는 광범위한 실시간 제어, 센서 노드 및 2차 안전 모니터링을 ...
    Date2023.05.18 Bynewsit Views413
    Read More
  14. 포티넷, ‘2022 기술 격차 보고서(2022 Skills Gap Report)’ 발표

    - 응답자 5명 중 2명 이상은 사이버 보안 인재를 채용(62%, 한국 52%)하고 유지(60%, 한국 52%)하는데 문제 포티넷 코리는 오늘 보안 업계의 인재 부족 문제를 조사한 ‘2022 기술 격차 보고서(2022 Skills Gap Report)’를 발표했다. 이 보고서는 포티넷이 영국...
    Date2023.05.18 Bynewsit Views508
    Read More
  15. 솔리다임, 데이터센터용 SSD 「D5-P5430」 출시…“총 소유 비용 최대 27% 절감”

    솔리다임이 메인 스트림 및 읽기 집약적인 워크로드에 최적화된 새로운 QLC SSD ‘솔리다임 D5-P5430’을 출시하고 자사의 D5 제품군을 확장한다고 밝혔다. 오늘날 대부분의 엔터프라이즈 애플리케이션이 읽기 중심으로 제공되고 있으며, 그 중에서도 4세대 PCIe...
    Date2023.05.18 Bynewsit Views503
    Read More
  16. 슈나이더 일렉트릭 코리아-KTL, 탄소 중립 및 디지털 전환 기술 사업제휴 협약

    - 탄소중립, 산업 디지털 전환 및 전력기기기 분야 신규 사업 개발 - MOU를 통해 양사 사업 분야 확장 및 역량 강화 슈나이더 일렉트릭 코리아는 17일 한국산업기술시험원(KTL) 과 탄소 중립 및 디지털 전환 기술을 위한 업무협약을 체결했다고 밝혔다. 서울 ...
    Date2023.05.18 Bynewsit Views629
    Read More
  17. ST, 엣지 AI 구동 2세대 마이크로프로세서 출시…”인더스트리 4.0 지원”

    - ST STM32MP2 시리즈 64비트 마이크로프로세서, SESIP 레벨 3 인증 획득 - 산업용 애플리케이션 지원 인터페이스 및 전용 엣지 AI 가속화 제공 ST마이크로일렉트로닉스가 동일한 에코시스템 기반의 새로운 아키텍처와 함께 산업 및 IoT 엣지 애플리케이션의 ...
    Date2023.05.18 Bynewsit Views409
    Read More
  18. 레노버, <Smarter Data Management Playbook 2023> 발표…“한국 CIO 96%, 비즈니스 우선순위로 지속가능성에 집중”

    - 아시아 태평양 지역 내 IT 및 비즈니스 의사 결정권자 554명을 대상으로 설문조사 - 2023년 CIO가 고려해야 할 주요 인사이트 제공 레노버는 아시아 태평양 지역 내 554명의 CIO의 인사이트를 담은 'Smarter Data Management Playbook 2023'을 발표했다. 레...
    Date2023.05.18 Bynewsit Views639
    Read More
  19. 안랩, ‘Meta’ 사칭해 기업 페이스북 계정 노리는 피싱 메일 주의보

    - 페이스북을 운영하는 ‘Meta(페이스북)’ 정책팀 사칭, ‘사용자의 비즈니스 계정이 지적 재산권을 침해해 차단되었다’는 내용으로 피싱 메일 유포 - 사용자가 속아 메일 하단의 ‘Request Review(재검토 요청)’을 누르면 페이스북 계정 정보 탈취 시도하는 피싱...
    Date2023.05.17 Bynewsit Views377
    Read More
  20. ADI, 아일랜드 리머릭의 차세대 반도체 연구개발 및 제조 시설에 6억3천만 유로 투자

    - 디지털 생물학, 전기차, 로봇 등 첨단 애플리케이션의 발전을 가속화하기 위한 시설 신축 예정 - 신규 투자로 아일랜드 리머릭 소재 ADI 유럽 본사에서 600개의 새로운 일자리 창출 및 웨이퍼 생산 능력 3배 신장 기대 - 아일랜드가 처음으로 유럽연합 집행...
    Date2023.05.17 Bynewsit Views529
    Read More
Board Pagination Prev 1 ... 217 218 219 220 221 222 223 224 225 226 ... 288 Next
/ 288
CLOSE