- 엔비디아 H100 L4 GPU, 생성형 AI 및 기타 모든 워크로드 새로운 수준으로 향상

- 젯슨 AGX 오린 성능 및 효율성 향상

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (2).jpg

엔비디아 최신 MLPerf 결과에서 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다고 밝혔다. MLPerf는 독립적인 타사 벤치마크로서 AI 성능에 대한 최종적인 측정치로 남아 있다. 엔비디아의 AI 플랫폼은 MLPerf 추론 3.0 벤치마크를 포함해 MLPerf가 시작된 이래 훈련과 추론 모두에서 지속적으로 리더십을 보여 왔다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 "3년 전 A100을 출시했을 때 AI 세계는 컴퓨터 비전이 지배를 했다. 하지만 이제는 생성형 AI가 등장했다. 이것이 바로 우리가 트랜스포머 엔진(Transformer Engine)을 통해 GPT에 특별히 최적화된 호퍼(Hopper)를 개발한 이유이다. MLPerf 3.0은 A100보다 4배 더 높은 성능을 제공하는 호퍼를 강조한다"고 밝히고, "다음 단계 생성형 AI는 뛰어난 에너지 효율로 대규모 언어 모델을 훈련할 수 있는 새로운 AI 인프라를 필요로 한다. 고객은 수만 개의 호퍼 GPU를 엔비디아 NV링크(NVLink)와 인피니밴드(InfiniBand)로 연결해 AI 인프라를 구축하면서 대규모로 호퍼를 확장하고 있다. 업계는 안전하고 신뢰할 수 있는 생성형 AI의 새로운 발전을 위해 열심히 노력하고 있다. 호퍼는 이러한 필수적인 작업을 가능하게 한다"고 덧붙였다.

 

최신 MLPerf 결과에 따르면 엔비디아는 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다. 특히, DGX H100 시스템에서 실행되는 엔비디아 H100 텐서 코어(Tensor Core) GPU는 생산에서 신경망을 실행하는 작업인 AI 추론의 모든 테스트에서 최고 성능을 제공했다. 소프트웨어 최적화 덕분에 GPU는 9월에 출시된 제품 대비 최대 54%의 성능 향상을 달성했다. 의료 분야에서 H100 GPU는 의료 영상용 MLPerf 벤치마크인 3D-UNet에서 9월 이후 31%의 성능 향상을 달성했다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (3).jpg

트랜스포머 엔진으로 구동되는 호퍼 아키텍처 기반 H100 GPU는 트랜스포머 기반 대규모 언어 모델인 BERT에서 탁월한 성능을 발휘해 생성형 AI의 광범위한 사용의 토대를 마련했다.

 

생성형 AI를 통해 사용자는 텍스트, 이미지, 3D 모델 등을 빠르게 만들 수 있다. 이는 스타트업부터 클라우드 서비스 제공업체에 이르기까지 다양한 기업이 새로운 비즈니스 모델을 구현하고 기존 비즈니스 모델을 가속화하기 위해 빠르게 도입하고 있는 기능이다. 현재 수억 명의 사람들이 즉각적인 응답을 기대하며 트랜스포머 모델인 챗GPT와 같은 생성형 AI 도구를 사용하고 있다. 이러한 AI의 시대에는 추론 성능이 매우 중요하다. 딥러닝은 이제 거의 모든 곳에 배포되고 있으며 공장 현장부터 온라인 추천 시스템에 이르기까지 추론 성능에 대한 요구가 끊임없이 증가하고 있다.

 

L4 GPU의 빠른 속도

엔비디아 L4 텐서 코어 GPU는 이전 세대 T4 GPU보다 3배 이상 빠른 속도로 MLPerf 테스트에 데뷔했다. 프로파일이 낮은 폼 팩터(low-profile form factor)로 패키징된 가속기는 거의 모든 서버에서 높은 처리량과 짧은 지연 시간을 제공하도록 설계됐다.

 

L4 GPU는 모든 MLPerf 워크로드를 실행했다. 주요 FP8 형식을 지원하므로 성능에 민감한 BERT 모델에서 특히 뛰어난 결과를 보였다.

 

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (4).jpg

L4 GPU는 탁월한 AI 성능 외에도 최대 10배 빠른 이미지 디코드, 최대 3.2배 빠른 영상 처리, 4배 이상 빠른 그래픽 및 실시간 렌더링 성능을 제공한다.

 

GTC 2023에서 발표된 이 가속기는 이미 주요 시스템 제조업체와 클라우드 서비스 제공업체에서 사용할 수 있다. L4 GPU는 GTC 2023에서 발표된 엔비디아의 AI 추론 플랫폼 포트폴리오에 가장 최근에 추가된 제품이다.

 

시스템 테스트에서 빛나는 소프트웨어, 네트워크

엔비디아의 풀스택 AI 플랫폼이 새로운 MLPerf 테스트에서 리더십을 입증했다. 이른바 네트워크 분할 벤치마크는 데이터를 원격 추론 서버로 스트리밍한다. 이 테스트는 기업 방화벽 뒤에 데이터를 저장한 채 클라우드에서 AI 작업을 실행하는 기업 사용자의 일반적인 시나리오를 반영한다.

 

BERT에서 원격 엔비디아 DGX A100 시스템은 최대 로컬 성능의 96%까지 제공했으며, 일부 작업의 경우 CPU가 완료될 때까지 기다려야 하기 때문에 부분적으로 속도가 느려졌다. GPU로만 처리되는 컴퓨터 비전을 위한 ResNet-50 테스트에서는 100%를 기록했다.

 

두 결과 모두 엔비디아 퀀텀 인피니밴드(Quantum Infiniband) 네트워킹, 엔비디아 커넥트X(ConnectX) 스마트NIC(SmartNIC)엔비디아 GPU다이렉트(GPUDirect)와 같은 소프트웨어 덕분이다.

 

엣지에서 3.2배의 성능 향상을 보여준 오린

이와는 별도로 엔비디아 젯슨 AGX 오린(Orin) 시스템 온 모듈은 1년 전 결과에 비해 에너지 효율성은 최대 63%, 성능은 81% 향상됐다. 젯슨 AGX 오린은 배터리로 구동되는 시스템을 포함해 저전력 수준의 제한된 공간에서 AI가 필요할 때 추론을 제공한다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (1).jpg

더 적은 전력을 소비하는 더 작은 모듈을 필요로 하는 애플리케이션의 경우, 벤치마크에서 첫 선을 보인 젯슨 오린 NX 16G가 빛을 발했다. 이전 세대 젯슨 자비에(Jetson Xavier) NX 프로세서보다 최대 3.2배의 성능을 제공했다.

 

광범위한 엔비디아 AI 생태계

MLPerf 결과는 엔비디아 AI가 업계에서 가장 광범위한 머신 러닝 생태계의 지원을 받고 있음을 보여준다. 이번 라운드에는 10개 기업이 엔비디아 플랫폼에 대한 결과를 제출했다. 여기에는 마이크로소프트 애저(Microsoft Azure) 클라우드 서비스 및 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), H3C, 레노버(Lenovo), 네트릭스(Nettrix), 슈퍼마이크로(Supermicro) 및 엑스퓨젼(xFusion)을 비롯한 시스템 제조업체가 포함됐다.

 

이들의 연구는 사용자가 클라우드와 자체 데이터센터에서 실행되는 서버 모두에서 엔비디아 AI를 통해 뛰어난 성능을 얻을 수 있음을 보여준다. 엔비디아 파트너는 MLPerf가 AI 플랫폼 및 공급업체를 평가하는 고객에게 유용한 도구라는 것을 알고 있기 때문에 MLPerf에 참여한다. 최신 라운드의 결과는 그들이 현재 제공하는 성능이 엔비디아 플랫폼과 함께 성장할 것임을 입증한다.

 

사용자에게 필요한 다목적 성능

엔비디아 AI는 데이터센터 및 엣지 컴퓨팅에서 모든 MLPerf 추론 워크로드 및 시나리오를 실행할 수 있는 유일한 플랫폼이다. 다재다능한 성능과 효율성은 사용자를 진정한 승자로 만든다.실제 애플리케이션은 일반적으로 실시간으로 답을 제공해야 하는 다양한 종류의 신경망을 많이 사용한다.

 

예를 들어, AI 애플리케이션은 사용자의 음성 요청을 이해하고, 이미지를 분류하고, 추천한 후 사람 목소리가 담긴 음성 메시지로 응답을 전달해야 할 수 있다. 따라서 각 단계마다 다른 유형의 AI 모델이 필요하다.

 

MLPerf 벤치마크는 이러한 워크로드 및 기타 인기있는 AI 워크로드를 다룬다. 따라서 IT 의사 결정권자는 이 테스트를 통해 신뢰할 수 있고 유연하게 배포할 수 있는 성능을 얻을 수 있다.

 

테스트는 투명하고 객관적이기 때문에 사용자는 정보에 입각한 구매 결정을 내릴 때 MLPerf 결과를 신뢰할 수 있다. 이 벤치마크는 암(Arm), 바이두(Baidu), 페이스북 AI(Facebook AI), 구글, 하버드(Harvard), 인텔(Intel), 마이크로소프트(Microsoft), 스탠포드(Stanford) 및 토론토 대학교(University of Toronto)를 포함한 광범위한 그룹의 지원을 받고 있다.

 

사용 가능한 소프트웨어

엔비디아 AI 플랫폼의 소프트웨어 계층인 엔비디아AI 엔터프라이즈(Enterprise)는 사용자가 인프라 투자에서 최적화된 성능을 얻을 수 있도록 보장할 뿐만 아니라 기업 데이터센터에서 AI를 실행하는 데 필요한 엔터프라이즈급 지원, 보안 및 안정성을 제공한다.

 

이 테스트에 사용된 모든 소프트웨어는 MLPerf 리포지토리에서 사용할 수 있으므로 누구나 이러한 세계적 수준의 결과를 얻을 수 있다.

 

최적화는 엔비디아의 GPU 가속 소프트웨어용 카탈로그인 NGC에서 사용할 수 있는 컨테이너에 지속적으로 접혀 있다. 이 카탈로그에는 이번 라운드의 모든 출품작에서 AI 추론을 최적화하는 데 사용되는 엔비디아 텐서RT가 호스팅된다.

 

 

#엔비디아#AI#MLPerf#호퍼#젯슨#오린

?

  1. 벤큐, 2023년형 프리미엄 전자칠판 「RP03」 시리즈 출시

    - 전자칠판의 ‘끝판왕’ RP03시리즈의 강화된 성능과 혁신적인 기능으로 전자칠판 시장 선두 주자 도약 기대 벤큐는 옥타코어 CPU를 탑재해 전작 대비 2배 빠른 2023년형 프리미엄 전자칠판 RP03 시리즈를 국내에 출시했다고 발표했다. RP03 전자칠판 시리즈(65...
    Date2023.04.10 Bynewsit Views154
    Read More
  2. 가트너, “2023년 세계 IT 지출 전년 대비 5.5% 증가 전망”

    - 불확실한 글로벌 경제 상황 속에서도 전 세계 모든 지역에서 IT 지출 증가할 것 … - 소프트웨어와 IT 서비스 지출 증가, 디바이스는 감소 예측 - 2026년까지 숙련 IT 인재 부족 현상 지속 - 인력 유지 비용 높아져 IT 서비스 기업에 의지할 것 가트너(Gartne...
    Date2023.04.10 Bynewsit Views446
    Read More
  3. 캐논코리아, 신제품 잉크젯 프린터 「PIXMA G2930/G3930」 출시

    - 대용량 및 고품질 출력, 뛰어난 사용 편의성을 갖춘 가정용 잉크젯 프린터 - 간편한 유지보수와 외부 PC 연결로 누구나 쉽게 사용 가능 기업 캐논코리아는 콤팩트한 사이즈에 간편한 조작성을 갖춘 가정용 잉크젯 프린터 PIXMA G2930, G3930 2종을 출시했다...
    Date2023.04.10 Bynewsit Views143
    Read More
  4. 윈드리버, ‘2023 일하기 좋은 기업’ 인증 획득

    윈드리버는 ‘일하기 좋은 기업 인증(Great Place To Work Certification)’을 획득했다고 밝혔다. 이 인증은 윈드리버에 현재 근무하고 있는 직원들의 설문조사를 바탕으로 이루어지며, 올해 조사에서 윈드리버가 일하기 좋은 기업이라고 답한 임직원의 비율은 ...
    Date2023.04.10 Bynewsit Views488
    Read More
  5. 마우저, 휴대용 전자 기기용 인피니언 「EZ-PD PMG1-B1」 MCU 공급

    마우저 일렉트로닉스는 인피니언의 EZ-PD PMG1-B1 USB Type C 마이크로컨트롤러 제품을 공급한다고 밝혔다. EZ-PD PMG1-B1 마이크로컨트롤러는 엔지니어에게 유연하고 안전한 MCU와 전동 공구, 소형 가전제품, 전기자전거 등과 같은 대형 BOM이 필요한 고전압 ...
    Date2023.04.07 Bynewsit Views350
    Read More
  6. ASUS, 13세대 인텔 코어 프로세서용 TUF 게이밍·프라임 B760 메인보드 3종 추가 출시

    - TUF 게이밍 B760M-플러스 시리즈… 밀리터리 등급 전원 및 냉각 솔루션, DDR5 메모리, PCIe 5.0 x16 슬롯 지원 - TUF 게이밍 B760M-플러스 WIFI… 최대 2.4Gbps 속도 WiFi 6 지원으로 안정적인 네트워크 구축 - 프라임 B760M-A WIFI D4… PCIe 4.0 슬롯 및 PCIe...
    Date2023.04.07 Bynewsit Views197
    Read More
  7. AMD, 5nm ASIC 기반 미디어 가속기 「알베오 MA35D」 발표…“32x 1080p 스트리밍 성능과 AI 기반 비디오 품질 최적화 제공”

    - AV1 가속 파이프라인을 갖춘 특수 제작된 비디오 프로세싱 아키텍처로 카드당 32x 1080p 스트리밍 성능과 AI 기반 비디오 품질 최적화 제공 AMD가 새로운 대규모 라이브 양방향 스트리밍 서비스 트렌드에 대응하고자 특수 제작된 2개의 5nm ASIC을 기반으로 ...
    Date2023.04.07 Bynewsit Views302
    Read More
  8. 엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현

    - 엔비디아 H100 및 L4 GPU, 생성형 AI 및 기타 모든 워크로드 새로운 수준으로 향상 - 젯슨 AGX 오린 성능 및 효율성 향상 엔비디아가 최신 MLPerf 결과에서 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다고 밝혔다. MLPerf는...
    Date2023.04.07 Bynewsit Views425
    Read More
  9. 캐논코리아-메디엔비테크, 메디컬 사업 확장 업무협약 체결

    - 캐논코리아, 병원에서 요양 병원, 요양원까지 메디컬 분야 토탈 솔루션 제공 기업으로 자리매김 - 고령사회 환자 케어 문제 해결을 위한 ‘스마트 바디 클린’ 제품 판매 확장 계획 캐논코리아 주식회사)가 의료기기 R&D 및 생산업체 메디엔비테크와 메디컬 사...
    Date2023.04.07 Bynewsit Views184
    Read More
  10. 아크로니스, CRN 선정 2년 연속 ‘보안 100대 기업 및 데이터센터 50대 기업’ 선정

    - 채널 지원 정책에 집중하고, 최고의 솔루션을 제공하는 업체로 인정 아크로니스는 오늘 2년 연속 CRN ‘보안 100(Security 100)대 기업’ 및 ‘데이터센터 50(Data Center 50)대 기업’으로 선정됐다고 밝혔다. CRN 선정 보안 100대 기업 목록은 채널 지원 정책...
    Date2023.04.07 Bynewsit Views202
    Read More
  11. MSI, ‘지포스 RTX 40 시리즈 체험존’ 운영

    - ‘MSI 지포스 RTX 4090 슈프림X 트라이프로져3S’ 등 직접 체험 가능 엠에스아이코리아는 ‘지포스 RTX 40 시리즈 체험존’을 설치 및 운영하여 고객들이 직접 MSI의 그래픽카드를 체험할 수 있는 행사를 진행한다고 밝혔다. 이번 행사는 2023년 4월 1일부터 4월...
    Date2023.04.06 Bynewsit Views211
    Read More
  12. VMware, ’VMware 익스플로어 코리아' 개최… “한국 기업의 클라우드 자신감 전 세계 최고 수준”

    VMware는 오늘 서울에서 VMware 익스플로어 코리아(VMware Explore Korea)를 개최하고 국 기업의 클라우드 자신감이 전 세계 최고 수준이라고 발표했다. 국내 첫 개최한 이번 VMware의 플래그십 콘퍼런스에는 약 3천 명의 클라우드 관계자들이 등록, 최신 멀티...
    Date2023.04.06 Bynewsit Views311
    Read More
  13. 삼성전자-AMD, 차세대 그래픽 설계자산 파트너십 확대

    삼성전자와 AMD가 차세대 고성능·저전력 그래픽 설계자산(IP) 분야 전략적 파트너십을 확대한다. 삼성전자는 AMD의 초저전력·고성능 라데온(Radeon) 그래픽 설계자산을 기반으로 개발하는 차세대 그래픽 솔루션을 엑시노스(Exynos) 라인업에 확대 적용한다고 ...
    Date2023.04.06 Bynewsit Views203
    Read More
  14. SAP 코리아-MAVEK, ‘글로벌 반도체 전쟁과 미래: C-Level 서밋 2023’ 두 번째 세션 개최

    - ‘중국의 반도체 전략과 美반도체법 대응’ 주제로 오는 4월 18일 개최 SAP 코리아는 지난 2월 국제 거래 자문기업 MAVEK과 함께 개최한 ‘글로벌 반도체 전쟁과 미래: C-Level 서밋 2023’ 웨비나 시리즈 중 두 번째 세션을 오는 4월 18일에 개최한다고 밝혔다....
    Date2023.04.06 Bynewsit Views481
    Read More
  15. 소니코리아, 알파 풀프레임 미러리스 카메라 및 렌즈 정품등록 프로모션 이벤트

    - 4월 6일(목)부터 6월 11일(일)까지 알파 풀프레임 미러리스 카메라 3종·G Master 및 G 렌즈 12종 정품등록 프로모션 실시 - 높아지는 여행 수요에 발맞춰, 여행의 추억을 더욱 가치있게 남길 수 있는 정품등록 프로모션 기획 - 행사 기간 내 제품 구매 후 정...
    Date2023.04.06 Bynewsit Views155
    Read More
  16. 트렌드마이크로, 사이버 범죄 조직 보고서 <사이버 범죄 기업의 내부> 발표

    - “사이버 범죄 조직 규모가 클수록 기업 형태 갖춰” - 대규모 사이버 범죄 조직 대부분 운영 비용 80% 임금에 할당 트렌드마이크로는 사이버 범죄 조직 보고서 <사이버 범죄 기업의 내부>를 발표하고, 사이버 범죄 조직이 성장할수록 합법적 기업의 형태를 갖...
    Date2023.04.06 Bynewsit Views205
    Read More
  17. 엔비디아, ‘색보이: 빅 어드벤처’에 DLSS 3 등 최신 업데이트 지원

    엔비디아가 색보이: 빅 어드벤처(Sackboy: A Big Adventure)의 최신 업데이트에 엔비디아(NVIDIA) DLSS 3, 엔비디아 리플렉스(Reflex) 및 SER(Shader Execution Reordering) 지원이 추가된다고 밝혔다. 엔비디아 DLSS는 현재 280개 이상의 게임과 애플리케이션...
    Date2023.04.05 Bynewsit Views196
    Read More
  18.   나이트스코프, 혁신적 감지 기술로 공공 안전 보장하는 ‘자율 순찰 로봇’ 발표

    - 바이코의 고밀도 전력 모듈, 범죄 예방하는 신속 감시 AI 네트워크 구현 수년 전 ‘자율 순찰 로봇’이라는 개념은 공상과학으로 그쳤지만 오늘날에는 현실구현 가능하며 영향력 있는 존재로 자리잡았다. 2013년 캘리포니아주 마운틴뷰(Mountain View)에서 출...
    Date2023.04.05 Bynewsit Views432
    Read More
  19. 벤큐- 카카오게임즈, ‘카카오 배틀그라운드’ 제휴 관련 업무 협약 체결

    - 상호 협력을 통한 배틀그라운드 PC방, 클랜 등 코어 유저 대상 협력 캠페인 진행 벤큐는 카카오의 게임 전문 계열사 카카오게임즈와 ‘카카오 배틀그라운드’ 관련 마케팅 업무 협약을 체결했다고 밝혔다. 이번 협약식은 4월 4일 카카오게임즈 본사에서 양사 ...
    Date2023.04.05 Bynewsit Views137
    Read More
  20. SAP 코리아, ‘SAP Young Next Cloud Academy’ 3기 모집

    - 높은 취업률로 인기를 더해가는 교육 프로그램 3기 모집 SAP 코리아가 ‘SAP Young Next Cloud(SYNC 아카데미)’ 3기 과정의 참가자를 모집한다고 밝혔다. 작년 6월 1기를 시작으로 올해 3기에 접어든 SYNC 아카데미는 고용노동부가 진행하는 케이(K)-디지털 ...
    Date2023.04.05 Bynewsit Views400
    Read More
Board Pagination Prev 1 ... 186 187 188 189 190 191 192 193 194 195 ... 249 Next
/ 249
CLOSE