- 엔비디아 H100 L4 GPU, 생성형 AI 및 기타 모든 워크로드 새로운 수준으로 향상

- 젯슨 AGX 오린 성능 및 효율성 향상

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (2).jpg

엔비디아 최신 MLPerf 결과에서 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다고 밝혔다. MLPerf는 독립적인 타사 벤치마크로서 AI 성능에 대한 최종적인 측정치로 남아 있다. 엔비디아의 AI 플랫폼은 MLPerf 추론 3.0 벤치마크를 포함해 MLPerf가 시작된 이래 훈련과 추론 모두에서 지속적으로 리더십을 보여 왔다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 "3년 전 A100을 출시했을 때 AI 세계는 컴퓨터 비전이 지배를 했다. 하지만 이제는 생성형 AI가 등장했다. 이것이 바로 우리가 트랜스포머 엔진(Transformer Engine)을 통해 GPT에 특별히 최적화된 호퍼(Hopper)를 개발한 이유이다. MLPerf 3.0은 A100보다 4배 더 높은 성능을 제공하는 호퍼를 강조한다"고 밝히고, "다음 단계 생성형 AI는 뛰어난 에너지 효율로 대규모 언어 모델을 훈련할 수 있는 새로운 AI 인프라를 필요로 한다. 고객은 수만 개의 호퍼 GPU를 엔비디아 NV링크(NVLink)와 인피니밴드(InfiniBand)로 연결해 AI 인프라를 구축하면서 대규모로 호퍼를 확장하고 있다. 업계는 안전하고 신뢰할 수 있는 생성형 AI의 새로운 발전을 위해 열심히 노력하고 있다. 호퍼는 이러한 필수적인 작업을 가능하게 한다"고 덧붙였다.

 

최신 MLPerf 결과에 따르면 엔비디아는 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다. 특히, DGX H100 시스템에서 실행되는 엔비디아 H100 텐서 코어(Tensor Core) GPU는 생산에서 신경망을 실행하는 작업인 AI 추론의 모든 테스트에서 최고 성능을 제공했다. 소프트웨어 최적화 덕분에 GPU는 9월에 출시된 제품 대비 최대 54%의 성능 향상을 달성했다. 의료 분야에서 H100 GPU는 의료 영상용 MLPerf 벤치마크인 3D-UNet에서 9월 이후 31%의 성능 향상을 달성했다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (3).jpg

트랜스포머 엔진으로 구동되는 호퍼 아키텍처 기반 H100 GPU는 트랜스포머 기반 대규모 언어 모델인 BERT에서 탁월한 성능을 발휘해 생성형 AI의 광범위한 사용의 토대를 마련했다.

 

생성형 AI를 통해 사용자는 텍스트, 이미지, 3D 모델 등을 빠르게 만들 수 있다. 이는 스타트업부터 클라우드 서비스 제공업체에 이르기까지 다양한 기업이 새로운 비즈니스 모델을 구현하고 기존 비즈니스 모델을 가속화하기 위해 빠르게 도입하고 있는 기능이다. 현재 수억 명의 사람들이 즉각적인 응답을 기대하며 트랜스포머 모델인 챗GPT와 같은 생성형 AI 도구를 사용하고 있다. 이러한 AI의 시대에는 추론 성능이 매우 중요하다. 딥러닝은 이제 거의 모든 곳에 배포되고 있으며 공장 현장부터 온라인 추천 시스템에 이르기까지 추론 성능에 대한 요구가 끊임없이 증가하고 있다.

 

L4 GPU의 빠른 속도

엔비디아 L4 텐서 코어 GPU는 이전 세대 T4 GPU보다 3배 이상 빠른 속도로 MLPerf 테스트에 데뷔했다. 프로파일이 낮은 폼 팩터(low-profile form factor)로 패키징된 가속기는 거의 모든 서버에서 높은 처리량과 짧은 지연 시간을 제공하도록 설계됐다.

 

L4 GPU는 모든 MLPerf 워크로드를 실행했다. 주요 FP8 형식을 지원하므로 성능에 민감한 BERT 모델에서 특히 뛰어난 결과를 보였다.

 

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (4).jpg

L4 GPU는 탁월한 AI 성능 외에도 최대 10배 빠른 이미지 디코드, 최대 3.2배 빠른 영상 처리, 4배 이상 빠른 그래픽 및 실시간 렌더링 성능을 제공한다.

 

GTC 2023에서 발표된 이 가속기는 이미 주요 시스템 제조업체와 클라우드 서비스 제공업체에서 사용할 수 있다. L4 GPU는 GTC 2023에서 발표된 엔비디아의 AI 추론 플랫폼 포트폴리오에 가장 최근에 추가된 제품이다.

 

시스템 테스트에서 빛나는 소프트웨어, 네트워크

엔비디아의 풀스택 AI 플랫폼이 새로운 MLPerf 테스트에서 리더십을 입증했다. 이른바 네트워크 분할 벤치마크는 데이터를 원격 추론 서버로 스트리밍한다. 이 테스트는 기업 방화벽 뒤에 데이터를 저장한 채 클라우드에서 AI 작업을 실행하는 기업 사용자의 일반적인 시나리오를 반영한다.

 

BERT에서 원격 엔비디아 DGX A100 시스템은 최대 로컬 성능의 96%까지 제공했으며, 일부 작업의 경우 CPU가 완료될 때까지 기다려야 하기 때문에 부분적으로 속도가 느려졌다. GPU로만 처리되는 컴퓨터 비전을 위한 ResNet-50 테스트에서는 100%를 기록했다.

 

두 결과 모두 엔비디아 퀀텀 인피니밴드(Quantum Infiniband) 네트워킹, 엔비디아 커넥트X(ConnectX) 스마트NIC(SmartNIC)엔비디아 GPU다이렉트(GPUDirect)와 같은 소프트웨어 덕분이다.

 

엣지에서 3.2배의 성능 향상을 보여준 오린

이와는 별도로 엔비디아 젯슨 AGX 오린(Orin) 시스템 온 모듈은 1년 전 결과에 비해 에너지 효율성은 최대 63%, 성능은 81% 향상됐다. 젯슨 AGX 오린은 배터리로 구동되는 시스템을 포함해 저전력 수준의 제한된 공간에서 AI가 필요할 때 추론을 제공한다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (1).jpg

더 적은 전력을 소비하는 더 작은 모듈을 필요로 하는 애플리케이션의 경우, 벤치마크에서 첫 선을 보인 젯슨 오린 NX 16G가 빛을 발했다. 이전 세대 젯슨 자비에(Jetson Xavier) NX 프로세서보다 최대 3.2배의 성능을 제공했다.

 

광범위한 엔비디아 AI 생태계

MLPerf 결과는 엔비디아 AI가 업계에서 가장 광범위한 머신 러닝 생태계의 지원을 받고 있음을 보여준다. 이번 라운드에는 10개 기업이 엔비디아 플랫폼에 대한 결과를 제출했다. 여기에는 마이크로소프트 애저(Microsoft Azure) 클라우드 서비스 및 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), H3C, 레노버(Lenovo), 네트릭스(Nettrix), 슈퍼마이크로(Supermicro) 및 엑스퓨젼(xFusion)을 비롯한 시스템 제조업체가 포함됐다.

 

이들의 연구는 사용자가 클라우드와 자체 데이터센터에서 실행되는 서버 모두에서 엔비디아 AI를 통해 뛰어난 성능을 얻을 수 있음을 보여준다. 엔비디아 파트너는 MLPerf가 AI 플랫폼 및 공급업체를 평가하는 고객에게 유용한 도구라는 것을 알고 있기 때문에 MLPerf에 참여한다. 최신 라운드의 결과는 그들이 현재 제공하는 성능이 엔비디아 플랫폼과 함께 성장할 것임을 입증한다.

 

사용자에게 필요한 다목적 성능

엔비디아 AI는 데이터센터 및 엣지 컴퓨팅에서 모든 MLPerf 추론 워크로드 및 시나리오를 실행할 수 있는 유일한 플랫폼이다. 다재다능한 성능과 효율성은 사용자를 진정한 승자로 만든다.실제 애플리케이션은 일반적으로 실시간으로 답을 제공해야 하는 다양한 종류의 신경망을 많이 사용한다.

 

예를 들어, AI 애플리케이션은 사용자의 음성 요청을 이해하고, 이미지를 분류하고, 추천한 후 사람 목소리가 담긴 음성 메시지로 응답을 전달해야 할 수 있다. 따라서 각 단계마다 다른 유형의 AI 모델이 필요하다.

 

MLPerf 벤치마크는 이러한 워크로드 및 기타 인기있는 AI 워크로드를 다룬다. 따라서 IT 의사 결정권자는 이 테스트를 통해 신뢰할 수 있고 유연하게 배포할 수 있는 성능을 얻을 수 있다.

 

테스트는 투명하고 객관적이기 때문에 사용자는 정보에 입각한 구매 결정을 내릴 때 MLPerf 결과를 신뢰할 수 있다. 이 벤치마크는 암(Arm), 바이두(Baidu), 페이스북 AI(Facebook AI), 구글, 하버드(Harvard), 인텔(Intel), 마이크로소프트(Microsoft), 스탠포드(Stanford) 및 토론토 대학교(University of Toronto)를 포함한 광범위한 그룹의 지원을 받고 있다.

 

사용 가능한 소프트웨어

엔비디아 AI 플랫폼의 소프트웨어 계층인 엔비디아AI 엔터프라이즈(Enterprise)는 사용자가 인프라 투자에서 최적화된 성능을 얻을 수 있도록 보장할 뿐만 아니라 기업 데이터센터에서 AI를 실행하는 데 필요한 엔터프라이즈급 지원, 보안 및 안정성을 제공한다.

 

이 테스트에 사용된 모든 소프트웨어는 MLPerf 리포지토리에서 사용할 수 있으므로 누구나 이러한 세계적 수준의 결과를 얻을 수 있다.

 

최적화는 엔비디아의 GPU 가속 소프트웨어용 카탈로그인 NGC에서 사용할 수 있는 컨테이너에 지속적으로 접혀 있다. 이 카탈로그에는 이번 라운드의 모든 출품작에서 AI 추론을 최적화하는 데 사용되는 엔비디아 텐서RT가 호스팅된다.

 

 

#엔비디아#AI#MLPerf#호퍼#젯슨#오린

?

  1. 샥즈, 프리미엄 골전도 블루투스 헤드셋 ‘오픈컴’ 시리즈 국내 출시…“산업 현장에 최적화”

    - 귀를 막지 않는 오픈형 디자인으로 외부 소리도 들을 수 있어 안전 보장 - 노이즈 캔슬링 붐 마이크를 적용해 시끄러운 작업 환경에서도 뛰어난 통화 품질 지원 - 5분 급속 충전으로 약 2시간 사용 가능한 강력한 배터리 성능 자랑 - IP55 방수·방진 등급으...
    Date2023.04.20 Bynewsit Views271
    Read More
  2. 스펙트럼 인스트루먼트, PCIe 디지타이저에 외부 GPU 활용 DDC 기능 구현

    - 디지털 다운 변환(DDC)으로 RF 신호를 베이스밴드 신호로 변환 가능 스펙트럼 인스트루먼트(Spectrum Instrumentation)가 자사 PCIe 디지타이저 제품군에 디지털 다운 변환(DDC)기능을 구현한다고 밝혔다. DDC는 디지털 라디오, 레이더, 모바일 통신, 우주 ...
    Date2023.04.20 Bynewsit Views510
    Read More
  3. 오라클, ‘기업의 의사결정 딜레마’ 글로벌 조사 결과 발표…“전 세계 비즈니스 리더 70%, AI에 의사결정 일임 원한다”

    - 전 세계 85%의 비즈니스 리더, 지난해 내린 결정에 대해 후회 및 죄책감을 느끼거나 의구심을 가지는 등 의사결정으로 인한 괴로움에 시달려 - 72%의 응답자, 방대한 양의 데이터 및 데이터에 대한 신뢰 부족이 의사 결정을 막고 있다고 토로 - 응답자 94%, ...
    Date2023.04.20 Bynewsit Views614
    Read More
  4. 엔비디아-지멘스, 하노버 산업박람회에서 프레이어(FREYR) 디지털 가상 배터리 공장 데모 협력

    엔비디아는 4월 17일부터 21일까지 5일간 독일 하노버에서 개최되는 ‘하노버 산업박람회(Hannover Messe)’에서 지멘스가 공개한 차세대 프레이어(FREYR) 배터리 공장의 디지털 모델 제작에 엔비디아(NVIDIA)가 협력했다고 밝혔다. 해당 모델은 지난 17일 지멘...
    Date2023.04.19 Bynewsit Views520
    Read More
  5. 스틸시리즈, ‘프라임 에이밍 대회’ 성황리 종료

    - 게임 조준 속도 훈련 및 테스트하는 프로그램 3D 에임 트레이너 스틸시리즈가 스틸시리즈 프라임 에이밍 대회를 성황리에 종료했다고 밝혔다. 금번 대회는 2023년 4월 6일 (목) ~ 2023년 4월 16일 (일) 약 11일간 인벤 스틸시리즈 페이지에서 진행되었다. 프...
    Date2023.04.19 Bynewsit Views238
    Read More
  6. 슈나이더 일렉트릭 코리아-케이엠파워, ‘월드IT쇼 2023’에서 IT 핵심 제품 공개  

    - 대형엔〮터프라이즈 데이터센터부터 엣지, 소규모 환경에 맞는 IT 인프라 제품 제안 - 데이터센터 기반설비 전문 파트너로서, 동반성장을 위한 상생 파트너십 유지 슈나이더 일렉트릭 코리아가 케이엠파워와 4월 19일(수)부터 21일(금)까지 서울 코엑스에서 ...
    Date2023.04.19 Bynewsit Views453
    Read More
  7. 씨엠, 초소형 고정밀 반도체용 ‘히트 익스체인저’ 출시

    - 정밀 칠러 국산화 첫 성공 기업 씨엠 불소계 쿨런트 전용 히트 익스체인저 개발 씨엠은 초소형 크기(45x90x90cm)에 열 교환능력이 60kW, 온도편차 ±0.1℃인 고정밀 반도체용 히트 익스체인저를 출시했다고 밝혔다. 기존제품은 체적이 240리터에 냉각능력은 15...
    Date2023.04.19 Bynewsit Views389
    Read More
  8. 엔비디아, 새로운 지포스 게임 레디 드라이버 출시…“290개의 게임과 애플리케이션에서 DLSS 사용 가능”

    엔비디아가 새로운 게임 레디 드라이버를 출시했다고 밝혔다. 여기에 엔비디아(NVIDIA)는 블릭 페이스: 포세이큰(Bleak Faith: Forsaken), 로맨슬베니아(Romancelvania), 셜록 홈즈 디 어웨이큰드(Sherlock Holmes The Awakened)의 추가를 포함해 이제 290개의...
    Date2023.04.19 Bynewsit Views233
    Read More
  9. 팀뷰어, SAP 디지털 제조 솔루션에 팀뷰어 프론트라인 AR 솔루션 통합…“제조 현장 생산성 제고”

    팀뷰어(TeamViewer)가 산업용 AR 솔루션 ‘팀뷰어 프론트라인(TeamViewer Frontline)’을 SAP 디지털 제조 솔루션과 통합해 제조 현장의 생산 성능을 최적화한다고 19일 밝혔다. 이번 통합으로 고객은 팀뷰어 프론트라인의 강력한 AR 기반 워크플로우 솔루션을 ...
    Date2023.04.19 Bynewsit Views633
    Read More
  10. 마우저, 유블럭스 「JODY-W3」 호스트 기반 차량용 모듈 공급…“ 다중 채널 및 고속 데이터 통신 확장”

    마우저 일렉트로닉스는 유블럭스(u-blox)의 JODY-W3 호스트 기반 차량용 모듈을 공급한다고 밝혔다. JODY-W3 호스트 기반 차량용 모듈은 제조 현장 자동화, 기계 제어, 보안 및 감시와 같은 자동차 및 산업용 IoT 애플리케이션을 위해 늘어나고 있는 고속 무선...
    Date2023.04.19 Bynewsit Views476
    Read More
  11. S2W-성신여대, 산학협력 및 정보보안 전문 인력 양성 MOU 체결

    - 4월 18일 성신여자대학교와 S2W 산학협력 기반의 정보보호 교육 기반 강화 및 직무중심의 정보보호 전문인력 양성 MOU 체결 - 정보보호 산업현장의 수요에 맞는 교육과정 개설 및 운영, 정보보호 특화과정 운영을 위한 인프라 구축 및 교육 관리에 대한 향후...
    Date2023.04.19 Bynewsit Views324
    Read More
  12. 씨게이트, 최고의 신뢰성과 성능을 갖춘 ‘아이언울프 프로’ 22TB HDD 출시

    - 다중 사용자 환경 및 엔터프라이즈 RAID 솔루션 위한 CMR 기반 22TB 하드 드라이브 씨게이트(Seagate)가 미국 라스베이거스에서 열린 NAB 2023 콘퍼런스에서 ‘아이언울프 프로(IronWolf Pro)’ 22TB HDD를 선보였다. 이번에 출시된 아이언울프 프로 22TB는 다...
    Date2023.04.18 Bynewsit Views256
    Read More
  13. 스플렁크, 2023 보안 현황 보고서 발표…“설문 참여 기업 중 절반 이상, 데이터 유출 경험”

    - 설문 참여 기업 중 62%, 예기치 않은 다운타임 한 달에 한번 경험 데이터 플랫폼 전문기업 스플렁크(Splunk)가 리서치 업체 ESG(Enterprise Strategy Group) 와 함께 2023 보안 현황 보고서를 발표했다. 스플렁크가 매년 발간하는 보안 현황 보고서는 오늘날...
    Date2023.04.18 Bynewsit Views588
    Read More
  14. TI, 업계 최초의 독립식 능동 EMI 필터 IC 개발…“고밀도 전원 공급 장치 설계 지원”

    - 시스템 성능과 효율성, 신뢰성 최적화 - 더 작고, 가벼우면서 경제적인 솔루션 설계 지원 텍사스 인스트루먼트(TI)는 오늘 더 작고 가벼운 EMI 필터를 통해 더 낮은 시스템 비용으로 EMI 규정 표준을 충족하고 시스템 기능을 개선할 수 있는 업계 최초의 독...
    Date2023.04.18 Bynewsit Views516
    Read More
  15. 에지오, 애플리케이션 성능 관리 플랫폼 ‘에지오 애플리케이션 v7’ 발표…”보안 및 전송속도 개선“

    - 강력한 통합 다계층 보안이 적용된 1초 미만의 신속한 웹사이트 콘텐츠 전송할 수 있는 종합적인 플랫폼 제공 에지오(Edgio)는 오늘, 1초 미만의 빠른 콘텐츠 전송 속도와 강력한 보안을 기반으로 단일 사용자 관리화면(UI)에서 애플리케이션 기능을 통합 관...
    Date2023.04.18 Bynewsit Views313
    Read More
  16. 옴디아, 디스플레이 생산 및 재고 트래커 조사 발표…“2023년 2분기 글로벌 디스플레이 팹 가동률은 74%로 회복 중, OLED 팹은 평균 60% 미만”

    옴디아(Omdia)가 디스플레이 생산 및 재고 트래커(Display Production & Inventory Tracker) 조사를 18일 발표했다. 옴디아는 LCD TV와 노트북, 모니터 패널 그리고 스마트폰 LCD 패널 주문이 급증하며 총 디스플레이 팹 가동률이 2023년 1분기의 66%에서 2023...
    Date2023.04.18 Bynewsit Views521
    Read More
  17. 마우저, TE 커넥티비티 ‘올해의 글로벌 우수 서비스 유통기업’ 어워드 9번째 수상

    마우저 일렉트로닉스는 TE 커넥티비티로부터 아홉 번째로 올해의 글로벌 우수 서비스 유통기업 상을 수상했다고 밝혔다. 마우저는 지난 2022년 기록한 매출 성장과 시장 점유율 성장, 고객 성장 및 사업 계획 성과를 바탕으로 유통 부문에 있어 권위 있는 본 ...
    Date2023.04.18 Bynewsit Views457
    Read More
  18. 서비스나우, 나우 플랫폼 유타 릴리즈 출시

    - 나우 플랫폼 최신 버전 출시를 통해 RPA, 검색, HR을 위한 인력 최적화, 보안 및 운영 - 위험 해결을 위한 향상된 인시던트 관리 기능을 갖춘 AI 기반 프로세스 마이닝 공개 디지털 비즈니스 플랫폼 서비스나우(ServiceNow)가 오늘 나우 플랫폼(Now Platform...
    Date2023.04.18 Bynewsit Views618
    Read More
  19. 슈나이더 일렉트릭, ‘하노버메세 2023’ 참가

    - 증가하는 에너지 수요를 해결하고 넷제로 목표를 달성할 수 있는 솔루션 및 제품 공개 - ETAP의 새로운 통합 전기 디지털 트윈 플랫폼 및 AVEVA의 최첨단 산업용 소프트웨어 공개 슈나이더 일렉트릭이 4월 17일(월) 부터 21일(금) 까지 독일 하노버에서 개최...
    Date2023.04.17 Bynewsit Views677
    Read More
  20. 뱅앤올룹슨, 「베오플레이 EX 아틀리에 에디션」 한정판 피치 핑크 컬러 출시

    뱅앤올룹슨(Bang&Olufsen)이 베오플레이 EX 아틀리에 에디션(Beoplay EX Atelier Edition) 피치 핑크를 출시한다고 밝혔다. 아틀리에 에디션은 극소량 제작과 화려한 색상이 특징이다. 베오플레이 EX 아틀리에 에디션은 자기만의 취향과 스타일을 추구하는 젠...
    Date2023.04.17 Bynewsit Views321
    Read More
Board Pagination Prev 1 ... 205 206 207 208 209 210 211 212 213 214 ... 270 Next
/ 270
CLOSE