- 엔비디아 H100 L4 GPU, 생성형 AI 및 기타 모든 워크로드 새로운 수준으로 향상

- 젯슨 AGX 오린 성능 및 효율성 향상

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (2).jpg

엔비디아 최신 MLPerf 결과에서 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다고 밝혔다. MLPerf는 독립적인 타사 벤치마크로서 AI 성능에 대한 최종적인 측정치로 남아 있다. 엔비디아의 AI 플랫폼은 MLPerf 추론 3.0 벤치마크를 포함해 MLPerf가 시작된 이래 훈련과 추론 모두에서 지속적으로 리더십을 보여 왔다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 "3년 전 A100을 출시했을 때 AI 세계는 컴퓨터 비전이 지배를 했다. 하지만 이제는 생성형 AI가 등장했다. 이것이 바로 우리가 트랜스포머 엔진(Transformer Engine)을 통해 GPT에 특별히 최적화된 호퍼(Hopper)를 개발한 이유이다. MLPerf 3.0은 A100보다 4배 더 높은 성능을 제공하는 호퍼를 강조한다"고 밝히고, "다음 단계 생성형 AI는 뛰어난 에너지 효율로 대규모 언어 모델을 훈련할 수 있는 새로운 AI 인프라를 필요로 한다. 고객은 수만 개의 호퍼 GPU를 엔비디아 NV링크(NVLink)와 인피니밴드(InfiniBand)로 연결해 AI 인프라를 구축하면서 대규모로 호퍼를 확장하고 있다. 업계는 안전하고 신뢰할 수 있는 생성형 AI의 새로운 발전을 위해 열심히 노력하고 있다. 호퍼는 이러한 필수적인 작업을 가능하게 한다"고 덧붙였다.

 

최신 MLPerf 결과에 따르면 엔비디아는 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다. 특히, DGX H100 시스템에서 실행되는 엔비디아 H100 텐서 코어(Tensor Core) GPU는 생산에서 신경망을 실행하는 작업인 AI 추론의 모든 테스트에서 최고 성능을 제공했다. 소프트웨어 최적화 덕분에 GPU는 9월에 출시된 제품 대비 최대 54%의 성능 향상을 달성했다. 의료 분야에서 H100 GPU는 의료 영상용 MLPerf 벤치마크인 3D-UNet에서 9월 이후 31%의 성능 향상을 달성했다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (3).jpg

트랜스포머 엔진으로 구동되는 호퍼 아키텍처 기반 H100 GPU는 트랜스포머 기반 대규모 언어 모델인 BERT에서 탁월한 성능을 발휘해 생성형 AI의 광범위한 사용의 토대를 마련했다.

 

생성형 AI를 통해 사용자는 텍스트, 이미지, 3D 모델 등을 빠르게 만들 수 있다. 이는 스타트업부터 클라우드 서비스 제공업체에 이르기까지 다양한 기업이 새로운 비즈니스 모델을 구현하고 기존 비즈니스 모델을 가속화하기 위해 빠르게 도입하고 있는 기능이다. 현재 수억 명의 사람들이 즉각적인 응답을 기대하며 트랜스포머 모델인 챗GPT와 같은 생성형 AI 도구를 사용하고 있다. 이러한 AI의 시대에는 추론 성능이 매우 중요하다. 딥러닝은 이제 거의 모든 곳에 배포되고 있으며 공장 현장부터 온라인 추천 시스템에 이르기까지 추론 성능에 대한 요구가 끊임없이 증가하고 있다.

 

L4 GPU의 빠른 속도

엔비디아 L4 텐서 코어 GPU는 이전 세대 T4 GPU보다 3배 이상 빠른 속도로 MLPerf 테스트에 데뷔했다. 프로파일이 낮은 폼 팩터(low-profile form factor)로 패키징된 가속기는 거의 모든 서버에서 높은 처리량과 짧은 지연 시간을 제공하도록 설계됐다.

 

L4 GPU는 모든 MLPerf 워크로드를 실행했다. 주요 FP8 형식을 지원하므로 성능에 민감한 BERT 모델에서 특히 뛰어난 결과를 보였다.

 

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (4).jpg

L4 GPU는 탁월한 AI 성능 외에도 최대 10배 빠른 이미지 디코드, 최대 3.2배 빠른 영상 처리, 4배 이상 빠른 그래픽 및 실시간 렌더링 성능을 제공한다.

 

GTC 2023에서 발표된 이 가속기는 이미 주요 시스템 제조업체와 클라우드 서비스 제공업체에서 사용할 수 있다. L4 GPU는 GTC 2023에서 발표된 엔비디아의 AI 추론 플랫폼 포트폴리오에 가장 최근에 추가된 제품이다.

 

시스템 테스트에서 빛나는 소프트웨어, 네트워크

엔비디아의 풀스택 AI 플랫폼이 새로운 MLPerf 테스트에서 리더십을 입증했다. 이른바 네트워크 분할 벤치마크는 데이터를 원격 추론 서버로 스트리밍한다. 이 테스트는 기업 방화벽 뒤에 데이터를 저장한 채 클라우드에서 AI 작업을 실행하는 기업 사용자의 일반적인 시나리오를 반영한다.

 

BERT에서 원격 엔비디아 DGX A100 시스템은 최대 로컬 성능의 96%까지 제공했으며, 일부 작업의 경우 CPU가 완료될 때까지 기다려야 하기 때문에 부분적으로 속도가 느려졌다. GPU로만 처리되는 컴퓨터 비전을 위한 ResNet-50 테스트에서는 100%를 기록했다.

 

두 결과 모두 엔비디아 퀀텀 인피니밴드(Quantum Infiniband) 네트워킹, 엔비디아 커넥트X(ConnectX) 스마트NIC(SmartNIC)엔비디아 GPU다이렉트(GPUDirect)와 같은 소프트웨어 덕분이다.

 

엣지에서 3.2배의 성능 향상을 보여준 오린

이와는 별도로 엔비디아 젯슨 AGX 오린(Orin) 시스템 온 모듈은 1년 전 결과에 비해 에너지 효율성은 최대 63%, 성능은 81% 향상됐다. 젯슨 AGX 오린은 배터리로 구동되는 시스템을 포함해 저전력 수준의 제한된 공간에서 AI가 필요할 때 추론을 제공한다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (1).jpg

더 적은 전력을 소비하는 더 작은 모듈을 필요로 하는 애플리케이션의 경우, 벤치마크에서 첫 선을 보인 젯슨 오린 NX 16G가 빛을 발했다. 이전 세대 젯슨 자비에(Jetson Xavier) NX 프로세서보다 최대 3.2배의 성능을 제공했다.

 

광범위한 엔비디아 AI 생태계

MLPerf 결과는 엔비디아 AI가 업계에서 가장 광범위한 머신 러닝 생태계의 지원을 받고 있음을 보여준다. 이번 라운드에는 10개 기업이 엔비디아 플랫폼에 대한 결과를 제출했다. 여기에는 마이크로소프트 애저(Microsoft Azure) 클라우드 서비스 및 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), H3C, 레노버(Lenovo), 네트릭스(Nettrix), 슈퍼마이크로(Supermicro) 및 엑스퓨젼(xFusion)을 비롯한 시스템 제조업체가 포함됐다.

 

이들의 연구는 사용자가 클라우드와 자체 데이터센터에서 실행되는 서버 모두에서 엔비디아 AI를 통해 뛰어난 성능을 얻을 수 있음을 보여준다. 엔비디아 파트너는 MLPerf가 AI 플랫폼 및 공급업체를 평가하는 고객에게 유용한 도구라는 것을 알고 있기 때문에 MLPerf에 참여한다. 최신 라운드의 결과는 그들이 현재 제공하는 성능이 엔비디아 플랫폼과 함께 성장할 것임을 입증한다.

 

사용자에게 필요한 다목적 성능

엔비디아 AI는 데이터센터 및 엣지 컴퓨팅에서 모든 MLPerf 추론 워크로드 및 시나리오를 실행할 수 있는 유일한 플랫폼이다. 다재다능한 성능과 효율성은 사용자를 진정한 승자로 만든다.실제 애플리케이션은 일반적으로 실시간으로 답을 제공해야 하는 다양한 종류의 신경망을 많이 사용한다.

 

예를 들어, AI 애플리케이션은 사용자의 음성 요청을 이해하고, 이미지를 분류하고, 추천한 후 사람 목소리가 담긴 음성 메시지로 응답을 전달해야 할 수 있다. 따라서 각 단계마다 다른 유형의 AI 모델이 필요하다.

 

MLPerf 벤치마크는 이러한 워크로드 및 기타 인기있는 AI 워크로드를 다룬다. 따라서 IT 의사 결정권자는 이 테스트를 통해 신뢰할 수 있고 유연하게 배포할 수 있는 성능을 얻을 수 있다.

 

테스트는 투명하고 객관적이기 때문에 사용자는 정보에 입각한 구매 결정을 내릴 때 MLPerf 결과를 신뢰할 수 있다. 이 벤치마크는 암(Arm), 바이두(Baidu), 페이스북 AI(Facebook AI), 구글, 하버드(Harvard), 인텔(Intel), 마이크로소프트(Microsoft), 스탠포드(Stanford) 및 토론토 대학교(University of Toronto)를 포함한 광범위한 그룹의 지원을 받고 있다.

 

사용 가능한 소프트웨어

엔비디아 AI 플랫폼의 소프트웨어 계층인 엔비디아AI 엔터프라이즈(Enterprise)는 사용자가 인프라 투자에서 최적화된 성능을 얻을 수 있도록 보장할 뿐만 아니라 기업 데이터센터에서 AI를 실행하는 데 필요한 엔터프라이즈급 지원, 보안 및 안정성을 제공한다.

 

이 테스트에 사용된 모든 소프트웨어는 MLPerf 리포지토리에서 사용할 수 있으므로 누구나 이러한 세계적 수준의 결과를 얻을 수 있다.

 

최적화는 엔비디아의 GPU 가속 소프트웨어용 카탈로그인 NGC에서 사용할 수 있는 컨테이너에 지속적으로 접혀 있다. 이 카탈로그에는 이번 라운드의 모든 출품작에서 AI 추론을 최적화하는 데 사용되는 엔비디아 텐서RT가 호스팅된다.

 

 

#엔비디아#AI#MLPerf#호퍼#젯슨#오린

?

  1. 트렌드마이크로, “클라우드 보안 3년 안에 SOC에 흡수될 것”  

    - 클라우드 보안과 SOC 도구 전반에 전문성을 갖춘 보안 파트너 선택해야 - 클라우드와 인프라 전반의 가시성 확보를 위해 팀 별 보안 전문가들의 선제적인 수용과 협업 필요 트렌드마이크로는 기업 내 SOC(보안 운영 센터)가 2026년까지 기업 내 클라우드 보...
    Date2023.06.14 Bynewsit Views377
    Read More
  2. 와콤-안양문화고등학교, 웹툰 인재 육성을 위한 교육 업무 협약 체결

    - 안양문화고등학교와 ‘웹툰 교육 지원’ 통해 웹툰 인재 육성하는 산학 협력 체제 구축 - 웹툰메이커스과, 고성능 창작 장비 와콤 ‘신티크프로24’ 풀 세트 전면 도입 한국와콤이 안양문화고등학교와 함께 우수 웹툰 인재 양성 및 창작 교육 활성화를 위한 교육...
    Date2023.06.14 Bynewsit Views373
    Read More
  3. 포티넷, KT등 11개사와 새로운 MSSP 파트너십 체결…“글로벌 Secure SD-WAN 및 SASE 입지 확대”

    - 포티넷 시큐어 네트워킹 솔루션, 매니지드 SD-WAN에서 SASE, ZTNA, SD Branch 서비스로의 원활한 전환 지원 포티넷 코리아는 오늘, KT를 비롯한 11개의 새로운 매니지드 보안 서비스 공급업체(MSSP)들이 고객에게 더 나은 비즈니스 성과와 경험을 제공하기 ...
    Date2023.06.13 Bynewsit Views454
    Read More
  4. 로지텍, 무선 게이밍 헤드셋 'PRO X 2 LIGHTSPEED' 출시

    - 혁신적인 그래핀(Graphene) 소재 PRO-G 고급 드라이버 탑재, 최적의 사운드 경험 - 전작 대비 가벼워진 무게와 프리미엄 소재 헤드밴드 · 이어패드로 편안한 착용감 선사 - 블루투스 및 3.5mm AUX 단자 지원, LIGHTSPEED 무선 기술 적용으로 지연 없이 안정...
    Date2023.06.13 Bynewsit Views406
    Read More
  5. 유블럭스, 검증된 F9 플랫폼 기반의 고정밀 GNSS 위치추적 모듈 2종 발표

    - NEO-F9P, 움직이는 산업용 기계의 정밀 내비게이션 및 자동화 구현 - ZED-F9P-15B, 모바일 로봇 분야 고객에게 L1/L2 대역 외에 L1/L5 옵션 제공 유블럭스는 유블럭스 F9 고정밀 GNSS 플랫폼을 기반으로 하는 신제품 모듈 2종을 발표했다. 저전력 NEO-F9P는 ...
    Date2023.06.13 Bynewsit Views485
    Read More
  6. 온세미, ‘나스닥 100’ 지수에 편입…“기술 업계의 핵심적인 혁신 기업으로 인정”

    온세미는 6월 20일 시장 개장 전 나스닥 100지수(Nasdaq-100 Index)에 추가될 예정이라고 발표했다. 이는 2년 연속의 기록적인 실적 달성과 함께 지난 30개월 간의 시가총액이 세 배 증가함에 따른 것이다. 온세미는 2022년 83억 달러(한화 약 10조원) 매출을 ...
    Date2023.06.13 Bynewsit Views421
    Read More
  7. 힐셔, ‘netX 90/netRAPID 90’ CC링크 IE 필드 베이직 인증 획득…“생산설비의 가시화 및 고효율화 실현”

    힐셔는 netX 90 통신 컨트롤러와 netRAPID 90 임베디드 모듈 제품이 CC링크 IE 필드 베이직 슬레이브 프로토콜에 대해 CC링크 협회(CLPA)의 공식 인증을 획득했다고 밝혔다. netX 90 통신 컨트롤러는 자동화 산업 분야에서 통합 애플리케이션 프로세서를 갖춘 ...
    Date2023.06.13 Bynewsit Views520
    Read More
  8. 캐논코리아, 여름맞이 캐논 아카데미 온·오프라인 클래스 오픈

    - 실시간 라이브 클래스 ‘R Live’ 세미나, 온라인에서 오프라인으로 확대 운영 - 캐논 제품으로 찍고 뽑는 오프라인 클래스 다변화, ‘코스형 아카데미 오프라인 클래스’ 신설 캐논코리아가 본격적인 여름을 맞아 캐논 아카데미에서 이론 강의부터 실습까지 다...
    Date2023.06.13 Bynewsit Views265
    Read More
  9. EDB, 교보문고에 ‘포스트그레스 어드밴스드 서버‘ 공급…“오픈소스 DBMS 기반 MSA 구축”  

    - 상용 DB 기반 온라인 통합몰 서비스를 오픈소스 기반 EDB Postgres로 손쉽게 전환 - EDB 코리아와 파트너의 전략 및 최적화 수행으로 성공적 프로젝트 완료 - 서비스 별 DB 분리 및 읽기전용 DB를 통한 분산 처리로 대규모 트래픽 안정성 강화 - EPAS 전환 ...
    Date2023.06.12 Bynewsit Views740
    Read More
  10. 로지텍, 'MX Keys' 무선 키보드 및 마우스 3종 출시

    - 새로운 스마트 액션 소프트웨어로 반복 작업 감소, 효율성 및 몰입도 극대화 - 신규 페일그레이 컬러 ‘MX Keys S’와 8000 DPI 트래킹, 무소음 클릭의 'MX Anywhere 3S' - 최고급 무선 키보드 · 마우스 ‘MX Keys S’, ‘MX Master 3S’와 ‘MX 팜레스트’ 조합 ‘MX...
    Date2023.06.12 Bynewsit Views355
    Read More
  11. 캐논코리아, 전국 순회 장수 사진 촬영 봉사 활동 전개

    - 캐논코리아, 2010년부터 어르신 대상으로 장수사진 촬영 봉사 활동 전개 - 캐논 아카데미 강사로 활동하는 윤우석 작가와 총 20회에 걸쳐 최대 800장의 장수사진 촬영 예정 캐논코리아는 60세 이상 어르신 대상 전국 순회 장수사진 촬영 봉사활동을 진행한다...
    Date2023.06.12 Bynewsit Views390
    Read More
  12. S2W, 글로벌 보안 기업 ‘텐서 시큐리티(Tensor Security Asia Pacific)’와 협력…“다크웹 보안 솔루션으로 해외시장 공략”

    - 다크웹 AI 언어모델 ‘다크버트(DarkBERT)’가 적용된 사이버 위협 인텔리전스(CTI) 솔루션 ‘자비스 (XARVIS)’의 첫 수출성과 - 다국적 보안 솔루션 전문 공급기업 텐서 시큐리티(Tensor Security)와 손잡고 인도네시아 정부기관과 계약 사이버 인텔리전스 전...
    Date2023.06.09 Bynewsit Views345
    Read More
  13. 레노버 2023년 가트너 공급망 선도 25대 기업 선정

    세계 1위 PC 및 스마트 디바이스 업체 레노버가 2023년 ‘가트너 공급망 선도 상위 25개 기업(Gartner Supply Chain Top 25)’에서 8위를 차지했다. 글로벌 시장조사 업체 가트너는 매년 상위 25개 공급망 선도 기업을 발표하며 지역 및 산업별 글로벌 규모 공급...
    Date2023.06.09 Bynewsit Views627
    Read More
  14. ST, 8채널 하이 사이드 스위치 「IPS8160HQ/IPS8160HQ-1」 출시…“공간 절감형 풋프린트에 보호 및 진단 기능 내장”

    ST마이크로일렉트로닉스는 소형 QFN48L 패키지에 보호 및 진단 기능을 내장한 8 채널 하이 사이드 스위치 IPS8160HQ 및 IPS8160HQ-1을 출시하고, 독보적 기능 조합으로 자동판매기의 과부하와 단방향 모터를 구동하는 데 사용되는 PLC 모듈의 공간을 절감하고 ...
    Date2023.06.08 Bynewsit Views409
    Read More
  15. 엔비디아, '라쳇 & 클랭크: 리프트 어파트' DLSS 3 지원 발표

    - 디아블로 IV, DLSS 3와 함께 출시 - DLSS 모멘텀 계속 이어져 현재 300개 돌파 엔비디아가 7월 26일 출시를 앞둔 소니(Sony)의 라쳇 & 클랭크: 리프트 어파트(Ratchet & Clank: Rift Apart)에 DLSS 3와 레이 트레이싱, 리플렉스(Reflex), DLAA 등 엔비디아(N...
    Date2023.06.08 Bynewsit Views435
    Read More
  16. 와콤, '2023 서울국제도서전(SIBF)’ 참가

    - 오는 14일부터 18일까지 5일간 개최되는 서울국제도서전 참가 - ‘일러스트레이터스 룸’ 에서 행사 참여 작가, 브랜드, 일반 관람객 대상 체험 프로그램 진행 - 프로급 액정타블렛 ‘신티크 프로 27’ 등 와콤 타블렛 체험 및 다양한 즐길거리 제공 - 타블렛 체...
    Date2023.06.08 Bynewsit Views376
    Read More
  17. 비이와알이, 아태지역 에너지 보고서 발표…“에너지 전환 가속화를 위한 청정 에너지 연합 촉구

    바이와알이(BayWa r.e.)는 <위기에 처한 아시아의 기후 목표, 보다 큰 틀의 시급한 합의 필요(Asia’s Climate Goals at Risk, - the Urgent Need for Greater Accord)>라는 제목의 아태지역(APAC) 에너지 보고서를 발표했다. 이 보고서는 아태지역의 신재생에...
    Date2023.06.08 Bynewsit Views707
    Read More
  18. 스틸시리즈, 디아블로 4 런칭 기념 한정판 국내 본격 출시  

    - 6월 1일(목)~ 6월 7일(수) 폭발적인 관심과 호응 속에 사전 예약 판매 종료 - 한정판 구매 고객 대상 독점 인게임 아이템 코드 증정 스틸시리즈와 퍼포먼스 게이밍 기어 개발사 컨트롤프릭(Kontrol Freek), 액션 RPG 장르를 정의한 디아블로 시리즈 제작사 ...
    Date2023.06.08 Bynewsit Views318
    Read More
  19. MSI, tvN 월화드라마 '이로운 사기' 노트북 협찬

    엠에스아이코리아는 tvN 새 월화드라마 '이로운 사기'에 MSI '크리에이터 Z16', '모던 14' 등 노트북을 협찬했다고 밝혔다. '이로운 사기'는 지능지수(IQ) 180의 암기 천재 사기꾼 이로움(천우희)과 지나친 공감 능력 때문에 고통받는 과공감 증후군 변호사 한...
    Date2023.06.08 Bynewsit Views345
    Read More
  20. 캐논코리아, ‘파워샷(PowerShot) V10’ 와디즈 크라우드 펀딩 당일 목표 금액 달성

    - 1인 촬영에 최적화된 카메라 신제품 ‘파워샷 V10,’ 와디즈 크라우드 펀딩 개시 5분만에 목표금액 달성 - 파워샷 V10, 4K UHD 30/24p, FHD 60/30/24p의 고화질 영상 촬영을 지원하는 브이로그용 카메라 - 슈퍼 얼리버드, 얼리버드 펀딩 참여 시 ▲64G 메모리 ...
    Date2023.06.08 Bynewsit Views375
    Read More
Board Pagination Prev 1 ... 214 215 216 217 218 219 220 221 222 223 ... 288 Next
/ 288
CLOSE