- 엔비디아 H100 L4 GPU, 생성형 AI 및 기타 모든 워크로드 새로운 수준으로 향상

- 젯슨 AGX 오린 성능 및 효율성 향상

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (2).jpg

엔비디아 최신 MLPerf 결과에서 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다고 밝혔다. MLPerf는 독립적인 타사 벤치마크로서 AI 성능에 대한 최종적인 측정치로 남아 있다. 엔비디아의 AI 플랫폼은 MLPerf 추론 3.0 벤치마크를 포함해 MLPerf가 시작된 이래 훈련과 추론 모두에서 지속적으로 리더십을 보여 왔다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 "3년 전 A100을 출시했을 때 AI 세계는 컴퓨터 비전이 지배를 했다. 하지만 이제는 생성형 AI가 등장했다. 이것이 바로 우리가 트랜스포머 엔진(Transformer Engine)을 통해 GPT에 특별히 최적화된 호퍼(Hopper)를 개발한 이유이다. MLPerf 3.0은 A100보다 4배 더 높은 성능을 제공하는 호퍼를 강조한다"고 밝히고, "다음 단계 생성형 AI는 뛰어난 에너지 효율로 대규모 언어 모델을 훈련할 수 있는 새로운 AI 인프라를 필요로 한다. 고객은 수만 개의 호퍼 GPU를 엔비디아 NV링크(NVLink)와 인피니밴드(InfiniBand)로 연결해 AI 인프라를 구축하면서 대규모로 호퍼를 확장하고 있다. 업계는 안전하고 신뢰할 수 있는 생성형 AI의 새로운 발전을 위해 열심히 노력하고 있다. 호퍼는 이러한 필수적인 작업을 가능하게 한다"고 덧붙였다.

 

최신 MLPerf 결과에 따르면 엔비디아는 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다. 특히, DGX H100 시스템에서 실행되는 엔비디아 H100 텐서 코어(Tensor Core) GPU는 생산에서 신경망을 실행하는 작업인 AI 추론의 모든 테스트에서 최고 성능을 제공했다. 소프트웨어 최적화 덕분에 GPU는 9월에 출시된 제품 대비 최대 54%의 성능 향상을 달성했다. 의료 분야에서 H100 GPU는 의료 영상용 MLPerf 벤치마크인 3D-UNet에서 9월 이후 31%의 성능 향상을 달성했다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (3).jpg

트랜스포머 엔진으로 구동되는 호퍼 아키텍처 기반 H100 GPU는 트랜스포머 기반 대규모 언어 모델인 BERT에서 탁월한 성능을 발휘해 생성형 AI의 광범위한 사용의 토대를 마련했다.

 

생성형 AI를 통해 사용자는 텍스트, 이미지, 3D 모델 등을 빠르게 만들 수 있다. 이는 스타트업부터 클라우드 서비스 제공업체에 이르기까지 다양한 기업이 새로운 비즈니스 모델을 구현하고 기존 비즈니스 모델을 가속화하기 위해 빠르게 도입하고 있는 기능이다. 현재 수억 명의 사람들이 즉각적인 응답을 기대하며 트랜스포머 모델인 챗GPT와 같은 생성형 AI 도구를 사용하고 있다. 이러한 AI의 시대에는 추론 성능이 매우 중요하다. 딥러닝은 이제 거의 모든 곳에 배포되고 있으며 공장 현장부터 온라인 추천 시스템에 이르기까지 추론 성능에 대한 요구가 끊임없이 증가하고 있다.

 

L4 GPU의 빠른 속도

엔비디아 L4 텐서 코어 GPU는 이전 세대 T4 GPU보다 3배 이상 빠른 속도로 MLPerf 테스트에 데뷔했다. 프로파일이 낮은 폼 팩터(low-profile form factor)로 패키징된 가속기는 거의 모든 서버에서 높은 처리량과 짧은 지연 시간을 제공하도록 설계됐다.

 

L4 GPU는 모든 MLPerf 워크로드를 실행했다. 주요 FP8 형식을 지원하므로 성능에 민감한 BERT 모델에서 특히 뛰어난 결과를 보였다.

 

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (4).jpg

L4 GPU는 탁월한 AI 성능 외에도 최대 10배 빠른 이미지 디코드, 최대 3.2배 빠른 영상 처리, 4배 이상 빠른 그래픽 및 실시간 렌더링 성능을 제공한다.

 

GTC 2023에서 발표된 이 가속기는 이미 주요 시스템 제조업체와 클라우드 서비스 제공업체에서 사용할 수 있다. L4 GPU는 GTC 2023에서 발표된 엔비디아의 AI 추론 플랫폼 포트폴리오에 가장 최근에 추가된 제품이다.

 

시스템 테스트에서 빛나는 소프트웨어, 네트워크

엔비디아의 풀스택 AI 플랫폼이 새로운 MLPerf 테스트에서 리더십을 입증했다. 이른바 네트워크 분할 벤치마크는 데이터를 원격 추론 서버로 스트리밍한다. 이 테스트는 기업 방화벽 뒤에 데이터를 저장한 채 클라우드에서 AI 작업을 실행하는 기업 사용자의 일반적인 시나리오를 반영한다.

 

BERT에서 원격 엔비디아 DGX A100 시스템은 최대 로컬 성능의 96%까지 제공했으며, 일부 작업의 경우 CPU가 완료될 때까지 기다려야 하기 때문에 부분적으로 속도가 느려졌다. GPU로만 처리되는 컴퓨터 비전을 위한 ResNet-50 테스트에서는 100%를 기록했다.

 

두 결과 모두 엔비디아 퀀텀 인피니밴드(Quantum Infiniband) 네트워킹, 엔비디아 커넥트X(ConnectX) 스마트NIC(SmartNIC)엔비디아 GPU다이렉트(GPUDirect)와 같은 소프트웨어 덕분이다.

 

엣지에서 3.2배의 성능 향상을 보여준 오린

이와는 별도로 엔비디아 젯슨 AGX 오린(Orin) 시스템 온 모듈은 1년 전 결과에 비해 에너지 효율성은 최대 63%, 성능은 81% 향상됐다. 젯슨 AGX 오린은 배터리로 구동되는 시스템을 포함해 저전력 수준의 제한된 공간에서 AI가 필요할 때 추론을 제공한다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (1).jpg

더 적은 전력을 소비하는 더 작은 모듈을 필요로 하는 애플리케이션의 경우, 벤치마크에서 첫 선을 보인 젯슨 오린 NX 16G가 빛을 발했다. 이전 세대 젯슨 자비에(Jetson Xavier) NX 프로세서보다 최대 3.2배의 성능을 제공했다.

 

광범위한 엔비디아 AI 생태계

MLPerf 결과는 엔비디아 AI가 업계에서 가장 광범위한 머신 러닝 생태계의 지원을 받고 있음을 보여준다. 이번 라운드에는 10개 기업이 엔비디아 플랫폼에 대한 결과를 제출했다. 여기에는 마이크로소프트 애저(Microsoft Azure) 클라우드 서비스 및 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), H3C, 레노버(Lenovo), 네트릭스(Nettrix), 슈퍼마이크로(Supermicro) 및 엑스퓨젼(xFusion)을 비롯한 시스템 제조업체가 포함됐다.

 

이들의 연구는 사용자가 클라우드와 자체 데이터센터에서 실행되는 서버 모두에서 엔비디아 AI를 통해 뛰어난 성능을 얻을 수 있음을 보여준다. 엔비디아 파트너는 MLPerf가 AI 플랫폼 및 공급업체를 평가하는 고객에게 유용한 도구라는 것을 알고 있기 때문에 MLPerf에 참여한다. 최신 라운드의 결과는 그들이 현재 제공하는 성능이 엔비디아 플랫폼과 함께 성장할 것임을 입증한다.

 

사용자에게 필요한 다목적 성능

엔비디아 AI는 데이터센터 및 엣지 컴퓨팅에서 모든 MLPerf 추론 워크로드 및 시나리오를 실행할 수 있는 유일한 플랫폼이다. 다재다능한 성능과 효율성은 사용자를 진정한 승자로 만든다.실제 애플리케이션은 일반적으로 실시간으로 답을 제공해야 하는 다양한 종류의 신경망을 많이 사용한다.

 

예를 들어, AI 애플리케이션은 사용자의 음성 요청을 이해하고, 이미지를 분류하고, 추천한 후 사람 목소리가 담긴 음성 메시지로 응답을 전달해야 할 수 있다. 따라서 각 단계마다 다른 유형의 AI 모델이 필요하다.

 

MLPerf 벤치마크는 이러한 워크로드 및 기타 인기있는 AI 워크로드를 다룬다. 따라서 IT 의사 결정권자는 이 테스트를 통해 신뢰할 수 있고 유연하게 배포할 수 있는 성능을 얻을 수 있다.

 

테스트는 투명하고 객관적이기 때문에 사용자는 정보에 입각한 구매 결정을 내릴 때 MLPerf 결과를 신뢰할 수 있다. 이 벤치마크는 암(Arm), 바이두(Baidu), 페이스북 AI(Facebook AI), 구글, 하버드(Harvard), 인텔(Intel), 마이크로소프트(Microsoft), 스탠포드(Stanford) 및 토론토 대학교(University of Toronto)를 포함한 광범위한 그룹의 지원을 받고 있다.

 

사용 가능한 소프트웨어

엔비디아 AI 플랫폼의 소프트웨어 계층인 엔비디아AI 엔터프라이즈(Enterprise)는 사용자가 인프라 투자에서 최적화된 성능을 얻을 수 있도록 보장할 뿐만 아니라 기업 데이터센터에서 AI를 실행하는 데 필요한 엔터프라이즈급 지원, 보안 및 안정성을 제공한다.

 

이 테스트에 사용된 모든 소프트웨어는 MLPerf 리포지토리에서 사용할 수 있으므로 누구나 이러한 세계적 수준의 결과를 얻을 수 있다.

 

최적화는 엔비디아의 GPU 가속 소프트웨어용 카탈로그인 NGC에서 사용할 수 있는 컨테이너에 지속적으로 접혀 있다. 이 카탈로그에는 이번 라운드의 모든 출품작에서 AI 추론을 최적화하는 데 사용되는 엔비디아 텐서RT가 호스팅된다.

 

 

#엔비디아#AI#MLPerf#호퍼#젯슨#오린

?

  1. 온세미, 차세대 1200V 엘리트 실리콘 카바이드 ‘M3S’ 디바이스 출시...“전기차 및 에너지 인프라 애플리케이션 효율성 향상”

    - 새로운 포트폴리오, 업계 표준 패키지에서 스위치당 업계 최저 Rds(on)을 제공하는 고속 스위칭 MOSFET 및 하프 브리지 전력 통합 모듈이 포함 온세미(ON)는 최신 1200V 엘리트 실리콘 카바이드(EliteSiC) 실리콘 카바이드(SiC) M3S 디바이스 출시를 발표했...
    Date2023.05.10 Bynewsit Views459
    Read More
  2. 슈나이더 일렉트릭, ‘2023 대한민국 기계설비전시회’ 참가

    - 데이터센터에 적합한 쿨링 및 3상 UPS 제품 선보일 예정 - 2023년 데이터센터 컨퍼런스에서 다양한 인사이트 제공 일렉트릭 코리아가 파트너사 2곳(우진기전, 이피코리아)과 10일부터 12일까지 3일간 서울 코엑스에서 열리는 ‘2023 대한민국 기계설비전시회(...
    Date2023.05.10 Bynewsit Views792
    Read More
  3. 마우저, ‘마우저 파워 세미나 2023’ 개최…“우수한 효율과 신뢰성 및 낮은 EMI 전력 솔루션 소개”

    마우저 일렉트로닉스는 오는 5월 17(수) ~ 18(목) 이틀 동안 ‘저탄소 시대의 요구를 충족하는 고효율, 높은 신뢰성, 낮은 EMI 전력 솔루션을 위한 마우저 파워 세미나 2023’을 온라인 상에서 무료로 개최한다고 밝혔다. 전 세계적으로 재생 에너지 사용 확대와...
    Date2023.05.10 Bynewsit Views565
    Read More
  4. 인피니언, 업계 최초로 ‘LPDDR’ 플래시 메모리 공개… 차세대 오토모티브 E/E 아키텍처 구현 지원

    인피니언은 업계 최초로 LPDDR 플래시 메모리를 공개하조 차세대 오토모티브 E/E(전기/전자) 아키텍처 구현을 지원한다고 밝혔다. 인피니언 SEMPER X1 LPDDR 플래시 메모리는 오토모티브 도메인과 존(zone) 컨트롤러에 핵심인 안전성, 신뢰성, 실시간 코드 실...
    Date2023.05.10 Bynewsit Views380
    Read More
  5. 마드라스체크, 글로벌 협업툴 '모닝메이트' 출시

    대한민국 대표 협업툴 '플로우(flow)'를 서비스하는 마드라스체크가 자사 협업툴의 글로벌 버전 '모닝메이트(MorningMate)'를 출시했다고 10일 밝혔다. 마드라스체크의 ‘모닝메이트’ 출시 배경은 협업툴 플로우에 대한 글로벌 수요가 증가함에 따라 해외 업무 ...
    Date2023.05.10 Bynewsit Views642
    Read More
  6. 캐논코리아, 흑백 레이저 프린터 「LBP361dw」 출시

    - 무선 네트워크 및 모바일 앱 지원으로 다양한 비즈니스 환경에서 작업 가능 - 다양한 카트리지 및 카세트 옵션 지원해 용도에 따른 최적의 출력 환경 구축 캐논코리아가 신제품 흑백 레이저 프린터 ‘LBP361dw’를 출시했다고 밝혔다. ‘LBP361dw’는 분당 61매...
    Date2023.05.09 Bynewsit Views289
    Read More
  7. 가민, 러기드 GPS 스마트워치 「인스팅트 2X 솔라」 출시  

    - 인스팅트 2X 솔라, 50mm의 섬유 보강 케이스와 스크래치에 강한 파워 글래스 렌즈 장착 - 미 육군 표준(MIL-STD-810)의 엄격한 내구도 테스트를 통과해 극한의 환경에서 사용 가능 - 태양광 충전을 통해 스마트워치 모드에서 무제한으로 사용 가능한 배터리 ...
    Date2023.05.09 Bynewsit Views382
    Read More
  8. 포티넷, 사이버레이팅 ‘차세대 방화벽 평가’ 시험에서 99.88% 보안 유효성 점수 획득

    - 포티게이트 600F 시리즈, 사이버레이팅(CyberRatings.org) NGFW 테스트의 4개 평가 항목 - 모두에서 만점에 가까운 'AAA' 등급을 획득해 동종 업계 중 Mbps당 최고의 높은 성능 입증 포티넷 코리아 오늘, 자사의 포티게이트 600F(FortiGate 600F) 차세대 방...
    Date2023.05.09 Bynewsit Views362
    Read More
  9. SAS코리아-씨엔알리서치, 임상전문 SAS 프로그래머 양성 업무 협약 체결

    - ‘SAS를 사용한 CDISC 활용’ 교육 과정 국내 최초 개설 - 국제임상데이터표준 준수 지원 및 전문 인력 양성 목표 SAS코리아와 국내 최대 임상시험 수탁기관(CRO) 씨엔알리서치가 임상 전문 SAS 프로그래머 양성을 위한 공동 교육 사업에 협력하기로 했다. 이...
    Date2023.05.08 Bynewsit Views638
    Read More
  10. 디디케어스 페보, Chat GPT 활용한 최초의 반려견 맞춤형 정보 제공 서비스 ‘페보 댕박사’ 도입  

    - 국내 최초로 페보 워치 디바이스를 통해 수집한 데이터를 기반해 응답하는 반려견 전용 ‘펫GPT’ 서비스 개발 - GPT 프롬프트에 최적화, 본인이 키우는 반려견에 대한 질의에 맞춰 응답 가능 24시간 반려견 케어 솔루션 브랜드 디디케어스는 ChatGPT를 활용해...
    Date2023.05.08 Bynewsit Views664
    Read More
  11. EDB, 오픈소스 DBMS ‘포스트그레SQL(PostgreSQL)’ 코드 개선 기여자 분석 결과 발표

    - 기술자 및 개발자들이 전 세계적으로 포스트그레스(Postgres) 커뮤니티에서 코드 기여자로서 가장 많이 활동 - 포스트그레스(PostgreSQL) 코드 개발과 개선에 기여하지 않는 기업은 버그를 수정하거나 새로운 기능 개발 못해 - EDB, 연중무휴(24x7) 글로벌 ...
    Date2023.05.08 Bynewsit Views751
    Read More
  12. 팔로알토 네트웍스, “챗GPT 관련 스캠 사기 확산 …각별한 주의 필요”

    팔로알토 네트웍스의 위협 연구 기관 유닛42(Unit42)는 챗GPT 관련 스캠 사기가 급증하는 추세라고 밝히며 각별한 주의가 필요하다고 밝혔다. 유닛42 조사에 따르면 지난해 11월부터 올해 4월까지 등록된 ChatGPT 관련 도메인이 910% 증가했으며, 팔로알토 네...
    Date2023.05.04 Bynewsit Views413
    Read More
  13. 안랩, 인도 사이버 보안 솔루션 유통 전문 기업 ‘RAS 인포텍’과 파트너십 계약 체결

    - 인도 사이버 보안 솔루션 유통 전문 기업 ‘RAS 인포텍’과 파트너십 계약 체결로 인도 시장 첫 진출, 현지 영업망 기반으로 인도 전 지역에 안랩 보안 솔루션 공급 기대 - ▲PC용 백신 솔루션 ‘V3’ 제품군 ▲엔드포인트 보안 플랫폼 ‘안랩 EPP’ ▲차세대 위협 탐...
    Date2023.05.04 Bynewsit Views335
    Read More
  14. 뉴렐릭, 세계 최초 생성형 AI 옵저버빌리티 어시스턴트 ‘그록’ 공개

    - 자연어 프롬프트로 소프트웨어 스택 전반의 모니터링, 디버그 및 보안 성능 향상 - 옵저버빌리티 도입을 위한 데이터 및 장벽 점검 작업을 손쉽게 처리 올인원 옵저버빌리티 플랫폼 기업 뉴렐릭이 세계 최초의 옵저버빌리티용 생성형 인공지능(AI) 어시스턴...
    Date2023.05.04 Bynewsit Views548
    Read More
  15. 퓨어스토리지 포트웍스, 몽고DB와 파트너십 체결… 모든 데이터 서비스에 일관된 개발자 경험 제공

    - 포트웍스 데이터 서비스, 몽고DB를 사용하여 구축한 애플리케이션의 출시 기간 단축 퓨어스토리지가 몽고DB(MongoDB)와 새로운 파트너십을 발표하고, 업계 최초의 서비스형 데이터베이스 플랫폼(DBPaaS)인 포트웍스 데이터 서비스와 몽고DB를 통합하여 개발...
    Date2023.05.04 Bynewsit Views486
    Read More
  16. 솔리다임, ‘솔리다임 시너지 2.0 소프트웨어’ 공개…“스토리지 성능 최적화“  

    - PC 사용자 환경을 새로운 수준으로 끌어 올리는 무료 소프트웨어 솔리다임(Solidigm)이 솔리다임 시너지 2.0(Solidigm Synergy 2.0) 소프트웨어를 출시했다고 4일 밝혔다. 솔리다임 시너지 소프트웨어 제품군은 전체적인 시스템의 성능을 향상시키고, 하드웨...
    Date2023.05.04 Bynewsit Views339
    Read More
  17. S2W, 세계 최고 자연어처리 학회 2년 연속 논문 등재

    - 2022년 NAACL과 2023년 ACL 자연어 처리 분야 학술 대회에서 지속적으로 원천 기술력 인정 - 사이버 보안 영역에서 다크웹 전문 언어 모델인 다크버트 (DarkBERT) 제작해 주제 발표 - 다크웹 수집, 정제, 분석 기술력 및 엔진 + 범용 언어모델 BERT의 결함 =...
    Date2023.05.04 Bynewsit Views474
    Read More
  18. 가민코리아, ‘웰니스 워치’ 브랜드위크 프로모션

    - 스마트 기기 브랜드 가민, 오는 4일부터 15일까지 ‘웰니스 워치’ 프로모션 진행 - ‘베뉴 Sq 2’, ‘베뉴 2플러스’, ’릴리’ 등 데일리 스마트워치 최대 60%할인 가민이 가정의 달을 맞아 5월 4일부터 5월 15일까지 12일간 ‘웰니스 워치’ 브랜드위크 프로모션을 ...
    Date2023.05.04 Bynewsit Views364
    Read More
  19. 안체인에이아이, ‘RSA 컨퍼런스 2023’ 최고 스타트업에 선정

    - ‘RSA 컨퍼런스 2023 이노베이션 샌드박스 콘테스트’의 최종 후보로 선정 - 웹3 SOC, 웹3 디지털 자산을 보호하는 보안 운영 센터를 제공한 공로 인정 인섹시큐리티는 오늘, 글로벌 블록체인 분석 기업인 ‘안체인에이아이(AnChain.AI)가 ‘RSA 컨퍼런스 2023 ...
    Date2023.05.03 Bynewsit Views396
    Read More
  20. 와탭랩스 ‘AWS 서밋 서울 2023’ 참가…“신규 서비스 공개 및 강연”

    - 신규 서비스 브라우저 모니터링 소개 및 시현 예정 - ‘SaaS와 모니터링 플랫폼’ 주제로 강연 예정… 모니터링의 새로운 인사이트 제공 와탭랩스는 5월 3일과 4일, 양일간 코엑스 컨벤션센터에서 열리는 ‘AWS 서밋 서울 2023(AWS Summit Seoul 2023)’에 참가할...
    Date2023.05.03 Bynewsit Views655
    Read More
Board Pagination Prev 1 ... 217 218 219 220 221 222 223 224 225 226 ... 285 Next
/ 285
CLOSE