- 엔비디아 H100 L4 GPU, 생성형 AI 및 기타 모든 워크로드 새로운 수준으로 향상

- 젯슨 AGX 오린 성능 및 효율성 향상

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (2).jpg

엔비디아 최신 MLPerf 결과에서 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다고 밝혔다. MLPerf는 독립적인 타사 벤치마크로서 AI 성능에 대한 최종적인 측정치로 남아 있다. 엔비디아의 AI 플랫폼은 MLPerf 추론 3.0 벤치마크를 포함해 MLPerf가 시작된 이래 훈련과 추론 모두에서 지속적으로 리더십을 보여 왔다.

 

엔비디아 CEO 젠슨 황(Jensen Huang)은 "3년 전 A100을 출시했을 때 AI 세계는 컴퓨터 비전이 지배를 했다. 하지만 이제는 생성형 AI가 등장했다. 이것이 바로 우리가 트랜스포머 엔진(Transformer Engine)을 통해 GPT에 특별히 최적화된 호퍼(Hopper)를 개발한 이유이다. MLPerf 3.0은 A100보다 4배 더 높은 성능을 제공하는 호퍼를 강조한다"고 밝히고, "다음 단계 생성형 AI는 뛰어난 에너지 효율로 대규모 언어 모델을 훈련할 수 있는 새로운 AI 인프라를 필요로 한다. 고객은 수만 개의 호퍼 GPU를 엔비디아 NV링크(NVLink)와 인피니밴드(InfiniBand)로 연결해 AI 인프라를 구축하면서 대규모로 호퍼를 확장하고 있다. 업계는 안전하고 신뢰할 수 있는 생성형 AI의 새로운 발전을 위해 열심히 노력하고 있다. 호퍼는 이러한 필수적인 작업을 가능하게 한다"고 덧붙였다.

 

최신 MLPerf 결과에 따르면 엔비디아는 클라우드에서 엣지까지 AI 추론의 성능과 효율성을 새로운 차원으로 끌어올렸다. 특히, DGX H100 시스템에서 실행되는 엔비디아 H100 텐서 코어(Tensor Core) GPU는 생산에서 신경망을 실행하는 작업인 AI 추론의 모든 테스트에서 최고 성능을 제공했다. 소프트웨어 최적화 덕분에 GPU는 9월에 출시된 제품 대비 최대 54%의 성능 향상을 달성했다. 의료 분야에서 H100 GPU는 의료 영상용 MLPerf 벤치마크인 3D-UNet에서 9월 이후 31%의 성능 향상을 달성했다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (3).jpg

트랜스포머 엔진으로 구동되는 호퍼 아키텍처 기반 H100 GPU는 트랜스포머 기반 대규모 언어 모델인 BERT에서 탁월한 성능을 발휘해 생성형 AI의 광범위한 사용의 토대를 마련했다.

 

생성형 AI를 통해 사용자는 텍스트, 이미지, 3D 모델 등을 빠르게 만들 수 있다. 이는 스타트업부터 클라우드 서비스 제공업체에 이르기까지 다양한 기업이 새로운 비즈니스 모델을 구현하고 기존 비즈니스 모델을 가속화하기 위해 빠르게 도입하고 있는 기능이다. 현재 수억 명의 사람들이 즉각적인 응답을 기대하며 트랜스포머 모델인 챗GPT와 같은 생성형 AI 도구를 사용하고 있다. 이러한 AI의 시대에는 추론 성능이 매우 중요하다. 딥러닝은 이제 거의 모든 곳에 배포되고 있으며 공장 현장부터 온라인 추천 시스템에 이르기까지 추론 성능에 대한 요구가 끊임없이 증가하고 있다.

 

L4 GPU의 빠른 속도

엔비디아 L4 텐서 코어 GPU는 이전 세대 T4 GPU보다 3배 이상 빠른 속도로 MLPerf 테스트에 데뷔했다. 프로파일이 낮은 폼 팩터(low-profile form factor)로 패키징된 가속기는 거의 모든 서버에서 높은 처리량과 짧은 지연 시간을 제공하도록 설계됐다.

 

L4 GPU는 모든 MLPerf 워크로드를 실행했다. 주요 FP8 형식을 지원하므로 성능에 민감한 BERT 모델에서 특히 뛰어난 결과를 보였다.

 

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (4).jpg

L4 GPU는 탁월한 AI 성능 외에도 최대 10배 빠른 이미지 디코드, 최대 3.2배 빠른 영상 처리, 4배 이상 빠른 그래픽 및 실시간 렌더링 성능을 제공한다.

 

GTC 2023에서 발표된 이 가속기는 이미 주요 시스템 제조업체와 클라우드 서비스 제공업체에서 사용할 수 있다. L4 GPU는 GTC 2023에서 발표된 엔비디아의 AI 추론 플랫폼 포트폴리오에 가장 최근에 추가된 제품이다.

 

시스템 테스트에서 빛나는 소프트웨어, 네트워크

엔비디아의 풀스택 AI 플랫폼이 새로운 MLPerf 테스트에서 리더십을 입증했다. 이른바 네트워크 분할 벤치마크는 데이터를 원격 추론 서버로 스트리밍한다. 이 테스트는 기업 방화벽 뒤에 데이터를 저장한 채 클라우드에서 AI 작업을 실행하는 기업 사용자의 일반적인 시나리오를 반영한다.

 

BERT에서 원격 엔비디아 DGX A100 시스템은 최대 로컬 성능의 96%까지 제공했으며, 일부 작업의 경우 CPU가 완료될 때까지 기다려야 하기 때문에 부분적으로 속도가 느려졌다. GPU로만 처리되는 컴퓨터 비전을 위한 ResNet-50 테스트에서는 100%를 기록했다.

 

두 결과 모두 엔비디아 퀀텀 인피니밴드(Quantum Infiniband) 네트워킹, 엔비디아 커넥트X(ConnectX) 스마트NIC(SmartNIC)엔비디아 GPU다이렉트(GPUDirect)와 같은 소프트웨어 덕분이다.

 

엣지에서 3.2배의 성능 향상을 보여준 오린

이와는 별도로 엔비디아 젯슨 AGX 오린(Orin) 시스템 온 모듈은 1년 전 결과에 비해 에너지 효율성은 최대 63%, 성능은 81% 향상됐다. 젯슨 AGX 오린은 배터리로 구동되는 시스템을 포함해 저전력 수준의 제한된 공간에서 AI가 필요할 때 추론을 제공한다.

엔비디아, MLPerf 테스트에서 새로운 차원의 추론 실현 (1).jpg

더 적은 전력을 소비하는 더 작은 모듈을 필요로 하는 애플리케이션의 경우, 벤치마크에서 첫 선을 보인 젯슨 오린 NX 16G가 빛을 발했다. 이전 세대 젯슨 자비에(Jetson Xavier) NX 프로세서보다 최대 3.2배의 성능을 제공했다.

 

광범위한 엔비디아 AI 생태계

MLPerf 결과는 엔비디아 AI가 업계에서 가장 광범위한 머신 러닝 생태계의 지원을 받고 있음을 보여준다. 이번 라운드에는 10개 기업이 엔비디아 플랫폼에 대한 결과를 제출했다. 여기에는 마이크로소프트 애저(Microsoft Azure) 클라우드 서비스 및 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), H3C, 레노버(Lenovo), 네트릭스(Nettrix), 슈퍼마이크로(Supermicro) 및 엑스퓨젼(xFusion)을 비롯한 시스템 제조업체가 포함됐다.

 

이들의 연구는 사용자가 클라우드와 자체 데이터센터에서 실행되는 서버 모두에서 엔비디아 AI를 통해 뛰어난 성능을 얻을 수 있음을 보여준다. 엔비디아 파트너는 MLPerf가 AI 플랫폼 및 공급업체를 평가하는 고객에게 유용한 도구라는 것을 알고 있기 때문에 MLPerf에 참여한다. 최신 라운드의 결과는 그들이 현재 제공하는 성능이 엔비디아 플랫폼과 함께 성장할 것임을 입증한다.

 

사용자에게 필요한 다목적 성능

엔비디아 AI는 데이터센터 및 엣지 컴퓨팅에서 모든 MLPerf 추론 워크로드 및 시나리오를 실행할 수 있는 유일한 플랫폼이다. 다재다능한 성능과 효율성은 사용자를 진정한 승자로 만든다.실제 애플리케이션은 일반적으로 실시간으로 답을 제공해야 하는 다양한 종류의 신경망을 많이 사용한다.

 

예를 들어, AI 애플리케이션은 사용자의 음성 요청을 이해하고, 이미지를 분류하고, 추천한 후 사람 목소리가 담긴 음성 메시지로 응답을 전달해야 할 수 있다. 따라서 각 단계마다 다른 유형의 AI 모델이 필요하다.

 

MLPerf 벤치마크는 이러한 워크로드 및 기타 인기있는 AI 워크로드를 다룬다. 따라서 IT 의사 결정권자는 이 테스트를 통해 신뢰할 수 있고 유연하게 배포할 수 있는 성능을 얻을 수 있다.

 

테스트는 투명하고 객관적이기 때문에 사용자는 정보에 입각한 구매 결정을 내릴 때 MLPerf 결과를 신뢰할 수 있다. 이 벤치마크는 암(Arm), 바이두(Baidu), 페이스북 AI(Facebook AI), 구글, 하버드(Harvard), 인텔(Intel), 마이크로소프트(Microsoft), 스탠포드(Stanford) 및 토론토 대학교(University of Toronto)를 포함한 광범위한 그룹의 지원을 받고 있다.

 

사용 가능한 소프트웨어

엔비디아 AI 플랫폼의 소프트웨어 계층인 엔비디아AI 엔터프라이즈(Enterprise)는 사용자가 인프라 투자에서 최적화된 성능을 얻을 수 있도록 보장할 뿐만 아니라 기업 데이터센터에서 AI를 실행하는 데 필요한 엔터프라이즈급 지원, 보안 및 안정성을 제공한다.

 

이 테스트에 사용된 모든 소프트웨어는 MLPerf 리포지토리에서 사용할 수 있으므로 누구나 이러한 세계적 수준의 결과를 얻을 수 있다.

 

최적화는 엔비디아의 GPU 가속 소프트웨어용 카탈로그인 NGC에서 사용할 수 있는 컨테이너에 지속적으로 접혀 있다. 이 카탈로그에는 이번 라운드의 모든 출품작에서 AI 추론을 최적화하는 데 사용되는 엔비디아 텐서RT가 호스팅된다.

 

 

#엔비디아#AI#MLPerf#호퍼#젯슨#오린

?

  1. 그린잇, 취향에 맞는 골프장 실시간 예약 플랫폼 ‘골라가’ 출시

    - 디지털 전환 시대에 발맞춰 실시간 골프장 예약 앱 ‘골라가’ 출시 - 정교한 고급 검색필터 기능으로 원하는 티타임을 빠르게 찾고 실시간 예약부터 셀프 체크인-아웃까지 골프 라운드 모든 여정에 스마트한 고객경험 제공 - 업력 20년 이상의 골프장 통합 운...
    Date2023.05.17 Bynewsit Views338
    Read More
  2. 캐논코리아, 컬러 디지털 상업 인쇄기 「imagePRESS V1350」 출시

    - 개선된 설계 구조와 고강도 프레임 채택으로 장기간 동안 안정적인 출력 지원 - 고속 출력과 품질 안정성을 실현하는 급지 및 정착 시스템 적용 캐논코리아 주식회사가 상업 인쇄 생산성을 극대화한 컬러 디지털 상업 인쇄기 'imagePRESS V1350'을 출시했다...
    Date2023.05.17 Bynewsit Views329
    Read More
  3. HP, 게이밍 노트북 신제품 ‘HP OMEN 16 Slim' 공개

    - 휴대성과 성능을 모두 잡은 초경량 게이밍 노트북, 장소 제약 없이 고품질 플레이 구현 - 최근 3분기 국내 게이밍 PC 점유율 1위 차지한 HP 코리아, 게임 업계 리딩 브랜드로 ‘우뚝’ HP는 16일 초경량 프리미엄 게이밍 노트북 ‘HP OMEN 16 Slim(HP OMEN 16 ...
    Date2023.05.16 Bynewsit Views389
    Read More
  4. CEVA, 비지소닉스 공간 오디오 사업부 인수…“임베디드 시스템용 애플리케이션 소프트웨어 포트폴리오 확장”

    - TWS, OTC 히어러블, 게이밍 헤드폰, AR/VR, 오디오 회의, 오토모티브 및 미디어 엔터테인먼트 포함 폭넓은 시장 대상의 OEM 업체에 완벽한 공간 오디오 솔루션 제공 CEVA는 비지소닉스(VisiSonics)로부터 리얼스페이스(RealSpace) 3D 공간 오디오(Spatial Au...
    Date2023.05.16 Bynewsit Views512
    Read More
  5. 캐논코리아, ‘EOS R8 트래블로거: 스위스 발레주 스케치’ 여행 출사단 모집 이벤트

    - 영상과 사진에 관심있는 여행 크리에이터라면 누구나 5월 23일(화)까지 캐논코리아 홈페이지에서 신청 가능 - 스위스 발레주 출사단 총 8명 선정해 7박 9일간 발레주의 풍광 담은 영상 및 사진 촬영 미션 수행 예정 - 출사단 대상 ▲여행 전 일정 지원 ▲EOS R...
    Date2023.05.16 Bynewsit Views342
    Read More
  6. 퓨리오사AI, 과기정통부 주관 AI반도체 사업자 선정 결과 과반 이상 차지

    - 업스테이지, 엘리스, 포바이포, 노타, 마키나락스 등 50곳 이상의 업체와 실증 - AI바우처 사업과 고성능컴퓨팅 지원 사업에서 퓨리오사AI가 과반 이상 차지 AI반도체를 개발하는 퓨리오사AI는 최근 발표된 과학기술정보통신부 주관의 AI반도체 프로젝트 사...
    Date2023.05.16 Bynewsit Views604
    Read More
  7. 마우저, 보안 애플리케이션용 인피니언 'OPTIGA Trust M' IoT 보안 개발 키트 제품 공급

    마우저 일렉트로닉스는 인피니언(Infineon Technologies)의 OPTIGA Trust M IoT 보안 개발 키트 제품을 공급한다고 밝혔다. OPTIGA Trust M IoT 보안 개발 키트는 스마트홈, 산업 자동화 및 엔터프라이즈 디바이스에 대한 종단 간 보안 사용 사례를 개발하고 ...
    Date2023.05.15 Bynewsit Views520
    Read More
  8. 소니코리아, 아이코닉스와 함께 ‘소니 X 잔망루피 몰입의 즐거움’ 캠페인 전개

    - 5월 15일부터 6월 25일까지 소니 공식 온 ·오프라인 스토어에서 WH-1000XM5 구매자 대상… 7월 4일까지 정품 등록 및 사은품 신청자에 한해 ‘소니 X 잔망루피 트래블 패키지’ 증정 - 해외여행 수요 증가에 발맞춰 소니 헤드폰, 여행용품 보관 용이한 한정판 ‘...
    Date2023.05.15 Bynewsit Views397
    Read More
  9. 퀀텀, 소프트웨어 정의 올플래시 스토리지 플랫폼 ‘미리어드(Myriad)’ NAB2023에서 3관왕 수상

    - ‘NAB Show 2023’에서 TV 테크 베스트 오브 쇼(TV Tech Best of Show), TV유럽 베스트 오브 쇼(TVBEurope Best of Show), 클라우드 컴퓨팅 및 스토리지 부문 올해의 NAB 제품(NAB Product of the Year in the Cloud Computing and Storage) 등의 3개 부문 수...
    Date2023.05.15 Bynewsit Views429
    Read More
  10. 로지텍, 롯데백화점 부산본점에 ‘로지텍 브랜드샵’ 오픈

    - 최대 규모 브랜드샵, 오프라인 브랜드샵 최초로 레이싱 휠 체험 가능한 게이밍 룸 갖춰 로지텍은 롯데백화점 부산본점에 ‘로지텍 브랜드샵’을 오픈했다고 15일 밝혔다. 이번에 오픈한 브랜드샵은 올해 1월부터 현대백화점 판교점에서 운영 중인 매장과 지난 ...
    Date2023.05.15 Bynewsit Views428
    Read More
  11. 캐논코리아, 제31회 국제 방송∙미디어·음향·조명 전시회(KOBA 2023) 참가

    - ‘캐논으로 보다, 캐논이 보여주다’라는 테마로 첨단 방송 송출 시스템 및 ‘오토 트래킹’ 기술 등 시연 - ▲스튜디오 존 ▲PTZ 카메라 존 ▲플렉스 줌 렌즈 체험 존 ▲EOS R5 C & 버티고 존 등 총 7개 부스 운영 - 캐논 마스터즈 ▲나영석 예능PD ▲윤권수 프로듀서...
    Date2023.05.15 Bynewsit Views313
    Read More
  12. 티맥스소프트, '2023 티맥스소프트 파트너 데이' 개최…"파트너 에코시스템 강화로 디지털 전환 사업 확대"

    - 100여 개 기업 주요 인사 및 관계자 약 150여 명 참석 - '23년 사업 방향성, 마케팅 계획, 파트너 지원 프로그램, 차세대 전략 제품·기술 등 발표 티맥스소프트가 파트너 에코시스템을 강화해 디지털 전환 사업을 확대해 나간다. 티맥스소프트는 지난 11일 ...
    Date2023.05.12 Bynewsit Views620
    Read More
  13. 캐논코리아, 작고 가벼운 브이로그용 카메라 ‘파워샷(PowerShot) V10’ 발표  

    - 직관적인 UI로 보다 쾌적한 사진·영상 촬영을 지원하는 최적의 브이로그용 카메라 캐논코리아 주식회사는 간편한 휴대성과 고화질·고음질 성능을 갖춰 브이로그 입문용으로 최적화된 신제품 카메라 ‘파워샷(PowerShot) V10’을 5월 11일 공개했다. 이번에 출...
    Date2023.05.12 Bynewsit Views438
    Read More
  14. 소니코리아, 전문가와 함께하는 사진 비평 토크쇼 ‘find α’ 개최

    - ‘휴양지 속 α’ 주제로 첫 번째 행사 진행, 총 3회에 걸쳐 사진 전문가와 사진 마니아가 소통하는 프로그램 - 사진 큐레이터 1인과 사진작가 2인의 패널이 심도 깊은 사진 리뷰 진행, 비평 참가자 4명 및 현장 참관 30명 모집 - 선정된 비평 참가자에게는 전...
    Date2023.05.12 Bynewsit Views420
    Read More
  15. 퀀텀, 소프트웨어 정의 올플래시 스토리지 플랫폼 ‘미리어드(Myriad)’ 출시

    - 클라우드 네이티브 파일 및 오브젝트 스토리지 소프트웨어, - 미래의 스토리지 요구사항을 유연하게 수용하고, IT 담당자 업무 부담은 낮게 퀀텀코리아는 오늘, 본사가 올플래시 스케일아웃 파일 및 오브젝트 스토리지 소프트웨어 플랫폼인 ‘퀀텀 미리어드(Q...
    Date2023.05.11 Bynewsit Views372
    Read More
  16. 라이언로켓, 크릭앤리버엔터테인먼트와 MOU 체결…“웹툰 시장 점령하는 생성 AI”

    AI 스타트업 라이언로켓은 크릭앤리버엔터테인먼트와 웹소설 표지 및 웹툰 제작 지원 솔루션 최적화 사업을 위한 업무협약을 체결했다고 11일 밝혔다. 이번 협약으로 인해 크릭앤리버엔터테인먼트는 웹툰 및 웹소설 표지 제작에 라이언로켓의 웹툰 생성AI 기술...
    Date2023.05.11 Bynewsit Views677
    Read More
  17. TI, SiC 게이트 드라이버 「UCC5880-Q1」 출시…“전기차 주행거리 극대화 지원”

    - 더 안전하고, 효율적인 트랙션 인버터로 전기차 주행거리를 연간 1,000마일(약 1,600km)연장 가능 텍사스 인스트루먼트(TI)는 오늘 엔지니어들이 보다 효율적인 트랙션 인버터를 설계하고 전기차의 주행거리를 극대화할 수 있도록 고도로 통합되고 기능 안전...
    Date2023.05.11 Bynewsit Views356
    Read More
  18. MSI, 13세대 RTX 40 「MSI GE78 HX」 고성능 노트북 출시

    - 24코어 32스레드, 13세대 인텔 코어 i9-13950HX - 엔비디아 지포스 RTX 40 고성능 그래픽 탑재 - 백팩 및 게이밍 마우스 기본 제공, 포토 상품평 이벤트 진행 엠에스아이코리아는 어디에서나 최상의 게이밍 경험을 제공하는 하이엔드 게이밍 노트북 'MSI 레...
    Date2023.05.11 Bynewsit Views282
    Read More
  19. NXP-니오, 4D 이미징 레이더 배포 추진

    - 니오, NXP 이미징 레이더 기술로 센서 해상도를 향상하고 감지 범위를 확장해 높은 수준의 자율주행 달성 - 확장된 레이더 기능 통해 차량의 물체 감지, 분리, 분류 정확도를 높여 도로 안전성 및 주행 편의성 향상 - 레벨 2+ 이상의 자율주행 서비스 가능하...
    Date2023.05.11 Bynewsit Views657
    Read More
  20. 클라이온, 네이버 클라우드 최고 파트너 등급 ‘프리미엄’ 획득  

    - 공공 및 민간 고객의 클라우드 기반 디지털 전환 적극 지원으로 ‘Premium MSP’ 선정 통합 클라우드 서비스 전문 기업 클라이온은 네이버 클라우드 파트너 최고 레벨인 ‘Premium’ 등급을 획득했다고 11일 밝혔다. 네이버 클라우드의 최고 등급 서비스 파트너(...
    Date2023.05.11 Bynewsit Views772
    Read More
Board Pagination Prev 1 ... 217 218 219 220 221 222 223 224 225 226 ... 287 Next
/ 287
CLOSE