엔비디아엔비디아(NVIDIA) HGX™ H200을 출시한다고 밝혔다. 이 플랫폼은 엔비디아 호퍼(Hopper) 아키텍처를 기반으로 고급 메모리가 내장된 엔비디아 H200 텐서 코어 GPU(H200 Tensor Core GPU)를 탑재하고 있다. 따라서 생성형 AI와 고성능 컴퓨팅 워크로드를 위한 방대한 양의 데이터를 처리할 수 있다. 이번 HGX H200 출시로 세계 최고 AI 컴퓨팅 플랫폼을 가속화할 수 있을 것으로 기대된다.

 

엔비디아 H200은 HBM3e를 제공하는 최초의 GPU이다. HBM3e은 더 빠르고 대용량 메모리로 생성형 AI와 대규모 언어 모델의 가속화를 촉진하는 동시에 HPC 워크로드를 위한 과학 컴퓨팅을 발전시킨다. 엔비디아 H200은 HBM3e를 통해 초당 4.8TB의 속도로 141GB의 메모리를 제공하며, 이전 모델인 엔비디아 A100에 비해 거의 두 배 용량과 2.4배 더 많은 대역폭을 제공한다.

 

세계 유수 서버 제조업체와 클라우드 서비스 제공업체의 H200 기반 시스템은 2024년 2분기에 출시될 예정이다.

 

엔비디아 하이퍼스케일과 HPC 담당 부사장인 이안 벅(Ian Buck)은 "생성형 AI와 HPC 애플리케이션으로 인텔리전스를 생성하기 위해서는 대규모의 빠른 GPU 메모리를 통해 방대한 양의 데이터를 빠르고 효율적으로 처리해야 한다. 업계 최고의 엔드투엔드 AI 슈퍼컴퓨팅 플랫폼인 엔비디아 H200을 통해 세계에서 가장 중요한 과제를 해결할 수 있는 속도가 더욱 빨라졌다"고 말했다.

 

엔비디아, HGX H200 출시…세계 최고 AI 컴퓨팅 플랫폼 호퍼 가속화.jpg

끊임없는 혁신과 지속적인 성능 도약

엔비디아 호퍼 아키텍처는 이전 버전에 비해 전례 없는 성능 도약을 제공한다. 최근 출시된 엔비디아 텐서RT-LLM(TensorRT-LLM)과 같은 강력한 오픈 소스 라이브러리를 비롯해 H100의 지속적인 소프트웨어 개선을 통해 계속해서 기준을 높여가고 있다.

 

H200 도입으로 700억 개의 파라미터를 보유한 LLM인 라마 2(Llama 2)의 추론 속도가 H100에 비해 거의 두 배로 빨라질 것으로 예상된다. 또한 향후 소프트웨어 업데이트를 통해 H200의 추가적인 성능 리더십과 개선이 기대된다.

 

엔비디아 H200 폼 팩터

엔비디아 H200은 4개(four-way)와 8개(eight-way) 구성의 엔비디아 HGX H200 서버 보드에서 사용할 수 있으며, HGX H200 시스템의 하드웨어와 소프트웨어와 모두 호환된다. 또한 8월 발표된 HBM3e 탑재한 엔비디아 GH200 그레이스 호퍼 슈퍼칩이 포함된다.

 

이러한 선택 사항을 통해 H200은 온프레미스(on-premises), 클라우드, 하이브리드 클라우드와 엣지를 비롯한 모든 유형의 데이터센터에 배포할 수 있다. 또한 엔비디아 글로벌 파트너 서버 제조업체 에코시스템은 기존 시스템을 H200로 업데이트할 수 있다. 파트너사로는 애즈락랙(ASRock Rack), 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 에비덴(Eviden), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 인그라시스(Ingrasys), 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro), 위스트론(Wistron)과 위윈(Wiwynn) 등이 포함된다.

 

아마존웹서비스(Amazon Web Services), 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure)와 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure)는 내년부터 코어위브(CoreWeave), 람다(Lambda), 벌쳐(Vultr)에 이어 H200 기반 인스턴스를 배포하는 최초의 클라우드 서비스 제공업체 중 하나가 될 것이다.

 

HGX H200은 엔비디아 NV링크와 NV스위치 고속 인터커넥트를 기반으로 한다. 1,750억 개 이상의 파라미터가 포함된 대규모의 모델에 대한 LLM 훈련과 추론 등 다양한 애플리케이션 워크로드에서 최고의 성능을 제공한다.

 

8개 방식으로 구동되는 HGX H200은 32페타플롭(Petaflops) 이상의 FP8 딥 러닝 컴퓨팅과 총 1.1TB의 고대역폭 메모리를 제공한다. 이를 통해 생성형 AI와 HPC 애플리케이션에서 최고의 성능을 발휘한다.

 

H200을 초고속 NV링크-C2C 인터커넥트를 갖춘 엔비디아 그레이스 CPU와 결합하면 GH200 그레이스 호퍼 슈퍼칩을 만들 수 있다. 여기에는 대규모 HPC와 AI 애플리케이션을 지원하도록 설계된 통합 모듈인 HBM3e가 포함된다.

 

엔비디아 풀스택 소프트웨어로 AI 가속화

엔비디아 가속 컴퓨팅 플랫폼은 개발자와 기업이 AI에서 HPC에 이르기까지 즉시 생산이 가능한 애플리케이션을 구축하고 가속화할 수 있는 강력한 소프트웨어 도구로 지원된다. 여기에는 음성, 추천 시스템, 하이퍼스케일 추론과 같은 워크로드를 위한 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 제품군이 포함된다.

 

엔비디아 H200은 2024년 2분기부터 글로벌 시스템 제조업체와 클라우드 서비스 제공업체에서 구매할 수 있다.

 

#엔비디아#HGX#H200#AI#

?

  1. 라이언로켓, 중소벤처기업부 주최 외신 프레스투어 발표…“AI 웹툰 제작 파트너 ‘젠버스’ 소개”

    웹툰 생성 AI 1위 스타트업 라이언로켓은 23일(목) 중소벤처기업부 주최로 열린 외신 프레스 투어에서 젠버스(Genvas)를 공개하며 한국 웹툰 시장의 현황과 젠버스의 핵심 가치를 소개했다. 젠버스는 독자적인 캐릭터 고정 기술력과 동작 제어 기술로 기존보다...
    Date2024.05.27 Bynewsit Views433
    Read More
  2. 다쏘시스템, 파리 생루이 병원 AP-HP 투석실 버추얼 트윈 구현…“호흡기 환자 보호 및 간병인 교육 지원”

    - 다쏘시스템, 병원 관계자들이 바이러스의 호흡기 전파를 더 잘 이해하고 환자 치료를 최적화할 수 있도록 3D익스피리언스 플랫폼 사용해 버추얼 트윈 환경 구축 - 버추얼 트윈 활용한 시뮬레이션과 증강 현실 사용, 투석실 공기 통해 바이러스 입자가 순환할...
    Date2024.05.27 Bynewsit Views342
    Read More
  3. 알리바바 클라우드, 신규 클라우드 가용 영역 개설 및 글로벌 투자 확장…“AI 플랫폼 제공”

    - 전 세계 고객에게 생성형 AI 플랫폼 제공 및 고객 지원 강화 위한 파트너십 향상 발표 알리바바 클라우드가 멕시코에 첫 클라우드 리전(Cloud Region)을 개설하고 향후 3년 내에 한국과 말레이시아, 필리핀, 태국 등 주요 시장에 데이터센터를 추가로 설립한...
    Date2024.05.24 Bynewsit Views387
    Read More
  4. 캔바, 엔터프라이즈 기업을 위한 강력한 ‘기업용 Canva’ 최초 공개

    - 급증하는 대규모 기업 및 조직 수요 및 도입을 위한 새로운 구독 플랜 ‘기업용 Canva’ 공개 - 업무용 신제품으로 새로운 경험과 출시 이후 10년 만에 역대 최대 규모 개편 발표 - 캔바 강좌, 업무 키트 등 업무 교육을 위한 제품 및 서비스 출시 - 추천 편집...
    Date2024.05.24 Bynewsit Views324
    Read More
  5. EDB, 오픈소스 DB기반 지능형 플랫폼 ‘EDB 포스트그레스 AI’ 발표…“트랜잭션과 분석, AI 워크로드 분석에 탁월”

    - 클라우드와 온프레미스, 물리적 어플라이언스에서 AI, 분석 및 ML 애플리케이션을 위한 독보적인 데이터 처리 기능 제공 EDB는 오늘, 트랜잭션과 분석, AI 워크로드를 위한 오픈소스 DB인 포스트그레스(Postgres) 기반 지능형 DB관리 플랫폼인 ‘EDB 포스트그...
    Date2024.05.24 Bynewsit Views472
    Read More
  6. 애드저스트, ‘2024 게임 앱 인사이트’ 리포트 발간… “전 세계 5,000개 앱 데이터 결과 수록”g

    애드저스트(Adjust) 코리아는 오늘 전 세계 모바일 게임 시장 현황과 성공적인 게임을 위한 전략적 인사이트를 담은 ‘2024년 게임 앱 인사이트 리포트’ 발간 기자간담회를 열고 한국지사의 2024년 성과와 게이밍 리포트에 기반한 전략을 발표했다. 애드저스트 ...
    Date2024.05.23 Bynewsit Views399
    Read More
  7. 매스웍스, 제13회 '매트랩 엑스포 2024 코리아' 개최…“최신 기술 트랜드 인사이트 제공”

    - 삼성전자, 현대자동차 등 24개사, 매트랩 활용한 엔지니어링 및 과학 분야 연구개발 성과 소개 매스웍스는 6월 11일(화) ‘매트랩 엑스포 2024 코리아(MATLAB EXPO 2024 Korea)’를 그랜드 인터컨티넨탈 서울 파르나스에서 개최한다고 밝혔다. 매년 개최되는 ...
    Date2024.05.23 Bynewsit Views363
    Read More
  8. 아스펜테크, 지속가능성 경로 솔루션 위한 새로운 전략 계획 발표

    - 고객이 탄소 포집 밸류체인 투자를 최적화할 수 있도록 지원 - 아람코와의 공동 개발로 다양한 지속가능성 경로 전반에 걸쳐 솔루션 제공하는 확장된 공동 혁신 프로그램 출시 아스펜테크가 <지속가능성 경로를 위한 아스펜테크 전략 계획(AspenTech Strateg...
    Date2024.05.21 Bynewsit Views407
    Read More
  9. SAP 코리아, AI 기반 공급망 혁신 세미나 개최

    - 하노버 메쎄에서 선보인 AI 기반 공급망 혁신 솔루션 소개 및 생생한 고객 실사례 공유 SAP 코리아는 오늘 <제조혁신을 위한 AI 기반 공급망 혁신(SAP Innovation Day for Supply Chain)> 세미나를 개최했다고 밝혔다. 이번 행사는 지난 4월 독일에서 열린 ...
    Date2024.05.21 Bynewsit Views544
    Read More
  10. 헥사곤-영남대, 미래차 융합 인재 양성 MOU 체결

    - 국내 전기자율차 융합부품산업 분야 공동 기술개발 및 디지털 전환 위해 협력 모색 - 자율주행 시뮬레이션 솔루션 ‘가상 테스트 드라이브(VTD)’ 후원 - 실무 인재 양성 및 영남지역 미래차 경쟁력 향상 헥사곤 매뉴팩처링 인텔리전스는 영남대학교와 함께 전...
    Date2024.05.21 Bynewsit Views520
    Read More
목록
Board Pagination Prev 1 ... 122 123 124 125 126 127 128 129 130 131 ... 235 Next
/ 235
CLOSE