엔비디아엔비디아(NVIDIA) HGX™ H200을 출시한다고 밝혔다. 이 플랫폼은 엔비디아 호퍼(Hopper) 아키텍처를 기반으로 고급 메모리가 내장된 엔비디아 H200 텐서 코어 GPU(H200 Tensor Core GPU)를 탑재하고 있다. 따라서 생성형 AI와 고성능 컴퓨팅 워크로드를 위한 방대한 양의 데이터를 처리할 수 있다. 이번 HGX H200 출시로 세계 최고 AI 컴퓨팅 플랫폼을 가속화할 수 있을 것으로 기대된다.

 

엔비디아 H200은 HBM3e를 제공하는 최초의 GPU이다. HBM3e은 더 빠르고 대용량 메모리로 생성형 AI와 대규모 언어 모델의 가속화를 촉진하는 동시에 HPC 워크로드를 위한 과학 컴퓨팅을 발전시킨다. 엔비디아 H200은 HBM3e를 통해 초당 4.8TB의 속도로 141GB의 메모리를 제공하며, 이전 모델인 엔비디아 A100에 비해 거의 두 배 용량과 2.4배 더 많은 대역폭을 제공한다.

 

세계 유수 서버 제조업체와 클라우드 서비스 제공업체의 H200 기반 시스템은 2024년 2분기에 출시될 예정이다.

 

엔비디아 하이퍼스케일과 HPC 담당 부사장인 이안 벅(Ian Buck)은 "생성형 AI와 HPC 애플리케이션으로 인텔리전스를 생성하기 위해서는 대규모의 빠른 GPU 메모리를 통해 방대한 양의 데이터를 빠르고 효율적으로 처리해야 한다. 업계 최고의 엔드투엔드 AI 슈퍼컴퓨팅 플랫폼인 엔비디아 H200을 통해 세계에서 가장 중요한 과제를 해결할 수 있는 속도가 더욱 빨라졌다"고 말했다.

 

엔비디아, HGX H200 출시…세계 최고 AI 컴퓨팅 플랫폼 호퍼 가속화.jpg

끊임없는 혁신과 지속적인 성능 도약

엔비디아 호퍼 아키텍처는 이전 버전에 비해 전례 없는 성능 도약을 제공한다. 최근 출시된 엔비디아 텐서RT-LLM(TensorRT-LLM)과 같은 강력한 오픈 소스 라이브러리를 비롯해 H100의 지속적인 소프트웨어 개선을 통해 계속해서 기준을 높여가고 있다.

 

H200 도입으로 700억 개의 파라미터를 보유한 LLM인 라마 2(Llama 2)의 추론 속도가 H100에 비해 거의 두 배로 빨라질 것으로 예상된다. 또한 향후 소프트웨어 업데이트를 통해 H200의 추가적인 성능 리더십과 개선이 기대된다.

 

엔비디아 H200 폼 팩터

엔비디아 H200은 4개(four-way)와 8개(eight-way) 구성의 엔비디아 HGX H200 서버 보드에서 사용할 수 있으며, HGX H200 시스템의 하드웨어와 소프트웨어와 모두 호환된다. 또한 8월 발표된 HBM3e 탑재한 엔비디아 GH200 그레이스 호퍼 슈퍼칩이 포함된다.

 

이러한 선택 사항을 통해 H200은 온프레미스(on-premises), 클라우드, 하이브리드 클라우드와 엣지를 비롯한 모든 유형의 데이터센터에 배포할 수 있다. 또한 엔비디아 글로벌 파트너 서버 제조업체 에코시스템은 기존 시스템을 H200로 업데이트할 수 있다. 파트너사로는 애즈락랙(ASRock Rack), 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 에비덴(Eviden), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 인그라시스(Ingrasys), 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro), 위스트론(Wistron)과 위윈(Wiwynn) 등이 포함된다.

 

아마존웹서비스(Amazon Web Services), 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure)와 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure)는 내년부터 코어위브(CoreWeave), 람다(Lambda), 벌쳐(Vultr)에 이어 H200 기반 인스턴스를 배포하는 최초의 클라우드 서비스 제공업체 중 하나가 될 것이다.

 

HGX H200은 엔비디아 NV링크와 NV스위치 고속 인터커넥트를 기반으로 한다. 1,750억 개 이상의 파라미터가 포함된 대규모의 모델에 대한 LLM 훈련과 추론 등 다양한 애플리케이션 워크로드에서 최고의 성능을 제공한다.

 

8개 방식으로 구동되는 HGX H200은 32페타플롭(Petaflops) 이상의 FP8 딥 러닝 컴퓨팅과 총 1.1TB의 고대역폭 메모리를 제공한다. 이를 통해 생성형 AI와 HPC 애플리케이션에서 최고의 성능을 발휘한다.

 

H200을 초고속 NV링크-C2C 인터커넥트를 갖춘 엔비디아 그레이스 CPU와 결합하면 GH200 그레이스 호퍼 슈퍼칩을 만들 수 있다. 여기에는 대규모 HPC와 AI 애플리케이션을 지원하도록 설계된 통합 모듈인 HBM3e가 포함된다.

 

엔비디아 풀스택 소프트웨어로 AI 가속화

엔비디아 가속 컴퓨팅 플랫폼은 개발자와 기업이 AI에서 HPC에 이르기까지 즉시 생산이 가능한 애플리케이션을 구축하고 가속화할 수 있는 강력한 소프트웨어 도구로 지원된다. 여기에는 음성, 추천 시스템, 하이퍼스케일 추론과 같은 워크로드를 위한 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 제품군이 포함된다.

 

엔비디아 H200은 2024년 2분기부터 글로벌 시스템 제조업체와 클라우드 서비스 제공업체에서 구매할 수 있다.

 

#엔비디아#HGX#H200#AI#

?

  1. 엔비디아 드라이브, 선도적인 전기차 제조업체에 자율주행 실현 지원

    - 리 오토, 차세대 전기차에 드라이브 토르 선택 - GWM, 지커와 샤오미, AI 기반 자동차 개발에 엔비디아 드라이브 오린 사용 엔비디아가 전기차의 주행거리 연장 분야에서 선도적인 중국 전기차 업체인 리 오토(Li Auto)가 차세대 자동차에 드라이브 토르(DRI...
    Date2024.01.10 Bynewsit Views412
    Read More
  2. 테스트웍스, ‘2024 Emerging AI+X Top 100 기업’ 3년 연속 선정

    인공지능 데이터 및 검증 솔루션 전문기업 테스트웍스는 ‘2024 Emerging AI+X Top 100 기업’으로 선정됐다고 밝혔다. 테스트웍스는 크로스-인더스트리 분야의 AI Data 인프라스트럭처 부분 수상 기업으로 3년 연속 선정되었다. 지능정보산업협회는 인공지능(AI...
    Date2024.01.10 Bynewsit Views476
    Read More
  3. [CES 2024] 엔비디아, AI 기반 자동차 혁신 공개…“벤츠, 폴스타, 코디악, 페블 등 AI 탑재된 최신 차량 발표“

    엔비디아는 CES2024에서 자동차 파트너들이 AI와 엔비디아 기술을 활용해 다양한 혁신을 선보였다고 밝혔다. 리 오토(Li Auto)는 차세대 차량에 엔비디아 드라이브 토르(NVIDIA DRIVE Thor) 중앙집중식 차량용 컴퓨터를 채택하고, 전기차 제조업체인 GWM(Great...
    Date2024.01.09 Bynewsit Views493
    Read More
  4. [CES 2024] 엔비디아, 새로운 지포스 시리즈 및 AI 툴 발표…"생성형 AI 활용 확대"

    - 텐서코어 GPU, LLM, RTX PC, 워크스테이션용 툴로 수백만 명에게 생성형 AI 제공 - 새로운 지포스 RTX 슈퍼 GPU, AI 노트북 등 통해 RTX로 가속화된 AI 플랫폼 성능 제공 엔비디아가 텐서 코어 GPU, LLM, RTX PC와 워크스테이션용 툴을 통해 수백만 명에 생...
    Date2024.01.09 Bynewsit Views525
    Read More
  5. 오케스트로, ‘클라우드 네이티브 전환’ 서비스 확장

    - 클라우드 네이티브 전환 서비스 확장을 위한 인력 충원과 자본 투자 확대 국내 유일의 엔드투엔드 클라우드 서비스 기업 오케스트로는 클라우드 네이티브 전환 서비스를 확대하기 위해 조직 강화와 플랫폼 기술 고도화에 대한 투자를 확대하겠다고 밝혔다. ...
    Date2024.01.08 Bynewsit Views465
    Read More
  6. [CES 2024] 다쏘시스템, '버추얼 트윈'을 활용한 혁신적인 헬스케어 공개

    - 인공지능 활용한 의료분야 버추얼 트윈 체험 기회 제공 - 개인화된 버추얼 트윈, 효과적인 음식 섭취, 운동 방법 제시부터 임상시험 대체까지 다쏘시스템 CES 2024에 참가해 인공지능(AI)을 활용한 인체 버추얼 트윈 혁신을 선보이고, 이를 통해 정밀 의료의...
    Date2024.01.08 Bynewsit Views474
    Read More
  7. 인텔, 디지털브릿지와 함께 기업용 생성형 AI 솔루션 기업 '아티큘8' 설립

    - 업계 투자 통한 독립 기업 아티큘8 설립, 폭넓은 생성형AI 생태계를 위한 제품군 확장 및 시장진출 가속화 인텔은 글로벌 투자 회사 디지털브릿지 그룹(DigitalBridge Group)과 함께 기업 고객에게 최적화된, 안전한 풀스택 생성형 AI(GenAI) 소프트웨어 플...
    Date2024.01.08 Bynewsit Views403
    Read More
  8. 더조인, 국내 최초로 모바일 가상화 보안 솔루션 ‘J-VMP’ GS인증 1등급 획득 

    - 모바일 업무시스템 구축 시 필수적인 보안성과 사용자 편의성, 관리비용 절감, 운영 효율성 제공 - 외교부와 행정안전부 등의 중앙부처 및 산하 공공기관에 다수 공급하여 제품 안전성을 검증 받아 - GS인증에 이어, 오는 2월 중에 국제공통평가기준(CC)인증...
    Date2024.01.04 Bynewsit Views365
    Read More
  9. 티맥스소프트, 홈페이지 전면 개편…“저전력·고효율 ARM 서버 적용”

    - SaaS 중심의 클라우드 역량 알리고, 고객 소통 강화 위해 홈페이지 새 단장 - 솔루션 및 사업 분야별 성과, 계획, 경영 활동 등 담은 통합 콘텐츠 허브로 구현 - 신수종 사업 저전력·고효율 ARM 서버를 적용한 실증 사례로 활용 티맥스소프트가 공식 홈페이...
    Date2024.01.04 Bynewsit Views768
    Read More
  10. 매스웍스, 세종대학교 ‘2023 세종 AI 챌린지’ 공식 후원

    - 매스웍스, 2022년부터 2회 연속 대회 공식 후원…MATLAB을 활용한 대학생 실무능력 개발 장려 매스웍스는 세종대학교가 주최한 인공지능(AI) 분야 문제 해결 능력 경진대회 ‘2023 세종 AI 챌린지’를 후원했다고 발표했다. 이번 대회에는 총 196명의 학생들이 ...
    Date2024.01.04 Bynewsit Views441
    Read More
목록
Board Pagination Prev 1 ... 149 150 151 152 153 154 155 156 157 158 ... 237 Next
/ 237
CLOSE