엔비디아엔비디아(NVIDIA) HGX™ H200을 출시한다고 밝혔다. 이 플랫폼은 엔비디아 호퍼(Hopper) 아키텍처를 기반으로 고급 메모리가 내장된 엔비디아 H200 텐서 코어 GPU(H200 Tensor Core GPU)를 탑재하고 있다. 따라서 생성형 AI와 고성능 컴퓨팅 워크로드를 위한 방대한 양의 데이터를 처리할 수 있다. 이번 HGX H200 출시로 세계 최고 AI 컴퓨팅 플랫폼을 가속화할 수 있을 것으로 기대된다.

 

엔비디아 H200은 HBM3e를 제공하는 최초의 GPU이다. HBM3e은 더 빠르고 대용량 메모리로 생성형 AI와 대규모 언어 모델의 가속화를 촉진하는 동시에 HPC 워크로드를 위한 과학 컴퓨팅을 발전시킨다. 엔비디아 H200은 HBM3e를 통해 초당 4.8TB의 속도로 141GB의 메모리를 제공하며, 이전 모델인 엔비디아 A100에 비해 거의 두 배 용량과 2.4배 더 많은 대역폭을 제공한다.

 

세계 유수 서버 제조업체와 클라우드 서비스 제공업체의 H200 기반 시스템은 2024년 2분기에 출시될 예정이다.

 

엔비디아 하이퍼스케일과 HPC 담당 부사장인 이안 벅(Ian Buck)은 "생성형 AI와 HPC 애플리케이션으로 인텔리전스를 생성하기 위해서는 대규모의 빠른 GPU 메모리를 통해 방대한 양의 데이터를 빠르고 효율적으로 처리해야 한다. 업계 최고의 엔드투엔드 AI 슈퍼컴퓨팅 플랫폼인 엔비디아 H200을 통해 세계에서 가장 중요한 과제를 해결할 수 있는 속도가 더욱 빨라졌다"고 말했다.

 

엔비디아, HGX H200 출시…세계 최고 AI 컴퓨팅 플랫폼 호퍼 가속화.jpg

끊임없는 혁신과 지속적인 성능 도약

엔비디아 호퍼 아키텍처는 이전 버전에 비해 전례 없는 성능 도약을 제공한다. 최근 출시된 엔비디아 텐서RT-LLM(TensorRT-LLM)과 같은 강력한 오픈 소스 라이브러리를 비롯해 H100의 지속적인 소프트웨어 개선을 통해 계속해서 기준을 높여가고 있다.

 

H200 도입으로 700억 개의 파라미터를 보유한 LLM인 라마 2(Llama 2)의 추론 속도가 H100에 비해 거의 두 배로 빨라질 것으로 예상된다. 또한 향후 소프트웨어 업데이트를 통해 H200의 추가적인 성능 리더십과 개선이 기대된다.

 

엔비디아 H200 폼 팩터

엔비디아 H200은 4개(four-way)와 8개(eight-way) 구성의 엔비디아 HGX H200 서버 보드에서 사용할 수 있으며, HGX H200 시스템의 하드웨어와 소프트웨어와 모두 호환된다. 또한 8월 발표된 HBM3e 탑재한 엔비디아 GH200 그레이스 호퍼 슈퍼칩이 포함된다.

 

이러한 선택 사항을 통해 H200은 온프레미스(on-premises), 클라우드, 하이브리드 클라우드와 엣지를 비롯한 모든 유형의 데이터센터에 배포할 수 있다. 또한 엔비디아 글로벌 파트너 서버 제조업체 에코시스템은 기존 시스템을 H200로 업데이트할 수 있다. 파트너사로는 애즈락랙(ASRock Rack), 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 에비덴(Eviden), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 인그라시스(Ingrasys), 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro), 위스트론(Wistron)과 위윈(Wiwynn) 등이 포함된다.

 

아마존웹서비스(Amazon Web Services), 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure)와 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure)는 내년부터 코어위브(CoreWeave), 람다(Lambda), 벌쳐(Vultr)에 이어 H200 기반 인스턴스를 배포하는 최초의 클라우드 서비스 제공업체 중 하나가 될 것이다.

 

HGX H200은 엔비디아 NV링크와 NV스위치 고속 인터커넥트를 기반으로 한다. 1,750억 개 이상의 파라미터가 포함된 대규모의 모델에 대한 LLM 훈련과 추론 등 다양한 애플리케이션 워크로드에서 최고의 성능을 제공한다.

 

8개 방식으로 구동되는 HGX H200은 32페타플롭(Petaflops) 이상의 FP8 딥 러닝 컴퓨팅과 총 1.1TB의 고대역폭 메모리를 제공한다. 이를 통해 생성형 AI와 HPC 애플리케이션에서 최고의 성능을 발휘한다.

 

H200을 초고속 NV링크-C2C 인터커넥트를 갖춘 엔비디아 그레이스 CPU와 결합하면 GH200 그레이스 호퍼 슈퍼칩을 만들 수 있다. 여기에는 대규모 HPC와 AI 애플리케이션을 지원하도록 설계된 통합 모듈인 HBM3e가 포함된다.

 

엔비디아 풀스택 소프트웨어로 AI 가속화

엔비디아 가속 컴퓨팅 플랫폼은 개발자와 기업이 AI에서 HPC에 이르기까지 즉시 생산이 가능한 애플리케이션을 구축하고 가속화할 수 있는 강력한 소프트웨어 도구로 지원된다. 여기에는 음성, 추천 시스템, 하이퍼스케일 추론과 같은 워크로드를 위한 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 제품군이 포함된다.

 

엔비디아 H200은 2024년 2분기부터 글로벌 시스템 제조업체와 클라우드 서비스 제공업체에서 구매할 수 있다.

 

#엔비디아#HGX#H200#AI#

?

  1. 코드마인드, 일본 IT전시회 ‘EdgeTech+’ 참가

    - 수작업으로만 수행되어온 일본의 소프트웨어 테스팅, 이제는 자동 테스팅으로 이목 집중 소프트웨어 검증 전문기업 코드마인드가 일본 시장 공략에 나선다고 밝혔다. 코드마인드는 지난 15일부터 17일까지 3일간 일본 요코하마에서 열린 엣지테크플러스 2023...
    Date2023.11.27 Bynewsit Views728
    Read More
  2. 다쏘시스템, 솔리드웍스(SOLIDWORKS) 2024 출시…“보다 빠르고 스마트한 협업 경험 제공”

    - 솔리드웍스 2024, 데이터 관리 및 공유, 협업 효율성 향상에 집중 - 3D익스피리언스 플랫폼 연결하는 클라우드 서비스 제공으로 매끄러운 협업 환경 제공 - 많이 사용하는 그래픽 성능 향상으로 더 크고 복잡한 설계 가능 - SOLIDWORKS 구버전 저장 기능으로...
    Date2023.11.27 Bynewsit Views600
    Read More
  3. 유니버설 로봇, 울산대학교 유니버설 로봇 공인인증 트레이닝센터 지정…“협동로봇 교육으로 경남지역 로봇 전문가 양성”

    - 국내 협동로봇 교육 통해 로봇 및 AI 시대의 주역이 될 차세대 미래 인재 양성 협동로봇 전문 기업 ‘유니버설 로봇(Universal Robots)’은 울산대학교가 유니버설 로봇의 공인인증 트레이닝 센터로 지정되어 현판식을 진행했다고 27일 밝혔다. 이로써 울산대...
    Date2023.11.27 Bynewsit Views518
    Read More
  4. 유아이패스-LG CNS, AI 기반 자동화 구축 위한 전략적 파트너십 체결

    글로벌 엔터프라이즈용 자동화 소프트웨어 기업 유아이패스가 DX전문기업 LG CNS와 파트너십을 강화하고 고객사들을 대상으로 제공하는 자동화 서비스를 확대한다고 23일 밝혔다. 유아이패스가 LG CNS와 함께 협력하여 시장 진출에 나서면서 제조, 통신, 에너...
    Date2023.11.24 Bynewsit Views451
    Read More
  5. 아스펜테크, aspenOne 최신기능 업데이트 V14.2 출시…“오퍼레이셔널 엑설런스 달성 지원”

    - 지속가능성 혁신, AI 기반 산업 모델, 산업 데이터 관리, 새로운 제품 통합 아스펜테크가 자산 최적화 솔루션 포트폴리오 aspenONE에서 사용할 수 있는 새로운 성능 및 지속 가능성 기능을 최신 버전 출시를 통해 발표했다. 고객사의 디지털화 전략을 가속화...
    Date2023.11.23 Bynewsit Views460
    Read More
  6. 큐브리드, “클라우드 기반의 사용자 확산 및 개방형 생태계 구축에 집중”

    큐브리드가 자사의 DBMS ‘큐브리드(CUBRID)’의 오픈소스 전환 15주년을 맞아 기념식을 열고 클라우드 기반의 사용자 확산 및 개방형 생태계 구축에 집중할 계획이라고 밝혔다. 25년 이상 개발된 관계형 DBMS 제품인 CUBRID는 엔터프라이즈 시장에서 요구하는 ...
    Date2023.11.23 Bynewsit Views448
    Read More
  7. 애드저스트, ‘2023 모바일 앱 성장 리포트’ 발간…“아시아 태평양, 모바일 앱 성장 기회의 땅”

    - 애드저스트, 모바일 앱 마케터와 개발자의 글로벌 사용자 획득 기회 확대 정조준 - 2,500개 앱 실적 기반으로 앱과 앱 마케팅 성과의 객관적 측정 가능한 ‘성장점수’ 고안 - 인도, 성장점수 43.3점으로 글로벌 1위 달성, 모바일 게임 UA 캠페인에 가장 적합...
    Date2023.11.23 Bynewsit Views583
    Read More
  8. 지코어, AI/ML 추론 가속화 인프라 ‘엣지 AI’ 발표

    - 지코어코리아, '엔비디아 H100' 기반 퍼블릭 및 프라이빗 클라우드 서비스 제공 가능한 국내 유일한 클라우드 서비스 제공 기업 지코어는 오늘, AI/ML 추론을 가속화하는 서비스형 AI 인프라스트럭처(AI Infrastructure as a service)인 ‘엣지 AI(Edge AI)‘...
    Date2023.11.22 Bynewsit Views614
    Read More
  9. 엔비디아, 새로운 스펙트럼-X 이더넷 네트워킹으로 기업 AI 워크로드 가속화 지원

    - 델, HPE, 레노버 서버 라인업에 새로운 AI용 이더넷 네트워킹 기술 최초 통합 - 스펙트럼-4, 엔비디아 블루필드-3 슈퍼NIC, 가속 소프트웨어 결합해 AI 워크로드 효율성 극대화 엔비디아가 AI용 엔비디아 스펙트럼-X 이더넷 네트워킹 기술이 델 테크놀로지스...
    Date2023.11.22 Bynewsit Views587
    Read More
  10. 서비스나우, 나우 플랫폼의 모든 워크플로우에 생성형 AI 도입

    - 나우 플랫폼 밴쿠버 릴리스의 나우 어시스트, 생성형 AI 탑재해 생산성 가속화, 경험 개선 및 민첩성 향상 - 나우 어시스트 신기능, 서비스나우 도메인 특화 LLM 기반으로 업무 정확성 및 데이터 프라이버시에 최적화 서비스나우(ServiceNow)가 오늘 나우 어...
    Date2023.11.22 Bynewsit Views515
    Read More
목록
Board Pagination Prev 1 ... 139 140 141 142 143 144 145 146 147 148 ... 222 Next
/ 222
CLOSE