엔비디아엔비디아(NVIDIA) HGX™ H200을 출시한다고 밝혔다. 이 플랫폼은 엔비디아 호퍼(Hopper) 아키텍처를 기반으로 고급 메모리가 내장된 엔비디아 H200 텐서 코어 GPU(H200 Tensor Core GPU)를 탑재하고 있다. 따라서 생성형 AI와 고성능 컴퓨팅 워크로드를 위한 방대한 양의 데이터를 처리할 수 있다. 이번 HGX H200 출시로 세계 최고 AI 컴퓨팅 플랫폼을 가속화할 수 있을 것으로 기대된다.

 

엔비디아 H200은 HBM3e를 제공하는 최초의 GPU이다. HBM3e은 더 빠르고 대용량 메모리로 생성형 AI와 대규모 언어 모델의 가속화를 촉진하는 동시에 HPC 워크로드를 위한 과학 컴퓨팅을 발전시킨다. 엔비디아 H200은 HBM3e를 통해 초당 4.8TB의 속도로 141GB의 메모리를 제공하며, 이전 모델인 엔비디아 A100에 비해 거의 두 배 용량과 2.4배 더 많은 대역폭을 제공한다.

 

세계 유수 서버 제조업체와 클라우드 서비스 제공업체의 H200 기반 시스템은 2024년 2분기에 출시될 예정이다.

 

엔비디아 하이퍼스케일과 HPC 담당 부사장인 이안 벅(Ian Buck)은 "생성형 AI와 HPC 애플리케이션으로 인텔리전스를 생성하기 위해서는 대규모의 빠른 GPU 메모리를 통해 방대한 양의 데이터를 빠르고 효율적으로 처리해야 한다. 업계 최고의 엔드투엔드 AI 슈퍼컴퓨팅 플랫폼인 엔비디아 H200을 통해 세계에서 가장 중요한 과제를 해결할 수 있는 속도가 더욱 빨라졌다"고 말했다.

 

엔비디아, HGX H200 출시…세계 최고 AI 컴퓨팅 플랫폼 호퍼 가속화.jpg

끊임없는 혁신과 지속적인 성능 도약

엔비디아 호퍼 아키텍처는 이전 버전에 비해 전례 없는 성능 도약을 제공한다. 최근 출시된 엔비디아 텐서RT-LLM(TensorRT-LLM)과 같은 강력한 오픈 소스 라이브러리를 비롯해 H100의 지속적인 소프트웨어 개선을 통해 계속해서 기준을 높여가고 있다.

 

H200 도입으로 700억 개의 파라미터를 보유한 LLM인 라마 2(Llama 2)의 추론 속도가 H100에 비해 거의 두 배로 빨라질 것으로 예상된다. 또한 향후 소프트웨어 업데이트를 통해 H200의 추가적인 성능 리더십과 개선이 기대된다.

 

엔비디아 H200 폼 팩터

엔비디아 H200은 4개(four-way)와 8개(eight-way) 구성의 엔비디아 HGX H200 서버 보드에서 사용할 수 있으며, HGX H200 시스템의 하드웨어와 소프트웨어와 모두 호환된다. 또한 8월 발표된 HBM3e 탑재한 엔비디아 GH200 그레이스 호퍼 슈퍼칩이 포함된다.

 

이러한 선택 사항을 통해 H200은 온프레미스(on-premises), 클라우드, 하이브리드 클라우드와 엣지를 비롯한 모든 유형의 데이터센터에 배포할 수 있다. 또한 엔비디아 글로벌 파트너 서버 제조업체 에코시스템은 기존 시스템을 H200로 업데이트할 수 있다. 파트너사로는 애즈락랙(ASRock Rack), 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 에비덴(Eviden), 기가바이트(GIGABYTE), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), 인그라시스(Ingrasys), 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro), 위스트론(Wistron)과 위윈(Wiwynn) 등이 포함된다.

 

아마존웹서비스(Amazon Web Services), 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure)와 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure)는 내년부터 코어위브(CoreWeave), 람다(Lambda), 벌쳐(Vultr)에 이어 H200 기반 인스턴스를 배포하는 최초의 클라우드 서비스 제공업체 중 하나가 될 것이다.

 

HGX H200은 엔비디아 NV링크와 NV스위치 고속 인터커넥트를 기반으로 한다. 1,750억 개 이상의 파라미터가 포함된 대규모의 모델에 대한 LLM 훈련과 추론 등 다양한 애플리케이션 워크로드에서 최고의 성능을 제공한다.

 

8개 방식으로 구동되는 HGX H200은 32페타플롭(Petaflops) 이상의 FP8 딥 러닝 컴퓨팅과 총 1.1TB의 고대역폭 메모리를 제공한다. 이를 통해 생성형 AI와 HPC 애플리케이션에서 최고의 성능을 발휘한다.

 

H200을 초고속 NV링크-C2C 인터커넥트를 갖춘 엔비디아 그레이스 CPU와 결합하면 GH200 그레이스 호퍼 슈퍼칩을 만들 수 있다. 여기에는 대규모 HPC와 AI 애플리케이션을 지원하도록 설계된 통합 모듈인 HBM3e가 포함된다.

 

엔비디아 풀스택 소프트웨어로 AI 가속화

엔비디아 가속 컴퓨팅 플랫폼은 개발자와 기업이 AI에서 HPC에 이르기까지 즉시 생산이 가능한 애플리케이션을 구축하고 가속화할 수 있는 강력한 소프트웨어 도구로 지원된다. 여기에는 음성, 추천 시스템, 하이퍼스케일 추론과 같은 워크로드를 위한 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 제품군이 포함된다.

 

엔비디아 H200은 2024년 2분기부터 글로벌 시스템 제조업체와 클라우드 서비스 제공업체에서 구매할 수 있다.

 

#엔비디아#HGX#H200#AI#

?

  1. 델, 통합형 어플라이언스 ‘델 오브젝트스케일 XF960’ 출시…“최신 세대의 파워엣지 서버와 풀스택 NVMe를 장착”

    - ‘델 오브젝트스케일’의 새로운 SW 버전과 통합형 어플라이언스 선보여 - 델 오브젝트스케일, 쿠버네티스 소프트웨어 번들 혹은 레드햇 오픈시프트 상에서 구축 가능한 2가지의 소프트웨어 정의 옵션 제공 델 테크놀로지스가 자사의 차세대 오브젝트 스토리지...
    Date2023.11.21 Bynewsit Views237
    Read More
  2. AWS, HD현대오일뱅크의 디지털 혁신 가속화 및 데이터 기반 운영 지원

    - 국내 정유업체 최초 AWS 클라우드 전면 이전 통해 IT 관련 비용 20% 절감 기대 - 올해 말 전기차 충전 사업 AWS 기반 론칭 운영 및 향후 실험적 생성형 AI 활용 예정 아마존웹서비스(AWS)는 국내 정유 업체 HD현대오일뱅크의 디지털 혁신 강화, 오퍼레이션 ...
    Date2023.11.20 Bynewsit Views610
    Read More
  3. 록히드마틴, NASA ‘아르테미스 미션’ 시뮬레이션 호스팅에 레드햇 솔루션 사용

    지난 11월 16일은 미 항공우주국(NASA)가 아르테미스 1호 발사에 성공한지 1년이 되는 날이었다. 2022년 11월 16일 달로 발사된 아르테미스 1호는 인류를 다시 한번 달에 착륙시키고자 2017년 NASA가 시작한 아르테미스 계획(Artemis Program)의 첫 번째 미션...
    Date2023.11.20 Bynewsit Views630
    Read More
  4. 윈드리버, ‘2023 밀리터리 에어로스페이스 일렉트로닉스’ 어워드 임베디드 컴퓨팅 부문 수상

    - VxWorks 컨테이너 지원 인정받아 혁신 기업으로 선정 윈드리버가 ‘2023 MAE 이노베이터스 어워드(2023 MAE Innovators Awards)’ 프로그램에서 VxWorks 컨테이너 지원을 인정받아 임베디드 컴퓨팅 부문의 플래티넘 수상자로 선정됐다. 투표에 참여한 엔지니어...
    Date2023.11.20 Bynewsit Views637
    Read More
  5. 가민, 올인원 인도어 스마트 바이크 ‘Tacx NEO Bike Plus’ 출시…“실내에서 실감나는 라이딩 경험 제공”

    - Tacx NEO Bike Plus, 실제 야외에서 주행하는 것 같은 실내 라이딩 경험 제공 - 유저의 성과 파악을 위한 고급 트레이닝 및 성과 지표 제공 - 한 장소에서 여러 유저를 수용할 수 있도록 완전히 조절 가능 - Tacx Training 앱 구독 서비스를 통해 몰입감 넘...
    Date2023.11.20 Bynewsit Views236
    Read More
  6. 티맥스알지-원교재사, AI디지털 교과서 정보 개발 계약 체결

    - 티맥스그룹 슈퍼앱 기술 총 집약된 중등 정보교과 AI 디지털 교과서 개발 박차 - 정보 교과 학습에 필수적인 코딩 실습 환경 임베딩 - ‘학생들이 배우기 쉽고 – 선생님들이 가르치기 쉬운’ 최적의 학습 환경 제공 슈퍼앱 기반 교육·지식 플랫폼 전문 기업 티...
    Date2023.11.20 Bynewsit Views512
    Read More
  7. 동국제약, ‘베리타스 넷백업 어플라이언스’ 도입으로 랜섬웨어 공격에도 데이터 완벽 복구

    - ‘넷백업 어플라이언스’를 통해 랜섬웨어 감염에도 데이터를 신속하고 완벽하게 복구 - 백업 인프라 고도화, 용량 확보, 백업 데이터 보안 강화, 소산 백업을 통한 완벽한 데이터 보호 구현 베리타스테크놀로지스는 베리타스 솔루션을 도입하여 랜섬웨어 감염...
    Date2023.11.20 Bynewsit Views189
    Read More
  8. 에미레이트 항공, 롤스로이스 ‘트렌트 XWB-84’ 탑재 에어버스 A350-900 15대 발주

    롤스로이스(Rolls-Royce)는 에미레이트 항공(Emirates)이 자사의 트렌트(Trent) XWB-84 엔진을 탑재한 A350-900기 15대를 발주했다고 밝혔다. 이로써 트렌트 XWB 제품군의 총 수주량은 130대로 증가했으며, 금번 수주분의 납품은 2025년부터 시작될 예정이다. ...
    Date2023.11.20 Bynewsit Views202
    Read More
  9. SAP 석세스팩터스, ‘SAP HR 커넥트 서울 2023’ 성료

    - 생성형 AI 코파일럿 ‘쥴(Joule)’ 적용으로 직원 경험 향상 및 HR 업무 생산성 강화 - 현대자동차그룹 싱가폴 글로벌 혁신센터, LG에너지솔루션, GC녹십자,㈜씨젠, 우미건설, 등 고객 사례 공개 - SAP 석세스팩터스 코리아 유저 그룹(Korea SAP SuccessFactor...
    Date2023.11.17 Bynewsit Views614
    Read More
  10. 마우저, FIRST 설립자 ‘딘 케이먼’과의 단독 인터뷰 공개

    - 마우저, 2014년부터 FIRST 후원, 2022년부터 2년 연속으로 FIRST 한국 대표팀 선발하는 KRC 후원 마우저 일렉트로닉스(Mouser Electronics)는 매년 수십만 명의 청소년들을 대상으로 과학, 기술, 공학 및 수학(STEM) 분야의 인재를 육성하고, 일상의 기술 발...
    Date2023.11.17 Bynewsit Views415
    Read More
  11. 벤큐, 2024 수능 대박 기원 스크린바 모니터 조명 시리즈 반짝 이벤트 진행

    - 벤큐 네이버 브랜드 스토어, 벤큐 온라인 자사몰 단독 진행 - 벤큐 스크린바, 스크린바 헤일로 1만원 할인 (11.17~11.23) 벤큐는 지난 16일 마무리된 2024 수능을 응원하는 마음으로 벤큐 아이케어 스크린바 시리즈 반짝 이벤트를 진행한다고 밝혔다. 2024 ...
    Date2023.11.17 Bynewsit Views230
    Read More
  12. 로지텍, 전국 이마트 및 일렉트로마트 127개 지점에서 ‘로지텍 G 럭키박스 이벤트’ 진행

    - 17일부터 전국 이마트 및 일렉트로마트 127개 지점에서 오프라인 이벤트 진행 - 럭키박스 당첨 시 최신 무선 게이밍 마우스 ‘PRO X SUPERLIGHT 2’를 얻을 수 있는 기회 제공 - 공식 페이스북 채널을 통해 럭키박스 구매 인증 시 추첨을 통해 30만원 상당의 ...
    Date2023.11.17 Bynewsit Views375
    Read More
  13. 델, AI 워크로드용 96코어 고성능 워크스테이션 「델 프리시전 7875 타워」 공개

    - 최대 96코어의 AMD 라이젠 스레드리퍼 프로 7900 WX 시리즈 프로세서를 탑재해 AI 워크로드 수행하는 강력한 성능과 확장성 제공 - 6개의 PCIe 슬롯을 지원해 강력한 멀티 GPU 역량을 지원하고 델 프리시전 타워형 제품 최초로 통합 Wi-Fi 슬롯 탑재 - TPM 2...
    Date2023.11.17 Bynewsit Views307
    Read More
  14. 엔비디아, MS 애저에서 생성형 AI 파운드리 서비스 제공

    - 기업 맞춤 생성형 AI 개발과 튜닝 강화하는 엔드 투 엔드 솔루션 제공 - SAP, 암독스, 게티 이미지 등 선두업체들, LLM 구축 위해 AI 파운드리 서비스 적극 활용 엔비디아가 마이크로소프트 애저(Microsoft Azure)에 AI 파운드리 서비스를 제공한다고 밝혔다...
    Date2023.11.16 Bynewsit Views594
    Read More
  15. [지스타 2023] 벤큐 모비우스, ‘지스타 2023’ 게이밍 모니터 협찬

    - 벤큐 모비우스 EX3210U/EX2710Q/EX270M 3종 후원 벤큐는 자사의 프리미엄 게이밍 모니터 브랜드 모비우스(MOBIUZ) 제품을 오는 16일부터 열리는 국제 게임 전시회 ‘지스타 2023’의 협력사 부스에 협찬 참여를 통해 선보인다고 밝혔다. 이번 전시에서 벤큐는 ...
    Date2023.11.16 Bynewsit Views241
    Read More
  16. 사피온, 데이터센터용 AI 반도체 ‘X330’ 출시…“4배 빨라진 추론 성능을 바탕으로 시장공략 본격화”

    - 기존 X220 대비 성능을 4배이상 향상시킨 추론용 AI반도체, 글로벌 탑티어 NPU성능 글로벌 AI 반도체 기업 사피온은 오늘, 전작 대비 속도가 4배 향상된 데이터센터용 AI반도체 ‘X330’ 을 출시한다고 밝혔다. X330은 TSMC의 7나노공정을 통해 생산된 제품이...
    Date2023.11.16 Bynewsit Views381
    Read More
  17. [지스타 2023] 삼성전자, 오디세이 게이밍 모니터 신제품 3종 체험존 구성

    삼성전자는 오디세이 모니터를 통해 16일부터 19일까지 나흘간 부산 벡스코에서 열리는 국내 최대 게임쇼 ‘지스타(G-STAR) 2023’에서 다양한 게임들을 경험할 수 있다고 밝혔다. 삼성전자는 게임 파트너사들과 함께 오디세이 체험존을 마련하고, 올해 출시한 ...
    Date2023.11.16 Bynewsit Views180
    Read More
  18. Arm, 업계 리더들과 협력 통해 미래의 AI 기반 구축

    인공지능(AI)의 확산은 하드웨어와 소프트웨어 혁신 간의 지속적인 조율에 달려 있다. 이러한 결합은 엣지에서 워크로드를 실행하는 가장 작은 센서부터 대형 언어 모델(LLMs) 학습을 위해 복잡한 워크로드를 처리하는 가장 큰 서버에 이르기까지 모든 기술의 ...
    Date2023.11.16 Bynewsit Views404
    Read More
  19. 어플라이드 머티어리얼즈 코리아, GPTW 선정 ‘2023-2024 밀레니얼이 가장 일하기 좋은 기업’ 수상

    - 지난 9월 ‘2023년 대한민국 일하기 좋은 일터’ 인증… 좋은 기업문화 입증 어플라이드 머티어리얼즈 코리아가 글로벌 신뢰경영 평가 기관 GPTW(Great Place to Work Institute) 선정 ‘2023-2024 밀레니얼이 가장 일하기 좋은 기업'을 수상했다. GPTW가 주관하...
    Date2023.11.16 Bynewsit Views357
    Read More
  20. 지멘스, ‘인사이트EDA’ 인수…“캘리버(Calibre) IC 신뢰성 검증 제품군 강화”  

    - 인사이트EDA 인수로 고객은 설계 신뢰성 검증 및 분석 능력을 IC 설계 업무 전반에 손쉽게 추가 가능 지멘스 EDA 사업부는 오늘, 인사이트 EDA(Insight EDA)를 인수 완료했다고 발표했다. 인사이트 EDA는 세계 유수의 IC 설계 팀들에 획기적인 회로 신뢰성 ...
    Date2023.11.16 Bynewsit Views376
    Read More
Board Pagination Prev 1 ... 158 159 160 161 162 163 164 165 166 167 ... 268 Next
/ 268
CLOSE