엔비디아, 최신 MLPerf 훈련에서 블랙웰 아키텍처로 획기적 성능 입증.jpg

 

 

 

아마존웹서비스(AWS)는 추론 모델과 에이전틱 AI 시스템(Agentic AI systems) 등 새로운 생성형 AI 발전을 가속화하기 위해, 엔비디아 그레이스 블랙웰 슈퍼칩으로 구동되는 P6e-GB200 울트라서버를 출시했다고 밝혔다.

 

P6e-GB200 울트라서버는 매우 크고 정교한 AI 모델의 훈련과 배포를 위해 설계되었으며, AWS는 올해 초 다양한 AI 및 고성능 컴퓨팅(HPC) 워크로드를 위해 엔비디아 블랙웰 GPU로 구동되는 P6-B200 인스턴스를 출시한 바 있다.

 

확장되는 AI 워크로드 컴퓨팅 수요 충족

P6e-GB200 울트라서버는 현재까지 AWS가 제공하는 가장 강력한 GPU 제품으로, 최대 72개의 엔비디아 블랙웰 GPU를 탑재하고, 5세대 엔비디아 NV링크를 통해 상호 연결된 단일 컴퓨팅 유닛으로 작동한다.

 

각 울트라서버는 360페타플롭스의 FP8 고밀도 컴퓨팅과 13.4TB의 고대역폭 GPU 메모리(HBM3e)를 제공한다. 이는 P5en 인스턴스와 비교하면 단일 NV링크 도메인에서 20배 이상의 컴퓨팅 성능과 11배 이상의 메모리를 제공하는 것이다. P6e-GB200 울트라서버는 4세대 일래스틱 패브릭 어댑터(EFAv4) 네트워킹으로 최대 초당 28.8테라비트(Tbps)의 통합 대역폭을 지원한다.

 

P6-B200 인스턴스는 다양한 AI 활용 사례에 유연하게 대응할 수 있는 옵션이다. 각 인스턴스는 NV링크로 상호 연결된 8개의 엔비디아 블랙웰 GPU1.4TB의 고대역폭 GPU 메모리, 최대 3.2TbpsEFAv4 네트워킹, 5세대 인텔 제온 스케일러블 프로세서를 제공한다. 또한, P6-B200 인스턴스는 P5en 인스턴스와 비교하여 최대 2.25배 향상된 GPU 테라플롭스(TFLOPs) 연산 성능, 1.27배의 GPU 메모리 크기, 1.6배의 GPU 메모리 대역폭을 제공한다.

 

 

구체적인 워크로드 요구사항과 아키텍처 요구사항에 따라 P6e-GB200P6-B200를 선택해야 한다. P6e-GB200 울트라서버는 조 단위 매개변수 규모의 프론티어 모델 훈련 및 배포와 같은 컴퓨팅 및 메모리 집약적인 AI 워크로드에 이상적이다. 엔비디아 GB200 NVL72 아키텍처는 이러한 규모에서 진정한 성능을 발휘한다.

 

72개의 GPU가 통합된 메모리 공간과 조정된 워크로드 분산을 통해 단일 시스템으로 작동할 때, 이 아키텍처는 GPU 노드 간 통신 오버헤드를 줄여 더 효율적인 분산 훈련을 시킬 수 있다.

 

추론 워크로드의 경우, 1조 개 파라미터 모델을 단일 NV링크 도메인 내에 완전히 포함할 수 있어 대규모 환경에서도 더 빠르고 일관된 응답 시간을 제공한다. 엔비디아 다이나모(Dynamo) 기반 분산 서빙 등의 최적화 기법과 결합될 때, GB200 NVL72 아키텍처의 대규모 도메인 크기는 전문가 혼합 모델 등 다양한 모델 아키텍처에서 추론 효율성을 제공한다. 특히 GB200 NVL72는 초대형 컨텍스트 윈도우를 처리하거나 실시간으로 높은 동시성 애플리케이션을 실행해야 할 때 강력한 성능을 발휘한다.

 

P6-B200 인스턴스는 광범위한 AI 워크로드를 지원하며 중대형 규모의 훈련 및 추론 워크로드에 이상적이다. 기존 GPU 워크로드를 이식하려는 경우, P6-B200 인스턴스는 코드 변경을 최소화하고 현재 세대 인스턴스로부터의 마이그레이션을 간소화하는 친숙한 8GPU 구성을 제공한다. 또한, 엔비디아의 AI 소프트웨어 스택이 Armx86 모두에 최적화되어 있지만, 워크로드가 x86 환경에 특별히 구축된 경우, 인텔 제온 프로세서를 사용하는 P6-B200 인스턴스가 이상적인 선택이다.

 엔비디아 NV링크 스위치.jpg

 

AWS의 핵심 역량을 기반으로 한 혁신

엔비디아 블랙웰을 AWS에 도입하는 것은 단일 기술적 돌파구에 관한 것이 아니라, 인프라의 여러 계층에 걸친 지속적인 혁신의 결과이다. 컴퓨팅, 네트워킹, 운영 및 관리형 서비스 전반에 걸친 수년간의 경험과 혁신을 바탕으로, AWS는 고객들이 AWS에서 기대하는 안정성과 성능과 함께 엔비디아 블랙웰의 모든 역량을 제공한다.

 

견고한 인스턴스 보안 및 안정성

고객들이 AWS를 선택해 GPU 워크로드를 운영하는 이유를 말할 때마다 공통적으로 언급되는 핵심 요소가 있다. 바로 클라우드 환경에서 인스턴스의 보안성과 안정성에 집중하는 AWS의 접근 방식이다.

 

AWS 니트로 시스템(AWS Nitro System) 전용 하드웨어, 소프트웨어 및 펌웨어는 AWS 직원을 포함한 누구도 고객의 민감한 AI 워크로드와 데이터에 접근할 수 없도록 엄격한 제한을 적용하도록 설계되었다. 보안 측면을 넘어, 니트로 시스템은 인프라를 유지, 관리하고 최적화하는 방식을 근본적으로 변화시킨다. 네트워킹, 스토리지 및 기타 I/O 기능을 처리하는 니트로 시스템은 운영 상태를 유지하면서 펌웨어 업데이트, 버그 수정, 최적화를 적용할 수 있도록 지원한다. 시스템 중단 없이 업데이트를 지원하는 '라이브 업데이트'는 중단이 곧 프로덕션 일정에 큰 영향을 미칠 수 있는 오늘날의 AI 환경에서 매우 중요한 요소다. P6e-GB200P6-B200 모두 6세대 니트로 시스템을 탑재하고 있지만, 이와 같은 보안 및 안정성 혜택을 제공하는 AWS의 혁신적인 니트로 아키텍처는 2017년부터 아마존 EC2 워크로드를 보호하고 최적화해 왔다.

 

대규모 환경에서의 안정적인 성능

AI 인프라의 과제는 단순히 대규모에 도달하는 것이 아니라, 그 규모에서 일관된 성능과 안정성을 제공하는 것이다. AWS3세대 EC2 울트라클러스터에 P6e-GB200 울트라서버를 배포하여, 이는 가장 큰 데이터 센터들을 포괄할 수 있는 단일 패브릭을 구현했다. 3세대 울트라클러스터는 전력 소모를 최대 40% 줄이고 케이블링 요구사항을 80% 이상 줄여 효율성을 높이는 동시에, 장애 가능성을 유발하는 요소들을 획기적으로 감소시킨다.

 

이러한 대규모 환경에서 일관된 성능을 제공하기 위해, AWSSRD(Scalable Reliable Datagram) 프로토콜을 사용하는 EFA를 활용한다. 여러 네트워크 경로를 지능적으로 활용해 트래픽을 분산시켜, 혼잡이나 장애 상황에서도 원활한 운영을 유지한다. 또한, AWS4세대에 걸쳐 EFA의 성능을 지속적으로 개선해 왔으며, EFAv4를 사용하는 P6e-GB200P6-B200 인스턴스는 EFAv3을 사용하는 P5en 인스턴스와 비교하여 분산 훈련에서 최대 18% 더 빠른 집합 통신 성능을 보여준다.

 

인프라 효율성

P6-B200 인스턴스는 검증된 공기 냉각 인프라를 사용하는 반면, P6e-GB200 울트라서버는 액체 냉각 방식을 사용하여 대규모 NV링크 도메인 아키텍처에서 더 높은 컴퓨팅 밀도를 가능하게 하고 더 높은 시스템 성능을 제공한다.

 

P6e-GB200은 새로운 기계식 냉각 솔루션을 적용한 액체 냉각 방식으로 설계되었다. 이 시스템은 신규 및 기존 데이터 센터 모두에서 칩 수준까지 냉각이 가능한 유연한 액체-(liquid-to-chip) 냉각 방식을 제공한다. 이를 통해 하나의 시설 내에서 액체 냉각 방식의 가속기와 공랭 방식의 네트워크 및 스토리지 인프라를 함께 운영할 수 있다. 이러한 유연한 냉각 설계를 통해 AWS는 최저 비용으로 최대 성능과 효율성을 제공할 수 있다.

 IRHX 리퀴드 냉각 시스템 내부.jpg

AWS에서 엔비디아 블랙웰 시작하기

AWS는 여러 배포 경로를 통해 P6e-GB200 울트라서버와 P6-B200 인스턴스를 간편하게 시작할 수 있도록 했으며, 조직에 가장 적합한 운영 모델을 유지하면서 블랙웰 GPU 사용을 신속하게 시작할 수 있다.

 

아마존 세이지메이커 하이퍼팟

AI 개발을 가속화하면서 인프라 및 클러스터 운영 관리에 소요되는 시간을 줄이고 싶다면, 아마존 세이지메이커 하이퍼팟이 탁월하다. 대규모 GPU 클러스터의 프로비저닝과 관리를 자동으로 처리하는 탄력적인 관리형 인프라를 제공한다. AWS는 예측 가능한 학습 일정 수립과 예산 내 운영을 지원하기 위해서 유연한 학습 계획 등 다양한 기능을 지속적으로 추가하며 세이지메이커 하이퍼팟을 고도화하고 있다.

 

세이지메이커 하이퍼팟은 P6e-GB200 울트라서버와 P6-B200 인스턴스 모두를 지원하며, 워크로드를 동일한 NV링크 도메인 내에 유지하여 최대 성능을 낼 수 있도록 최적화되어 있다. 또한, 포괄적인 다층 복구 시스템을 구축해 세이지메이커 하이퍼팟이 동일한 NV링크 도메인 내에서 오류가 발생한 인스턴스를 사전 구성된 예비 인스턴스로 자동 대체할 수 있도록 지원한다. 내장된 대시보드는 GPU 사용률과 메모리 사용량부터 워크로드 메트릭과 울트라서버 상태를 보여준다.

 

아마존 EKS(Amazon EKS)

대규모 AI 워크로드를 운영하면서 쿠버네티스(Kubernetes) 기반 인프라 관리를 선호한다면 아마존 EKS는 종종 선택되는 제어 플레인이다. AWS는 아마존 EKS의 기능을 지속적으로 확장하고 있으며, 온프레미스와 EC2 기반 GPU를 단일 클러스터에서 통합 관리할 수 있도록 지원하는 아마존 EKS 하이브리드 노드와 같은 기능을 통해 AI 워크로드의 유연성을 더욱 강화하고 있다.

 

아마존 EKSP6e-GB200 울트라서버와 P6-B200 인스턴스를 모두 지원하며, 관리형 노드 그룹을 통한 자동 프로비저닝과 수명 주기 관리 기능을 제공한다. P6e-GB200 울트라서버의 경우 GB200 NVL72 아키텍처를 인식하는 토폴로지 인식 기능을 적용해, 각 노드를 울트라서버 ID 및 네트워크 토폴로지 정보와 함께 자동으로 라벨링함으로써 최적의 워크로드 배치가 가능하도록 지원한다.

 

사용자는 노드 그룹을 여러 울트라서버에 걸쳐 구성하거나, 개별 울트라서버에 전용으로 할당하는 방식 중 선택할 수 있어 학습 인프라를 더욱 유연하게 구성할 수 있다. 또한, Amazon EKSGPU 및 가속기 오류를 모니터링하고, 해당 정보를 쿠버네티스 제어 플레인에 전달해 필요시 복구 조치를 수행할 수 있도록 지원한다.

 

AWS에 탑재된 엔비디아 DGX 클라우드

P6e-GB200 울트라서버는 엔비디아 DGX 클라우드(NVIDIA DGX Cloud)를 통해서도 제공될 예정이다. DGX 클라우드는 다중 노드 AI 훈련 및 추론 기능과 엔비디아의 완전한 AI 소프트웨어 스택을 기반으로, 모든 계층에서 최적화된 통합 AI 플랫폼이다. 사용자는 엔비디아의 최신 최적화 기술, 벤치마킹 레시피, 기술 전문성을 바탕으로 AI 효율성과 성능을 향상시킬 수 있다. 또한, 유연한 이용 기간 옵션과 엔비디아 전문가의 포괄적인 지원 및 서비스를 통해 AI 이니셔티브를 가속화할 수 있도록 지원한다.

 

 

#AWS#엔비디아#DGX#클라우드#GB200#블랙웰#AI#

 
?

  1. 레인보우로보틱스, 이동형 양팔로봇 ‘RB-Y1’ 미국 시장 공략 본격화

    - MIT·UC Berkeley 등 유수 기관 납품 완료… “AI 연구자 위한 최적화 플랫폼” 호평 레인보우로보틱스가 자사의 차세대 이동형 양팔로봇 ‘RB-Y1’을 앞세워 미국 시장 내 입지를 본격적으로 확대하고 있다. 미국 유수의 대학(MIT, UC Berkeley, 스탠포드, 조지아...
    Date2025.07.28 Bynewsit Views432
    Read More
  2. 티머니모빌리티, 인기 유튜브 웹예능 <네고왕> 통해 교통비 프로모션

    - 티머니모빌리티, 생활 밀착형 플랫폼 티머니GO로 휴가철 교통비 끝낸다 - 택시 13,000원, 고속/시외버스 3,000원, 렌터카/여행 각 10,000원 최대 36,000원 혜택! 여름 휴가철을 맞아 티머니모빌리티의 생활 밀착형 플랫폼, '티머니GO'가 풍성한 교통비 할인 ...
    Date2025.07.28 Bynewsit Views126
    Read More
  3. 스틸시리즈, 2025 T1 홈그라운드 부스 참가…“제품 체험 및 다양한 이벤트 진행”

    - T1 홈그라운드 참가하여 게이밍 기어 제품 체험 부스 운영 - 제품 현장 구매 최대 30% 할인 및 구매자 대상 굿즈 증정 및 경품 추첨 이벤트 진행 게이밍 기어 브랜드 스틸시리즈는 ‘LCK 로드쇼 2025 T1 홈그라운드’에 참가해 성황리에 제품 체험 부스를 선보...
    Date2025.07.28 Bynewsit Views130
    Read More
  4. 한국레노버, 초고성능 노트북 ‘리전 9i’ 국내 공식 출시…“안경 없이 3D 영상 구현”

    - 인텔 코어 울트라 9 275HX 프로세서최〮대 엔비디아 지포스 RTX 5090 탑재 - 초고사양 게임부터 AI 콘텐츠, 3D 렌더링까지 강력한 퍼포먼스 지원 - 안경 없이 입체 콘텐츠 구현…차세대 디스플레이 기술 ‘레노버 3D 스튜디오’ 옵션 선택 가능 - 항공 등급 탄...
    Date2025.07.28 Bynewsit Views154
    Read More
  5. 지엠디소프트, 민간 기업 최초 디지털 포렌식 3대 핵심 분야 'KOLAS 공인시험기관' 인정 획득

    디지털 포렌식 전문기업 지엠디소프트(GMDSOFT)가 국내 민간기업으로는 최초로 포렌식 3대 핵심 분야에서 한국인정기구(KOLAS) 공인시험기관 인정을 획득했다고 밝혔다. 인정 분야는 디스크 포렌식, 모바일 포렌식, 물리복구 포렌식으로 디지털 증거 분석의 주...
    Date2025.07.28 Bynewsit Views156
    Read More
  6. 가민, 오션캠퍼스와 함께 포항 방석리 해안서 바다 정화 활동 성료

    - ‘바다 정화 릴레이 캠페인’의 하나로 대만∙인도네시아 이어 국내서 해양 정화 활동 전개 - 스쿠버다이버, 프리다이버, 가민과 오션캠퍼스 임직원 등 총 15명 참여… 바다숲 복원 위한 정화 활동 펼쳐 가민이 지난 25일 비영리민간단체 오션캠퍼스와 함께 경북...
    Date2025.07.28 Bynewsit Views133
    Read More
  7. 레이저, 게이머용 무선 핫스왑 키보드 ‘블랙위도우 V4 텐키리스 하이퍼스피드’ 출시

    레이저(RAZER)에서 깔끔한 데스크 셋업을 위한 무선 핫스왑 키보드 ‘Razer BlackWidow V4 Tenkeyless HyperSpeed’를 신규 출시했다. 블랙위도우 V4 TKL 하이퍼스피드는 게임 성능과 커스터마이징을 중요시하는 게이머를 위해 제작됐다. 3세대 Razer 택타일 기...
    Date2025.07.25 Bynewsit Views139
    Read More
  8. 사이냅소프트, '공공정보화 리더스 포럼 2025'에서 HWP 문서 기반 RAG 활용 방안 제시

    - “같은 LLM, 다른 결과: 공공문서(HWP) 효과적으로 RAG에 활용하는 방법" 발표 - 현직 공공기관 정보화 담당자 200명 대상 온라인 세미나에서 높은 관심 사이냅소프트는 '2025 공공정보화 리더스 포럼'에 참여하여 "같은 LLM, 다른 결과: 공공문서(HWP) 효과...
    Date2025.07.25 Bynewsit Views502
    Read More
  9. 삼성전자, ‘갤럭시 Z 폴드7·Z 플립7’ 및 ‘갤럭시 워치8·워치8 클래식’ 국내 출시

    - 25일부터 국내 포함 미국, 영국 등 전 세계 110여 개국에 순차 출시 - 슬림 하드웨어 혁신 적용한 ‘갤럭시 Z 폴드7·Z 플립7’ 사전판매 흥행 - ‘갤럭시 워치8 시리즈’, 슬림 디자인으로 역대급 착용감 구현 삼성전자가 25일부터 슬림 하드웨어 혁신을 적용한 ...
    Date2025.07.25 Bynewsit Views143
    Read More
  10. HPE, 2025 데이터 서비스 이노베이션 데이 성료

    - HPE 가상화 VM 에센셜 기반 최신 SimpliVity 인프라, AI 시대 스토리지 운영 전략 공유 한국 HPE는 24일 서울 포시즌스 호텔에서 ‘2025 HPE 데이터 서비스 이노베이션 데이(2025 HPE Data services Innovation Day)’를 개최했다고 밝혔다. 올해로 3년차를 맞...
    Date2025.07.25 Bynewsit Views484
    Read More
  11. 마에스트로 포렌식, 정부 군정보 및 수사기관에 AI 디지털 포렌식 가속기 ‘마에스트로 위즈덤’ 공급

    - 국내 다수 정보기관과 군기관 등의 공공기관, 법무법인 및 포렌식 전문 기업 등을 고객사로 확보 - 마에스트로 위즈덤, 윈도우/맥/리눅스/모바일 기기에서 기존 대비 3배 이상 빠른 증거 식별과 분석으로 시간 단축 마에스트로 포렌식은 오늘 국내 다수 군 ...
    Date2025.07.25 Bynewsit Views135
    Read More
  12. 사이버다임, 보안 전문 기업 ‘팬타랩’ 인수합병 완료…“문서중앙화 핵심 기술 및 보안 역량 강화”

    - 데이터 손실 방지(DLP), 소스코드 보안, 웹 콘텐츠 보호(Web DLP) 등 핵심 기술 확보 - AI 시대 대비한 문서 보안 인프라 고도화 문서중앙화 솔루션 전문 기업 사이버다임이 보안 기술 기업 팬타랩과 합병 절차를 공식 완료하고 통합 법인의 본격적인 운영에...
    Date2025.07.25 Bynewsit Views133
    Read More
  13. 레이저, 게이밍에 최적화된 게이밍 마우스 ‘코브라 하이퍼스피드’ 출시

    게이머 라이프스타일 브랜드 레이저(RAZER)가 커스터마이징 가능한 경량 무선 마우스 ‘Razer Cobra HyperSpeed’를 신규 출시했다. 코브라 하이퍼스피드는 레이저 크로마(Razer Chroma) RGB와 블루투스 및 2.4Ghz 무선 연결을 지원하면서 극단적인 무게 경량화...
    Date2025.07.24 Bynewsit Views152
    Read More
  14. 대원씨티에스, ASUS Prime·Dual GeForce RTX 5050 OC 그래픽카드 2종 출시

    - 차세대 Blackwell 아키텍처 및 5세대 Tensor 코어 탑재 - 8GB GDDR6 @ 20Gbps, 2,560 CUDA 코어 기반 고성능 엔트리 라인업 - 트리플 Axial-tech 팬 2.5슬롯 Prime vs 듀얼 Axial-tech 팬 2슬롯 Dual - Dual BIOS 및 0dB 팬 스톱으로 정숙한 구동 환경 실현 ...
    Date2025.07.24 Bynewsit Views158
    Read More
  15. 삼성SDS, 2분기 매출 3조5120억원·영업이익 2302억원 잠정실적 발표

    삼성SDS는 2분기 매출액 3조5120억원, 영업이익 2302억원의 잠정실적을 발표했다. 전년 동기 대비 매출액과 영업이익이 4.2%씩 증가했다. IT 서비스 부문 매출액은 지난해 같은 기간 대비 5.8% 증가한 1조6784억원으로 집계됐으며, 클라우드 사업 매출액은 약 ...
    Date2025.07.24 Bynewsit Views503
    Read More
  16. 티머니, 한국의 전통 문양을 담은 외국인 관광객용 ‘티머니 트래블카드’ 출시

    - 전국 호환 교통카드 기능과 다양한 혜택 제공으로 대한민국 관광 활성화에 기여 - 편의점 및 인천국제공항 내 유인 버스 매표소에서 판매 티머니가 외국인 관광객의 편의를 높이고자 신제품 ‘티머니트래블카드’를 출시한다고 24일 밝혔다. 전통 문양을 담아 ...
    Date2025.07.24 Bynewsit Views149
    Read More
  17. ams OSRAM, 소 위장 신호를 감지하는 초소형 온도 센서 ‘AS6221’ 공급…“동물 복지 개선 기여”

    ams OSRAM은 젖소의 체내 건강 상태를 모니터링하여 체외에서 감지하기 어려운 건강 이상을 조기에 파악할 수 있도록 지원하는 초소형 온도 센서를 공급한다고 밝혔다. 이 센서는 smaXtec의 볼루스(bolus) 센서 안에 내장되어 가축의 생리적 변화를 조기에 감...
    Date2025.07.24 Bynewsit Views365
    Read More
  18. 테스토코리아, 여름철 식중독 예방을 위한 ‘식품용 온도계’ 신제품 3종 발표

    - testo 104-IR BT, 탐침형 온도 측정과 적외선 온도 측정 두 가지 기능을 탑재한 듀얼 온도계 - testo 110 FOOD, 다양한 프로브를 탈부착해 여러 환경에서 활용할 수 있는 다용성 온도계 - testo 270 BT, 정밀 센서와 블루투스 기능이 탑재된 식용유 산패 측...
    Date2025.07.24 Bynewsit Views489
    Read More
  19. 카테노이드, 콜러스에 AI 자막 기능 출시...“정확도 높은 자막 자동 생성으로 콘텐츠 전달력 강화”

    - 최신 STT 기반 고정밀 자막 자동 생성... 글로벌 상용 기술을 상회하는 정확도 - 오디오 기반 자동 자막 분할로 가독성·전달력 향상 - 12월까지 출시 기념 프로모션... 매월 600분 무료 자막 생성 카테노이드가 자사 온라인 비디오 플랫폼 ‘콜러스(Kollus)’...
    Date2025.07.24 Bynewsit Views433
    Read More
  20. 델, '델 프로 맥스' 모바일 워크스테이션 신제품 6종 공개…“RTX 프로 블랙웰 탑재”

    - 엔비디아 RTX 프로 블랙웰 GPU기반의 강력한 성능과 통일감 있고 프로페셔널한 외관 겸비 - ‘델 프로 맥스 14∙16 프리미엄’, 4K 탠덤 OLED 디스플레이 옵션 등 최고급 사양과 휴대성, 스타일까지 갖춘 최상위 고급형 워크스테이션 - ‘델 프로 맥스 16∙18 플...
    Date2025.07.24 Bynewsit Views173
    Read More
Board Pagination Prev 1 ... 40 41 42 43 44 45 46 47 48 49 ... 270 Next
/ 270
CLOSE