- 최상위 컴퓨터 제조업체, 클라우드 서비스 제공업체, GPU 클라우드 제공업체와 협업

- 에이전틱에서 물리적 AI까지 광범위 추론 훈련 강화, 처리량 증가·응답 시간 단축·총소유비용 절감

- 새 개방형 다이나모 추론 소프트웨어 라이브러리로 추론 AI 서비스 확대

- 엔비디아 스펙트럼-X, 향상된 800G 이더넷 네트워킹으로 지연 시간·지터 크게 감소

 

엔비디아, AI 추론 시대 가속화 ‘블랙웰 울트라 AI 팩토리 플랫폼’ 공개.jpg

엔비디아가 GTC2025에서 AI 추론을 용이하게 하는 엔비디아 블랙웰 울트라(NVIDIA Blackwell Ultra)를 발표하고, 엔비디아 블랙웰 AI 팩토리 플랫폼의 차세대 버전이라고 밝혔다.

 

엔비디아 블랙웰 울트라는 추론 중 추가적인 계산을 할당해 정확도를 개선하는 기법인 테스트 타임 스케일링(TTS) 추론과 훈련을 강화한다. 이를 통해 AI 추론이나 에이전틱 AI(Agentic AI), 물리 AI와 같은 애플리케이션을 어디서나 가속할 수 있도록 한다.

 

블랙웰 울트라는 작년 소개된 혁신 기술인 블랙웰 아키텍처를 기반으로 한다. 또한, 엔비디아 GB300 NVL72 랙 스케일 솔루션과 엔비디아 HGX B300 NVL16 시스템을 포함한다. GB300 NVL72는 엔비디아 GB200 NVL72 대비 1.5배 뛰어난 AI 성능을 제공한다. 또한, 엔비디아 호퍼(Hopper) 기반으로 구축된 AI 팩토리에 비해 블랙웰의 수익 기회를 50배 증가시킨다.

 

엔비디아 CEO 젠슨 황은 “AI는 엄청난 도약을 이룩했다. 이제 추론과 에이전틱 AI가 훨씬 더 많은 컴퓨팅 성능을 요구하고 있다. 우리는 바로 이 순간을 위해 블랙웰 울트라를 설계했다. 이 다목적 플랫폼은 사전, 사후 훈련과 추론형 AI의 추론을 더욱 쉽고 효율적으로 만들어준다고 밝혔다.

 

엔비디아 블랙웰 울트라로 AI 추론 지원

엔비디아 GB300 NVL72는 블랙웰 울트라 GPU 72개와 Arm의 네오버스(Neoverse) 기반 엔비디아 그레이스(Grace) CPU 36개를 랙 스케일 디자인으로 연결했다. 이는 TTS용으로 구축된 거대한 단일 GPU로 작동한다. AI 모델들은 엔비디아 GB300 NVL72 플랫폼의 향상된 컴퓨팅에 액세스해 문제에 대한 다양한 솔루션을 탐색하고, 복잡한 요청을 여러 단계로 세분화해 보다 고품질의 응답을 얻을 수 있다.

 

GB300 NVL72는 또한 진화하는 워크로드를 위해 소프트웨어, 서비스, AI 전문 지식으로 성능을 최적화하는 선도적인 클라우드의 엔드 투 엔드 완전 관리형 AI 플랫폼인 엔비디아 DGX 클라우드(DGX Cloud)에서 사용 할 수 있다. DGX GB300 시스템이 탑재된 엔비디아 DGX SuperPODGB300 NVL72 랙 설계를 사용해 고객에게 턴키 AI 팩토리를 제공한다.

 

엔비디아 HGX B300 NVL16은 거대 언어 모델(LLM)에서 11배 빠른 추론, 7배 향상된 컴퓨팅, 4배 많은 메모리를 제공한다. 이를 통해 AI 추론처럼 가장 복잡한 워크로드에서도 획기적인 성능을 보여준다.

 

블랙웰 울트라 플랫폼은 에이전틱 AI와 물리 AI 같은 애플리케이션에 이상적이다.

 

최적의 성능을 위한 엔비디아 스케일 아웃 인프라

고급 스케일 아웃(Scale-out) 네트워킹은 최고의 성능을 제공하며 지연 시간(Latency)과 지터(Jitter)를 줄일 수 있는 AI 인프라의 중요한 구성 요소다.

 

블랙웰 울트라 시스템은 엔비디아 스펙트럼-X 이더넷(Spectrum-XEthernet)엔비디아 퀀텀-X800 인피니밴드(Quantum-X800 InfiniBand) 플랫폼과 원활히 통합된다. 이때 시스템 내 GPU800 Gb/s의 데이터 처리량을 제공하며, 엔비디아 커넥트X-8 슈퍼NIC(ConnectX-8 SuperNIC)로 연결된다. 이를 통해 동급 최고의 원격 직접 메모리 액세스 기능을 제공함으로써 AI 팩토리와 클라우드의 데이터센터가 병목 현상 없이 AI 추론 모델을 구동할 수 있도록 지원한다.

 

블랙웰 울트라 시스템에도 탑재된 엔비디아 블루필드-3(BlueField-3) DPU는 멀티 테넌트 네트워킹, GPU 컴퓨팅 탄력성, 데이터 액세스 가속화, 실시간 사이버보안 위협 탐지를 지원한다.

 

세계적 기술 선도업체, 블랙웰 울트라 도입

블랙웰 울트라 기반 제품은 2025년 하반기부터 파트너들을 통해 구매가 가능할 예정이다.

 

시스코(Cisco), 델 테크놀로지스(Dell Technologies), 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE), 레노버(Lenovo), 슈퍼마이크로(Supermicro) 에이브레스(Aivres), 애즈락랙(ASRock Rack), 에이수스(ASUS), 에비덴(Eviden), 폭스콘(Foxconn), 기가바이트(GIGABYTE), 인벤텍(Inventec), 페가트론(Pegatron), QCT, 위스트론(Wistron), 위윈(Wiwynn) 등의 기업이 블랙웰 울트라 기반의 다양한 제품들을 선보일 예정이다.

 

아울러 클라우드 서비스 제공업체인 아마존 웹 서비스(Amazon Web Services, AWS), 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure), 오라클 클라우드 인프라(Oracle Cloud Infrastructure)를 비롯해, GPU 클라우드 제공업체인 코어위브(CoreWeave), 크루소(Crusoe), 람다(Lambda), 네비우스(Nebius), 엔스케일(Nscale), 요타(Yotta), YTL이 블랙웰 울트라 기반 인스턴스를 가장 앞서 선보일 예정이다.

 

AI 병목 현상 줄이는 엔비디아 소프트웨어 혁신

엔비디아 블랙웰 제품 포트폴리오 전체는 풀스택 엔비디아 AI 플랫폼의 지원을 받는다. 오픈 소스 추론 프레임워크인 엔비디아 다이나모(Dynamo)는 추론형 AI 서비스를 강화해 처리량을 늘린다. 동시에 테스트 타임 컴퓨팅(Test-Time Compute)의 확장에 가장 효과적인 솔루션을 제공해 응답 시간과 모델 서빙 비용을 절감한다.

 

엔비디아 다이나모는 추론형 AI 모델을 배포하는 AI 팩토리의 토큰 수익 창출을 극대화하고자 고안된 AI 추론 서빙 소프트웨어다. 수천 개에 달하는 GPU에서 추론 통신을 조정, 가속한 뒤 분리 서빙 방식을 활용해 거대 언어 모델의 처리와 생성 단계들을 서로 다른 GPU에 나눠둔다. 이렇게 하면 각 단계에서 특별히 요구되는 사항에 맞춰 독립적 최적화가 가능하고, GPU 리소스 활용을 최대화할 수 있다.

 

블랙웰 시스템은 엔비디아 라마 네모트론 추론(Llama Nemotron Reason) 모델이나 엔비디아 AI-Q 블루프린트(Blueprint)를 실행하는 데 적합하며, 프로덕션급 AI를 위한 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼에서 지원된다. 엔비디아 AI 엔터프라이즈에는 엔비디아 NIM 마이크로서비스와 더불어 기업이 엔비디아 가속 클라우드, 데이터센터, 워크스테이션에 배포할 수 있는 AI 프레임워크, 라이브러리, 도구가 포함돼 있다.

 

블랙웰 플랫폼이 구축된 엔비디아의 에코시스템은 강력한 개발 도구와 엔비디아 쿠다-X(CUDA-X) 라이브러리, 6백만 명이 넘는 개발자, 수천 개의 GPU에서 성능을 확장해 나가는 4,000개 이상의 애플리케이션으로 구성돼 있다.

 

#GTC#2025#엔비디아#블랙웰울트라#AI#추론#GB300

 
?

  1. 사이냅소프트, 한국인터넷진흥협회 IT 전시회 참가…“공공 행정 혁신 솔루션 전시”

    - 단순 문서 처리 넘어 AI 기반 자동화까지... ‘디지털 플랫폼 정부’ 구현 앞당긴다 사이냅소프트는 지난 11일 군산새만금컨벤션센터에서 한국인터넷진흥협회 주최로 열린 IT전시회에 참가하여, 전국 지자체 정보화담당자를 대상으로 공공행정 효율화를 위한 A...
    Date2025.09.12 Bynewsit Views308
    Read More
  2. 레노버, 솔트룩스와 함께 HPC 공동 세미나 개최

    - AI ISV 솔트룩스와 공동으로 ‘Lenovo Tech Day - Smarter HPC for All’ 진행 - 레노버의 차세대 AI 인프라 전략 및 솔트룩스 초거대 언어모델 기반 AI 솔루션 ‘루시아 GPT’ 소개 레노버 글로벌 테크놀로지 코리아(ISG)는 11일, 시그니엘 서울에서 AI 전문기...
    Date2025.09.12 Bynewsit Views362
    Read More
  3. 가트너, “2029년까지 프리미엄 스마트폰 100% AI 기능 탑재… AI의 일상화”

    - 2025년 생성형 AI 스마트폰 최종 사용자 지출 2,982억 달러… 전체 AI 지출의 20% - 2026년 생성형 AI 스마트폰 최종 사용자 지출 32%, 출하량 51% 증가 예상 - NPU 확산으로 생성형 AI 스마트폰 성능 강화… 최적의 경험을 위한 수요 증가 전망 가트너는 전 ...
    Date2025.09.11 Bynewsit Views470
    Read More
  4. 세일포인트, ‘세일포인트 액셀러레이티드 애플리케이션 매니지먼트’ 발표…“대규모 인텔리전스 환경 관리 혁신”

    - 업계 최초 수백 종 애플리케이션을 인텔리전스를 적용해 체계적으로 관리할 수 있는 솔루션 발표 세일포인트는 기업의 애플리케이션 관리 방식을 혁신할 새로운 솔루션 ‘세일포인트 엑셀러레이티드 애플리케이션 매니지먼트(SailPoint Accelerated Applicati...
    Date2025.09.11 Bynewsit Views345
    Read More
  5. 세일즈포스, AI 에이전트 포함한 ‘하이퍼포스’ 지원 범위 확대…“에이젠틱 기업을 위한 통합 플랫폼 완성”

    - 차세대 인프라 ‘하이퍼포스’로 국내 데이터 레지던시 확보 지원, 신뢰 기반의 AI 혁신 인프라 마련 - 데이터 클라우드, 에이전트포스 등 핵심 솔루션 연계로 ‘AI 개발-활용 생애주기’ 지원 본격화 - 공공, 금융, 통신 등 핵심 산업군 정조준, ‘완전히 통합된...
    Date2025.09.11 Bynewsit Views350
    Read More
  6. 크리테오-구글, 온사이트 리테일 미디어 통합 발표

    - 브랜드 광고주, 구글 ‘서치 애즈 360’ 통해 크리테오 프리미엄 리테일 미디어 인벤토리 캠페인 확대 가능 - 리테일 부문 수요 촉진 및 실질적인 비즈니스 성장 지원 기대 크리테오가 구글과 온사이트 리테일 미디어를 통합한다고 밝혔다. 크리테오는 구글의 ...
    Date2025.09.11 Bynewsit Views279
    Read More
  7. 리미니스트리트, 일본의 정유사 이데미츠(Idemitsu)의 SAP ERP시스템 유지보수 계약 체결…“비용 절감과 디지털 전환 지원”

    - SAP용 리미니 서포트(Rimini Support for SAP) 전문성을 활용해 ECC 6.0 투자 전략 재정의, 추가 확보된 리소스를 경쟁 우위와 성장을 위한 DX 가속기로 전환 리미니스트리트(Rimini Street)는 오늘 일본 석유 제조 및 리테일 기업 이데미츠 코산(Idemitsu K...
    Date2025.09.10 Bynewsit Views295
    Read More
  8. 유클릭, 팔로알토 네트웍스와 파트너십 체결…“국내 기업 보안 혁신 가속화”

    - 국내 기업 고객에게 글로벌 수준의 다양한 보안 솔루션 및 통합 보안관제 서비스 제공 - AI 시대 사이버 위협 대응을 위한 차세대 보안 혁신 지원 AI 데이터 전문 기업 유클릭은 팔로알토 네트웍스(Palo Alto Networks)와 파트너십을 체결하고, 국내 기업 고...
    Date2025.09.10 Bynewsit Views302
    Read More
  9. 스노우플레이크 ‘데이터 드라이버 어워드’ 시상식 개최… AI 기반 비즈니스 혁신 사례 발굴

    - 앤서스랩코리아, ‘올해의 데이터 드라이버’ 선정… 데이터 운영 전략 개선으로 전체 비즈니스 성과 향상 - 힐링페이퍼·롯데쇼핑·넥슨 등 산업별 데이터 클라우드 활용 사례 다양화 - 롯데쇼핑, ‘데이터 분석 혁신’ 기업… 넥슨 이재면 팀장, ‘올해의 데이터 히...
    Date2025.09.10 Bynewsit Views381
    Read More
  10. 클루커스, 구글 클라우드 ‘디지털서비스 이용지원 시스템’등록완료…“공공기관 대상 생성형 AI 도입 제안 본격화”

    클라우드 전문기업 클루커스는 구글 클라우드 기반 서비스로 과학기술정보통신부의 ‘디지털서비스 이용지원시스템’ 등록을 완료했다고 오늘 밝혔다. 이번 등록은 구글 클라우드가 획득한 클라우드 보안 인증제도(CSAP) ‘하 등급’을 기반으로 진행되었으며, 이...
    Date2025.09.09 Bynewsit Views456
    Read More
목록
Board Pagination Prev 1 ... 41 42 43 44 45 46 47 48 49 50 ... 235 Next
/ 235
CLOSE