- 최상위 컴퓨터 제조업체, 클라우드 서비스 제공업체, GPU 클라우드 제공업체와 협업

- 에이전틱에서 물리적 AI까지 광범위 추론 훈련 강화, 처리량 증가·응답 시간 단축·총소유비용 절감

- 새 개방형 다이나모 추론 소프트웨어 라이브러리로 추론 AI 서비스 확대

- 엔비디아 스펙트럼-X, 향상된 800G 이더넷 네트워킹으로 지연 시간·지터 크게 감소

 

엔비디아, AI 추론 시대 가속화 ‘블랙웰 울트라 AI 팩토리 플랫폼’ 공개.jpg

엔비디아가 GTC2025에서 AI 추론을 용이하게 하는 엔비디아 블랙웰 울트라(NVIDIA Blackwell Ultra)를 발표하고, 엔비디아 블랙웰 AI 팩토리 플랫폼의 차세대 버전이라고 밝혔다.

 

엔비디아 블랙웰 울트라는 추론 중 추가적인 계산을 할당해 정확도를 개선하는 기법인 테스트 타임 스케일링(TTS) 추론과 훈련을 강화한다. 이를 통해 AI 추론이나 에이전틱 AI(Agentic AI), 물리 AI와 같은 애플리케이션을 어디서나 가속할 수 있도록 한다.

 

블랙웰 울트라는 작년 소개된 혁신 기술인 블랙웰 아키텍처를 기반으로 한다. 또한, 엔비디아 GB300 NVL72 랙 스케일 솔루션과 엔비디아 HGX B300 NVL16 시스템을 포함한다. GB300 NVL72는 엔비디아 GB200 NVL72 대비 1.5배 뛰어난 AI 성능을 제공한다. 또한, 엔비디아 호퍼(Hopper) 기반으로 구축된 AI 팩토리에 비해 블랙웰의 수익 기회를 50배 증가시킨다.

 

엔비디아 CEO 젠슨 황은 “AI는 엄청난 도약을 이룩했다. 이제 추론과 에이전틱 AI가 훨씬 더 많은 컴퓨팅 성능을 요구하고 있다. 우리는 바로 이 순간을 위해 블랙웰 울트라를 설계했다. 이 다목적 플랫폼은 사전, 사후 훈련과 추론형 AI의 추론을 더욱 쉽고 효율적으로 만들어준다고 밝혔다.

 

엔비디아 블랙웰 울트라로 AI 추론 지원

엔비디아 GB300 NVL72는 블랙웰 울트라 GPU 72개와 Arm의 네오버스(Neoverse) 기반 엔비디아 그레이스(Grace) CPU 36개를 랙 스케일 디자인으로 연결했다. 이는 TTS용으로 구축된 거대한 단일 GPU로 작동한다. AI 모델들은 엔비디아 GB300 NVL72 플랫폼의 향상된 컴퓨팅에 액세스해 문제에 대한 다양한 솔루션을 탐색하고, 복잡한 요청을 여러 단계로 세분화해 보다 고품질의 응답을 얻을 수 있다.

 

GB300 NVL72는 또한 진화하는 워크로드를 위해 소프트웨어, 서비스, AI 전문 지식으로 성능을 최적화하는 선도적인 클라우드의 엔드 투 엔드 완전 관리형 AI 플랫폼인 엔비디아 DGX 클라우드(DGX Cloud)에서 사용 할 수 있다. DGX GB300 시스템이 탑재된 엔비디아 DGX SuperPODGB300 NVL72 랙 설계를 사용해 고객에게 턴키 AI 팩토리를 제공한다.

 

엔비디아 HGX B300 NVL16은 거대 언어 모델(LLM)에서 11배 빠른 추론, 7배 향상된 컴퓨팅, 4배 많은 메모리를 제공한다. 이를 통해 AI 추론처럼 가장 복잡한 워크로드에서도 획기적인 성능을 보여준다.

 

블랙웰 울트라 플랫폼은 에이전틱 AI와 물리 AI 같은 애플리케이션에 이상적이다.

 

최적의 성능을 위한 엔비디아 스케일 아웃 인프라

고급 스케일 아웃(Scale-out) 네트워킹은 최고의 성능을 제공하며 지연 시간(Latency)과 지터(Jitter)를 줄일 수 있는 AI 인프라의 중요한 구성 요소다.

 

블랙웰 울트라 시스템은 엔비디아 스펙트럼-X 이더넷(Spectrum-XEthernet)엔비디아 퀀텀-X800 인피니밴드(Quantum-X800 InfiniBand) 플랫폼과 원활히 통합된다. 이때 시스템 내 GPU800 Gb/s의 데이터 처리량을 제공하며, 엔비디아 커넥트X-8 슈퍼NIC(ConnectX-8 SuperNIC)로 연결된다. 이를 통해 동급 최고의 원격 직접 메모리 액세스 기능을 제공함으로써 AI 팩토리와 클라우드의 데이터센터가 병목 현상 없이 AI 추론 모델을 구동할 수 있도록 지원한다.

 

블랙웰 울트라 시스템에도 탑재된 엔비디아 블루필드-3(BlueField-3) DPU는 멀티 테넌트 네트워킹, GPU 컴퓨팅 탄력성, 데이터 액세스 가속화, 실시간 사이버보안 위협 탐지를 지원한다.

 

세계적 기술 선도업체, 블랙웰 울트라 도입

블랙웰 울트라 기반 제품은 2025년 하반기부터 파트너들을 통해 구매가 가능할 예정이다.

 

시스코(Cisco), 델 테크놀로지스(Dell Technologies), 휴렛 팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE), 레노버(Lenovo), 슈퍼마이크로(Supermicro) 에이브레스(Aivres), 애즈락랙(ASRock Rack), 에이수스(ASUS), 에비덴(Eviden), 폭스콘(Foxconn), 기가바이트(GIGABYTE), 인벤텍(Inventec), 페가트론(Pegatron), QCT, 위스트론(Wistron), 위윈(Wiwynn) 등의 기업이 블랙웰 울트라 기반의 다양한 제품들을 선보일 예정이다.

 

아울러 클라우드 서비스 제공업체인 아마존 웹 서비스(Amazon Web Services, AWS), 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure), 오라클 클라우드 인프라(Oracle Cloud Infrastructure)를 비롯해, GPU 클라우드 제공업체인 코어위브(CoreWeave), 크루소(Crusoe), 람다(Lambda), 네비우스(Nebius), 엔스케일(Nscale), 요타(Yotta), YTL이 블랙웰 울트라 기반 인스턴스를 가장 앞서 선보일 예정이다.

 

AI 병목 현상 줄이는 엔비디아 소프트웨어 혁신

엔비디아 블랙웰 제품 포트폴리오 전체는 풀스택 엔비디아 AI 플랫폼의 지원을 받는다. 오픈 소스 추론 프레임워크인 엔비디아 다이나모(Dynamo)는 추론형 AI 서비스를 강화해 처리량을 늘린다. 동시에 테스트 타임 컴퓨팅(Test-Time Compute)의 확장에 가장 효과적인 솔루션을 제공해 응답 시간과 모델 서빙 비용을 절감한다.

 

엔비디아 다이나모는 추론형 AI 모델을 배포하는 AI 팩토리의 토큰 수익 창출을 극대화하고자 고안된 AI 추론 서빙 소프트웨어다. 수천 개에 달하는 GPU에서 추론 통신을 조정, 가속한 뒤 분리 서빙 방식을 활용해 거대 언어 모델의 처리와 생성 단계들을 서로 다른 GPU에 나눠둔다. 이렇게 하면 각 단계에서 특별히 요구되는 사항에 맞춰 독립적 최적화가 가능하고, GPU 리소스 활용을 최대화할 수 있다.

 

블랙웰 시스템은 엔비디아 라마 네모트론 추론(Llama Nemotron Reason) 모델이나 엔비디아 AI-Q 블루프린트(Blueprint)를 실행하는 데 적합하며, 프로덕션급 AI를 위한 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼에서 지원된다. 엔비디아 AI 엔터프라이즈에는 엔비디아 NIM 마이크로서비스와 더불어 기업이 엔비디아 가속 클라우드, 데이터센터, 워크스테이션에 배포할 수 있는 AI 프레임워크, 라이브러리, 도구가 포함돼 있다.

 

블랙웰 플랫폼이 구축된 엔비디아의 에코시스템은 강력한 개발 도구와 엔비디아 쿠다-X(CUDA-X) 라이브러리, 6백만 명이 넘는 개발자, 수천 개의 GPU에서 성능을 확장해 나가는 4,000개 이상의 애플리케이션으로 구성돼 있다.

 

#GTC#2025#엔비디아#블랙웰울트라#AI#추론#GB300

 
?

  1. 포티넷코리아, ‘OT 시큐리티 서밋 코리아(OT Security Summit Korea)’ 개최

    - 2025년 4월 8일(화)부터 10일(목) 오후 2시, 온라인 통해 진행 포티넷 코리아는 4월 8일(화)부터 10일(목)까지 3일간 오후 2시에, 고객 및 사용자를 대상으로 ‘OT 시큐리티 서밋 코리아(OT Security Summit Korea)’ 디지털 컨퍼런스를 개최한다고 밝혔다. 최...
    Date2025.03.25 Bynewsit Views166
    Read More
  2. 한국레노버, 아이디어센터 타워 데스크탑 ‘AIO 27IRH9’ 출시…업무·엔터테인먼트 최적화

    - 아이디어센터 타워 AIO 27IRH9, 성능·디자인·지속가능성에 초점 - 인텔 코어 i5 13세대 프로세서 탑재...고사양 작업 지원 - 27인치 디스플레이, 100Hz 주사율·HDMI 포트 지원...높은 확장성 및 쾌적한 작업 환경 제공 한국레노버가 성능, 디자인, 지속 가능...
    Date2025.03.25 Bynewsit Views142
    Read More
  3. 위로보틱스, 윔 보행운동센터 오픈 1주년 기념 참여자 데이터 공개

    - 전국, 전 세계에서 찾는 국내 최초의 로봇 보행전문 운동센터 웨어러블 로봇 리딩기업 위로보틱스가 서울에 위치한 “윔 보행운동 센터”의 오픈 1주년을 기념해 참여자 데이터를 공개했다. 국내 최초 로봇 보행전문 운동센터인 윔 보행운동센터를 방문하여 웨...
    Date2025.03.25 Bynewsit Views715
    Read More
  4. 리미니스트리트, SAP ERP 유지 보수 서비스 ‘리미니 서포트’ KBS에 공급

    - SAP ERP 유지보수를 리미니스트리트로 전환하여, 비용 절감 및 맞춤형 지원 서비스 리미니스트리트는 오늘 대한민국 KBS가 IT 운영 효율화를 위해 자사의 3자 유지보수 서비스 ‘리미니 서포트(Rimini Support)’를 도입했다고 발표했다. KBS는 대한민국의 대...
    Date2025.03.25 Bynewsit Views642
    Read More
  5. [GTC 2025] 엔비디아, GH200·GB200 슈퍼칩 기반 쿠다-X 라이브러리로 과학·공학 혁신 가속

    - 컴퓨팅 엔지니어링 툴 최대 11배 가속, 최대 5배 큰 계산 수행 - CPU-GPU 리소스 간 통합과 조정 강화해 엔지니어링 시뮬레이션과 설계 최적화 가속 - 엔비디아 쿠퀀텀 라이브러리, 양자 컴퓨팅 프레임워크와 통합으로 시뮬레이션 성능 극대화 엔비디아는 GT...
    Date2025.03.24 Bynewsit Views488
    Read More
  6. MSI, RTX 50 시리즈 탑재 AI 고성능 게이밍 노트북 사전예약 이벤트

    - 최신 AI 기술과 초고성능 하드웨어로 완성된 게이밍 노트북, 특별 혜택까지! 엠에스아이코리아는 최신 엔비디아 지포스 RTX 50 시리즈 그래픽과 AMD 파이어 레인지 및 인텔 애로우레이크 프로세서를 탑재한 고성능 게이밍 노트북의 사전예약 판매를 시작한다...
    Date2025.03.24 Bynewsit Views180
    Read More
  7. 마우저, AI 및 임베디드 애플리케이션용 라즈베리 파이 ‘컴퓨트 모듈 5’ 공급

    마우저 일렉트로닉스는 라즈베리 파이의 새로운 컴퓨트 모듈5(CM5)를 공급한다고 밝혔다.CM5는 이전 모델과의 기계적 호환성을 유지하면서도 산업 요구사항을 직접 해결할 수 있도록 개선된 시스템모듈이다. 또한, AI와 머신 비전(ML), 산업 자동화, 스마트 홈...
    Date2025.03.24 Bynewsit Views219
    Read More
  8. 다쏘시스템코리아-IBCT, 버추얼 트윈과 디지털 제품 패스포트 결합해 글로벌 ESG 규제 대응 협력

    다쏘시스템코리아와 탈중앙화 ID(DID) 및 DID 기반 데이터 플랫폼 전문 기술기업 아이비씨티가 글로벌 ESG 규제 대응을 위한 혁신적 협력을 발표했다. 이번 전략적 업무협약(MOU)을 통해 양사는 기업이 ESG 규제를 준수하고 탄소 배출량을 효과적으로 분석·관...
    Date2025.03.24 Bynewsit Views454
    Read More
  9. 카스퍼스키, ‘보안사고 대응 분석 보고서 2024’ 발표…“장기간 지속되는 공격 급증”

    - 장기간 지속되는 공격 급증: 2024년 보안사고 중 35.2%가 1개월 이상 지속 카스퍼스키는 오늘 지난해 발생한 사이버 공격에 대해 자세히 분석한 연례 ‘보안사고 대응 분석 보고서(Kaspersky Incident Response Analyst Report) 2024’를 발표했다. 이 보고서...
    Date2025.03.24 Bynewsit Views123
    Read More
  10. 한국레노버, AMD 크라켄포인트 탑재 신제품 출시…“혁신적인 AI 기능으로 압도적 성능 제공”

    - 아이디어패드 슬림 5, AMD 라이젠 AI 7 350 프로세서 적용 - 레노버 자체 개발 AI 소프트웨어 ‘레노버 러닝 존’, 스마트한 학습 방식 지원 - 요가 슬림 7, 이동성휴〮대성내〮구성 모두 갖춘 고성능 노트북 - 한국레노버, 24일부터 사전 예약…선착순으로 ‘마...
    Date2025.03.24 Bynewsit Views174
    Read More
  11. [GTC 2025] 엔비디아, ‘RTX PRO 6000 블랙웰 서버 에디션’ 발표…“AI와 그래픽 융합 가속화”

    - 블랙웰 범용 데이터센터 GPU로 고성능 엔터프라이즈 워크로드 지원 - AI, 반도체, 생명과학 등 다양한 산업에서 워크로드 가속화 - 5월부터 시스템 파트너와 클라우드 제공업체 통해 출시 예정 엔비디아은 GTC 2025에서 엔비디아 RTX PRO 6000 블랙웰 서버 ...
    Date2025.03.21 Bynewsit Views459
    Read More
  12. [GTC 2025] 엔비디아, 세계 최대 프랜차이즈 ‘얌 브랜드’와 요식산업 혁신 가속

    - KFC, 타코벨, 피자헛 모회사 얌 브랜드, 엔비디아 AI 적용해 주문 간소화와 운영 최적화 실현 - 올해 최대 500개 이상 매장에 AI 솔루션 확대 적용으로 레스토랑 전반 서비스 향상 GTC 2025에서 엔비디아는 글로벌 외식기업 얌 브랜드(Yum! Brands)와 전략적...
    Date2025.03.21 Bynewsit Views508
    Read More
  13. 스트럭처, 스마트 퍼걸러(Pergola) 및 카바나(Cabana) 제품군 출시…“노르딕의 스레드 기반 매터 솔루션 이용”

    - 노르딕의 nRF5340 SoC를 채택해 스레드 기반 매터 연결 기능 지원 - 스트럭처+(StruXure+) 퍼걸러(Pergola)및 카바나(Cabana) 제품군 고급 퍼걸러(Pergola) 제조업체 스트럭처(StruXure)는 노르딕 세미컨덕터의 nRF5340 SoC를 채택해 미국 최초로 스레드 기...
    Date2025.03.21 Bynewsit Views293
    Read More
  14. 마우저, ADI의 광범위한 데이터 변환과 전력관리, 신호 컨디셔닝 솔루션 공급

    마우저 일렉트로닉스는 아나로그디바이스(ADI)의 최신 고성능 아날로그, 혼성신호 및 디지털 신호 프로세싱(DSP) IC를 지속적으로 확장 공급한다고 밝혔다. 마우저는 42,000개 이상의 재고 및 즉시 출고가 가능한 제품을 포함하여 70,000개 이상의 ADI 제품을 ...
    Date2025.03.21 Bynewsit Views302
    Read More
  15. MSI, 강력한 AI 성능과 높은 성능의 비즈니스 노트북 '벤처 프로' 출시

    - 인텔 코어 울트라 7 프로세서로 강력한 AI 성능 구현 - 엔비디아 지포스 RTX 4050 탑재로 전문가용 그래픽 성능 제공 - 2K OLED 패널 및 120Hz 주사율로 정확하고 선명한 비주얼 지원 엠에스아이코리아는 AI기반의 강력한 성능과 높은 생산성을 자랑하는 새...
    Date2025.03.20 Bynewsit Views154
    Read More
  16. [GTC 2025] 엔비디아, 대규모 데이터 분석 자동 가속화 ‘프로젝트 에테르’ 출시…“가속 아파치 스파크로 기업 비용 절감 입증”

    - 엔비디아 가속화 아파치 스파크로 수백만 달러 절약, 데이터센터 분석 워크로드 자동화 - 호주 최대 금융기관 CBA, 아파치 스파크용 래피즈 액셀러레이터로 63억 거래 5일만에 처리 엔비디아는 GTC2025에서 프로젝트 에테르(Project Aether)를 공개했다. 프...
    Date2025.03.20 Bynewsit Views558
    Read More
  17. 코보, 완전 통합형 저전력 SoC 「QM35825」 출시…“초광대역(UWB) 포트폴리오 확장”

    코보(Qorvo)는 완전 통합형 저전력 초광대역(UWB) 시스템온칩(SoC)을 출시함으로써 자사의 UWB 포트폴리오를 확장한다고 발표했다. 이 고성능, 초저전력 SoC는 레이더 기반 센싱을 활용한 정밀 위치 추적을 지원하여 존재 감지 자동화, 홈 액세스 보안, 비침습...
    Date2025.03.20 Bynewsit Views227
    Read More
  18. 안랩, 유명 증권사 사칭 악성 앱 주의보

    - 최근 금융 투자 열풍을 틈타 유명 증권사의 MTS로 위장한 악성 앱 유포 사례 확인 - 앱 회원가입을 빌미로 개인정보 입력 유도, 사용자가 입력한 정보 탈취 시도 최근 주식, 코인, 선물 등 금융 투자 열풍을 틈타 모바일 거래를 이용하는 투자자들을 노린 피...
    Date2025.03.20 Bynewsit Views123
    Read More
  19. 가트너, "AI 에이전트, 계정 탈취 시간 2년 내 50% 줄일 것”

    - AI 에이전트, 범죄 자동화로 2027년까지 사용자 계정 탈취(ATO) 시간 50% 줄일 것 - 다양한 방법으로 수집한 비밀번호를 자동화 봇을 통해 로그인… 다중 인증(MFA) 도입 시급 - ‘임원진 사칭’ 사회 공학 공격… 딥페이크와 같은 위조 현실 기술과 만나 심각성...
    Date2025.03.20 Bynewsit Views575
    Read More
  20. [GTC 2025] 엔비디아-오라클, 기업 에이전트 AI 추론 가속화 협력

    - 오라클 데이터베이스와 엔비디아 AI 기술 통합해 에이전트 AI 활용 가속화 - 데이터센터, 퍼블릭 클라우드, 엣지 등 다양한 환경에서 AI 배포 지원 - OCI AI 블루프린트, 노코드 배포 레시피 제공해 신속한 AI 워크로드 실행 지원 엔비디아가 GTC2025에서 전...
    Date2025.03.20 Bynewsit Views401
    Read More
Board Pagination Prev 1 ... 66 67 68 69 70 71 72 73 74 75 ... 268 Next
/ 268
CLOSE