- GB300 NVL72, 호퍼 대비 메가와트당 처리량 최대 50배 향상저지연 환경 100만 토큰당 비용 35배 절감

 엔비디아, 블랙웰 울트라로 에이전틱 AI 추론 경쟁 본격화…성능 50배↑·토큰 비용 35배↓.jpg

 

 

 

엔비디아가 차세대 블랙웰 울트라 플랫폼을 공개하고 에이전틱 AI 추론 인프라 경쟁을 본격화했다. GB300 NVL72 시스템은 기존 호퍼 플랫폼 대비 메가와트당 처리량을 최대 50배 향상시키고, 저지연 환경에서 100만 토큰당 비용을 최대 35배 절감했다. 처리량과 토큰 비용을 동시에 낮추며 대규모 추론 환경의 총소유비용 구조를 크게 바꿨다.

 

에이전틱 AI 확산, 추론 인프라가 경쟁력 좌우

OpenRouter‘State of Inference’ 보고서에 따르면 AI 에이전트와 코딩 어시스턴트 확산으로 소프트웨어 프로그래밍 관련 AI 쿼리는 지난해 11%에서 약 50% 수준으로 급증했다. 다단계 워크플로 전반에서 실시간 반응성을 유지하려면 저지연 처리와 긴 컨텍스트 대응 역량이 필수 요건으로 자리 잡고 있다.

 엔비디아, 블랙웰 울트라로 에이전틱 AI 시대 가속… 성능 최대 50배↑·비용 35배↓.jpg

SemiAnalysis InferenceX 데이터는 블랙웰 울트라와 엔비디아 소프트웨어 최적화 기술의 결합이 성능과 비용을 동시에 개선했다고 분석했다. GB300 NVL72는 호퍼 대비 메가와트당 처리량을 최대 50배 향상시키고, 토큰당 비용을 최대 35배 절감했다. 총소유비용(TCO) 관점에서도 추론 워크로드의 경제성을 크게 높였다.

 

GB300 NVL72, 저지연 워크로드 성능 구조 개선

엔비디아 텐서RT-LLM, 다이나모, 문케이크, SGLang 등으로 구성된 공동 설계 소프트웨어 스택은 전문가 혼합(MoE) 추론 처리량을 전 구간에서 끌어올렸다. 최근 4개월 사이 저지연 워크로드 성능은 최대 5배 개선됐다.

 엔비디아 GB300 NVL72, 엔비디아 다이나모, 텐서RT-LLM 등으로 구성된 공동 설계 소프트웨어 스택은 엔비디아 호퍼 플랫폼 대비 토큰당 비용을 35배 절감한다.jpg

고성능 GPU 커널 최적화, NV링크 시메트릭 메모리, 프로그래매틱 디펜던트 런치 기술은 GPU 간 통신 효율을 높이고 유휴 시간을 줄였다. 칩과 시스템 아키텍처, 소프트웨어를 함께 설계하는 전략이 에너지 효율과 처리량을 동시에 끌어올렸다. 그 결과 GB300 NVL72는 지연 시간 전 구간에서 호퍼 대비 우수한 비용 구조를 구현했다.

 

긴 컨텍스트 환경에서 토큰 경제성 강화

GB300 NVL72128,000 토큰 입력과 8,000 토큰 출력을 처리하는 긴 컨텍스트 워크로드에서 강점을 보인다. GB200 NVL72 대비 토큰당 비용을 최대 1.5배 낮췄다. NVFP4 연산 성능은 1.5배 향상됐고 어텐션 처리 속도는 2배 빨라졌다. 대규모 코드베이스를 추론하는 에이전트 환경에서 처리 효율과 응답 속도를 동시에 확보할 수 있다.

 

 

클라우드 사업자, GB300 도입 확대

MS, 코어위브, OCI 등 주요 클라우드 사업자는 GB300 NVL72를 에이전틱 코딩과 긴 컨텍스트 활용 사례에 적용하고 있다. 토큰 비용을 낮추면서 대규모 코드베이스를 실시간으로 추론하는 환경을 구축하고 있다는 설명이다. 코어위브 첸 골드버그 엔지니어링 총괄 부사장은 긴 컨텍스트 처리 성능과 토큰 효율성이 AI 프로덕션 환경의 핵심 요소로 자리 잡았으며, GB300 시스템은 대규모 워크로드에서도 예측 가능한 성능과 비용 구조를 제공한다고 밝혔다.

 

차세대 루빈 플랫폼, 추가 도약 예고

엔비디아는 차세대 루빈(Rubin)’ 플랫폼을 통해 또 한 번의 성능 도약을 예고했다. 루빈은 6개의 신규 칩을 통합해 AI 슈퍼컴퓨터를 구성하며, MoE 추론에서 블랙웰 대비 메가와트당 최대 10배 높은 처리량과 100만 토큰당 10분의 1 수준 비용을 목표로 한다.

 

블랙웰 울트라와 루빈 플랫폼은 에이전틱 AI 시대에 필요한 대규모 추론 인프라 경쟁을 본격화하는 핵심 축으로 자리 잡을 전망이다.

 

#엔비디아 #BlackwellUltra #GB300NVL72 #에이전틱AI #AI추론 #MoE #TensorRTLLM #루빈

 

 
?

  1. 딥엘, 실시간 음성 번역 ‘보이스-투-보이스’ 공개…기업 협업용 AI 언어 플랫폼 확장

    - 회의·대화·고객응대 환경에서 음성→텍스트→음성 번역 지원 딥엘이 실시간 음성 커뮤니케이션을 위한 신규 번역 제품군 보이스-투-보이스(Voice-to-Voice)를 공개하며 회의와 대면 대화, 고객 응대 환경에서 음성을 텍스트로 변환하고 번역 결과를 다시 음성...
    Date2026.04.17 Bynewsit Views44
    Read More
  2. ST, 머신러닝 적용 모터 제어 SW ‘FP-IND-MCAI1’ 출시…FOC 기반 AI 모터 상태 진단 구현

    - 사전 학습 머신러닝 모델로 정상·고진동·불안정 상태 분류 지원 ST가 모터 제어 머신러닝 소프트웨어 팩 FP-IND-MCAI1을 출시하며 FOC 기반 BLDC 모터 제어와 진동 데이터 머신러닝 분석을 결합한 예지보전 개발 환경을 제공한다. 해당 소프트웨어는 EVLSPIN...
    Date2026.04.17 Bynewsit Views36
    Read More
  3. 카스퍼스키, 블루노로프 APT 분석 공개…화상회의·채용 위장 웹3 계정 탈취

    - 고스트콜(GhostCall)·고스트하이어(GhostHire) 캠페인 통해 지갑·클라우드·챗GPT(ChatGPT) 계정 동시 탈취 - 다단계 악성코드 체인과 생성형 AI 활용 공격 방식 확인 카스퍼스키가 북한 연계 해킹 그룹 블루노로프(BlueNoroff)의 가상자산 탈취 캠페인 고스...
    Date2026.04.16 Bynewsit Views62
    Read More
  4. 티오리, AI 오펜시브 보안 성과로 박세준 대표 행안부 장관표창 수상

    - 데프콘 CTF 9회 우승·AI 보안 기술 성과 인정 티오리 박세준 대표가 데프콘 CTF 9회 우승 성과와 AI 기반 오펜시브 보안 기술 공로를 인정받으며 제32회 정보통신망 정보보호 컨퍼런스(NetSec-KR 2026)에서 행정안전부 장관표창을 받았다. 제32회 정보통신망...
    Date2026.04.16 Bynewsit Views55
    Read More
  5. 클라우드플레어, 에이전트 클라우드 확장…다이내믹 워커스·씽크 기반 지속 실행 AI 에이전트 지원

    - 다이내믹 워커스·샌드박스·에이전트 SDK로 에이전트 실행 인프라 확장 - 깃(Git) 호환 스토리지 아티팩츠(Artifacts) 기반 대규모 에이전트 코드 관리 지원 클라우드플레어는 에이전트 SDK와 다이내믹 워커스 등이 포함된 에이전트 클라우드(Agent Cloud) 확...
    Date2026.04.15 Bynewsit Views46
    Read More
  6. 한국레노버, 미니멀 디자인 올인원 PC ‘AIO A105a’ 출시…홈 컴퓨팅 환경 최적화

    - 모니터·본체·스피커·카메라 일체형 설계로 공간 활용도 개선 - AMD 라이젠 10 시리즈 기반 멀티태스킹 성능 지원 - 23.8형 FHD 디스플레이와 다양한 연결성으로 활용 범위 확대 한국레노버가 모니터와 본체를 하나로 통합한 올인원 PC ‘AIO A105a’를 출시했...
    Date2026.04.15 Bynewsit Views50
    Read More
  7. ACM, 플래니터리 플랫폼 기반 반도체 공정 포트폴리오 구조 발표…고객 중심 제품 체계 강화

    - 8개 제품군 ‘에이트 플래닛’ 구조로 공정 단계별 포트폴리오 재편 - 전공정·패키징 전반 대응 통합 플랫폼 전략 제시 ACM 리서치가 반도체 및 첨단 웨이퍼 레벨 패키징(WLP) 공정 전반을 아우르는 ‘ACM 플래니터리 플랫폼(ACM Planetary Platform)’ 기반 공...
    Date2026.04.15 Bynewsit Views55
    Read More
  8. 어플라이드, 옹스트롬 로직 공정용 GAA 증착 시스템 발표…AI 반도체 전력 효율 향상

    - 프리시전 PECVD, STI 무결성 유지로 기생 커패시턴스 감소 - 트릴리움 ALD, 나노시트 메탈 게이트 스택 정밀 형성 지원 - 선도 파운드리·로직 제조사 2나노 이하 GAA 공정 적용 어플라이드 머티어리얼즈가 옹스트롬(Å) 시대 로직 칩을 위한 신규 증착 시스템...
    Date2026.04.14 Bynewsit Views58
    Read More
  9. 윈드리버, BAE 시스템즈 ‘파트너-투-윈’ 골드 티어 수상…방산 공급망 품질 역량 입증

    - 100% 정시 납기·품질 기준 충족으로 최고 등급 획득 - 미션 크리티컬 항공우주·방위 시스템 공급 역량 인정 윈드리버가 BAE 시스템즈 협력사 평가 프로그램 ‘파트너-투-윈(Partner 2 Win)’에서 골드 티어 어워드를 수상하며 2025년 전자시스템 공급망에서 정...
    Date2026.04.14 Bynewsit Views57
    Read More
  10. 솔트웨어, K-ISMS 기준 AWS 보안 점검 서비스 ‘SCR’ 업그레이드 출시…수분 내 점검 지원

    - AWS Config 기반 자동 점검으로 K-ISMS 취약점 보고서 제공 - 사전 절차 없이 수분 내 점검·개선 가이드 확인 가능 솔트웨어가 K-ISMS 기준에 특화된 AWS 보안 점검 서비스 SCR(Security Compliance Review) 업그레이드 버전을 출시했다. AWS Config 기반 자...
    Date2026.04.14 Bynewsit Views69
    Read More
  11. ST, 모션 제어용 고속 GaN 게이트 드라이버 출시…전력 효율·보호 기능 통합

    - STDRIVEG212·STDRIVEG612, 220V·600V 하이사이드 지원 - SmartSD 보호 기능·고속 전파 지연 특성으로 모션 제어 효율 개선 ST가 모션 제어와 전력 애플리케이션을 위한 고속 GaN 하프 브리지 게이트 드라이버 STDRIVEG212와 STDRIVEG612를 출시했다. GaN HEM...
    Date2026.04.14 Bynewsit Views56
    Read More
  12. 카스퍼스키, AI 캐리커처 열풍 속 개인정보 노출 위험 경고

    - 개인 맥락 정보 입력 과정에서 신원 사칭·사회공학 공격 가능성 증가 - 이미지 생성 과정에서 텍스트·행동 데이터까지 수집될 수 있어 주의 필요 카스퍼스키가 AI 캐리커처 생성 트렌드에서 개인 맥락 정보를 입력하는 과정이 신원 사칭과 사회공학 공격에 ...
    Date2026.04.14 Bynewsit Views59
    Read More
  13. 엔비디아, ‘네모트론 디벨로퍼 데이즈 서울 2026’ 첫 개최

    - 네모트론 오픈 모델 기반 소버린 AI 개발 전략 공유 - 기술 마스터클래스·48시간 해커톤·AI 에이전트 실습 프로그램 운영 엔비디아가 ‘네모트론 디벨로퍼 데이즈 서울 2026(NVIDIA Nemotron Developer Days Seoul 2026)’을 한국에서 처음 개최한다. 네모트론...
    Date2026.04.13 Bynewsit Views64
    Read More
  14. 로지텍, 앰배서더 프로그램 ‘로지텍 G 히어로즈’ 1기 모집

    - 제품 체험 기반 콘텐츠 제작 참여 프로그램 운영 - 어필리에이트·제품 지원·오프라인 이벤트 등 전용 혜택 제공 로지텍이 게이밍 기어 브랜드 로지텍 G 공식 앰배서더 프로그램 ‘로지텍 G 히어로즈’를 론칭하고 1기 참가자 모집을 시작했다. 제품 체험과 콘...
    Date2026.04.13 Bynewsit Views70
    Read More
  15. 마우저, 일상 속 AI 적용 사례 조명…EIT 기술 시리즈 공개

    - 소비가전·웨어러블·디지털 서비스 중심 AI 활용 사례 소개 - 엔지니어 관점에서 설계·적용 방법과 기술 과제 제시 마우저가 ‘일상 생활을 위한 AI 엔지니어링(Engineering AI for Daily Life)’을 주제로 함께 만드는 혁신(Empowering Innovation Together, E...
    Date2026.04.13 Bynewsit Views71
    Read More
  16. 코어시스템즈, 태양광 E-Ink 버스정보안내기 광명시 설치

    - 전자종이 기반 초저전력 구조로 외부 전력 없이 운영 - 무선 통신 기반 설치 방식으로 공사 부담 최소화 코어시스템즈가 광명시에 태양광 기반 E-Ink(전자종이) 버스정보안내기(BIT)를 설치하고 운영을 시작했다. 전자종이 디스플레이와 태양광 자가 발전 구...
    Date2026.04.13 Bynewsit Views41
    Read More
  17. 안랩, CPS 보안 플랫폼 ‘안랩 CPS 플러스’ 공개

    - OT 엔드포인트 보호 솔루션 ‘안랩 EPS’ 중심 CPS 보안 전략 소개 - 경량 설계 기반 구형 설비 보호 대응 제시 안랩이 Japan IT Week Spring 2026에서 CPS(사이버물리시스템) 보안 플랫폼 안랩 CPS 플러스와 OT 엔드포인트 보안 솔루션 안랩 EPS를 공개하고 O...
    Date2026.04.13 Bynewsit Views72
    Read More
  18. 레드햇, RHEL 14년 지원 ‘익스텐디드 라이프 사이클 프리미엄’ 출시

    - 단일 구독으로 장기 지원 체계 통합 - 금융·의료·공공 등 규제 산업 인프라 운영 기간 확대 레드햇이 레드햇 엔터프라이즈 리눅스 익스텐디드 라이프 사이클 프리미엄(Red Hat Enterprise Linux Extended Life Cycle Premium)을 출시하며 주요 레드햇 엔터프...
    Date2026.04.13 Bynewsit Views77
    Read More
  19. 그룹아이비, 북한 IT 인력 ‘AI 기반 가짜 신분 취업’ 캠페인 적발

    - 합성 신원과 생성형 AI 활용해 글로벌 기업 원격 채용 침투 시도 - 깃허브·프리랜서 플랫폼 기반 장기간 조직적 활동 확인 그룹아이비(Group-IB)가 북한(DPRK) 연계 IT 인력이 합성 신원(Synthetic Identity)과 생성형 AI 기반 입사 지원서를 활용해 글로벌 ...
    Date2026.04.13 Bynewsit Views81
    Read More
  20. 뉴타닉스, 멀티테넌트 클라우드 기능 확대… 파트너 서비스 경쟁력 지원

    - NCP 기반 멀티테넌트 IaaS 운영 환경 제공 - VM웨어 전환 지원 프로그램과 검증 서비스 체계 확대 뉴타닉스가 서비스 제공업체를 위한 멀티테넌시 기능과 마이그레이션 지원 프로그램을 발표하며 파트너 기반 클라우드 서비스 확장 전략을 강화했다. 멀티테...
    Date2026.04.13 Bynewsit Views61
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 289 Next
/ 289
CLOSE