- 베이스텐·딥인프라·파이어웍스 AI·투게더 AI, 블랙웰 최적화 스택으로 효율 극대화

 

엔비디아, 블랙웰 플랫폼으로 토큰당 비용 최대 10배 절감.jpg

엔비디아가 블랙웰 플랫폼을 통해 주요 추론 서비스 제공업체들이 토큰당 비용을 최대 10배까지 낮추고 있다고 밝혔다. 오픈소스 모델과 블랙웰 기반 최적화 추론 스택을 결합해 의료·게이밍·고객 서비스 전반에서 비용 효율을 끌어올리고 있다AI 기반 상호작용은 토큰단위로 작동한다. 기업이 더 많은 추론 요청을 처리하려면 동일 인프라에서 더 많은 토큰을 생성해야 한다. 엔비디아는 인프라와 알고리즘 효율 개선이 토큰 생산성을 높이고 결과적으로 토큰당 비용을 낮추는 핵심 요인이라고 설명했다.

 

 

추론 서비스 제공업체, 블랙웰 채택 확대

베이스텐, 딥인프라, 파이어웍스 AI, 투게더 AI는 블랙웰 기반 인프라로 전환하고 있다. 저정밀 NVFP4 형식과 TensorRT-LLM, 다이나모 추론 프레임워크를 결합해 처리량을 높이고 지연 시간을 줄였다. 엔비디아는 블랙웰이 호퍼 대비 달러당 처리량을 크게 개선해 토큰당 비용을 최대 10배까지 낮출 수 있다고 밝혔다.

 토큰 생산량이 인프라 비용을 초과하면 각 토큰의 가치는 하락한다.jpg

의료: 설리.ai, 추론 비용 90% 절감

설리.ai는 의료 코드 작성과 진료 기록 자동화를 위해 베이스텐의 모델 API를 활용해 블랙웰 GPU에서 오픈소스 모델을 운영하고 있다. 기존 폐쇄형 모델 대비 추론 비용을 10, 90% 줄였고 의료 기록 생성 워크플로우의 응답 시간을 65% 개선했다. 이를 통해 의료진의 행정 업무 부담을 낮추고 3천만 분 이상의 시간을 환원했다고 설명했다.

 설리.ai는 의료진을 위해 반복적인 업무를 처리하는 AI 직원을 개발한다.jpg

게이밍: 래티튜드, 토큰당 비용 4배 절감

래티튜드는 AI 던전과 보야지 플랫폼에서 블랙웰 기반 딥인프라 추론 플랫폼을 활용한다. MoE 모델 운영 비용을 호퍼 기준 100만 토큰당 20센트에서 5센트 수준까지 낮추며 토큰당 비용을 총 4배 절감했다. 높은 정확도를 유지하면서도 실시간 응답을 제공하는 구조다.

 래티튜드는 ‘AI 던전’이라는 텍스트 기반 어드벤처 스토리 게임을 개발했다.jpg

에이전틱 챗·고객 서비스도 비용 구조 개선

센티언트는 블랙웰 기반 파이어웍스 AI 추론 플랫폼을 적용해 호퍼 대비 25~50% 수준의 비용 효율 개선을 달성했다. 대규모 동시 사용자 환경에서도 낮은 지연을 유지했다.

 센티언트 챗은 복잡한 멀티 에이전트 워크플로우를 오케스트레이션하고, 커뮤니티에서 개발된 12개 이상의 특화된 AI 에이전트를 통합한다.jpg

데카곤은 투게더 AI와 협력해 블랙웰 GPU 기반 멀티모델 음성 스택을 운영한다. 추측 디코딩과 캐싱, 자동 확장 최적화를 통해 질의당 비용을 기존 폐쇄형 모델 대비 6배 절감하고 400ms 이하 응답을 구현했다.

 데카곤은 고객 지원을 위한 AI 에이전트를 구축하고 있으며, 음성 채널이 가장 까다로운 채널이다.jpg

GB200 NVL72·루빈으로 확장

엔비디아는 GB200 NVL72 시스템이 추론용 MoE 모델에서 호퍼 대비 토큰당 비용을 최대 10배까지 낮출 수 있다고 밝혔다. 이어 루빈 플랫폼은 6개 신규 칩을 단일 AI 슈퍼컴퓨터로 통합해 블랙웰 대비 최대 10배 성능 향상과 10배 비용 절감을 제공한다고 설명했다.

 

#엔비디아 #블랙웰 #GB200NVL72 #루빈 #AI추론 #토큰당비용 #TensorRTLLM #토크노믹스

 
?

  1. 델 프라이빗 클라우드, 뉴타닉스 AHV 지원…멀티 하이퍼바이저 분리형 전략 확대

    - 서버·스토리지 독립 확장 구조에 자동화 전 주기 적용, 투자 보호와 유연성 동시 강화 델이 ‘델 프라이빗 클라우드’에서 뉴타닉스 AHV를 공식 지원하며 멀티 하이퍼바이저 전략을 강화했다. 서버와 스토리지를 분리한 확장형 인프라 구조에 자동화 기반 운영...
    Date2026.02.23 Bynewsit Views32
    Read More
  2. 삼성SDS, 2026년 5대 사이버 보안 위협 제시…AI 확산에 보안 대응 방식 전환 강조

    - IT·보안 관계자 667명 의견 반영, AI 기반 자동화 중심 보안 전략 강조 삼성SDS가 지난해 국내외 사이버 보안 이슈를 분석하고 국내 IT·보안 관계자 667명의 의견을 반영해 ‘2026년 5대 사이버 보안 위협’을 제시했다. AI 확산과 클라우드 전환이 빨라지면서...
    Date2026.02.23 Bynewsit Views46
    Read More
  3. 엔비디아, 최신 게임 3종에 DLSS 4 적용…4K서 최대 3.8배 프레임 향상

    - ‘스틱스: 블레이드 오브 그리드’·‘스타 트렉: 보이저’·‘노르스’ 지원…‘배틀필드 6: 시즌 2’도 멀티 프레임 생성 탑재 엔비디아가 최신 게임 3종에 DLSS 4를 적용하며 지포스 RTX 게이머를 위한 성능 최적화를 확대했다. DLSS 4 멀티 프레임 생성과 DLSS 슈퍼...
    Date2026.02.20 Bynewsit Views44
    Read More
  4. 엔비디아, 블랙웰로 추론 토큰 비용 최대 10배 절감…토크노믹스 전환 가속

    - 베이스텐·딥인프라·파이어웍스 AI·투게더 AI, 블랙웰 최적화 스택으로 효율 극대화 엔비디아가 블랙웰 플랫폼을 통해 주요 추론 서비스 제공업체들이 토큰당 비용을 최대 10배까지 낮추고 있다고 밝혔다. 오픈소스 모델과 블랙웰 기반 최적화 추론 스택을 결...
    Date2026.02.20 Bynewsit Views38
    Read More
  5. 엔비디아, 메타와 차세대 AI 인프라 공동 구축…CPU·블랙웰·루빈 GPU 통합 설계

    - 스펙트럼-X 네트워킹·컨피덴셜 컴퓨팅 결합…전력 대비 성능·프라이버시 강화 엔비디아가 메타와 온프레미스와 클라우드를 아우르는 차세대 AI 인프라 구축을 위한 장기 전략적 파트너십을 체결했다고 밝혔다. CPU, 블랙웰·루빈 GPU, 스펙트럼-X 이더넷을 통...
    Date2026.02.20 Bynewsit Views30
    Read More
  6. 카스퍼스키, 2026 동계 올림픽 겨냥 사이버 사기 경고…공식 채널 이용 강조

    - 가짜 티켓·위조 상품·불법 스트리밍 확산…개인정보 유출 주의 카스퍼스키가 2026 동계 올림픽 기간 발생할 수 있는 주요 사이버 사기 유형과 식별법을 소개했다고 밝혔다. 가짜 티켓 판매, 위조 상품 쇼핑몰, 불법 스트리밍 사이트가 확산되며 스포츠 팬을 ...
    Date2026.02.20 Bynewsit Views35
    Read More
  7. 가민, 아시아 연구자에 웨어러블 로우 데이터 개방…디지털 헬스 연구 생태계 확대

    - 핏로커와 ‘아시아 지역 연구사업’ 착수…11개국 연구자 3월 31일까지 모집 가민이 글로벌 헬스 데이터 플랫폼 핏로커와 협력해 ‘아시아 지역 연구사업’을 시작했다고 밝혔다. 웨어러블 기반 고해상도 생체 데이터를 연구 현장에 제공해 임상·스포츠과학 분야 ...
    Date2026.02.20 Bynewsit Views54
    Read More
  8. 마우저, 마이크로칩 PIC32WM-BZ6 멀티프로토콜 모듈 공급…IoT 통합 설계 지원

    - 128MHz Cortex-M4F 기반 통합 무선 모듈…RoT 보안·AEC-Q100 등급 1 인증 지원 마우저 일렉트로닉스가 마이크로칩 PIC32WM-BZ6 멀티프로토콜 모듈을 공급한다고 밝혔다. 블루투스 LE, 스레드, 매터를 단일 모듈에 통합하고 RF 프런트 엔드와 안테나까지 포함...
    Date2026.02.20 Bynewsit Views50
    Read More
  9. 노조미 네트웍스, 랜섬웨어 70% 영어권 집중…OT·IoT 보안 리스크 확대

    - 랜섬웨어 70% 영어권 집중…교통·공공 부문 공격 급증 노조미 네트웍스가 2025년 하반기 OT·IoT 사이버보안 동향 보고서를 발표하며, 전 세계 랜섬웨어 공격의 70%가 영어권 국가를 겨냥했다고 밝혔다. 미국·캐나다·영국을 중심으로 공격이 집중됐으며, 생성...
    Date2026.02.20 Bynewsit Views33
    Read More
  10. 마우저, 인피니언 AURIX TC4x MCU 공급…6코어 500MHz·5Gb 이더넷 지원

    - ADAS·전기 모빌리티·AI 대응, PCIe·CAN-XL·24MB 온칩 NVM 탑재 마우저 일렉트로닉스는 인피니언의 AURIX TC4x 32비트 트라이코어(TriCore) 마이크로컨트롤러(MCU)를 공급한다고 19일 밝혔다. 최대 6개의 500MHz 코어와 5기가비트 이더넷, PCIe 인터페이스를 ...
    Date2026.02.19 Bynewsit Views44
    Read More
  11. 머큐시스, 10Gbps 유선 환경 대응 ‘MA510E’ 출시

    - 기가비트 대비 10배 속도·Flow Control·WoL·EEE 지원, NAS·서버·크리에이터 환경 확장 머큐시스는 10기가비트 PCIe 네트워크 랜카드 ‘MA510E’를 출시했다고 19일 밝혔다. 최대 10Gbps 속도를 지원해 1Gbps 기가비트 환경에서 발생하는 대역폭 한계를 해소하...
    Date2026.02.19 Bynewsit Views36
    Read More
  12. 지멘스, HD현대 조선 플랫폼 디지털 백본 구축…2028년 운항 선박부터 적용

    - Siemens Xcelerator 기반 설계·생산 전 공정 단일 데이터 흐름 연결 지멘스는 HD현대 중간 지주회사 HD한국조선해양이 통합 디지털 조선 플랫폼 구축을 위한 우선 협력사로 지멘스를 선정했다고 19일 밝혔다. Siemens Xcelerator를 기반으로 설계부터 생산까...
    Date2026.02.19 Bynewsit Views47
    Read More
  13. 딥엘, AWS 마켓플레이스 입점…기업용 AI 번역 구매·운영 통합

    - 딥엘 API 제공·AWS FTR 통과, 보안·확장성 기반 도입 간소화 글로벌 언어 AI 기업 딥엘은 자사 언어 AI 솔루션을 AWS 마켓플레이스에 제공한다고 19일 밝혔다. 기업 고객은 AWS 환경에서 딥엘 API를 직접 구매·도입해 기존 IT 인프라에 통합 운영하고, 조달 ...
    Date2026.02.19 Bynewsit Views31
    Read More
  14. 벡터, 영역형 ECU·HPC 아키텍처 대응 ‘CANape 24’ 출시

    - ASAM CMP 지원·ADAS 실시간 검증·100GB 클라우드 로깅 강화 벡터코리아는 영역형 ECU(Zonal ECU)와 고성능 컴퓨터(HPC) 기반 차량 아키텍처 환경에서 고정밀 계측과 캘리브레이션, ADAS 실시간 검증을 지원하는 CANape 24를 출시했다고 19일 밝혔다. 중앙 집...
    Date2026.02.19 Bynewsit Views31
    Read More
  15. 델, 맥라렌 F1 설계부터 전략까지 AI로 재편

    - 설계·제조·레이스 운영 전 과정에 HPC·AI PC 적용 델과 맥라렌 레이싱과 기술 파트너십을 확대하고 F1 경기력 강화를 위해 AI 인프라와 PC 포트폴리오를 전면 적용한다고 19일 밝혔다. 데이터 처리 구조를 고도화해 차량 개발 속도와 전략 의사결정의 정밀도...
    Date2026.02.19 Bynewsit Views26
    Read More
  16. 어플라이드 머티어리얼즈, 2026년 1분기 매출 70억1000만달러…D램·서비스 사상 최대

    - GAAP EPS 2.54달러, 전년 대비 75% 증가…AI 투자 확대로 수익성 개선 어플라이드 머티어리얼즈가 회계연도 2026년 1분기 매출 70억1000만달러를 기록했다. 전년 동기 대비 2% 감소했지만, D램 매출과 서비스 부문은 사상 최대를 달성했다. AI 중심 반도체 투...
    Date2026.02.13 Bynewsit Views69
    Read More
  17. 레이저, ‘BlackShark V3 for Xbox White Edition’ 출시

    - 10ms 초저지연 무선·9.9mm 탈부착 마이크·멀티 플랫폼 지원 레이저가 콘솔 게이머를 위한 ‘BlackShark V3 for Xbox White Edition’을 출시하며, 10ms 수준 초저지연 무선 연결과 9.9mm 탈부착 마이크, 멀티 플랫폼 호환성을 강화했다고 밝혔다기존 e스포츠 ...
    Date2026.02.13 Bynewsit Views122
    Read More
  18. 어플라이드 머티어리얼즈, 50억 달러 ‘EPIC 센터’에 삼성전자 합류 발표

    - 첨단 노드 스케일링·차세대 메모리·초고도 3D 집적 공동 개발 - 미국 역대 최대 반도체 장비 R&D 투자…상용화 기간 수년 단축 목표 어플라이드 머티어리얼즈가 실리콘밸리에 건설 중인 50억 달러(약 6조원) 규모 EPIC 센터에 삼성전자가 합류한다고 발표했다...
    Date2026.02.13 Bynewsit Views82
    Read More
  19. 슈나이더 일렉트릭 코리아, ‘소프트웨어 정의 자동화’로 통합 포트폴리오 혁신 가속  

    - 설계–자동화–전력–운영 데이터 연결…AI 기반 통합 운영 체계 구현 슈나이더 일렉트릭 코리아가 AI·소프트웨어 기반 산업 자동화 전략을 강화하며, 설계부터 운영까지 연결하는 통합 포트폴리오를 본격 확대한다고 밝혔다. Optimize–Operate–Onboard 구조를 ...
    Date2026.02.13 Bynewsit Views95
    Read More
  20. Tapo, 태양광·4G LTE 결합 실외용 보안 카메라 ‘Tapo C615G KIT’ 출시

    - 와이파이·전원 공사 없이 설치… 태양광 충전·AI 감지·360° 회전 지원 타포가 태양광 충전과 4G LTE 연결을 지원하는 회전형 실외용 보안 카메라 ‘Tapo C615G KIT’를 국내에 출시하며, 인터넷과 전원 인프라 제약 없이 원격 모니터링 환경을 구축할 수 있다고...
    Date2026.02.12 Bynewsit Views169
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 278 Next
/ 278
CLOSE