- 베이스텐·딥인프라·파이어웍스 AI·투게더 AI, 블랙웰 최적화 스택으로 효율 극대화

 

엔비디아, 블랙웰 플랫폼으로 토큰당 비용 최대 10배 절감.jpg

엔비디아가 블랙웰 플랫폼을 통해 주요 추론 서비스 제공업체들이 토큰당 비용을 최대 10배까지 낮추고 있다고 밝혔다. 오픈소스 모델과 블랙웰 기반 최적화 추론 스택을 결합해 의료·게이밍·고객 서비스 전반에서 비용 효율을 끌어올리고 있다AI 기반 상호작용은 토큰단위로 작동한다. 기업이 더 많은 추론 요청을 처리하려면 동일 인프라에서 더 많은 토큰을 생성해야 한다. 엔비디아는 인프라와 알고리즘 효율 개선이 토큰 생산성을 높이고 결과적으로 토큰당 비용을 낮추는 핵심 요인이라고 설명했다.

 

 

추론 서비스 제공업체, 블랙웰 채택 확대

베이스텐, 딥인프라, 파이어웍스 AI, 투게더 AI는 블랙웰 기반 인프라로 전환하고 있다. 저정밀 NVFP4 형식과 TensorRT-LLM, 다이나모 추론 프레임워크를 결합해 처리량을 높이고 지연 시간을 줄였다. 엔비디아는 블랙웰이 호퍼 대비 달러당 처리량을 크게 개선해 토큰당 비용을 최대 10배까지 낮출 수 있다고 밝혔다.

 토큰 생산량이 인프라 비용을 초과하면 각 토큰의 가치는 하락한다.jpg

의료: 설리.ai, 추론 비용 90% 절감

설리.ai는 의료 코드 작성과 진료 기록 자동화를 위해 베이스텐의 모델 API를 활용해 블랙웰 GPU에서 오픈소스 모델을 운영하고 있다. 기존 폐쇄형 모델 대비 추론 비용을 10, 90% 줄였고 의료 기록 생성 워크플로우의 응답 시간을 65% 개선했다. 이를 통해 의료진의 행정 업무 부담을 낮추고 3천만 분 이상의 시간을 환원했다고 설명했다.

 설리.ai는 의료진을 위해 반복적인 업무를 처리하는 AI 직원을 개발한다.jpg

게이밍: 래티튜드, 토큰당 비용 4배 절감

래티튜드는 AI 던전과 보야지 플랫폼에서 블랙웰 기반 딥인프라 추론 플랫폼을 활용한다. MoE 모델 운영 비용을 호퍼 기준 100만 토큰당 20센트에서 5센트 수준까지 낮추며 토큰당 비용을 총 4배 절감했다. 높은 정확도를 유지하면서도 실시간 응답을 제공하는 구조다.

 래티튜드는 ‘AI 던전’이라는 텍스트 기반 어드벤처 스토리 게임을 개발했다.jpg

에이전틱 챗·고객 서비스도 비용 구조 개선

센티언트는 블랙웰 기반 파이어웍스 AI 추론 플랫폼을 적용해 호퍼 대비 25~50% 수준의 비용 효율 개선을 달성했다. 대규모 동시 사용자 환경에서도 낮은 지연을 유지했다.

 센티언트 챗은 복잡한 멀티 에이전트 워크플로우를 오케스트레이션하고, 커뮤니티에서 개발된 12개 이상의 특화된 AI 에이전트를 통합한다.jpg

데카곤은 투게더 AI와 협력해 블랙웰 GPU 기반 멀티모델 음성 스택을 운영한다. 추측 디코딩과 캐싱, 자동 확장 최적화를 통해 질의당 비용을 기존 폐쇄형 모델 대비 6배 절감하고 400ms 이하 응답을 구현했다.

 데카곤은 고객 지원을 위한 AI 에이전트를 구축하고 있으며, 음성 채널이 가장 까다로운 채널이다.jpg

GB200 NVL72·루빈으로 확장

엔비디아는 GB200 NVL72 시스템이 추론용 MoE 모델에서 호퍼 대비 토큰당 비용을 최대 10배까지 낮출 수 있다고 밝혔다. 이어 루빈 플랫폼은 6개 신규 칩을 단일 AI 슈퍼컴퓨터로 통합해 블랙웰 대비 최대 10배 성능 향상과 10배 비용 절감을 제공한다고 설명했다.

 

#엔비디아 #블랙웰 #GB200NVL72 #루빈 #AI추론 #토큰당비용 #TensorRTLLM #토크노믹스

 
?

  1. 사이냅소프트, 사이냅 OCR IX 분당 500장 처리… 금융·공공 대량 트래픽 대응 구조 공개

    - 처리 속도·정확도·보안 3요건 충족… 금융·공공 200건 레퍼런스로 현장 검증 도큐먼트 AI 전문 기업 사이냅소프트 전경헌 대표가 1월 출시한 ‘사이냅 OCR IX’의 구체적인 성능 수치를 공개하며 온프레미스 환경에서 처리 속도와 정확도, 보안을 동시에 충족하...
    Date2026.02.27 Bynewsit Views119
    Read More
  2. 티유브이 슈드 코리아, 하우엔지니어링웍스와 기능안전·A-SPICE 통합 지원… 차량 반도체 글로벌 대응 체계 구축

    - ISO 26262·A-SPICE 기반 기술 자문부터 인증까지 연계… 국내 기업 국제 표준 경쟁력 강화 전동화와 자율주행 확산으로 자동차 산업이 소프트웨어 중심 구조로 빠르게 이동하는 가운데, 기능안전과 개발 프로세스 역량이 글로벌 협업의 핵심 요건으로 자리 잡...
    Date2026.02.27 Bynewsit Views114
    Read More
  3. 가트너, 메모리 130% 급등… PC·스마트폰 시장 ‘출하 축소 기반 수익 방어’ 체제로 전환

    - 원가 비중 23%로 상승·저가 세그먼트 급격 위축… 2026년 상반기 가격 전략 분기점 가트너가 메모리 가격 급등 영향으로 2026년 글로벌 PC 출하량이 전년 대비 10.4%, 스마트폰 출하량은 8.4% 감소할 것으로 전망했다. 2026년 말까지 D램과 SSD 가격이 합산 ...
    Date2026.02.27 Bynewsit Views108
    Read More
  4. 한국리미니스트리트, ‘제24회 대한민국 일하기 좋은 기업’ 선정…GPTW 7개 부문 수상

    - 100대 기업 27위·부모가 일하기 좋은 기업 포함…존중·동료애·자부심 부문 우수 평가 한국리미니스트리트가 GPTW인스티튜트가 주관한 ‘제24회 대한민국 일하기 좋은 100대 기업’에 선정됐다고 밝혔다. 기업 부문과 개인 부문을 포함해 총 7개 부문에 이름을 ...
    Date2026.02.26 Bynewsit Views112
    Read More
  5. 시마AI, 스티가와 피지컬 AI 전략 파트너십 체결…로봇 잔디깎이에 엣지 AI 통합

    - 초저지연·저전력 MLSoC 기반 실시간 의사결정 구현…자율 정원 장비 아키텍처 확장 시마AI가 유럽 정원용 기계·장비 제조 기업 스티가와 전략적 파트너십을 체결하며, 로봇 잔디깎이에 피지컬 AI 기반 엣지 AI 솔루션을 통합한다고 밝혔다. 초저지연·저전력 M...
    Date2026.02.26 Bynewsit Views73
    Read More
  6. 그룹아이비, ‘클라우드 보안 상태 관리(CSPM)’ 솔루션 출시…URP에 클라우드 보안 상태 관리 통합

    - 설정 오류 자동 탐지·규정 준수 모니터링 제공…ASM·위협 인텔리전스 결합 그룹아이비가 통합 리스크 플랫폼(URP)에 ‘클라우드 보안 상태 관리(CSPM)’ 솔루션을 추가하며, 클라우드 환경 전반의 설정 오류 탐지와 규정 준수 모니터링 기능을 강화했다고 밝혔...
    Date2026.02.25 Bynewsit Views100
    Read More
  7. 세일즈포스, “AI 경쟁은 데이터 실행력”…84% 공감, 61%는 성과 연결 실패

    - 국내 기업 84% 데이터 기반이 핵심이라 인식…글로벌 CIO는 AI보다 데이터 인프라에 4배 투자 세일즈포스가 한국 기업 500곳을 포함한 전 세계 약 8,000개 기업을 조사한 ‘데이터 및 분석 현황 보고서(State of Data & Analytics)’를 발표하며, AI 성과를 가...
    Date2026.02.25 Bynewsit Views80
    Read More
  8. 슈나이더 일렉트릭 코리아, 산업 자동화·스마트 에너지·BESS 통합 인프라 공개…현장 지능형 구조로 전력 밀도 대응

    - 설비 제어부터 전력 보호·에너지 저장까지 하나의 운영 체계로 연결 - One Solution Provider 전략 본격화 슈나이더 일렉트릭 코리아가 산업 자동화와 스마트 에너지, BESS를 아우르는 현장 지능형 통합 인프라 포트폴리오를 공개하며, 설비 제어와 전력 인...
    Date2026.02.25 Bynewsit Views120
    Read More
  9. 플로우, 프로젝트 설계 ‘AI 에이전트’ 출시…기업용 협업을 실행 구조 중심으로 전환

    - 초기 기획 시간 80% 단축, 생산성·비용·보안 3대 과제 동시 대응 마드라스체크가 협업툴 ‘플로우’에 프로젝트 구조를 자동 설계하는 AI 에이전트를 출시하며, 기획 단계부터 개입하는 기업용 AI 협업 플랫폼 전략을 본격화했다. 기존 협업툴 AI는 회의록 요...
    Date2026.02.24 Bynewsit Views102
    Read More
  10. 스노우플레이크 코리아, ‘데이터 포 브렉퍼스트’ 개최…엔터프라이즈 AI 플랫폼 전략 공개

    - 3월 19일 앰배서더 서울 풀만서 열려, 글로벌 제품 총괄 방한 기조연설 스노우플레이크 코리아가 3월 19일 앰배서더 서울 풀만 호텔 그랜드볼룸에서 연례 컨퍼런스 ‘데이터 포 브렉퍼스트’를 개최하며, 기업의 AI 내재화를 지원하는 엔터프라이즈 데이터 플...
    Date2026.02.24 Bynewsit Views123
    Read More
목록
Board Pagination Prev 1 ... 6 7 8 9 10 11 12 13 14 15 ... 238 Next
/ 238
CLOSE