- FP8 양자화, 텐서RT 최적화로 VRAM 사용 40% 줄이고, 처리 속도 2배 향상

- 개발자용 RTX 전용 텐서RT SDK 출시경량화, JIT 컴파일 지원

 

엔비디아, 모델 양자화로 ‘스테이블 디퓨전 3.5’ 성능 대폭 향상.jpg

 

 

 

 

엔비디아가 양자화를 통해 스테이블 디퓨전 3.5(Stable Diffusion 3.5) 모델의 성능을 대폭 향상시켰다고 발표했다. 생성형 AI는 사람들이 디지털 콘텐츠를 만들고, 상상하며, 상호작용하는 방식을 혁신적으로 바꾸고 있다. 그러나 지속적으로 AI 모델의 기능이 향상되고 복잡성이 증가면서 더 많은 VRAM이 요구되고 있다. 예를 들어 기본 스테이블 디퓨전 3.5 라지(Large) 모델은 18GB 이상의 VRAM을 사용하므로 고성능 시스템이 아니면 실행이 어렵다.

 

하지만 이 모델에 양자화를 적용하면 중요하지 않은 레이어를 제거하거나 더 낮은 정밀도로도 실행할 수 있다. 엔비디아 지포스(GeForce) RTX 40 시리즈와 에이다 러브레이스(Ada Lovelace) 세대 엔비디아 RTX PRO GPU는 FP8 양자화를 지원해 이러한 경량화된 모델을 실행할 수 있다. 또한 최신 엔비디아 블랙웰(Blackwell) GPU는 FP4도 지원한다.

 

엔비디아는 스태빌리티 AI(Stability AI)와 협력해 최신 모델인 스테이블 디퓨전 3.5 라지를 FP8로 양자화해 VRAM 사용량을 40%까지 줄였다. 여기에 엔비디아 텐서RT(TensorRT) 소프트웨어 개발 키트(SDK)를 통한 최적화로 스테이블 디퓨전 3.5 라지와 미디엄 모델의 성능을 2배로 끌어올렸다.

 

또한, 텐서RT가 RTX AI PC 환경을 위해 새롭게 설계됐다. 업계 최고 수준의 성능과 JIT(Just-In-Time), 온디바이스 엔진 구축 기능을 더하고 패키지 크기를 8배 줄여 1억 대 이상의 RTX AI PC에 AI를 원활하게 배포할 수 있게 됐다. RTX용 텐서RT는 이제 개발자를 위한 독립형 SDK로 제공된다.

 

RTX 기반 AI 가속

엔비디아와 스태빌리티 AI는 세계에서 가장 인기 있는 AI 이미지 생성 모델 중 하나인 스테이블 디퓨전 3.5의 성능을 높이고 VRAM 요구 사항을 낮췄다. 엔비디아 텐서RT 가속과 양자화 기술을 통해, 사용자는 엔비디아 RTX GPU에서 이미지를 더 빠르고 효율적으로 생성하고 편집할 수 있다.

스테이블 디퓨전 3.5 FP8 양자화 모델(오)은 FP16 모델(왼)과 유사한 품질을 유지하면서 이미지 생성 시간을 절반으로 단축시킨다.jpg

스테이블 디퓨전 3.5 FP8 양자화 모델(오)은 FP16 모델(왼)과 유사한 품질을 유지하면서 이미지 생성 시간을 절반으로 단축시킨다.

프롬프트: 해 뜨는 고요한 산속 호수, 눈 덮인 봉우리를 반사하는 맑은 물, 호수를 따라 펼쳐진 울창한 소나무 숲, 부드러운 아침 안개, 사진처럼 사실적인 고화질의 생생한 색감

 

스테이블 디퓨전 3.5 라지의 VRAM 한계를 해결하기 위해 이 모델은 텐서RT를 활용해 FP8로 양자화됐다. 그 결과, VRAM 요구량이 40% 줄어 11GB면 충분해졌다. 즉, 단 한 대의 GPU가 아닌 다섯 대의 지포스 RTX 50 시리즈 GPU가 메모리에서 모델을 동시에 실행할 수 있게 됐다.

 

또한 스테이블 디퓨전 3.5 라지와 미디엄 모델은 텐서RT를 통해 최적화됐다. 텐서RT는 텐서 코어를 최대한 활용할 수 있도록 설계된 AI 백엔드로, 모델의 가중치와 모델 실행을 위한 명령 체계인 그래프를 RTX GPU에 맞게 최적화한다.

 

FP8 텐서RT는 스테이블 디퓨전 3.5 라지의 성능을 BF16 파이토치 대비 2.3배 향상시키면서 메모리 사용량은 40_ 줄여준다. 스테이블 디퓨전 3.5 미디엄의 경우, BF16 텐서RT는 BF16 파이토치 대비 1..jpg

FP8 텐서RT는 스테이블 디퓨전 3.5 라지의 성능을 BF16 파이토치 대비 2.3배 향상시키면서 메모리 사용량은 40% 줄여준다. 스테이블 디퓨전 3.5 미디엄의 경우, BF16 텐서RT는 BF16 파이토치 대비 1.7배 더 빠르다.

 

FP8 텐서RT를 적용한 결과, 스테이블 디퓨전 3.5 라지 모델은 BF16 파이토치(PyTorch)에서 실행했을 때보다 성능이 2.3배 향상됐고, 메모리 사용량은 40% 감소했다. 스테이블 디퓨전 3.5 미디엄 모델도 BF16 텐서RT를 통해 BF16 파이토치 대비 1.7배 더 높은 성능을 발휘했다.

 

이처럼 최적화된 모델은 현재 스태빌리티 AI의 허깅페이스(Hugging Face) 페이지에서 이용할 수 있다.

 

또한 엔비디아와 스태빌리티 AI는 스테이블 디퓨전 3.5 모델을 엔비디아 NIM 마이크로서비스 형태로도 출시할 계획이다. 이를 통해 크리에이터와 개발자는 다양한 애플리케이션에서 보다 쉽게 모델을 접근하고 배포할 수 있게 된다. 해당 NIM 마이크로서비스는 오는 7월 출시될 예정이다.

 

RTX용 텐서RT SDK 출시

엔비디아 RTX용 텐서RT가 독립형 SDK로 새롭게 제공된다. RTX용 텐서RT는 지난 마이크로소프트 빌드(Microsoft Build)에서 발표됐으며, 이미 새로운 윈도우 ML(Windows ML) 프레임워크의 일부로 프리뷰 버전으로 제공되고 있다.

 

기존에는 개발자가 각 GPU 클래스에 맞는 텐서RT 엔진을 미리 생성하고 패키징해야 했다. 이 과정은 GPU별 최적화가 가능하지만, 시간이 많이 소요되는 단점이 있었다. 그러나 새로운 버전의 텐서RT를 사용하면 개발자는 단 몇 초 만에 디바이스에 최적화되는 범용 텐서RT 엔진을 생성할 수 있다. 이 JIT 컴파일 방식은 소프트웨어 설치 시 또는 기능을 처음 사용할 때 백그라운드에서 실행된다.

 

새로운 SDK는 통합이 간편해지고, 이전 대비 8배 더 작아졌다. 이는 마이크로소프트의 새로운 AI 추론 백엔드인 윈도우 ML을 통해 쉽게 호출할 수 있다. 새로운 독립형 SDK는 엔비디아 개발자(NVIDIA Developer) 페이지에서 다운로드하거나, 윈도우 ML 프리뷰를 통해 테스트해볼 수 있다.

 

#엔비디아#RTX#FP8#스테이블디퓨전#

?

  1. 레인보우로보틱스, 이동형 양팔로봇 ‘RB-Y1’ 미국 시장 공략 본격화

    - MIT·UC Berkeley 등 유수 기관 납품 완료… “AI 연구자 위한 최적화 플랫폼” 호평 레인보우로보틱스가 자사의 차세대 이동형 양팔로봇 ‘RB-Y1’을 앞세워 미국 시장 내 입지를 본격적으로 확대하고 있다. 미국 유수의 대학(MIT, UC Berkeley, 스탠포드, 조지아...
    Date2025.07.28 Bynewsit Views495
    Read More
  2. 티머니모빌리티, 인기 유튜브 웹예능 <네고왕> 통해 교통비 프로모션

    - 티머니모빌리티, 생활 밀착형 플랫폼 티머니GO로 휴가철 교통비 끝낸다 - 택시 13,000원, 고속/시외버스 3,000원, 렌터카/여행 각 10,000원 최대 36,000원 혜택! 여름 휴가철을 맞아 티머니모빌리티의 생활 밀착형 플랫폼, '티머니GO'가 풍성한 교통비 할인 ...
    Date2025.07.28 Bynewsit Views155
    Read More
  3. 스틸시리즈, 2025 T1 홈그라운드 부스 참가…“제품 체험 및 다양한 이벤트 진행”

    - T1 홈그라운드 참가하여 게이밍 기어 제품 체험 부스 운영 - 제품 현장 구매 최대 30% 할인 및 구매자 대상 굿즈 증정 및 경품 추첨 이벤트 진행 게이밍 기어 브랜드 스틸시리즈는 ‘LCK 로드쇼 2025 T1 홈그라운드’에 참가해 성황리에 제품 체험 부스를 선보...
    Date2025.07.28 Bynewsit Views168
    Read More
  4. 한국레노버, 초고성능 노트북 ‘리전 9i’ 국내 공식 출시…“안경 없이 3D 영상 구현”

    - 인텔 코어 울트라 9 275HX 프로세서최〮대 엔비디아 지포스 RTX 5090 탑재 - 초고사양 게임부터 AI 콘텐츠, 3D 렌더링까지 강력한 퍼포먼스 지원 - 안경 없이 입체 콘텐츠 구현…차세대 디스플레이 기술 ‘레노버 3D 스튜디오’ 옵션 선택 가능 - 항공 등급 탄...
    Date2025.07.28 Bynewsit Views201
    Read More
  5. 지엠디소프트, 민간 기업 최초 디지털 포렌식 3대 핵심 분야 'KOLAS 공인시험기관' 인정 획득

    디지털 포렌식 전문기업 지엠디소프트(GMDSOFT)가 국내 민간기업으로는 최초로 포렌식 3대 핵심 분야에서 한국인정기구(KOLAS) 공인시험기관 인정을 획득했다고 밝혔다. 인정 분야는 디스크 포렌식, 모바일 포렌식, 물리복구 포렌식으로 디지털 증거 분석의 주...
    Date2025.07.28 Bynewsit Views191
    Read More
  6. 가민, 오션캠퍼스와 함께 포항 방석리 해안서 바다 정화 활동 성료

    - ‘바다 정화 릴레이 캠페인’의 하나로 대만∙인도네시아 이어 국내서 해양 정화 활동 전개 - 스쿠버다이버, 프리다이버, 가민과 오션캠퍼스 임직원 등 총 15명 참여… 바다숲 복원 위한 정화 활동 펼쳐 가민이 지난 25일 비영리민간단체 오션캠퍼스와 함께 경북...
    Date2025.07.28 Bynewsit Views180
    Read More
  7. 레이저, 게이머용 무선 핫스왑 키보드 ‘블랙위도우 V4 텐키리스 하이퍼스피드’ 출시

    레이저(RAZER)에서 깔끔한 데스크 셋업을 위한 무선 핫스왑 키보드 ‘Razer BlackWidow V4 Tenkeyless HyperSpeed’를 신규 출시했다. 블랙위도우 V4 TKL 하이퍼스피드는 게임 성능과 커스터마이징을 중요시하는 게이머를 위해 제작됐다. 3세대 Razer 택타일 기...
    Date2025.07.25 Bynewsit Views202
    Read More
  8. 사이냅소프트, '공공정보화 리더스 포럼 2025'에서 HWP 문서 기반 RAG 활용 방안 제시

    - “같은 LLM, 다른 결과: 공공문서(HWP) 효과적으로 RAG에 활용하는 방법" 발표 - 현직 공공기관 정보화 담당자 200명 대상 온라인 세미나에서 높은 관심 사이냅소프트는 '2025 공공정보화 리더스 포럼'에 참여하여 "같은 LLM, 다른 결과: 공공문서(HWP) 효과...
    Date2025.07.25 Bynewsit Views586
    Read More
  9. 삼성전자, ‘갤럭시 Z 폴드7·Z 플립7’ 및 ‘갤럭시 워치8·워치8 클래식’ 국내 출시

    - 25일부터 국내 포함 미국, 영국 등 전 세계 110여 개국에 순차 출시 - 슬림 하드웨어 혁신 적용한 ‘갤럭시 Z 폴드7·Z 플립7’ 사전판매 흥행 - ‘갤럭시 워치8 시리즈’, 슬림 디자인으로 역대급 착용감 구현 삼성전자가 25일부터 슬림 하드웨어 혁신을 적용한 ...
    Date2025.07.25 Bynewsit Views191
    Read More
  10. HPE, 2025 데이터 서비스 이노베이션 데이 성료

    - HPE 가상화 VM 에센셜 기반 최신 SimpliVity 인프라, AI 시대 스토리지 운영 전략 공유 한국 HPE는 24일 서울 포시즌스 호텔에서 ‘2025 HPE 데이터 서비스 이노베이션 데이(2025 HPE Data services Innovation Day)’를 개최했다고 밝혔다. 올해로 3년차를 맞...
    Date2025.07.25 Bynewsit Views545
    Read More
  11. 마에스트로 포렌식, 정부 군정보 및 수사기관에 AI 디지털 포렌식 가속기 ‘마에스트로 위즈덤’ 공급

    - 국내 다수 정보기관과 군기관 등의 공공기관, 법무법인 및 포렌식 전문 기업 등을 고객사로 확보 - 마에스트로 위즈덤, 윈도우/맥/리눅스/모바일 기기에서 기존 대비 3배 이상 빠른 증거 식별과 분석으로 시간 단축 마에스트로 포렌식은 오늘 국내 다수 군 ...
    Date2025.07.25 Bynewsit Views166
    Read More
  12. 사이버다임, 보안 전문 기업 ‘팬타랩’ 인수합병 완료…“문서중앙화 핵심 기술 및 보안 역량 강화”

    - 데이터 손실 방지(DLP), 소스코드 보안, 웹 콘텐츠 보호(Web DLP) 등 핵심 기술 확보 - AI 시대 대비한 문서 보안 인프라 고도화 문서중앙화 솔루션 전문 기업 사이버다임이 보안 기술 기업 팬타랩과 합병 절차를 공식 완료하고 통합 법인의 본격적인 운영에...
    Date2025.07.25 Bynewsit Views179
    Read More
  13. 레이저, 게이밍에 최적화된 게이밍 마우스 ‘코브라 하이퍼스피드’ 출시

    게이머 라이프스타일 브랜드 레이저(RAZER)가 커스터마이징 가능한 경량 무선 마우스 ‘Razer Cobra HyperSpeed’를 신규 출시했다. 코브라 하이퍼스피드는 레이저 크로마(Razer Chroma) RGB와 블루투스 및 2.4Ghz 무선 연결을 지원하면서 극단적인 무게 경량화...
    Date2025.07.24 Bynewsit Views195
    Read More
  14. 대원씨티에스, ASUS Prime·Dual GeForce RTX 5050 OC 그래픽카드 2종 출시

    - 차세대 Blackwell 아키텍처 및 5세대 Tensor 코어 탑재 - 8GB GDDR6 @ 20Gbps, 2,560 CUDA 코어 기반 고성능 엔트리 라인업 - 트리플 Axial-tech 팬 2.5슬롯 Prime vs 듀얼 Axial-tech 팬 2슬롯 Dual - Dual BIOS 및 0dB 팬 스톱으로 정숙한 구동 환경 실현 ...
    Date2025.07.24 Bynewsit Views183
    Read More
  15. 삼성SDS, 2분기 매출 3조5120억원·영업이익 2302억원 잠정실적 발표

    삼성SDS는 2분기 매출액 3조5120억원, 영업이익 2302억원의 잠정실적을 발표했다. 전년 동기 대비 매출액과 영업이익이 4.2%씩 증가했다. IT 서비스 부문 매출액은 지난해 같은 기간 대비 5.8% 증가한 1조6784억원으로 집계됐으며, 클라우드 사업 매출액은 약 ...
    Date2025.07.24 Bynewsit Views578
    Read More
  16. 티머니, 한국의 전통 문양을 담은 외국인 관광객용 ‘티머니 트래블카드’ 출시

    - 전국 호환 교통카드 기능과 다양한 혜택 제공으로 대한민국 관광 활성화에 기여 - 편의점 및 인천국제공항 내 유인 버스 매표소에서 판매 티머니가 외국인 관광객의 편의를 높이고자 신제품 ‘티머니트래블카드’를 출시한다고 24일 밝혔다. 전통 문양을 담아 ...
    Date2025.07.24 Bynewsit Views189
    Read More
  17. ams OSRAM, 소 위장 신호를 감지하는 초소형 온도 센서 ‘AS6221’ 공급…“동물 복지 개선 기여”

    ams OSRAM은 젖소의 체내 건강 상태를 모니터링하여 체외에서 감지하기 어려운 건강 이상을 조기에 파악할 수 있도록 지원하는 초소형 온도 센서를 공급한다고 밝혔다. 이 센서는 smaXtec의 볼루스(bolus) 센서 안에 내장되어 가축의 생리적 변화를 조기에 감...
    Date2025.07.24 Bynewsit Views419
    Read More
  18. 테스토코리아, 여름철 식중독 예방을 위한 ‘식품용 온도계’ 신제품 3종 발표

    - testo 104-IR BT, 탐침형 온도 측정과 적외선 온도 측정 두 가지 기능을 탑재한 듀얼 온도계 - testo 110 FOOD, 다양한 프로브를 탈부착해 여러 환경에서 활용할 수 있는 다용성 온도계 - testo 270 BT, 정밀 센서와 블루투스 기능이 탑재된 식용유 산패 측...
    Date2025.07.24 Bynewsit Views539
    Read More
  19. 카테노이드, 콜러스에 AI 자막 기능 출시...“정확도 높은 자막 자동 생성으로 콘텐츠 전달력 강화”

    - 최신 STT 기반 고정밀 자막 자동 생성... 글로벌 상용 기술을 상회하는 정확도 - 오디오 기반 자동 자막 분할로 가독성·전달력 향상 - 12월까지 출시 기념 프로모션... 매월 600분 무료 자막 생성 카테노이드가 자사 온라인 비디오 플랫폼 ‘콜러스(Kollus)’...
    Date2025.07.24 Bynewsit Views492
    Read More
  20. 델, '델 프로 맥스' 모바일 워크스테이션 신제품 6종 공개…“RTX 프로 블랙웰 탑재”

    - 엔비디아 RTX 프로 블랙웰 GPU기반의 강력한 성능과 통일감 있고 프로페셔널한 외관 겸비 - ‘델 프로 맥스 14∙16 프리미엄’, 4K 탠덤 OLED 디스플레이 옵션 등 최고급 사양과 휴대성, 스타일까지 갖춘 최상위 고급형 워크스테이션 - ‘델 프로 맥스 16∙18 플...
    Date2025.07.24 Bynewsit Views207
    Read More
Board Pagination Prev 1 ... 58 59 60 61 62 63 64 65 66 67 ... 288 Next
/ 288
CLOSE