- 알리바바 클라우드, 140(14B)·13(1.3B) 매개변수 버전의 영상 생성 모델 ‘Wan2.1’ 오픈소스로 전격 공개

- ‘Wan2.1’, VBench리더보스에서 1위 기록상위 5개 모델 중 유일한 오픈소스 영상 생성 모델

 

Qwen으로 생성된 AI 이미지.png

 

 

알리바바 클라우드가 오픈소스 커뮤니티 활성화를 위한 최신 조치의 일환으로 AI 기반 영상 생성 모델을 오픈소스로 무료 공개한다고 25일 발표했다.

 

알리바바 클라우드는 비디오 파운데이션 모델 ‘Tongyi Wanxiang(통이 완샹)’의 최신 버전인 Wan2.1 시리즈 중 140(14B) 13(1.3B) 매개변수 모델 4종을 오픈소스로 공개하며, AI 기술의 개방성과 확장성을 더욱 강화해 나갈 계획이다.

 

이번에 공개된 모델은 T2V-14B, T2V-1.3B, I2V-14B-720P, I2V-14B-480P 4종으로, 텍스트 및 이미지 입력을 기반으로 고품질 이미지와 영상을 생성하도록 설계됐다. 해당 모델들은 알리바바 클라우드의 AI 모델 커뮤니티인 모델스코프(ModelScope)’와 협업형 AI 플랫폼 허깅페이스(Hugging Face)’에서 다운로드 가능하며, 전 세계 학계 연구자 및 기업들이 자유롭게 활용할 수 있도록 공개됐다.

 

올해 초 공개된 Wan2.1 시리즈는 중국어와 영어에서 텍스트 효과를 지원하는 최초의 AI 영상 생성 모델로 복잡한 움직임을 정밀하게 처리하고, 픽셀 품질을 향상시키며, 물리적 원칙을 준수하며, 명령 실행 정확도를 최적화하는 등 사실적인 영상 생성 능력에서 강점을 발휘한다.

 

이처럼 뛰어난 명령 수행 정밀도 덕분에 Wan2.1은 영상 생성 모델의 종합 벤치마크인 VBench리더보드에서 1위를 기록했다. 또한, 허깅페이스의 VBench 리더보드 상위 5개 모델 중 유일한 오픈소스 영상 생성 모델로 자리매김하며 글로벌 AI 커뮤니티에서 그 기술력을 입증하고 있다.

 

VBench에 따르면, Wan2.1 시리즈는 종합 점수 86.22%를 기록하며, 움직임의 자연스러움, 공간적 관계, 색상 표현, 다중 객체 상호작용 등 핵심 평가 항목에서 최고 수준의 성능을 입증했다.

 

[참고 사진] Wan2.1 시리즈가 종합 점수 86.22_를 기록하며 핵심 평가 항목에서 최고 수준의 성능을 입증했다.jpg

영상 생성 AI 모델을 훈련하려면 막대한 컴퓨팅 자원과 대량의 고품질 학습 데이터가 필수적이다. 이러한 모델을 오픈소스로 개방하면 AI 활용의 장벽을 낮출 수 있으며, 기업들은 보다 효율적이고 경제적인 방식으로 자사 비즈니스에 최적화된 고품질 영상 콘텐츠를 제작할 수 있다.

T2V-14B 모델은 복잡한 동작이 포함된 고품질 영상 생성에 최적화되어 있으며, T2V-1.3B 모델은 생성 품질과 연산 효율성의 균형을 맞춰 연구 및 2차 개발 작업을 진행하는 다양한 개발자들에게 이상적인 솔루션을 제공한다. 예를 들어, T2V-1.3B 모델은 일반적인 개인용 노트북에서도 480p 해상도의 5초 길이 영상을 약 4분 만에 생성할 수 있어, 연구자 및 개발자들이 보다 쉽고 효율적으로 이를 활용할 수 있도록 지원한다.

 

또한, I2V-14B-720P I2V-14B-480P 모델은 텍스트 기반 영상 생성뿐만 아니라 이미지 기반 영상 생성 기능까지 지원한다. 사용자는 한 장의 이미지와 간단한 텍스트 설명만 입력하면 역동적인 영상 콘텐츠를 손쉽게 제작할 수 있으며, 플랫폼은 특정 크기에 제한 없이, 다양한 해상도의 이미지를 정상적으로 입력받아 처리할 수 있도록 설계됐다.

 

한편, 알리바바 클라우드는 AI 모델을 오픈소스로 공개한 최초의 글로벌 테크 기업 중 하나로, 20238월 자체 개발한 대규모 AI 모델 'Qwen(Qwen-7B)'을 첫 공개했다. 이후 큐원 시리즈는 허깅페이스의 오픈 LLM 리더보드에서 지속적으로 최상위권을 유지하며, 다양한 벤치마크에서 글로벌 최고 수준의 AI 모델과 어깨를 나란히 하는 성능을 입증하고 있다.

현재까지 허깅페이스에서 큐원 모델을 기반으로 개발된 파생 모델이 10만 개를 돌파, 전 세계에서 가장 규모가 큰 AI 모델군 중 하나로 자리매김하고 있다.

 

#알리바바클라우드#AI#Qwen#LLM

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
3906 델, ‘델 프로 플러스’ 업무용 모니터 및 QHD 게이밍 모니터 신제품 6종 공개   file newsit 2025.03.14 173
3905 ASUS, 인텔 Xeon 6 서버 라인업 공개 file newsit 2025.03.13 151
3904 윈드리버, 클라우드 인프라 솔루션 ‘윈드리버 스튜디오 오퍼레이터’ 출시 file newsit 2025.03.13 400
3903 실리콘랩스, BG29 무선 SoC 신제품 발표…“초소형 디바이스용 블루투스 LE의 미래 선도” file newsit 2025.03.13 283
3902 MSI, ‘지포스 RTX 5080/5070 벤투스 화이트’ 출시 file newsit 2025.03.13 162
3901 티피링크, <SECON 2025> 참가…“차세대 통합 보안 감시 솔루션 공개” file newsit 2025.03.13 126
3900 TI, 세계에서 가장 작은 MCU 출시…“초소형 애플리케이션에서 혁신 실현” file newsit 2025.03.13 231
3899 티맥스티베로, 차세대 DB어플라이언스 ‘ZetaData7’ 공개 및 GS인증 1등급 획득 file newsit 2025.03.13 498
3898 세일즈포스, ‘2025 에이전트포스 파트너 서밋’ 성료…“동반성장 견인할 AI 생태계 구축 목표” file newsit 2025.03.13 389
3897 샥즈, ‘2025 서울마라톤’에서 최신 오픈형 이어폰 체험 부스 운영 file newsit 2025.03.13 146
3896 포티넷, ‘OT 보안 플랫폼’ 업데이트 공개…“중요 인프라 보호 강화” file newsit 2025.03.13 160
3895 하이크비전, 산업 보안 국제표준 ‘IEC 62443-4-1’ 인증 획득 file newsit 2025.03.13 156
3894 IAR, 임베디드 월드 2025에서 클라우드 기반 최신 플랫폼 서비스 공개 file newsit 2025.03.12 261
3893 온세미, 업계 최초 실시간 iToF센서 ‘하이퍼럭스 ID’ 제품군 출시 file newsit 2025.03.12 237
3892 NXP, S32K5 차량용 MCU 제품군 출시…“자동차 업계 최초 MRAM 탑재” file newsit 2025.03.12 228
3891 알리바바 클라우드, 혁신적인 '3단계 분리 아키텍처'로 TPC-C 벤치마크 세계 신기록 달성 file newsit 2025.03.12 421
3890 퓨어스토리지, '플래시블레이드//EXA' 공개…“AI·고성능 컴퓨팅 위한 업계 최강 데이터 스토리지 플랫폼” file newsit 2025.03.12 127
3889 미르, 모바일 로봇간 상호 운용성 지원 어댑터 MiR VDA 5050 출시…“브랜드 상관없이 상호 연결과 유연한 자동화 확보“ file newsit 2025.03.12 694
3888 카스퍼스키, 정보탈취 ‘인포스틸러 악성코드 위협 현황 보고서’ 발표…“다크웹에 230만개 은행카드 유출 확인” file newsit 2025.03.12 154
3887 와콤, 완전히 새로워진 ‘와콤 인튜어스 프로(2025)’ 국내 출시 file newsit 2025.03.12 155
Board Pagination Prev 1 ... 75 76 77 78 79 80 81 82 83 84 ... 275 Next
/ 275
CLOSE