- 알리바바 클라우드, 140(14B)·13(1.3B) 매개변수 버전의 영상 생성 모델 ‘Wan2.1’ 오픈소스로 전격 공개

- ‘Wan2.1’, VBench리더보스에서 1위 기록상위 5개 모델 중 유일한 오픈소스 영상 생성 모델

 

Qwen으로 생성된 AI 이미지.png

 

 

알리바바 클라우드가 오픈소스 커뮤니티 활성화를 위한 최신 조치의 일환으로 AI 기반 영상 생성 모델을 오픈소스로 무료 공개한다고 25일 발표했다.

 

알리바바 클라우드는 비디오 파운데이션 모델 ‘Tongyi Wanxiang(통이 완샹)’의 최신 버전인 Wan2.1 시리즈 중 140(14B) 13(1.3B) 매개변수 모델 4종을 오픈소스로 공개하며, AI 기술의 개방성과 확장성을 더욱 강화해 나갈 계획이다.

 

이번에 공개된 모델은 T2V-14B, T2V-1.3B, I2V-14B-720P, I2V-14B-480P 4종으로, 텍스트 및 이미지 입력을 기반으로 고품질 이미지와 영상을 생성하도록 설계됐다. 해당 모델들은 알리바바 클라우드의 AI 모델 커뮤니티인 모델스코프(ModelScope)’와 협업형 AI 플랫폼 허깅페이스(Hugging Face)’에서 다운로드 가능하며, 전 세계 학계 연구자 및 기업들이 자유롭게 활용할 수 있도록 공개됐다.

 

올해 초 공개된 Wan2.1 시리즈는 중국어와 영어에서 텍스트 효과를 지원하는 최초의 AI 영상 생성 모델로 복잡한 움직임을 정밀하게 처리하고, 픽셀 품질을 향상시키며, 물리적 원칙을 준수하며, 명령 실행 정확도를 최적화하는 등 사실적인 영상 생성 능력에서 강점을 발휘한다.

 

이처럼 뛰어난 명령 수행 정밀도 덕분에 Wan2.1은 영상 생성 모델의 종합 벤치마크인 VBench리더보드에서 1위를 기록했다. 또한, 허깅페이스의 VBench 리더보드 상위 5개 모델 중 유일한 오픈소스 영상 생성 모델로 자리매김하며 글로벌 AI 커뮤니티에서 그 기술력을 입증하고 있다.

 

VBench에 따르면, Wan2.1 시리즈는 종합 점수 86.22%를 기록하며, 움직임의 자연스러움, 공간적 관계, 색상 표현, 다중 객체 상호작용 등 핵심 평가 항목에서 최고 수준의 성능을 입증했다.

 

[참고 사진] Wan2.1 시리즈가 종합 점수 86.22_를 기록하며 핵심 평가 항목에서 최고 수준의 성능을 입증했다.jpg

영상 생성 AI 모델을 훈련하려면 막대한 컴퓨팅 자원과 대량의 고품질 학습 데이터가 필수적이다. 이러한 모델을 오픈소스로 개방하면 AI 활용의 장벽을 낮출 수 있으며, 기업들은 보다 효율적이고 경제적인 방식으로 자사 비즈니스에 최적화된 고품질 영상 콘텐츠를 제작할 수 있다.

T2V-14B 모델은 복잡한 동작이 포함된 고품질 영상 생성에 최적화되어 있으며, T2V-1.3B 모델은 생성 품질과 연산 효율성의 균형을 맞춰 연구 및 2차 개발 작업을 진행하는 다양한 개발자들에게 이상적인 솔루션을 제공한다. 예를 들어, T2V-1.3B 모델은 일반적인 개인용 노트북에서도 480p 해상도의 5초 길이 영상을 약 4분 만에 생성할 수 있어, 연구자 및 개발자들이 보다 쉽고 효율적으로 이를 활용할 수 있도록 지원한다.

 

또한, I2V-14B-720P I2V-14B-480P 모델은 텍스트 기반 영상 생성뿐만 아니라 이미지 기반 영상 생성 기능까지 지원한다. 사용자는 한 장의 이미지와 간단한 텍스트 설명만 입력하면 역동적인 영상 콘텐츠를 손쉽게 제작할 수 있으며, 플랫폼은 특정 크기에 제한 없이, 다양한 해상도의 이미지를 정상적으로 입력받아 처리할 수 있도록 설계됐다.

 

한편, 알리바바 클라우드는 AI 모델을 오픈소스로 공개한 최초의 글로벌 테크 기업 중 하나로, 20238월 자체 개발한 대규모 AI 모델 'Qwen(Qwen-7B)'을 첫 공개했다. 이후 큐원 시리즈는 허깅페이스의 오픈 LLM 리더보드에서 지속적으로 최상위권을 유지하며, 다양한 벤치마크에서 글로벌 최고 수준의 AI 모델과 어깨를 나란히 하는 성능을 입증하고 있다.

현재까지 허깅페이스에서 큐원 모델을 기반으로 개발된 파생 모델이 10만 개를 돌파, 전 세계에서 가장 규모가 큰 AI 모델군 중 하나로 자리매김하고 있다.

 

#알리바바클라우드#AI#Qwen#LLM

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
4249 F5, 2025 애플리케이션 전략 현황 보고서 발표…"AI, 논의에서 실무로 본격 전환" file newsit 2025.05.28 507
4248 SAS코리아, ‘SAS 이노베이트 온 투어 서울 2025’ 개최…“생산성과 AI를 위한 미래 전략 발표” file newsit 2025.05.28 500
4247 마우저, 라즈베리 파이의 「RP2350」 마이크로컨트롤러 공급…“임베디드 및 산업용 IoT 애플리케이션용” file newsit 2025.05.28 425
4246 유아이패스, IDC 마켓스케이프 ‘2025 글로벌 비즈니스 자동화 플랫폼 부문’ 리더 선정 file newsit 2025.05.28 656
4245 퓨어스토리지-SK하이닉스, 하이퍼스케일 데이터센터용 고성능·에너지 효율 솔루션 공동 개발 file newsit 2025.05.28 158
4244 카스퍼스키, 노출된 컨테이너로 침투하는 암호화폐 ‘데로(Dero)’ 채굴 악성코드 발견 file newsit 2025.05.28 204
4243 HS효성인포메이션시스템, 통합 데이터 관리 소프트웨어 솔루션 ‘VSP 360’ 출시 file newsit 2025.05.28 169
4242 서비스나우, AI 기반 재무 사례 관리 솔루션 및 ‘코어 비즈니스 스위트’ 출시 file newsit 2025.05.28 755
4241 ECS텔레콤-브라이트패턴-네〮이버클라우드, 차세대 컨택센터 전환 가속 위한 협력 강화 file newsit 2025.05.27 756
4240 롤스로이스 MT30 엔진, 대한민국 FFX 배치 IV 사업에 선정 file newsit 2025.05.27 134
4239 시놀로지, ‘KOBA 2025’ 전시회 성료…“미디어 및 엔터프라이즈 산업용 혁신적인 데이터 솔루션 공개” file newsit 2025.05.27 150
4238 TI, 엔비디아와 800V 고전압 DC 전력 분배 제공 협업…“AI 인프라 효율화” file newsit 2025.05.27 458
4237 한국레노버, 신제품 모니터 3종 출시…“비즈니스부터 크리에이티브 환경에 최적화”   file newsit 2025.05.27 208
4236 카테노이드 ‘찰나’, 출시 2년만에 숏폼 로드 수 40억 뷰 돌파 file newsit 2025.05.27 469
4235 Axis, 강남 자곡 래미안 포레 아파트에 ‘통합 영상 방송 관제 시스템’ 구축 file newsit 2025.05.27 210
4234 MSI, '2025 플레이엑스포' 참가 성료···차세대 게이밍·AI 기술력 입증 file newsit 2025.05.26 199
4233 스티브 바라캇, 3년 만의 월드투어로 한국 방문…“유니세프 공식 찬가까지 감동의 무대 예고” file newsit 2025.05.26 127
4232 실리콘랩스, 시리즈 3 플랫폼의 첫 번째 SoC 제품군 공개…“차세대 IoT 혁신에 동력 제공” file newsit 2025.05.26 332
4231 가민, '가민 사이클링 클럽' 이벤트 성료 file newsit 2025.05.26 189
4230 위로보틱스, 보행보조 웨어러블 로봇 ‘윔(WIM)’ 효과 입증한 국제 논문 발표…”웨어러블 로봇 착용 시 낙상예방 운동 효과 입증” file newsit 2025.05.26 525
Board Pagination Prev 1 ... 72 73 74 75 76 77 78 79 80 81 ... 289 Next
/ 289
CLOSE