- 알리바바 클라우드, 140(14B)·13(1.3B) 매개변수 버전의 영상 생성 모델 ‘Wan2.1’ 오픈소스로 전격 공개

- ‘Wan2.1’, VBench리더보스에서 1위 기록상위 5개 모델 중 유일한 오픈소스 영상 생성 모델

 

Qwen으로 생성된 AI 이미지.png

 

 

알리바바 클라우드가 오픈소스 커뮤니티 활성화를 위한 최신 조치의 일환으로 AI 기반 영상 생성 모델을 오픈소스로 무료 공개한다고 25일 발표했다.

 

알리바바 클라우드는 비디오 파운데이션 모델 ‘Tongyi Wanxiang(통이 완샹)’의 최신 버전인 Wan2.1 시리즈 중 140(14B) 13(1.3B) 매개변수 모델 4종을 오픈소스로 공개하며, AI 기술의 개방성과 확장성을 더욱 강화해 나갈 계획이다.

 

이번에 공개된 모델은 T2V-14B, T2V-1.3B, I2V-14B-720P, I2V-14B-480P 4종으로, 텍스트 및 이미지 입력을 기반으로 고품질 이미지와 영상을 생성하도록 설계됐다. 해당 모델들은 알리바바 클라우드의 AI 모델 커뮤니티인 모델스코프(ModelScope)’와 협업형 AI 플랫폼 허깅페이스(Hugging Face)’에서 다운로드 가능하며, 전 세계 학계 연구자 및 기업들이 자유롭게 활용할 수 있도록 공개됐다.

 

올해 초 공개된 Wan2.1 시리즈는 중국어와 영어에서 텍스트 효과를 지원하는 최초의 AI 영상 생성 모델로 복잡한 움직임을 정밀하게 처리하고, 픽셀 품질을 향상시키며, 물리적 원칙을 준수하며, 명령 실행 정확도를 최적화하는 등 사실적인 영상 생성 능력에서 강점을 발휘한다.

 

이처럼 뛰어난 명령 수행 정밀도 덕분에 Wan2.1은 영상 생성 모델의 종합 벤치마크인 VBench리더보드에서 1위를 기록했다. 또한, 허깅페이스의 VBench 리더보드 상위 5개 모델 중 유일한 오픈소스 영상 생성 모델로 자리매김하며 글로벌 AI 커뮤니티에서 그 기술력을 입증하고 있다.

 

VBench에 따르면, Wan2.1 시리즈는 종합 점수 86.22%를 기록하며, 움직임의 자연스러움, 공간적 관계, 색상 표현, 다중 객체 상호작용 등 핵심 평가 항목에서 최고 수준의 성능을 입증했다.

 

[참고 사진] Wan2.1 시리즈가 종합 점수 86.22_를 기록하며 핵심 평가 항목에서 최고 수준의 성능을 입증했다.jpg

영상 생성 AI 모델을 훈련하려면 막대한 컴퓨팅 자원과 대량의 고품질 학습 데이터가 필수적이다. 이러한 모델을 오픈소스로 개방하면 AI 활용의 장벽을 낮출 수 있으며, 기업들은 보다 효율적이고 경제적인 방식으로 자사 비즈니스에 최적화된 고품질 영상 콘텐츠를 제작할 수 있다.

T2V-14B 모델은 복잡한 동작이 포함된 고품질 영상 생성에 최적화되어 있으며, T2V-1.3B 모델은 생성 품질과 연산 효율성의 균형을 맞춰 연구 및 2차 개발 작업을 진행하는 다양한 개발자들에게 이상적인 솔루션을 제공한다. 예를 들어, T2V-1.3B 모델은 일반적인 개인용 노트북에서도 480p 해상도의 5초 길이 영상을 약 4분 만에 생성할 수 있어, 연구자 및 개발자들이 보다 쉽고 효율적으로 이를 활용할 수 있도록 지원한다.

 

또한, I2V-14B-720P I2V-14B-480P 모델은 텍스트 기반 영상 생성뿐만 아니라 이미지 기반 영상 생성 기능까지 지원한다. 사용자는 한 장의 이미지와 간단한 텍스트 설명만 입력하면 역동적인 영상 콘텐츠를 손쉽게 제작할 수 있으며, 플랫폼은 특정 크기에 제한 없이, 다양한 해상도의 이미지를 정상적으로 입력받아 처리할 수 있도록 설계됐다.

 

한편, 알리바바 클라우드는 AI 모델을 오픈소스로 공개한 최초의 글로벌 테크 기업 중 하나로, 20238월 자체 개발한 대규모 AI 모델 'Qwen(Qwen-7B)'을 첫 공개했다. 이후 큐원 시리즈는 허깅페이스의 오픈 LLM 리더보드에서 지속적으로 최상위권을 유지하며, 다양한 벤치마크에서 글로벌 최고 수준의 AI 모델과 어깨를 나란히 하는 성능을 입증하고 있다.

현재까지 허깅페이스에서 큐원 모델을 기반으로 개발된 파생 모델이 10만 개를 돌파, 전 세계에서 가장 규모가 큰 AI 모델군 중 하나로 자리매김하고 있다.

 

#알리바바클라우드#AI#Qwen#LLM

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
3992 캐논코리아, '파워샷 골프' 광고 모델 김효주 선수 LPGA 통산 7번째 우승 기념 특별 이벤트 file newsit 2025.04.03 203
3991 SAS코리아, 신용 포트폴리오 관리 솔루션 ‘윈나우(Winnow)’ 출시…“금융기관 선제적 리스크 관리 지원 강화” file newsit 2025.04.02 417
3990 슈나이더 일렉트릭, AI 시대 맞춤형 데이터 센터 쿨링 혁신 선도 file newsit 2025.04.02 602
3989 AWS, AWS 마켓플레이스 한국 확장…“국내 기술 기업의 글로벌 접근성 강화” file newsit 2025.04.02 478
3988 MSI, 최신 지포스 RTX 5090 탑재 게이밍 노트북 출시! file newsit 2025.04.02 193
3987 ST, 4채널 지능형 전력 스위치 「IPS4140HQ/IPS4140HQ-1」 출시…“컴팩트한 크기로 효율적이고 견고한 성능 제공” file newsit 2025.04.02 529
3986 유아이패스, ‘유아이패스 테스트 클라우드’ 출시…“소프트웨어 품질 테스트에 AI 에이전트 활용” file newsit 2025.04.02 448
3985 태블로, '나라장터' 등록으로 공공기관 공급 시작…“공공부문 데이터 기반 행정 및 디지털 전환 가속화 기대” file newsit 2025.04.02 478
3984 가트너, “올해 전 세계 생성형 AI 지출 76.4% 증가” file newsit 2025.04.02 451
3983 티머니, 신설 분할 법인 ‘티머니모빌리티’ 출범…“더 편한 이동과 결제로 모두를 위한 모빌리티 생태계 실현” file newsit 2025.04.01 746
3982 노르딕 세미컨덕터, ‘nPM2100’ 전력관리 IC로 비충전식 배터리 애플리케이션 개발 지원 file newsit 2025.04.01 346
3981 파고네트웍스, ‘PAGO 시큐리티 서밋 2025’ 개최 file newsit 2025.04.01 188
3980 SAP, 독일 하노버 메세에서 제조 업계의 최선 이끌어 낼 AI 혁신 공개 file newsit 2025.03.31 472
3979 카스퍼스키, 크롬(Chrome) 제로데이 취약점(CVE-2025-2783) 발견 file newsit 2025.03.31 180
3978 알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개 file newsit 2025.03.31 779
3977 캐논코리아, 데스크탑 대형 잉크젯 프린터 TC-21·복합기 TC-21M 2종 출시…“다양한 비즈니스 환경지원” file newsit 2025.03.31 188
3976 TI, 업계 최초로 ‘기능 절연 모듈레이터’ 제품군 출시 file newsit 2025.03.31 485
3975 안랩블록체인컴퍼니, 그라운드엑스와 블록체인 지갑 서비스 ‘클립(Klip)’ 사업 양수도 계약 체결 file newsit 2025.03.31 405
3974 가민, 프리미엄 건강∙운동 데이터 앱 ‘가민 커넥트 플러스’ 국내 출시 file newsit 2025.03.28 207
3973 캐논코리아, KLPGA 박준석 기자 사진전 '792만 번의 스윙, 792만 번의 기록, 1/792만 초의 셔터' 오프닝 행사 성료 file newsit 2025.03.28 177
Board Pagination Prev 1 ... 71 72 73 74 75 76 77 78 79 80 ... 275 Next
/ 275
CLOSE