- 알리바바 클라우드, 140(14B)·13(1.3B) 매개변수 버전의 영상 생성 모델 ‘Wan2.1’ 오픈소스로 전격 공개

- ‘Wan2.1’, VBench리더보스에서 1위 기록상위 5개 모델 중 유일한 오픈소스 영상 생성 모델

 

Qwen으로 생성된 AI 이미지.png

 

 

알리바바 클라우드가 오픈소스 커뮤니티 활성화를 위한 최신 조치의 일환으로 AI 기반 영상 생성 모델을 오픈소스로 무료 공개한다고 25일 발표했다.

 

알리바바 클라우드는 비디오 파운데이션 모델 ‘Tongyi Wanxiang(통이 완샹)’의 최신 버전인 Wan2.1 시리즈 중 140(14B) 13(1.3B) 매개변수 모델 4종을 오픈소스로 공개하며, AI 기술의 개방성과 확장성을 더욱 강화해 나갈 계획이다.

 

이번에 공개된 모델은 T2V-14B, T2V-1.3B, I2V-14B-720P, I2V-14B-480P 4종으로, 텍스트 및 이미지 입력을 기반으로 고품질 이미지와 영상을 생성하도록 설계됐다. 해당 모델들은 알리바바 클라우드의 AI 모델 커뮤니티인 모델스코프(ModelScope)’와 협업형 AI 플랫폼 허깅페이스(Hugging Face)’에서 다운로드 가능하며, 전 세계 학계 연구자 및 기업들이 자유롭게 활용할 수 있도록 공개됐다.

 

올해 초 공개된 Wan2.1 시리즈는 중국어와 영어에서 텍스트 효과를 지원하는 최초의 AI 영상 생성 모델로 복잡한 움직임을 정밀하게 처리하고, 픽셀 품질을 향상시키며, 물리적 원칙을 준수하며, 명령 실행 정확도를 최적화하는 등 사실적인 영상 생성 능력에서 강점을 발휘한다.

 

이처럼 뛰어난 명령 수행 정밀도 덕분에 Wan2.1은 영상 생성 모델의 종합 벤치마크인 VBench리더보드에서 1위를 기록했다. 또한, 허깅페이스의 VBench 리더보드 상위 5개 모델 중 유일한 오픈소스 영상 생성 모델로 자리매김하며 글로벌 AI 커뮤니티에서 그 기술력을 입증하고 있다.

 

VBench에 따르면, Wan2.1 시리즈는 종합 점수 86.22%를 기록하며, 움직임의 자연스러움, 공간적 관계, 색상 표현, 다중 객체 상호작용 등 핵심 평가 항목에서 최고 수준의 성능을 입증했다.

 

[참고 사진] Wan2.1 시리즈가 종합 점수 86.22_를 기록하며 핵심 평가 항목에서 최고 수준의 성능을 입증했다.jpg

영상 생성 AI 모델을 훈련하려면 막대한 컴퓨팅 자원과 대량의 고품질 학습 데이터가 필수적이다. 이러한 모델을 오픈소스로 개방하면 AI 활용의 장벽을 낮출 수 있으며, 기업들은 보다 효율적이고 경제적인 방식으로 자사 비즈니스에 최적화된 고품질 영상 콘텐츠를 제작할 수 있다.

T2V-14B 모델은 복잡한 동작이 포함된 고품질 영상 생성에 최적화되어 있으며, T2V-1.3B 모델은 생성 품질과 연산 효율성의 균형을 맞춰 연구 및 2차 개발 작업을 진행하는 다양한 개발자들에게 이상적인 솔루션을 제공한다. 예를 들어, T2V-1.3B 모델은 일반적인 개인용 노트북에서도 480p 해상도의 5초 길이 영상을 약 4분 만에 생성할 수 있어, 연구자 및 개발자들이 보다 쉽고 효율적으로 이를 활용할 수 있도록 지원한다.

 

또한, I2V-14B-720P I2V-14B-480P 모델은 텍스트 기반 영상 생성뿐만 아니라 이미지 기반 영상 생성 기능까지 지원한다. 사용자는 한 장의 이미지와 간단한 텍스트 설명만 입력하면 역동적인 영상 콘텐츠를 손쉽게 제작할 수 있으며, 플랫폼은 특정 크기에 제한 없이, 다양한 해상도의 이미지를 정상적으로 입력받아 처리할 수 있도록 설계됐다.

 

한편, 알리바바 클라우드는 AI 모델을 오픈소스로 공개한 최초의 글로벌 테크 기업 중 하나로, 20238월 자체 개발한 대규모 AI 모델 'Qwen(Qwen-7B)'을 첫 공개했다. 이후 큐원 시리즈는 허깅페이스의 오픈 LLM 리더보드에서 지속적으로 최상위권을 유지하며, 다양한 벤치마크에서 글로벌 최고 수준의 AI 모델과 어깨를 나란히 하는 성능을 입증하고 있다.

현재까지 허깅페이스에서 큐원 모델을 기반으로 개발된 파생 모델이 10만 개를 돌파, 전 세계에서 가장 규모가 큰 AI 모델군 중 하나로 자리매김하고 있다.

 

#알리바바클라우드#AI#Qwen#LLM

 
?

  1. 티맥스티베로, 재외동포청 ‘재외동포인증센터’ 무중단 서비스 구현

  2. 스트라타시스, ‘인터몰드 코리아 2025’ 참가…“산업 맞춤형 적층 제조 솔루션 공개”

  3. 애브포인트, 가트너 마켓가이드 BaaS 대표 기업 선정

  4. 샥즈, 프리미엄 오픈형 이어폰 ‘오픈핏 2’ 국내 출시

  5. 딥엘, 신규 기능 ‘클래리파이’ 추가…“AI와 상호작용 통해 최적의 비즈니스 번역 지원”

  6. 윈드리버, 복잡한 클라우드 및 엣지 환경을 위한 AI 아키텍처 ‘인텔 제온 6’ 프로세서 지원

  7. 리미니스트리트, 생활문화기업 ‘LF’에 오라클 데이터베이스 및 SAP ERP 유지보수 '리미니 서포트' 제공

  8. 카스퍼스키, 2024 카스퍼스키 시큐리티 보고서 발표…“지난해 국내 발생 웹 기반 공격 천만건 육박”

  9. No Image 04Mar
    by newsit
    2025/03/04 by newsit
    Views 476 

    카테노이드, ‘코리아 나라장터 엑스포 2025’ 참가… 공공 부문 사업 강화

  10. 가민, 스마트 골프 워치 ‘어프로치 S50’ 출시…“고급 GPS 기술과 4만 3000개 이상의 골프 코스 정보 내장”

  11. 티맥스소프트, 디지털 분야 시상식 '2024 앤어워드' 수상

  12. 캐논, 전 세계 렌즈교환식 카메라 시장 점유율 22년 연속 1위 달성!

  13. 마우저, 마이크로칩 「EV42J24A」 평가 키트 공급…“신속한 ROT 솔루션 개발”

  14. 엘앤에프, “가족 친화적 따뜻한 기업문화 조성”

  15. ST, 최신 STM32C0 MCU 3종 추가 출시…“엔트리 레벨 임베디드 개발 간소화”

  16. 한국레노버, 씽크패드 X1 시리즈 아우라 에디션 2종 출시…“AI로 업무 생산성 혁신”

  17. 쿤텍-비나텍, 글로벌 탄소 규제 공동 대응 MOU 체결

  18. 카스퍼스키, 깃허브에서 멀웨어 ‘GitVenom’ 발견

  19. 알리바바 클라우드, AI 기반 비디오 생성 모델 ‘Wan2.1’ 오픈소스 공개

  20. 마우저-NXP, <최신 전기차를 위한 첨단 모터 제어 기술에 대한 11명의 전문가 제언> 전자책 발간

Board Pagination Prev 1 ... 52 53 54 55 56 57 58 59 60 61 ... 249 Next
/ 249
CLOSE