알리바바 클라우드, 최신 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’ 공개 (1).png

알리바바 클라우드가 새로운 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’를 공개했다.

 

이번 모델은 시작 프레임과 종료 프레임을 입력값으로 활용해, 보다 정교하고 직관적인 영상 생성이 가능하도록 설계되었다. 이를 통해 숏폼 콘텐츠 제작자는 자신만의 AI 모델과 애플리케이션을 보다 효율적이고 경제적으로 개발할 수 있다.

 

Wan2.1-FLF2V-14B는 알리바바 클라우드의 파운데이션 모델 시리즈인 ‘Wan2.1’에 속하며, 텍스트와 이미지 입력을 기반으로 고품질의 이미지와 영상을 생성하는 데 최적화된 모델이다. 현재 해당 모델은 오픈소스 플랫폼인 허깅페이스(Hugging Face), 깃허브(GitHub), 알리바바 클라우드의 오픈소스 커뮤니티 모델스코프(ModelScope)를 통해 누구나 자유롭게 활용할 수 있다.

 

해당 모델은 사용자 명령어의 정밀한 실행은 물론, 첫 프레임과 마지막 프레임 사이의 시각적 일관성을 유지하며, 복잡한 동작을 자연스럽게 연결해 사실적인 영상 결과물을 제공한다. Wan 시리즈의 공식 웹사이트에서는 해당 모델을 활용해 720p 해상도의 5초 분량 영상을 무료로 생성할 수 있다.

 

이번 모델의 핵심 기술은 제어 조정 메커니즘(Control Adjustment Mechanism)’이다. 사용자가 제공한 시작 프레임과 종료 프레임을 제어 조건으로 활용함으로써, 두 장면 사이의 부드럽고 정밀한 전환을 가능하게 한다.

 

알리바바 클라우드, 최신 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’ 공개 (2).png

또한, 시각 안정성을 확보하기 위해 해당 메커니즘은 시작 프레임과 종료 프레임에 포함된 의미 정보를 생성 과정에 반영하는데, 이를 통해 프레임을 동적으로 변형하면서도 스타일과 콘텐츠, 구조적 일관성을 함께 유지할 수 있다.

 

알리바바 클라우드는 자사가 개발한 대규모 AI 모델을 가장 먼저 오픈소스로 제공한 글로벌 테크 기업 중 하나로, 지난 2월에도 Wan2.1 시리즈 내 4종 모델을 오픈소스로 공개한 바 있다. 해당 시리즈는 현재까지 허깅페이스와 모델스코프에서 누적 220만 건 이상의 다운로드를 기록했다.

 

Wan2.1 시리즈는 중국어와 영어 기반 텍스트 효과를 모두 지원하는 최초의 영상 생성 AI 모델로, 복잡한 움직임과 픽셀 표현, 명령 수행 정확도 면에서 탁월한 성능을 보이며, 영상 생성 벤치마크 플랫폼 ‘VBench 리더보드(VBench Leaderboard)’에서 종합 1위를 차지했다

 

한편, 알리바바 클라우드는 20238월 최초의 오픈형 대규모 언어모델 큐원-7B(Qwen-7B)’를 공개했다. 큐원 시리즈는 허깅페이스의 오픈 LLM 리더보드에서 지속적으로 최상위권을 기록하며, 다양한 벤치마크에서 세계 주요 AI 모델과 대등한 성능을 입증한 바 있다.

 

지난 수년간 알리바바 클라우드는 200개 이상의 생성형 AI 모델을 오픈소스로 공개해 왔다. 현재까지 허깅페이스를 기반으로 약 10만 개 이상의 파생 모델이 개발되어 전 세계에서 가장 규모가 큰 AI 모델군 중 하나로 자리 잡았다.

 

 

#알리바바클라우드#허깅페이스#큐원#LLM

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
4240 롤스로이스 MT30 엔진, 대한민국 FFX 배치 IV 사업에 선정 file newsit 2025.05.27 129
4239 시놀로지, ‘KOBA 2025’ 전시회 성료…“미디어 및 엔터프라이즈 산업용 혁신적인 데이터 솔루션 공개” file newsit 2025.05.27 144
4238 TI, 엔비디아와 800V 고전압 DC 전력 분배 제공 협업…“AI 인프라 효율화” file newsit 2025.05.27 455
4237 한국레노버, 신제품 모니터 3종 출시…“비즈니스부터 크리에이티브 환경에 최적화”   file newsit 2025.05.27 202
4236 카테노이드 ‘찰나’, 출시 2년만에 숏폼 로드 수 40억 뷰 돌파 file newsit 2025.05.27 464
4235 Axis, 강남 자곡 래미안 포레 아파트에 ‘통합 영상 방송 관제 시스템’ 구축 file newsit 2025.05.27 193
4234 MSI, '2025 플레이엑스포' 참가 성료···차세대 게이밍·AI 기술력 입증 file newsit 2025.05.26 183
4233 스티브 바라캇, 3년 만의 월드투어로 한국 방문…“유니세프 공식 찬가까지 감동의 무대 예고” file newsit 2025.05.26 122
4232 실리콘랩스, 시리즈 3 플랫폼의 첫 번째 SoC 제품군 공개…“차세대 IoT 혁신에 동력 제공” file newsit 2025.05.26 330
4231 가민, '가민 사이클링 클럽' 이벤트 성료 file newsit 2025.05.26 175
4230 위로보틱스, 보행보조 웨어러블 로봇 ‘윔(WIM)’ 효과 입증한 국제 논문 발표…”웨어러블 로봇 착용 시 낙상예방 운동 효과 입증” file newsit 2025.05.26 501
4229 서비스나우, AI 기반 CRM 플랫폼 공개…판매부터 주문 처리, 서비스까지 전 과정 아우르는 통합 플랫폼 file newsit 2025.05.26 672
4228 레노버, 태블릿 판매 채널 확대…전국 각지 대형마트 입점 file newsit 2025.05.26 168
4227 엔비디아, ‘스타게이트 UAE’에 그레이스 블랙웰 GB300 시스템 공급 file newsit 2025.05.26 464
4226 NXP, 2세대 차량용 개발 플랫폼 ‘오렌지박스 2.0’ 공개 file newsit 2025.05.26 578
4225 인텔, 제온 6 프로세서 신제품 3종 출시…“GPU 가속 AI 성능 극대화” file newsit 2025.05.23 559
4224 아이씨알, '유럽 무선기기 사이버보안 규정 강화 대비 방안' 국제 세미나 성료 file newsit 2025.05.23 181
4223 마우저, 몰렉스(Molex)의 광범위한 커넥터 솔루션 포트폴리오 공급 file newsit 2025.05.23 520
4222 ST, 모듈형 IO-Link 개발 키트 출시…“산업 자동화 장치의 노드 구축 간소화” file newsit 2025.05.23 367
4221 샥즈, 근대5종 메달리스트 전웅태 ‘2025 공식 브랜드 앰버서더’로 발탁 file newsit 2025.05.23 223
Board Pagination Prev 1 ... 69 70 71 72 73 74 75 76 77 78 ... 285 Next
/ 285
CLOSE