알리바바 클라우드, 최신 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’ 공개 (1).png

알리바바 클라우드가 새로운 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’를 공개했다.

 

이번 모델은 시작 프레임과 종료 프레임을 입력값으로 활용해, 보다 정교하고 직관적인 영상 생성이 가능하도록 설계되었다. 이를 통해 숏폼 콘텐츠 제작자는 자신만의 AI 모델과 애플리케이션을 보다 효율적이고 경제적으로 개발할 수 있다.

 

Wan2.1-FLF2V-14B는 알리바바 클라우드의 파운데이션 모델 시리즈인 ‘Wan2.1’에 속하며, 텍스트와 이미지 입력을 기반으로 고품질의 이미지와 영상을 생성하는 데 최적화된 모델이다. 현재 해당 모델은 오픈소스 플랫폼인 허깅페이스(Hugging Face), 깃허브(GitHub), 알리바바 클라우드의 오픈소스 커뮤니티 모델스코프(ModelScope)를 통해 누구나 자유롭게 활용할 수 있다.

 

해당 모델은 사용자 명령어의 정밀한 실행은 물론, 첫 프레임과 마지막 프레임 사이의 시각적 일관성을 유지하며, 복잡한 동작을 자연스럽게 연결해 사실적인 영상 결과물을 제공한다. Wan 시리즈의 공식 웹사이트에서는 해당 모델을 활용해 720p 해상도의 5초 분량 영상을 무료로 생성할 수 있다.

 

이번 모델의 핵심 기술은 제어 조정 메커니즘(Control Adjustment Mechanism)’이다. 사용자가 제공한 시작 프레임과 종료 프레임을 제어 조건으로 활용함으로써, 두 장면 사이의 부드럽고 정밀한 전환을 가능하게 한다.

 

알리바바 클라우드, 최신 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’ 공개 (2).png

또한, 시각 안정성을 확보하기 위해 해당 메커니즘은 시작 프레임과 종료 프레임에 포함된 의미 정보를 생성 과정에 반영하는데, 이를 통해 프레임을 동적으로 변형하면서도 스타일과 콘텐츠, 구조적 일관성을 함께 유지할 수 있다.

 

알리바바 클라우드는 자사가 개발한 대규모 AI 모델을 가장 먼저 오픈소스로 제공한 글로벌 테크 기업 중 하나로, 지난 2월에도 Wan2.1 시리즈 내 4종 모델을 오픈소스로 공개한 바 있다. 해당 시리즈는 현재까지 허깅페이스와 모델스코프에서 누적 220만 건 이상의 다운로드를 기록했다.

 

Wan2.1 시리즈는 중국어와 영어 기반 텍스트 효과를 모두 지원하는 최초의 영상 생성 AI 모델로, 복잡한 움직임과 픽셀 표현, 명령 수행 정확도 면에서 탁월한 성능을 보이며, 영상 생성 벤치마크 플랫폼 ‘VBench 리더보드(VBench Leaderboard)’에서 종합 1위를 차지했다

 

한편, 알리바바 클라우드는 20238월 최초의 오픈형 대규모 언어모델 큐원-7B(Qwen-7B)’를 공개했다. 큐원 시리즈는 허깅페이스의 오픈 LLM 리더보드에서 지속적으로 최상위권을 기록하며, 다양한 벤치마크에서 세계 주요 AI 모델과 대등한 성능을 입증한 바 있다.

 

지난 수년간 알리바바 클라우드는 200개 이상의 생성형 AI 모델을 오픈소스로 공개해 왔다. 현재까지 허깅페이스를 기반으로 약 10만 개 이상의 파생 모델이 개발되어 전 세계에서 가장 규모가 큰 AI 모델군 중 하나로 자리 잡았다.

 

 

#알리바바클라우드#허깅페이스#큐원#LLM

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1683 델, 엔비디아와 협력해 차세대 엔터프라이즈 AI 솔루션 공개 - 새롭게 업데이트 된 ‘엔비디아 기반 델 AI 팩토리’, 컴퓨팅 및 데이터 처리 가속화를 위한 혁신 주도, 운영 간소화, AI 구축의 모든 단계에서 더 빠른 성과 내... file newsit 2025.05.20 465
1682 [Computex 2025] 엔비디아, 세계 최대 규모 양자 연구용 슈퍼컴퓨터 ‘ABCI-Q’ 지원 - 퀀텀2 인피니밴드 네트워킹 플랫폼으로 상호 연결된 H100 GPU 2,020개 탑재 - 다양한 큐비트 양식 전반에 걸쳐 하이브리드 양자 GPU 작업 실현 엔비디아가 양자... file newsit 2025.05.19 672
1681 [Computex 2025] 엔비디아, AI 팩토리 디지털 트윈용 ’옴니버스 블루프린트’ 지원 확대 - 델타 일렉트로닉스, 제이콥스, 지멘스와 새로운 통합 발표 - 조기 결함 발견으로 더 스마트하고 안전한 시설 구축 지원 - 심레디 표준화 워크플로우로 AI 팩토... file newsit 2025.05.19 713
1680 뉴타닉스, 퓨어스토리지와 파트너십 체결…“미션 크리티컬 워크로드 신규 통합 솔루션으로 고객 선택권 확대” - ‘뉴타닉스 클라우드 플랫폼’과 ‘퓨어스토리지 플래시어레이’ 결합…가장 까다로운 환경에 필요한 고성능 기능, 유연성, 보안성 및 확장성 제공 뉴타닉스는 세계... file newsit 2025.05.19 491
1679 AMD, 사우디 AI 기업 ‘휴메인(HUMAIN)’과 100억 달러 규모 글로벌 AI 인프라 협력 발표 – 다년간의 전략적 협력을 통해 AMD가 보유한 모든 컴퓨팅 영역 및 AMD ROCm 오픈 소프트웨어 생태계 기반으로 최대 500메가와트 규모의 AI 인프라 구축 예정 AMD... file newsit 2025.05.16 501
1678 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 - 영상 제작 전 과정을 하나의 모델로 통합… 콘텐츠 창작 효율성과 생산성 대폭 향상 기대 알리바바가 영상 생성 및 편집을 위한 최신 오픈소스 AI 모델 ‘Wan2.1-... file newsit 2025.05.16 443
1677 한국정보통신, 비대면 간편결제 ‘이지톡페이’ 공식 웹사이트 오픈 – 매장 방문 없이 결제 가능한 ‘이지톡페이’, 사이트에서 체험 가능 – 카카오 알림톡 기반 간편결제로 학원 등 다양한 업종에서 실사용 중 – 연간 135만 건 이상 ... file newsit 2025.05.16 519
1676 엑셈, 1분기 기준 역대 최대 매출 달성…“전년 동기 대비 27.6% 상승” - 1분기 연결 매출 116억7000만원… 전년 동기 대비 27.6% 상승 - 올해 엑셈원, 이빅스, 우드페커 등 AI와 클라우드 솔루션 고성장 기대 IT 통합 성능 관리 전문 ... file newsit 2025.05.15 684
1675 미루웨어, '국제인공지능대전 2025'에서 다양한 AI 솔루션 공개 HPC 컴퓨팅 전문기업 미루웨어는 ‘AI EXPO KOREA(국제인공지능산업대전)’에 참가해 AI 기반 솔루션을 대거 선보였다고 밝혔다. ‘AI’로 대변되는 인공지능 기술과 ... file newsit 2025.05.15 722
1674 페이오니아, 1분기 실적 발표… 분기 매출 2억4660만달러 달성 - 금리 수익 제외 매출 전년 동 분기 대비 16% 증가… 고객당 평균 매출 확대가 성장세 견인 - 중소기업 고객 발 매출 1억7000만달러… 전년 대비 18% 증가 전 세계... file newsit 2025.05.15 477
목록
Board Pagination Prev 1 ... 62 63 64 65 66 67 68 69 70 71 ... 235 Next
/ 235
CLOSE