알리바바 클라우드, 최신 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’ 공개 (1).png

알리바바 클라우드가 새로운 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’를 공개했다.

 

이번 모델은 시작 프레임과 종료 프레임을 입력값으로 활용해, 보다 정교하고 직관적인 영상 생성이 가능하도록 설계되었다. 이를 통해 숏폼 콘텐츠 제작자는 자신만의 AI 모델과 애플리케이션을 보다 효율적이고 경제적으로 개발할 수 있다.

 

Wan2.1-FLF2V-14B는 알리바바 클라우드의 파운데이션 모델 시리즈인 ‘Wan2.1’에 속하며, 텍스트와 이미지 입력을 기반으로 고품질의 이미지와 영상을 생성하는 데 최적화된 모델이다. 현재 해당 모델은 오픈소스 플랫폼인 허깅페이스(Hugging Face), 깃허브(GitHub), 알리바바 클라우드의 오픈소스 커뮤니티 모델스코프(ModelScope)를 통해 누구나 자유롭게 활용할 수 있다.

 

해당 모델은 사용자 명령어의 정밀한 실행은 물론, 첫 프레임과 마지막 프레임 사이의 시각적 일관성을 유지하며, 복잡한 동작을 자연스럽게 연결해 사실적인 영상 결과물을 제공한다. Wan 시리즈의 공식 웹사이트에서는 해당 모델을 활용해 720p 해상도의 5초 분량 영상을 무료로 생성할 수 있다.

 

이번 모델의 핵심 기술은 제어 조정 메커니즘(Control Adjustment Mechanism)’이다. 사용자가 제공한 시작 프레임과 종료 프레임을 제어 조건으로 활용함으로써, 두 장면 사이의 부드럽고 정밀한 전환을 가능하게 한다.

 

알리바바 클라우드, 최신 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’ 공개 (2).png

또한, 시각 안정성을 확보하기 위해 해당 메커니즘은 시작 프레임과 종료 프레임에 포함된 의미 정보를 생성 과정에 반영하는데, 이를 통해 프레임을 동적으로 변형하면서도 스타일과 콘텐츠, 구조적 일관성을 함께 유지할 수 있다.

 

알리바바 클라우드는 자사가 개발한 대규모 AI 모델을 가장 먼저 오픈소스로 제공한 글로벌 테크 기업 중 하나로, 지난 2월에도 Wan2.1 시리즈 내 4종 모델을 오픈소스로 공개한 바 있다. 해당 시리즈는 현재까지 허깅페이스와 모델스코프에서 누적 220만 건 이상의 다운로드를 기록했다.

 

Wan2.1 시리즈는 중국어와 영어 기반 텍스트 효과를 모두 지원하는 최초의 영상 생성 AI 모델로, 복잡한 움직임과 픽셀 표현, 명령 수행 정확도 면에서 탁월한 성능을 보이며, 영상 생성 벤치마크 플랫폼 ‘VBench 리더보드(VBench Leaderboard)’에서 종합 1위를 차지했다

 

한편, 알리바바 클라우드는 20238월 최초의 오픈형 대규모 언어모델 큐원-7B(Qwen-7B)’를 공개했다. 큐원 시리즈는 허깅페이스의 오픈 LLM 리더보드에서 지속적으로 최상위권을 기록하며, 다양한 벤치마크에서 세계 주요 AI 모델과 대등한 성능을 입증한 바 있다.

 

지난 수년간 알리바바 클라우드는 200개 이상의 생성형 AI 모델을 오픈소스로 공개해 왔다. 현재까지 허깅페이스를 기반으로 약 10만 개 이상의 파생 모델이 개발되어 전 세계에서 가장 규모가 큰 AI 모델군 중 하나로 자리 잡았다.

 

 

#알리바바클라우드#허깅페이스#큐원#LLM

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1694 매스웍스-KISTI, 고성능 컴퓨팅 인프라 구축 위한 협약 체결 - 매트랩 병렬 서버 호스팅으로 국가슈퍼컴퓨팅센터 연구 생산성 향상 지원… 대규모 데이터 처리 및 AI 연구 가속화 기대 매스웍스(MathWorks)는 한국과학기술정... file newsit 2025.05.23 727
1693 리미니스트리트, 인천국제공항공사에 '리미니 서포트' 지원…“SAP S/4HANA 유지보수” - SAP S/4HANA ERP 유지보수 서비스를 리미니스트리트로 전환, IT 비용 절감 및 비즈니스 프로세스 혁신 실현 리미니스트리트(RMNI)는 오늘, 대한민국의 대표적인... file newsit 2025.05.22 587
1692 인텔 가우디 3, 델 AI 플랫폼에 탑재…“대규모 AI 혁신 위한 가용성 확대” - 델 AI 팩토리를 통해 제공되는 인텔 가우디 3 AI 가속기, 고성능, 오픈 소스 유연성 및 엔터프라이즈급 인프라를 제공하여 AI 도입 속도 향상 인텔은 델(Dell)... file newsit 2025.05.21 525
1691 엔비디아, MS와 함께 RTX AI PC 생태계 확장 - 윈도우 ML 기반 ‘RTX용 엔비디아 텐서RT’로 AI 성능 대폭 강화 - 새로운 엔비디아 NIM 마이크로서비스와 AI 블루프린트로 개발자 워크플로우 혁신 - 프로젝트 G... file newsit 2025.05.21 421
1690 SAP, 연례 콘퍼런스 ‘SAP사파이어 2025’ 개최…“AI 혁신으로 업무 생산성 최대 30% 향상” - 기업 운영 방식 재정의할 비즈니스 AI 공개 - 퍼플렉시티 및 팔란티어와의 파트너십 통해 고객의 잠재력 극대화 SAP가 20일 미국 플로리다 올랜도에서 SAP의 연... file newsit 2025.05.21 546
1689 피아이이, 판교 위든타워에 ‘PIE AI R&D Campus’ 설립…“서강대와 산학협력 본격화” - ‘AI+X’ 융합 기술 중심 연구 거점 구축…이차전지 넘어 첨단 산업 맞춤형 AI 솔루션 확대 - 서강대와 산학협력으로 최신 AI 기술의 산업 적용 가속화 및 실용적 ... file newsit 2025.05.21 496
1688 레드햇, ‘레드햇 엔터프라이즈 리눅스 10’ 출시…“하이브리드 환경에서 인텔리전스 및 보안 강화” - IT 혁신 위한 견고한 기반 ‘RHEL 10’, AI 기반 리눅스 관리 통해 더욱 지능적인 하이브리드 클라우드 운영 지원 - 미래 양자 기반 위협 완화 위한 보안 기능 추... file newsit 2025.05.21 468
1687 [DTW 2025] 델, 소프트웨어 기반의 분리형 인프라로 혁신적인 데이터센터 운영 전략 제시 - 분리형 인프라스트럭처 전략의 토대로 스토리지 성능 및 사이버 회복탄력성 관련 제품 기능 강화 - 소프트웨어 개발로 프라이빗 클라우드 및 엣지 솔루션의 관... file newsit 2025.05.21 507
1686 슬랙, NH투자증권 혁신금융서비스 지정 승인…“금융 산업의 디지털 업무 환경 구축 선도” - NH투자증권, 국내 최초 혁신금융서비스 지정 승인 기반의 슬랙 도입 - 온프레미스 시스템 한계 극복… 실시간 커뮤니케이션 및 자동화로 생산성 극대화 - 고객 ... file newsit 2025.05.21 652
1685 사이냅소프트, 국내 최대 B2B 오픈마켓 도매꾹에 ‘사이냅 OCR Pro’ 공급 - 사이냅 OCR Pro, 대형 이미지 문제 해결 생산성 극대화 사이냅소프트는 자사의 AI기술이 적용된 ‘사이냅 OCR Pro’를 국내 최대 B2B 오픈마켓 ‘도매꾹·도매매’에... file newsit 2025.05.20 482
목록
Board Pagination Prev 1 ... 62 63 64 65 66 67 68 69 70 71 ... 236 Next
/ 236
CLOSE