- 영상 제작 전 과정을 하나의 모델로 통합콘텐츠 창작 효율성과 생산성 대폭 향상 기대

 

알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (1).png

 

 

알리바바가 영상 생성 및 편집을 위한 최신 오픈소스 AI 모델 ‘Wan2.1-VACE(Video All-in-one Creation and Editing)’를 공식 발표했다.

 

이번 모델은 다양한 영상 처리 기능을 하나로 통합해 영상 제작 과정을 간소화하고, 크리에이터의 효율성과 생산성을 극대화하는 데 중점을 두었다. Wan2.1-VACE는 알리바바의 영상 생성 특화 대규모 모델 시리즈인 ‘Wan2.1’에 속하며, 영상 생성 및 편집 기능을 아우르는 업계 최초의 오픈소스 통합 모델이다.

 

해당 모델은 텍스트, 이미지, 영상 등 다양한 멀티모달 입력을 기반으로 영상 생성이 가능하며, 이미지나 특정 프레임을 참조해 편집하거나, 영상 내 선택 영역을 수정·재구성하고, 시공간 확장까지 지원하는 고급 편집 기능을 제공한다. 이를 통해 사용자는 여러 작업을 유연하게 결합해 더욱 창의적인 결과물을 만들 수 있다.

 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (2).png

Wan2.1-VACE는 이미지 샘플을 바탕으로 상호작용하는 객체가 포함된 영상을 생성하거나, 정적인 이미지를 자연스럽게 움직이게 하여 생동감을 부여할 수 있다. 포즈 전환, 움직임 제어, 깊이 조절, 색상 재처리 등의 기능도 포함돼 고도화된 영상 리페인팅을 지원한다.

 

또한, 영상 내 특정 영역을 주변에 영향을 주지 않고 수정하거나 삭제·추가할 수 있으며, 영상 경계를 확장하고 자동으로 자연스러운 콘텐츠를 생성해 시각적 풍부함을 더한다.

 

사용자는 정적인 이미지를 영상으로 변환하는 동시에 객체의 이동 경로를 지정해 움직임을 제어하거나, 특정 인물·사물을 참조해 치환 및 애니메이션 처리도 가능하다. 수직 이미지를 가로 영상으로 확장하면서 새로운 요소를 추가하는 작업 역시 손쉽게 수행할 수 있다.

 

혁신적인 기술 적용

Wan2.1-VACE는 다양한 영상 편집 작업의 니즈를 고려한 첨단 기술을 다수 적용했다. 멀티모달 입력(텍스트, 이미지, 영상, 마스크 등)을 일괄 처리하는 통합 인터페이스 ‘VCU(Video Condition Unit)’를 도입했으며, 시간적·공간적 요소를 정형화된 방식으로 표현하는 컨텍스트 어댑터(Context Adapter)’ 구조를 통해 각 작업 개념을 효율적으로 모델에 주입할 수 있도록 설계되었다.

 

이를 기반으로 폭넓은 영상 합성 작업을 유연하게 관리할 수 있다. 특히 이 같은 구조적 혁신 덕분에 Wan2.1-VACESNS 숏폼 영상의 빠른 제작 광고·마케팅용 콘텐츠 창작 영상 후반 작업 및 특수효과 적용 교육용 트레이닝 콘텐츠 제작 등 다양한 분야에서 폭넓게 활용될 수 있다.

 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (1).gif

영상 기반 AI 모델을 훈련하려면 막대한 연산 자원과 고품질 학습 데이터가 필요하다. Wan2.1-VACE는 오픈소스를 통해 이러한 장벽을 낮추고, 더 많은 기업이 빠르고 경제적인 방식으로 자사 니즈에 맞춘 고품질 영상 콘텐츠를 제작할 수 있도록 지원한다.

 

Wan2.1-VACE는 파라미터 수 기준으로 140(14B) 버전과 13(1.3B) 버전 두 가지 형태로 제공된다. 현재 해당 모델은 허깅페이스(Hugging Face), 깃허브(GitHub), 알리바바 클라우드 오픈소스 커뮤니티 모델스코프(ModelScope)에서 누구나 무료로 다운로드할 수 있다.

 

알리바바는 자사 개발 대규모 AI 모델을 가장 먼저 오픈소스로 공개한 글로벌 주요 기술 기업 중 하나로, 지난 2월에는 Wan2.1 시리즈의 4가지 모델을, 지난달에는 시작 및 종료 프레임 기반 영상 생성 모델을 각각 공개한 바 있다. 현재까지 해당 모델들은 허깅페이스와 모델스코프에서 총 330만 건 이상의 누적 다운로드를 기록하며 높은 관심을 받고 있다.

 

#알리바바#Wan2.1#VACE#

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1978 레노버, 에이전트 AI 통합한 ‘AI 지원 인력 포트폴리오’로 업무 혁신 가속화 레노버(Lenovo)가 에이전트 AI(Agentic AI) 기술을 통합한 ‘AI 지원 인력 포트폴리오(AI-Powered Workforce Portfolio)’를 공개하며 기업의 업무 혁신을 가속화한... file newsit 2025.10.21 174
1977 티맥스티베로, ‘K-OpenSource X AI in Seoul 2025’ 참가...데이터·오픈소스 기반 AI 전략 제시 데이터베이스 관리 시스템(DBMS) 전문 기업 티맥스티베로가 오는 27일 서울 과학기술회관에서 열리는 ‘K-OpenSource X AI in Seoul 2025’에서 AI 시대의 데이터베... file newsit 2025.10.21 192
1976 유아이패스, 구글 제미나이 기반 음성 에이전트로 에이전틱 자동화 혁신 가속화 에이전틱 자동화 분야의 글로벌 리더 유아이패스(UiPath) 가 구글 제미나이(Gemini) 모델을 기반으로 음성 대화를 지원하는 유아이패스 대화형 에이전트(UiPath C... file newsit 2025.10.21 199
1975 가트너, 2026년 10대 전략 기술 트렌드 발표… AI·보안·신뢰의 삼각축 부상 - AI 초연결 시대, ‘책임감 있는 혁신’이 관건 AI 기술이 산업의 중심축으로 자리잡은 가운데, 가트너(Gartner)가 발표한 ‘2026년 10대 전략 기술 트렌드’는 단순... file newsit 2025.10.21 211
1974 슈나이더 일렉트릭, 스마트십 특화 ‘프로페이스 HMI GP6000’ 시리즈로 선박 자동화 강화 - 극한 해양 환경에 최적화된 견고한 설계…진동·염분·습기 등 외부 요인에도 안정적 운영 - 에너지 절감·친환경 설계로 IMO 환경 규제 대응 슈나이더 일렉트릭이 ... file newsit 2025.10.21 172
1973 EDB코리아, 재난 상황 대비 ‘무중단 서비스’ 구현 방안 발표 – 분산형 DBMS ‘EDB Postgres Distributed(PGD) 6.0’으로 공공·금융 DR 혁신 지원 – 찾아가는 맞춤형 컨설팅·세미나로 국내 고객 기술 지원 강화 글로벌 오픈소스... file newsit 2025.10.21 191
1972 오나인솔루션즈, ‘2025 Gartner Peer Insights 고객의 선택’ 선정..."고객 94%가 'o9 Digital Brain' 플랫폼 추천" – 공급망 계획 솔루션 부문 유일한 Customers’ Choice 기업 엔터프라이즈 AI SaaS 플랫폼 기업 오나인솔루션즈(o9 Solutions)는 ‘2025 Gartner Peer Insights 공... file newsit 2025.10.20 178
1971 오라클, ‘OCI 전용 리전25’ 공개… 신속한 AI·클라우드 서비스 배포 지원 - 최소 3개 랙 구성으로 단 몇 주 만에 200여 개 AI·클라우드 서비스 제공 - 데이터 주권 강화 및 소규모 환경에서도 전용 클라우드 구현 지원 오라클(Oracle)은 ... file newsit 2025.10.20 173
1970 윈드리버-블랙박스, 지능형 엣지·프라이빗 클라우드 혁신 전략적 파트너십 체결 - 산업·제조·금융 등 주요 산업군 대상 차세대 디지털 인프라 전환 가속 윈드리버(Wind River)가 디지털 인프라 전문기업 블랙박스(Black Box)와 전략적 파트너십... file newsit 2025.10.20 182
1969 비트센싱·코리아와이드, 500대 버스 대상 ADAS 실증 프로젝트 본격화 - 비트센싱, 코리아와이드 경북고속·진안고속과 협력해 상용차용 운전자 보조 시스템 실증 - 레이더·카메라 통합 ADAS Kit 설치, 전방·측면·차선·보행자 감지 기... file newsit 2025.10.17 191
목록
Board Pagination Prev 1 ... 26 27 28 29 30 31 32 33 34 35 ... 228 Next
/ 228
CLOSE