- 영상 제작 전 과정을 하나의 모델로 통합콘텐츠 창작 효율성과 생산성 대폭 향상 기대

 

알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (1).png

 

 

알리바바가 영상 생성 및 편집을 위한 최신 오픈소스 AI 모델 ‘Wan2.1-VACE(Video All-in-one Creation and Editing)’를 공식 발표했다.

 

이번 모델은 다양한 영상 처리 기능을 하나로 통합해 영상 제작 과정을 간소화하고, 크리에이터의 효율성과 생산성을 극대화하는 데 중점을 두었다. Wan2.1-VACE는 알리바바의 영상 생성 특화 대규모 모델 시리즈인 ‘Wan2.1’에 속하며, 영상 생성 및 편집 기능을 아우르는 업계 최초의 오픈소스 통합 모델이다.

 

해당 모델은 텍스트, 이미지, 영상 등 다양한 멀티모달 입력을 기반으로 영상 생성이 가능하며, 이미지나 특정 프레임을 참조해 편집하거나, 영상 내 선택 영역을 수정·재구성하고, 시공간 확장까지 지원하는 고급 편집 기능을 제공한다. 이를 통해 사용자는 여러 작업을 유연하게 결합해 더욱 창의적인 결과물을 만들 수 있다.

 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (2).png

Wan2.1-VACE는 이미지 샘플을 바탕으로 상호작용하는 객체가 포함된 영상을 생성하거나, 정적인 이미지를 자연스럽게 움직이게 하여 생동감을 부여할 수 있다. 포즈 전환, 움직임 제어, 깊이 조절, 색상 재처리 등의 기능도 포함돼 고도화된 영상 리페인팅을 지원한다.

 

또한, 영상 내 특정 영역을 주변에 영향을 주지 않고 수정하거나 삭제·추가할 수 있으며, 영상 경계를 확장하고 자동으로 자연스러운 콘텐츠를 생성해 시각적 풍부함을 더한다.

 

사용자는 정적인 이미지를 영상으로 변환하는 동시에 객체의 이동 경로를 지정해 움직임을 제어하거나, 특정 인물·사물을 참조해 치환 및 애니메이션 처리도 가능하다. 수직 이미지를 가로 영상으로 확장하면서 새로운 요소를 추가하는 작업 역시 손쉽게 수행할 수 있다.

 

혁신적인 기술 적용

Wan2.1-VACE는 다양한 영상 편집 작업의 니즈를 고려한 첨단 기술을 다수 적용했다. 멀티모달 입력(텍스트, 이미지, 영상, 마스크 등)을 일괄 처리하는 통합 인터페이스 ‘VCU(Video Condition Unit)’를 도입했으며, 시간적·공간적 요소를 정형화된 방식으로 표현하는 컨텍스트 어댑터(Context Adapter)’ 구조를 통해 각 작업 개념을 효율적으로 모델에 주입할 수 있도록 설계되었다.

 

이를 기반으로 폭넓은 영상 합성 작업을 유연하게 관리할 수 있다. 특히 이 같은 구조적 혁신 덕분에 Wan2.1-VACESNS 숏폼 영상의 빠른 제작 광고·마케팅용 콘텐츠 창작 영상 후반 작업 및 특수효과 적용 교육용 트레이닝 콘텐츠 제작 등 다양한 분야에서 폭넓게 활용될 수 있다.

 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (1).gif

영상 기반 AI 모델을 훈련하려면 막대한 연산 자원과 고품질 학습 데이터가 필요하다. Wan2.1-VACE는 오픈소스를 통해 이러한 장벽을 낮추고, 더 많은 기업이 빠르고 경제적인 방식으로 자사 니즈에 맞춘 고품질 영상 콘텐츠를 제작할 수 있도록 지원한다.

 

Wan2.1-VACE는 파라미터 수 기준으로 140(14B) 버전과 13(1.3B) 버전 두 가지 형태로 제공된다. 현재 해당 모델은 허깅페이스(Hugging Face), 깃허브(GitHub), 알리바바 클라우드 오픈소스 커뮤니티 모델스코프(ModelScope)에서 누구나 무료로 다운로드할 수 있다.

 

알리바바는 자사 개발 대규모 AI 모델을 가장 먼저 오픈소스로 공개한 글로벌 주요 기술 기업 중 하나로, 지난 2월에는 Wan2.1 시리즈의 4가지 모델을, 지난달에는 시작 및 종료 프레임 기반 영상 생성 모델을 각각 공개한 바 있다. 현재까지 해당 모델들은 허깅페이스와 모델스코프에서 총 330만 건 이상의 누적 다운로드를 기록하며 높은 관심을 받고 있다.

 

#알리바바#Wan2.1#VACE#

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
4194 [Computex 2025] 인텔, 컴퓨텍스에서 AI·워크스테이션용 최신 GPU ‘아크프로 B60/50’ 공개 file newsit 2025.05.20 256
4193 델, 엔비디아와 협력해 차세대 엔터프라이즈 AI 솔루션 공개 file newsit 2025.05.20 319
4192 [Computex 2025] 엔비디아, 세계 최대 규모 양자 연구용 슈퍼컴퓨터 ‘ABCI-Q’ 지원 file newsit 2025.05.19 466
4191 [Computex 2025] 엔비디아, AI 팩토리 디지털 트윈용 ’옴니버스 블루프린트’ 지원 확대 file newsit 2025.05.19 500
4190 뉴타닉스, 퓨어스토리지와 파트너십 체결…“미션 크리티컬 워크로드 신규 통합 솔루션으로 고객 선택권 확대” file newsit 2025.05.19 319
4189 마우저-ADI, <14인의 전문가가 제시하는 최신 모터 제어 애플리케이션의 동향 및 과제> 전자책 발간 file newsit 2025.05.19 179
4188 슈퍼마이크로, 차세대 직접 수냉식 솔루션 ‘DLC-2’ 공개…“데이터센터 에너지 사용량 최대 40%, TCO 최대 20% 절감” file newsit 2025.05.19 75
4187 HS효성인포메이션, '히타치 밴타라-해머스페이스' 차세대 데이터 인텔리전트 AI 인프라 솔루션 협력 발표 file newsit 2025.05.19 96
4186 마우저, 르네사스의 RZ/V2N 마이크로프로세서 공급…“첨단 비전 AI 기술을 지원” file newsit 2025.05.16 432
4185 AMD, 사우디 AI 기업 ‘휴메인(HUMAIN)’과 100억 달러 규모 글로벌 AI 인프라 협력 발표 file newsit 2025.05.16 338
4184 ST, AI 지원 초소형 센서 ‘LSM6DSV320X’ 센서 공개 file newsit 2025.05.16 344
» 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 file newsit 2025.05.16 295
4182 안랩 V3, AV-TEST의 2025년 첫번째 ‘지능형 위협 방어 테스트’서 만점 획득 file newsit 2025.05.16 129
4181 한국정보통신, 비대면 간편결제 ‘이지톡페이’ 공식 웹사이트 오픈 file newsit 2025.05.16 354
4180 캐논코리아, 창립 40주년 기념 미디어 라운드 테이블 성료 file newsit 2025.05.16 101
4179 엑셈, 1분기 기준 역대 최대 매출 달성…“전년 동기 대비 27.6% 상승” file newsit 2025.05.15 535
4178 [컴퓨텍스 2025] MSI, 획기적인 PC 및 메인보드 라인업 공개 file newsit 2025.05.15 93
4177 미루웨어, '국제인공지능대전 2025'에서 다양한 AI 솔루션 공개 file newsit 2025.05.15 507
4176 페이오니아, 1분기 실적 발표… 분기 매출 2억4660만달러 달성 file newsit 2025.05.15 333
4175 슈나이더 일렉트릭, ‘국제 전기전력 전시회 2025’ 참가…“50년의 노하우 담은 지속 가능한 미래 비전 제시” file newsit 2025.05.15 346
Board Pagination Prev 1 ... 35 36 37 38 39 40 41 42 43 44 ... 249 Next
/ 249
CLOSE