- 영상 제작 전 과정을 하나의 모델로 통합콘텐츠 창작 효율성과 생산성 대폭 향상 기대

 

알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (1).png

 

 

알리바바가 영상 생성 및 편집을 위한 최신 오픈소스 AI 모델 ‘Wan2.1-VACE(Video All-in-one Creation and Editing)’를 공식 발표했다.

 

이번 모델은 다양한 영상 처리 기능을 하나로 통합해 영상 제작 과정을 간소화하고, 크리에이터의 효율성과 생산성을 극대화하는 데 중점을 두었다. Wan2.1-VACE는 알리바바의 영상 생성 특화 대규모 모델 시리즈인 ‘Wan2.1’에 속하며, 영상 생성 및 편집 기능을 아우르는 업계 최초의 오픈소스 통합 모델이다.

 

해당 모델은 텍스트, 이미지, 영상 등 다양한 멀티모달 입력을 기반으로 영상 생성이 가능하며, 이미지나 특정 프레임을 참조해 편집하거나, 영상 내 선택 영역을 수정·재구성하고, 시공간 확장까지 지원하는 고급 편집 기능을 제공한다. 이를 통해 사용자는 여러 작업을 유연하게 결합해 더욱 창의적인 결과물을 만들 수 있다.

 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (2).png

Wan2.1-VACE는 이미지 샘플을 바탕으로 상호작용하는 객체가 포함된 영상을 생성하거나, 정적인 이미지를 자연스럽게 움직이게 하여 생동감을 부여할 수 있다. 포즈 전환, 움직임 제어, 깊이 조절, 색상 재처리 등의 기능도 포함돼 고도화된 영상 리페인팅을 지원한다.

 

또한, 영상 내 특정 영역을 주변에 영향을 주지 않고 수정하거나 삭제·추가할 수 있으며, 영상 경계를 확장하고 자동으로 자연스러운 콘텐츠를 생성해 시각적 풍부함을 더한다.

 

사용자는 정적인 이미지를 영상으로 변환하는 동시에 객체의 이동 경로를 지정해 움직임을 제어하거나, 특정 인물·사물을 참조해 치환 및 애니메이션 처리도 가능하다. 수직 이미지를 가로 영상으로 확장하면서 새로운 요소를 추가하는 작업 역시 손쉽게 수행할 수 있다.

 

혁신적인 기술 적용

Wan2.1-VACE는 다양한 영상 편집 작업의 니즈를 고려한 첨단 기술을 다수 적용했다. 멀티모달 입력(텍스트, 이미지, 영상, 마스크 등)을 일괄 처리하는 통합 인터페이스 ‘VCU(Video Condition Unit)’를 도입했으며, 시간적·공간적 요소를 정형화된 방식으로 표현하는 컨텍스트 어댑터(Context Adapter)’ 구조를 통해 각 작업 개념을 효율적으로 모델에 주입할 수 있도록 설계되었다.

 

이를 기반으로 폭넓은 영상 합성 작업을 유연하게 관리할 수 있다. 특히 이 같은 구조적 혁신 덕분에 Wan2.1-VACESNS 숏폼 영상의 빠른 제작 광고·마케팅용 콘텐츠 창작 영상 후반 작업 및 특수효과 적용 교육용 트레이닝 콘텐츠 제작 등 다양한 분야에서 폭넓게 활용될 수 있다.

 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (1).gif

영상 기반 AI 모델을 훈련하려면 막대한 연산 자원과 고품질 학습 데이터가 필요하다. Wan2.1-VACE는 오픈소스를 통해 이러한 장벽을 낮추고, 더 많은 기업이 빠르고 경제적인 방식으로 자사 니즈에 맞춘 고품질 영상 콘텐츠를 제작할 수 있도록 지원한다.

 

Wan2.1-VACE는 파라미터 수 기준으로 140(14B) 버전과 13(1.3B) 버전 두 가지 형태로 제공된다. 현재 해당 모델은 허깅페이스(Hugging Face), 깃허브(GitHub), 알리바바 클라우드 오픈소스 커뮤니티 모델스코프(ModelScope)에서 누구나 무료로 다운로드할 수 있다.

 

알리바바는 자사 개발 대규모 AI 모델을 가장 먼저 오픈소스로 공개한 글로벌 주요 기술 기업 중 하나로, 지난 2월에는 Wan2.1 시리즈의 4가지 모델을, 지난달에는 시작 및 종료 프레임 기반 영상 생성 모델을 각각 공개한 바 있다. 현재까지 해당 모델들은 허깅페이스와 모델스코프에서 총 330만 건 이상의 누적 다운로드를 기록하며 높은 관심을 받고 있다.

 

#알리바바#Wan2.1#VACE#

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
4189 마우저-ADI, <14인의 전문가가 제시하는 최신 모터 제어 애플리케이션의 동향 및 과제> 전자책 발간 file newsit 2025.05.19 171
4188 슈퍼마이크로, 차세대 직접 수냉식 솔루션 ‘DLC-2’ 공개…“데이터센터 에너지 사용량 최대 40%, TCO 최대 20% 절감” file newsit 2025.05.19 71
4187 HS효성인포메이션, '히타치 밴타라-해머스페이스' 차세대 데이터 인텔리전트 AI 인프라 솔루션 협력 발표 file newsit 2025.05.19 94
4186 마우저, 르네사스의 RZ/V2N 마이크로프로세서 공급…“첨단 비전 AI 기술을 지원” file newsit 2025.05.16 426
4185 AMD, 사우디 AI 기업 ‘휴메인(HUMAIN)’과 100억 달러 규모 글로벌 AI 인프라 협력 발표 file newsit 2025.05.16 332
4184 ST, AI 지원 초소형 센서 ‘LSM6DSV320X’ 센서 공개 file newsit 2025.05.16 315
» 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 file newsit 2025.05.16 278
4182 안랩 V3, AV-TEST의 2025년 첫번째 ‘지능형 위협 방어 테스트’서 만점 획득 file newsit 2025.05.16 125
4181 한국정보통신, 비대면 간편결제 ‘이지톡페이’ 공식 웹사이트 오픈 file newsit 2025.05.16 326
4180 캐논코리아, 창립 40주년 기념 미디어 라운드 테이블 성료 file newsit 2025.05.16 97
4179 엑셈, 1분기 기준 역대 최대 매출 달성…“전년 동기 대비 27.6% 상승” file newsit 2025.05.15 496
4178 [컴퓨텍스 2025] MSI, 획기적인 PC 및 메인보드 라인업 공개 file newsit 2025.05.15 88
4177 미루웨어, '국제인공지능대전 2025'에서 다양한 AI 솔루션 공개 file newsit 2025.05.15 479
4176 페이오니아, 1분기 실적 발표… 분기 매출 2억4660만달러 달성 file newsit 2025.05.15 324
4175 슈나이더 일렉트릭, ‘국제 전기전력 전시회 2025’ 참가…“50년의 노하우 담은 지속 가능한 미래 비전 제시” file newsit 2025.05.15 332
4174 ams OSRAM, 새로운 ‘청록색 레이저 다이오드’ 공개 file newsit 2025.05.15 423
4173 노르딕 세미컨덕터 nRF9151 모듈, DECT NR+ 기술 기반의 ‘스마트 미터링’ 솔루션 지원 file newsit 2025.05.15 226
4172 엔비디아, 사우디 휴메인과 미래형 AI 팩토리 구축 위한 전략적 파트너십 체결 file newsit 2025.05.15 303
4171 아비바코리아, 산업 지능 기반의 ‘디지털 트윈’ 전략 제시 file newsit 2025.05.15 370
4170 사이냅소프트, 내부 문서에 기반한 구축형 LLM ‘사이냅 어시스턴트' 출시 file newsit 2025.05.15 300
Board Pagination Prev 1 ... 35 36 37 38 39 40 41 42 43 44 ... 249 Next
/ 249
CLOSE