- 영상 제작 전 과정을 하나의 모델로 통합콘텐츠 창작 효율성과 생산성 대폭 향상 기대

 

알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (1).png

 

 

알리바바가 영상 생성 및 편집을 위한 최신 오픈소스 AI 모델 ‘Wan2.1-VACE(Video All-in-one Creation and Editing)’를 공식 발표했다.

 

이번 모델은 다양한 영상 처리 기능을 하나로 통합해 영상 제작 과정을 간소화하고, 크리에이터의 효율성과 생산성을 극대화하는 데 중점을 두었다. Wan2.1-VACE는 알리바바의 영상 생성 특화 대규모 모델 시리즈인 ‘Wan2.1’에 속하며, 영상 생성 및 편집 기능을 아우르는 업계 최초의 오픈소스 통합 모델이다.

 

해당 모델은 텍스트, 이미지, 영상 등 다양한 멀티모달 입력을 기반으로 영상 생성이 가능하며, 이미지나 특정 프레임을 참조해 편집하거나, 영상 내 선택 영역을 수정·재구성하고, 시공간 확장까지 지원하는 고급 편집 기능을 제공한다. 이를 통해 사용자는 여러 작업을 유연하게 결합해 더욱 창의적인 결과물을 만들 수 있다.

 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (2).png

Wan2.1-VACE는 이미지 샘플을 바탕으로 상호작용하는 객체가 포함된 영상을 생성하거나, 정적인 이미지를 자연스럽게 움직이게 하여 생동감을 부여할 수 있다. 포즈 전환, 움직임 제어, 깊이 조절, 색상 재처리 등의 기능도 포함돼 고도화된 영상 리페인팅을 지원한다.

 

또한, 영상 내 특정 영역을 주변에 영향을 주지 않고 수정하거나 삭제·추가할 수 있으며, 영상 경계를 확장하고 자동으로 자연스러운 콘텐츠를 생성해 시각적 풍부함을 더한다.

 

사용자는 정적인 이미지를 영상으로 변환하는 동시에 객체의 이동 경로를 지정해 움직임을 제어하거나, 특정 인물·사물을 참조해 치환 및 애니메이션 처리도 가능하다. 수직 이미지를 가로 영상으로 확장하면서 새로운 요소를 추가하는 작업 역시 손쉽게 수행할 수 있다.

 

혁신적인 기술 적용

Wan2.1-VACE는 다양한 영상 편집 작업의 니즈를 고려한 첨단 기술을 다수 적용했다. 멀티모달 입력(텍스트, 이미지, 영상, 마스크 등)을 일괄 처리하는 통합 인터페이스 ‘VCU(Video Condition Unit)’를 도입했으며, 시간적·공간적 요소를 정형화된 방식으로 표현하는 컨텍스트 어댑터(Context Adapter)’ 구조를 통해 각 작업 개념을 효율적으로 모델에 주입할 수 있도록 설계되었다.

 

이를 기반으로 폭넓은 영상 합성 작업을 유연하게 관리할 수 있다. 특히 이 같은 구조적 혁신 덕분에 Wan2.1-VACESNS 숏폼 영상의 빠른 제작 광고·마케팅용 콘텐츠 창작 영상 후반 작업 및 특수효과 적용 교육용 트레이닝 콘텐츠 제작 등 다양한 분야에서 폭넓게 활용될 수 있다.

 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (1).gif

영상 기반 AI 모델을 훈련하려면 막대한 연산 자원과 고품질 학습 데이터가 필요하다. Wan2.1-VACE는 오픈소스를 통해 이러한 장벽을 낮추고, 더 많은 기업이 빠르고 경제적인 방식으로 자사 니즈에 맞춘 고품질 영상 콘텐츠를 제작할 수 있도록 지원한다.

 

Wan2.1-VACE는 파라미터 수 기준으로 140(14B) 버전과 13(1.3B) 버전 두 가지 형태로 제공된다. 현재 해당 모델은 허깅페이스(Hugging Face), 깃허브(GitHub), 알리바바 클라우드 오픈소스 커뮤니티 모델스코프(ModelScope)에서 누구나 무료로 다운로드할 수 있다.

 

알리바바는 자사 개발 대규모 AI 모델을 가장 먼저 오픈소스로 공개한 글로벌 주요 기술 기업 중 하나로, 지난 2월에는 Wan2.1 시리즈의 4가지 모델을, 지난달에는 시작 및 종료 프레임 기반 영상 생성 모델을 각각 공개한 바 있다. 현재까지 해당 모델들은 허깅페이스와 모델스코프에서 총 330만 건 이상의 누적 다운로드를 기록하며 높은 관심을 받고 있다.

 

#알리바바#Wan2.1#VACE#

 
?

  1. 델, 최고급 컨슈머 노트북 ‘델 14∙16 프리미엄’ 첫 공개

  2. 노르딕, 퓨처 일렉트로닉스와 글로벌 유통 파트너십 체결

  3. TI, 폭스바겐 그룹 어워드 2025에서 ‘운영 우수상’ 수상

  4. 테스토코리아, HK와 국내 공식 대리점 계약 체결…“식품 안전 부문 시장 확대”

  5. 레노버, ‘ESG 연례 보고서’ 발표…ESG 성과로 업계 리더십 입증

  6. Qt그룹, 온코소프트에 Qt 플랫폼 활용한 'OncoStudio 2.0' 고도화 지원…의료 AI 시장 공략 강화

  7. 다쏘시스템, ‘아스콘 큐브’ 기술 인수…“공장 버추얼 트윈 전략 실행 가속화”

  8. AWS, 엔비디아 블랙웰 기반 AI 인프라 공개…차세대 AI용 컴퓨팅 솔루션 출시

  9. 지멘스, 국내 대표 연례 EDA 행사 ‘Siemens EDA Forum 2025’ 개최

  10. SK키파운드리-지멘스, 130nm 차량용 전력 반도체 공정 기반 ‘PERC PDK’ 출시

  11. 엠클라우드브리지, AOAI & Fabric 기반 데이터 분석 플랫폼 ‘Ai 365 데이터 에이전트’ 출시

  12. 스틸시리즈, 티켓 증정 이벤트 진행…“스틸시리즈 제품 구매하고 T1 홈그라운드 가자”

  13. 델, 한국 정부기관 생성형 AI 투자 증가 전망…“소버린 AI는 선택적 접근”

  14. 딥엘, 국내 직장인 대상 AI 활용 실태조사 결과 발표…10명 중 약 7명 “AI 번역기 사용한다”

  15. 톰슨로이터, AI시대 ‘전문직 미래 전망 2025’ 보고서 발표

  16. Ceva, 차세대 모션 제어 소프트웨어 솔루션 ‘모션 엔진 헥스’ 공개

  17. 지멘스, NX 최신 업데이트 발표…“AI 코파일럿과 몰입형 설계, 통합 시뮬레이션 기능 추가”

  18. 한국레노버, 전문가용 최신 씽크스테이션 및 워크스테이션 솔루션 출시

  19. 슈나이더 일렉트릭, 차세대 분산형 I/O 솔루션 ‘모디콘 엣지 I/O NTS’ 출시

  20. 트림블코리아, 국내 철골 제작사 대상 ‘테클라 파워팹 런칭 세미나’ 개최

Board Pagination Prev 1 ... 61 62 63 64 65 66 67 68 69 70 ... 289 Next
/ 289
CLOSE