- 영상 제작 전 과정을 하나의 모델로 통합콘텐츠 창작 효율성과 생산성 대폭 향상 기대

 

알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (1).png

 

 

알리바바가 영상 생성 및 편집을 위한 최신 오픈소스 AI 모델 ‘Wan2.1-VACE(Video All-in-one Creation and Editing)’를 공식 발표했다.

 

이번 모델은 다양한 영상 처리 기능을 하나로 통합해 영상 제작 과정을 간소화하고, 크리에이터의 효율성과 생산성을 극대화하는 데 중점을 두었다. Wan2.1-VACE는 알리바바의 영상 생성 특화 대규모 모델 시리즈인 ‘Wan2.1’에 속하며, 영상 생성 및 편집 기능을 아우르는 업계 최초의 오픈소스 통합 모델이다.

 

해당 모델은 텍스트, 이미지, 영상 등 다양한 멀티모달 입력을 기반으로 영상 생성이 가능하며, 이미지나 특정 프레임을 참조해 편집하거나, 영상 내 선택 영역을 수정·재구성하고, 시공간 확장까지 지원하는 고급 편집 기능을 제공한다. 이를 통해 사용자는 여러 작업을 유연하게 결합해 더욱 창의적인 결과물을 만들 수 있다.

 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (2).png

Wan2.1-VACE는 이미지 샘플을 바탕으로 상호작용하는 객체가 포함된 영상을 생성하거나, 정적인 이미지를 자연스럽게 움직이게 하여 생동감을 부여할 수 있다. 포즈 전환, 움직임 제어, 깊이 조절, 색상 재처리 등의 기능도 포함돼 고도화된 영상 리페인팅을 지원한다.

 

또한, 영상 내 특정 영역을 주변에 영향을 주지 않고 수정하거나 삭제·추가할 수 있으며, 영상 경계를 확장하고 자동으로 자연스러운 콘텐츠를 생성해 시각적 풍부함을 더한다.

 

사용자는 정적인 이미지를 영상으로 변환하는 동시에 객체의 이동 경로를 지정해 움직임을 제어하거나, 특정 인물·사물을 참조해 치환 및 애니메이션 처리도 가능하다. 수직 이미지를 가로 영상으로 확장하면서 새로운 요소를 추가하는 작업 역시 손쉽게 수행할 수 있다.

 

혁신적인 기술 적용

Wan2.1-VACE는 다양한 영상 편집 작업의 니즈를 고려한 첨단 기술을 다수 적용했다. 멀티모달 입력(텍스트, 이미지, 영상, 마스크 등)을 일괄 처리하는 통합 인터페이스 ‘VCU(Video Condition Unit)’를 도입했으며, 시간적·공간적 요소를 정형화된 방식으로 표현하는 컨텍스트 어댑터(Context Adapter)’ 구조를 통해 각 작업 개념을 효율적으로 모델에 주입할 수 있도록 설계되었다.

 

이를 기반으로 폭넓은 영상 합성 작업을 유연하게 관리할 수 있다. 특히 이 같은 구조적 혁신 덕분에 Wan2.1-VACESNS 숏폼 영상의 빠른 제작 광고·마케팅용 콘텐츠 창작 영상 후반 작업 및 특수효과 적용 교육용 트레이닝 콘텐츠 제작 등 다양한 분야에서 폭넓게 활용될 수 있다.

 알리바바, 영상 생성·편집 위한 올인원 오픈소스 모델 ‘Wan2.1-VACE’ 공개 (1).gif

영상 기반 AI 모델을 훈련하려면 막대한 연산 자원과 고품질 학습 데이터가 필요하다. Wan2.1-VACE는 오픈소스를 통해 이러한 장벽을 낮추고, 더 많은 기업이 빠르고 경제적인 방식으로 자사 니즈에 맞춘 고품질 영상 콘텐츠를 제작할 수 있도록 지원한다.

 

Wan2.1-VACE는 파라미터 수 기준으로 140(14B) 버전과 13(1.3B) 버전 두 가지 형태로 제공된다. 현재 해당 모델은 허깅페이스(Hugging Face), 깃허브(GitHub), 알리바바 클라우드 오픈소스 커뮤니티 모델스코프(ModelScope)에서 누구나 무료로 다운로드할 수 있다.

 

알리바바는 자사 개발 대규모 AI 모델을 가장 먼저 오픈소스로 공개한 글로벌 주요 기술 기업 중 하나로, 지난 2월에는 Wan2.1 시리즈의 4가지 모델을, 지난달에는 시작 및 종료 프레임 기반 영상 생성 모델을 각각 공개한 바 있다. 현재까지 해당 모델들은 허깅페이스와 모델스코프에서 총 330만 건 이상의 누적 다운로드를 기록하며 높은 관심을 받고 있다.

 

#알리바바#Wan2.1#VACE#

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
1691 엔비디아, MS와 함께 RTX AI PC 생태계 확장 - 윈도우 ML 기반 ‘RTX용 엔비디아 텐서RT’로 AI 성능 대폭 강화 - 새로운 엔비디아 NIM 마이크로서비스와 AI 블루프린트로 개발자 워크플로우 혁신 - 프로젝트 G... file newsit 2025.05.21 338
1690 SAP, 연례 콘퍼런스 ‘SAP사파이어 2025’ 개최…“AI 혁신으로 업무 생산성 최대 30% 향상” - 기업 운영 방식 재정의할 비즈니스 AI 공개 - 퍼플렉시티 및 팔란티어와의 파트너십 통해 고객의 잠재력 극대화 SAP가 20일 미국 플로리다 올랜도에서 SAP의 연... file newsit 2025.05.21 440
1689 피아이이, 판교 위든타워에 ‘PIE AI R&D Campus’ 설립…“서강대와 산학협력 본격화” - ‘AI+X’ 융합 기술 중심 연구 거점 구축…이차전지 넘어 첨단 산업 맞춤형 AI 솔루션 확대 - 서강대와 산학협력으로 최신 AI 기술의 산업 적용 가속화 및 실용적 ... file newsit 2025.05.21 394
1688 레드햇, ‘레드햇 엔터프라이즈 리눅스 10’ 출시…“하이브리드 환경에서 인텔리전스 및 보안 강화” - IT 혁신 위한 견고한 기반 ‘RHEL 10’, AI 기반 리눅스 관리 통해 더욱 지능적인 하이브리드 클라우드 운영 지원 - 미래 양자 기반 위협 완화 위한 보안 기능 추... file newsit 2025.05.21 376
1687 [DTW 2025] 델, 소프트웨어 기반의 분리형 인프라로 혁신적인 데이터센터 운영 전략 제시 - 분리형 인프라스트럭처 전략의 토대로 스토리지 성능 및 사이버 회복탄력성 관련 제품 기능 강화 - 소프트웨어 개발로 프라이빗 클라우드 및 엣지 솔루션의 관... file newsit 2025.05.21 390
1686 슬랙, NH투자증권 혁신금융서비스 지정 승인…“금융 산업의 디지털 업무 환경 구축 선도” - NH투자증권, 국내 최초 혁신금융서비스 지정 승인 기반의 슬랙 도입 - 온프레미스 시스템 한계 극복… 실시간 커뮤니케이션 및 자동화로 생산성 극대화 - 고객 ... file newsit 2025.05.21 566
1685 사이냅소프트, 국내 최대 B2B 오픈마켓 도매꾹에 ‘사이냅 OCR Pro’ 공급 - 사이냅 OCR Pro, 대형 이미지 문제 해결 생산성 극대화 사이냅소프트는 자사의 AI기술이 적용된 ‘사이냅 OCR Pro’를 국내 최대 B2B 오픈마켓 ‘도매꾹·도매매’에... file newsit 2025.05.20 383
1684 [Computex 2025] 엔비디아, 폭스콘·대만 정부와 협력해 AI 팩토리 구축 - 폭스콘 자회사 빅 이노베이션 컴퍼니, 엔비디아 블랙웰 GPU 10,000개 탑재한 엔비디아 블랙웰 슈퍼컴퓨터 구축 - TSMC, 연구 개발 위해 빅 이노베이션 컴퍼니 ... file newsit 2025.05.20 366
1683 델, 엔비디아와 협력해 차세대 엔터프라이즈 AI 솔루션 공개 - 새롭게 업데이트 된 ‘엔비디아 기반 델 AI 팩토리’, 컴퓨팅 및 데이터 처리 가속화를 위한 혁신 주도, 운영 간소화, AI 구축의 모든 단계에서 더 빠른 성과 내... file newsit 2025.05.20 384
1682 [Computex 2025] 엔비디아, 세계 최대 규모 양자 연구용 슈퍼컴퓨터 ‘ABCI-Q’ 지원 - 퀀텀2 인피니밴드 네트워킹 플랫폼으로 상호 연결된 H100 GPU 2,020개 탑재 - 다양한 큐비트 양식 전반에 걸쳐 하이브리드 양자 GPU 작업 실현 엔비디아가 양자... file newsit 2025.05.19 588
목록
Board Pagination Prev 1 ... 45 46 47 48 49 50 51 52 53 54 ... 219 Next
/ 219
CLOSE