- 에이전틱 코딩·멀티모달 추론·음성·영상 통합 처리 기반 AI 실행 범위 확대

 Qwen3.5-Omni-Plus 상세 기능.jpg

알리바바(Alibaba)가 에이전틱 실행 기반 코딩 모델 Qwen3.6-Plus와 텍스트·음성·이미지·영상 데이터를 통합 처리하는 옴니모달 모델 Qwen3.5-Omni를 공개했다. 복합 작업을 단계적으로 수행하는 실행 구조와 멀티모달 처리 범위를 확장해 소프트웨어 개발 자동화와 실시간 상호작용형 AI 적용 영역을 동시에 넓혔다.

 

에이전틱 실행 구조와 옴니모달 모델 병행 공개

두 모델은 서로 다른 활용 목적에 맞춰 개발됐다. Qwen3.6-Plus는 코드 생성 이후 테스트와 반복 개선 과정을 이어가는 에이전틱 실행 흐름에 초점을 맞췄으며 Qwen3.5-Omni는 텍스트·음성·이미지·영상 입력을 단일 모델에서 함께 처리하는 옴니모달 구조를 사용한다. 인식·추론·행동 단계를 하나의 흐름으로 연결해 다단계 작업을 연속적으로 수행한다.

 

Qwen3.6-Plus, 저장소 단위 엔지니어링 작업 자동화

Qwen3.6-Plus는 저장소(repository) 단위 코드 분석과 실제 시각 환경 기반 문제 해결을 수행하는 에이전틱 실행 모델이다. 능력 루프(Capability Loop)는 인식·추론·행동 단계를 하나의 워크플로로 연결해 코드 생성 이후 테스트와 반복 개선 과정을 이어가며 최대 100만 토큰 컨텍스트를 지원해 장문 문서와 대규모 코드베이스를 함께 분석한다.

 

멀티모달 추론 기능은 고밀도 문서 파싱, 실제 환경 이미지 해석, 장편 영상 이해 작업을 포함한다. UI 스크린샷, 손그림 와이어프레임, 제품 프로토타입을 입력 데이터로 활용해 프론트엔드 코드 생성까지 이어지는 시각적 코딩 기능을 제공한다.

 

Model StudioQwen Chat에서 사용할 수 있으며 OpenClaw, Claude Code, Cline 등 외부 개발 도구와 연동된다. 일부 모델은 개발자 친화적 규모의 오픈소스 형태로 공개될 예정이다.

 Qwen3.5-Omni-Plus, 주요 벤치마크에서 최고 수준 성능 달성.png

Qwen3.5-Omni, 텍스트·음성·영상 통합 처리 모델

Qwen3.5-Omni는 텍스트, 음성, 이미지, 영상 데이터를 하나의 모델에서 함께 처리하는 옴니모달 AI 모델이다. 텍스트와 음성을 출력 형태로 제공하며 실시간 상호작용과 오프라인 분석 작업을 하나의 실행 흐름에서 수행한다. 라이브 스트리밍, 음성 비서, 영상 자막 생성과 같은 멀티모달 기반 서비스에 활용된다.

 Qwen3.6-Plus, 주요 벤치마크에서 경쟁 모델 대비 우수한 성능 입증.png

Plus·Flash·Light 세 가지 버전으로 제공되며 최대 256K 토큰 컨텍스트를 지원한다. Qwen3.5-Omni-Plus200개 이상의 벤치마크에서 상위 수준 결과를 기록했으며 음성 이해, 추론, 음성 인식, 다국어 번역 영역에서 성능 평가 범위를 넓혔다.

 

Hybrid-Attention Mixture-of-Experts 아키텍처를 기반으로 10시간 이상의 연속 오디오 입력을 처리하며 1억 시간 이상의 음성·영상 데이터를 포함한 학습 데이터를 활용했다. 음성 인식은 113개 언어와 방언, 음성 생성은 36개 언어를 지원한다.

 

장면 단위 분할과 타임스탬프 정렬을 통해 등장인물 관계와 맥락 정보를 포함한 구조화된 설명을 생성한다. Audio-Visual Vibe Coding 기능은 음성 설명과 스케치를 입력 데이터로 활용해 앱·웹 인터페이스 프로토타입 생성 흐름을 제공한다. ARIA(Adaptive Rate Interleave Alignment) 기술을 적용해 스트리밍 환경에서 음성 합성 안정성을 높였다.

 

#알리바바 #Qwen #Qwen36Plus #Qwen35Omni #에이전틱AI #옴니모달AI #멀티모달 #MixtureofExperts #AI코딩 #AudioVisualAI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
2361 신한카드, 스테이블코인·블록체인 6대 PoC 완료…웹3 결제 적용 가능성 확인 - P2P 결제·크로스보더 정산·하드월렛 카드 등 웹3 기반 결제 모델 테스트 신한카드가 스테이블코인과 블록체인 기반 6대 핵심 기술 과제 개념 검증(PoC)을 진행... file newsit 2026.04.09 10
2360 사이냅소프트, NIPA ‘2026 AX 원스톱 바우처’ 공급기업 선정…Document AI 기반 AX 구축 지원 확대 - 자체 데이터 학습·프롬프트 엔지니어링 기술 검증 통과 사이냅소프트가 정보통신산업진흥원(NIPA)이 주관하는 ‘2026년 AX 원스톱 바우처 지원사업’ 공급기업으... file newsit 2026.04.09 13
2359 뉴타닉스, 에이전틱 AI 멀티테넌트 기능 공개…네오클라우드 AI 서비스 운영 지원 - AI 관리 포털 기반 GPUaaS·KaaS 등 서비스형 AI 플랫폼 구축 뉴타닉스가 에이전틱 AI(Agentic AI) 솔루션에 멀티테넌트와 관리 포털 기능을 추가하고 네오클라... file newsit 2026.04.09 14
2358 세일즈포스, 맞춤형 AI 에이전트 슬랙봇 공개… 에이전틱 엔터프라이즈 비전 제시 - 슬랙 중심 사람·에이전트·데이터 협업 구조 제시 세일즈포스가 맞춤형 AI 에이전트 슬랙봇(Slackbot)을 국내에 공개하고 슬랙을 중심으로 한 에이전틱 엔터프라... file newsit 2026.04.08 26
2357 인텔, 산토쉬 비스와나탄 APJ 총괄 선임…아시아태평양·일본 지역 리더십 확대 - 인도 총괄에서 APJ 지역 총괄로 역할 확대…고객·파트너 협력 강화 - 글로벌 영업 운영 경험 기반 지역 성장 전략 추진 인텔이 산토쉬 비스와나탄(Santhosh Visw... file newsit 2026.04.08 26
2356 윈드리버, AMD와 오픈랜·AI-RAN 통합 플랫폼 공개…단일 인프라로 RAN·AI 동시 운영 - AMD EPYC 기반 단일 하드웨어에서 가상화 RAN과 AI 추론 워크로드 통합 윈드리버가 AMD와 협력해 오픈랜(Open RAN)과 AI-RAN 워크로드를 단일 인프라에서 통합 ... file newsit 2026.04.07 31
2355 오토폼, K-제조 위한 디지털 금형 전략 발표… 숙련 기술 AI 전환 오토폼이 AI 시뮬레이션과 디지털 트윈 기반 금형 로드맵을 공개하며 제조 현장의 숙련 기술을 데이터 자산으로 전환해 공정 예측 정확도와 품질 일관성을 높인다... file newsit 2026.04.07 38
» 알리바바, Qwen3.6-Plus·Qwen3.5-Omni 공개…에이전틱 실행과 옴니모달 처리 동시 확장 - 에이전틱 코딩·멀티모달 추론·음성·영상 통합 처리 기반 AI 실행 범위 확대 알리바바(Alibaba)가 에이전틱 실행 기반 코딩 모델 Qwen3.6-Plus와 텍스트·음성·이... file newsit 2026.04.06 44
2353 한국레노버, 산업용 AI 엣지 컴퓨팅 ‘씽크엣지’ 2종 출시…온디바이스 처리로 지연 최소화 - 씽크엣지 SE30n·SE60n, 최대 97 TOPS 기반 실시간 산업 데이터 분석 지원 한국레노버가 산업 환경에 최적화된 AI 엣지 컴퓨팅 솔루션 씽크엣지(ThinkEdge) 2종... file newsit 2026.04.06 34
2352 사이냅소프트, 문서 AI·RAG 기반 도서관 AX 전환 지원 - 문서 AI 4종으로 학술 데이터 지식화 및 검색 자동화 기능 공개 사이냅소프트가 제24차 한국학술정보협의회 콘퍼런스에서 문서 AI(Document AI) 기반 도서관 업... file newsit 2026.04.03 35
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 237 Next
/ 237
CLOSE