- 에이전틱 코딩·멀티모달 추론·음성·영상 통합 처리 기반 AI 실행 범위 확대

 Qwen3.5-Omni-Plus 상세 기능.jpg

알리바바(Alibaba)가 에이전틱 실행 기반 코딩 모델 Qwen3.6-Plus와 텍스트·음성·이미지·영상 데이터를 통합 처리하는 옴니모달 모델 Qwen3.5-Omni를 공개했다. 복합 작업을 단계적으로 수행하는 실행 구조와 멀티모달 처리 범위를 확장해 소프트웨어 개발 자동화와 실시간 상호작용형 AI 적용 영역을 동시에 넓혔다.

 

에이전틱 실행 구조와 옴니모달 모델 병행 공개

두 모델은 서로 다른 활용 목적에 맞춰 개발됐다. Qwen3.6-Plus는 코드 생성 이후 테스트와 반복 개선 과정을 이어가는 에이전틱 실행 흐름에 초점을 맞췄으며 Qwen3.5-Omni는 텍스트·음성·이미지·영상 입력을 단일 모델에서 함께 처리하는 옴니모달 구조를 사용한다. 인식·추론·행동 단계를 하나의 흐름으로 연결해 다단계 작업을 연속적으로 수행한다.

 

Qwen3.6-Plus, 저장소 단위 엔지니어링 작업 자동화

Qwen3.6-Plus는 저장소(repository) 단위 코드 분석과 실제 시각 환경 기반 문제 해결을 수행하는 에이전틱 실행 모델이다. 능력 루프(Capability Loop)는 인식·추론·행동 단계를 하나의 워크플로로 연결해 코드 생성 이후 테스트와 반복 개선 과정을 이어가며 최대 100만 토큰 컨텍스트를 지원해 장문 문서와 대규모 코드베이스를 함께 분석한다.

 

멀티모달 추론 기능은 고밀도 문서 파싱, 실제 환경 이미지 해석, 장편 영상 이해 작업을 포함한다. UI 스크린샷, 손그림 와이어프레임, 제품 프로토타입을 입력 데이터로 활용해 프론트엔드 코드 생성까지 이어지는 시각적 코딩 기능을 제공한다.

 

Model StudioQwen Chat에서 사용할 수 있으며 OpenClaw, Claude Code, Cline 등 외부 개발 도구와 연동된다. 일부 모델은 개발자 친화적 규모의 오픈소스 형태로 공개될 예정이다.

 Qwen3.5-Omni-Plus, 주요 벤치마크에서 최고 수준 성능 달성.png

Qwen3.5-Omni, 텍스트·음성·영상 통합 처리 모델

Qwen3.5-Omni는 텍스트, 음성, 이미지, 영상 데이터를 하나의 모델에서 함께 처리하는 옴니모달 AI 모델이다. 텍스트와 음성을 출력 형태로 제공하며 실시간 상호작용과 오프라인 분석 작업을 하나의 실행 흐름에서 수행한다. 라이브 스트리밍, 음성 비서, 영상 자막 생성과 같은 멀티모달 기반 서비스에 활용된다.

 Qwen3.6-Plus, 주요 벤치마크에서 경쟁 모델 대비 우수한 성능 입증.png

Plus·Flash·Light 세 가지 버전으로 제공되며 최대 256K 토큰 컨텍스트를 지원한다. Qwen3.5-Omni-Plus200개 이상의 벤치마크에서 상위 수준 결과를 기록했으며 음성 이해, 추론, 음성 인식, 다국어 번역 영역에서 성능 평가 범위를 넓혔다.

 

Hybrid-Attention Mixture-of-Experts 아키텍처를 기반으로 10시간 이상의 연속 오디오 입력을 처리하며 1억 시간 이상의 음성·영상 데이터를 포함한 학습 데이터를 활용했다. 음성 인식은 113개 언어와 방언, 음성 생성은 36개 언어를 지원한다.

 

장면 단위 분할과 타임스탬프 정렬을 통해 등장인물 관계와 맥락 정보를 포함한 구조화된 설명을 생성한다. Audio-Visual Vibe Coding 기능은 음성 설명과 스케치를 입력 데이터로 활용해 앱·웹 인터페이스 프로토타입 생성 흐름을 제공한다. ARIA(Adaptive Rate Interleave Alignment) 기술을 적용해 스트리밍 환경에서 음성 합성 안정성을 높였다.

 

#알리바바 #Qwen #Qwen36Plus #Qwen35Omni #에이전틱AI #옴니모달AI #멀티모달 #MixtureofExperts #AI코딩 #AudioVisualAI

 

 
?

  1. 서비스나우, 전 제품 AI 네이티브 전환…컨텍스트 엔진으로 워크플로우 의사결정 통합

    - 데이터·거버넌스·실행 기능 기본 포함, 별도 애드온 없이 AI 운영 시작 서비스나우가 컨텍스트 엔진(Context Engine)을 중심으로 AI 네이티브 플랫폼 전략을 공개하며 전 제품에 데이터 연결, 워크플로우 실행, 보안 및 거버넌스를 기본 포함하는 방식으로 ...
    Date2026.04.10 Bynewsit Views50
    Read More
  2. 닷핵 컨퍼런스 2026 성료, LLM 기반 취약점 분석·AI 레드팀 전략 공유

    - 코엑스서 600여 명 참가, 드림핵 인비테이셔널 해킹방어대회 결승 진행 닷핵 컨퍼런스 2026(.HACK Conference 2026)가 코엑스에서 이틀간 진행되며 LLM기반 취약점 분석과 AI 레드팀(AI Red Team) 운영 등 최신 보안 기술 적용 사례를 공유했다. AI·LLM 기반...
    Date2026.04.09 Bynewsit Views49
    Read More
  3. 신한카드, 스테이블코인·블록체인 6대 PoC 완료…웹3 결제 적용 가능성 확인

    - P2P 결제·크로스보더 정산·하드월렛 카드 등 웹3 기반 결제 모델 테스트 신한카드가 스테이블코인과 블록체인 기반 6대 핵심 기술 과제 개념 검증(PoC)을 진행하며 디지털자산 결제와 기존 카드 인프라를 연계하는 웹3 기반 결제 적용 가능성을 확인했다. 스...
    Date2026.04.09 Bynewsit Views42
    Read More
  4. MSI, 숙명여대서 RTX AI PC 캠퍼스 세미나 개최…RTX 기반 AI 활용 환경 소개

    - RTX GPU 기반 AI PC 활용 사례 및 체험 전시 운영 MSI가 엔비디아와 공동으로 숙명여자대학교에서 ‘RTX AI PC 캠퍼스 세미나’를 개최하고 GPU 기반 AI 기술 활용 사례와 AI PC 환경을 소개했다. RTX GPU 기반 AI 활용 사례 발표 행사는 숙명여자대학교 눈꽃...
    Date2026.04.09 Bynewsit Views50
    Read More
  5. 사이냅소프트, NIPA ‘2026 AX 원스톱 바우처’ 공급기업 선정…Document AI 기반 AX 구축 지원 확대

    - 자체 데이터 학습·프롬프트 엔지니어링 기술 검증 통과 사이냅소프트가 정보통신산업진흥원(NIPA)이 주관하는 ‘2026년 AX 원스톱 바우처 지원사업’ 공급기업으로 선정되며 Document AI 기반 전사적 인공지능 전환(AX) 구축 지원 범위를 확대한다. Document A...
    Date2026.04.09 Bynewsit Views44
    Read More
  6. DJI, 8K 360° FPV 드론 Avata 360 국내 출시…몰입형 항공 촬영 지원 확대

    - 듀얼 센서 기반 8K 360° 영상·O4+ 전송 시스템 적용 DJI가 8K 360° 촬영을 지원하는 FPV 드론 Avata 360을 국내 출시하며 360° 영상 기록과 FPV 비행을 결합한 몰입형 항공 촬영 환경을 제공한다. 8K 360° 촬영 기반 몰입형 콘텐츠 제작 지원 아바타 360(Ava...
    Date2026.04.09 Bynewsit Views49
    Read More
  7. 스틸시리즈, 4K 폴링레이트 지원 Aerox 3 Wireless Gen 2 출시…QcK Heavy 신규 컬러 공개

    - 최대 4,000Hz 폴링레이트 및 최대 200시간 배터리, FPS 환경 대응 성능 강화 스틸시리즈가 4K 폴링레이트를 지원하는 무선 게이밍 마우스 Aerox 3 Wireless Gen 2와 QcK Heavy 게이밍 마우스패드를 국내 출시한다. 4K 폴링레이트 기반 입력 지연 감소 Aerox ...
    Date2026.04.09 Bynewsit Views32
    Read More
  8. 뉴타닉스, 에이전틱 AI 멀티테넌트 기능 공개…네오클라우드 AI 서비스 운영 지원

    - AI 관리 포털 기반 GPUaaS·KaaS 등 서비스형 AI 플랫폼 구축 뉴타닉스가 에이전틱 AI(Agentic AI) 솔루션에 멀티테넌트와 관리 포털 기능을 추가하고 네오클라우드 사업자가 AI 서비스를 운영할 수 있는 플랫폼 범위를 확대한다. GPU 자원 활용 수요가 증가...
    Date2026.04.09 Bynewsit Views47
    Read More
  9. 팔로알토 네트웍스, Vertex AI 인증정보 접근 가능성 공개…AI 에이전트 권한 관리 이슈

    - 서비스 계정 권한 범위 통해 데이터 접근 가능성 확인 팔로알토 네트웍스가 구글 클라우드 Vertex AI 에이전트 환경에서 서비스 계정 권한 구조를 악용할 수 있는 보안 리스크를 공개했다. AI 에이전트가 내부 인증 정보를 활용해 추가 권한을 획득할 수 있...
    Date2026.04.09 Bynewsit Views46
    Read More
  10. 세일즈포스, 맞춤형 AI 에이전트 슬랙봇 공개… 에이전틱 엔터프라이즈 비전 제시

    - 슬랙 중심 사람·에이전트·데이터 협업 구조 제시 세일즈포스가 맞춤형 AI 에이전트 슬랙봇(Slackbot)을 국내에 공개하고 슬랙을 중심으로 한 에이전틱 엔터프라이즈(Agentic Enterprise) 비전과 전략을 제시했다. 세일즈포스 코리아 박세진 대표는 슬랙을 사...
    Date2026.04.08 Bynewsit Views31
    Read More
  11. 인텔, 산토쉬 비스와나탄 APJ 총괄 선임…아시아태평양·일본 지역 리더십 확대

    - 인도 총괄에서 APJ 지역 총괄로 역할 확대…고객·파트너 협력 강화 - 글로벌 영업 운영 경험 기반 지역 성장 전략 추진 인텔이 산토쉬 비스와나탄(Santhosh Viswanathan) 인도 총괄을 아시아 태평양 및 일본(APJ) 지역 총괄로 선임했다. 통합된 리더십 체계 ...
    Date2026.04.08 Bynewsit Views32
    Read More
  12. 후지소프트, AMD Embedded+ 기반 AI 영상 보안 구현…CPU·FPGA 이종 컴퓨팅 적용

    - Ryzen Embedded와 Versal AI Edge 결합…실시간 객체 인식 기반 영상 분석 수행 후지소프트가 AMD 임베디드+(Embedded+) 플랫폼 기반 AI 영상 보안 시스템 적용 사례를 공개했다. 라이젠 임베디드(Ryzen Embedded) 프로세서와 버설 AI 엣지(Versal AI Edge) ...
    Date2026.04.08 Bynewsit Views49
    Read More
  13. 안랩, 정책·보조금 위장 광고 앱 주의…악성 기능 추가 가능성  

    - 정부 정책·공모주·대출 정보 제공 앱으로 위장해 광고 반복 노출 안랩이 공식 앱스토어에서 정책 정보 제공 앱으로 위장한 광고 기반 앱 다수를 발견하고 사용자 주의를 당부했다. 해당 앱은 정부 정책·보조금, 공모주, 대출 정보 제공을 표방하지만 실제 사...
    Date2026.04.07 Bynewsit Views53
    Read More
  14. 마우저, 암페놀 윌콕슨 VDS130 공급… IEPE 진동 데이터를 MQTT 기반 IIoT로 변환

    - 4채널 IEPE 입력 기반 진동 데이터 분석·클라우드 연동 지원 마우저가 암페놀 윌콕슨의 4채널 디지털 컨버터 VDS130 진동 데이터 소스를 공급한다. IEPE 기반 아날로그 진동 신호를 MQTT 형식으로 변환해 설비 상태 데이터를 클라우드 분석 시스템으로 전달...
    Date2026.04.07 Bynewsit Views56
    Read More
  15. 힐셔, HIMA와 SIL 3 대응 안전 통신 평가키트 공개… HICore 1·netX 90 통합

    - 단일 하드웨어에서 기능 안전·산업용 네트워크 통합 구현 힐셔가 HIMA와 협력해 기능 안전 통신 구현을 위한 통합 평가키트를 공개했다. HIMA의 안전 SoC ‘하이코어 1(HICore 1)’과 힐셔의 멀티프로토콜 통신 컨트롤러 ‘넷엑스 90(netX 90)’을 단일 하드웨어...
    Date2026.04.07 Bynewsit Views64
    Read More
  16. 윈드리버, AMD와 오픈랜·AI-RAN 통합 플랫폼 공개…단일 인프라로 RAN·AI 동시 운영

    - AMD EPYC 기반 단일 하드웨어에서 가상화 RAN과 AI 추론 워크로드 통합 윈드리버가 AMD와 협력해 오픈랜(Open RAN)과 AI-RAN 워크로드를 단일 인프라에서 통합 운영할 수 있는 상용 플랫폼을 공개했다. RAN 기능과 AI 애플리케이션을 별도 시스템에서 운영하...
    Date2026.04.07 Bynewsit Views36
    Read More
  17. 오토폼, K-제조 위한 디지털 금형 전략 발표… 숙련 기술 AI 전환

    오토폼이 AI 시뮬레이션과 디지털 트윈 기반 금형 로드맵을 공개하며 제조 현장의 숙련 기술을 데이터 자산으로 전환해 공정 예측 정확도와 품질 일관성을 높인다. AI 기반 금형 설계 판단 기준 데이터 축적 제조 산업은 숙련 인력 감소로 공정 판단 기준이 개...
    Date2026.04.07 Bynewsit Views50
    Read More
  18. 삼성전자·ETRI·프라임마스, CXL 기반 메모리 중심 컴퓨팅 구조 공동 개발

    - 칩렛 CXL 컨트롤러·대용량 DRAM·시스템 통합으로 초거대 메모리 확장 구현 삼성전자와 한국전자통신연구원(ETRI), 프라임마스(Primemas)가 CXL 기반 초거대용량 메모리 확장 솔루션 공동 개발에 착수했다. 메모리 풀링과 패브릭 인터커넥트를 결합한 메모리 ...
    Date2026.04.06 Bynewsit Views54
    Read More
  19. 카스퍼스키, 2025 한국 보안 위협 보고서 발표…웹 공격 650만건·로컬 위협 919만건 탐지

    - KSN 기반 웹·이동식 매체 위협 동시 증가 카스퍼스키(Kaspersky)가 ‘2025년 한국 사이버 위협 현황’ 보고서를 발표했다. 카스퍼스키 시큐리티 네트워크(KSN) 분석 결과 웹 기반 공격 650만건, 로컬 위협 919만건이 탐지되며 웹과 이동식 매체를 통한 악성코...
    Date2026.04.06 Bynewsit Views55
    Read More
  20. 알리바바, Qwen3.6-Plus·Qwen3.5-Omni 공개…에이전틱 실행과 옴니모달 처리 동시 확장

    - 에이전틱 코딩·멀티모달 추론·음성·영상 통합 처리 기반 AI 실행 범위 확대 알리바바(Alibaba)가 에이전틱 실행 기반 코딩 모델 Qwen3.6-Plus와 텍스트·음성·이미지·영상 데이터를 통합 처리하는 옴니모달 모델 Qwen3.5-Omni를 공개했다. 복합 작업을 단계적...
    Date2026.04.06 Bynewsit Views50
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 288 Next
/ 288
CLOSE