Fun IT Media - 알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개

Extra Form
참조#1	https://www.youtube.com/embed/762UIspGICA?feature=oembed
참조#2	http://www.alibabacloud.com

참조#1

https://www.youtube.com/embed/762UIspGICA?feature=oembed

참조#2

http://www.alibabacloud.com

알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개.PNG

알리바바 클라우드가 자사 큐원(Qwen) 시리즈의 통합 엔드투엔드 멀티모달 모델인 ‘Qwen2.5-Omni-7B’를 새롭게 공개했다.

이번 모델은 종합적인 멀티모달 인식을 위해 설계되어, 텍스트, 이미지, 음성, 영상 등 다양한 형태의 입력 정보를 처리하고 실시간 텍스트 및 자연스러운 음성 응답을 지원함으로써 모바일 기기와 노트북과 같은 엣지 디바이스에 최적화된 멀티모달 AI 기술의 새로운 표준을 제시한다.

Qwen2.5-Omni-7B는 7B(70억) 파라미터의 컴팩트한 설계에도 불구하고 성능 저하 없이 강력한 멀티모달 처리 능력을 제공한다. 이러한 고유한 조합은 특히 지능형 음성 애플리케이션과 같이 실질적인 가치를 제공하는 민첩하고 비용 효율적인 AI 에이전트 개발에 적합하다. 예를 들어 이 모델은 시각 장애인이 실시간 음성 설명을 통해 주변 환경을 인식하고 탐색할 수 있도록 지원하거나, 동영상 속 재료를 분석해 단계별 요리 가이드를 제공하는 데 활용될 수 있다. 또한 고객의 니즈를 정확히 이해하는 지능형 고객 응대 시스템 구현에도 적용 가능하다.

Qwen2.5-Omni-7B는 현재 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 오픈소스로 공개되었으며, 큐원 챗(Qwen Chat)과 알리바바 클라우드 오픈소스 커뮤니티인 모델스코프(ModelScope)를 통해서도 접근할 수 있다. 알리바바 클라우드는 지난 몇 년간 총 200개 이상의 생성형 AI 모델을 오픈소스로 공개한 바 있다.

혁신적 아키텍처 기반의 고성능 멀티모달 처리

Qwen2.5-Omni-7B는 모든 모달리티 중에서 뛰어난 성능을 발휘하며, 유사한 규모의 단일 모달리티 특화 모델과 비교해도 손색이 없다. 특히 실시간 음성 상호작용, 자연스럽고 안정적인 음성 생성, 엔드투엔드 음성 명령어 이행 등에서 업계 최고 수준의 벤치마크를 제시했다.

해당 모델의 효율성과 고성능은 혁신적인 아키텍처에서 비롯된다. 대표적으로 텍스트 생성(Thinker)과 음성 합성(Talker)을 분리하여 서로 다른 모달 간의 간섭을 최소화하는 ‘Thinker-Talker 아키텍처’, 일관된 콘텐츠 생성을 위해 비디오 입력과 오디오를 보다 잘 동기화하는 위치 임베딩 기술 TMRoPE(Time-aligned Multimodal RoPE), 그리고 끊김 없는 음성 상호작용을 위한 저지연 오디오 응답을 가능하게 하는 블록와이즈 스트리밍 처리 등이 적용되었다.

경량 모델임에도 불구하고 탁월한 성능

Qwen2.5-Omni-7B는 이미지-텍스트, 영상-텍스트, 영상-음성, 음성-텍스트, 텍스트 데이터를 포함한 방대하고 다양한 데이터셋을 기반으로 사전 학습되어 다양한 작업에서 강력한 성능을 보장한다.

알리바바 클라우드 엔드투엔드 멀티모달 AI 모델 Qwen2.5-Omni-7B 공개.jpg

혁신적인 아키텍처와 고품질 사전학습 데이터셋을 바탕으로 이 모델은 음성 명령을 정확히 이해하고 수행하는 데 뛰어난 성능을 보이며, 텍스트 입력만 사용하는 경우와 유사한 수준의 성능을 달성한다. 특히 시각, 청각(acoustic), 텍스트 정보를 통합적으로 인식, 해석, 추론하는 능력을 평가하는 OmniBench 벤치마크와 같이 다양한 모달리티를 통합적으로 처리해야 하는 작업에서도 Qwen2.5-Omni는 최고 수준의 성능을 기록했다.

Qwen2.5-Omni-7B는 인컨텍스트 러닝(ICL)을 통해 상황과 맥락에 따른 음성 이해 및 생성 능력을 향상시켰다. 또, 강화학습(RL) 기반 최적화를 통해 생성 안정성에서 상당한 향상을 보였으며, 음성 응답 시 주의력 분산, 발음 오류, 부자연스러운 정지 현상 등이 현저히 감소되었다.

한편, 알리바바 클라우드는 지난해 9월 Qwen2.5를 처음 공개한 데 이어, 올해 1월에는 ‘Qwen2.5-Max’를 출시해 Chatbot Arena에서 7위를 기록, 대등한 주요 상용 모델들 대비 뛰어난 성능을 입증한 바 있다. 또한, 시각 이해와 장문 입력 처리를 위한 모델인 ‘Qwen2.5-VL’과 ‘Qwen2.5-1M’ 등을 오픈소스로 공개했다.

#알리바바클라우드#Qwen#멀티모달#AI#

Atachment
첨부 '2'	알리바바 클라우드 엔드투엔드 멀티모달 AI 모델 Qwen2.5-Omni-7B 공개.jpg, 알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개.PNG,

List of Articles
번호	제목	글쓴이	날짜	조회 수
1633	사이냅소프트, 감성 충전 AI 다이어리 앱 사이다(SAIDA) 출시 - 답답한 마음 시원하게 AI 친구 '사이다'와 톡! - 글쓰기가 어렵다면? AI가 써주는 마법 같은 일기! 도큐먼트 AI 전문 기업 사이냅소프트가 바쁜 일상에 지친 현...	newsit	2025.04.24	572
1632	알리바바 클라우드, 최신 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’ 공개 알리바바 클라우드가 새로운 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’를 공개했다. 이번 모델은 시작 프레임과 종료 프레임을 입력값으로 활용해, 보다 정교...	newsit	2025.04.24	528
1631	다쏘시스템, 유네스코와 함께 세계 엔지니어링의 날 기념 다쏘시스템은 유네스코(UNESCO) 및 세계엔지니어링기구연맹(WFEO)과 파트너십을 맺고, 버추얼 트윈이 책임 있는 혁신적 비즈니스 관행을 촉진하고 유엔(UN) 지속...	newsit	2025.04.22	594
1630	윈드리버, 엣지 운영체제 플랫폼 시장에서 부동의 1위 수성 - VDC 리서치 최신 보고서에서 엣지 운영체제 시장 리더 기업으로 등재 - 실시간 운영체제, 커머셜 임베디드 리눅스, IoT, 임베디드 OS 전체 카테고리에서 장기간...	newsit	2025.04.21	644
1629	어플라이드 머티어리얼즈 코리아, ‘어플라이드와 함께하는 과학교실’ 5년 연속 후원 - 경기 남부지역 25개 지역아동센터 350여 명 초등학생 대상 실습 중심 과학 교육 - 반도체 공정 체험 가능한 아시아 STEAM 키트 제공… 임직원 참여 통해 눈높이 ...	newsit	2025.04.21	550
1628	크리테오, HSAD와 업무 협약 체결…“AI 기반 광고 솔루션으로 실질적인 성과 창출 지원” 커머스 미디어 기업 크리테오는 지난 8일 HSAD와 업무 협약을 체결하고 공동 사업 추진 방안에 대해 논의했다고 밝혔다. 업무 협약식에서는 갈수록 치열해지는 경...	newsit	2025.04.21	586
1627	인포빕, “메시징도 AI 시대… 국내 사용량 125% 급증” - AI 기반 메시징 도입 확산… 기업-소비자 간 소통 방식 변화와 고객 경험(CX) 향상에 기여 - 국내 기업-소비자 간 메시징 전년 대비 125% 증가… 왓츠앱 사용량 6...	newsit	2025.04.21	559
1626	다쏘시스템, ‘2025 SUSTAINABILITY FORUM’ 참여…“기술 기반 ESG 전략 제시” - 디지털 기반의 ESG 전략과 지속가능한 에너지 전환 방안 제시 - 2025 SUSTAINABILITY FORUM, 한국-유럽 협력의 중요성 및 디지털 기술 기반 ESG 전략 중요성 강...	newsit	2025.04.18	475
1625	매스웍스-포어텔릭스, 혁신적 툴체인 파트너십 체결…“마쯔다 차세대 자율주행 개발 가속화” - 가상 시뮬레이션 기술 통합으로 안전성 향상 및 개발 시간 단축 실현 매스웍스가 데이터 기반 자율주행 개발 툴체인 기업 포어텔릭스(Foretellix)와 전략적 기...	newsit	2025.04.17	513
1624	엔비디아, AI 수학 올림피아드서 1위… 추론 모델로 일반화 성능 입증 - 엔비디아 L4 GPU 4개로 구성된 클러스터로 5시간 동안 문제 50개 중 34개 풀이 - 자연어 추론과 파이썬 코드 실행 결합한 더 작고, 빠른 긴 사고 모델 구축 - ...	newsit	2025.04.17	441

분류

글쓴이

1633

사이냅소프트, 감성 충전 AI 다이어리 앱 사이다(SAIDA) 출시

- 답답한 마음 시원하게 AI 친구 '사이다'와 톡! - 글쓰기가 어렵다면? AI가 써주는 마법 같은 일기! 도큐먼트 AI 전문 기업 사이냅소프트가 바쁜 일상에 지친 현... file

newsit

2025.04.24

572

1632

알리바바 클라우드가 새로운 오픈소스 영상 생성 모델 ‘Wan2.1-FLF2V-14B’를 공개했다. 이번 모델은 시작 프레임과 종료 프레임을 입력값으로 활용해, 보다 정교... file

newsit

2025.04.24

528

1631

다쏘시스템, 유네스코와 함께 세계 엔지니어링의 날 기념

다쏘시스템은 유네스코(UNESCO) 및 세계엔지니어링기구연맹(WFEO)과 파트너십을 맺고, 버추얼 트윈이 책임 있는 혁신적 비즈니스 관행을 촉진하고 유엔(UN) 지속... file

newsit

2025.04.22

594

1630

윈드리버, 엣지 운영체제 플랫폼 시장에서 부동의 1위 수성

newsit

2025.04.21

644

1629

어플라이드 머티어리얼즈 코리아, ‘어플라이드와 함께하는 과학교실’ 5년 연속 후원

- 경기 남부지역 25개 지역아동센터 350여 명 초등학생 대상 실습 중심 과학 교육 - 반도체 공정 체험 가능한 아시아 STEAM 키트 제공… 임직원 참여 통해 눈높이 ... file

newsit

2025.04.21

550

1628

크리테오, HSAD와 업무 협약 체결…“AI 기반 광고 솔루션으로 실질적인 성과 창출 지원”

커머스 미디어 기업 크리테오는 지난 8일 HSAD와 업무 협약을 체결하고 공동 사업 추진 방안에 대해 논의했다고 밝혔다. 업무 협약식에서는 갈수록 치열해지는 경... file

newsit

2025.04.21

586

1627

인포빕, “메시징도 AI 시대… 국내 사용량 125% 급증”

- AI 기반 메시징 도입 확산… 기업-소비자 간 소통 방식 변화와 고객 경험(CX) 향상에 기여 - 국내 기업-소비자 간 메시징 전년 대비 125% 증가… 왓츠앱 사용량 6... file

newsit

2025.04.21

559

1626

다쏘시스템, ‘2025 SUSTAINABILITY FORUM’ 참여…“기술 기반 ESG 전략 제시”

- 디지털 기반의 ESG 전략과 지속가능한 에너지 전환 방안 제시 - 2025 SUSTAINABILITY FORUM, 한국-유럽 협력의 중요성 및 디지털 기술 기반 ESG 전략 중요성 강... file

newsit

2025.04.18

475

1625

매스웍스-포어텔릭스, 혁신적 툴체인 파트너십 체결…“마쯔다 차세대 자율주행 개발 가속화”

- 가상 시뮬레이션 기술 통합으로 안전성 향상 및 개발 시간 단축 실현 매스웍스가 데이터 기반 자율주행 개발 툴체인 기업 포어텔릭스(Foretellix)와 전략적 기... file

newsit

2025.04.17

513

1624

엔비디아, AI 수학 올림피아드서 1위… 추론 모델로 일반화 성능 입증

- 엔비디아 L4 GPU 4개로 구성된 클러스터로 5시간 동안 문제 50개 중 34개 풀이 - 자연어 추론과 파이썬 코드 실행 결합한 더 작고, 빠른 긴 사고 모델 구축 - ... file

newsit

2025.04.17

441

로지텍, 현대백화점 무역센터점 팝업스토어 오픈...업...	04-10
인텔, 구글과 AI 인프라 협력 확대...Xeon·IPU로 이기...	04-10
서비스나우, 전 제품 AI 네이티브 전환…컨텍스트 엔진...	04-10
닷핵 컨퍼런스 2026 성료, LLM 기반 취약점 분석·AI 레...	04-09
신한카드, 스테이블코인·블록체인 6대 PoC 완료…웹3 결...	04-09
MSI, 숙명여대서 RTX AI PC 캠퍼스 세미나 개최…RTX 기...	04-09
사이냅소프트, NIPA ‘2026 AX 원스톱 바우처’ 공급기업...	04-09
DJI, 8K 360° FPV 드론 Avata 360 국내 출시…몰입형 항...	04-09
스틸시리즈, 4K 폴링레이트 지원 Aerox 3 Wireless Gen...	04-09
뉴타닉스, 에이전틱 AI 멀티테넌트 기능 공개…네오클라...	04-09

소프트웨어·컴퓨팅

소프트웨어·컴퓨팅

알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개

단축키

단축키

소프트웨어·컴퓨팅