알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개.PNG

알리바바 클라우드가 자사 큐원(Qwen) 시리즈의 통합 엔드투엔드 멀티모달 모델인 ‘Qwen2.5-Omni-7B’를 새롭게 공개했다.

 

이번 모델은 종합적인 멀티모달 인식을 위해 설계되어, 텍스트, 이미지, 음성, 영상 등 다양한 형태의 입력 정보를 처리하고 실시간 텍스트 및 자연스러운 음성 응답을 지원함으로써 모바일 기기와 노트북과 같은 엣지 디바이스에 최적화된 멀티모달 AI 기술의 새로운 표준을 제시한다.

 

Qwen2.5-Omni-7B7B(70) 파라미터의 컴팩트한 설계에도 불구하고 성능 저하 없이 강력한 멀티모달 처리 능력을 제공한다. 이러한 고유한 조합은 특히 지능형 음성 애플리케이션과 같이 실질적인 가치를 제공하는 민첩하고 비용 효율적인 AI 에이전트 개발에 적합하다. 예를 들어 이 모델은 시각 장애인이 실시간 음성 설명을 통해 주변 환경을 인식하고 탐색할 수 있도록 지원하거나, 동영상 속 재료를 분석해 단계별 요리 가이드를 제공하는 데 활용될 수 있다. 또한 고객의 니즈를 정확히 이해하는 지능형 고객 응대 시스템 구현에도 적용 가능하다.

 

Qwen2.5-Omni-7B는 현재 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 오픈소스로 공개되었으며, 큐원 챗(Qwen Chat)과 알리바바 클라우드 오픈소스 커뮤니티인 모델스코프(ModelScope)를 통해서도 접근할 수 있다. 알리바바 클라우드는 지난 몇 년간 총 200개 이상의 생성형 AI 모델을 오픈소스로 공개한 바 있다.

 

혁신적 아키텍처 기반의 고성능 멀티모달 처리

Qwen2.5-Omni-7B는 모든 모달리티 중에서 뛰어난 성능을 발휘하며, 유사한 규모의 단일 모달리티 특화 모델과 비교해도 손색이 없다. 특히 실시간 음성 상호작용, 자연스럽고 안정적인 음성 생성, 엔드투엔드 음성 명령어 이행 등에서 업계 최고 수준의 벤치마크를 제시했다.

해당 모델의 효율성과 고성능은 혁신적인 아키텍처에서 비롯된다. 대표적으로 텍스트 생성(Thinker)과 음성 합성(Talker)을 분리하여 서로 다른 모달 간의 간섭을 최소화하는 ‘Thinker-Talker 아키텍처’, 일관된 콘텐츠 생성을 위해 비디오 입력과 오디오를 보다 잘 동기화하는 위치 임베딩 기술 TMRoPE(Time-aligned Multimodal RoPE), 그리고 끊김 없는 음성 상호작용을 위한 저지연 오디오 응답을 가능하게 하는 블록와이즈 스트리밍 처리 등이 적용되었다.

 

경량 모델임에도 불구하고 탁월한 성능

Qwen2.5-Omni-7B는 이미지-텍스트, 영상-텍스트, 영상-음성, 음성-텍스트, 텍스트 데이터를 포함한 방대하고 다양한 데이터셋을 기반으로 사전 학습되어 다양한 작업에서 강력한 성능을 보장한다.

 알리바바 클라우드 엔드투엔드 멀티모달 AI 모델 Qwen2.5-Omni-7B 공개.jpg

혁신적인 아키텍처와 고품질 사전학습 데이터셋을 바탕으로 이 모델은 음성 명령을 정확히 이해하고 수행하는 데 뛰어난 성능을 보이며, 텍스트 입력만 사용하는 경우와 유사한 수준의 성능을 달성한다. 특히 시각, 청각(acoustic), 텍스트 정보를 통합적으로 인식, 해석, 추론하는 능력을 평가하는 OmniBench 벤치마크와 같이 다양한 모달리티를 통합적으로 처리해야 하는 작업에서도 Qwen2.5-Omni는 최고 수준의 성능을 기록했다.

 

Qwen2.5-Omni-7B는 인컨텍스트 러닝(ICL)을 통해 상황과 맥락에 따른 음성 이해 및 생성 능력을 향상시켰다. , 강화학습(RL) 기반 최적화를 통해 생성 안정성에서 상당한 향상을 보였으며, 음성 응답 시 주의력 분산, 발음 오류, 부자연스러운 정지 현상 등이 현저히 감소되었다.

 

한편, 알리바바 클라우드는 지난해 9Qwen2.5를 처음 공개한 데 이어, 올해 1월에는 ‘Qwen2.5-Max’를 출시해 Chatbot Arena에서 7위를 기록, 대등한 주요 상용 모델들 대비 뛰어난 성능을 입증한 바 있다. 또한, 시각 이해와 장문 입력 처리를 위한 모델인 ‘Qwen2.5-VL’‘Qwen2.5-1M’ 등을 오픈소스로 공개했다.

 

#알리바바클라우드#Qwen#멀티모달#AI#

 
?

  1. AWS, 물-인공지능 융합 허브 ‘워터-AI 넥서스 센터’ 출범

    - 글로벌 물 문제와 AI 인프라 물 사용 절감 동시에 겨냥 아마존웹서비스(AWS)가 글로벌 수자원 기관 및 학계, 산업계와 함께 ‘워터-AI 넥서스 센터(Water-AI Nexus Center of Excellence)’를 설립했다. 이번 협력은 AI 인프라 운영 과정에서의 물 사용을 줄이...
    Date2025.10.02 Bynewsit Views248
    Read More
  2. SK-오픈AI, 메모리·AI 데이터센터 공동 구축…K-AI 경쟁력 가속

    SK그룹이 오픈AI와 손잡고 글로벌 AI 인프라 구축에 본격 참여한다. 양사는 메모리 공급과 한국 서남권 AI 데이터센터(DC) 설립·운영에 관한 파트너십을 체결하며, ‘K-AI’ 생태계 확대에 속도를 낸다. SK 최태원 회장은 “글로벌 AI 인프라 구축을 위한 스타게...
    Date2025.10.02 Bynewsit Views241
    Read More
  3. IBM-AMD, Zyphra와 손잡고 차세대 AI 인프라 선도

    IBM과 AMD가 오픈 소스 AI 연구기업 자이프라(Zyphra)와 협력해 차세대 AI 인프라를 구축한다고 발표했다. 이번 다년 계약에 따라 IBM은 IBM 클라우드 상에서 AMD Instinct MI300X GPU 기반의 대규모 교육 클러스터를 자이프라에 제공하며, 프론티어급 다중 모...
    Date2025.10.02 Bynewsit Views272
    Read More
  4. 유아이패스-오픈AI, 챗GPT 커넥터로 엔터프라이즈 에이전틱 자동화 가속

    에이전틱 자동화가 기업 디지털 전환의 핵심 키워드로 떠오르는 가운데, 유아이패스와 오픈AI가 손잡고 새로운 협력 모델을 내놨다. 양사는 오픈AI의 최신 모델을 유아이패스의 엔터프라이즈 오케스트레이션 기반 워크플로우와 통합한 ‘챗GPT 커넥터’를 발표하...
    Date2025.10.02 Bynewsit Views203
    Read More
  5. 슈나이더 일렉트릭, 고효율 UPS ‘갤럭시 VS’로 해양 산업 혁신 지원

    전 세계 조선·해양 산업이 친환경 전환과 디지털화라는 거대한 변화의 물결 속에서 ‘전력 안정성’이 새로운 경쟁력으로 부상하고 있다. 선박의 항해 장비, 통신 시스템, 안전 설비까지 모든 운영이 전력에 의존하면서, 무정전 전원 공급 장치(UPS)는 이제 선택...
    Date2025.10.02 Bynewsit Views226
    Read More
  6. 아웃시스템즈, ‘에이전트 워크벤치’ 정식 출시… 기업 AI 혁신 가속화

    아웃시스템즈(OutSystems)가 ‘에이전트 워크벤치(Agent Workbench)’를 정식 출시하고, 기업이 다양한 부서와 데이터 세트, 워크플로우 전반에서 지능형 AI 에이전트를 빠르고 안전하게 생성·운영할 수 있으며 에이전틱(Agentic) 시스템 도입을 가속화한다고 밝...
    Date2025.10.01 Bynewsit Views254
    Read More
  7.   유아이패스, 에이전틱 자동화·오케스트레이션 플랫폼 확장…AI 전환 속도↑

    - 에이전트 구축·자동화·오케스트레이션 전 단계 간소화 - 산업 맞춤형 솔루션으로 ROI·가치 실현 속도 향상 에이전틱 자동화 리더 유아이패스(UiPath)가 플랫폼 기능을 확대하며 AI 기반 전환을 가속화한다고 밝혔다. 이번 확장으로 기업은 사전 구축 솔루션,...
    Date2025.10.01 Bynewsit Views249
    Read More
  8. 하이퍼커넥트, ISO/IEC 27001:2022 인증 획득…글로벌 보안 신뢰성 강화

    - 국제 표준 정보보호 관리체계 인증으로 4개 영역 93개 항목 충족 - 글로벌 영상 커뮤니케이션 플랫폼 경쟁력 제고 하이퍼커넥트가 국제 표준 정보보호 관리체계 ISO/IEC 27001:2022 인증을 획득했다고 밝혔다. 이번 인증은 조직적·인적·물리적·기술적 통제 ...
    Date2025.10.01 Bynewsit Views320
    Read More
  9. 가트너, “완전 자율 AI 에이전트 도입 기업은 15%에 불과”

    - 기업 75%, AI 에이전트 도입했지만 거버넌스·기술 성숙도·확산 우려가 걸림돌 - AI 에이전트, 단기간 내 애플리케이션·인력 대체 가능성 낮아 가트너는 사람의 감독 없이 목표를 수행하는 완전 자율 AI 에이전트를 고려하거나 시범 운영 중인 기업은 15%에 ...
    Date2025.10.01 Bynewsit Views232
    Read More
  10. 지멘스, '디지털 트윈'과 'AI'로 지속 가능한 제품 개발 속도 높인다

    - 팀센터(Teamcenter)에 AI 기반 수명주기 평가(LCA) 기능 추가 - 디지털 트윈과 연계해 전체 제품 수명주기 인텔리전스 제공 - 메이커사이트와 공동 개발, 초기 설계부터 규제 준수 제품 개발 가능 지멘스가 제품 수명주기 관리 소프트웨어 팀센터(Teamcenter...
    Date2025.10.01 Bynewsit Views246
    Read More
목록
Board Pagination Prev 1 ... 30 31 32 33 34 35 36 37 38 39 ... 228 Next
/ 228
CLOSE