알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개.PNG

알리바바 클라우드가 자사 큐원(Qwen) 시리즈의 통합 엔드투엔드 멀티모달 모델인 ‘Qwen2.5-Omni-7B’를 새롭게 공개했다.

 

이번 모델은 종합적인 멀티모달 인식을 위해 설계되어, 텍스트, 이미지, 음성, 영상 등 다양한 형태의 입력 정보를 처리하고 실시간 텍스트 및 자연스러운 음성 응답을 지원함으로써 모바일 기기와 노트북과 같은 엣지 디바이스에 최적화된 멀티모달 AI 기술의 새로운 표준을 제시한다.

 

Qwen2.5-Omni-7B7B(70) 파라미터의 컴팩트한 설계에도 불구하고 성능 저하 없이 강력한 멀티모달 처리 능력을 제공한다. 이러한 고유한 조합은 특히 지능형 음성 애플리케이션과 같이 실질적인 가치를 제공하는 민첩하고 비용 효율적인 AI 에이전트 개발에 적합하다. 예를 들어 이 모델은 시각 장애인이 실시간 음성 설명을 통해 주변 환경을 인식하고 탐색할 수 있도록 지원하거나, 동영상 속 재료를 분석해 단계별 요리 가이드를 제공하는 데 활용될 수 있다. 또한 고객의 니즈를 정확히 이해하는 지능형 고객 응대 시스템 구현에도 적용 가능하다.

 

Qwen2.5-Omni-7B는 현재 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 오픈소스로 공개되었으며, 큐원 챗(Qwen Chat)과 알리바바 클라우드 오픈소스 커뮤니티인 모델스코프(ModelScope)를 통해서도 접근할 수 있다. 알리바바 클라우드는 지난 몇 년간 총 200개 이상의 생성형 AI 모델을 오픈소스로 공개한 바 있다.

 

혁신적 아키텍처 기반의 고성능 멀티모달 처리

Qwen2.5-Omni-7B는 모든 모달리티 중에서 뛰어난 성능을 발휘하며, 유사한 규모의 단일 모달리티 특화 모델과 비교해도 손색이 없다. 특히 실시간 음성 상호작용, 자연스럽고 안정적인 음성 생성, 엔드투엔드 음성 명령어 이행 등에서 업계 최고 수준의 벤치마크를 제시했다.

해당 모델의 효율성과 고성능은 혁신적인 아키텍처에서 비롯된다. 대표적으로 텍스트 생성(Thinker)과 음성 합성(Talker)을 분리하여 서로 다른 모달 간의 간섭을 최소화하는 ‘Thinker-Talker 아키텍처’, 일관된 콘텐츠 생성을 위해 비디오 입력과 오디오를 보다 잘 동기화하는 위치 임베딩 기술 TMRoPE(Time-aligned Multimodal RoPE), 그리고 끊김 없는 음성 상호작용을 위한 저지연 오디오 응답을 가능하게 하는 블록와이즈 스트리밍 처리 등이 적용되었다.

 

경량 모델임에도 불구하고 탁월한 성능

Qwen2.5-Omni-7B는 이미지-텍스트, 영상-텍스트, 영상-음성, 음성-텍스트, 텍스트 데이터를 포함한 방대하고 다양한 데이터셋을 기반으로 사전 학습되어 다양한 작업에서 강력한 성능을 보장한다.

 알리바바 클라우드 엔드투엔드 멀티모달 AI 모델 Qwen2.5-Omni-7B 공개.jpg

혁신적인 아키텍처와 고품질 사전학습 데이터셋을 바탕으로 이 모델은 음성 명령을 정확히 이해하고 수행하는 데 뛰어난 성능을 보이며, 텍스트 입력만 사용하는 경우와 유사한 수준의 성능을 달성한다. 특히 시각, 청각(acoustic), 텍스트 정보를 통합적으로 인식, 해석, 추론하는 능력을 평가하는 OmniBench 벤치마크와 같이 다양한 모달리티를 통합적으로 처리해야 하는 작업에서도 Qwen2.5-Omni는 최고 수준의 성능을 기록했다.

 

Qwen2.5-Omni-7B는 인컨텍스트 러닝(ICL)을 통해 상황과 맥락에 따른 음성 이해 및 생성 능력을 향상시켰다. , 강화학습(RL) 기반 최적화를 통해 생성 안정성에서 상당한 향상을 보였으며, 음성 응답 시 주의력 분산, 발음 오류, 부자연스러운 정지 현상 등이 현저히 감소되었다.

 

한편, 알리바바 클라우드는 지난해 9Qwen2.5를 처음 공개한 데 이어, 올해 1월에는 ‘Qwen2.5-Max’를 출시해 Chatbot Arena에서 7위를 기록, 대등한 주요 상용 모델들 대비 뛰어난 성능을 입증한 바 있다. 또한, 시각 이해와 장문 입력 처리를 위한 모델인 ‘Qwen2.5-VL’‘Qwen2.5-1M’ 등을 오픈소스로 공개했다.

 

#알리바바클라우드#Qwen#멀티모달#AI#

 
?

  1. 매트랩 엑스포 2025 코리아, 소프트웨어 정의 시스템 기술 혁신 제시

    - 매스웍스, 기술 전문가 및 고객과 소프트웨어 정의 시스템, 모델 기반 설계 최신 트렌드 공유 매스웍스가 4월 8일(화) 코엑스 그랜드 볼룸 및 아셈볼룸에서 '매트랩 엑스포 2025 코리아(MATLAB EXPO 2025 Korea)'를 성공적으로 개최했다고 발표했다. 행사에...
    Date2025.04.08 Bynewsit Views391
    Read More
  2. 와탭랩스, ‘2025 가트너 마켓 가이드’ 인프라 모니터링 도구 부문 대표 기업 선정

    - 한국 기업으로 유일하게 등재돼 세계 수준의 인프라 모니터링 기술력 입증 - 와탭, 서버·쿠버네티스·네트워크 성능 모니터링 제품에서 높은 평가 옵저버빌리티 전문 기업 와탭랩스가 글로벌 IT 시장조사기관 가트너의 <2025 인프라 모니터링 도구 마켓 가이...
    Date2025.04.08 Bynewsit Views357
    Read More
  3. 가트너, 비즈니스를 바꿀 12가지 혁신 기술 발표

    - 가트너, 경쟁 우위를 제공하고 비즈니스 표준으로 자리 잡을 12가지 혁신 기술 선정 - 생성형 AI 기반 코드 아키텍처, 기존 UI 대체하고 새로운 형태의 사용자 시나리오 발굴 - 허위 정보 보안, 네트워크 외부에서 발생하는 위협에 대비해 신뢰할 수 있는 정...
    Date2025.04.08 Bynewsit Views417
    Read More
  4. 슈나이더 일렉트릭, 원 클릭 LCA와 파트너십 체결…“고객 탈탄소화 지원 강화”

    - MEP(기계, 전기 및 배관) 분야의 탄소 배출 감축을 위한 데이터 기반의 접근 방식 제안 - 전력 제품의 환경성적지표 공개를 통해 건축, 엔지니어링 및 건설 분야에서 가장 지속 가능한 제품 선정 가능 슈나이더 일렉트릭이 AI 기반 지속가능성 플랫폼 및 솔...
    Date2025.04.08 Bynewsit Views399
    Read More
  5. 스트래티지 코리아, ABL생명에 ‘데이터 분석 및 통합 관리 플랫폼’ 구축

    - 데이터 활용도 확대 및 비즈니스 인사이트를 높이는 혁신적 의사결정 플랫폼 운영 스트래티지 코리아는 ABL생명의 사내 체계적인 데이터 통합 관리 및 정확한 데이터 분석 환경을 구축 지원을 위해 Strategy BI를 전사 데이터 플랫폼으로 선정하고 프로젝트...
    Date2025.04.08 Bynewsit Views365
    Read More
  6. 윈드리버, 이탈리아 레오나르도 항공우주에 ‘VxWorks’ 공급…“국방 안전 시스템의 소프트웨어 정의 혁신”

    윈드리버는 오늘 세계적인 방산 기업 이탈리아의 레오나르도(Leonardo)가 멀티코어 프로세서 아키텍처 기반의 최첨단 세이프티 관련 무선 주파수(RF) 시스템을 소프트웨어 정의 방식으로 고도화하기 위해 ‘VxWorks’ 실시간 운영 체제(RTOS)를 도입했다고 밝혔...
    Date2025.04.08 Bynewsit Views363
    Read More
  7. PTC, 본사 부사장 겸 한국 지사에 김도균 대표 선임

    PTC코리아는 오늘 김도균 본사 부사장(Vice President) 겸 한국지사 대표를 선임했다고 밝혔다. 김도균 대표는 클라우드, IT, 애플리케이션, 인터넷 서비스 분야에서 20년 이상의 경력을 보유한 업계 베테랑이다. PTC에 합류하기 전에는 클라우드플레어의 초대...
    Date2025.04.07 Bynewsit Views454
    Read More
  8. 키넥시스, 데이터브릭스와 파트너십 체결… AI 기반 공급망 오케스트레이션 가속화

    - 키넥시스 마에스트로(Kinaxis Maestro)와 데이터브릭스의 데이터 인텔리전스 플랫폼(Data Intelligence Platform)을 결합 - 글로벌 공급망 전반에서 더 빠른 인사이트, 통합 데이터, 확장 가능한 AI 제공 키넥시스(Kinaxis))와 데이터 및 AI 전문 기업 데이...
    Date2025.04.03 Bynewsit Views412
    Read More
  9. 헥사곤, '하노버 메세 2025' 참가… 'F1 팩토리' 통해 넥서스 플랫폼 제조 혁신 성과 공개  

    - 헥사곤 디지털 리얼리티 플랫폼 ‘넥서스’, 출시 2년 만에 3만 명 이상 사용자 확보… 제조업 디지털 전환 가속화 - 헥사곤, 오라클 레드불 레이싱 F1 차량 통해 설계부터 품질 검사까지 워크플로우 전 단계 지원하는 통합 솔루션 시연 헥사곤 매뉴팩처링 인텔...
    Date2025.04.03 Bynewsit Views381
    Read More
  10. 다쏘시스템, 몰입형 증강현실 ‘에너지 익스피리언스’ 발표…“지속가능한 에너지 창출∙사용 혁신 제시”

    - 버추얼 트윈 활용한 협업적이고 혁신적인 솔루션 통해 에너지 소비 개선, 식량 생산 최적화, 친환경적인 모빌리티 창조 - 에너지와 자연, 가상 세계에서 결합하여 인류의 발전 이끌고 실생활 개선할 것 다쏘시스템이 프랑스 파리의 기념비적인 랜드마크를 버...
    Date2025.04.03 Bynewsit Views418
    Read More
목록
Board Pagination Prev 1 ... 54 55 56 57 58 59 60 61 62 63 ... 219 Next
/ 219
CLOSE