알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개.PNG

알리바바 클라우드가 자사 큐원(Qwen) 시리즈의 통합 엔드투엔드 멀티모달 모델인 ‘Qwen2.5-Omni-7B’를 새롭게 공개했다.

 

이번 모델은 종합적인 멀티모달 인식을 위해 설계되어, 텍스트, 이미지, 음성, 영상 등 다양한 형태의 입력 정보를 처리하고 실시간 텍스트 및 자연스러운 음성 응답을 지원함으로써 모바일 기기와 노트북과 같은 엣지 디바이스에 최적화된 멀티모달 AI 기술의 새로운 표준을 제시한다.

 

Qwen2.5-Omni-7B7B(70) 파라미터의 컴팩트한 설계에도 불구하고 성능 저하 없이 강력한 멀티모달 처리 능력을 제공한다. 이러한 고유한 조합은 특히 지능형 음성 애플리케이션과 같이 실질적인 가치를 제공하는 민첩하고 비용 효율적인 AI 에이전트 개발에 적합하다. 예를 들어 이 모델은 시각 장애인이 실시간 음성 설명을 통해 주변 환경을 인식하고 탐색할 수 있도록 지원하거나, 동영상 속 재료를 분석해 단계별 요리 가이드를 제공하는 데 활용될 수 있다. 또한 고객의 니즈를 정확히 이해하는 지능형 고객 응대 시스템 구현에도 적용 가능하다.

 

Qwen2.5-Omni-7B는 현재 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 오픈소스로 공개되었으며, 큐원 챗(Qwen Chat)과 알리바바 클라우드 오픈소스 커뮤니티인 모델스코프(ModelScope)를 통해서도 접근할 수 있다. 알리바바 클라우드는 지난 몇 년간 총 200개 이상의 생성형 AI 모델을 오픈소스로 공개한 바 있다.

 

혁신적 아키텍처 기반의 고성능 멀티모달 처리

Qwen2.5-Omni-7B는 모든 모달리티 중에서 뛰어난 성능을 발휘하며, 유사한 규모의 단일 모달리티 특화 모델과 비교해도 손색이 없다. 특히 실시간 음성 상호작용, 자연스럽고 안정적인 음성 생성, 엔드투엔드 음성 명령어 이행 등에서 업계 최고 수준의 벤치마크를 제시했다.

해당 모델의 효율성과 고성능은 혁신적인 아키텍처에서 비롯된다. 대표적으로 텍스트 생성(Thinker)과 음성 합성(Talker)을 분리하여 서로 다른 모달 간의 간섭을 최소화하는 ‘Thinker-Talker 아키텍처’, 일관된 콘텐츠 생성을 위해 비디오 입력과 오디오를 보다 잘 동기화하는 위치 임베딩 기술 TMRoPE(Time-aligned Multimodal RoPE), 그리고 끊김 없는 음성 상호작용을 위한 저지연 오디오 응답을 가능하게 하는 블록와이즈 스트리밍 처리 등이 적용되었다.

 

경량 모델임에도 불구하고 탁월한 성능

Qwen2.5-Omni-7B는 이미지-텍스트, 영상-텍스트, 영상-음성, 음성-텍스트, 텍스트 데이터를 포함한 방대하고 다양한 데이터셋을 기반으로 사전 학습되어 다양한 작업에서 강력한 성능을 보장한다.

 알리바바 클라우드 엔드투엔드 멀티모달 AI 모델 Qwen2.5-Omni-7B 공개.jpg

혁신적인 아키텍처와 고품질 사전학습 데이터셋을 바탕으로 이 모델은 음성 명령을 정확히 이해하고 수행하는 데 뛰어난 성능을 보이며, 텍스트 입력만 사용하는 경우와 유사한 수준의 성능을 달성한다. 특히 시각, 청각(acoustic), 텍스트 정보를 통합적으로 인식, 해석, 추론하는 능력을 평가하는 OmniBench 벤치마크와 같이 다양한 모달리티를 통합적으로 처리해야 하는 작업에서도 Qwen2.5-Omni는 최고 수준의 성능을 기록했다.

 

Qwen2.5-Omni-7B는 인컨텍스트 러닝(ICL)을 통해 상황과 맥락에 따른 음성 이해 및 생성 능력을 향상시켰다. , 강화학습(RL) 기반 최적화를 통해 생성 안정성에서 상당한 향상을 보였으며, 음성 응답 시 주의력 분산, 발음 오류, 부자연스러운 정지 현상 등이 현저히 감소되었다.

 

한편, 알리바바 클라우드는 지난해 9Qwen2.5를 처음 공개한 데 이어, 올해 1월에는 ‘Qwen2.5-Max’를 출시해 Chatbot Arena에서 7위를 기록, 대등한 주요 상용 모델들 대비 뛰어난 성능을 입증한 바 있다. 또한, 시각 이해와 장문 입력 처리를 위한 모델인 ‘Qwen2.5-VL’‘Qwen2.5-1M’ 등을 오픈소스로 공개했다.

 

#알리바바클라우드#Qwen#멀티모달#AI#

 
?

  1. 클라우드플레어, 한국 지사 설립…“아태지역에서의 지속적 입지 확대”

    클라우드플레어가 한국 지사 설립을 발표했다. 클라우드플레어는 싱가포르에 위치한 아태지역 본사, 그리고 베이징, 시드니, 도쿄 지사에 이어 이번에 새롭게 오픈한 서울 지사를 통해 아태지역에서 입지를 한층 강화해 나간다는 방침이다. 클라우드플레어 한...
    Date2023.03.08 Bynewsit Views6970
    Read More
  2. 티맥스소프트, ‘유망 SaaS 개발·육성 지원 사업’ 우수사례 선정

    - ‘오픈프레임’ 고도화 및 사업화 과제 완수, 클라우드 서비스 적격성과 사업성 높이 평가 - 기존 대비 성능 40% 향상, 신뢰성과 안정성 확고히 입증...글로벌 경쟁력↑ - AI·클라우드 혁신 연결하는 글로벌 SaaS 비즈니스 확대 기업용 소프트웨어(SW) 전문기업...
    Date2025.02.06 Bynewsit Views942
    Read More
  3. 줌, ‘옥타 엔드 투 엔드 암호화 인증’ 도입…“화상회의에서 참여자 신원 관리 가능

    줌(Zoom)이 글로벌 아이덴티티 보안 기업 옥타(Okta)의 ‘옥타 엔드 투 엔드 암호화 인증(Okta Authentication for E2EE)’을 도입해 화상회의의 보안을 강화한다고 밝혔다. 최근 많은 기업이 자유롭게 업무 시간과 장소를 선택할 수 있는 유연근무제 등을 시행...
    Date2023.03.31 Bynewsit Views902
    Read More
  4. 델, MS 애저 스택 HCI용 통합 시스템 신제품 출시…“MS와 하이브리드 클라우드 분야 협력 강화”

    - 델-MS, 고객이 통합형 하이브리드 클라우드 전략으로 데이터가 어디에 있든 모든 지점에 일관된 클라우드 경험 누릴 수 있도록 협력 지속 - 마이크로소프트 애저 스택 HCI를 위한 델 통합 시스템…싱글 노드 구성으로 상면은 줄이고, AI/ML워크로드 위한 성능...
    Date2022.10.18 Category클라우드 Bynewsit Views892
    Read More
  5. 티맥스클라우드, 하이퍼클라우드-오케스트로 CMP 제품 연동…"손쉬운 클라우드 플랫폼 사용 지원"

    - 오케스트로 CMP 환경에서 하이퍼클라우드의 안정적 운영과 최상의 모니터링 기능 지원 - 지역 마케팅 및 케이스 스터디 등의 활동 함께 시행하며 공공, 금융 시장 공략 활성화 티맥스클라우드와 오케스트로가 함께 손쉬운 클라우드 플랫폼 사용을 돕는다. 티...
    Date2022.07.10 Category클라우드 Bynewsit Views885
    Read More
  6. 보다폰, “오라클 클라우드 기반으로 IT 기술 현대화 추진”

    - 보다폰, 차세대 통신 서비스 출시 지원 위해 OCI 전용 리전으로 핵심 시스템 이전 및 현대화 오라클이 유럽 및 아프리카 지역 최대 통신기업인 보다폰 (Vodafone)과 유럽 내 IT 인프라의 현대화 및 신속한 클라우드 이전을 위한 전략적 파트너십을 체결했다....
    Date2022.07.11 Bynewsit Views881
    Read More
  7. 엔비디아, 'GTC 2023' 개최…“한국 개발자 위한 스페셜 데이”

    - 3월 20일부터 24일까지 진행, 젠슨 황 기조 연설부터 650개 이상 세션 공개 - 3월 24일, 한국 개발자를 위한 Korea AI Day 마련 엔비디아가 3월 20일부터 24일까지 엔비디아 GTC 2023 콘퍼런스를 개최한다고 밝혔다. 엔비디아 GTC는 AI와 메타버스 시대를 위...
    Date2023.03.09 Bynewsit Views875
    Read More
  8. 엔비디아 A100, 금융 서비스 부문 추론 벤치마크에서 최고 성능 기록

    - 엔비디아 A100 GPU, 99점의 백분위 점수로 낮은 지연시간 기록 - 백테스팅, 시뮬레이션 등 워크로드 처리량과 에너지 효율 부분에서 압도적인 성능 제공 엔비디아는 슈퍼마이크로 서버의 엔비디아(NVIDIA) A100 텐서 코어 GPU가 최신 STAC-ML 마켓 벤치마크...
    Date2023.02.10 Bynewsit Views869
    Read More
  9. HPE, HPE 파트너 레디 벤티지 프로그램 발표…“파트너 생태계 강화”

    - 업데이트된 파트너 포털 및 파트너 커넥트와 함께 파트너사의 애저 서비스 비즈니스 성장 및 추진 도모 한국 HPE가 신규 파트너 프로그램인 HPE 파트너 레디 벤티지(Partner Ready Vantage) 프로그램을 발표했다. HPE 파트너 레디 벤티지는 프로그램은 애저...
    Date2022.07.10 Bynewsit Views869
    Read More
  10. No Image

    아크로니스, MSP 성장 지원 ’MSP 아카데미’ 개설

    - 아크로니스 MSP 아카데미, 매니지드 서비스 공급업체를 위해 설계된 종합 교육 프로그램, 비즈니스 운영, 기술, 영업 및 마케팅 전반에 대한 교육 제공 아크로니스는 오늘, 매니지드 서비스 공급업체(MSP)에게 탁월한 역량을 발휘하고 성장하는 데 필요한 비...
    Date2023.11.09 Bynewsit Views863
    Read More
  11. 슈나이더 일렉트릭 코리아, ‘이노베이션 데이: 지속가능한 데이터센터’ 행사 성료

    - 온·오프라인을 결합한 하이브리드 형태 컨퍼런스…약 1천명의 고객 및 파트너사 참여 - 데이터센터 업계 리더들이 전하는 지속가능한 데이터 추진 강연 및 패널토의 시간 마련 슈나이더 일렉트릭 코리아는 오늘(6일) 열린 ‘이노베이션 데이: 지속가능한 데이...
    Date2022.07.10 Bynewsit Views860
    Read More
  12. 다날 워너아이, 코레일과 협약식 체결…“관광 상품 개발 및 홍보 지원 협력”

    - 데이터 가치, 보상에 대한 인식 확산 도움 기대 워너아이는 한국철도공사(코레일)와 기차 여행 활성화와 국내 관광자원 발굴 및 홍보, 소외 계층에 대한 지원 등을 위한 포괄적 업무 협약을 체결했다고 6일 밝혔다. 워너아이와 코레일은 이날 협약을 통해 ▲...
    Date2022.07.10 Bynewsit Views857
    Read More
  13. 사이냅소프트, ‘사이냅 OCR Pro’ ICT 기술마켓 인증 획득

    사이냅소프트는 AI OCR ‘Synap OCR Pro’가 ICT 기술마켓 인증을 획득했다고 밝혔다. ‘Synap OCR Pro’는 자체 개발한 데이터 렌더링 기법을 사용해 데이터를 수집 및 확보하고,지속적인 AI 딥러닝 학습을 통해 최고 수준의 한글 인식률과 고품질의 데이터 추출...
    Date2022.07.10 Bynewsit Views844
    Read More
  14. Veeam, ‘빔 데이터 플랫폼’ 하반기 업데이트 발표

    - 빔온 레질리언시 서밋을 통해 데이터 보안, 멀웨어 탐지, 복구 자동화 등 하반기 업데이트 발표 - 랜섬웨어 공격 93% 백업 삭제, 암호화 시도… 빠르고 안전한 복구가 비즈니스 연속성의 핵심 - 빔 백업 및 리플리케이션 v12.1로 백업에 대한 사전 예방적 위...
    Date2023.10.26 Bynewsit Views842
    Read More
  15. 베리타스, ‘베리타스 테크 데이 2022’ 개최…“하이브리드 클라우드 환경에서 최신 데이터 관리 실제 사례 소개”

    - 7월 6일 오후 1시 ‘베리타스 테크데이 2022’ 온라인 컨퍼런스 개최 - 기업들의 성공적인 디지털 전환을 위한 효율적인 데이터 장기보관 방안 - 랜섬웨어 대응을 위한 데이터 관리 노하우와 국내 금융기업 고객 사례 설명 예정 베리타스코리아는 오는 7월 6일...
    Date2022.07.10 Bynewsit Views836
    Read More
  16. 알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개

    알리바바 클라우드가 자사 큐원(Qwen) 시리즈의 통합 엔드투엔드 멀티모달 모델인 ‘Qwen2.5-Omni-7B’를 새롭게 공개했다. 이번 모델은 종합적인 멀티모달 인식을 위해 설계되어, 텍스트, 이미지, 음성, 영상 등 다양한 형태의 입력 정보를 처리하고 실시간 텍...
    Date2025.03.31 Bynewsit Views830
    Read More
  17. EDB, 오픈소스 데이터관리시스템 EPAS와 DBaaS 솔루션 ‘빅애니멀’ 발표…”완전관리형 ‘포스트그레SQL’로 국내 DBMS 시장 공략

    - 국내 금융, 공공, 제조 기업들 신규 고객으로 확보 오픈소스 PostgreSQL의 최대 지원 기업 EDB는 오늘 주력 제품인 오픈소스 포스트그레SQL 데이터관리시스템인 '포스트그레스 어드밴스드 서버(EPAS)'와 업계 최초의 클라우드 기반 완전 DBaaS(서비스형 데이...
    Date2022.09.19 Category소프트웨어 Bynewsit Views829
    Read More
  18. 틱톡, 넷플릭스 제치고 미국 내 35세 이하에게 가장 인기 있는 앱

    옴디아(Omdia)는 최근 연구에서 틱톡이 넷플릭스를 뛰어넘어 미국에서 두 번째로 인기 있는 서비스가 되었으며, 유튜브는 35세 이하 시청자의 시청 1순위를 유지하고 있다고 밝혔다. 틱톡의 인기도는 연령에 따라 편향된 양상을 보이며, 35세 이상에게는 6번째...
    Date2022.10.21 Bynewsit Views828
    Read More
  19. 티맥스티베로, 네이버 클라우드 티베로 3개월 무료 이용 공동 프로모션 이벤트

    - 네이버클라우드 환경에 최적화된 티베로 통해 티베로의 손쉬운 설치 및 사용 지원 - 티맥스티베로-네이버클라우드, KERIS 'e학습터', '고려대학교 의료원' 적용 통해 제품 간 호환성 및 안정성 입증 DBMS 전문기업 티맥스티베로가 신규 고객을 대상으로 네이...
    Date2022.07.11 Category클라우드 Bynewsit Views828
    Read More
  20. 티맥스오에스, 제16회 '공개SW 개발자 대회' 후원…"오픈소스 SW 인재 적극 양성"

    - 오픈 VPN, VPN 선행인증 등의 과제 중심으로 교육 및 멘토링 지원 - 대회 상금 외에도 자체 포상 및 지원시 가산점 부여 통해 SW 인재 육성 계획 티맥스오에스가 지난해에 이어 올해에도 '제16회 공개SW 개발자 대회' 후원을 통해 국내 오픈소스 생태계 활성...
    Date2022.07.10 Bynewsit Views824
    Read More
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 285 Next
/ 285
CLOSE