알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개.PNG

알리바바 클라우드가 자사 큐원(Qwen) 시리즈의 통합 엔드투엔드 멀티모달 모델인 ‘Qwen2.5-Omni-7B’를 새롭게 공개했다.

 

이번 모델은 종합적인 멀티모달 인식을 위해 설계되어, 텍스트, 이미지, 음성, 영상 등 다양한 형태의 입력 정보를 처리하고 실시간 텍스트 및 자연스러운 음성 응답을 지원함으로써 모바일 기기와 노트북과 같은 엣지 디바이스에 최적화된 멀티모달 AI 기술의 새로운 표준을 제시한다.

 

Qwen2.5-Omni-7B7B(70) 파라미터의 컴팩트한 설계에도 불구하고 성능 저하 없이 강력한 멀티모달 처리 능력을 제공한다. 이러한 고유한 조합은 특히 지능형 음성 애플리케이션과 같이 실질적인 가치를 제공하는 민첩하고 비용 효율적인 AI 에이전트 개발에 적합하다. 예를 들어 이 모델은 시각 장애인이 실시간 음성 설명을 통해 주변 환경을 인식하고 탐색할 수 있도록 지원하거나, 동영상 속 재료를 분석해 단계별 요리 가이드를 제공하는 데 활용될 수 있다. 또한 고객의 니즈를 정확히 이해하는 지능형 고객 응대 시스템 구현에도 적용 가능하다.

 

Qwen2.5-Omni-7B는 현재 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 오픈소스로 공개되었으며, 큐원 챗(Qwen Chat)과 알리바바 클라우드 오픈소스 커뮤니티인 모델스코프(ModelScope)를 통해서도 접근할 수 있다. 알리바바 클라우드는 지난 몇 년간 총 200개 이상의 생성형 AI 모델을 오픈소스로 공개한 바 있다.

 

혁신적 아키텍처 기반의 고성능 멀티모달 처리

Qwen2.5-Omni-7B는 모든 모달리티 중에서 뛰어난 성능을 발휘하며, 유사한 규모의 단일 모달리티 특화 모델과 비교해도 손색이 없다. 특히 실시간 음성 상호작용, 자연스럽고 안정적인 음성 생성, 엔드투엔드 음성 명령어 이행 등에서 업계 최고 수준의 벤치마크를 제시했다.

해당 모델의 효율성과 고성능은 혁신적인 아키텍처에서 비롯된다. 대표적으로 텍스트 생성(Thinker)과 음성 합성(Talker)을 분리하여 서로 다른 모달 간의 간섭을 최소화하는 ‘Thinker-Talker 아키텍처’, 일관된 콘텐츠 생성을 위해 비디오 입력과 오디오를 보다 잘 동기화하는 위치 임베딩 기술 TMRoPE(Time-aligned Multimodal RoPE), 그리고 끊김 없는 음성 상호작용을 위한 저지연 오디오 응답을 가능하게 하는 블록와이즈 스트리밍 처리 등이 적용되었다.

 

경량 모델임에도 불구하고 탁월한 성능

Qwen2.5-Omni-7B는 이미지-텍스트, 영상-텍스트, 영상-음성, 음성-텍스트, 텍스트 데이터를 포함한 방대하고 다양한 데이터셋을 기반으로 사전 학습되어 다양한 작업에서 강력한 성능을 보장한다.

 알리바바 클라우드 엔드투엔드 멀티모달 AI 모델 Qwen2.5-Omni-7B 공개.jpg

혁신적인 아키텍처와 고품질 사전학습 데이터셋을 바탕으로 이 모델은 음성 명령을 정확히 이해하고 수행하는 데 뛰어난 성능을 보이며, 텍스트 입력만 사용하는 경우와 유사한 수준의 성능을 달성한다. 특히 시각, 청각(acoustic), 텍스트 정보를 통합적으로 인식, 해석, 추론하는 능력을 평가하는 OmniBench 벤치마크와 같이 다양한 모달리티를 통합적으로 처리해야 하는 작업에서도 Qwen2.5-Omni는 최고 수준의 성능을 기록했다.

 

Qwen2.5-Omni-7B는 인컨텍스트 러닝(ICL)을 통해 상황과 맥락에 따른 음성 이해 및 생성 능력을 향상시켰다. , 강화학습(RL) 기반 최적화를 통해 생성 안정성에서 상당한 향상을 보였으며, 음성 응답 시 주의력 분산, 발음 오류, 부자연스러운 정지 현상 등이 현저히 감소되었다.

 

한편, 알리바바 클라우드는 지난해 9Qwen2.5를 처음 공개한 데 이어, 올해 1월에는 ‘Qwen2.5-Max’를 출시해 Chatbot Arena에서 7위를 기록, 대등한 주요 상용 모델들 대비 뛰어난 성능을 입증한 바 있다. 또한, 시각 이해와 장문 입력 처리를 위한 모델인 ‘Qwen2.5-VL’‘Qwen2.5-1M’ 등을 오픈소스로 공개했다.

 

#알리바바클라우드#Qwen#멀티모달#AI#

 
?

  1. 팀뷰어, 지멘스와 손잡고 AR·MR 솔루션으로 PLM 분야 혁신 지원

    - 지멘스의 PLM 소프트웨어 ‘팀센터’에 팀뷰어의 산업용 AR 솔루션 ‘프론트라인’ 적용… 보다 직관적인 쌍방향의 제품 개발 프로세스로 전환 팀뷰어가 지멘스 디지털 인더스트리 소프트웨어와 PLM(제품수명주기관리) 분야에서 새로운 전략적 파트너십을 체결했...
    Date2022.07.27 Bynewsit Views679
    Read More
  2. 삼성SDS, 레드햇·IBM과 협력…“클라우드 사업 강화”

    삼성SDS가 클라우드 사업 경쟁력 강화를 위해 글로벌 오픈소스 솔루션 기업 레드햇, IBM과 손을 잡았다. 이번 협력을 통해 삼성SDS는 삼성 클라우드 플랫폼(SCP)에서 레드햇의 오픈시프트(OpenShift)를 제공한다. 또한 삼성SDS는 IBM, 레드햇과 공동 영업 및 ...
    Date2023.09.04 Bynewsit Views678
    Read More
  3. SAP 코리아, ‘SAP 스펜드 커넥트 포럼’ 개최…“지속가능한 구매 디지털 혁신 방안 제시”

    SAP 코리아는 지난 7일 ‘SAP 스펜드 커넥트 포럼(SAP Spend Connect Forum)’을 개최했다고 8일 밝혔다. SAP 코리아는 ‘비즈니스 네트워크를 활용한 공급망 위기 선제적 대응 전략’ 주제로 개최한 이번 포럼에서 SAP 비즈니스 네트워크(SAP Business Network)를...
    Date2022.12.08 Bynewsit Views678
    Read More
  4. 라이언로켓, 크릭앤리버엔터테인먼트와 MOU 체결…“웹툰 시장 점령하는 생성 AI”

    AI 스타트업 라이언로켓은 크릭앤리버엔터테인먼트와 웹소설 표지 및 웹툰 제작 지원 솔루션 최적화 사업을 위한 업무협약을 체결했다고 11일 밝혔다. 이번 협약으로 인해 크릭앤리버엔터테인먼트는 웹툰 및 웹소설 표지 제작에 라이언로켓의 웹툰 생성AI 기술...
    Date2023.05.11 Bynewsit Views677
    Read More
  5. 가트너, 2024년 10대 전략 기술 트렌드 발표

    - IT 리더, 불확실성 속 전략적 기술 투자 로드맵 수립해야 … 가트너 10대 전략 기술 트렌드, 향후 36개월 이내에 CIO와 기타 IT 리더에게 상당한 변화와 기회 가져올 것 가트너(Garnter)가 ‘2024년 기업들이 주목해야 할 10대 전략 기술 트렌드’를 발표했다. ...
    Date2023.10.17 Bynewsit Views676
    Read More
  6. 플루닛, EQBR 홀딩스와 NFT 사업 MOU 체결

    인공지능 기업 솔트룩스의 자회사 플루닛이 블록체인 인프라 전문 기업 EQBR 홀딩스와 NFT 사업 추진을 위한 전략적 업무협약을 체결했다고 11일 밝혔다. 플루닛 본사에서 진행된 협약식에는 플루닛 이경일 대표 및 EQBR 이현기 대표를 비롯해 양 사의 주요 관...
    Date2023.04.11 Bynewsit Views676
    Read More
  7. 인포빕, 스푼라디오에 글로벌 SMS 인증 솔루션 지원

    - 소셜 OTP 인증 서비스 대체, 휴대전화로 가입 절차 간소화 최적 UX 제공 - 500ms 안에 SMS 전송해 가입 과정 진행 중 이탈 80% 감소 - 비용 효율성을 높여 매월 운영비 최대 80% 절감 - 전 세계 70여 개 지사, 650여 개 이통사 협업 통해 현지 규제 준수와 ...
    Date2023.02.28 Bynewsit Views676
    Read More
  8. 리미니스트리트, ‘태영건설’에 오라클 ERP 및 데이터베이스 시스템 3자 유지보수 서비스 제공

    - 태영건설, 보다 신속하고 전문적으로 대응하는 ERP 지원의 혜택 - 절감한 비용 및 인건비를 전략적 인프라 프로젝트에 재배치 리미니스트리트는 오늘, 토목, 레저 및 방송 분야의 국내 대표 선두 기업인 태영건설이 오라클 데이터베이스 유지보수 서비스를 ...
    Date2022.11.09 Bynewsit Views676
    Read More
  9. 티맥스티베로, 성능관리 솔루션 「시스마스터DB 8」 출시…"클라우드 최적화 환경에서 DBMS의 효율적 사용"

    - 클라우드 환경에서 티베로의 실시간 운영 상황 및 장애 원인 분석해 안정적인 DBMS 활용 지원 - 성능관리∙모니터링∙분석 기능 개선해 DB 자원 관리 및 분석을 위한 시간과 비용 절감 - 지속적 고도화 통해 클라우드 DBMS 특화 운영관리 솔루션으로 도약할 것...
    Date2022.11.01 Bynewsit Views676
    Read More
  10. 원프레딕트, ‘2025 스마트공장·자동화산업전’ 참가...'디지털 산업 자산 통합관리 솔루션' 가디원 pdx 전시

    - ‘2025 스마트공장·자동화산업전’서 디지털 산업 자산 통합관리 플랫폼 ‘가디원 pdx’ 필두 제품 전시 - 산업 설비 가용성 극대화하는 자체 AI 기반 솔루션으로 산업 자산 O&M 혁신 - 원프레딕트 윤병동 대표, ‘AI 전환’ 주제로 산업지능화 컨퍼런스 기조연설 ...
    Date2025.03.11 Bynewsit Views675
    Read More
목록
Board Pagination Prev 1 ... 40 41 42 43 44 45 46 47 48 49 ... 236 Next
/ 236
CLOSE