알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개.PNG

알리바바 클라우드가 자사 큐원(Qwen) 시리즈의 통합 엔드투엔드 멀티모달 모델인 ‘Qwen2.5-Omni-7B’를 새롭게 공개했다.

 

이번 모델은 종합적인 멀티모달 인식을 위해 설계되어, 텍스트, 이미지, 음성, 영상 등 다양한 형태의 입력 정보를 처리하고 실시간 텍스트 및 자연스러운 음성 응답을 지원함으로써 모바일 기기와 노트북과 같은 엣지 디바이스에 최적화된 멀티모달 AI 기술의 새로운 표준을 제시한다.

 

Qwen2.5-Omni-7B7B(70) 파라미터의 컴팩트한 설계에도 불구하고 성능 저하 없이 강력한 멀티모달 처리 능력을 제공한다. 이러한 고유한 조합은 특히 지능형 음성 애플리케이션과 같이 실질적인 가치를 제공하는 민첩하고 비용 효율적인 AI 에이전트 개발에 적합하다. 예를 들어 이 모델은 시각 장애인이 실시간 음성 설명을 통해 주변 환경을 인식하고 탐색할 수 있도록 지원하거나, 동영상 속 재료를 분석해 단계별 요리 가이드를 제공하는 데 활용될 수 있다. 또한 고객의 니즈를 정확히 이해하는 지능형 고객 응대 시스템 구현에도 적용 가능하다.

 

Qwen2.5-Omni-7B는 현재 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 오픈소스로 공개되었으며, 큐원 챗(Qwen Chat)과 알리바바 클라우드 오픈소스 커뮤니티인 모델스코프(ModelScope)를 통해서도 접근할 수 있다. 알리바바 클라우드는 지난 몇 년간 총 200개 이상의 생성형 AI 모델을 오픈소스로 공개한 바 있다.

 

혁신적 아키텍처 기반의 고성능 멀티모달 처리

Qwen2.5-Omni-7B는 모든 모달리티 중에서 뛰어난 성능을 발휘하며, 유사한 규모의 단일 모달리티 특화 모델과 비교해도 손색이 없다. 특히 실시간 음성 상호작용, 자연스럽고 안정적인 음성 생성, 엔드투엔드 음성 명령어 이행 등에서 업계 최고 수준의 벤치마크를 제시했다.

해당 모델의 효율성과 고성능은 혁신적인 아키텍처에서 비롯된다. 대표적으로 텍스트 생성(Thinker)과 음성 합성(Talker)을 분리하여 서로 다른 모달 간의 간섭을 최소화하는 ‘Thinker-Talker 아키텍처’, 일관된 콘텐츠 생성을 위해 비디오 입력과 오디오를 보다 잘 동기화하는 위치 임베딩 기술 TMRoPE(Time-aligned Multimodal RoPE), 그리고 끊김 없는 음성 상호작용을 위한 저지연 오디오 응답을 가능하게 하는 블록와이즈 스트리밍 처리 등이 적용되었다.

 

경량 모델임에도 불구하고 탁월한 성능

Qwen2.5-Omni-7B는 이미지-텍스트, 영상-텍스트, 영상-음성, 음성-텍스트, 텍스트 데이터를 포함한 방대하고 다양한 데이터셋을 기반으로 사전 학습되어 다양한 작업에서 강력한 성능을 보장한다.

 알리바바 클라우드 엔드투엔드 멀티모달 AI 모델 Qwen2.5-Omni-7B 공개.jpg

혁신적인 아키텍처와 고품질 사전학습 데이터셋을 바탕으로 이 모델은 음성 명령을 정확히 이해하고 수행하는 데 뛰어난 성능을 보이며, 텍스트 입력만 사용하는 경우와 유사한 수준의 성능을 달성한다. 특히 시각, 청각(acoustic), 텍스트 정보를 통합적으로 인식, 해석, 추론하는 능력을 평가하는 OmniBench 벤치마크와 같이 다양한 모달리티를 통합적으로 처리해야 하는 작업에서도 Qwen2.5-Omni는 최고 수준의 성능을 기록했다.

 

Qwen2.5-Omni-7B는 인컨텍스트 러닝(ICL)을 통해 상황과 맥락에 따른 음성 이해 및 생성 능력을 향상시켰다. , 강화학습(RL) 기반 최적화를 통해 생성 안정성에서 상당한 향상을 보였으며, 음성 응답 시 주의력 분산, 발음 오류, 부자연스러운 정지 현상 등이 현저히 감소되었다.

 

한편, 알리바바 클라우드는 지난해 9Qwen2.5를 처음 공개한 데 이어, 올해 1월에는 ‘Qwen2.5-Max’를 출시해 Chatbot Arena에서 7위를 기록, 대등한 주요 상용 모델들 대비 뛰어난 성능을 입증한 바 있다. 또한, 시각 이해와 장문 입력 처리를 위한 모델인 ‘Qwen2.5-VL’‘Qwen2.5-1M’ 등을 오픈소스로 공개했다.

 

#알리바바클라우드#Qwen#멀티모달#AI#

 
?

  1. 크리테오, HSAD와 업무 협약 체결…“AI 기반 광고 솔루션으로 실질적인 성과 창출 지원”

    커머스 미디어 기업 크리테오는 지난 8일 HSAD와 업무 협약을 체결하고 공동 사업 추진 방안에 대해 논의했다고 밝혔다. 업무 협약식에서는 갈수록 치열해지는 경쟁 속에서 양사가 혁신과 협업을 바탕으로 우수한 성과를 창출하고, 디지털 혁신을 선도하기 위...
    Date2025.04.21 Bynewsit Views538
    Read More
  2. 인포빕, “메시징도 AI 시대… 국내 사용량 125% 급증”  

    - AI 기반 메시징 도입 확산… 기업-소비자 간 소통 방식 변화와 고객 경험(CX) 향상에 기여 - 국내 기업-소비자 간 메시징 전년 대비 125% 증가… 왓츠앱 사용량 647% 급증 - 전 세계 카카오톡 메시지 사용량의 87%가 국내 사용자… 사용량 전년 대비 56% 증가 ...
    Date2025.04.21 Bynewsit Views489
    Read More
  3. 캐논코리아, 미니 포토프린터 2종 ‘캐노니 셀피 한정판 패키지’ 출시

    - 캐노니 시리즈, 신규 캐릭터 ‘캐니(고양이)’와 ‘노니(강아지)’를 셀피 한정판 패키지로 구현 - 미니 포토프린터 2종 ‘셀피 CP1500’ 및 ‘셀피 QX20’에 ▲북케이스 콘셉트의 전용 파우치 ▲포토 앨범 구성 캐논코리아가 본격적인 피크닉 시즌을 맞아 미니 포토프...
    Date2025.04.21 Bynewsit Views160
    Read More
  4. ACM 리서치, ‘2025 3D InCites 기술 활성화 부문’ 수상

    - 대용량 팬아웃 패널 레벨 패키징(FOPLP) 솔루션의 혁신성 인정 ACM 리서치는 자사의 Ultra C ECP ap-p 장비가 2025 3D InCites 시상식에서 기술 활성화 부문상(Technology Enablement category)을 수상했다고 발표했다. 이 상은 이기종 통합 로드맵을 발전시...
    Date2025.04.21 Bynewsit Views411
    Read More
  5. 다쏘시스템, ‘2025 SUSTAINABILITY FORUM’ 참여…“기술 기반 ESG 전략 제시”

    - 디지털 기반의 ESG 전략과 지속가능한 에너지 전환 방안 제시 - 2025 SUSTAINABILITY FORUM, 한국-유럽 협력의 중요성 및 디지털 기술 기반 ESG 전략 중요성 강조 다쏘시스템은 지난 17일 서울 여의도 FKI 타워 컨퍼런스센터 3층 에메랄드홀에서 열린 2025 S...
    Date2025.04.18 Bynewsit Views440
    Read More
  6. 캐논코리아, ‘차세대 나라장터 구축’ 기여로 조달청장 표창 수상

    - ‘차세대 나라장터 구축’ 전 과정에 실질적 기여 인정받아 ‘차세대 나라장터 구축사업 유공’ 포상 - 향후에도 기술력과 역량 바탕으로 국가 발전에 기여할 수 있도록 지속적 노력할 계획 캐논코리아가 지난 17일 조달청이 주관한 ‘차세대 나라장터 구축사업 ...
    Date2025.04.18 Bynewsit Views175
    Read More
  7. 안랩, 대만 ‘CYBERSEC 2025’서 현지 맞춤형 보안 솔루션 소개

    - 대만 최대 사이버 보안 포럼 ‘CYBERSEC 2025’서 ▲CPS 보안 제품군(AhnLab EPS/XTD/Xcanner) ▲안티 랜섬웨어 제품군(AhnLab EDR/MDS) 등 소개 안랩은 15일부터 17일까지 대만 타이베이 난강전람관에서 열린 사이버 보안 포럼 ‘CYBERSEC 2025’에 참가해 현지 ...
    Date2025.04.18 Bynewsit Views147
    Read More
  8. 카스퍼스키, 한국 온라인 뱅킹 사용자 대상 ‘숨니봇(SoumniBot)’ 멀웨어 발견

    - 한국 온라인 뱅킹 사용자를 대상으로 청첩장 링크를 클릭하면 숨니봇 멀웨어가 설치 - 개인 데이터 및 은행 디지털 인증서 등의 중요한 정보 훔쳐 카스퍼스키는 오늘 사이버 범죄자들이 인생에서 가장 소중한 기념일인 결혼식 청첩장을 악용하여 안드로이드 ...
    Date2025.04.18 Bynewsit Views159
    Read More
  9. 매스웍스-포어텔릭스, 혁신적 툴체인 파트너십 체결…“마쯔다 차세대 자율주행 개발 가속화”

    - 가상 시뮬레이션 기술 통합으로 안전성 향상 및 개발 시간 단축 실현 매스웍스가 데이터 기반 자율주행 개발 툴체인 기업 포어텔릭스(Foretellix)와 전략적 기술 통합을 통해 자동차 기업 마쯔다(Mazda)의 차세대 자율주행 및 운전자 보조 시스템(AD/ADAS) ...
    Date2025.04.17 Bynewsit Views457
    Read More
  10. 엔비디아, AI 수학 올림피아드서 1위… 추론 모델로 일반화 성능 입증

    - 엔비디아 L4 GPU 4개로 구성된 클러스터로 5시간 동안 문제 50개 중 34개 풀이 - 자연어 추론과 파이썬 코드 실행 결합한 더 작고, 빠른 긴 사고 모델 구축 - 조기 중단 기법 도입해 추론 시간 획기적으로 단축 엔비디아가 AI 수학 올림피아드(AI Mathematic...
    Date2025.04.17 Bynewsit Views391
    Read More
  11. 태블로, 차세대 데이터 분석 플랫폼 ‘태블로 넥스트’ 공개…"AI 에이전트가 실무까지 주도하는 데이터 분석 자동화 시대"

    - ‘태블로 컨퍼런스 2025’서 차세대 데이터 분석 플랫폼 ‘태블로 넥스트’ 공개 - 비즈니스 리더 76%, “데이터 기반 업무 수행 부담 커졌다”… 90%는 즉시 데이터 접근 환경 기대 - 태블로 넥스트, 복잡한 분석 과정 자동화해 데이터 해석 및 활용 진입 장벽 해...
    Date2025.04.17 Bynewsit Views553
    Read More
  12. 케이엘정보통신-SAS코리아, 공공 부문 대상 데이터 및 AI 솔루션 공급 위해 파트너십 체결

    - 데이터 및 AI 기술 중심의 공공 부문 혁신 및 생산성 향상 위한 포괄적 협력 - 케이엘정보통신의 풍부한 고객층을 기반으로 SAS의 검증된 공공 특화 글로벌 솔루션 제공 공공 전문 정보기술 서비스를 제공하는 케이엘정보통신은 세계적인 데이터 및 AI 선두 ...
    Date2025.04.17 Bynewsit Views496
    Read More
  13. ST, 디지털 키 애플리케이션용 차세대 자동차용 NFC 리더기 출시…“고성능 ST25R 포트폴리오 확장”

    - CCC 디지털 자동차 키 및 차량 내 무선 충전을 지원 - 소형 사이즈의 새로운 ST25R500/501 디바이스로 최대 70% 향상된 저전력 카드 감지 범위 ST마이크로일렉트로닉스가 새로운 자동차용 NFC 리더기 2가지 제품을 출시해 ST25R 포트폴리오를 확장하고, 탁월...
    Date2025.04.17 Bynewsit Views320
    Read More
  14. 이튼, ‘데이터센터 테크데이 2025’ 개최 … AI 시대의 지속가능한 데이터센터 전력 혁신 전략 제시

    - AI 수요에 대응하는 ‘고신뢰·고효율’ 전력 솔루션, 국내 시장에서 입지 확대 - 차세대 AI 데이터센터를 위한 통합 전력 관리 솔루션 전시 … 모듈러 설계·리퀴드 쿨링 등 국내 첫 공개 이튼(Eaton)은 오늘 서울에서 ‘데이터센터 테크데이 2025(Eaton Datacent...
    Date2025.04.17 Bynewsit Views566
    Read More
  15. 마우저-ADI-암페놀, '전기 모빌리티 및 항공의 미래 조명' 전자책 발간

    마우저 일렉트로닉스(Mouser Electronics)는 아나로그디바이스(ADI) 및 암페놀(Amphenol)과 협력하여 항공 분야의 발전을 지원하는 첨단 연결 기술 및 반도체 디바이스의 핵심 역할을 조명한 새로운 전자책을 발간했다고 밝혔다. 항공 산업은 전례 없는 혁신을...
    Date2025.04.17 Bynewsit Views509
    Read More
  16. KG ICT, 카스퍼스키와 총판 계약 체결

    - Kaspersky Threat Intelligence·OT 보안 시장 본격 진출 정보통신기술 전문기업 KG ICT가 글로벌 사이버 보안 기업 카스퍼스키와 손잡고 국내 기업용 보안 시장 확대에 나선다. KG ICT는 최근 카스퍼스키와 국내 총판 계약을 체결하고, 산업 전반에 걸친 차...
    Date2025.04.17 Bynewsit Views171
    Read More
  17. 다쏘시스템코리아-울산대 SW중심대학사업단, 이끌 소프트웨어 인재 양성 MOU 체결…“산학협력 통해 주요산업 및 지역인재 육성”

    - 다쏘시스템코리아 – 울산대학교, 산학협력 통해 울산지역 주력산업 소프트웨어 및 AX 혁신 제고, 실무형 소프트웨어 인재 양성 - 다쏘시스템 3D익스피리언스 플랫폼 기반 실습 중심 교육, 산학 프로젝트, 인턴십 등 다양한 협력 프로그램 공동 추진 - 다쏘시...
    Date2025.04.16 Bynewsit Views453
    Read More
  18. 슈나이더 일렉트릭, 전력 인프라의 효율성과 안정성 높이는 DC 전력 솔루션 공개

    - 2025 국제 전기전력 전시회서 직류 배전 인프라 구축에 최적화된 DC 전력기기 제품군 선보여 - 배터리 에너지 저장 시스템(BESS) 수요에 최적화된 고신뢰성 직류 전력 솔루션 보유 슈나이더 일렉트릭이 오는 5월 14일(수) 개최되는 ‘국제 전기전력 전시회(EP...
    Date2025.04.16 Bynewsit Views502
    Read More
  19. 듀폰, 분사 예정 전자사업 신설법인 CEO로 존 켐프 선임

    - 전자사업 부문 분사, 오는 11월 1일 완료 목표 듀폰은 최근 전자&산업 부문 사장인 존 켐프(Jon Kemp)를 전자사업 분사 이후 설립될 독립 상장회사의 최고경영자(CEO) 및 이사회 구성원으로 내정했다고 발표했다. 신설 전자회사는 반도체 및 전자 산업을 위...
    Date2025.04.16 Bynewsit Views583
    Read More
  20. 히타치 스토리지, 국내 하이엔드 스토리지 시장 11년 연속 1위

    - 매출액 기준 2024년 국내 하이엔드 스토리지 시장 점유율 41.2%로 독보적 입지 - ‘VSP One’ 전략 통해 AI·하이브리드 클라우드 시대 선도하는 미래형 스토리지 아키텍처 제시 HS효성인포메이션시스템은 IDC의 분기별 외장형 스토리지 시스템 시장조사 자료(I...
    Date2025.04.16 Bynewsit Views166
    Read More
Board Pagination Prev 1 ... 64 65 66 67 68 69 70 71 72 73 ... 272 Next
/ 272
CLOSE