알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개.PNG

알리바바 클라우드가 자사 큐원(Qwen) 시리즈의 통합 엔드투엔드 멀티모달 모델인 ‘Qwen2.5-Omni-7B’를 새롭게 공개했다.

 

이번 모델은 종합적인 멀티모달 인식을 위해 설계되어, 텍스트, 이미지, 음성, 영상 등 다양한 형태의 입력 정보를 처리하고 실시간 텍스트 및 자연스러운 음성 응답을 지원함으로써 모바일 기기와 노트북과 같은 엣지 디바이스에 최적화된 멀티모달 AI 기술의 새로운 표준을 제시한다.

 

Qwen2.5-Omni-7B7B(70) 파라미터의 컴팩트한 설계에도 불구하고 성능 저하 없이 강력한 멀티모달 처리 능력을 제공한다. 이러한 고유한 조합은 특히 지능형 음성 애플리케이션과 같이 실질적인 가치를 제공하는 민첩하고 비용 효율적인 AI 에이전트 개발에 적합하다. 예를 들어 이 모델은 시각 장애인이 실시간 음성 설명을 통해 주변 환경을 인식하고 탐색할 수 있도록 지원하거나, 동영상 속 재료를 분석해 단계별 요리 가이드를 제공하는 데 활용될 수 있다. 또한 고객의 니즈를 정확히 이해하는 지능형 고객 응대 시스템 구현에도 적용 가능하다.

 

Qwen2.5-Omni-7B는 현재 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 오픈소스로 공개되었으며, 큐원 챗(Qwen Chat)과 알리바바 클라우드 오픈소스 커뮤니티인 모델스코프(ModelScope)를 통해서도 접근할 수 있다. 알리바바 클라우드는 지난 몇 년간 총 200개 이상의 생성형 AI 모델을 오픈소스로 공개한 바 있다.

 

혁신적 아키텍처 기반의 고성능 멀티모달 처리

Qwen2.5-Omni-7B는 모든 모달리티 중에서 뛰어난 성능을 발휘하며, 유사한 규모의 단일 모달리티 특화 모델과 비교해도 손색이 없다. 특히 실시간 음성 상호작용, 자연스럽고 안정적인 음성 생성, 엔드투엔드 음성 명령어 이행 등에서 업계 최고 수준의 벤치마크를 제시했다.

해당 모델의 효율성과 고성능은 혁신적인 아키텍처에서 비롯된다. 대표적으로 텍스트 생성(Thinker)과 음성 합성(Talker)을 분리하여 서로 다른 모달 간의 간섭을 최소화하는 ‘Thinker-Talker 아키텍처’, 일관된 콘텐츠 생성을 위해 비디오 입력과 오디오를 보다 잘 동기화하는 위치 임베딩 기술 TMRoPE(Time-aligned Multimodal RoPE), 그리고 끊김 없는 음성 상호작용을 위한 저지연 오디오 응답을 가능하게 하는 블록와이즈 스트리밍 처리 등이 적용되었다.

 

경량 모델임에도 불구하고 탁월한 성능

Qwen2.5-Omni-7B는 이미지-텍스트, 영상-텍스트, 영상-음성, 음성-텍스트, 텍스트 데이터를 포함한 방대하고 다양한 데이터셋을 기반으로 사전 학습되어 다양한 작업에서 강력한 성능을 보장한다.

 알리바바 클라우드 엔드투엔드 멀티모달 AI 모델 Qwen2.5-Omni-7B 공개.jpg

혁신적인 아키텍처와 고품질 사전학습 데이터셋을 바탕으로 이 모델은 음성 명령을 정확히 이해하고 수행하는 데 뛰어난 성능을 보이며, 텍스트 입력만 사용하는 경우와 유사한 수준의 성능을 달성한다. 특히 시각, 청각(acoustic), 텍스트 정보를 통합적으로 인식, 해석, 추론하는 능력을 평가하는 OmniBench 벤치마크와 같이 다양한 모달리티를 통합적으로 처리해야 하는 작업에서도 Qwen2.5-Omni는 최고 수준의 성능을 기록했다.

 

Qwen2.5-Omni-7B는 인컨텍스트 러닝(ICL)을 통해 상황과 맥락에 따른 음성 이해 및 생성 능력을 향상시켰다. , 강화학습(RL) 기반 최적화를 통해 생성 안정성에서 상당한 향상을 보였으며, 음성 응답 시 주의력 분산, 발음 오류, 부자연스러운 정지 현상 등이 현저히 감소되었다.

 

한편, 알리바바 클라우드는 지난해 9Qwen2.5를 처음 공개한 데 이어, 올해 1월에는 ‘Qwen2.5-Max’를 출시해 Chatbot Arena에서 7위를 기록, 대등한 주요 상용 모델들 대비 뛰어난 성능을 입증한 바 있다. 또한, 시각 이해와 장문 입력 처리를 위한 모델인 ‘Qwen2.5-VL’‘Qwen2.5-1M’ 등을 오픈소스로 공개했다.

 

#알리바바클라우드#Qwen#멀티모달#AI#

 
?

  1. 레드밴스, 디자인·기능성 갖춘 ‘오스람 LED 슬림 다운라이트’ 출시

    - 슬림한 형태와 미니멀한 화이트 바디로 다양한 인테리어 스타일과 조화 - 플리커 프리 광원과 최적화된 설계 통해 안정적인 빛 제공 - 3인치부터 8인치까지 다양한 규격과 뛰어난 에너지 효율 글로벌 조명 기업 레드밴스가 디자인과 기능성을 갖춘 등기구 ‘...
    Date2025.04.03 Bynewsit Views70
    Read More
  2. ASUS, 4K 240Hz 게이밍 모니터 ROG Strix OLED 「XG27UCDMG」 발표

    에이수스 코리아는 최신 4세대 QD-OLED 패널을 기반으로 240Hz 주사율, 4K 해상도의 스펙을 갖춘 게이밍 모니터, ROG Strix OLED XG27UCDMG를 공개했다. ROG Strix OLED XG27UCDMG는 게이밍뿐만 아니라 콘텐츠 및 일상 사용을 위한 모니터를 선호하는 사용자를...
    Date2025.04.03 Bynewsit Views121
    Read More
  3. 키넥시스, 데이터브릭스와 파트너십 체결… AI 기반 공급망 오케스트레이션 가속화

    - 키넥시스 마에스트로(Kinaxis Maestro)와 데이터브릭스의 데이터 인텔리전스 플랫폼(Data Intelligence Platform)을 결합 - 글로벌 공급망 전반에서 더 빠른 인사이트, 통합 데이터, 확장 가능한 AI 제공 키넥시스(Kinaxis))와 데이터 및 AI 전문 기업 데이...
    Date2025.04.03 Bynewsit Views341
    Read More
  4. MSI, 4월 지포스 RTX50/40 및 라데온 RX6000 구매 이벤트

    - MSI 지포스 RTX 50/RTX 40 및 라데온 RX 6000 시리즈 구매 이벤트 - 구매 후 MSI 홈페이지에 제품 등록 후 프로모션 신청하면 35,000원 스팀 월렛 증정 엠에스아이코리아는 MSI 그래픽카드를 구매한 고객들에게 스팀 월렛 35,000원 코드를 증정하는 행사를 ...
    Date2025.04.03 Bynewsit Views119
    Read More
  5. 마우저, ADI 「ADIS1657x」 MEMS IMU 모듈 공급

    마우저 일렉트로닉스는 아나로그디바이스(ADI)의 새로운 ADIS1657x 정밀 MEMS 기반 관성측정장치(IMU) 모듈을 공급한다고 밝혔다. 3축 자이로스코프와 가속도계를 내장한 ADIS1657x MEMS IMU는 공장 및 산업 자동화를 비롯해 건설 장비와 스마트 농업, 무인 및...
    Date2025.04.03 Bynewsit Views257
    Read More
  6. 헥사곤, '하노버 메세 2025' 참가… 'F1 팩토리' 통해 넥서스 플랫폼 제조 혁신 성과 공개  

    - 헥사곤 디지털 리얼리티 플랫폼 ‘넥서스’, 출시 2년 만에 3만 명 이상 사용자 확보… 제조업 디지털 전환 가속화 - 헥사곤, 오라클 레드불 레이싱 F1 차량 통해 설계부터 품질 검사까지 워크플로우 전 단계 지원하는 통합 솔루션 시연 헥사곤 매뉴팩처링 인텔...
    Date2025.04.03 Bynewsit Views319
    Read More
  7. 다쏘시스템, 몰입형 증강현실 ‘에너지 익스피리언스’ 발표…“지속가능한 에너지 창출∙사용 혁신 제시”

    - 버추얼 트윈 활용한 협업적이고 혁신적인 솔루션 통해 에너지 소비 개선, 식량 생산 최적화, 친환경적인 모빌리티 창조 - 에너지와 자연, 가상 세계에서 결합하여 인류의 발전 이끌고 실생활 개선할 것 다쏘시스템이 프랑스 파리의 기념비적인 랜드마크를 버...
    Date2025.04.03 Bynewsit Views342
    Read More
  8. 카스퍼스키 EDR, 3년 연속 AV-Comparatives EPR 테스트 '리더' 선정

    - 카스퍼스키 Next EDR Expert, 합리적인 제품 비용과 운영 정확도를 유지하여 비용을 절감시키고, 침해 예방 및 대응에 있어 탁월한 성능 인정 카스퍼스키는 오늘, 2024 AV-Comparatives Endpoint Prevention and Response (EPR) 테스트에서 EDR 솔루션인 ‘Ka...
    Date2025.04.03 Bynewsit Views139
    Read More
  9. 지코어, 노던데이터그룹과 전략적 파트너십 체결…“글로벌 AI 추론 가속화”

    - 지코어, 노던데이터그룹과 파트너십 통해 풀스택 AI 플랫폼 제공 - 독자적인 지능형 전송 네트워크(IDN)로 초저지연 속도와 엔터프라이즈급 보안까지 확보 - 단 몇 번의 클릭만으로 전 세계에 빠르게 AI 솔루션 배포 가능…AI 인프라 혁신 가속화 기대 지코어...
    Date2025.04.03 Bynewsit Views302
    Read More
  10. 캐논코리아, '파워샷 골프' 광고 모델 김효주 선수 LPGA 통산 7번째 우승 기념 특별 이벤트

    - 캐논 ‘파워샷 골프’ 광고 모델 김효주 선수, LPGA 투어 포드 챔피언십 우승으로 통산 7번째 우승컵 획득 - 캐논코리아, 공식 인스타그램 채널 통해 ▲’파워샷 골프’ 제품 후기 작성 ▲김효주 선수 응원 댓글 이벤트 진행 캐논코리아는 캐논 골프 거리측정기 '...
    Date2025.04.03 Bynewsit Views128
    Read More
  11. SAS코리아, 신용 포트폴리오 관리 솔루션 ‘윈나우(Winnow)’ 출시…“금융기관 선제적 리스크 관리 지원 강화”

    - SAS 바이야 플랫폼에 액스로직 ‘윈나우’ 통합 제공... 금융사 리스크 대응력 및 신용 포트폴리오 관리 역량 강화 - 4월 8일 ‘윈나우’ 국내 출시 세미나 개최… 신용 포트폴리오 수익성 및 리스크 관리 방안 소개 SAS코리아가 금융기관을 위한 신용 포트폴리오...
    Date2025.04.02 Bynewsit Views307
    Read More
  12. 슈나이더 일렉트릭, AI 시대 맞춤형 데이터 센터 쿨링 혁신 선도

    - AI 워크로드 증가로 인한 열 관리 문제 해결 위한 쿨링 시스템 고도화 - 모티브에어 인수 통해 고성능·고효율 쿨링 솔루션 제공… 지속 가능한 데이터 센터 실현 슈나이더 일렉트릭은 AI 기술 발전에 따른 데이터 센터의 에너지 수요 증가와 열 관리 문제에 ...
    Date2025.04.02 Bynewsit Views471
    Read More
  13. AWS, AWS 마켓플레이스 한국 확장…“국내 기술 기업의 글로벌 접근성 강화”

    - 네오사피엔스, 솔트룩스, 슈퍼브에이아이 등 국내 ISV 및 LG CNS, 메가존클라우드, SK C&C 등 채널 파트너, 글로벌 고객과 직접 거래할 새로운 기회 열려 아마존웹서비스(AWS)는 오늘 AWS 마켓플레이스의 한국 확장을 발표했다. 이번 확장을 통해 국내 독립 ...
    Date2025.04.02 Bynewsit Views368
    Read More
  14. MSI, 최신 지포스 RTX 5090 탑재 게이밍 노트북 출시!

    엠에스아이코리아는 최신 엔비디아 지포스 RTX 5090 그래픽을 탑재한 초고성능 게이밍 노트북을 공식 출시하며 4월 15일까지 사전 예약 판매를 진행한다고 밝혔다. 차세대 지포스 RTX 5090, 역대급 성능 제공 이번에 출시된 MSI 레이더(Raider) 시리즈는 AI 기...
    Date2025.04.02 Bynewsit Views125
    Read More
  15. ST, 4채널 지능형 전력 스위치 「IPS4140HQ/IPS4140HQ-1」 출시…“컴팩트한 크기로 효율적이고 견고한 성능 제공”

    - PLC, 산업용 PC 주변장치의 입출력 포트, 수치 제어 공작기계 지원 ST마이크로일렉트로닉스가 다양한 기능을 갖춘 4채널 지능형 전력 스위치인 IPS4140HQ 및 IPS4140HQ-1을 출시했다. 이 전력 스위치는 컴팩트한 풋프린트(8mm × 6mm)와 채널당 최대 80mΩ의 R...
    Date2025.04.02 Bynewsit Views437
    Read More
  16. 유아이패스, ‘유아이패스 테스트 클라우드’ 출시…“소프트웨어 품질 테스트에 AI 에이전트 활용”

    - 유아이패스 에이전틱 테스트, 기존 소프트웨어 테스팅 방식에 소요되는 IT 예산 25%를 획기적으로 절감 유아이패스(UiPath)는 오늘 ‘유아이패스 테스트 클라우드(UiPath Test Cloud)’를 출시한다고 발표했다. 고급 AI를 활용하는 이 솔루션은 혁신적인 소프...
    Date2025.04.02 Bynewsit Views333
    Read More
  17. 태블로, '나라장터' 등록으로 공공기관 공급 시작…“공공부문 데이터 기반 행정 및 디지털 전환 가속화 기대”

    - 정부·지자체·교육기관 등 공공기관 별도 계약 절차 없이 데이터 분석 솔루션 도입 가능 - 데이터 품질 관리 및 데이터 기반의 정책 의사결정 지원으로 공공 서비스 혁신 지원 목표 세일즈포스는 지능형 데이터 분석 플랫폼 태블로의 조달청 나라장터 종합쇼...
    Date2025.04.02 Bynewsit Views358
    Read More
  18. 가트너, “올해 전 세계 생성형 AI 지출 76.4% 증가”

    - 생성형 AI 지출, 기반 모델 개선과 AI 제품 수요 증가로 올해 6,440억 달러 전망 - 생성형 AI 도입 시 자체 개발 대신 상용 솔루션 활용에 집중할 것 - 하드웨어, 전체 생성형 AI 지출의 80% 차지… “AI 지원 디바이스가 시장 성장 주도” 가트너는 2025년 전 ...
    Date2025.04.02 Bynewsit Views332
    Read More
  19. 티머니, 신설 분할 법인 ‘티머니모빌리티’ 출범…“더 편한 이동과 결제로 모두를 위한 모빌리티 생태계 실현”

    - 교통 약자 배려, 대중교통 활성화, 지자체 협업, 운수업계 상생 등 ESG 경영 강화 - 카카오모빌리티 지분 투자 및 전략적 협력으로 공공교통 및 공익 서비스 고도화 지원 티머니가 카카오모빌리티와 손잡고 생활 밀착형 모빌리티 핀테크 플랫폼 기업 ‘티머니...
    Date2025.04.01 Bynewsit Views557
    Read More
  20. 노르딕 세미컨덕터, ‘nPM2100’ 전력관리 IC로 비충전식 배터리 애플리케이션 개발 지원

    노르딕 세미컨덕터가 자사의 nPM2100 전력관리 IC(PMIC)에 대한 개발 지원을 공식화한다고 밝혔다. 지난 1월 출시된 이후 조기에 nPM2100을 채택한 고객들은 이미 개인 건강 모니터링 기기에서 무선 산업용 센서에 이르기까지 다양한 1차 전지용 애플리케이션...
    Date2025.04.01 Bynewsit Views280
    Read More
Board Pagination Prev 1 ... 45 46 47 48 49 50 51 52 53 54 ... 250 Next
/ 250
CLOSE