알리바바 클라우드, 엔드투엔드 멀티모달 AI 모델 ‘Qwen2.5-Omni-7B’ 공개.PNG

알리바바 클라우드가 자사 큐원(Qwen) 시리즈의 통합 엔드투엔드 멀티모달 모델인 ‘Qwen2.5-Omni-7B’를 새롭게 공개했다.

 

이번 모델은 종합적인 멀티모달 인식을 위해 설계되어, 텍스트, 이미지, 음성, 영상 등 다양한 형태의 입력 정보를 처리하고 실시간 텍스트 및 자연스러운 음성 응답을 지원함으로써 모바일 기기와 노트북과 같은 엣지 디바이스에 최적화된 멀티모달 AI 기술의 새로운 표준을 제시한다.

 

Qwen2.5-Omni-7B7B(70) 파라미터의 컴팩트한 설계에도 불구하고 성능 저하 없이 강력한 멀티모달 처리 능력을 제공한다. 이러한 고유한 조합은 특히 지능형 음성 애플리케이션과 같이 실질적인 가치를 제공하는 민첩하고 비용 효율적인 AI 에이전트 개발에 적합하다. 예를 들어 이 모델은 시각 장애인이 실시간 음성 설명을 통해 주변 환경을 인식하고 탐색할 수 있도록 지원하거나, 동영상 속 재료를 분석해 단계별 요리 가이드를 제공하는 데 활용될 수 있다. 또한 고객의 니즈를 정확히 이해하는 지능형 고객 응대 시스템 구현에도 적용 가능하다.

 

Qwen2.5-Omni-7B는 현재 허깅페이스(Hugging Face)와 깃허브(GitHub)를 통해 오픈소스로 공개되었으며, 큐원 챗(Qwen Chat)과 알리바바 클라우드 오픈소스 커뮤니티인 모델스코프(ModelScope)를 통해서도 접근할 수 있다. 알리바바 클라우드는 지난 몇 년간 총 200개 이상의 생성형 AI 모델을 오픈소스로 공개한 바 있다.

 

혁신적 아키텍처 기반의 고성능 멀티모달 처리

Qwen2.5-Omni-7B는 모든 모달리티 중에서 뛰어난 성능을 발휘하며, 유사한 규모의 단일 모달리티 특화 모델과 비교해도 손색이 없다. 특히 실시간 음성 상호작용, 자연스럽고 안정적인 음성 생성, 엔드투엔드 음성 명령어 이행 등에서 업계 최고 수준의 벤치마크를 제시했다.

해당 모델의 효율성과 고성능은 혁신적인 아키텍처에서 비롯된다. 대표적으로 텍스트 생성(Thinker)과 음성 합성(Talker)을 분리하여 서로 다른 모달 간의 간섭을 최소화하는 ‘Thinker-Talker 아키텍처’, 일관된 콘텐츠 생성을 위해 비디오 입력과 오디오를 보다 잘 동기화하는 위치 임베딩 기술 TMRoPE(Time-aligned Multimodal RoPE), 그리고 끊김 없는 음성 상호작용을 위한 저지연 오디오 응답을 가능하게 하는 블록와이즈 스트리밍 처리 등이 적용되었다.

 

경량 모델임에도 불구하고 탁월한 성능

Qwen2.5-Omni-7B는 이미지-텍스트, 영상-텍스트, 영상-음성, 음성-텍스트, 텍스트 데이터를 포함한 방대하고 다양한 데이터셋을 기반으로 사전 학습되어 다양한 작업에서 강력한 성능을 보장한다.

 알리바바 클라우드 엔드투엔드 멀티모달 AI 모델 Qwen2.5-Omni-7B 공개.jpg

혁신적인 아키텍처와 고품질 사전학습 데이터셋을 바탕으로 이 모델은 음성 명령을 정확히 이해하고 수행하는 데 뛰어난 성능을 보이며, 텍스트 입력만 사용하는 경우와 유사한 수준의 성능을 달성한다. 특히 시각, 청각(acoustic), 텍스트 정보를 통합적으로 인식, 해석, 추론하는 능력을 평가하는 OmniBench 벤치마크와 같이 다양한 모달리티를 통합적으로 처리해야 하는 작업에서도 Qwen2.5-Omni는 최고 수준의 성능을 기록했다.

 

Qwen2.5-Omni-7B는 인컨텍스트 러닝(ICL)을 통해 상황과 맥락에 따른 음성 이해 및 생성 능력을 향상시켰다. , 강화학습(RL) 기반 최적화를 통해 생성 안정성에서 상당한 향상을 보였으며, 음성 응답 시 주의력 분산, 발음 오류, 부자연스러운 정지 현상 등이 현저히 감소되었다.

 

한편, 알리바바 클라우드는 지난해 9Qwen2.5를 처음 공개한 데 이어, 올해 1월에는 ‘Qwen2.5-Max’를 출시해 Chatbot Arena에서 7위를 기록, 대등한 주요 상용 모델들 대비 뛰어난 성능을 입증한 바 있다. 또한, 시각 이해와 장문 입력 처리를 위한 모델인 ‘Qwen2.5-VL’‘Qwen2.5-1M’ 등을 오픈소스로 공개했다.

 

#알리바바클라우드#Qwen#멀티모달#AI#

 
?

  1. 슈나이더 일렉트릭, 전력 인프라의 효율성과 안정성 높이는 DC 전력 솔루션 공개

    - 2025 국제 전기전력 전시회서 직류 배전 인프라 구축에 최적화된 DC 전력기기 제품군 선보여 - 배터리 에너지 저장 시스템(BESS) 수요에 최적화된 고신뢰성 직류 전력 솔루션 보유 슈나이더 일렉트릭이 오는 5월 14일(수) 개최되는 ‘국제 전기전력 전시회(EP...
    Date2025.04.16 Bynewsit Views502
    Read More
  2. 듀폰, 분사 예정 전자사업 신설법인 CEO로 존 켐프 선임

    - 전자사업 부문 분사, 오는 11월 1일 완료 목표 듀폰은 최근 전자&산업 부문 사장인 존 켐프(Jon Kemp)를 전자사업 분사 이후 설립될 독립 상장회사의 최고경영자(CEO) 및 이사회 구성원으로 내정했다고 발표했다. 신설 전자회사는 반도체 및 전자 산업을 위...
    Date2025.04.16 Bynewsit Views584
    Read More
  3. 히타치 스토리지, 국내 하이엔드 스토리지 시장 11년 연속 1위

    - 매출액 기준 2024년 국내 하이엔드 스토리지 시장 점유율 41.2%로 독보적 입지 - ‘VSP One’ 전략 통해 AI·하이브리드 클라우드 시대 선도하는 미래형 스토리지 아키텍처 제시 HS효성인포메이션시스템은 IDC의 분기별 외장형 스토리지 시스템 시장조사 자료(I...
    Date2025.04.16 Bynewsit Views166
    Read More
  4. 마에스트로 포렌식, macOS 포렌식 솔루션 ‘마에스트로 위즈덤(MAESTRO WISDOM)’ 출시

    - 원격 환경에서도 macOS 기기의 디스크 이미징, 라이브 증거 데이터 수집, 디지털포렌식 조사와 악성코드 탐지 및 분석, 침해사고 대응과 분석 기능 수행 마에스트로 포렌식은 오늘, macOS 시스템 라이브 증거 데이터 추출, 원격 이미징, 침해사고 조사, 악성...
    Date2025.04.15 Bynewsit Views166
    Read More
  5. 캐논코리아, 캐논갤러리에서 스위스의 대자연 담은 ‘Wonder of Valais’ 전시 개최

    - 5월 6일(화)까지 캐논갤러리에서 EOS R 시스템으로 담아낸 11가지 색, ‘Wonder of Valais’ 전시회 개최 - EOS R 시스템의 뛰어난 화질과 정교한 표현력으로 담아낸 스위스 알프스 대자연의 광활함 - EOS R 시스템, 캐논의 독자적인 광학 기술을 기반으로 폭...
    Date2025.04.15 Bynewsit Views172
    Read More
  6. 안랩, 자체 구축 AI 플랫폼 ‘안랩 AI 플러스(AhnLab AI PLUS)’ 런칭

    -‘안랩 AI 플러스(AhnLab AI PLUS)’: 안랩이 30년간 축적한 위협 분석 데이터, 악성코드 및 침해 사고 대응 경험 등 방대한 보안 정보를 기반으로 개발한 자체 AI 플랫폼 안랩이 자체 구축 AI 플랫폼 ‘안랩 AI 플러스(AhnLab AI Plus)’를 런칭했다고 밝혔다. ‘...
    Date2025.04.15 Bynewsit Views164
    Read More
  7. 로지텍, ‘유나이트 서울 2025’ 공식 스폰서 참여…MX 마스터 시리즈로 AI 활용 스마트한 개발 환경 제시

    - AI 활용한 스마트 액션 기능으로 개발 효율 극대화 및 브랜드 체험 기회 확대 - 게임 개발 유튜버 ‘오늘코딩’과 로지텍 스마트 액션을 활용해 게임 개발 효율을 높일 수 있는 개발 과정 실시간 시연 진행 - 최고급 기계식 키보드 ‘MX Mechanical’과 고성능 ...
    Date2025.04.15 Bynewsit Views152
    Read More
  8. 온세미, 한국 신임 대표 겸 부천 팹 운영담당 부사장으로 이태종 대표이사 선임

    - 반도체 팹, 글로벌 IDM, 파운드리 등 다양한 현업에서 30년 이상의 풍부한 경험 보유 - 이태종 신임 대표, 키파운드리와 삼성반도체 거친 한국 반도체 ‘베테랑’ 온세미는 경기도 부천에 위치한 온세미코리아의 신임 대표이사로 이태종 전 키파운드리 대표이...
    Date2025.04.15 Bynewsit Views322
    Read More
  9. 피아이이, 토모큐브와 MOU 체결…홀로토모그래피 기반 검사 사업 본격 확대

    - 양사 핵심 기술 융합으로 고객 맞춤형 기술 개발, 프로젝트 공동 수행 등 다각적 협력 추진 - AI 기반 3D 이미징 기술 ‘홀로토모그래피’ …반도체, 디스플레이 등 산업 정밀 검사 분야로 확대 AI 전문기업 피아이는 3차원 비표지(label-free) 세포 이미징 전...
    Date2025.04.15 Bynewsit Views568
    Read More
  10. 사이냅소프트 '구글 워크스페이스용 사이냅 문서뷰어' 전 세계 100만 사용자 돌파

    - 문서 열람의 혁신, 한글 표준 문서 포맷까지 브라우저에서 바로 확인 가능 사이냅소프트는 자사의 '구글 워크스페이스용 사이냅 문서뷰어(Synap Document Viewer for Google Workspace)'가 출시 이후 빠른 성장세를 보이며 글로벌 누적 사용자 100만 명을 돌...
    Date2025.04.15 Bynewsit Views543
    Read More
  11. 마우저, 마이크로칩 테크놀로지 「PIC16F13145」 마이크로컨트롤러 공급…“설정 가능한 로직 블록 탑재” 

    마우저 일렉트로닉스(Mouser Electronics)는 마이크로칩 테크놀로지(Microchip Technology)의 PIC16F13145 마이크로컨트롤러(MCU) 제품군을 공급한다고 밝혔다. PIC16F13145 마이크로컨트롤러 제품군은 설정 가능한 로직 블록(CLB) 주변장치를 통해 사용자가 ...
    Date2025.04.15 Bynewsit Views449
    Read More
  12. 라바웨이브, ‘몸캠피싱 채널별 가해자 접근 패턴 분석 보고서’ 발표

    - SNS·랜덤채팅·성소수자 커뮤니티 등 다중 경로 접근- 랜덤 채팅 앱에서 2차 채팅 플랫폼으로 유인- 카카오톡, ‘추천 친구’ 기능 악용 - 영상통화로 협박 수법- 성소수자 커뮤니티 및 X(트위터)에서도 피해 잇달아 디지털 범죄 대응 전문기업 라바웨이브는 14...
    Date2025.04.15 Bynewsit Views143
    Read More
  13. MSI, RTX 5090 탑재 '타이탄 18 HX' 한정판 및 차세대 노트북 대거 출시

    엠에스아이코리아는 AI 및 레이 트레이싱 성능을 대폭 향상시킨 최신 엔비디아 지포스 RTX 50 시리즈 GPU를 탑재한 차세대 노트북을 국내 공식 출시했다고 밝혔다. 이번에 출시된 신제품은 최신 인텔 프로세서와 엔비디아 지포스 RTX 50 시리즈 GPU를 탑재해 ...
    Date2025.04.15 Bynewsit Views167
    Read More
  14. AWS, 아마존 Q 디벨로퍼 한국어 지원 확장…국내 개발자 경험 강화

    - 한국어 언어 지원 확장으로 국내 기업의 커뮤니케이션 효율성 및 개발 생산성 강화 기대 아마존웹서비스(AWS)는 오늘 아마존 Q 디벨로퍼(Amazon Q Developer)의 언어 지원 확장을 발표했다. 이를 통해 국내 개발자들은 한국어를 활용하여 아마존 Q 디벨로퍼 ...
    Date2025.04.14 Bynewsit Views545
    Read More
  15. ASUS, 라이프 스타일 맞춤형 AI 노트북 비보북(Vivobook) S16 출시

    - 퀄컴 ‘스냅드래곤 X’’ 및 AMD ‘라이젠’ 프로세서 탑재한 더욱 향상된 성능의 AI 노트북 출시 - 최대 32시간 동안 지속되는 배터리 수명, 70Wh 대용량 배터리 장착 통한 끊김 없는 사용 지원 - 전용 코파일럿 키 탑재해 AI 기능 즉시 엑세스 가능…복잡한 업무...
    Date2025.04.14 Bynewsit Views203
    Read More
  16. 와콤, 전문가용 액정 타블렛 ‘신티크 프로 24’ 스탠드 증정 프로모션 

    - 와콤, 전문가용 액정 타블렛 ‘신티크 프로 24’ 모델 대상 특별 혜택 적용 - 행사 대상 제품 구매 시 65만원 상당의 전용 스탠드 증정 및 방문 설치 서비스 제공 와콤코리아는 오늘부터 전문가용 액정 타블렛 ‘신티크 프로 24’를 대상으로 65만원 상당의 전용...
    Date2025.04.14 Bynewsit Views171
    Read More
  17. 플로우, 국내 최초 ‘공공 맞춤형 협업툴’로 공공 AI 혁신 선도…"대형 공공기관 도입 사례 증가 추세"

    - 대형 공공기관부터 지자체 산하기관까지 확산… CSAP·조달 등록으로 접근성 강화 - 민간 수준의 속도와 유연성, 최신 보안 기술로 공공 디지털 혁신을 현실로 디지털 대전환과 행정 효율화가 국가 핵심 과제로 떠오르며, 공공 부문에서도 민간 수준의 유연성...
    Date2025.04.14 Bynewsit Views692
    Read More
  18. 넷앱, 구글 클라우드와 협력…“클라우드에서 고성능 워크로드 확장 간소화”

    - 버텍스 AI(Vertex AI)를 비롯한 대규모 워크로드 지원을 개선한 구글 클라우드 넷앱 볼륨의 새로운 기능 출시 넷앱과 구글 클라우드가 완전 관리형 파일 스토리지 서비스인 ‘구글 클라우드 넷앱 볼륨(Google Cloud NetApp Volumes)’의 새로운 기능을 발표했...
    Date2025.04.11 Bynewsit Views142
    Read More
  19. BMW-알리바바, 중국에서 전략적 협력 확대…“‘노이에 클라쎄’에 생성형 AI 큐원 탑재로 모빌리티 혁신”

    BMW와 알리바바가 중국에서 전략적 협력 관계를 한층 강화한다. BMW와 알리바바 그룹은 지난 3월 27일, 전략적 파트너십 확대를 발표하고, BMW의 지능형 개인 비서 시스템(IPA)에 양사가 공동 개발한 맞춤형 AI 엔진을 탑재한다고 밝혔다. 알리바바의 지능형 ...
    Date2025.04.11 Bynewsit Views577
    Read More
  20. 테스토코리아, ‘열화상 카메라’와 ‘열선 풍속계’ 패키지 ‘20% 할인 프로모션’ 이벤트

    - 소방, 기계설비, 진단 및 점검 실무자들에게 꼭 필요한 열화상 카메라 ‘testo 872’와 열선 풍속계 ‘testo 440’을 ‘열풍’ 패키지로 구성 - 4월 9일(수)부터 6월 9일(월)까지 두 달간 ‘열풍’ 패키지 구매 고객에게 20% 할인 혜택 제공 - 계측기 업계에서 유일...
    Date2025.04.11 Bynewsit Views282
    Read More
Board Pagination Prev 1 ... 65 66 67 68 69 70 71 72 73 74 ... 272 Next
/ 272
CLOSE