- 1조 개 이상 파라미터 기반 강화학습으로 추론·지식 처리 성능 대폭 강화

- 적응형 도구 활용과 테스트 단계 확장으로 복합 추론·에이전트 역량 고도화

 

알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개.png

알리바바가 최신 추론 모델 ‘Qwen3-Max-Thinking’을 공개하며 초대규모 강화학습 기반 AI 경쟁력 강화에 나섰다. 알리바바에 따르면 Qwen3-Max-Thinking1조 개 이상의 파라미터로 모델 규모를 확장하고 강화학습을 적용해 사실적 지식 처리, 복합 추론, 지시 수행, 인간 선호도 정렬, 에이전트 기능 등 핵심 영역 전반에서 성능을 끌어올렸다.

 

19개 주요 벤치마크서 최신 초거대 모델과 경쟁력 입증

Qwen3-Max-Thinking은 총 19개 주요 벤치마크 평가에서 Claude Opus 4.5, Gemini 3 Pro, GPT-5.2-Thinking-xhigh 등 최신 고성능 추론 모델들과 비교해 경쟁력 있는 선도 성능을 기록했다. 과학·수학·코딩 문제 해결은 물론, 검색 도구를 활용해 다양한 분야의 전문가급 질문을 해결하는 평가 항목에서도 높은 정확도와 일관성을 보이며 범용 추론 모델로서의 완성도를 입증했다.

 

적응형 도구 활용으로 검색·코드 실행을 자동 판단

Qwen3-Max-Thinking의 핵심 차별점 중 하나는 적응형 도구 활용(Adaptive Tool-use) 기능이다. 모델은 대화 맥락에 따라 검색(Search), 메모리(Memory), 코드 인터프리터(Code Interpreter)를 자동으로 선택·활용한다. 기존처럼 사용자가 직접 도구를 지정할 필요 없이, 모델이 문제 해결에 필요한 수단을 스스로 판단해 호출함으로써 복잡한 추론 과정을 보다 효율적으로 수행한다. 이 기능은 초기 미세 조정 이후, 규칙 기반과 모델 기반 피드백을 결합한 다중 과제 학습을 통해 구현됐다. 검색과 메모리 기능은 환각을 줄이고 실시간 정보 접근성을 높이며, 코드 인터프리터는 계산이나 실행 기반 추론이 필요한 복합 문제 해결을 지원한다.

 

경험 누적형 테스트 단계 확장으로 추론 효율 개선

알리바바는 고도화된 테스트 단계 확장(Test-time Scaling) 기법도 적용했다. 특히 경험 누적형 다회차 테스트 단계 확장 전략을 도입해, 이전 상호작용에서 도출된 핵심 정보를 정제·활용하도록 설계했다. 이를 통해 이미 확인된 결론을 반복적으로 재추론하지 않고, 남아 있는 불확실성 해결에 집중할 수 있도록 했다. 그 결과 동일하거나 유사한 토큰 비용 환경에서도 병렬 샘플링 및 집계 방식 대비 지속적으로 높은 추론 성능과 문맥 효율을 기록했다.

 

Qwen Chat·모델 스튜디오 통해 제공

Qwen3-Max-Thinking은 현재 Qwen Chat을 통해 이용할 수 있으며, 모델 API는 알리바바의 생성형 AI 개발 플랫폼 모델 스튜디오(Model Studio)’에서 제공된다.  알리바바는 이번 모델 공개를 통해 초대규모 파라미터 기반 추론 모델 경쟁에서 기술적 존재감을 강화하고, 에이전트형 AI와 복합 문제 해결 중심의 차세대 활용 시나리오를 본격 확대한다는 전략이다.

 

#알리바바 #Qwen3MaxThinking #추론모델 #강화학습 #생성형AI #에이전트AI #초거대AI

 

 
?

  1. NEW

    슈나이더 일렉트릭, 2025년 글로벌 ESG 평가 최상위권 석권

    - WBA·ACT Core·EcoVadis·CDP 잇단 최고 등급…지속가능성 실행력 입증 에너지 관리 및 자동화 분야 글로벌 기업 슈나이더 일렉트릭이 2025년 주요 글로벌 ESG 평가에서 잇달아 최상위 성과를 기록하며 지속가능성 전략의 실행력을 입증했다. 슈나이더 일렉트릭...
    Date2026.01.30 Bynewsit Views6
    Read More
  2. 쿤텍, ‘오토모티브 월드 도쿄 2026’ 참가…‘패스트브이랩스’로 일본 SDV 시장 공략

    - Level 4 가상화 기반 SDV 개발·검증 자동화 환경 제시 - 일본 OEM·Tier-1과 실사용 중심 PoC 논의 구체화 융합보안 전문기업 쿤텍이 일본 최대 자동차 기술 전시회에서 SDV 시장 공략에 속도를 냈다. 쿤텍은 1월 21일부터 23일까지 일본 도쿄 빅사이트에서 ...
    Date2026.01.29 Bynewsit Views14
    Read More
  3. 세일즈포스, 차세대 ‘뮬소프트 에이전트 패브릭’ 공개…멀티 에이전트 통합 관리 본격화

    - 에이전트 스프롤 대응…멀티클라우드 AI 에이전트 자동 식별·관리 - AWS·구글 클라우드 등 주요 플랫폼 연동, AI 운영 가시성·비용 효율성 강화 세일즈포스가 기업 내에 분산된 AI 에이전트를 통합 관리하는 차세대 ‘뮬소프트 에이전트 패브릭(MuleSoft Agent...
    Date2026.01.29 Bynewsit Views15
    Read More
  4. 슈나이더 일렉트릭 코리아, ‘AW 2026’ 참가…AI 기반 One Solution Provider 전략 제시

    - 데이터 통합·지능형 제어로 자율제조·지속가능성 방향 제시 - EAE·AVEVA·ETAP 등 디지털 연결성 기반 솔루션 공개 슈나이더 일렉트릭 코리아가 ‘2026 스마트공장·자동화산업전(AW 2026)’에 참가해 AI 기반 산업 자동화 전략을 선보인다. 전시는 3월 4일부터 ...
    Date2026.01.29 Bynewsit Views17
    Read More
  5. 토종 AI 협업툴 ‘플로우’, 흑자 전환·고성장 동시 달성…AI 전환·글로벌 확장 가속

    - 수주·계약 210억 원 달성…IPO 준비 본격화 - AI 중심 사업 전환과 SaaS·엔터프라이즈 하이브리드 전략 성과 - 제조·금융·공공 실적 기준 국내 1위 협업툴 입지 강화 국내 스타트업 시장이 투자 위축과 수익성 압박에 직면한 가운데, 마드라스체크가 개발·운...
    Date2026.01.29 Bynewsit Views21
    Read More
  6. AMD, EPYC 앞세워 클라우드 컴퓨트 표준화 가속

    - AWS·구글·애저·OCI 전반 채택 확대…AI·HPC·범용 워크로드 대응 - 차세대 클라우드 인프라 겨냥한 성능·효율·확장성 전략 제시 AMD가 서버용 EPYC 프로세서를 중심으로 클라우드 컴퓨팅 인프라 시장에서 존재감을 확대하고 있다. 주요 하이퍼스케일러가 EPYC ...
    Date2026.01.28 Bynewsit Views28
    Read More
  7. 유아이패스, 2026년 AI·에이전틱 자동화 트렌드 제시…글로벌 AI 지형에서 아태지역 역할 부각

    - 에이전틱 AI 투자 확대 속 아태지역, 글로벌 AI 혁신의 출발점으로 부상 유아이패스가 ‘유아이패스 2026 AI 및 에이전틱 자동화 트렌드 보고서’를 통해 2026년 글로벌 AI 환경에서 아시아태평양·일본(APJ) 지역이 수행할 핵심 역할과 주요 변화 흐름을 제시...
    Date2026.01.28 Bynewsit Views19
    Read More
  8. 지브라, 아태지역 성장 가속 위한 리더십 강화

    - 주요 임원 승진·역할 확대 통해 파트너 협력 및 고객 디지털 전환 지원 강화 지브라 테크놀로지스가 아시아태평양(APAC) 지역 전반에서 리더십을 강화하며 고객 참여와 파트너 협력 확대에 나섰다. 지브라는 이번 주요 임원 인사와 역할 확대를 통해 인력 부...
    Date2026.01.28 Bynewsit Views26
    Read More
  9. 알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개

    - 1조 개 이상 파라미터 기반 강화학습으로 추론·지식 처리 성능 대폭 강화 - 적응형 도구 활용과 테스트 단계 확장으로 복합 추론·에이전트 역량 고도화 알리바바가 최신 추론 모델 ‘Qwen3-Max-Thinking’을 공개하며 초대규모 강화학습 기반 AI 경쟁력 강화에...
    Date2026.01.28 Bynewsit Views25
    Read More
  10. 넷스카우트, 통합 모니터링 솔루션 ‘엔지니어스원(nGeniusONE)’ 고도화

    - 원격 사이트 가시성 격차 해소 및 SSL/TLS 인증서 리스크 관리 강화 - 실시간 DPI·와이파이 7·SSL/TLS 모니터링 기반 복원력과 대응성 확대 넷스카우트가 이더넷과 와이파이 7 환경에서 실시간 심층 패킷 분석(DPI)을 지원하고, SSL/TLS 인증서 모니터링 기...
    Date2026.01.28 Bynewsit Views17
    Read More
목록
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 222 Next
/ 222
CLOSE