- 1조 개 이상 파라미터 기반 강화학습으로 추론·지식 처리 성능 대폭 강화

- 적응형 도구 활용과 테스트 단계 확장으로 복합 추론·에이전트 역량 고도화

 

알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개.png

알리바바가 최신 추론 모델 ‘Qwen3-Max-Thinking’을 공개하며 초대규모 강화학습 기반 AI 경쟁력 강화에 나섰다. 알리바바에 따르면 Qwen3-Max-Thinking1조 개 이상의 파라미터로 모델 규모를 확장하고 강화학습을 적용해 사실적 지식 처리, 복합 추론, 지시 수행, 인간 선호도 정렬, 에이전트 기능 등 핵심 영역 전반에서 성능을 끌어올렸다.

 

19개 주요 벤치마크서 최신 초거대 모델과 경쟁력 입증

Qwen3-Max-Thinking은 총 19개 주요 벤치마크 평가에서 Claude Opus 4.5, Gemini 3 Pro, GPT-5.2-Thinking-xhigh 등 최신 고성능 추론 모델들과 비교해 경쟁력 있는 선도 성능을 기록했다. 과학·수학·코딩 문제 해결은 물론, 검색 도구를 활용해 다양한 분야의 전문가급 질문을 해결하는 평가 항목에서도 높은 정확도와 일관성을 보이며 범용 추론 모델로서의 완성도를 입증했다.

 

적응형 도구 활용으로 검색·코드 실행을 자동 판단

Qwen3-Max-Thinking의 핵심 차별점 중 하나는 적응형 도구 활용(Adaptive Tool-use) 기능이다. 모델은 대화 맥락에 따라 검색(Search), 메모리(Memory), 코드 인터프리터(Code Interpreter)를 자동으로 선택·활용한다. 기존처럼 사용자가 직접 도구를 지정할 필요 없이, 모델이 문제 해결에 필요한 수단을 스스로 판단해 호출함으로써 복잡한 추론 과정을 보다 효율적으로 수행한다. 이 기능은 초기 미세 조정 이후, 규칙 기반과 모델 기반 피드백을 결합한 다중 과제 학습을 통해 구현됐다. 검색과 메모리 기능은 환각을 줄이고 실시간 정보 접근성을 높이며, 코드 인터프리터는 계산이나 실행 기반 추론이 필요한 복합 문제 해결을 지원한다.

 

경험 누적형 테스트 단계 확장으로 추론 효율 개선

알리바바는 고도화된 테스트 단계 확장(Test-time Scaling) 기법도 적용했다. 특히 경험 누적형 다회차 테스트 단계 확장 전략을 도입해, 이전 상호작용에서 도출된 핵심 정보를 정제·활용하도록 설계했다. 이를 통해 이미 확인된 결론을 반복적으로 재추론하지 않고, 남아 있는 불확실성 해결에 집중할 수 있도록 했다. 그 결과 동일하거나 유사한 토큰 비용 환경에서도 병렬 샘플링 및 집계 방식 대비 지속적으로 높은 추론 성능과 문맥 효율을 기록했다.

 

Qwen Chat·모델 스튜디오 통해 제공

Qwen3-Max-Thinking은 현재 Qwen Chat을 통해 이용할 수 있으며, 모델 API는 알리바바의 생성형 AI 개발 플랫폼 모델 스튜디오(Model Studio)’에서 제공된다.  알리바바는 이번 모델 공개를 통해 초대규모 파라미터 기반 추론 모델 경쟁에서 기술적 존재감을 강화하고, 에이전트형 AI와 복합 문제 해결 중심의 차세대 활용 시나리오를 본격 확대한다는 전략이다.

 

#알리바바 #Qwen3MaxThinking #추론모델 #강화학습 #생성형AI #에이전트AI #초거대AI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
2230 알리바바 클라우드, 밀라노-코르티나 2026 동계올림픽에 AI·클라우드 중계 혁신 적용 - Qwen 기반 LLM·클라우드 중계로 올림픽 방송 지능화·고속화 추진 알리바바그룹의 디지털 기술 중추인 알리바바 클라우드가 밀라노-코르티나 2026 동계올림픽과 ... file newsit 2026.02.05 136
2229 슈나이더 일렉트릭, 맥라렌 레이싱 ‘공식 에너지 테크놀로지 파트너’ 선정 - 글로벌 모터스포츠 무대서 에너지·디지털 기술 리더십 확대 - 데이터·지속가능성 기반 전략적 파트너십 본격화 슈나이더 일렉트릭이 세계적인 레이싱 팀 맥라렌... file newsit 2026.02.05 138
2228 넷스카우트, AI·ML 기반 차세대 DDoS 방어 전략 공개 - 클라우드·봇넷 결합 공격 확산…AISecOps 기반 자동화 방어 전환 필요성 제시 글로벌 보안기업 넷스카우트가 AI·머신러닝(AI/ML)을 기반으로 한 차세대 DDoS 방... file newsit 2026.02.05 104
2227 몬드리안에이아이, 금감원 가상자산 조사 플랫폼 ‘VISTA’에 AI 인프라 공급 - AI 연구개발 플랫폼 ‘예니퍼’ 적용…초 단위 시세조종 자동 탐지 체계 구현 인공지능(AI) 인프라 솔루션 전문기업 몬드리안에이아이는 금융감독원의 가상자산 불... file newsit 2026.02.04 115
2226 스노우플레이크, 데이터·AI 프로젝트 운영 전환 가속 기술 공개 - 코텍스 코드·시맨틱 뷰 오토파일럿 정식 출시…엔터프라이즈 데이터·AI 개발 자동화 강화 AI 데이터 클라우드 기업 스노우플레이크가 기업의 데이터 및 AI 프로... file newsit 2026.02.04 106
2225 사이냅소프트, 삼성SDS ‘브리티웍스’에 문서뷰어 공급 - 기업·공공 고객이 검증한 협업 환경 완성…보안·AI·전문 문서까지 확장 도큐먼트 AI 전문기업 사이냅소프트가 삼성SDS의 기업용 올인원 협업 솔루션 ‘브리티웍스... file newsit 2026.02.04 113
2224 지멘스, 가트너 매직 쿼드런트 QMS 소프트웨어 부문 리더 선정 - 비전 완성도·실행력 평가서 Teamcenter X Quality·Opcenter X Quality 경쟁력 부각 지멘스가 가트너 매직 쿼드런트 품질 관리 시스템(QMS) 소프트웨어 부문에서... file newsit 2026.02.04 128
2223 클루커스, 위즈 기반으로 현대자동차그룹 클라우드 보안 가시성 강화 지원 - 단계적 구축 통해 보안 정책·자산·취약점 통합 관리 체계 정립 데이터·인공지능(AI) 특화 클라우드 전문기업 클루커스가 글로벌 클라우드 보안 플랫폼 위즈를 ... file newsit 2026.02.04 100
2222 솔트웨어, AI 중심 사업 재편으로 3년 만에 영업이익 흑자 전환 AI 클라우드 전문기업 솔트웨어가 3년 만에 영업이익 흑자 전환에 성공하며 실적 반등의 전환점을 마련했다. 클라우드 사업의 안정적인 성장과 함께, 기존 IT 서... file newsit 2026.02.04 121
2221 넷앱, 한국 진출 25주년 맞아 엔터프라이즈 AI 데이터 플랫폼 전략 공개 - 엔터프라이즈 AI 성과 창출 위한 데이터 인프라 고도화…한국 AI 경쟁력 강화 방점 지능형 데이터 인프라 기업 넷앱이 한국 진출 25주년을 맞아 엔터프라이즈 AI... file newsit 2026.02.04 108
목록
Board Pagination Prev 1 ... 7 8 9 10 11 12 13 14 15 16 ... 234 Next
/ 234
CLOSE