- 1조 개 이상 파라미터 기반 강화학습으로 추론·지식 처리 성능 대폭 강화

- 적응형 도구 활용과 테스트 단계 확장으로 복합 추론·에이전트 역량 고도화

 

알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개.png

알리바바가 최신 추론 모델 ‘Qwen3-Max-Thinking’을 공개하며 초대규모 강화학습 기반 AI 경쟁력 강화에 나섰다. 알리바바에 따르면 Qwen3-Max-Thinking1조 개 이상의 파라미터로 모델 규모를 확장하고 강화학습을 적용해 사실적 지식 처리, 복합 추론, 지시 수행, 인간 선호도 정렬, 에이전트 기능 등 핵심 영역 전반에서 성능을 끌어올렸다.

 

19개 주요 벤치마크서 최신 초거대 모델과 경쟁력 입증

Qwen3-Max-Thinking은 총 19개 주요 벤치마크 평가에서 Claude Opus 4.5, Gemini 3 Pro, GPT-5.2-Thinking-xhigh 등 최신 고성능 추론 모델들과 비교해 경쟁력 있는 선도 성능을 기록했다. 과학·수학·코딩 문제 해결은 물론, 검색 도구를 활용해 다양한 분야의 전문가급 질문을 해결하는 평가 항목에서도 높은 정확도와 일관성을 보이며 범용 추론 모델로서의 완성도를 입증했다.

 

적응형 도구 활용으로 검색·코드 실행을 자동 판단

Qwen3-Max-Thinking의 핵심 차별점 중 하나는 적응형 도구 활용(Adaptive Tool-use) 기능이다. 모델은 대화 맥락에 따라 검색(Search), 메모리(Memory), 코드 인터프리터(Code Interpreter)를 자동으로 선택·활용한다. 기존처럼 사용자가 직접 도구를 지정할 필요 없이, 모델이 문제 해결에 필요한 수단을 스스로 판단해 호출함으로써 복잡한 추론 과정을 보다 효율적으로 수행한다. 이 기능은 초기 미세 조정 이후, 규칙 기반과 모델 기반 피드백을 결합한 다중 과제 학습을 통해 구현됐다. 검색과 메모리 기능은 환각을 줄이고 실시간 정보 접근성을 높이며, 코드 인터프리터는 계산이나 실행 기반 추론이 필요한 복합 문제 해결을 지원한다.

 

경험 누적형 테스트 단계 확장으로 추론 효율 개선

알리바바는 고도화된 테스트 단계 확장(Test-time Scaling) 기법도 적용했다. 특히 경험 누적형 다회차 테스트 단계 확장 전략을 도입해, 이전 상호작용에서 도출된 핵심 정보를 정제·활용하도록 설계했다. 이를 통해 이미 확인된 결론을 반복적으로 재추론하지 않고, 남아 있는 불확실성 해결에 집중할 수 있도록 했다. 그 결과 동일하거나 유사한 토큰 비용 환경에서도 병렬 샘플링 및 집계 방식 대비 지속적으로 높은 추론 성능과 문맥 효율을 기록했다.

 

Qwen Chat·모델 스튜디오 통해 제공

Qwen3-Max-Thinking은 현재 Qwen Chat을 통해 이용할 수 있으며, 모델 API는 알리바바의 생성형 AI 개발 플랫폼 모델 스튜디오(Model Studio)’에서 제공된다.  알리바바는 이번 모델 공개를 통해 초대규모 파라미터 기반 추론 모델 경쟁에서 기술적 존재감을 강화하고, 에이전트형 AI와 복합 문제 해결 중심의 차세대 활용 시나리오를 본격 확대한다는 전략이다.

 

#알리바바 #Qwen3MaxThinking #추론모델 #강화학습 #생성형AI #에이전트AI #초거대AI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
5382 엔비디아, ‘하프 소드’ 포함 최신 게임 3종에 DLSS 기술 지원 확대 newfile newsit 2026.01.28 16
5381 유아이패스, 2026년 AI·에이전틱 자동화 트렌드 제시…글로벌 AI 지형에서 아태지역 역할 부각 newfile newsit 2026.01.28 9
5380 지브라, 아태지역 성장 가속 위한 리더십 강화 newfile newsit 2026.01.28 15
» 알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개 newfile newsit 2026.01.28 14
5378 넷스카우트, 통합 모니터링 솔루션 ‘엔지니어스원(nGeniusONE)’ 고도화 newfile newsit 2026.01.28 12
5377 스틸시리즈, 무선 게이밍 헤드셋 ‘아크티스 노바 엘리트’ 2025 씨넷코리아 에디터스 초이스 선정 newfile newsit 2026.01.28 13
5376 더존비즈온-롯데이노베이트, AI 기반 ERP 전략적 협력 MOU 체결… 기업 AX 시장 정조준 file newsit 2026.01.27 14
5375 티맥스소프트, 글로벌 AI 비즈니스 플랫폼 기업으로 체질 혁신 선언 file newsit 2026.01.27 15
5374 로지텍, 농심 레드포스와 2026 시즌 파트너십 체결… e스포츠 전폭 지원 지속 file newsit 2026.01.27 19
5373 리미니스트리트, ‘리미니 스마트 패스’로 혁신 자금 확보… Agentic AI ERP 전환 지원 file newsit 2026.01.27 24
5372 이글루코퍼레이션, ‘2026 이머징 AI+X 톱 100’ 2년 연속 선정 file newsit 2026.01.27 14
5371 시놀로지, 한국사업본부 공식 출범… 국내 파트너십·고객 지원 강화 file newsit 2026.01.27 21
5370 오토닉스, 다쏘시스템과 3D익스피리언스 플랫폼 구축… 단일 플랫폼 기반 스마트팩토리 고도화 file newsit 2026.01.27 12
5369 슈나이더 일렉트릭 중국 우한 공장, 세계경제포럼 인재혁신 등대공장 선정 file newsit 2026.01.27 18
5368 벡터, ‘CANoe 모델 옵션 일렉트릭 모터’ 출시… 모터 제어 유닛 조기 검증 지원 file newsit 2026.01.27 11
5367 아이티센클로잇, 엔터프라이즈 AI 플랫폼 ‘에이전트고 2026’ 출시 file newsit 2026.01.27 12
5366 하이크비전, “AI+·엣지 AI·거버넌스가 2026년 AIoT 산업 지형 재편” file newsit 2026.01.27 17
5365 MSI, 신학기 겨냥 G마켓 설 빅세일 참여… 노트북 최대 24% 할인 file newsit 2026.01.26 12
5364 ST, 클래리베이트 ‘2026 글로벌 100대 혁신 기업’ 선정 file newsit 2026.01.26 20
5363 알리바바 클라우드, AI 인프라·모델·플랫폼 전반서 글로벌 리더십 입증 file newsit 2026.01.26 19
Board Pagination Prev 1 2 3 4 5 6 7 8 9 10 ... 270 Next
/ 270
CLOSE