- 1조 개 이상 파라미터 기반 강화학습으로 추론·지식 처리 성능 대폭 강화

- 적응형 도구 활용과 테스트 단계 확장으로 복합 추론·에이전트 역량 고도화

 

알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개.png

알리바바가 최신 추론 모델 ‘Qwen3-Max-Thinking’을 공개하며 초대규모 강화학습 기반 AI 경쟁력 강화에 나섰다. 알리바바에 따르면 Qwen3-Max-Thinking1조 개 이상의 파라미터로 모델 규모를 확장하고 강화학습을 적용해 사실적 지식 처리, 복합 추론, 지시 수행, 인간 선호도 정렬, 에이전트 기능 등 핵심 영역 전반에서 성능을 끌어올렸다.

 

19개 주요 벤치마크서 최신 초거대 모델과 경쟁력 입증

Qwen3-Max-Thinking은 총 19개 주요 벤치마크 평가에서 Claude Opus 4.5, Gemini 3 Pro, GPT-5.2-Thinking-xhigh 등 최신 고성능 추론 모델들과 비교해 경쟁력 있는 선도 성능을 기록했다. 과학·수학·코딩 문제 해결은 물론, 검색 도구를 활용해 다양한 분야의 전문가급 질문을 해결하는 평가 항목에서도 높은 정확도와 일관성을 보이며 범용 추론 모델로서의 완성도를 입증했다.

 

적응형 도구 활용으로 검색·코드 실행을 자동 판단

Qwen3-Max-Thinking의 핵심 차별점 중 하나는 적응형 도구 활용(Adaptive Tool-use) 기능이다. 모델은 대화 맥락에 따라 검색(Search), 메모리(Memory), 코드 인터프리터(Code Interpreter)를 자동으로 선택·활용한다. 기존처럼 사용자가 직접 도구를 지정할 필요 없이, 모델이 문제 해결에 필요한 수단을 스스로 판단해 호출함으로써 복잡한 추론 과정을 보다 효율적으로 수행한다. 이 기능은 초기 미세 조정 이후, 규칙 기반과 모델 기반 피드백을 결합한 다중 과제 학습을 통해 구현됐다. 검색과 메모리 기능은 환각을 줄이고 실시간 정보 접근성을 높이며, 코드 인터프리터는 계산이나 실행 기반 추론이 필요한 복합 문제 해결을 지원한다.

 

경험 누적형 테스트 단계 확장으로 추론 효율 개선

알리바바는 고도화된 테스트 단계 확장(Test-time Scaling) 기법도 적용했다. 특히 경험 누적형 다회차 테스트 단계 확장 전략을 도입해, 이전 상호작용에서 도출된 핵심 정보를 정제·활용하도록 설계했다. 이를 통해 이미 확인된 결론을 반복적으로 재추론하지 않고, 남아 있는 불확실성 해결에 집중할 수 있도록 했다. 그 결과 동일하거나 유사한 토큰 비용 환경에서도 병렬 샘플링 및 집계 방식 대비 지속적으로 높은 추론 성능과 문맥 효율을 기록했다.

 

Qwen Chat·모델 스튜디오 통해 제공

Qwen3-Max-Thinking은 현재 Qwen Chat을 통해 이용할 수 있으며, 모델 API는 알리바바의 생성형 AI 개발 플랫폼 모델 스튜디오(Model Studio)’에서 제공된다.  알리바바는 이번 모델 공개를 통해 초대규모 파라미터 기반 추론 모델 경쟁에서 기술적 존재감을 강화하고, 에이전트형 AI와 복합 문제 해결 중심의 차세대 활용 시나리오를 본격 확대한다는 전략이다.

 

#알리바바 #Qwen3MaxThinking #추론모델 #강화학습 #생성형AI #에이전트AI #초거대AI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
2223 클루커스, 위즈 기반으로 현대자동차그룹 클라우드 보안 가시성 강화 지원 - 단계적 구축 통해 보안 정책·자산·취약점 통합 관리 체계 정립 데이터·인공지능(AI) 특화 클라우드 전문기업 클루커스가 글로벌 클라우드 보안 플랫폼 위즈를 ... file newsit 2026.02.04 100
2222 솔트웨어, AI 중심 사업 재편으로 3년 만에 영업이익 흑자 전환 AI 클라우드 전문기업 솔트웨어가 3년 만에 영업이익 흑자 전환에 성공하며 실적 반등의 전환점을 마련했다. 클라우드 사업의 안정적인 성장과 함께, 기존 IT 서... file newsit 2026.02.04 121
2221 넷앱, 한국 진출 25주년 맞아 엔터프라이즈 AI 데이터 플랫폼 전략 공개 - 엔터프라이즈 AI 성과 창출 위한 데이터 인프라 고도화…한국 AI 경쟁력 강화 방점 지능형 데이터 인프라 기업 넷앱이 한국 진출 25주년을 맞아 엔터프라이즈 AI... file newsit 2026.02.04 108
2220 딥엘, 실시간 음성 인식·번역 API 출시… 기업용 다국어 커뮤니케이션 구현 - ‘딥엘 보이스 API’ 공개… 음성 스트리밍 기반 최대 5개 언어 동시 번역 지원 딥엘이 실시간 음성 인식과 번역 기능을 애플리케이션에 통합할 수 있는 ‘딥엘 보... file newsit 2026.02.03 119
2219 슈나이더 일렉트릭 코리아, 슈나이더 일렉트릭 아카데미 2026년 신규 교육과정 개설 - 데이터센터 솔루션·변압기 교육 신설… 산업 현장 직결 실무 교육 강화 슈나이더 일렉트릭 코리아가 업계 전문가를 대상으로 운영하는 ‘슈나이더 일렉트릭 아카... file newsit 2026.02.03 95
2218 Verkada, 우송대학교에 AI 기반 통합 물리보안 플랫폼 구축 - 서버실·통신실 등 IT 핵심 공간 통합 가시성 확보… AI 분석으로 보안 운영 효율 개선 AI 기반 물리보안 기술 기업 Verkada가 우송대학교에 AI 기반 통합 물리보... file newsit 2026.02.02 119
2217 티유브이슈드, ISO 규격 전환·ESG 대응 교육 프로그램 발표 - 2026년 국제 규격 대개정 대비… 기업 맞춤형 전환·업데이트 교육 본격화 글로벌 시험·인증 기관 TUV SUD가 주요 국제 ISO 규격 개정 흐름에 맞춰 기업의 지속가... file newsit 2026.02.02 138
2216 가트너, “2027년까지 전 세계 국가 35%, 소버린 AI로 전환” - 지정학·규제·보안 압력 확대… AI 플랫폼 전환률 5%에서 7배 증가 전망 가트너가 2027년까지 전 세계 국가의 35%가 독립적인 맥락 데이터를 활용하는 ‘소버린 AI... file newsit 2026.02.02 134
2215 크리테오 “물가 상승에도 여행은 필수”… 소비자 52% 여행 수요 유지 - 글로벌 여행 트렌드 리포트 발표… 전 세계 여행객 41% 물가 상승 체감 커머스 생태계를 연결하는 글로벌 플랫폼 크리테오가 ‘2025 글로벌 여행 트렌드 리포트’... file newsit 2026.02.02 120
2214 리미니스트리트, 에이전틱 AI ERP 위한 ‘Rimini Agentic UX’ 20종 공개 - ERP 업그레이드·마이그레이션 없이 며칠 내 적용… 자동화·비용 절감·민첩성 강화 리미니스트리트가 에이전틱 AI 기반으로 ERP 프로세스를 최적화·자동 실행하는... file newsit 2026.02.02 116
목록
Board Pagination Prev 1 ... 8 9 10 11 12 13 14 15 16 17 ... 235 Next
/ 235
CLOSE