- 1조 개 이상 파라미터 기반 강화학습으로 추론·지식 처리 성능 대폭 강화

- 적응형 도구 활용과 테스트 단계 확장으로 복합 추론·에이전트 역량 고도화

 

알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개.png

알리바바가 최신 추론 모델 ‘Qwen3-Max-Thinking’을 공개하며 초대규모 강화학습 기반 AI 경쟁력 강화에 나섰다. 알리바바에 따르면 Qwen3-Max-Thinking1조 개 이상의 파라미터로 모델 규모를 확장하고 강화학습을 적용해 사실적 지식 처리, 복합 추론, 지시 수행, 인간 선호도 정렬, 에이전트 기능 등 핵심 영역 전반에서 성능을 끌어올렸다.

 

19개 주요 벤치마크서 최신 초거대 모델과 경쟁력 입증

Qwen3-Max-Thinking은 총 19개 주요 벤치마크 평가에서 Claude Opus 4.5, Gemini 3 Pro, GPT-5.2-Thinking-xhigh 등 최신 고성능 추론 모델들과 비교해 경쟁력 있는 선도 성능을 기록했다. 과학·수학·코딩 문제 해결은 물론, 검색 도구를 활용해 다양한 분야의 전문가급 질문을 해결하는 평가 항목에서도 높은 정확도와 일관성을 보이며 범용 추론 모델로서의 완성도를 입증했다.

 

적응형 도구 활용으로 검색·코드 실행을 자동 판단

Qwen3-Max-Thinking의 핵심 차별점 중 하나는 적응형 도구 활용(Adaptive Tool-use) 기능이다. 모델은 대화 맥락에 따라 검색(Search), 메모리(Memory), 코드 인터프리터(Code Interpreter)를 자동으로 선택·활용한다. 기존처럼 사용자가 직접 도구를 지정할 필요 없이, 모델이 문제 해결에 필요한 수단을 스스로 판단해 호출함으로써 복잡한 추론 과정을 보다 효율적으로 수행한다. 이 기능은 초기 미세 조정 이후, 규칙 기반과 모델 기반 피드백을 결합한 다중 과제 학습을 통해 구현됐다. 검색과 메모리 기능은 환각을 줄이고 실시간 정보 접근성을 높이며, 코드 인터프리터는 계산이나 실행 기반 추론이 필요한 복합 문제 해결을 지원한다.

 

경험 누적형 테스트 단계 확장으로 추론 효율 개선

알리바바는 고도화된 테스트 단계 확장(Test-time Scaling) 기법도 적용했다. 특히 경험 누적형 다회차 테스트 단계 확장 전략을 도입해, 이전 상호작용에서 도출된 핵심 정보를 정제·활용하도록 설계했다. 이를 통해 이미 확인된 결론을 반복적으로 재추론하지 않고, 남아 있는 불확실성 해결에 집중할 수 있도록 했다. 그 결과 동일하거나 유사한 토큰 비용 환경에서도 병렬 샘플링 및 집계 방식 대비 지속적으로 높은 추론 성능과 문맥 효율을 기록했다.

 

Qwen Chat·모델 스튜디오 통해 제공

Qwen3-Max-Thinking은 현재 Qwen Chat을 통해 이용할 수 있으며, 모델 API는 알리바바의 생성형 AI 개발 플랫폼 모델 스튜디오(Model Studio)’에서 제공된다.  알리바바는 이번 모델 공개를 통해 초대규모 파라미터 기반 추론 모델 경쟁에서 기술적 존재감을 강화하고, 에이전트형 AI와 복합 문제 해결 중심의 차세대 활용 시나리오를 본격 확대한다는 전략이다.

 

#알리바바 #Qwen3MaxThinking #추론모델 #강화학습 #생성형AI #에이전트AI #초거대AI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
2303 [GTC 2026] 엔비디아, ‘베라 루빈’ 공개… NVL72·LPU 기반 AI 팩토리 전환 - 7종 칩·5개 랙 통합 설계로 학습·추론·에이전트 전 과정 처리 엔비디아가 GTC 2026에서 차세대 AI 플랫폼 ‘베라 루빈’을 공개하고, AI 인프라를 랙·POD 기반 ‘A... file newsit 2026.03.17 74
2302 사이냅소프트, ‘사이냅 문서뷰어’로 AI 문서 활용 확대 - EDMS·KMS·문서중앙화 시스템 연동으로 기업 문서 활용 환경 강화 사이냅소프트가 기업 문서 인프라와 연동되는 ‘사이냅 문서뷰어’를 앞세워 AI 기반 문서 활용 ... file newsit 2026.03.16 72
2301 유아이패스·딜로이트, ‘에이전틱 ERP’ 공개…AI 기반 ERP 자동화 추진 - AI 에이전트·RPA·ERP 오케스트레이션 결합한 자율형 기업 운영 모델 제시 유아이패스가 딜로이트와 협력을 확대하고 AI 기반 업무 오케스트레이션을 적용한 ‘에... file newsit 2026.03.16 85
2300 티맥스소프트, 기술본부장에 최영만 전무 선임…글로벌 기술지원 체계 강화 - 빅데이터·AI·클라우드 분야 25년 경력 전문가 영입 티맥스소프트가 글로벌 기술지원 체계 강화를 위해 신임 기술본부장에 최영만 전무를 선임했다. AI 기반 기... file newsit 2026.03.16 78
2299 가트너, AI 시대 데이터·분석 8대 전망…2027년 채용 75% AI 역량 평가 - AI 확산에 인재 전략·데이터 거버넌스·시맨틱 데이터 인프라 변화 가트너가 AI 확산이 데이터 및 분석(D&A) 조직 전반에 구조적 변화를 가져오며 인재 전략과 ... file newsit 2026.03.16 65
2298 HS효성인포메이션·EDB, 데이터 기술 협력…엔터프라이즈 데이터 시장 확대 - 데이터 인프라 컨설팅과 데이터베이스 기술 결합 HS효성인포메이션시스템이 EDB와 엔터프라이즈 데이터 기술 협력을 위한 업무협약(MOU)을 체결하며 국내 데이... file newsit 2026.03.16 71
2297 윈드리버, 김영남 한국 지사장 선임…클라우드·리눅스 시장 확대 추진 - 임베디드 사업 기반으로 엔터프라이즈·클라우드 영역 확장 윈드리버가 김영남 한국 지사장을 선임하며 국내 사업 확대 전략을 강화했다. 임베디드 소프트웨어 ... newsit 2026.03.16 60
2296 리미니스트리트, ‘2026 리미니스트리트 써밋’ 개최…AI 기반 ERP 혁신 전략 공유 - Rimini Smart Path 기반 운영 최적화와 Agentic AI 전환 방향 제시 리미니스트리트가 서울에서 ‘2026 리미니스트리트 써밋’을 개최하고 AI 기반 엔터프라이즈 ... file newsit 2026.03.13 89
2295 헥사곤, 레드불 포드 파워트레인스 F1 엔진 개발 지원…정밀 측정 기술 적용 - 독점 메트롤로지 파트너 참여…2026 F1 규정 대응 파워트레인 개발 헥사곤이 오라클 레드불 레이싱과 레드불 포드 파워트레인스의 독점 메트롤로지 파트너로 참... file newsit 2026.03.13 105
2294 AT&T·AWS·아마존 레오, 미국 통신 인프라 현대화 협력 - 클라우드 전환·광섬유 연결·저궤도 위성 네트워크 확대 AT&T와 아마존웹서비스(AWS), 아마존 레오가 미국 통신 인프라 현대화를 위한 협력에 나섰다. 세 기업은... file newsit 2026.03.13 103
목록
Board Pagination Prev 1 ... 3 4 5 6 7 8 9 10 11 12 ... 238 Next
/ 238
CLOSE