알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개

newsit

https://hwlab.com/SW_Computing/18638 조회 수 138 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

- 1조 개 이상 파라미터 기반 강화학습으로 추론·지식 처리 성능 대폭 강화

- 적응형 도구 활용과 테스트 단계 확장으로 복합 추론·에이전트 역량 고도화

알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개.png

알리바바가 최신 추론 모델 ‘Qwen3-Max-Thinking’을 공개하며 초대규모 강화학습 기반 AI 경쟁력 강화에 나섰다. 알리바바에 따르면 Qwen3-Max-Thinking은 1조 개 이상의 파라미터로 모델 규모를 확장하고 강화학습을 적용해 사실적 지식 처리, 복합 추론, 지시 수행, 인간 선호도 정렬, 에이전트 기능 등 핵심 영역 전반에서 성능을 끌어올렸다.

19개 주요 벤치마크서 최신 초거대 모델과 경쟁력 입증

Qwen3-Max-Thinking은 총 19개 주요 벤치마크 평가에서 Claude Opus 4.5, Gemini 3 Pro, GPT-5.2-Thinking-xhigh 등 최신 고성능 추론 모델들과 비교해 경쟁력 있는 선도 성능을 기록했다. 과학·수학·코딩 문제 해결은 물론, 검색 도구를 활용해 다양한 분야의 전문가급 질문을 해결하는 평가 항목에서도 높은 정확도와 일관성을 보이며 범용 추론 모델로서의 완성도를 입증했다.

적응형 도구 활용으로 검색·코드 실행을 자동 판단

Qwen3-Max-Thinking의 핵심 차별점 중 하나는 적응형 도구 활용(Adaptive Tool-use) 기능이다. 모델은 대화 맥락에 따라 검색(Search), 메모리(Memory), 코드 인터프리터(Code Interpreter)를 자동으로 선택·활용한다. 기존처럼 사용자가 직접 도구를 지정할 필요 없이, 모델이 문제 해결에 필요한 수단을 스스로 판단해 호출함으로써 복잡한 추론 과정을 보다 효율적으로 수행한다. 이 기능은 초기 미세 조정 이후, 규칙 기반과 모델 기반 피드백을 결합한 다중 과제 학습을 통해 구현됐다. 검색과 메모리 기능은 환각을 줄이고 실시간 정보 접근성을 높이며, 코드 인터프리터는 계산이나 실행 기반 추론이 필요한 복합 문제 해결을 지원한다.

경험 누적형 테스트 단계 확장으로 추론 효율 개선

알리바바는 고도화된 테스트 단계 확장(Test-time Scaling) 기법도 적용했다. 특히 경험 누적형 다회차 테스트 단계 확장 전략을 도입해, 이전 상호작용에서 도출된 핵심 정보를 정제·활용하도록 설계했다. 이를 통해 이미 확인된 결론을 반복적으로 재추론하지 않고, 남아 있는 불확실성 해결에 집중할 수 있도록 했다. 그 결과 동일하거나 유사한 토큰 비용 환경에서도 병렬 샘플링 및 집계 방식 대비 지속적으로 높은 추론 성능과 문맥 효율을 기록했다.

Qwen Chat·모델 스튜디오 통해 제공

Qwen3-Max-Thinking은 현재 Qwen Chat을 통해 이용할 수 있으며, 모델 API는 알리바바의 생성형 AI 개발 플랫폼 ‘모델 스튜디오(Model Studio)’에서 제공된다. 알리바바는 이번 모델 공개를 통해 초대규모 파라미터 기반 추론 모델 경쟁에서 기술적 존재감을 강화하고, 에이전트형 AI와 복합 문제 해결 중심의 차세대 활용 시나리오를 본격 확대한다는 전략이다.

#알리바바 #Qwen3MaxThinking #추론모델 #강화학습 #생성형AI #에이전트AI #초거대AI

Facebook Twitter Google Pinterest KakaoStory Band

Atachment
첨부 '1'	알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개.png,

위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

댓글 쓰기

에디터 사용하기 닫기

뉴스룸

List of Articles
번호	제목	글쓴이	날짜	조회 수
5479	MSI, 인텔 코어 울트라 시리즈 3 탑재 ‘프레스티지 AI+’ 출시…360도 플립·OLED 적용	newsit	2026.02.11	116
5478	데이터브릭스, 전년 대비 65% 성장…연간 환산 매출 54억 달러 돌파	newsit	2026.02.11	143
5477	가민, ‘바리아 리어뷰 820’ 출시…175m 탐지·2km 가시성으로 후방 안전 강화	newsit	2026.02.11	137
5476	카스퍼스키, ‘OT 사이버보안 절감 계산기’ 공개…보안 투자 효과 수치화	newsit	2026.02.11	152
5475	MSI, 지포스 RTX 50 노트북 구매 시 ‘바이오하자드 레퀴엠’ 증정	newsit	2026.02.11	83
5474	엔비디아, ‘용과 같이 극3·외전 다크 타이즈’ 포함 3종에 DLSS 4 적용…RTX 50 번들 확대	newsit	2026.02.11	124
5473	슈나이더 일렉트릭 코리아, ‘Innovation Day for Partners 2026’ 성료…통합 채널 조직 출범 및 리바운드 전략 공개	newsit	2026.02.11	155
5472	[세미콘 코리아 2026] 엔비디아, AI 슈퍼컴퓨팅으로 반도체 설계·제조 통합 전략 제시	newsit	2026.02.11	157
5471	스틸시리즈, 세계 최초 듀얼 모드 클라우드 게임 컨트롤러 ‘님버스 클라우드’ 국내 런칭	newsit	2026.02.11	141
5470	EDB, 교보문고 차세대 DW 구축 완료…온프레미스 전환	newsit	2026.02.11	144
5469	사이냅 문서뷰어, 금융권 AX·AI 검증 인프라로 확산…국내 20대 금융사 85% 도입	newsit	2026.02.11	119
5468	닷핵 컨퍼런스 2026, 4월 코엑스 개최…AI 시대 보안 전략 집중 조명	newsit	2026.02.10	140
5467	애브넷, 아태지역 엔지니어 56% 제품 설계에 AI 활용	newsit	2026.02.10	107
5466	함샤우트 글로벌, 알리고AI와 AI·셀럽 IP 기반 마케팅 협력	newsit	2026.02.10	138
5465	SAP코리아, 제조·공급망 혁신 전략 공유하는 ‘SAP 커넥트 데이’ 개최	newsit	2026.02.10	99
5464	알리바바, 밀라노 스포르차 성서 AI 몰입형 체험 ‘원더 온 아이스’ 공개	newsit	2026.02.10	119
5463	엠클라우드브리지, Ai 365 지식관리 에이전트 도입 확대	newsit	2026.02.10	121
5462	ST·나노익스플로어, 위성·우주 임무용 SoC FPGA NG-ULTRA 공개	newsit	2026.02.10	115
5461	하이크비전, 보안 취약점 관리 국제표준 인증 획득	newsit	2026.02.10	95
5460	클라우드플레어, 2025년 4분기 DDoS 공격 전년 대비 121% 증가	newsit	2026.02.10	91

쓰기

엔비디아, 최신 게임 3종에 DLSS 4 적용…4K서 최대 3.8...	02-20
엔비디아, 블랙웰로 추론 토큰 비용 최대 10배 절감…토...	02-20
엔비디아, 메타와 차세대 AI 인프라 공동 구축…CPU·블...	02-20
카스퍼스키, 2026 동계 올림픽 겨냥 사이버 사기 경고…...	02-20
가민, 아시아 연구자에 웨어러블 로우 데이터 개방…디...	02-20
마우저, 마이크로칩 PIC32WM-BZ6 멀티프로토콜 모듈 공...	02-20
노조미 네트웍스, 랜섬웨어 70% 영어권 집중…OT·IoT 보...	02-20
마우저, 인피니언 AURIX TC4x MCU 공급…6코어 500MHz·5...	02-19
머큐시스, 10Gbps 유선 환경 대응 ‘MA510E’ 출시	02-19
지멘스, HD현대 조선 플랫폼 디지털 백본 구축…2028년 ...	02-19

오늘의 뉴스

알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개

단축키

단축키

뉴스룸