- 1조 개 이상 파라미터 기반 강화학습으로 추론·지식 처리 성능 대폭 강화

- 적응형 도구 활용과 테스트 단계 확장으로 복합 추론·에이전트 역량 고도화

 

알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개.png

알리바바가 최신 추론 모델 ‘Qwen3-Max-Thinking’을 공개하며 초대규모 강화학습 기반 AI 경쟁력 강화에 나섰다. 알리바바에 따르면 Qwen3-Max-Thinking1조 개 이상의 파라미터로 모델 규모를 확장하고 강화학습을 적용해 사실적 지식 처리, 복합 추론, 지시 수행, 인간 선호도 정렬, 에이전트 기능 등 핵심 영역 전반에서 성능을 끌어올렸다.

 

19개 주요 벤치마크서 최신 초거대 모델과 경쟁력 입증

Qwen3-Max-Thinking은 총 19개 주요 벤치마크 평가에서 Claude Opus 4.5, Gemini 3 Pro, GPT-5.2-Thinking-xhigh 등 최신 고성능 추론 모델들과 비교해 경쟁력 있는 선도 성능을 기록했다. 과학·수학·코딩 문제 해결은 물론, 검색 도구를 활용해 다양한 분야의 전문가급 질문을 해결하는 평가 항목에서도 높은 정확도와 일관성을 보이며 범용 추론 모델로서의 완성도를 입증했다.

 

적응형 도구 활용으로 검색·코드 실행을 자동 판단

Qwen3-Max-Thinking의 핵심 차별점 중 하나는 적응형 도구 활용(Adaptive Tool-use) 기능이다. 모델은 대화 맥락에 따라 검색(Search), 메모리(Memory), 코드 인터프리터(Code Interpreter)를 자동으로 선택·활용한다. 기존처럼 사용자가 직접 도구를 지정할 필요 없이, 모델이 문제 해결에 필요한 수단을 스스로 판단해 호출함으로써 복잡한 추론 과정을 보다 효율적으로 수행한다. 이 기능은 초기 미세 조정 이후, 규칙 기반과 모델 기반 피드백을 결합한 다중 과제 학습을 통해 구현됐다. 검색과 메모리 기능은 환각을 줄이고 실시간 정보 접근성을 높이며, 코드 인터프리터는 계산이나 실행 기반 추론이 필요한 복합 문제 해결을 지원한다.

 

경험 누적형 테스트 단계 확장으로 추론 효율 개선

알리바바는 고도화된 테스트 단계 확장(Test-time Scaling) 기법도 적용했다. 특히 경험 누적형 다회차 테스트 단계 확장 전략을 도입해, 이전 상호작용에서 도출된 핵심 정보를 정제·활용하도록 설계했다. 이를 통해 이미 확인된 결론을 반복적으로 재추론하지 않고, 남아 있는 불확실성 해결에 집중할 수 있도록 했다. 그 결과 동일하거나 유사한 토큰 비용 환경에서도 병렬 샘플링 및 집계 방식 대비 지속적으로 높은 추론 성능과 문맥 효율을 기록했다.

 

Qwen Chat·모델 스튜디오 통해 제공

Qwen3-Max-Thinking은 현재 Qwen Chat을 통해 이용할 수 있으며, 모델 API는 알리바바의 생성형 AI 개발 플랫폼 모델 스튜디오(Model Studio)’에서 제공된다.  알리바바는 이번 모델 공개를 통해 초대규모 파라미터 기반 추론 모델 경쟁에서 기술적 존재감을 강화하고, 에이전트형 AI와 복합 문제 해결 중심의 차세대 활용 시나리오를 본격 확대한다는 전략이다.

 

#알리바바 #Qwen3MaxThinking #추론모델 #강화학습 #생성형AI #에이전트AI #초거대AI

 

 
?

List of Articles
번호 분류 제목 글쓴이 날짜 조회 수
2253 딥엘, AWS 마켓플레이스 입점…기업용 AI 번역 구매·운영 통합 - 딥엘 API 제공·AWS FTR 통과, 보안·확장성 기반 도입 간소화 글로벌 언어 AI 기업 딥엘은 자사 언어 AI 솔루션을 AWS 마켓플레이스에 제공한다고 19일 밝혔다. ... file newsit 2026.02.19 66
2252 벡터, 영역형 ECU·HPC 아키텍처 대응 ‘CANape 24’ 출시 - ASAM CMP 지원·ADAS 실시간 검증·100GB 클라우드 로깅 강화 벡터코리아는 영역형 ECU(Zonal ECU)와 고성능 컴퓨터(HPC) 기반 차량 아키텍처 환경에서 고정밀 계... file newsit 2026.02.19 53
2251 델, 맥라렌 F1 설계부터 전략까지 AI로 재편 - 설계·제조·레이스 운영 전 과정에 HPC·AI PC 적용 델과 맥라렌 레이싱과 기술 파트너십을 확대하고 F1 경기력 강화를 위해 AI 인프라와 PC 포트폴리오를 전면 ... file newsit 2026.02.19 54
2250 슈나이더 일렉트릭 코리아, ‘소프트웨어 정의 자동화’로 통합 포트폴리오 혁신 가속   - 설계–자동화–전력–운영 데이터 연결…AI 기반 통합 운영 체계 구현 슈나이더 일렉트릭 코리아가 AI·소프트웨어 기반 산업 자동화 전략을 강화하며, 설계부터 운... file newsit 2026.02.13 116
2249 벡터코리아, AI·클라우드 전략 투자 확대…소프트웨어 생태계 기업 전환 선언 - 코드 중심 개발·확장형 플랫폼 고도화…자동차 넘어 의료·항공·산업 IoT 확장 벡터코리아 장지환 지사장은 코드 중심 소프트웨어 개발과 클라우드, AI 분야에 대... file newsit 2026.02.12 209
2248 데이터브릭스, 전년 대비 65% 성장…연간 환산 매출 54억 달러 돌파 - 기업가치 1,340억 달러 평가·70억 달러 시리즈 L 투자 마무리 - AI 제품 매출 14억 달러·순매출 유지율 140% 유지 - 레이크베이스·지니 고도화에 자금 투입 데... file newsit 2026.02.11 204
2247 슈나이더 일렉트릭 코리아, ‘Innovation Day for Partners 2026’ 성료…통합 채널 조직 출범 및 리바운드 전략 공개 - BU별 조직 통합, 일관된 파트너 지원 체계 본격 가동 - ‘Key Hero Offers’ 공식 론칭 및 2026년 리바운드 전략 공유 슈나이더 일렉트릭 코리아는 2월 10일 서울... file newsit 2026.02.11 211
2246 EDB, 교보문고 차세대 DW 구축 완료…온프레미스 전환 - 외산 클라우드 전용 DW 대체…데이터 주권 확보·비용 구조 개선 EDB가 교보문고와 협력해 ‘EDB Postgres AI for WarehousePG’ 기반 차세대 경영정보 지원시스템 ... file newsit 2026.02.11 191
2245 사이냅 문서뷰어, 금융권 AX·AI 검증 인프라로 확산…국내 20대 금융사 85% 도입 - ERP·KMS부터 RAG 기반 AI 검증까지… 금융권 AX 인프라로 표준화 사이냅소프트가 자사 문서 관리 솔루션 ‘사이냅 문서뷰어’를 국내 주요 금융사 20곳 중 17곳에 ... file newsit 2026.02.11 173
2244 애브넷, 아태지역 엔지니어 56% 제품 설계에 AI 활용 - 중국은 대규모 확산, 일본은 신뢰성 중심 전략으로 AI 활용 확대 애브넷이 발표한 제5회 연례 ‘애브넷 인사이트(Avnet Insights)’ 설문조사 결과에 따르면, 아... file newsit 2026.02.10 160
목록
Board Pagination Prev 1 ... 7 8 9 10 11 12 13 14 15 16 ... 237 Next
/ 237
CLOSE