2026.01.28 09:18

알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개

newsit

https://hwlab.com/SW_Computing/18638 조회 수 161 추천 수 0 댓글 0

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

단축키

Prev이전 문서

Next다음 문서

가 크게 작게 위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

- 1조 개 이상 파라미터 기반 강화학습으로 추론·지식 처리 성능 대폭 강화

- 적응형 도구 활용과 테스트 단계 확장으로 복합 추론·에이전트 역량 고도화

알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개.png

알리바바가 최신 추론 모델 ‘Qwen3-Max-Thinking’을 공개하며 초대규모 강화학습 기반 AI 경쟁력 강화에 나섰다. 알리바바에 따르면 Qwen3-Max-Thinking은 1조 개 이상의 파라미터로 모델 규모를 확장하고 강화학습을 적용해 사실적 지식 처리, 복합 추론, 지시 수행, 인간 선호도 정렬, 에이전트 기능 등 핵심 영역 전반에서 성능을 끌어올렸다.

19개 주요 벤치마크서 최신 초거대 모델과 경쟁력 입증

Qwen3-Max-Thinking은 총 19개 주요 벤치마크 평가에서 Claude Opus 4.5, Gemini 3 Pro, GPT-5.2-Thinking-xhigh 등 최신 고성능 추론 모델들과 비교해 경쟁력 있는 선도 성능을 기록했다. 과학·수학·코딩 문제 해결은 물론, 검색 도구를 활용해 다양한 분야의 전문가급 질문을 해결하는 평가 항목에서도 높은 정확도와 일관성을 보이며 범용 추론 모델로서의 완성도를 입증했다.

적응형 도구 활용으로 검색·코드 실행을 자동 판단

Qwen3-Max-Thinking의 핵심 차별점 중 하나는 적응형 도구 활용(Adaptive Tool-use) 기능이다. 모델은 대화 맥락에 따라 검색(Search), 메모리(Memory), 코드 인터프리터(Code Interpreter)를 자동으로 선택·활용한다. 기존처럼 사용자가 직접 도구를 지정할 필요 없이, 모델이 문제 해결에 필요한 수단을 스스로 판단해 호출함으로써 복잡한 추론 과정을 보다 효율적으로 수행한다. 이 기능은 초기 미세 조정 이후, 규칙 기반과 모델 기반 피드백을 결합한 다중 과제 학습을 통해 구현됐다. 검색과 메모리 기능은 환각을 줄이고 실시간 정보 접근성을 높이며, 코드 인터프리터는 계산이나 실행 기반 추론이 필요한 복합 문제 해결을 지원한다.

경험 누적형 테스트 단계 확장으로 추론 효율 개선

알리바바는 고도화된 테스트 단계 확장(Test-time Scaling) 기법도 적용했다. 특히 경험 누적형 다회차 테스트 단계 확장 전략을 도입해, 이전 상호작용에서 도출된 핵심 정보를 정제·활용하도록 설계했다. 이를 통해 이미 확인된 결론을 반복적으로 재추론하지 않고, 남아 있는 불확실성 해결에 집중할 수 있도록 했다. 그 결과 동일하거나 유사한 토큰 비용 환경에서도 병렬 샘플링 및 집계 방식 대비 지속적으로 높은 추론 성능과 문맥 효율을 기록했다.

Qwen Chat·모델 스튜디오 통해 제공

Qwen3-Max-Thinking은 현재 Qwen Chat을 통해 이용할 수 있으며, 모델 API는 알리바바의 생성형 AI 개발 플랫폼 ‘모델 스튜디오(Model Studio)’에서 제공된다. 알리바바는 이번 모델 공개를 통해 초대규모 파라미터 기반 추론 모델 경쟁에서 기술적 존재감을 강화하고, 에이전트형 AI와 복합 문제 해결 중심의 차세대 활용 시나리오를 본격 확대한다는 전략이다.

#알리바바 #Qwen3MaxThinking #추론모델 #강화학습 #생성형AI #에이전트AI #초거대AI

Facebook Twitter Google Pinterest KakaoStory Band

Atachment
첨부 '1'	알리바바, 최신 추론 모델 ‘Qwen3-Max-Thinking’ 공개.png,

위로 아래로 게시글 수정 내역 댓글로 가기 인쇄 첨부

✔댓글 쓰기

에디터 선택하기

✔ 텍스트 모드 ✔ 에디터 모드

댓글 쓰기

에디터 사용하기 닫기

소프트웨어·컴퓨팅

List of Articles
번호	제목	글쓴이	날짜	조회 수
2241	알리바바, 밀라노 스포르차 성서 AI 몰입형 체험 ‘원더 온 아이스’ 공개 알리바바그룹이 이탈리아 밀라노 스포르차 성 광장에서 AI와 클라우드를 결합한 공공 체험형 설치물 ‘원더 온 아이스(Wonder on Ice)’를 공개했다. 밀라노-코르티...	newsit	2026.02.10	181
2240	엠클라우드브리지, Ai 365 지식관리 에이전트 도입 확대 기업용 AI 통합 업무 플랫폼 기업 엠클라우드브리지가 기업용 AI 플랫폼 ‘Ai 365 지식관리 에이전트’를 제조, 식품, 법무 등 다양한 산업 현장에 적용하며 실제 ...	newsit	2026.02.10	156
2239	넷앱, NFL 슈퍼볼 LX 데이터 운영 지원…리바이스 스타디움 인프라 구축 지능형 데이터 인프라 기업 넷앱이 NFL 슈퍼볼 LX의 데이터 운영을 공식 지원한다. 넷앱은 샌프란시스코 포티나이너스와 미국프로풋볼리그의 공식 지능형 데이터 ...	newsit	2026.02.10	129
2238	EDB, ‘씨플랫폼’과 총판 계약 체결…한국 소버린 엔터프라이즈 AI·분석 시장 확대 - 씨플랫폼과 파트너십 체결…EDB 에코시스템 전략 강화 및 국내 데이터 플랫폼 시장 성장 가속 - 단순 DB 공급 넘어 ‘WarehousePG’ 기반 엔터프라이즈 분석·AI 플...	newsit	2026.02.09	152
2237	가트너, 2026년 글로벌 IT 지출 6조1,500억 달러 전망…AI 인프라 투자 30% 이상 성장 - 데이터센터·서버 지출 전년 대비 30% 이상 증가 - 소프트웨어 성장률 소폭 조정에도 생성형 AI 모델 지출 80% 이상 성장 - 디바이스 지출은 메모리 가격 상승 ...	newsit	2026.02.09	128
2236	옴디아, 2025년 글로벌 태블릿 출하량 10% 성장… 둔화 국면 진입 경고 - 연간 1억6200만대 출하, 팬데믹 이후 최고 수준 - 2026년 메모리 제약·수요 압박 본격화 전망 옴디아는 2025년 글로벌 태블릿 출하량이 전년 대비 9.8% 증가한 ...	newsit	2026.02.06	184
2235	HS효성인포메이션, 2026년 지속가능한 AI 전환 전략 공개 - 풀스택 프라이빗 AI 클라우드로 학습·추론·운영 전 과정 통합 지원 - LLMOps·MLOps 아우르는 파트너 에코시스템 확대로 AI 전 주기 대응 HS효성인포메이션시스...	newsit	2026.02.06	149
2234	데클라, 전년 대비 매출 48% 성장…디시전 AI로 글로벌 공급망 의사결정 표준 확대 - 글로벌 2000대 기업 도입 확대, 평균 고객 계약 기간 약 3년 기록 AI 기반 글로벌 공급망 의사결정 및 인텔리전스 통합 솔루션 기업 데클라가 2025년 기준 전년...	newsit	2026.02.06	141
2233	크리테오, AI 쇼핑 어시스턴트용 ‘에이전틱 커머스 추천 서비스’ 공개…추천 정확도 60% 향상 - 실제 쇼핑·구매 데이터 기반 추천으로 정확도 최대 60% 향상 크리테오가 AI 쇼핑 어시스턴트 고도화를 위한 ‘에이전틱 커머스 추천 서비스(Agentic Commerce Re...	newsit	2026.02.06	147
2232	가트너, “2026년 사이버보안 핵심은 위험 관리·복원력·자원 배분” - AI 확산·지정학 리스크·규제 변동성 속 보안 전략 전환 요구 - 포스트양자 암호화·AI 에이전트 대응·거버넌스 혁신 과제로 부상 가트너가 2026년을 관통할 사이...	newsit	2026.02.06	174

태그 쓰기

닷핵 컨퍼런스 2026 성료, LLM 기반 취약점 분석·AI 레...	04-09
신한카드, 스테이블코인·블록체인 6대 PoC 완료…웹3 결...	04-09
MSI, 숙명여대서 RTX AI PC 캠퍼스 세미나 개최…RTX 기...	04-09
사이냅소프트, NIPA ‘2026 AX 원스톱 바우처’ 공급기업...	04-09
DJI, 8K 360° FPV 드론 Avata 360 국내 출시…몰입형 항...	04-09
스틸시리즈, 4K 폴링레이트 지원 Aerox 3 Wireless Gen...	04-09
뉴타닉스, 에이전틱 AI 멀티테넌트 기능 공개…네오클라...	04-09
팔로알토 네트웍스, Vertex AI 인증정보 접근 가능성 ...	04-09
세일즈포스, 맞춤형 AI 에이전트 슬랙봇 공개… 에이전...	04-08
인텔, 산토쉬 비스와나탄 APJ 총괄 선임…아시아태평양·...	04-08