滚动资讯

当前位置：首页 > 资讯 > 信息流 > 正文内容

阿里Qwen3-Max-Thinking预览版亮相，数学满分却“费”token，推理实力引期待

时间：2025-11-05 00:09:03 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

阿里最新推出的Qwen3-Max-Thinking早期预览版引发了AI领域的广泛关注。这款推理模型作为Qwen 3系列中的顶级版本，虽然目前仍处于训练中期阶段，但已在多项高难度基准测试中展现出惊人实力。在AIME 2025数学竞赛和哈佛-MIT数学锦标赛（HMMT）中，该模型凭借工具运用和测试时计算技术，实现了100%准确率的突破性表现。

该模型的技术细节尚未完全公开，但通义千问团队透露其创新性地融合了思考模式与非思考模式。在Qwen Chat和阿里云API平台开放试用后，开发者发现模型在智能体编程、常识推理以及数学科学领域展现出显著提升。特别值得注意的是，模型在思考模式下会通过多轮验证确保答案准确性，这种特性在处理复杂问题时尤为突出。

实际测试显示，当面对AIME 2025竞赛压轴题时，Qwen3-Max-Thinking不仅反复验证正确答案，还主动调用代码解释器从不同角度证明结果。整个推理过程持续约4-5分钟，消耗1.2万至1.5万个token。这种深度推理能力虽然带来较高计算成本，但用户可通过1024-81920个token的可调预算控件进行灵活控制。

在智能体编程任务中，该模型与DeepSeek-V3.2的对比测试颇具看点。当要求开发开源项目分享网站的HTML原型时，Qwen3-Max-Thinking生成的1417行代码虽然略显冗长，但完整实现了需求功能。相比之下，DeepSeek-V3.2仅用787行代码就完成了相似任务，显示出不同模型在代码效率上的差异。不过前者在需求分析准确性方面表现更优，生成的网页原型更符合实际使用场景。

目前Qwen3-Max-Thinking仅支持文本到文本的单一模态，且未在Hugging Face等主流平台开源。阿里云API提供的限时免费服务吸引了大量开发者尝试，但完整基准测试结果尚未公布。随着训练进程推进，更多版本预计将陆续发布，这款专为高难度推理设计的模型能否在通用场景中保持优势，仍有待进一步观察验证。

更多>同类资讯

5月31日“蓝月亮”与年度最小满月同现夜空，别样意趣等你赏

由于两次满月的间隔约为29.53天，而公历历法中除了2月，每个月有30天或31天，循环往复之后，个别月份就会出现两次满月。中国天文学会会员、天津市天文学会理事杨婧表示，“蓝月亮”现象平均每2年多就会出现一次，…

05-31

月球极地“黑暗灯塔”：超稳定激光站开启星际导航与计时新纪元

05-31

上海互联网优创赋能计划重磅发布！大V深耕等福利助力创作者扎根申城

05-31

《薪火》展演点亮申城：以艺术之笔绘就科学家精神传承新画卷

05-31

全球顶尖创作者齐聚上海盛典，共话创作之路，感受魔都独特魅力

05-31

天涯社区推出“天涯重启者数字徽章” 创世成员享规则制定及投资优先权

05-31

2026上海科技节闭幕：“科学之夜”奇妙启幕共赴天文科普盛宴

当天恰逢第十个全国科技工作者日，作为本届科技节收官活动，“科学之夜——奇妙天文夜”同步开启，通过科普展演、沉浸式体验和科学艺术融合活动，为公众奉上一场奇妙的科学盛宴。为让更多公众共享科技节成果，上海天文馆当…

05-31

“2026 ESG与高质量发展创新论坛”举行共探产业链ESG协同发展新路径

05-31

谷光伏旋转支架：精密机械与智能控制，让光伏板高效“追光”的秘诀

别把它想得太复杂，它本质上就是一个精密的机械系统，负责让光伏板在一天中跟随太阳方位角变化，从而多“吃”进几口光。一套好用的谷光伏旋转支架，不是“能转就行”的粗放产品，而是要在可靠性、成本和发电增益之间找到平衡…

05-31

每秒狂奔600公里！地球随银河系“漂移”，人类终将抵达还是永远流浪？

05-31

太空暗藏危机：变异真菌威胁宇航员，超强太阳风暴险让文明停摆

05-31

跨越千年维度认知：从低维束缚到四维洞察，探寻宇宙空间的深层奥秘

05-31

5月31日“蓝月亮”与年度最小满月同现夜空，博白赏月好时机别错过

05-31

神舟二十三号发射：中国空间站步入应用时代，科研能源新探索启航

05-31

AI社会治理测试：Grok四天崩溃、Gemini犯罪率最高

05-30

点击查看更多 +

全站最新

雄魂美学遇上华为乾崑！全新猛士M817预售价37万起，开启智能越野新篇章

2026半固态电池价值论坛启幕张朝阳：半固态电池破解当下难题更具现实性

2026款吉利牛仔上市！配置升级潮野范足，限时优享7.59万起

本田CRF450系列7月焕新登场！新发动机新车架，越野体验再升级

粤港澳车展看传承：一汽丰田串联燃油与新能源，汽车文化待续新章

蔚来携三大品牌齐聚大湾区车展，多款新车升级亮相共启科技新程

热门内容

本栏最新

雪佛兰LS9引擎落幕，高性能传奇未完待续，新品引擎预告引期待

2026搜狐极限探索者大会启幕在即，议程揭晓共赴勇气与热爱之旅

迅雷2026年Q1财报亮眼：总营收同比增54.1%，出海业务成新增长极

云桌面系统：破解物业IT运维难题，实现高效便捷数字化管理新路径

新能安与张雪机车高层接洽合作，锂电池巨头跨界机车领域引关注

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.