滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

阿里通义实验室推出 FIPO 算法，助力大模型推理能力大幅提升

时间：2026-04-07 17:49:08 来源：CHINAZ编辑：快讯 IP：北京 发表评论无障碍通道

阿里通义实验室的 Qwen Pilot 团队近日推出了一种全新的算法 FIPO（Future-KL Influenced Policy Optimization），该算法旨在突破当前大模型在推理过程中面临的瓶颈问题。传统的强化学习方法(RLVR)在处理推理链中的每个 Token 时，往往无法区分出哪些 Token 对最终结果至关重要。因此，如何精准识别关键 Token 成为了一个亟待解决的难题。

FIPO 算法引入了 Future-KL 机制，专门奖励那些对后续推理有显著影响的 Token，从而解决了在纯 RL 训练中 “推理长度停滞” 的问题。在实际测试中，FIPO 在32B 规模的纯 RL 设置下，表现超越了 o1-mini 和 DeepSeek-Zero-MATH 等同规模的模型。

根据团队的研究结果，大多数 Token 在训练前后几乎没有变化，显示出强化学习的影响是极度稀疏的。团队发现，行业常用的评估指标如熵和 KL 散度，难以精准识别关键 Token 的变化。因此，他们引入了新的观察维度 —— 符号对数概率差（Δlog p），有效捕捉到优化的方向性。

在实验中，FIPO 算法在零基础模型 Qwen2.5-32B-Base 上进行测试，突破了推理长度的瓶颈，平均推理长度提升至10，000Token 以上。同时，该算法还实现了推理准确率的显著提升，证明了其在复杂数学推理中的潜力。

划重点:

更多>同类资讯

特斯拉FSD V14.3.3更新：智能召唤提速，核心性能与舒适度双提升

05-17

机械师Mini GTR迷你主机上架预约：R7 8745H+16G+1TB 仅售3999元

05-17

荣耀笔记本X14 2026“战斗版”来袭，酷睿5 320处理器搭配轻薄机身登场

05-17

小米曾规划超轻薄Air旗舰，因体验妥协最终未量产引关注

05-17

特斯拉FSD V14.3.3更新：智能召唤提速，系统性能与舒适度双提升

05-17

买一块三星990 PRO 2TB SSD却收到10块：价值3.3万元

05-17

亚马逊将停止为旧款Kindle提供支持，用户纷纷选择越狱设备

05-17

谷歌Veo 4惨遭泄露，视频版“香蕉”9秒封神

05-17

Meta裁员前夜，员工抢零食如末日

05-17

小米汽车公布YU7全新颜色火山灰

05-17

前Meta员工回忆2022年大裁员：办公室上演免费零食、饮料和充电器哄抢潮

05-17

小米AI大模型密集落地：从“缺位”到“领跑” 构建人车家全生态新图景

05-17

小米YU7“火山灰”配色登场！矿物颗粒融入车漆，实车到店等你赏

小米汽车近日宣布，旗下YU7车型新增了一款名为“火山灰”的配色。这一设计灵感来源于晨雾中的火山地貌，结合了高纯度灰色调与纳米级矿物颗粒，使车身在不同光照条件下展现出细腻且富有层次的金属质感。据官方透露，“火山…

05-17

小米YU7 GT试驾体验：德系底盘调校邂逅强劲电动性能，重塑轿跑新标准

这款车凭借其卓越的操控性能和技术创新，获得了试驾媒体的高度评价，认为其“重新定义了智能电动轿跑的标准”。这样的设计不仅提升了驾驶乐趣，更为用户提供了更高的安全保障。作为一款集德系底盘调校与先进电动技术于一身的…

05-17

神舟二十三号蓄势待发香港女航天员有望飞天巴基斯坦航天员共赴星辰之约

05-17

点击查看更多 +

全站最新

比亚迪闪充站建设提速：一周新增55座，覆盖312城年底将达2万座

特斯拉FSD V14.3.3更新：智能召唤提速，系统性能与舒适度双提升

乐道两年跨越培育期：精准布局纯电赛道，以实力开启跃升新篇

爱跑103号赛级燃油亮相！打破进口依赖，国产高性能燃油填补空白

绿意川蜀邂逅硬核江铃大道成都上市会解锁皮卡多元生活新可能

特斯拉得州新测试跑道渐露真容，新车型Roadster亮相时间再引猜测

热门内容

本栏最新

特斯拉FSD V14.3.3更新：智能召唤提速，系统性能与舒适度双提升

小米AI大模型密集落地：从“缺位”到“领跑” 构建人车家全生态新图景

2026年PI与PET胶带行业变革：技术驱动下耐温防静电的供应商新选择

小米YU7“火山灰”配色官图亮相！高纯度灰调设计，5月底将正式发布

科大讯飞AI学习机深度评测：护眼设计搭配学习功能，哪款更适合孩子？

科大讯飞智能办公本深度评测：以科技赋能办公高效体验触手可及

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

​阿里通义实验室推出 FIPO 算法，助力大模型推理能力大幅提升

阿里通义实验室推出 FIPO 算法，助力大模型推理能力大幅提升