滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

32B 推理性能反超 o1-mini！阿里通义发布 FIPO 算法，让大模型“想得更深”

时间：2026-04-08 12:41:28 来源：CHINAZ编辑：快讯 IP：北京 发表评论无障碍通道

据报道，阿里通义实验室的 Qwen Pilot 团队推出了一项名为 FIPO 的全新算法。该算法旨在打破传统强化学习（RL）在处理复杂逻辑时的瓶颈，让模型在推理长度和准确率上实现双重飞跃。

核心突破：解决“推理长度停滞”

传统模型在面对数学等复杂问题时，往往难以区分哪些 Token 是通往正确答案的关键。FIPO 算法对此进行了针对性重构：

Future-KL 机制：引入 Future-KL 策略，专门奖励那些对后续推理有显著积极影响的 Token，让 AI 学会“深谋远虑”。

符号对数概率差：引入这一新机制来精准捕捉模型的优化方向，避免推理过程陷入无效的循环。

推理长度跨越：在零基础模型上，FIPO 成功将平均推理长度提升至 10，000 Token 以上，彻底解决了推理深度不足的问题。

战绩斐然：32B 模型逆袭 o1-mini

在实测对比中，搭载 FIPO 算法的 32B 规模模型展现出了惊人的“小钢炮”属性：

反超竞品：在纯强化学习设置下，其推理性能成功反超同规模模型，甚至在部分指标上优于OpenAI 的 o1-mini。

数学潜力：算法在处理高难度数学推理题目时表现尤为出色，展现了极强的逻辑推导潜力。

行业背景：通义实验室的“智能进化”

阿里通义实验室近期在 AI 底层算法上动作频频。除了本次惊艳的 FIPO 算法，团队在 3 月底刚推出了CoPaw 1.0 新版本，显示出其在提升模型逻辑严密性与交互深度方面的持续深耕。

结语：推理效率的“第二曲线”

当行业还在争论参数规模时，阿里通义通过 FIPO 算法证明了：通过更精细的奖励机制和逻辑诱导，较小规模的模型同样能迸发出顶级的“思考力”。

05-31

Meta拟明年测试AI吊坠，扩充智能眼镜线并推企业“办公可穿戴设备”服务

Meta公司计划于明年启动一款人工智能吊坠的测试工作。这份可穿戴设备发展蓝图目标宏大，旨在扭转其硬件部门持续巨额亏损的局面。内部规划备忘录显示，公司计划大幅扩充智能AI眼镜产品线，并推出面向企业的服务项目—…

05-31

Meta明年将测试AI吊坠，扩充智能眼镜线并推企业服务以扭转硬件亏损

Meta公司计划于明年启动一款人工智能吊坠的测试工作。这份可穿戴设备发展蓝图目标宏大，旨在扭转其硬件部门持续巨额亏损的局面。内部规划备忘录显示，公司计划大幅扩充智能AI眼镜产品线，并推出面向企业的服务项目—…

05-31

宇树机器人再登王力宏舞台机械歌声与互动引爆全场欢乐氛围

05-31

小红书亮相上海网络视听创作者大会，共绘AI时代创作治理新画卷

在《AIGC重塑创作：开启人机共创新生态》主题圆桌中，小红书社区科技人文内容负责人散兵表示，AI正在降低内容创作门槛，也让越来越多普通人拥有表达和创造的能力。多位创作者也在现场分享了他们借助AI进行创作与表…

05-31

小米汽车答网友问第250集：YU7空调、天际屏、车身材质等疑问全解答

05-31

某MCN就造谣小米集团及雷军公开道歉

05-31

Meta正在开发一款人工智能吊坠

05-31

2026智博会“海陆空”机器人齐聚消费级AI产品涌现见证AI落地新图景

天津港的“锁站机器人”“无人叉车”与“岸电机器人”正在改变码头作业方式；一汽大众展出L4级自动驾驶乘用车，已完成快递送货服务的实际应用；重庆龙翼航空的消防无人机可胜任高层建筑与森林灭火任务…… 联想集团董事…

05-31

科梦奇迎宾机器人：解锁接待新场景，从入口到导览的智能服务全攻略

品牌对比如何理解科梦奇机器人侧重迎宾接待、场馆讲解、路线引导和内容展示，适合需要长期运行的接待空间。日常使用中的任务分工迎宾机器人更适合承担清晰、重复、可标准化的岗位。科梦奇机器人在部署时，应结合入口视线…

05-31

Hermes Agent智能体赋能Coredoo Store：构建全域电商智能运营新生态

Hermes Agent 智能体框架的出现，为企业搭建了一个“人机协同、数据驱动、智能决策”的全新商业中枢，将商城系统从传统管理平台升级为智能化运营生态。通过全域触点的覆盖，HermesAgent 智能…

05-31

小米REDMI K90至尊版入网：骁龙8至尊版加持，165Hz高刷屏6月登场

作为旗舰系列，所有版本均为旗舰配置起步，确保整体性能需求，而区别在影像、续航、处理器、散热等方面，进行精准调整。整体性能同样达到旗舰级别，可流畅运行各大手游，而且是高画质+高帧率模式下，提升视觉+游戏体验…

05-31

拯救者Y70新机来袭！2K大屏搭配8000mAh电池，6月9日开启游戏新体验

“高配置、高性能”成为高端机、旗舰机、游戏手机的主力方向，主要是考虑到高负载场景运行，尤其是大型游戏，具备高画质+高帧率模式，流畅与视觉体验兼顾。新机整体亮点明确，比如2K大屏、三重散热、高续航、第五代骁龙…

05-31

雄魂美学遇上华为乾崑！全新猛士M817预售价37万起，开启智能越野新篇章

全新猛士M817共实现296项实力进化，集原创雄魂美学、赛级同源动力、军工级全维安全、华为乾崑黑科技、百万级舒享于一身，全方位适配用户多元出行需求：五天工作日，可在职场与生活之间从容切换；两天休息日，携家人奔…

05-31

小米米家冰箱Pro对开620L今日首发！双系统双循环，超大容量仅售2499元

05-31

点击查看更多 +

全站最新

万洲电气凭WOES智能优化节能系统入列湖北工业软件企业名单引领节能新潮流

小红书亮相上海网络视听创作者大会，共绘AI时代创作治理新画卷

油车6万公里保养关键期！更换这4个配件，省下大修费延长车寿命

德系双雄对决：奥迪A6 Avant e-hybrid与BMW 530e Touring谁更胜一筹？

开车多年却车技平平？掌握这些方法，告别机械驾驶稳步提升车技

小米汽车答网友问第250集：YU7空调、天际屏、车身材质等疑问全解答

热门内容

本栏最新

小红书亮相上海网络视听创作者大会，共绘AI时代创作治理新画卷

小米汽车答网友问第250集：YU7空调、天际屏、车身材质等疑问全解答

2026智博会“海陆空”机器人齐聚消费级AI产品涌现见证AI落地新图景

雄魂美学遇上华为乾崑！全新猛士M817预售价37万起，开启智能越野新篇章

奥迪E7X上市：德系豪华碰撞本土智能，能否在中大型纯电SUV市场突围？

华为赋能猎装轿跑启境GT7来袭，价格公布，能否在细分市场突围？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.