滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

港中大（深圳）新突破：AI推理“纠偏术”让算力省七成答案更准

时间：2026-04-27 22:43:27 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

香港中文大学（深圳）联合深圳湾区研究院、北京科技大学及DualityRL团队，在人工智能推理效率领域取得突破性进展。其提出的"路径剪枝"技术通过提前终止无效推理路径，在保持答案准确率的同时将计算量降低超70%。这项名为STOP（Super TOken for Pruning）的技术方案，以预印本形式发表于arXiv平台（编号2604.16029v1），为解决大型推理模型高能耗问题提供了新思路。

传统AI推理采用"并行试错"机制，同时运行数十条推理路径后投票选出最优解。这种模式虽能提升答案可靠性，但单次查询成本高达6美元。研究团队发现，约60%的推理路径在初始阶段就已偏离正确方向，却仍会消耗大量算力完成全流程计算。这种"无效劳动"不仅造成资源浪费，错误路径的投票权还可能拉低最终答案质量。

技术核心在于构建"推理质量评估插件"。该系统通过新增[STOP]特殊标记，实时捕获AI内部状态信息，经轻量化LoRA适配器转换后，由分类器输出0-1的路径质量评分。整个评估过程复用已有计算缓存，额外耗时不足原始推理的1%。实验数据显示，在15亿参数模型处理AIME 2024数学题时，STOP技术使准确率从30.1%提升至37.92%，同时减少73.88%的计算量。

研究团队建立的双维度分类框架，将现有剪枝方法划分为四类：外部信号+固定规则、外部信号+可学习、内部信号+固定规则、内部信号+可学习。其中，同时利用内部状态与可学习机制的STOP方案，在五个不同难度基准测试中均表现最优。特别是在HMMT 2025数学竞赛数据集上，该方法在仅保留12.5%路径的情况下，仍维持了原始准确率。

动态保留比例算法是该技术的另一创新。通过分析算力预算、前缀长度与任务复杂度的数学关系，研究团队推导出最优剪枝比例公式。实际应用中，用户可根据预设表格直接查询参数，无需反复调试。在AIMO3竞赛系统实测中，接入STOP的1200亿参数模型在5小时时限内完成50题，得分从39分提升至43分，达到银牌标准。

注意力可视化分析揭示了STOP的评估逻辑。该系统重点关注推理文本中的逻辑转折词（如"don't"）和结构标记（如"therefore"），而非直接盯住答案选项。对低质量路径，系统会捕捉其过早聚焦答案选项的特征，将其判定为"投机取巧"行为。这种过程导向的评价机制，使STOP具备跨领域适用性，在ZebraLogic逻辑谜题测试中，答案准确率提升4个百分点。

技术实现细节显示，STOP采用蒙特卡洛软标签训练法，通过32次续写采样估算路径成功概率。这种标注方式比传统二元标签更具稳定性，使模型能学习到路径的"潜力概率"而非单次结果。研究团队已开放训练数据集与模型权重，普通研究者可直接下载使用，避免了重复构建数据的高昂成本。

当前技术仍存在改进空间。研究团队指出，在700亿参数以上模型和超大规模路径采样场景中，STOP的性能尚未验证。现有方案仅支持固定位置的单阶段剪枝，未来可探索多时间点分级筛选策略。这些局限性为后续研究指明了方向，相关技术细节可在arXiv平台获取完整论文。

更多>同类资讯

德州农工大学等团队构建AI视频编辑评估体系，为工具质量“打分”

04-27

巴勒斯坦团队创新：三相变换器让AI语言模型训练效率大幅提升

04-27

对话Momenta曹旭东：自动驾驶领航，驶向物理AI新未来

04-27

李想汽车研究院创新Switch-KD框架，助力小模型高效“看懂”图片世界

04-27

望圆智能冲击IPO：高毛利光环下，研发短板与市场风险待解

与同赛道其他玩家相比，望圆在细分市场的头部地位和成本整体控制水平确实拔尖，但在技术溢价方面存在明显短板——研发开支占收入比仅3.75%，远低于其他机器人企业8%~30%的普遍水平。它在盈利能力和商业落地上已…

04-27

上交大等团队发布PRL-BENCH：AI挑战物理研究，真实能力边界在哪？

04-27

让AI学会“认真看图”：V-GIFT方法为视觉理解注入新活力

04-27

五所高校联合攻克AI持续学习难题：最优传输理论助力对抗遗忘

04-27

艺术与科技共舞：机器人演绎经典，AI时代艺术教育如何破局新生？

04-27

GPT-5.5发布：长上下文质变，定价翻倍下中国开发者的机遇与挑战

国产模型在编程能力上正在逼近，DeepSeekV3.2、Qwen3.6在LMArena编程榜单上已经跻身前十；但在复杂推理、顶层科研场景上，FrontierMath Tier 4国产最优解尚不在同一量级，但…

04-27

AI安全风险受瞩目多家企业主动为高能力模型设置访问门槛

《参考消息》4月27日刊发文章《“太危险而不宜向公众开放”AI企业为最强模型设限渐成趋势》。该模型在化学、生物学任务及实验设计方面的表现，显著优于当前公开可用的模型。 Anthropic与OpenAI对近…

04-27

郭明錤爆料：OpenAI携手高通联发科研发手机芯片 2028年或迎量产新篇

04-27

MiniMax港股表现低迷：大跌14% 市值较峰值缩水半数

04-27

联发科北京车展亮剑：3nm座舱芯片引领AI汽车新潮流，2nm芯片蓄势待发

04-27

最高法院定音：露韦美恶意诉讼宇树科技败诉赔偿8万并担诉讼费

04-27

点击查看更多 +

全站最新

东风奕派双车齐发：奕派M8携华为技术亮相，纳米01 Cross以8.38万开启纯电新体验

图解丨南下资金加仓中芯国际、中国移动，减持阿里和腾讯

韩国、中国台湾、日本三地股市收盘齐创历史新高

史诗级暴涨中，知名大空头紧急出手！

沃什入主美联储板上钉钉？鲍威尔将迎终极大考！

台股涨超3%，首次突破4万点，再创历史新高

热门内容

本栏最新

黄鹤之星领航班走进华为：共话数智未来，携手开启企业转型新篇章

元戎首席科学家阮翀首秀：基座模型破局智驾困境，驱动组织AI变革

海康存储北京车展秀实力：多款车载新品亮相，赋能汽车智能化新未来

国家超算互联网限时免费开放DeepSeek-V4对话开启百万上下文普惠新篇

欣旺达北京车展秀实力：“欣星环”电池发布，“能量家生活馆”引领新能源生活

吉利第5代帝豪i-HEV智擎混动北京车展首秀动力节能安全全面升级

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.