滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

OPPO AI新突破："搜索多思考少"策略让AI智能体效率与准确率双提升

时间：2026-02-28 23:52:09 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

在人工智能研究领域，OPPO AI团队近期提出了一项突破性框架——SMTL（Search More, Think Less），该框架通过重构智能体的问题解决模式，为深度研究型AI系统开辟了新路径。与传统依赖长时间推理的智能助手不同，SMTL采用并行信息获取策略，将复杂任务分解为多个可同时执行的子任务，显著提升了处理效率与结果准确性。

研究团队将传统AI比作埋头苦思的学者，面对问题时往往需要逐步推导，而SMTL则被形容为经验丰富的图书管理员——通过同时派遣多个助手搜集信息，再快速整合结果。这种策略在BrowseComp基准测试中展现出显著优势：在最多100次交互内，平均推理步数减少70.7%，准确率从41.2%提升至48.6%。实验数据显示，SMTL-100模型仅需60.4步即可达到44.6%准确率，而同类模型MiroThinker-v1.0需要206步才能实现41.2%的准确率。

该框架的核心创新在于并行智能体工作流，其运作机制包含三个阶段：初始计划构建阶段将任务拆解为可并行处理的子目标；并行执行阶段通过多线程工具调用（如网络搜索与页面抓取）同步获取信息；动态计划完善阶段则根据实时反馈调整任务优先级。这种设计使系统每步平均执行3.5次工具调用，信息密度较传统方法提升3倍以上。研究团队特别强调，并行策略并非简单增加计算量，而是通过优化任务组织方式实现效率跃升。

训练过程采用两阶段策略：监督微调阶段使用蒸馏自DeepSeek-V3.2与GPT-5的轨迹数据，强化学习阶段则引入改进的REINFORCE Leave-One-Out算法。为解决训练-推理不匹配问题，团队对rollout校正应用序列级重要性采样，并过滤由环境问题导致的负面轨迹。奖励机制设计上，系统仅对正确答案分配奖励1，同时对工具调用格式错误实施零容忍策略，确保模型学习到高效的信息获取模式。

在深度搜索任务评估中，SMTL在BrowseComp、XBench-DeepSearch和WebWalker-QA等基准上均取得领先成绩。特别是在300步预算设置下，其准确率较基线模型提升5个百分点，达到48.6%。开放式研究评估显示，该框架在综合性、洞察力深度与指令遵循等维度表现均衡，总体得分45.9%超越多个30B规模开源模型。案例分析表明，SMTL能在8个交互轮次内定位关键证据，而顺序推理模型需要16轮次才能达到同等水平。

消融实验揭示了框架设计的关键要素：增加网络搜索的top-k参数（返回结果数量）可显著提升性能，当top-k从4增至8时，SMTL-300准确率提升7.7%；而传统模型依赖的交互步数扩展对成功案例影响有限，失败案例则与预算耗尽密切相关。这些发现印证了研究团队的假设——在长视野搜索中，扩展检索广度比增加推理深度更具效益。技术细节方面，SMTL通过溢出触发压缩方案管理上下文，采用目标条件摘要技术提升爬取效率，并设计双系统prompt分别支持不同任务类型。

该研究已开源代码、模型与数据集，为学术界提供完整的研究基础设施。实验结果表明，SMTL框架在保持结构化任务处理能力的同时，实现了推理成本与结果质量的双重优化。这种"以搜索为中心"的设计范式，为开发能够处理复杂现实问题的通用智能体提供了新思路，其并行信息整合机制尤其适用于需要多源数据验证的应用场景。

更多>同类资讯

工业和信息化部多举措并举，全面推动人工智能与制造业深度融合发展

杜广达表示，下一步将实施“模数共振”行动、人形机器人实景实训行动、人工智能应用服务商培育行动等，打造“模型—数据—场景”的良性互促，激发产业发展动能；分级分类推动人工智能重点标准研制；推动人工智能伦理治理技…

04-12

从被科普到成为核工程师，“核之光”照亮未来，2035年核科普将覆盖亿人次

04-12

工业和信息化部多举措并举全面推动人工智能与制造业深度融合发展

杜广达表示，下一步将实施“模数共振”行动、人形机器人实景实训行动、人工智能应用服务商培育行动等，打造“模型—数据—场景”的良性互促，激发产业发展动能；分级分类推动人工智能重点标准研制；推动人工智能伦理治理技…

04-12

上海交大等申请TGV模型S参数预测专利毫秒级计算提升设计优化效率

国家知识产权局信息显示，上海交通大学;上海精测半导体技术有限公司申请一项名为“一种基于神经网络的TGV模型S参数快速预测方法和系统”的专利，公开号CN121835388A，申请日期为2025年12月。声明：…

04-12

网梯科技新专利：AI智能体数字员工系统，为教育管理智能化添动力

国家知识产权局信息显示，北京网梯科技发展有限公司申请一项名为“一种AI智能体数字员工教育管理工作站系统及方法”的专利，公开号CN121836988A，申请日期为2025年12月。通过天眼查大数据分析，北京网梯…

04-12

第六届消博会下月海口启幕，未来科技“双星”人工智能眼镜与飞行汽车齐亮相

本届展会特别值得期待的是，人工智能眼镜与飞行汽车等未来科技产品将首次大规模集中亮相，为观众带来一场前所未有的科技盛宴。人工智能眼镜：开启智能生活新篇章如果说人工智能眼镜是日常生活中的“黑科技”，那么飞行汽…

04-12

极氪高端纯电再发力：焕新7系携001五周年纪念版齐发，引领细分赛道新潮流

04-12

极氪发力高端纯电市场：焕新7系与001五周年纪念版联袂上市

04-12

AI生成画面引反感：七成玩家不愿使用英伟达DLSS 5

04-12

地平线余凯：即将发布舱驾融合智能体芯片星空系列，单车最高省4000元

04-12

奥迪E5 Sportback逆势突围月销创新高，AUDI品牌开启豪华电动新篇章

04-12

毫秒间守护算力脉动：探访和林格尔数据中心的幕后“护航者”

04-12

《AI时代的商业进化蓝图（2026）》：AI从工具到主体，重塑企业增长新逻辑

04-12

蔚来李斌谈行业挑战：新车迭代快致盈利难，呼吁推动电芯芯片标准化

04-12

苹果高配Mac mini与Mac Studio缺货，内存短缺或为背后主因？

04-12

点击查看更多 +

全站最新

清华大学李克强：智能驾驶转向安全重构阶段，“车路云一体化”破局关键

特斯拉限量“签名版”Model S与X Plaid登场纪念旗舰车型十余年历程

比亚迪综合越野开发中心开放，仰望U8展现硬核实力，技术布局迈向新高度

智谱“龙虾”热潮下：营收激增亏损扩大，大模型赛道马拉松如何持续领跑？

H10：哈弗拾起品牌语法，开启家用SUV市场新征程

比亚迪即将推出六款新车：闪充刀片电池加持，多款车型亮点十足

热门内容

本栏最新

极氪高端纯电再发力：焕新7系携001五周年纪念版齐发，引领细分赛道新潮流

极氪发力高端纯电市场：焕新7系与001五周年纪念版联袂上市

蔚来李斌谈行业挑战：新车迭代快致盈利难，呼吁电芯芯片标准化降本

蔚来李斌谈行业困境：新车迭代快致盈利难，呼吁推动电芯芯片标准化

蔚来李斌谈行业困境：新车迭代快致盈利难，呼吁电芯芯片标准化降本

豆包2.27亿用户免费畅用：以免费策略筑牢数据基石开启商业变现新征程

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.