滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

AI代码生成新突破：广撒网策略胜过复杂调参多样探索成优化关键

时间：2026-02-13 03:02:43 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

人工智能领域的一项新研究颠覆了传统认知：在生成GPU内核代码时，通过大量尝试后筛选最优方案的策略，其效果显著优于让AI持续学习改进的复杂方法。这项由国际研究团队完成的研究，通过系统性实验验证了简单搜索策略在特定任务中的优势，为AI优化技术提供了全新思路。

研究团队以GPU内核优化为切入点，构建了包含250个机器学习任务的测试平台KernelBench。该平台能精确测量代码在真实硬件上的运行效率，为实验提供了可靠的评估标准。实验采用双层架构设计：外层训练基础模型掌握代码生成技能，内层则对比两种策略的效能差异。其中"最优N选一"策略要求AI生成64个方案后择优，而"测试时训练"策略则允许AI在1-5步内实时调整参数。

实验结果呈现明显反差：简单搜索策略在测试任务中达到90%的成功率，而实时学习策略的最佳表现仅30.6%，甚至低于随机选择。更引人注目的是，后者要达到同等效果需要少于1次的尝试次数，这意味着实时学习反而降低了性能。这种悖论现象促使研究团队深入探究其内在机制。

通过分析发现，实时学习策略存在"过度锐化"缺陷。AI在调整参数时过度强化早期成功样本，而这些样本往往只是平庸解。这种倾向导致模型逐渐偏离最优解所在的概率分布"尾部区域"，就像学生反复确认错误答案而忽略正确解。数据显示，随着训练步数增加，AI对较差方案的置信度反而提升，证实了过度锐化的存在。

研究团队据此提出"惊讶度引导选择"策略。该策略颠覆传统选择逻辑，转而挑选那些AI生成概率低但实际有效的方案。实验表明，这种方法将成功率从50%提升至80%，若综合三个最优意外方案，成功率更达100%。这种反直觉现象源于训练数据的偏差：常见代码在数据中占比较高，导致AI高估平庸方案而低估创新解。

进一步验证显示，任务难度对策略效果影响显著。在简单任务中，实时学习劣势较小；但在复杂任务中，早期错误会严重误导后续学习。跨任务迁移实验更表明，实时学习易导致模型对特定训练任务的过拟合，降低泛化能力。这解释了为何简单搜索策略在密集奖励的确定性任务中更具优势。

该发现对AI开发实践具有直接指导意义。以GPU代码优化为例，开发者可让AI生成多样化方案，再通过惊讶度指标筛选，既避免复杂训练的计算开销，又提升优化效果。实验数据显示，这种方法在保持高性能的同时，将资源消耗降低至实时学习策略的1/5。

研究同时承认其局限性：实验聚焦特定领域且使用单一模型架构，其他任务类型或模型规模可能产生不同结果。研究采用的适应性训练方法也较为基础，更复杂的技术或能改变结论。这些因素为后续研究指明了方向，包括开发预判方案质量的评估机制，以及探索编译器优化等密集反馈领域的应用。

这项研究通过严谨的实验设计，揭示了不同优化策略的适用边界。在具有明确评估标准的任务中，保持方案多样性比持续参数调整更为关键。该发现促使开发者重新思考AI训练策略：与其追求复杂的自适应学习，不如构建能生成创新方案的模型，配合智能筛选机制，这或许才是突破性能瓶颈的有效途径。完整技术细节可查阅论文编号arXiv:2602.07670v1。

更多>同类资讯

2026北京车展荣威展台新亮点家越07概念车大5座SUV定制AI出行方案

04-23

童声与AI共舞航天梦 “音随航天”活动点亮少年星辰征途

活动以这首充满朝气的《孩子的天空》开场，瞬间点燃现场氛围，孩子们在歌声中释放热情，满怀期待开启航天音乐之旅。歌声结束后，老师围绕神舟飞天、嫦娥探月、空间站建设等中国航天重大成就展开专业讲解，并通过趣味问答与…

04-23

第57次报告发布：2025年我国互联网向“新”向“好” 成果斐然筑牢发展基石

截至2025年12月，我国网民规模达11.25亿人，互联网普及率突破80%（见图1），数字发展成果惠及更广泛群体。展望“十五五”，我国互联网将继续坚持向“新”以强技术、向“好”以惠民生，在支撑经济社会高质量发…

04-23

手机巨头跨界机器人赛道：一场马拉松背后的技术突围与商业博弈

04-23

杜华引领乐华转型：从艺人经纪到“机器人+AI+IP”科技文娱新征程

04-23

2030年AI浪潮下，人类哪些独特价值将永远无法被“蒸馏”？

04-23

“创新加速行”路演浙江安吉启幕京品高科2.51亿融资夺冠引关注

04-23

AI浪潮下需求激增，芯片股创16连涨纪录，半导体行业前景可期

04-23

AI赛道新格局：Anthropic二级市场估值破万亿，OpenAI暂处下风

04-23

OpenAI 推出 Workspace Agents：全天候办公时代开启

04-23

Anthropic 撤回 Claude Code 订阅限制测试，承认算力成本超出 Pro 套餐负荷

04-23

OpenAI 推出针对临床医生的免费 ChatGPT，助力医疗服务效率提升

04-23

OpenAI向临床医生免费开放专业级服务

04-23

特斯拉第一季度净利润同比增长17% 称“需求复苏”

04-23

荣耀林林曝光今晚发布会新品，含WIN电竞游戏本等

04-23

点击查看更多 +

全站最新

科大讯飞携手清华团队布局“AI+量子”，量智开物首秀亮剑多项硬核成果

刘庆峰翟荟对话：AI与量子融合成破局关键，中国有望引领下一代计算文明

AI相对论① | 智能驾驶下半场：技术理想与商业现实的碰撞下如何破局？

小米汽车北京车展明日启幕！雷军亲临主讲，多款车型亮相还有惊喜好礼

禾赛车载主激光雷达2026年2月市占率超51%，引领智能汽车安全新标配时代

2026北京车展国产GT跑车扎堆，领克小米长城谁将引领颜值性能新风潮

热门内容

本栏最新

2026北京车展荣威展台新亮点家越07概念车大5座SUV定制AI出行方案

第57次报告发布：2025年我国互联网向“新”向“好” 成果斐然筑牢发展基石

荣威20年深耕家庭市场，“家越”序列以AI开启汽车新篇章

全新BMW 7系全球首发：以创新科技重塑豪华，引领智能驾趣新标杆

吉利银河星耀7预售开启：2L级油耗搭配5秒级加速，重塑中级车豪华新标杆

2026年AI沙龙会新动向：技术、资源、场景如何深度融合破局？

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.

AI代码生成新突破：广撒网策略胜过复杂调参 多样探索成优化关键

AI代码生成新突破：广撒网策略胜过复杂调参多样探索成优化关键