滚动资讯

当前位置：首页 > 资讯 > 业界动态 > 正文内容

Meta新AI“左右互搏”：不依赖人类数据，代码自我进化时代或将来临

时间：2025-12-30 17:45:01 来源：快讯编辑：快讯 IP：北京 发表评论无障碍通道

程序员们常调侃，最痛苦的时刻不是熬夜写新代码，而是凌晨被叫醒修复自己几个月前埋下的“神级Bug”。但如今，meta公司的一项新研究让AI不仅能自己制造问题，还能在无人指导的情况下通过“自我对弈”的方式解决问题，这一突破引发了科技界的广泛关注。

12月下旬，meta与伊利诺伊大学厄巴纳-香槟分校联合发表的论文，详细介绍了一种名为SSR（Self-play SWE-RL）的全新系统。该系统的核心思路看似简单却充满颠覆性：让同一个大语言模型同时扮演“破坏者”和“修复者”的角色。传统AI编程工具，如GitHub Copilot，依赖人类编写的代码、修复过的Bug以及设计的测试用例进行学习，相当于“做老师布置的题目”。而SSR则完全反其道而行之，让AI自己出题、自己解答。

具体实现上，SSR将一个模型拆分为两个智能体：一个负责向开源项目中注入隐蔽的Bug，另一个则需根据有限线索找出并修复这些错误。两个角色共享参数，本质上是同一个“大脑”，却执行着完全相反的任务。这种设计类似于一个人用左手制造问题，再用右手解决问题，且全程不能参考答案。

为了确保生成的Bug质量，SSR引入了三重验证机制：首先，Bug必须能被弱化测试检测到；其次，不能直接暴露修复路径；最后，需通过“逆向变异测试”确认改动确实改变了程序行为。无效的Bug会被直接丢弃，绝不掺杂水分。这种机制生成的训练数据，质量远超人工标注，因为所有Bug均源自真实的Git历史记录，例如故意撤销某次修复提交或删除看似冗余实则关键的逻辑。这些案例并非教科书中的典型问题，而是工程实践中常见的“暗坑”。

在实战测试中，SSR的表现令人瞩目。研究团队在SWE-bench Verified和SWE-bench Pro两个基准平台上进行了评估。这两个平台由普林斯顿、斯坦福等机构共同构建，收录了来自Django、PyTorch等知名项目的真实Bug修复任务，被视为衡量AI编程能力的“试金石”。实验结果显示，即使完全屏蔽人类提供的任务描述和测试用例，SSR训练的智能体性能仍持续提升，最终超越了采用传统强化学习加人类数据训练的基线模型。而后者在训练几十轮后便陷入停滞，难以进一步突破。

进一步的分析揭示了SSR成功的关键：消融实验表明，若仅训练Bug注入智能体，模型会陷入“只会搞破坏”的困境；若仅提供固定Bug集让AI修复，模型则会迅速过拟合。只有让两个智能体形成闭环联动，动态调整任务难度，才能持续产生新挑战，促使模型不断进步。这种机制类似于健身时自动增加重量，始终保持“跳一跳够得着”的状态。

尽管SSR展现了强大的潜力，但其局限性同样明显。研究团队在论文中坦承，首先，系统严重依赖单元测试作为评判标准，但现实开发中许多问题（如性能瓶颈、安全漏洞、用户体验）无法通过测试脚本量化；其次，目前两个智能体使用同一模型架构，尚未探索“强弱对抗”（如用更大模型充当出题者）是否更有效；最后，训练过程极不稳定，尝试加入自然语言描述或聚焦单一代码仓库时，性能反而下降。这些限制表明，SSR距离“全自动程序员”仍有很大差距。

不过，SSR的意义远不止于技术突破。它标志着AI正在从“模仿人类”转向“自我创造学习信号”。就像AlphaGo走出人类从未想过的棋路，SSR也可能发现工程师忽略的缺陷模式或修复策略。事实上，12月下旬，智谱AI发布了“伐谋”智能体框架，支持多智能体协同演化；阿里通义实验室也宣布Qwen Code Agent进入企业内测阶段。全球顶尖团队纷纷押注“自主进化型AI”，而SSR的独特之处在于，它几乎不需要人类监督。

更多>同类资讯

马斯克整合旗下企业版图？SpaceX被曝正评估与特斯拉或xAI合并的可能

01-30

库克直呼“被销量惊到了”：iPhone 17等在中国卖爆，靠产品与用户共鸣

01-30

消息称OpenAI计划在年底前上市赶在竞争对手Anthropic之前

01-30

工业互联网智能交互系统：华为、西门子、阿里云的创新设计与实践

阿里云工业数据可视化交互系统以DataV-Board为核心载体，立足工业场景“数据杂、实时性高、操作门槛不一”的痛点，构建“云边协同架构+多模数据底座+低代码交互引擎”的一体化设计体系，实现数据从采集、处理…

01-30

特斯拉停产Model S/X 工厂将转产Optimus人形机器人

01-30

大润发永辉高管“对调”：大润发布局供应链，零售转型新棋局启幕

01-30

东方甄选上半年净利润同比暴增347%，自营产品成增长核心驱动力

01-30

京东七鲜京沪双店齐开！24小时鲜品、特色礼盒助力年货消费热潮

01-30

厂二代接班：光环之下是挑战，53亿流量难掩月薪三千五现实

01-30

百度系创业老将任旭阳领航，海致科技13年磨剑冲刺“除幻第一股”

01-30

苹果财报亮眼：iPhone收入创新高中国市场强势反弹成增长引擎

01-30

科技传播新路径：抖音“企业+创作者”模式如何让技术“活”起来？

01-30

扎克伯格押注AI未来：Meta今年最高投1350亿美元，加速布局谋领先

01-30

谷歌“深层思维”AI模型突破：解码98%“暗基因组”助力疾病研究

01-30

一加16手机配置大揭秘：2亿像素双摄+9000mAh电池+240Hz高刷屏

01-30

点击查看更多 +

全站最新

吴向东荣膺"2025十大经济年度人物"

83亿港元双向持股！顺丰成极兔战略股东，极兔中国从"规模狂奔"转向"质量蓄力"

A股异动丨上海建工跌逾5% 股东国盛集团拟减持不超3%公司股份

A股异动丨德邦科技盘中跌逾7% 股东舟山泰重拟减持不超2%股份

A股异动丨*ST春天一字跌停股价创近9个月新低

A股异动丨光莆股份跌近6% 股价创逾2个月新低

热门内容

本栏最新

全球消费级3D打印：中国品牌主导市场，未来行业趋势与竞争格局解析

2026年岚图火力全开！四款新车蓄势待发，技术亮点与市场期待并存

奥迪E5 Sportback斩获年度车奖，以融合创新开启豪华电动新篇章

国新基金发力早期硬科技投资：以“五个赋能”助力创业者破局突围

开年剧集盛宴：《太平年》溯历史之魂《生命树》绘生态长卷

大众速腾S实车亮相 3月正式上市入门定位能否掀起市场新浪潮

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.