在人工智能领域,“自进化”正成为最炙手可热的话题。小米MiMo大模型负责人罗福莉在中关村论坛上指出,未来一到两年内,大模型有望实现自进化能力,这一进程比她一年前的预测大幅提前。更激进的观点来自Anthropic首席执行官阿莫迪,他在达沃斯论坛上表示,AI的递归自我改进可能在半年到一年内实现,人类距离AI自主构建下一代AI仅一步之遥。
这种自我改进机制一旦形成闭环,其进步速度将呈现指数级增长。上海交通大学刘鹏飞教授团队近期发表的论文《ASI-Evolve: AI Accelerates AI》正是这一方向的突破性成果。研究团队构建了一个闭环框架,让智能体在“学习经验-提出新设计-实验验证-分析结果”的循环中持续优化模型架构、训练数据筛选和强化学习算法三大核心组件。实验表明,AI确实具备了自我改进的能力。
论文第一作者徐为先的身份引发广泛关注——这位上海交通大学大三学生主导了这项研究。他的技术背景令人惊叹:不仅在AI领域深耕神经架构搜索和持续学习,还独立完成操作系统内核ACore(Rust开发)、编译器Imxc(C++实现)和基于Tomasulo架构的RISC-V处理器(Verilog设计)。其GitHub项目ASI-Arch已获得1100余星标,展现出超越同龄人的技术实力。
徐为先认为,实现真正的自我进化AI需要突破“持续自我改进”和“长期可靠性”两大瓶颈。他的研究分为两条路径:一是优化单个模型的学习目标和记忆机制,二是构建多智能体协作生态系统。这项研究的灵感源于2025年Google的AlphaEvolve项目,其核心思想是将AI的科研能力反哺自身发展,形成自我加速的循环。
尽管取得突破,徐为先强调人类指导不可或缺。ASI-Evolve系统融入了大量人类研究经验,初始目标和评估标准均由人类设定。AI的作用是在人类指引的方向上进行高效探索,而非盲目搜索所有可能性。这种模式使研究人员能够专注于战略性问题设计,而将具体技术方案的优化交给AI完成。
该系统的分析器模块是其关键创新之一。它能自动提炼实验结果中的关键模式,将有效设计选择和失败原因写入经验数据库,使系统具备真正的学习能力。徐为先比喻道:“传统自动化系统像普通刷题者,只记录对错数量;而ASI-Evolve会分析错题原因,总结解题规律。”
在神经网络架构设计方面,ASI-Evolve发现的最佳模型性能提升0.97%,接近人类设计SOTA增益的3倍。这些架构通过系统演化而非暴力搜索获得,展现了AI的创造性。在预训练数据筛选领域,AI优化的数据策略使基准测试平均提升3.96%,知识密集型任务提升超18%,标志着AI能够自主判断数据价值并完成全流程筛选。
强化学习算法设计领域同样取得突破。ASI-Evolve提出的全新算法在数学竞赛中表现优异:AMC32得分超越GRPO基线12.5分,AIME24提升11.67分,OlympiadBench提高5.04分。这些成果源于原创性的数学创新,包括新的优化目标函数和梯度更新策略。
徐为先的成就引发科技巨头对天才少年的激烈争夺。月之暗面推出的“穿越计划”提供正式offer、奖金和公司期权,吸引未毕业顶尖人才;OpenAI的Safety Fellowship则通过资金支持、计算资源和导师指导,培养AI安全与对齐领域的研究者。这些项目反映行业趋势:在AI发展速度超越人才培养速度的背景下,企业正通过提前布局争夺未来竞争优势。
这位年轻研究者展现出技术天才与生活情趣的完美平衡。作为吉他手(精通古典和电吉他)、单簧管九级持有者,他热爱羽毛球和电子游戏,并在个人主页坦诚分享恋爱状态。徐为先认为,真正的天才源于热爱、天赋与努力的结合,他希望在科研与生活间找到平衡点,享受“Happy Research”的过程。
对于未来,徐为先更关注AI的反思能力和持续学习能力。他计划通过读博深入研究模型全生命周期表现,探索训练与部署阶段的融合可能。在他看来,让AI在真实使用场景中动态进化,比单纯提升单代模型能力更重要。这种视角或许预示着AI发展的新方向——从追求静态性能转向实现动态适应。











