上海交通大学联合科研团队近日宣布,其开发的AI自主研发系统ASI-EVOLVE取得重大突破,这项成果已在arXiv平台公开,编号为arXiv:2603.29640v1。该系统首次实现AI自主完成从知识学习到方案优化的完整科研闭环,在模型架构设计、数据处理及算法优化三大领域展现出超越人类专家的能力,为人工智能发展开辟全新路径。
研究团队构建的ASI-EVOLVE系统包含五大核心模块:研究员模块负责生成创新方案,工程师模块执行实验验证,分析师模块提炼经验教训,认知库存储专业知识,数据库记录完整研究历程。这套系统通过持续迭代实现自我进化,每轮循环都会将实验结果转化为新的知识储备,形成"学习-设计-实验-分析"的螺旋上升模式。在神经架构设计任务中,系统仅用1773轮探索就生成1350个原创架构,其中105个超越人类设计的基准模型,最佳方案性能提升达0.97分,是近期人类专家改进效果的三倍。
数据处理领域同样见证系统威力。面对海量异构数据,ASI-EVOLVE自动识别网页文本、学术文献、社交媒体等不同数据源的质量问题,设计针对性清洗策略。经优化处理的数据使模型在知识密集型任务中表现跃升:MMLU基准提升18.64分,医学问答MedQA提升13.48分。这种自动化处理流程不仅提升效率,更建立起数据质量与模型性能的量化关联,为AI训练数据优化提供新范式。
在强化学习算法设计方面,系统从GRPO算法出发,通过300轮进化实验开发出新型变体。最优算法在数学推理任务中表现卓越:AMC32提升12.5分,AIME24提升11.67分。这些突破源于算法创新,如成对非对称优化策略通过样本间比较确定优势,预算约束动态半径策略则像家庭理财般合理分配训练资源。这些设计使算法在保持稳定性的同时,显著提升复杂任务处理能力。
系统能力边界测试同样令人瞩目。在圆形装箱优化问题中,ASI-EVOLVE仅用17轮迭代就达到2.63597的得分,最终结果与全球最佳解仅相差0.000013。消融实验显示,分析师模块的持续反馈使系统能突破性能平台期,而认知库则帮助系统快速建立知识基线。当移除认知库时,系统虽能通过自主探索最终达到相似性能,但收敛速度大幅下降,凸显先验知识的重要性。
跨领域应用验证中,系统在药物-靶标相互作用预测任务展现强大泛化能力。针对全新药物或蛋白质的冷启动场景,AI设计的架构使AUROC指标提升最高达6.94分。最佳架构融合三项关键创新:Sinkhorn注意力机制确保分配平衡,领域特定边缘化策略实现组合建模,Top-k稀疏门控机制降低特征干扰。这些设计选择精准对应生物分子结合的物理规律,证明系统已具备理解问题本质的能力。
技术实现层面,系统采用多层次分析机制处理复杂实验数据。在神经架构任务中,分析师模块需同时解析数十个性能指标、训练动态曲线及计算效率数据。通过量化分析、模式识别和因果推理的三级处理,系统能准确诊断问题根源并提出改进方向。数据库的智能采样策略则平衡探索与利用,UCB1算法在知识充足时优先选择高潜力方案,MAP-Elites算法通过并行进化分支防止过早收敛。
这项突破引发学界对科研范式的深度思考。传统AI研发依赖人类专家进行架构设计、数据筛选和算法调优,而ASI-EVOLVE证明AI可承担这些基础工作。研究团队强调,人类研究者将转向更高层次的战略规划,如定义研究目标、评估社会影响及把控伦理边界。系统开源决定更体现科研共享精神,全球开发者现已可通过GitHub获取完整代码和文档,共同推进AI自主研发技术发展。











