计算机科学领域迎来一项突破性进展:俄罗斯科研团队开发出名为GigaEvo的开源框架,首次实现大语言模型驱动的自动化代码进化系统。这项由俄罗斯人工智能研究院与俄罗斯储蓄银行联合完成的研究,通过模拟生物进化机制,使程序代码能够自主完成"变异-选择-优化"的循环过程,在几何优化、算法设计等领域取得接近人类专家水平的成果。
研究团队构建的智能进化系统包含四大核心模块:作为样本库的Redis数据库、负责测试流程的DAG执行引擎、统筹进化的MAP-Elites算法引擎,以及基于LangGraph技术的变异操作器。这套系统通过维护代码的"家族谱系",记录每个代码样本的演化轨迹和性能数据,形成包含22个维度的表现图谱,确保代码群体在保持多样性的同时持续优化。
在数学难题验证环节,GigaEvo展现出惊人实力。面对单位面积等边三角形内放置11个点的海尔布伦问题,系统找到的解决方案达到0.0364的最小三角形面积,与AlphaEvolve报告的最优解仅相差0.0001。在单位正方形圆形打包测试中,系统将32个圆的半径总和提升至2.939,突破此前2.937的纪录。更令人瞩目的是高维空间接触数问题,系统在12维空间成功构造出840个单位球体的最优排列,达到已知理论下界。
该系统的技术突破体现在多个创新机制。双向家族谱系追踪技术通过分析代码的"祖先经验"和"后代改进",为变异操作提供精准指导;变异上下文构建阶段整合个体分析报告、家族演化数据等12类信息,生成结构化改进建议;重写模式变异策略通过限定修改区域,将语法正确率提升至85%以上。研究团队还开发出异构模型路由技术,根据任务特性自动匹配最优大语言模型。
实际应用测试中,GigaEvo在Reddit社区规则检测任务上取得突破。系统进化出的智能体解决方案将基线模型的测试AUC从0.670提升至0.803,通过整合Qwen嵌入相似性特征和校准sigmoid函数,实现神经网络预测与传统特征方法的有机融合。这种多步骤推理策略在未见过的隐藏规则测试中仍保持78.3%的准确率,证明系统具备跨领域泛化能力。
开源框架的设计哲学体现三大原则:模块化架构允许单独替换进化算法或语言模型;标准化问题接口支持快速接入新任务;分层配置系统通过Hydra框架实现200余个参数的灵活组合。这种设计使研究人员能在48小时内完成从问题定义到优化实验的全流程,较传统方法效率提升10倍以上。目前框架已支持Python、C++等6种编程语言,兼容GPT-4、Llama3等主流大语言模型。
技术文档显示,系统在温度参数调优中发现有趣现象:当采样温度设为0.6时,既能保持52%的语法正确率,又能维持足够的解决方案多样性。在多岛进化实验中,研究人员意外发现单岛版本与分布式版本在200代进化后的性能差异不足3%,这为后续优化行为空间设计提供了新思路。
该成果已引发学术界广泛关注。麻省理工学院计算进化实验室主任评价:"这标志着自动化编程进入生物启发的新纪元,开源框架将加速相关技术在药物设计、金融建模等领域的落地。"目前已有17个国家的32个研究团队基于GigaEvo开展延伸研究,涉及量子电路优化、蛋白质结构预测等前沿领域。












