滚动资讯

当前位置：首页 > 资讯 > 人工智能 > 正文内容

MiniMax稀宇科技M2.7大模型亮相，模型自我进化开启AI研发新篇章

时间：2026-03-19 04:57:47 来源：互联网编辑：快讯 IP：北京 发表评论无障碍通道

MiniMax稀宇科技近日推出新一代Agent旗舰大模型M2.7，首次实现“模型自我进化”功能。该模型通过构建Agent Harness体系，深度参与自身训练与优化流程，在部分研发场景中可承担30%至50%的工作量，并在内部评测中实现约30%的效果提升。这一突破标志着AI模型从被动接受训练转向主动优化自身架构的新阶段。

在编程能力方面，M2.7展现强劲实力。在涵盖多种编程语言的SWE-Pro测试中，该模型以56.22%的正确率追平GPT-5.3-Codex；在Repo级代码生成基准VIBE-Pro上，M2.7得分55.6%，几乎与Opus 4.6持平。这些数据表明，M2.7不仅能处理单文件代码生成，更能胜任完整项目交付任务。特别在复杂工程系统理解方面，该模型在Terminal Bench 2测试中取得57.0%的成绩，证明其具备深入理解软件运行逻辑的能力。

研发团队通过构建强化学习Harness，使M2.7具备自主优化能力。在一个持续100轮的迭代实验中，模型通过“分析失败轨迹→规划改动→修改代码→运行评测→对比结果→决定保留或回退”的循环，自主发现多项有效优化方案。这些改进包括系统性搜索采样参数最优组合、设计更具体的工作流指引，以及在Agent Loop中添加循环检测机制。最终在内部评测中，模型性能提升30%，显著缩短研发周期。

办公场景应用中，M2.7在GDPval-AA评测中取得1495的ELO分数，位列开源模型榜首。该模型对Office三件套的操作能力大幅提升，支持多轮高保真编辑和复杂模板应用。在复杂环境交互测试中，M2.7在40个复杂技能（超过2000Token）的案例中保持97%的技能遵循率，在Toolathon评测中正确率达46.3%，达到全球第一梯队水平。这些能力使其能高效处理金融研报分析、营收模型构建等复杂任务。

金融领域应用案例显示，M2.7可自主阅读年报、业绩沟通会纪要和多篇研报，交叉比对数据后独立设计假设并构建营收预测模型。该模型还能根据模板生成PPT和研究报告，并在多轮交互中自我修正。从业者评价其产出物可直接进入后续工作流程，显著提升工作效率。在机器学习任务测试中，M2.7参与MLE Bench Lite的22个研发环节测试，三次测试平均得牌率达66.6%，与Gemini-3.1持平。

多智能体协作是M2.7的另一大亮点。Agent Teams功能要求模型具备稳定的角色锚定、对抗性推理和协议遵循能力。在内部产品原型开发测试中，由多个智能体组成的团队展现出高效协作能力，每个智能体都能主动挑战队友的逻辑盲区，在复杂状态机中自主决策。这种协作模式使项目开发效率提升数倍。

更多>同类资讯

索尼新策略：为保利润缩减PS5出货量，短期降价促销难

06-24

GPT-5.6大量实测流出：本周四或登场

06-24

字节豆包Seedance 2.5将在7月初正式发布

06-24

英伟达讲了三年的故事，Momenta准备在港交所兑现

06-24

豆包大模型2.1 Pro发布：百万Token输入定价6元

06-24

火山引擎谭待：字节内部已落地AI Coding生产流程

06-24

豆包Seedream 5.0 Pro发布：随手画设计图

06-24

华为云通过中国信通院“可信AI-Token服务质量评估”

06-24

数亿元融资，影眸科技凭什么被大厂追投？ | 浪潮

06-24

全球首次人形机器人实现工段全覆盖

06-24

从30秒造车到托起大飞机重庆“智造天团”以硬核实力书写中国式现代化新篇

06-24

刚刚，Seedance 2.5 正式发布，国产视频模型再次捅破天花板

06-24

GPT-5.6大量实测流出：本周四或登场

06-24

英伟达讲了三年的故事，Momenta准备在港交所兑现

06-24

QQ邮箱开启内测「Agently Mail」，让AI用自己的身份收发邮件

06-24

点击查看更多 +

全站最新

问界全系车型闪耀链博会，以“五高”标准引领中国豪华汽车向上之路

马云率阿里高管下田插秧：以“种地”之姿，All in AI 谋长远发展

2026快手珠宝文玩配饰行业洞察：流量攀升，消费增长，细分赛道亮点纷呈

电商运营全攻略：深度剖析小红书、快手、抖音、微博四大平台玩法

零跑D99提档6月25日上市！大尺寸高配置，或成MPV市场新变量

腾势N8L闪充版31.98万起售！续航升级闪充快，智能“迪迪虾”首发亮相

热门内容

本栏最新

从30秒造车到托起大飞机重庆“智造天团”以硬核实力书写中国式现代化新篇

火山引擎FORCE大会：豆包2.1 Pro与Seedance 2.5登场，国产AI模型再攀高峰

零跑D99 6月25日上市！超5米车身+双动力，智能座舱芯片行业首发

中科院固态电池新突破：循环性能提升，多产业未来十年或迎变革

英特尔Arc G3 Extreme定制加持壹号本OnexPlayer四款新品覆盖全场景需求

FF法拉第未来芝加哥Automate展发力：发布多形态机器人，勾勒工业生态新蓝图

本网站LOGO小熊标志受版权保护，版权登记号：鲁作登字-2015-F-025467，未经ITBEAR比尔科技官方许可，严禁使用。
声明：本网站是公益性科普网站，为网友提供科技类资讯内容，无障碍技术由太阳湾捐增，为阅读障碍用户提供内容听读服务。如本站内容侵犯了您的权利，请通知我们及时删除。
中国（山东）自由贸易试验区鲁ICP备11015305号-1 联系入口
Copyright © 比尔科技 2007-2024 ITBEAR.COM.CN All rights reserved.