编程领域正经历前所未有的激烈竞争,各大科技公司纷纷推出创新产品,试图在这片红海中占据一席之地。从Vibe Coding到Claude Code,再到Codex和Cursor,新名词层出不穷,技术迭代速度之快令人目不暇接。Trae、Qoder、CodeBuddy等新兴势力也在市场中崭露头角,形成了一场贴身肉搏的科技大战。
在这场技术竞赛中,黑话和热词不断涌现,支配着从业者的注意力。去年,"skill"还是行业内的热门词汇,而今年,"harness"已取而代之,成为新的焦点。尽管各大模型在基准测试中的表现日益接近,但真正决定胜负的,已不再是模型本身,而是围绕模型构建的生态系统。研究显示,在Claude Code泄露的代码中,真正属于模型决策的部分仅占1.6%,其余98.4%都是用于管理权限、上下文和错误的"harness"代码。
为了充分发挥模型优势,新一代agent产品如雨后春笋般涌现。Grok Build、Qoder 1.0和TRAE SOLO等新产品相继推出,引发市场关注。就连一向低调的DeepSeek也加入战局,大规模招聘agent开发人才。MiniMax作为早期布局agent的公司,在5月中旬推出了主打多agent编排架构的Agent Team功能,随后又凭借M3旗舰模型将桌面端产品全面升级为MiniMax Code,再次搅动市场。
Agent Team的核心是一套名为Leader-Worker-Verifier的"对抗式"架构,将执行和验证职责分离,通过状态机管理不同agent,实现上下文隔离。这一设计有效解决了长程agent任务中的上下文污染、焦虑和agent间"共谋"等顽疾。有趣的是,MiniMax并未等待M3模型发布,而是在M2.7阶段就推出了Agent Team,展现出对技术传播的重视。
MiniMax Code推出后,用户反馈积极。通过优化订阅逻辑,用户只需购买token计划即可使用完整功能。一个多月内,下载量和订阅量显著增长。许多用户利用全模态特性,用Agent Team生成长视频和诗朗诵音频,这些C端应用超出公司预期。用户普遍反映,Agent Team带来的"员工感"和情绪价值是其最大亮点。
在技术实现上,Agent Team架构通过分离执行和验证agent,并引入打回机制,确保任务质量。内部使用一个月后,团队决定对外发布,并考虑开源架构。该架构允许agent间自由通信,不同于传统线性工作流程,能够灵活应对开发环境中的各种问题。例如,当开发受阻时,worker或verifier可以通知其他agent避免重复错误。
针对模型同源agent间的对抗问题,MiniMax通过精心设计的提示词和可观测的停止条件实现。Worker的停止条件是完成任务,而verifier则需找出错误。用户可以根据需求自定义对抗强度,通过Skill功能让agent总结用户偏好作为判断标准。随着模型能力提升,这一过程将变得更加自动化和智能化。
上下文隔离是Agent Team的另一大特色。通过将用户请求、生产资料和执行轨迹分离,有效避免了长程任务中的上下文污染问题。这种设计源于对agent长时间运行的预期,既然大部分信息不需要共享,隔离就成为自然选择。系统还能确保同时处理多个任务时不会"串台",提供独特的用户体验。
在行业竞争中,MiniMax认为真正的差距不在于模型本身,而在于如何利用模型。Anthropic和OpenAI的不同路径就是例证:前者对模型持怀疑态度,处处设限;后者则采用极简循环框架,充分发挥模型能力。MiniMax选择了一条中间道路——既给予模型充分信任,又通过"harness"加入合理约束,这种独特思路在业界独树一帜。
对于其他玩家的跟进,MiniMax持开放态度。虽然共识形成速度加快,但执行细节仍决定成败。例如,Claude Code的新架构与Agent Team在设计哲学上有相似之处,但实现方式和交互细节存在差异。MiniMax强调,在agent时代,开发效率固然重要,但真正决定胜负的是对所有细节的把握。
面对行业快速迭代,MiniMax认为没有公司能建立真正壁垒,但可以通过快速输出新认知保持领先。公司计划继续以最快速度向行业分享见解,做共识的领导者、执行者和验证者。对于未来,MiniMax设定了明确目标:当agent能够实现真正自进化,并在几乎所有任务上超越人类时,将标志着技术成熟期的到来。
在应用层面,MiniMax Code展现出惊人潜力。许多用户利用其进行视频生成和音频创作,这些非预期用途验证了产品的泛化能力。公司认为,随着模型能力提升,专业视频制作中的抽卡和剪辑成本将大幅降低,但完全替代人类创作仍需分工协作。调研显示,目前人工剪辑成本仍低于AI,但这一差距正在缩小。
MiniMax的研发工程师择因分享了个人观点:当更强大的模型如M3出现时,技术将进一步突破。他举例说明,三月开始使用的Agent Team架构源于对agent记忆机制的思考——错误记忆不应影响后续任务。这种创新思维推动了新架构的快速落地,并在内部引发开发方式革命。
对于行业现象,择因认为Anthropic对模型的过度约束可能源于宣传策略,而非技术本质。相比之下,GPT 5.5展现出更强的主动性和生产价值。他指出,agent和模型是互补关系:强大的agent能榨干模型潜力,而强大的模型则不需要复杂agent。当前verifier方案的流行,正是与模型能力阶段相匹配的结果。
在组织效率方面,择因强调这是科技公司保持竞争力的关键。MiniMax通过全模态路线和自研模型部署,构建了复合优势。对于国产模型开源现象,他认为当模型进入价格战阶段,开源风气可能减弱,但全球范围内,通过论文分享创新成果仍将是主流。
面对大厂采用赛马机制开发agent产品的现象,择因提出关键问题:这些产品能否与模型能力形成闭环,能否反馈到模型训练中。他强调,agent产品应先在内部验证有效再对外发布。虽然B端产品收益更明确,但agent的核心价值在于放大模型能力,探索模型应用方式。
在个人工作变革方面,择因描述了agent带来的正反馈循环:通过不断赋予agent更复杂任务,团队预期不断提高,同时得以专注于工作抽象和模式识别,提升自身能力。连接飞书后,与agent的交互体验带来强烈情绪价值,这种变革正在重塑开发者的工作方式。
对于未来就业市场,择因提出了大胆预测:当agent能力全面超越人类时,现有教育体系可能面临挑战。他观察到视频剪辑领域已出现"付费上班"现象——初学者需通过实际项目积累经验。这一模式可能扩展到其他领域,促使本科生毕业后需再"付费实习"两三年才能获得正式工作机会。当然,这也可能推动教育制度创新,催生新的学习范式。
在访谈最后,择因回答了一个开放性问题:如果拥有无限算力,他将用于构建人类决策分身系统。这个系统能综合个人基因、经历和环境数据,在决策时刻提供参考。他特别强调,这一工具不仅用于个人决策,更希望帮助那些因意外导致人生轨迹突变的人,通过关注小概率但颠覆性的事件,实现真正的人生解放。










