在中国人工智能领域的一次重要展会上,中国移动正式推出了其创新性的MoMA多模型与智能体聚合及服务引擎,这一发布标志着AI技术在复杂应用场景下的又一重大突破。
MoMA引擎的核心价值在于其强大的汇聚与调度能力。它能够整合行业内的多种优质大模型和专用智能体,根据实际应用场景的需求,智能地匹配并调用最合适的模型和智能体组合,形成一个超级大模型服务基座。这一能力为解决复杂多变的任务提供了更为强大和灵活的解决方案。
面对当前AI模型应用中的诸多挑战,如模型调度与组合、意图理解与规划、以及成本收益平衡等,MoMA引擎通过多级路由技术给出了有效回应。它不仅解决了模型路由选择和能力规划调度的基础问题,更为企业和个人用户提供了切实可行的解决方案。
MoMA,即多模型与智能体聚合及服务引擎,是一个高度标准化和动态化的系统。它通过标准化接口广泛连接业界的大模型和智能体,针对复杂行业场景提供自动化的感知、编排和调用能力。这种能力使得MoMA能够持续进化,为用户提供高准确率、高安全性、高可靠性和高效能的大模型推理服务。
MoMA的核心架构包括模型、工程引擎和协议体系三大部分。在模型部分,MoMA通过对模型和智能体能力的深入探测,以及对用户意图的精准理解,能够自动选择最佳方案。同时,它还通过闭环监控反馈机制,不断优化和调整,以适应数据变化和业务需求。
在工程引擎部分,MoMA以分层路由与动态编排为核心,通过标准协议连接模型、智能体和工具,形成超级大模型能力基座。这一基座能够实现对任务类型、资源分配和执行流程的动态管理,从而在效果、成本和效率三重约束下做出最优决策。
MoMA还提出了“问题难度-领域矩阵”(PD²-Matrix)框架,这一框架通过正交维度分类和差异化评估指标,将大语言模型的“黑箱”能力转化为结构化的“能力矩阵”。这不仅实现了对模型能力的精准诊断,还为不同下游应用提供了个性化的资源-性能权衡策略。
在协议体系方面,MoMA在兼容业界规范的基础上,拓展了统一认证和安全通信等能力,增强了对工具的可调度性。这构建了中国移动特色的A2A和MCP协议,实现了对业界智能体生态的兼容,形成了开放、安全、可信、高效的技术体系服务底座。
MoMA引擎在实际应用中已经取得了显著成效。它聚合了包括九天大模型、Qwen和DeepSeek等在内的15个高质量内外部模型,以及20多个专家智能体。这些模型和智能体涵盖了编程、数学、翻译、医疗等多个领域,能够迅速解决专业领域的问题,精准匹配用户需求。
在实际用户覆盖超过百万的情况下,MoMA的动态路由机制能够在不同参数模型之间灵活切换,整体速度相比固定的75B参数模型提升了42%。目前,MoMA已经应用于中国移动的灵犀智能体2.0,助力其全面升级为跨领域、多任务、自规划的通用型智能体,为用户提供多元化的特色服务。