多模型与智能体聚合及服务引擎(MoMA)白皮书
多模型与智能体聚合及服务引擎(MoMA)白皮书Mixture of Models and Agents(MoMA)White Paper(2025 年)前言本白皮书旨在提出中国移动九天人工智能研究院对于多模型与智能体聚合及服务引擎(MoMA)的目标愿景与总体框架,关键技术特征和典型应用场景,并借助本白皮书面向产业提出共建共享的 MoMA开放运营生态的倡议。本白皮书的版权归中国移动九天人工智能研究院所有,未经授权,任何单位或个人不得复制或拷贝本建议之部分或全部内容。多模型与智能体聚合及服务引擎(MoMA)白皮书(2025)1目录1. 引言 ............................................................ 22. 愿景与框架 ...................................................... 32.1 目标愿景 ..................................................... 32.2 总体框架 ..................................................... 43. 关键技术特征 .................................................... 63.1 MoMA 生态汇聚层 ............................................... 63.2 MoMA 核心功能层 ............................................... 83.2.1 MoMA 模型 ..............................................83.2.2 MoMA 工程引擎 ..........................................93.2.3 MoMA 协议体系 .........................................103.3 MoMA 开放服务层 .............................................. 124. 典型应用场景 ................................................... 144.1 面向个人用户的智慧生活助手 .................................. 144.2 面向行业客户的智能服务调度引擎 .............................. 155. 展望与倡议 ..................................................... 18缩略语 ............................................................ 20参考文献 .......................................................... 21多模型与智能体聚合及服务引擎(MoMA)白皮书(2025)21. 引言近年来,大模型技术得到了突飞猛进的发展,模型规模和能力的不断跃升催生了以智能体为主要应用范式的智能服务新形态和 AI 产业新生态,使智能体逐渐成为大模型应用落地和各行业智能化转型的重要驱动力。与此同时,随着大模型和智能体技术不断走向落地应用,产业的发展重心正逐步由模型的技术创新转变为以落地价值为导向的应用创新,更加关注应用的实际成效和长期运行成本。这一转变的关键不在于追求更大的模型规模,而在于构建能让大模型及智能体自主协作、动态演化的技术和服务生态;在于如何能以广大用户接受的成本实现更优的服务体验。在产业应用实践过程中,也逐渐暴露出两大痛点:一是模型选择及组合问题。大模型与智能体的能力各异且数量不断增长,用户的应用场景和业务需求也在持续演进创新,单一模型或智能体难以满足用户的所有需求。如何为用户找到最匹配应用场景需求的能力组合最优解,以保证场景任务完成质量和用户体验,成为部署模型和智能体实现智能服务的首要挑战。二是模型应用成本问题。除了模型训练外,大量用户并发情况下模型的推理同样需要消耗巨量算力,智能体的长期运营也会带来持续开销。如何在保障服务质量的同时,有效控制算力使用效率和运营成本,成为模型和智能体大规模落地的关键瓶颈。在这一背景下,大模型和智能体的发展已进入一个迫切需要体系化 AI 基础设施[1]的阶段。智能服务无法仅依赖单一模型或智能体,而是需要一个能够聚合多模型与多智能体的体系化解决方案,以根据用户需求自动探测匹配各类模型、智能体和工具组合,并通过智能规划、动态路由与精准调度,实现平衡效果、效率和成本的智能化业务服务。多模型与智能体聚合及服务引擎(MoMA)白皮书(2025)32. 愿景与框架2.1 目标愿景图 1 MoMA 的愿景和目标为解决模型选择组合难、模型应用成本高的痛点问题,从供需两个方向推动模型和智能体的规模化应用和商用落地进程,本白皮书基于中国移动在 AI 领域的“供给者、汇聚者、运营者”定位提出多模型与智能体聚合及服务引擎 Mixtureof Models and Agents (MoMA)的概念。MoMA 通过标准化接口自动感知和探索各类模型、智能体和工具,实现动态路由、智能规划、精确调度,提供高准确、高安全、高可靠、高效能的大模型推理服务。一方面为用户提供精准匹配应用需求的,如同通信服务般便捷、普惠和可靠的模型与智能体服务;另一方面有效控制模型和智能体服务全流程的成本,为供需双方提高经济效益。其核心目标包括:打造 MoMA 模型:打造最懂模型和智能体的 MoMA 模型。探测 MoMA汇聚的模型和智能体能力,并识别和理解用户意图,精准匹配满足用户应用需求的模型和智能体组合最优解;多模型与智能体聚合及服务引擎(MoMA)白皮书(2025)4提供 MoMA 引擎:提供具备超大规模服务能力和极致优化成本的工程引擎。在效果、效率、成本三重约束下实现对任务类型、资源分配、执行流程的动态管理和最优决策,提速降本;构建 MoMA 协议:构建支持模型、智能体接口互联互通的标准化、高安全的协议体系。融合“类 MCP、A2A”等主流通信协议,并增强统一认证及安全通信等能力,使能模型、智能体、工具、数据、环境和应用系统之间的无障碍互联互通。2.2 总体框架图 2 MoMA 总体框架MoMA 通过分层架构集成多源异构模型、智能体,形成覆盖能力汇聚、动态智能调度、应用支撑的全链路智能服务流程闭环。其核心架构包含生态汇聚层、核心功能层、开放服务层:多模型与智能体聚合及服务引擎(MoMA)白皮书(2025)5MoMA 生态汇聚层:负责构建、筛选、评估和持续进化出一个包含丰富多样、质量优良、安全可控的模型、智能体及工具的资源池。通过对模型、智能体及工具的供应商建立严格的准入机制,以及通过标准化的合作流程,持续吸引并激励优质供应商持续提供核心能力。在此基础上,持续进行能力资源的筛选、评估与进化,并依托技术
多模型与智能体聚合及服务引擎(MoMA)白皮书,点击即可下载。报告格式为PDF,大小0.87M,页数23页,欢迎下载。