6G“零中断”网络设计白皮书
前 言从5G商用化进程的加速到万物智联时代的开启,及物联网、工业互联网、自动驾驶、远程医疗等新兴技术的蓬勃发展,人类对网络的需求不再局限于基础连接,而是向极致可靠性、全域覆盖与智能自治能力迈进。当前 5G 网络虽在时延和带宽性能上实现显著突破,但商用部署中仍暴露出多重短板与潜在风险,部分关键场景存在业务中断隐患。6G 作为下一代移动通信技术,对网络稳定性与可靠性提出了更高要求。本白皮书聚焦核心网领域,汇聚行业专家的研究成果与实践经验,深度剖析4/5G 商用网络事故带来的启示、前瞻性预判 6G 网络面临的可靠性挑战,提出6G “零中断”网络(Zero-Outage Network, ZON)愿景和目标、设计“零中断”网络三体架构,即网络本体原生抗毁、灾备护体物理止损、高稳智能体智能提效,并论述6G可靠性设计的关键要素。致力于为人类社会提供永续在线、无缝切换、自主愈合的通信服务,为业界同行提供参考,共同推动 6G 技术发展,助力实现万物智联的美好未来。II11. 4/5G网络商用事故启示及6G可靠性挑战21.1 4/5G 商用事故统计分析随着 4G 和 5G 技术在全球范围内的商用推广,通信网络的规模和复杂性急剧增长。近年来,全球通信网络中的重大故障事件也屡屡发生,给运营商和用户带来了严重的影响。根据互联网公开数据和行业报告不完全统计,在 2021 年至 2024年期间,全球通信行业发生了超过 66 起重大网络事故,影响范围广、恢复时间长、经济损失严重。如何提高网络设备的容错性、提升整网抗信令风暴的鲁棒性以及故障自愈的高效性是 6G 网络必须优先考虑和解决的问题。图 12021年至2024年4/5G商用事故统计事故诱因复杂,以网络故障和动网操作为主。4G/5G网络的故障呈现出软硬结合、内外因交织的复合性特点。其中,网络故障占比约50%,通常由网络自身设计缺陷或容灾不足引起网络中断,包括硬件故障、网络云故障、核心网故障、传输承载故障等。其次,动网操作占比约38%,通常由人为的网络维护操作、或升级调试等行为引发网络功能异常、甚至信令风暴和大面积服务中断。过载是主要现象。占比约69%,通常因局域异常未能及时恢复或隔离,再加上4/5G智能终端永远在线的设计,导致短时间内反复重试引发过载。语音和数据业务会同时受影响。占比约88%,因语音和数据业务强耦合设计,一方面语音业务都是基于IMS承载的,当数据业务发生故障,语音业务也将遭受牵连;另一方面因为终端的语音优先策略,当语音业务故障时会释放数据连接。事故诱因事故现象业务影响中断时长3业务中断时间长。88%的事故中断时长超过2个小时,50%的事故中断时长超过5个小时,主要因为发现异常耗时长、人工定界、诊断、恢复耗时长。1.2 4/5G 商用事故启示1.2.1 技术演进启示5G网络在商用与能力演进过程中暴露出的问题和影响,要求在6G设计之初充分考虑并规避。 降低网络复杂度,减少故障风险和定位时长:5G网元和接口数量增加,长链路交互增加了故障诊断/定位的耗时和难度,当网络信令风暴发生后需要E2E协同控制才能有效恢复。 降低资源池故障的跨层传导,做好亚健康监控和容错设计:5G网络在虚拟化改造后,采用资源池、通用硬件替代传统的通信专用硬件,亚健康故障检测和定位定界难度增加,三层兼容性问题增加,对网络可靠性带来挑战。需通过通用硬件层的高可用设计、基础软件层的稳定运行及业务软件层的容错机制协同保障,实现系统级可靠性,确保服务持续稳定。 加固枢纽节点应灾能力,减少服务化信令冲击:NRF、SCP作为5G服务化、信令转发的中枢节点,一旦故障影响较大。随着网络规模的扩大以及用户量的扩增,服务化接口信令冲击、大包传输、链路层资源不足的风险相应增加。 加强边缘网隔离性,减少和公网相互影响:边缘网络与公网可能存在控制面交互、数据同步,一旦发生链路异常或传输异常,影响边缘业务的4正常运行,同时,边缘网络访问公网也存在安全攻击风险和故障传导风险。 提升网络敏捷拓展能力,保持基础网络的稳定性:随着3GPP标准的不断更新,许多新业务拓展常需多个基础网元升级,业务发展不敏捷,也波及已商用业务的在线体验和基础网络的稳定运行。1.2.2 容灾管理启示容灾组网的完善程度直接决定了网络在面对灾难或突发故障时的恢复能力。当前许多网络在面临大规模故障时,无法保证服务的连续性,恢复过程缓慢。 做好基础容灾备份,避免二次危机:部分运营商因缺少冗余设计,导致灾难发生时业务无法平滑迁移至备用路径或系统,短时信令冲击引发二次危机,故障影响范围持续扩大、定位复杂度进一步增加,恢复时间延长。 做好风险化解,避免大面积瘫痪故障:数据网元(例如UDM、HSS)作为移动通信网核心所在,该设备的故障将引发超大规模的用户重注册、进而引起信令风暴,需要考虑相应机制分担数据网元故障后的风险与压力。 做好动网预演,避免操作不当带来风险:部分事故是由于管理机制不完善,在网络升级改造、调整维护时缺少预演预验证手段,导致一些误操作的风险不可提前预估与防范。 重塑打底逃生网,弥补2G退网后的不足:2G低制式网络虽然技术落后,但其是4/5G网络天生的兜底平面,为基础通信需求提供了最后一道屏5障保护。随着2G的退网,这一天然屏障将丧失。6G网络需要考虑相应机制和4/5G网络形成新形态的高低制式间的互补与兜底。1.3 6G 网络可靠性挑战分析6G网络将覆盖更广泛的应用场景,赋能多行业、多领域的智能化服务。ITU-R在2023年明确了6G六大核心场景,包括沉浸式通信、超大规模连接、极高可靠低时延、感知与通信的融合、人工智能与通信、泛在连接。这些新场景普遍要求网络提供更高稳定性,同时对网络可靠性也提出一些新挑战。图 2ITU 定义 6G 六大核心场景1.3.1 人工智能与通信,智能与可靠的博弈AI 与 6G 通信的深度融合在提升网络能力的同时,也引入多重可靠性风险。AI 模型对数据质量高度依赖,数据偏差可能导致故障预测失准或资源调度失效;模型黑箱特性使决策过程难以追溯,关键场景下故障定位与修复效率受限;AI 系统面临数据污染、模型攻击等安全威胁,可能引发错误决策或网络异常;此外,AI 驱动的核心网依赖稳定算力支撑,算力资源故障将直接影响智能功能运行。这6些挑战要求 6G 网络在 AI 模型鲁棒性、决策透明性、系统安全性及算力可靠性等方面强化设计,平衡智能化与可靠性的技术演进。1.3.2 智能体通信,新型模型和实时组网需要动态保障在6G 网络中,AI Agent 将随着技术的快速发展而得到广泛应用,带来全新可靠性挑战。智能体基于环境自主学习的特性,使其行为模式难以预测,导致网络设备动态调度结果的不确定性增加,传统流量管理模型失效;智能体通信以 AI模型、原始数据等机器媒体为主,传输需求更复杂(如持续低延迟交互、高度并行通信),颠覆了传统人类通信的流量模式,对网络带宽动态适配与话务冲击应对提出更高要求;机器人集群、自动驾驶车队等场景依赖 P2P 动态组网,需实时组建协作网络并共享环境信息,现有网络的静态子网管理与路由机制难以满足动态协同需求,亟需提升网络动态组网与智能调度能力以保障业务可靠性。1.3.3 超大规模连接,瞬时信令冲击加倍6
6G“零中断”网络设计白皮书,点击即可下载。报告格式为PDF,大小2.78M,页数36页,欢迎下载。
