2025年算力基础设施安全技术白皮书——端管云协同
华为算力基础设施安全技术白皮书 ——端管云协同 Huawei Computing Infrastructure Security Technical White Paper (HCIST) ——From Device-Pipe-Cloud Perspective 文档版本 V1.0 发布日期 2025-09-18 i 当前,人工智能技术以前所未有的速度重塑全球产业格局,在深刻重构人类生活、学习与工作的底层逻辑的同时,也对全球数字化转型进程带来巨大影响。“算力+数据+网络联接”已经成为全球企业在数字化转型中的核心关注点。过去 24 个月里,全球 GPU 出货量激增,AI 训练集群规模已从万卡集群迈向十万卡集群,算力基础设施建设正以“摩尔定律×云速度”快速扩张。 在算力成为企业数字化时代第一生产力的同时,算力已经成为网络攻击者的首要目标之一。算力一旦被降速或污染,会直接引发业务停摆;而针对算力集群的入侵,则可能导致 AI 训练模型被篡改、金融交易被延迟、制造执行系统乱序等一系列后果。“算力基础设施”作为数字化核心生产系统,已经被纳入到关键信息资产进行管理。以审计为例,数字化运营企业的审计已经从财务领域扩展到“全面风险管理”,审计既要通过经营数据看企业“做了什么”,也要关注计算完整性以保证这些经营结果的“真实可信”,目前部分国家监管机构会把“系统算法、参数、日志的完整性与可追溯性”列为必审内容。企业在算力基础设施上的合规治理能力将会直接反映在企业的股价、日常保费、融资费率等一系列核心经营指标上。如果不在算力基础设施规划、建设和运营的同时嵌入“安全基因”,企业最宝贵的数字化生产力将变成企业最大的风险敞口。 面对这些挑战,华为始终秉持“构建安全可信的算力基础设施”这一核心理念,深度融合端管云协 同 架 构 与 机 密 计 算 、 机 密 存 储 等 前 沿 技 术 , 打 造 了 华 为 算 力 基 础 设 施 安 全 技 术 体系(HCIST)。HCIST 通过全栈内生安全能力,覆盖芯片、固件、软件、单节点、多节点、集群及云场景,严格遵循“数据可用不可见”原则,为用户数据与模型资产提供全生命周期的安全保护。在计算场景中,我们基于鲲鹏和昇腾处理器,构建了硬件级可信保障能力;在存储场景中,通过机密存储技术实现数据静态与传输中的端到端保护;在云场景中,依托擎天架构,提供了高安全、强隔离的机密计算环境。同时,HCIST 通过远程证明与安全验证机制,确保平台身份与运行环境的真实可信。未来,华为将继续深化异构硬件级保护、跨设备安全通道协议及合规框架的研发,推动算力基础设施向更安全、更高效的方向演进。 HCIST 将能够帮助数字化运营企业更好的将“计算完整性”纳入企业风险管理中,确保计算节点的可验证、可追溯,引入持续的安全监控措施,确保风险管控的有效闭环。我们相信,HCIST 不仅能为 AI 时代的数据处理提供坚实底座,更将为全球数字经济的可持续发展注入新动能。 杨晓宁 华为网络安全与隐私保护官 i 人工智能正处于跨越式发展的新阶段,从基础大模型的快速迭代,到各行业智能化应用的广泛落地,我们正见证一场深刻的技术革命。这场革命不仅改变了人类的工作与生活方式,也在重塑全球产业格局。算力,作为人工智能的“发动机”,正日益成为数字经济的核心生产要素。 然而,随着智能化进程的加速,诸多挑战也逐渐显现。一方面,算力需求持续攀升,供需失衡已成为大模型规模化落地的重要瓶颈;另一方面,数据作为 AI 的关键生产要素,在跨组织、跨场景流转中面临安全与隐私挑战,如何在保障安全可信的前提下最大化释放数据价值,已成为产业共同面对的核心议题。 华为始终致力于为智能社会构建安全、可信、开放的算力基础设施。为此,我们构建了华为算力基础设施安全可信技术体系(HCIST)。该体系坚持开放的设计理念,既支持多元异构环境的适配,又确保各方资源能够按需集成、协同运作。纵向层面,HCIST 构筑了从芯片、固件、操作系统、集群到云的全栈安全能力;横向层面,则充分发挥“端-管-云”协同优势,为数据和模型资产提供端到端的全生命周期保护。 通过内生安全机制与开放的架构,HCIST 为各类 AI 应用提供高性能、可扩展、易迁移、可信赖的算力基础设施。在实际部署中,HCIST 面向复杂异构算力场景,实现从 CPU 到 NPU 的全面安全防护;在数据管理方面,提供机密存储、隐私计算与远程证明等关键能力;在网络层面,支持跨设备、跨地域的安全协议和加密传输,构建可信任的数据流通环境。通过持续的技术创新和华为全栈软硬件能力,HCIST 逐步发展成为体系化的安全框架,从单点设备到超大规模集群全面赋能,支撑多样化的安全与隐私需求。 展望未来,华为将继续与产业伙伴协同共进,不断推动异构、跨域协同的安全防护架构和标准体系的建设与演进,促进全球智能化走向可持续、可信赖的发展模式。 朱小勇 华为 2012 实验室 可信理论、技术与工程实验室主任 i 前言导读 人工智能(AI)正以前所未有的速度重塑全球产业格局,以 ChatGPT 为代表的技术浪潮,不仅推动了大模型的工业化应用,更将 AI 算力和数据安全推向全球科技竞争的战略高地。然而,这一进程伴随着两大结构性挑战:其一,算力供需的不平衡严重制约了大模型的规模化部署和普及;其二,数据资产在跨组织、跨地域流动过程中的安全风险阻碍了协同与创新。 为应对这一挑战,华为秉持“构建开放安全可信的算力基础设施”这一核心理念,依托端管云协同架构,融合机密计算、机密存储、可信网络等多维度安全能力,构建了华为算力基础设施安全技术体系(HCIST),实现数据与模型资产的全生命周期保护。 在计算安全方面,鲲鹏平台通过 virtCCA/CCA 技术实现 ARM 架构下的机密计算,配合国密算法加速与可信计算 3.0 满足高安全合规要求;昇腾 NPU 则通过昇盾、PMCC 等技术,确保模型权重、用户数据和中间结果在推理、训练与微调始终处于机密域,防范恶意用户、恶意管理员等潜在威胁。 在存储安全方面,HCIST 提出了机密存储(Confidential Storage)新理念,旨在从硬件层面构建可信根基,依托硬件身份、链路加密、双层认证和数据直通等核心技术,形成覆盖全链路的数据安全体系。该方案面向存算分离与智能存储深度融合的架构,不仅有效降低了跨节点、跨网络传输所带来的安全风险,还实现了高安全和高性能的兼顾。 在云安全方面,华为云基于擎天(Qingtian)架构构建了物理隔离、安全启动、硬件身份证明等机制,防御云平台内部威胁。擎天 Enclave 技术为租户提供高度隔离的执行环境,支持加密机、机密AI 等敏感业务的安全运行,为多租户云环境下的关键业务部署提供可信基础。 在 AI 平台安全方面,HCIST 推出的 A+K 异构机密计算加速平台,实现了 CPU TEE 与 NPU TEE 的深度协同,形成“双硬件信任根、端到端运行时隔离、任务级零信任验证”的整体架构。而机密容器技术的推出,更是将 AI 运行时与 TEE 安全保护相融合,兼顾大模型的安全与性能。 在通信安全方面,HCIST 构建了端云协议安全以及
2025年算力基础设施安全技术白皮书——端管云协同,点击即可下载。报告格式为PDF,大小3.8M,页数51页,欢迎下载。
