AI可信数据空间白皮书
屵囌㱱䎨ᴑD≯ṡ㏰䣺摴䓽䔮᳦贵州省数据流通交易服务中心贵州大数据集团贵州贵旅数网科技有限公司华为云计算技术有限公司朱宗尧 徐 昊 张 广 肖 霏潘伟杰 金 凯 艾晓松 胡琼元 黄籽渝赵 将 吕 东 宋 雪 胡 鹤 袁 波吴 越 邓龙江 刘志杰 刘泥君 代新敏王似巍 冯俊峰 吴忠林 李 勇 龙 婕杨文敬 张洪能 尹舒鹤 李 媛 杨 松张 中 黄 涛 陈 媛 黄 松 杨舒宁徐 强 徐 俊 悦 怡 张志刚 霍战鹏邝逸鹤 周 岩 王 立 乔丽娜 陈 勇邴 丽 孙梦龙 陈 玙 杨梦辉 唐如兵雷鸿伟 郑 辉 张小军 柏 君 孙思东张鑫洁 唐 文 张 溯 陈吉栋 叶 飞 白文武 何志强编制委员会P R E P A R A T I O N C O M M I T T E E编制单位编委顾问编写成员(排名不分先后)(排名不分先后)01CONTENTS䕮ⷕ滶灙㏰䣺摴≑⫕㆑滷灙ᴺⱥ㓺佽➧㢡☋婭㐙≑⫕㆑滸灙㏰䣺摴D⇏⊌≑⫕䔄ῳ掮㆑01㏰䣺摴ᴺⱥ㓺佽⇏⊌≑⫕㆑滶灙㐰ᷓ䭻濢㏰㢡⇏⊌滷灙㐰㘶㘄濢D≯ṡ㏰䣺摴滸灙㐰䎟⺁濢㏰㓺䎟02D≯ṡ㏰䣺摴曶⫂娾娡滵滻瀲滶滹滶滺瀲滸滺滶灙宵ⱞ➧㏰敆╢Ῥ㏰㈈㗃幐劥䣺摴⨞屵滷灙宵ⱞ䖁㐇㑅囌Ლ㏰䣺摴≊➧㢡☋⨞屵滸灙㯷㏰敆╢♎Ⲃ㏰䣺摴⨞屵滹灙㱱△⇗⫱㏰≯ṡ㯁庚㖍℡㈢䮢⨞屵滺灙⇎ᲺᶁᲚ㏰䣺摴㈢䮢⨞屵0304㖀ᷳ⨞屵㛈ḋ滸滻瀲滹滾≂亃ⶕ䎨滺滵瀲滺滶前言PREFACE构建可信数据空间与人工智能协同创新范式,开启人工智能新时代。在数字文明加速迭代进化的时代洪流中,数据与人工智能共生发展正重塑全球经济的格局。数据作为我国第五大生产要素,其价值释放的深度与广度,直接决定了人工智能产业从“感知智能”向“认知智能”跃迁的新高度。当前全球数据总量虽呈指数级增长(2023年突破 175ZB),但高质量语料尤其是中文语料严重匮乏,实际流通率却不足 5%。数据产业面临“不敢共享、不愿共享、不能共享”的困局如同无形枷锁禁锢着 AI 创新的步伐。比如医疗数据因隐私顾虑难以赋能疾病预测模型,工业数据因竞争壁垒阻碍供应链协同优化,金融数据因权属模糊制约风险管控精度,这些挑战的本质,是数据要素市场化配置过程中“信任基础”的不足,也将严重制约着人工智能产业的发展。国家数据局重磅出台《可信数据空间发展行动计划(2024—2028 年)》,以国家战略方式推动可信数据空间的加速建设,预计 2028 年国内将建成 100 个以上可信数据空间,包括城市、行业、企业、个人、跨境五类可信空间,打通数据要素流通的“最后一公里”。在AI 时代,可信数据空间是战略级新型数据基础设施,它不是单一技术、工具的堆砌,而是制度规则、技术架构、生态系统三位一体协同的创新范式,将成为全域数字化转型的核心数字底座。随着人工智能技术指数级增长,生产型 AI 场景爆发式应用,大模型对高质量数据的“饥渴需求”进一步放大了可信数据空间的价值。本白皮书结合新技术的理解与创新实践的探索,梳理可信数据空间与 AI 协同发展的技术路径、制度框架与实践蓝图,提出 AI 可信数据空间的顶层设计与创新架构,希望借此推动产业共识,联合各界探索数据要素市场化改革的灯塔,共同开启“数据可信即 AI 未来”的新纪元。0501数据空间与人工智能协同发展挑战1、数据空间发展与挑战1.1 数据空间国内外发展趋势国际数据空间(IDS, International Data Space)的概念最早起源于欧洲,旨在解决数据孤岛、隐私安全和权属不清等问题,推动数据的高效流通与价值释放,促进数字经济的快速发展。2016 年,德国工业 4.0 战略率先提出工业数据空间的概念,随后欧盟推出《欧洲数据战略》,将数据空间建设提升至战略高度。美国、日本等国纷纷跟进,结合自身特点探索数据空间建设模式。截至 2024 年,全球已建成超过 200 个可信数据空间,覆盖工业、医疗、金融、能源、农业、交通等多个领域,实现了数据的安全可信流通与价值共创,成为数字经济高质量发展的关键基础设施。欧盟是国际数据空间建设的先行者,其发展模式以联邦式去中心化为核心。欧盟通过《欧洲数据战略》、《数据治理法案》、《数据法案》等政策文件,强调数据主权、多方协同治理和标准化,GDPR(通用数据保护条例)为数据保护奠定了法律基础。在技术架构上,欧盟以 GAIA-X、IDSA 为代表,采用联邦式、去中心化架构。数据不集中存储,而是保留在数据源地,通过联邦学习、隐私计算等技术实现协同分析。此外,还利用区块链、分布式身份认证等技术,保障数据流通的安全与可控。通过连接器机制(Connector Mechanism),实现了不同系统间的数据互操作,提升跨域数据流通效率。在生态与应用方面,欧盟已启动 14 个共同数据空间,覆盖工业制造、医疗健康、金融、能源、农业等领域。典型案例包括 Catena-X(汽车行业)、欧洲健康数据空间(EHDS)、德国工业数据空间(IDS)等。这些数据空间推动了产业链上下游企业的数据共享与协同创新,为欧盟数字经济的发展注入了新动能。全球可信数据空间建设发展日趋成熟,随着国家数据局的战略布局和重点工作推进,我国可信数据空间的建设已逐步从试点探索走向规模化建设。2024 年11 月国家数据局发布《可信数据空间发展行动计划(2024—2028 年)》,首次在国家层面对这一新型数据基础设施系统布局,明确到 2028 年建成 100 个以上可信数据空间的目标。₶₶㛆㘶ㆇⶕ娾㐹⊑䥋曶娾塄ₒ卝╾㹀≑㏰堁䮠㷜佽ⶺ囌ℨ►㓯棱ℨᵷẼ恊㎾㏰堁䮠᳘㏰㏈ⴔṃ≑⫕Ῠ既ⶀ⫕≯ṡ㏰䣺摴婕㼹塄㢡娾╽℡擢瀐堁䮠Ⲃ►↖忍䷮䵼⊈㎹早婕㼹⺻ᷓ㐹㛈瀑灙瀐㏰ᴌ⇁㗡瀑䚴擤堁䮠㯁ℨ攜䜍濤㉐⇇⇏⊌㏈䈇滷滵滷滷䦬ᴌ⫊㏰⧗㎿ⴜ娾⭰ᶚ㉐⁺濢娩㏰灃ḛ⸗⁺灄灃㯁⸗ℨ灄灃䎨⸗⟽灄滷滵滷滸澳滶滷╽⨶㏰⫀瀐≯ṡ㏰䣺摴≑⫕囌ℨ娡ₒ瀨滷滵滷滹瀵滷滵滷滽瀩瀑㉐⁺娾滶滵滵炜≯ṡ㏰䣺摴滷滵滷滹澳滶滶╽⨶㏰⫀瀐滷滵滷滺≯ṡ㏰䣺摴ₛ㐰≑⫕婕㼹⊍⇕瀑Ῥⲃ栖ヹ䎳ㄥゐ℟䔄滻滸Ც≯ṡ㏰䣺摴婕㼹曹䕮⊍⇕滷滵滷滺澳滵滼图 1 可信数据空间建设发展历程07我国可信数据空间的建设可以分为四个主要阶段:· 第一阶段:建制度(2020-2022 年):国务院陆续发布《关于构建更加完善的要素市场化配置体制机制的意见》、《关于构建数据基础制度更好发挥数据要素作用的意见》等文件,明确数据列为新型生产要素,提出“三权分置”等制度,形成基础的制度框架,明确数据要素使用规则,为数据要素市场化配置奠定基础。· 第二阶段:立顶设(2023-2024 年):数据局负责完成发布《数字中国建设整体布局规划》,明确构建全国一体化数据资源体系,提出让数据“供的出、流得动、用得好”
AI可信数据空间白皮书,点击即可下载。报告格式为PDF,大小8.1M,页数52页,欢迎下载。