空间智能研究报告
空间智能研究报告2025.4 量子位智库 QbitAI Insights 分析师 Xuanhao xuanhao@qbitai.com01 空间智能概览目录02自动驾驶033D⽣成04具身智能05扩展现实(XR)06世界模型07空间智能玩家图谱空间智能是主要基于3D视觉信息进⾏理解、推理、⽣成、交互的AI系统4信息来源:量⼦位智库3D理解数据算法3D⽣成3D推理交互虚拟世界物理世界空间智能概览自动驾驶3D⽣成具身智能扩展现实(XR)世界模型空间智能概览:3D⽣成、自动驾驶、具身智能是空间智能不同成熟度的应用领域,XR是空间智能的原⽣交互⽅式5信息来源:量⼦位智库3D⽣成扩展现实(XR)自动驾驶具身智能物理世界虚拟世界终局状态发展成熟度世界模型空间智能概览自动驾驶3D⽣成具身智能扩展现实(XR)世界模型• ⾼• 软件服务可快速普及应用,3D⽣成价格低从智能三要素、普及便捷度、经济性出发,自动驾驶和3D⽣成是空间智能最先成熟的领域,具身智能仍处早期,各要素尚未完备数据成熟度(核⼼)6信息来源:量⼦位智库自动驾驶3D⽣成• ⾼• 汽车⾏驶数据(摄像头及传感器)达到百亿英里级• 仿真数据正在快速发展以弥补真实数据的分布缺失具身智能成熟度XR经济性• ⾼• 融合感知、规划、控制的端到端⼤模型已经成为业界共识算法成熟度• ⾼• 头部玩家达到5万卡H100算⼒支撑• 中• 安全性和合规要求⾼普及便捷度• 中• 有千万级规模的⾼精度3D资产数据,但仍需要更⼤规模的数据提升⽣成效果• 中• 目前算法部分处于快速进步阶段,但数据表征尚未成熟,技术目前可支撑商业化• 低• 头部玩家算⼒百卡/千卡级,算⼒目前并非瓶颈• ⾼• 软件服务可快速普及应用• 中• 自动驾驶软件成本低,潜在受众巨⼤,头部玩家已投放市场• 低• ⾼质量的机器⼈真机操作数据数量稀少,仿真数据作用有限• 低• 目前算法部分处于摸索期,感知、规划、控制等功能都不成熟• 低• ⼤多数玩家在千卡级,目前的主要瓶颈是数据• 低• 物理操作需要满⾜安全性、合规性和精确度需求• 低• 机器⼈本体目前价格昂贵,商业价值低• 硬件设备承担3D交互功能• 可以为具身智能训练采集数据,是目前真机数据的主要获取⽅式空间智能概览自动驾驶3D⽣成具身智能扩展现实(XR)世界模型⽂字、图片、视频数据相比空间智能规模更⼤,支撑了以语⾔模型为核⼼的AI浪潮快速发展,3D和物理AI在数据成熟后空间智能也将迎来爆发7信息来源:量⼦位智库⽂本15万亿Token图片视频自动驾驶3D⽣成具身智能数亿视频⽂字片段百亿级图⽂对百亿英里⾏驶数据千万级⾼质量3D模型百万小时真机数据分析• ⽂本、图片、视频等数据由于互联⽹内容的长期积累,数据规模上显著⼤于自动驾驶、3D和具身智能• 空间智能涉及3D视觉类数据、物理世界交互数据,互联⽹数据的作用有限,需要等待数据体系进⼀步成熟,数据整体上比语⾔更复杂,对数据处理的要求也更⾼空间智能数据规模空间智能概览自动驾驶3D⽣成具身智能扩展现实(XR)世界模型• ⾼• 自动驾驶车队可形成正反馈的数据闭环,加速模型能⼒提升• 数据⽣成:XR设备可以支持空间智能相关的数据⽣产,例如英伟达GR00T项目,通过XR设备为机器⼈进⾏操作演示数据体系成熟度是观察空间智能进展的关键,包括数据积累、数据构成、数据分布、数据闭环四部分,成熟度上自动驾驶>3D⽣成>具身智能数据积累规模8信息来源:量⼦位智库自动驾驶3D⽣成• ⾼• 已有数量庞⼤的车队和成熟的道路交通系统可以收集⼤量数据具身智能分析XR• 中• 以视觉信息为主,纯视觉技术路线外会涉及激光雷达和其他模态数据构成精简度• 中• 以道路交通系统的⾏驶为主,多数驾驶场景下需要的数据可以充分收集,但缺乏长尾数据数据分布多样性数据闭环成熟度• 中• ⾼精度的3D资产图形学数据,主要由专业的3D模型师制作,数量有限• 中• 3D⽣成需要的图形学数据种类多样,如形状、体积、纹理、材质,对数据表征要求⾼• 中• 3D模型的数据集丰富度较⾼,模型可以覆盖各类物件和场景• ⽆• 低• 缺少存量装机量,要从零开始积累数据,同时仿真数据精度有限• 低• 需要视觉数据、⼒学数据、运动数据、激光雷达、甚⾄其他模态,异构数据多• 低,数据主要来自⼀些垂直的训练场景,数据分布比较单⼀• ⽆• 目前数据是⼤部分AI系统进步的瓶颈,算法和算⼒的问题相对更容易解决• 自动驾驶能够快速成熟的核⼼原因在于数据采集和数据闭环⽅面的优势,⼤规模的自动驾驶车队⾄关重要空间智能概览自动驾驶3D⽣成具身智能扩展现实(XR)世界模型自动驾驶是空间智能目前规模最⼤、最成熟的应用,已经接近⼈类⽔平,技术前沿开始从模仿学习转向强化学习,以保持性能增长10信息来源:量⼦位智库描述L1阶段L2L3L4L5数据支撑• 极少• 以视觉为主的⼤量车辆驾驶数据,附加激光雷达等其他传感器数据• 在驾驶数据的基础上增加针对尾部场景的模拟仿真数据算⼒支撑• 端侧的低算⼒ECU/嵌⼊式芯片• 云侧需要万卡集群• 端侧需要⾼端推理芯片,如特斯拉HW3或者英伟达Orin/DRIVEThor• 数⼗万卡、百万卡集群• 辅助驾驶,由AI来控制单个运动控制,其他操作由⼈类驾驶员完成,例如巡航和车道保持• 部分自动化,⼈类驾驶员为主,但⼤部分驾驶操作由自动驾驶系统完成• 有条件的自动化,由AI来完成所有的驾驶操作,驾驶员仅在系统提示介⼊时⼲预操作• 在限定范围内⽆需⼈类任何⼲预,所有的驾驶操作由AI完成• 不限地域范围• 完全由AI完成驾驶操作权责划分算法支撑• 真实数据积累量(本质是模仿学习)对模型能⼒的增益呈现边际递减的情况,优秀的模型会增加长尾数据的收集难度,模型越好依赖真实数据进⾏提升越困难• 需要引⼊强化学习+合成数据的新算法来加速模型迭代速度、提⾼智能上限数据量模型能⼒强化学习增益当前阶段空间智能概览自动驾驶3D⽣成具身智能扩展现实(XR)世界模型• 长期愿景自动驾驶有最成熟的空间智能数据体系,核⼼在于⼤量车队的数据积累,同时可以构建⼤模型的数据闭环,通过正反馈加速驱动模型迭代11信息来源:量⼦位智库,1)以特斯拉FSD为例数据积累规模数据构成精简度• 数据规模⼤:特斯拉FSD在过去3年已经积累30亿英里的驾驶里程,同时每日里程积累数量已经突破1千万英里,并随着特斯拉车队规模扩⼤加速增长,Waymo的模拟⾏驶里程已经达到了150亿英里,累计⾏驶里程超2千万英里数据分布多样性数据闭环成熟度• 精简度中:视觉驾驶数据最关键,纯视觉之外的技术路线也会采用激光雷达、毫米波雷达等传感器,但纯视觉的精简路线已被证明有效• 地图数据和定位数据相对简单,不构成瓶颈• 多样性中:地域范围包括不同国家/地域,城市/乡村,频次分布来看包括不同⾼频日常和长尾场景,时间范围包括白天/夜晚,季节性,⾼峰/非⾼峰等• 数据反馈循环强:有⼤规模车队搭载自动驾驶系统测试、收集数据用于模型训练,再将新模型投放市场进⾏OTA升级,重复数据收集、反馈的闭环描述构成自动驾驶数据量级11202220232024~2亿公里~13亿公里~50亿公里自动驾驶数据来源2真实数据• 最主要的训练数据,涵盖⼤量复杂多样的环境变化,保真度最⾼合成数
[北京极客伙伴科技]:空间智能研究报告,点击即可下载。报告格式为PDF,大小11.91M,页数27页,欢迎下载。