汽车行业深度报告:当自动驾驶与机器人共振:详解VLA与世界模型
请务必仔细阅读正文之后的评级说明和重要声明证券研究报告汽车行业深度报告hyzqdatemark投资评级: 看好(首次)证券分析师李泽SAC:S1350525030001lize@huayuanstock.com联系人板块表现:当自动驾驶与机器人共振:详解 VLA与世界模型投资要点:VLA 模型具备成为具身智能基础模型潜力。视觉-语言-动作模型(VLA)代表一类旨在处理多模态输入与输出的模型,通用性是 VLA 模型的核心特点之一,体现在其以多模态大语言模型为底座,具备“理解万物”的能力,VLA 模型的理解能力和多任务泛化能力让模型在不同的应用场景中具备出色表现,展现出超越自动驾驶乃至机器人等单独垂域应用的潜力,有望成为广义具身智能基础模型范式。VLA 模型是自动驾驶向知识驱动、体验优先升级的技术基础。我们认为汽车领域智能化的最终形式是实现驾驶领域的通用人工智能,而非简单的汽车电子软件智能化,这使得汽车从第三人称智能化向第一人称智能化、由数据驱动向知识驱动进化成为自动驾驶进化的未来趋势,而 VLA 模型特别是其中语言类大模型的成功引入则奠定了范式转变的技术基础。底层技术逻辑升维也带动了车端应用焦点由基本功能实现向人车交互性、极端场景通过性等体验提升转变,中期维度看,不同车企自动驾驶的模型性能领先、功能领先将转化为体验领先并重塑汽车行业产品生态,知识驱动范式的智能化模型也将重新定义自动驾驶,行业将真正开启电动智能化下半场角逐。工程化部署能力是当前车端 VLA 核心矛盾。现有车端 VLA 技术路线尚未收敛且工程部署较少,但由于汽车面临的结构场景和任务单一、硬件结构较统一、数据和汽车保有量高、车端算力相对充足等因素,车端 VLA 范式落地前景已经较为明朗。我们认为:1)在汽车 VLA 模型的数据闭环构建过程中,获取良好 3D 中间表征、强化模型长时序记忆能力与端侧计算效率、优化模型架构、构建高保真的云端模拟环境等环节是 VLA 端侧工程部署的关键。2)在模型训练方法上,行为克隆(初步训练端到端模型)+逆强化学习(从专家数据中初始化奖励函数)+强化学习(通过与环境交互改善模型和奖励函数)方案或将成为未来自驾模型训练主流方案。具身智能本质是自动驾驶的升维问题,构建数据闭环是关键。具身智能的场景、任务复杂度更高、本体自由度更高、感知方式更灵活、硬件构型更差异化等因素决定了具身 VLA 模型的数据闭环构建难度远超自动驾驶;但同时智能汽车实质上是物理智能体的具体形式之一,自动驾驶与具身智能在核心的智能化能力即模型构建方法论以及具体的硬件零部件领域有诸多可迁移之处,因此具身智能本质是自动驾驶的升维问题。我们认为,当前以人形机器人为代表的具身智能关键问题在于还无法进行有效的数据采集进而实现数据闭环,而无法 Scaling 的具身模型就无从实现智能化。在当前阶段,标准化与模型性能优化是破局的关键点:1)首先需要标准化,尤其是底层硬件、通信协议的标准化,底层零部件和软件基础标准化是机器人统一构型以进行规模化数据收集破局数据-模型能力的鸡生蛋问题以及壮大行业供应链的关键;2)模型优化核心在于闭环模型构建以及模型物理交互能力建设,其中物理交互能力的引入或是未来人形机器人向真正具身智能体转化的关键。2025 年 07 月 07 日请务必仔细阅读正文之后的评级说明和重要声明第 2页/ 共 46页源引金融活水 润泽中华大地投资建议:建议关注本轮智能化进展较快的整车企业理想汽车、小鹏汽车风险提示:1)新技术迭代风险、2)市场竞争加剧风险、3)宏观经济环境波动风险请务必仔细阅读正文之后的评级说明和重要声明第 3页/ 共 46页源引金融活水 润泽中华大地内容目录1. 自动驾驶模型范式由数据驱动向知识驱动升维.............................................................71.1. 自动驾驶两大趋势:模型数据驱动转向知识驱动、模型功能至上迈向驾乘体验优先71.2. 传统基于规则的模块化算法核心缺陷在于无法 Scaling............................................ 71.3. 端到端模型:自动驾驶从数据驱动向知识驱动演进..................................................91.3.1. 数据驱动的端到端模型面临数据瓶颈....................................................................91.3.2. 多模态大语言模型引入是端到端模型实现知识驱动的关键.................................102. VLA 模型是自动驾驶端到端架构的演进方向..............................................................122.1. VLA 推动自动驾驶从功能迈向体验.........................................................................122.2. 自动驾驶 VLA 模型构建与工程部署面临的主要问题及解决方法............................132.2.1. 3D GS 或是车端实时获取良好 3D 中间特征的途径............................................142.2.2. 强化长时序记忆能力将提升 VLA 模型长程任务规划与解决能力........................ 152.2.3. 优化模型架构与推理机制可以提高端侧计算效率................................................162.2.4. 利用世界模型构建云端仿真环境是模型闭环测试、强化学习的关键.................. 182.3. 自动驾驶典型 VLA 架构..........................................................................................252.3.1. Waymo EMMA:开创性的端到端多模态自动驾驶模型......................................252.3.2. Open Drive VLA 框架的贡献在于模型 3D 环境感知和交互................................ 262.3.3. 小米 ORION 框架引入 QT-Former 模块实现了长时序记忆............................... 282.3.4. 理想 Mind VLA:深度融合空间、语言及行为智能..............................................293. 具身智能本质是自动驾驶的升维问题,构建数据闭环是关键 .....................................3
[华源证券]:汽车行业深度报告:当自动驾驶与机器人共振:详解VLA与世界模型,点击即可下载。报告格式为PDF,大小3.45M,页数46页,欢迎下载。
