产业策略自动驾驶系列:FSDV12将迎重大架构变化 “端到端自动驾驶”影响几何?
证券研究报告 请务必阅读正文之后第 23 页起的免责条款和声明 FSD V12 将迎重大架构变化,“端到端自动驾驶”影响几何? 产业策略自动驾驶系列|2023.10.10 ▍ 中信证券研究部 ▍ 核心观点 连一席 产业策略 首席分析师 S1010523020002 沈思越 产业策略分析师 S1010523030001 特斯拉多次表示 FSD V12 将实现全新的“端到端自动驾驶”,模型架构将迎来重大变化。对于新架构的技术细节和潜在影响,市场仍有较多疑惑和分歧。根据特斯拉对外披露的信息及马斯克在 X 平台(前推特)发布的信息,我们推测特斯拉内部目前有两条“端到端”路线同步在研:1)级联式端到端神经网络;2)World Model。我们认为,FSD V12 是前者的可能性较大,有望于明年初落地,以更好地实现 L3 能力;World Model 仍较为新兴,但中长期有望成为自动驾驶乃至具身智能领域的基础模型,可类比 GPT 之于 LLM,或对行业格局产生颠覆性影响。 ▍可能性 1(较高):级联式端到端神经网络,大幅提升训练效率和性能上限,有望助力自动驾驶系统更好地实现 L3 能力,但能否迈向 L4 仍待观望。 技术本质:系统从输入到输出,全程使用神经网络算法,无需任何人工规则介入。当前,自动驾驶模型多为模块化架构,感知预测、规划、控制等不同任务分属于多个不同的小模型,且下游规控环节普遍仍以规则为主。而“端到端”神经网络在输入图像后,可直接输出转向、刹车、加速等控制指令。为提升训练效果,“端到端”的大神经网络可能由多个小的子神经网络级联而成。但与传统模块化架构用“规则”连接模块不同,级联式神经网络的子模块是以“神经网络”的方式自行训练堆叠,因此可通过数据驱动优化整个端到端模型,避免“局部最优,而非全局最优”的困境。 潜在影响:更好地实现 L3 能力。端到端/神经网络的核心好处在于模型迭代的关键由“工程师”变为了更易于规模化的“数据和算力”,因而训练效率和性能上限有望得到显著提升。落到实处,我们认为端到端方案所展示出的性能潜力有望大幅提升自动驾驶系统的接管水平,从而实现真正无可争议的 L3 能力(例如达到每周接管 1 次)。但端到端模型的“黑盒”问题目前产业界尚未有十分成熟的解决方案,因此我们认为,其最终能否迈向追求极致安全性的 L4 全无人驾驶仍待观望。 发展进度:有望搭载于 FSD V12,明年初正式落地的可能性较大。2023 年 8月 26 日,马斯克在 X 平台(前推特)进行了 FSD V12 demo 的驾驶直播。我们认为,尽管直播中展现出的能力距离正式推送给消费者仍有距离,但可基本推断当前的 V12 模型已十分接近端到端,再配合特斯拉在数据和算力上的巨大投入,V12 接下来至年底的迭代速度有望大幅加快。 ▍可能性 2(较低):World Model,有望打造自动驾驶领域的基础底座,引领视觉的 GPT 时刻;目前或仍处于 GPT-1 阶段,但发展速度值得期待,中长期看或对行业格局产生颠覆性影响。 技术本质:无需标注、自监督的预训练模型。World Model 可生成自动驾驶相关的连续帧视频场景,其本质是对视频中的丰富语义以及背后的物理规律进行学习,从而对物理世界的演化产生深刻理解。基于 World Model 所提供的丰富语义信息以及对世界强大的理解力,自动驾驶模型的感知与预测能力有望得到显著提升,规划、控制等下游任务也有望迎刃而解。 潜在影响:为自动驾驶提供了一套未经证明的新路径,若得以走通,将对行业产生较大颠覆。中短期来看,World Model 或将主要应用于数据合成和仿真模拟环节,厂商的车队规模对算法训练的重要性或有所下降,数据闭环的框架也将有所改变。长期来看,World Model 有潜力成为自动驾驶乃至具身智能领域的基础模型,可类比 GPT 为所有 NLP 问题提供了一个通用解。考虑到更标准 产业策略自动驾驶系列|2023.10.10 请务必阅读正文之后的免责条款和声明 2 化的解决方案和更巨大的资金投入(资金需求或是这一代 BEV+Transformer 方案的数倍),行业内有望出现少数几家强大的 World Model 基础模型层平台方,以 SaaS 或 API 的方式为主机厂/运营方提供自动驾驶能力,行业格局和合作模式或将发生较大变化。 发展进度:仍处早期,但发展速度值得期待。我们认为,特斯拉、Wayve 等公司不约而同地在今年推出 World Model,很大程度上是受到了 GPT 的启发。目前,World Model 或仍处于 GPT-1 的阶段,但考虑到目前行业整体对“大模型”潜力的强烈共识、算力的升级以及以特斯拉为代表的玩家此前积累的海量数据,我们认为 World Model 从 0 到 1 的爆发或较 ChatGPT 更快(OpenAI 从 GPT-1至 GPT-3.5 共历经 4 年)。 ▍国内玩家距离“端到端”仍有较远距离。无论是级联式端到端神经网络还是World Model,我们总结其核心壁垒皆在于:1)专业的 AI 人才团队,2)海量的视频数据,以及 3)巨大的算力投入。国内主机厂从 2023 年开始陆续实现这一代“BEV+Transformer”架构的量产上车,尽快实现“脱图”以及尽可能多地“开城”是国内智驾车企当前的重点。 对于下一代的“端到端”技术路线,国内主机厂目前最快也仍处于早期预研阶段,且在人才、数据、算力三方面较特斯拉皆有较大差距,因此从预研到上车乐观看或也需 3 年左右的时间。 而对于前景更不明朗的 World Model(或需等待特斯拉有更多成果展示),面临着较大销售和交付压力的国内主机厂,在新技术的人才和资源投入上或也有所保留。相较之下,我们认为,特斯拉、华为等行业巨头在资金和资源上更占优势;而 WAYVE、极佳科技等初创企业的目标和精力更为聚焦,也有望吸引到更多的 AI 人才,类似于当年的 OpenAI。 ▍风险因素:特斯拉端到端技术路线发展不及预期;特斯拉 FSD V12 推送进度不及预期;云端训练算力出现较大紧缺;中国玩家追赶进度不及预期等。 产业策略自动驾驶系列|2023.10.10 请务必阅读正文之后的免责条款和声明 3 目录 报告缘起 ........................................................................................................................... 5 可能性 1:级联式端到端神经网络,大幅提升训练效率和性能上限 ................................. 6 本质:全程使用神经网络,无需人工规则介入.................................................................. 6 影响:有望助力 FSD 更好地实现 L3 能力,但能否迈向 L4 仍待观望 .............................. 8 进度:FSD V12 搭载概率大,有望
[中信证券]:产业策略自动驾驶系列:FSDV12将迎重大架构变化 “端到端自动驾驶”影响几何?,点击即可下载。报告格式为PDF,大小3.86M,页数24页,欢迎下载。