特斯拉(TSLA.US)深度跟踪报告:如何看待特斯拉自动驾驶的纯视觉技术路线?
证券研究报告 请务必阅读正文之后第 25 页起的免责条款和声明 如何看待特斯拉自动驾驶的纯视觉技术路线? 特斯拉(TSLA.O)深度跟踪报告|2022.11.25 中信证券研究部 核心观点 陈俊云 前瞻研究首席 分析师 S1010517080001 许英博 科技产业首席 分析师 S1010510120041 贾凯方 前瞻研究分析师 S1010522080001 刘锐 前瞻研究分析师 S1010522110001 特斯拉作为全球整车厂中独树一帜的存在,一直坚持纯视觉的自动驾驶方案,因为其较低的成本、更快的商业化路径引来了一众追随者,但市场的诸多担忧仍一直存在。当前市场主要疑虑在于:纯视觉方案的障碍物感知能力较差,同时易受到环境因素的影响,从而导致安全问题。我们分析认为,特斯拉算法设计基于第一性原理,借助 BEV 视觉算法与栅格网络实现三维空间鸟瞰视图构建,并融入时间序列特征,极大程度拉近了与激光雷达方案间的差距,而环境端的问题则可以通过驾驶员的主观判断最大程度避免;数据端借助庞大的现役车辆,特斯拉亦通过影子模式、无标注数据技术等,驱动自身感知、决策、规划算法的不断优化&迭代。特斯拉芯片+算法+数据一体化融合带来的系统性优势以及纯视觉方案的成本优势、稳定性&可扩展性带来的更广阔的商业化道路等,有望使得特斯拉自动驾驶技术在全球市场保持持续领先,并不断强化自身在全球电动车市场的领先地位。受 Twitter 事件、市场对短期全球汽车销量担忧等因素影响,特斯拉近期股价表现疲软,我们持续看好特斯拉中长期投资价值,公司当前股价对应 2022/23/24 年 PE(Non-GAAP)为 41/30/21x,建议投资者积极关注特斯拉短期股价大幅回调带来的建仓机会。 ▍报告缘起:市场对特斯拉纯视觉路线存在担忧,包括障碍物识别精准度、鲁棒性等方面。特斯拉自 2022 年 2 月开始,在所有北美销售车型上均取消了毫米波雷达,开启纯视觉方案自动驾驶。国内造车新势力蔚来、小鹏、理想均采用了“摄像头+雷达+高精地图”的方案。以大众为例的传统车企当前采用“摄像头+雷达”方案,未来预计在部分车型搭载激光雷达。纯视觉方案因为取消了激光雷达,采用纯摄像头作为数据输入,更难掌握障碍物三维位置信息。同时摄像头的输入高度收到光照等环境影响,在逆光、大雪遮挡的情况下会造成辨识困难。以上这些等问题,引起了市场对特斯拉纯视觉方案安全性上的持续担忧。本篇文章将结合特斯拉的最新技术情况,包括相关论文以及近两年特斯拉 AI Day 上公布的技术细节,就特斯拉自动驾驶纯视觉路线技术细节、潜在优劣势等,进行系统分析和讨论。 ▍特斯拉纯视觉算法:结合数据引擎能力、神经网络模型帮助算法迭代追赶与激光雷达的感知差距。1)感知端 Occupancy Network:加入栅格网络,将识别出的物体按照动、静态快速分类,并直接输出到规划层。本次公布的 Occupancy Network 是特斯拉在纯视觉感知方案上进一步的探索成果。Occupancy 并非是BEV 鸟瞰图的替代品,而是在 BEV 的基础上对高度方向进行了进一步扩展,在增加了一个维度后,Occupancy 将 BEV 的 2D 栅格变为了 3D,进而生成了Occupancy Features 代替 BEV Features,在高速移动环境中表现已经追平甚至超过了激光雷达。2)静态识别 Vector Lane:解决复杂城市道路中道路线与路牌辨认。在前序处理上,特斯拉首先加入了 Map Component 模块,使用了低精地图中关于车道线的几何拓扑关系以及车道线宽度、车道线数量等信息,并整合编码给到 Vector Lane 模块。Vector Lane 模块采用了一种类似 Transformer的架构,这样生成的道路线模型会根据实时感知到的信息不断进行微调,帮助FSD 获得非常复杂路口的道路连接关系。3)道路规划:新方法搜索决策树,单次搜索时间缩短到 100us。特斯拉的决策算法基于其感知算法构建的向量空间,借助增量树搜索来完成整体决策。数据驱动决策树生成模型使用 Tesla 车队中人类驾驶员驾驶数据和在无时间约束的离线条件下规划的全局最优路径最为真值进行训练,能够在 100us 内生成一个候选规划路径。4)数据引擎:强调数据延展性,避免对高精地图的依赖。特斯拉数据引擎自成闭环,由标配自动驾驶硬件的车队进行大量数据采集,到通过各种规则及影子模式下人脑 AI 差异(如接管、行为差异)构成的触发器引发数据回传筛选有语义信息的数据回传云端, 仅供内部参考,请勿外传 特斯拉(TSLA.O)深度跟踪报告|2022.11.25 请务必阅读正文之后的免责条款和声明 2 云端通过工具对错误的 AI 输出进行纠正,放入数据集群,然后利用这些有效数据训练车端在线模型和云端离线模型,最终通过影子模式部署回车端进行新的测试比较不同版本指标,直到最后经过验证的新模型部署车端,完成一个完整的数据驱动迭代开发循环。这整个数据闭环无疑是当今数据驱动系统应用的典范,被其他厂商争相模仿,却难以超越,核心因素在于特斯拉庞大的车辆保有量以及系统化的工程师思维。 ▍纯视觉技术方案优劣势:感知方面的差距可以通过算法&数据不断迭代缩小,激光雷达因为同步&取信问题可能事倍功半。1)在感知方面,纯视觉方案与激光雷达的差距可以通过系统工程与技术手段大幅缩小。特斯拉通过整体性的设计,结合全栈式自研的硬件与配套软件,将各个细节性能的细节优化到极致。在车身有限算力、内存与带宽的场景下,以低延迟从数据引擎出发到迭代式评估系统,从而大规模、批量化完成这一系列任务。在加入栅格网络后,特斯拉的纯视觉方案在快速移动场景下的障碍物辨识能力已经追平甚至超过了激光雷达方案。2)多传感器融合方案中,摄像头也是数据输入的重要一环,在光源受影响的情况下,多传感器融合方案中的摄像头同样会受到严重影响,这个时候如何在多传感器间做采信是一个额外工作。此外,在极端天气的条件下,激光雷达通过发射光束进行探测,受环境影响较大,光束受遮挡后就不能正常使用,此时多传感器方案中更多需要依靠毫米波雷达进行探测。但毫米波雷达本身的精度过低的问题让其也无法很好地解决这一问题,因此面对极端天气等外在情况,目前无论是哪个方案,更多地仍然需要依靠驾驶员自己的判断。 ▍商业化落地:纯视觉方案的闪光点。1)纯视觉方案的最大优点在于整体的成本,特斯拉八个摄像头的硬件成本仅为 200 美元左右,而一套激光雷达的成本在3000-10000 美元不等。Troy Teslike 数据显示,目前 22Q1 特斯拉 FSD 全球渗透率约 7.3%,较 2019Q4 高峰时期 35.7%的渗透率,降低约 28.4pcts。主要原因是 Model 3/Model Y 等价格较低车型的销量占比持续提升。依据特斯拉历年的销量数据、FSD 渗透率、FSD 价格情况,我们测算特斯拉 FSD 在 2019-2021年的营业收入分别为 8.3/8.7/9.4 亿美元,其中营收占比分别为 3.4%、2.8%、1.7%。2)纯视觉方案的第二个优点在于系统的统一性与可扩展
[中信证券]:特斯拉(TSLA.US)深度跟踪报告:如何看待特斯拉自动驾驶的纯视觉技术路线?,点击即可下载。报告格式为PDF,大小2.9M,页数26页,欢迎下载。