智能驾驶行业专题:Robo-X的产业趋势、市场空间和产业链拆解
请务必阅读正文之后的免责声明及其项下所有内容证券研究报告 | 2025年12月15日Robo-X的产业趋势、市场空间和产业链拆解智能驾驶行业专题证券分析师:唐旭霞0755-81981814tangxx@guosen.com.cnS0980519080002行业研究 · 深度报告 汽车 · 汽车零部件投资评级:优于大市证券分析师:杨钐0755-81982771yangshan@guosen.com.cnS0980523110001请务必阅读正文之后的免责声明及其项下所有内容核心观点⚫ Robo-X:政策+技术+成本催化下,L4预计在2026年迎元年时刻。监管机构的支持和政策利好将推动无人驾驶汽车的商业化进程,强化学习+世界模型构建L4技术底层,随着L2/L2+级自动驾驶汽车渗透率持续增长,带动智能驾驶相关的零部件成本下降,而L4和L2/L2+的零部件存在共通性,L4级自动驾驶硬件的成本进一步降低,Robo-X预计在2026年迎元年时刻。⚫ Robo-X行业:长赛道,大空间,自主Robo-X厂商崛起。市场空间方面,2030年,参考文远知行招股说明书,全球L4市场空间上万亿,国内市场方面,Robotaxi:国内出租车和网约车年化市场规模2360亿元,2025年Robotaxi在共享出行里面占比0.6%;Robovan:国内可替代轻/微卡潜在市场空间为1645亿元,2025年Robovan在物流配送车里面占比2%;Robotruck:假设2024、2030年国内Roboruck年销量0.1、6万台,重卡售价150万元,对应Robotruck国内2024、2030年市场规模分别15亿元、900亿元;Robobus:国内公交年化市场规模150-350亿元,Robobus在公交车里面占比2%以内;Robosweeper:国内环卫车年化市场规模113-225亿元,2025年Robosweeper在环卫车里面占比4.7%。竞争格局方面,Robotaxi方面,自动驾驶公司文远知行、小马智行、萝卜快跑商业化落地加速;Robovan方面,代表性玩家有九识智能、新石器、白犀牛、川行致远(DSXW股子公司)、佑驾创新、驭势科技等;Robotruck方面,玩家有希迪智驾、易控智驾、小马智行、主线科技、西井科技等;Robobus方面,玩家有文远知行、轻舟智航等;Robosweeper方面,代表性玩家有仙途智能、深兰科技等。⚫ 投资建议:Robo-X整车销售/运营方面,自主Robo-X玩家崛起,我们推荐小马智行、文远知行、小鹏汽车,建议关注佑驾创新。零部件方面,我们基于数据流角度进行推荐,数据获取环节,推荐禾赛科技、速腾聚创,建议关注图达通;数据传输环节,推荐沪光股份;数据处理环节,推荐科博达、华阳集团、均胜电子、地平线机器人-W、黑芝麻智能;数据应用环节,推荐保隆科技、伯特利、耐世特。⚫ 风险提示:智能驾驶推进不及预期风险;产业政策支持力度不及预期风险。请务必阅读正文之后的免责声明及其项下所有内容03RobovanRobo-X:政策+技术+成本催化下,L4预计在2026年迎元年时刻0106Robosweeper目录Robotruck0407投资建议和风险提示Robotaxi02Robobus05请务必阅读正文之后的免责声明及其项下所有内容⚫ 强化学习(Reinforcement Learning,RL)和模仿学习(Imitation Learning,IL)是机器学习中的两种重要方法。模仿学习通过监督的方式训练模型,以模拟人类驾驶行为,该方法旨在从专家演示中学习驾驶风格,这些演示作为模型训练的案例。强化学习是一种通过智能体与环境进行交互来学习最优策略的机器学习方法,智能体在环境中执行动作,环境会根据智能体的动作反馈一个奖励信号,智能体的目标是通过不断尝试不同的动作,以最大化长期累积奖励。基于模仿学习的自动驾驶系统在训练过程中无法覆盖所有可能的驾驶情景,而强化学习通过与环境的互动,随着时间的推移最大化累计奖励,智能体根据自身行为做出驾驶决策,以获取奖励或避免惩罚。另一方面,强化学习通过探索与利用的策略来改进驾驶模型。强化学习是智能体与环境不断交互学习的过程,因此不存在模块化自动驾驶系统中各个模块之间的相互依赖问题,以及模仿学习中对专家行为的依赖问题,也避免了数据稀缺,数据不平衡等间题。⚫ 从L2级辅助驾驶到L4级无人驾驶,要求智能驾驶系统具备"远超人类驾驶员"的场景处理能力。传统L2级模仿学习存在以下局限:1)能力边界固化:L2级优化越精细,系统越依赖特定场景的统计规律,与L4级"泛化决策"需求背道而驰;2)意图理解缺失:模仿学习仅能复现"驾驶动作",无法推导"驾驶意图"(如变道的时机选择、对行人意图的预判);3)开环训练缺陷:端到端模型的"感知-控制"直接映射缺乏"中间推理"环节,无法模拟人类基于经验的直觉判断。世界模型通过构建"虚拟驾驶沙盒",让策略在仿真环境中完成"假设-验证-优化"的闭环:"世界模型是生产车端模型的数字工厂,L4级技术的核心差异在于'工厂'的仿真精度"),从根本上解决了上述问题。此外,参考全球计算机视觉学术顶会 ICCV 2025 上,理想汽车自动驾驶高级算法专家詹锟《世界模型:让我们从数据闭环走向训练闭环》观点,在辅助驾驶任务上,很多场景的数据是稀疏的,自然采集到的数据不足以训练 AI,但这些少见的场景(CornerCase)正是辅助驾驶需要改进的重点,在构建 L4 级的自动驾驶系统时,这些问题都需要得到解决,有了世界模型的合成数据能力后,AI 模型在训练的数据配比上更为合理,理想的辅助驾驶系统在实际道路表现的稳定性和能力的泛化上均有了很大的改善。技术:强化学习+世界模型构建L4技术底层,2026年预计迎来元年时刻图1:有了世界模型的合成数据能力后,AI 模型在训练的数据配比上更为合理资料来源:机器之心,理想汽车,国信证券经济研究所整理请务必阅读正文之后的免责声明及其项下所有内容⚫ 世界模型分为四个核心部分:1)场景数据生成器:模拟各种驾驶场景;2)驾驶行为评估体系:对驾驶操作的好坏进行判断;3)高真实性的仿真系统:最大程度还原真实世界的复杂场景;4)数据挖掘工具和引擎:提取和分析有价值的数据。技术:强化学习+世界模型构建L4技术底层,2026年预计迎来元年时刻图2:小马智行世界模型运行过程资料来源:公司公告,国信证券经济研究所整理表1:世界模型增强强化学习、交互提示和综合指标特点相关说明强化学习强化学习通过环境交互训练人工智能体,对最优行为给予奖励,对不良行为进行惩罚。这种“从实践中学习”的方式使人工智能体能够逐步改进决策能力,直至达到最佳性能。通过引入人类指导,这一学习过程可进一步优化:领域专家直接识别理想行为,补充甚至替代标准的奖惩系统。这种方法实现了双重优势 —— 训练期间更快收敛(即加速学习过程),同时使人工智能的行为更符合人类价值观和预期。交互提示交互提示作为额外的信息编码层,丰富了模型对环境的理解。这些提示封装了明确注入模型的人类知识和规则。通过对这类信息进行编码,交互提示有助于提升模型的可解释性。例如,交通规则或社会规范可编码为提示,确保模型在交互场景中遵守这些准则。这一特性增强
[国信证券]:智能驾驶行业专题:Robo-X的产业趋势、市场空间和产业链拆解,点击即可下载。报告格式为PDF,大小5.58M,页数67页,欢迎下载。



