机械设备行业专题研究:机器人大脑是商业化焦点,Sim2real或成主流训练方案
证券研究报告 | 行业专题研究 请仔细阅读本报告末页声明 gszqdatemark 机械设备 机器人大脑是商业化焦点,Sim2real 或成主流训练方案 从 LLM 到 VLM 再到 VLA 等,模型将机器人泛化性、执行动作的精确度、物理感知等性能逐步提高。LLM 解决了大规模文本数据训练问题,VLM 跨模态突破了文本的限制将图像视频也融入至大模型中,VLA 则跨越了图像视频/文本的感知理解与机器人动作之间的鸿沟。早期 VLA 更多侧重视觉信息的输入,随着越来越多用于人形机器人中,触觉(Touch,通过力/触觉传感器获取的压力/摩擦力/纹理等信息)输入端也被加入到模型中,这可以提升模型的鲁棒性。各类 VLA 模型的性能也在逐步提升:RT-1 发布时只回答了数据集建构和模型设计问题,并没有表现过多的泛化性和迁移性;RT-2 则表现出了强大的泛化性,但其数据收集成本较高;ViLLA 则可以采用无标注的视频来训练,同时也解决了之前机器人生产的动作不符合物理学问题。 当前虚拟走向现实仍然存在巨大鸿沟,英伟达 Sim2Real 或为未来主流训练方式。Sim2Real 的技术原理为利用合成数据生成技术,通过场景随机化、参数调整等方式让机器人接触大量不同数据积累经验,而后将仿真生成的精准数据与现实采集的少量数据输入 Cosmos,生成更多样、更贴近真实情况的数据,用于训练机器人模型,使其能更好地适应现实世界。Sim2Real 的核心纽带是串联 3 台计算机,第一台是 AI 超级计算机,为机器处理信息提供算力基础;第二台是仿真计算机,以 Omniverse 和 Isaac Sim 为核心,让机器在虚拟世界掌握感知与交互能力;第三台是物理 AI 计算机,由 GROOT、Cosmos 和 Jetson Thor 构成,负责让机器人在真实世界执行任务。银河通用发布的 DexonomySim 开源合成数据集即是采用虚拟数据与真实数据合成而来,真实数据为辅(量少),虚拟数据为主。 海外 Tesla Optimus 采用的 AI 模型拟人化程度高,国内北京通用人工智能研究院有不错进展。Tesla Optimus 的 AI 集成高度借鉴 FSD((核心在于纯视觉和单一神经网络架构),并于 xAI 的 Gork 模型(处理自然语言和情感互动)深度融合,输入原始图像就可以直接规划出人类想要的动作执行,不依赖于激光雷达类似的点云图,拟人化程度高,且在尝试让机器人可以感知自己的身体物理特征(如手臂有多长等)。北京通用人工智能研究院的科研团队提出了全球首个“力位混合控制算法”的统一理论,无需使用传感器,相关任务成功率较只使用位置控制的策略提高了约 39.5%。银 河 通 用 发 布 全 球 首 个 灵 巧 手 功 能 性 抓 取 合 成 大 数 据 集 — —DexonomySim,推动具身智能走向实际应用。 投资建议:建议关注有涉及相关软硬件业务的上市公司如品茗科技(北京通用人工智能研究院)等。 风险提示:机器人应用模型开发不及预期风险,数据质量和数量不及预期的风险,时间推移风险,样本误差风险。 增持(维持) 行业走势 作者 分析师 张一鸣 执业证书编号:S0680522070009 邮箱:zhangyiming@gszq.com 分析师 何鲁丽 执业证书编号:S0680523070003 邮箱:heluli3652@gszq.com 相关研究 1、《商业航天火箭端 专题报告:下半年密集首发试射,开启商业航天元年》 2025-08-13 2、《工程机械:国内外大周期均向上,利润弹性大》 2025-06-17 3、《机械设备:触觉:机器人的下一个超级赛道》 2025-03-02 -10%2%14%26%38%50%2024-102025-022025-062025-10机械设备沪深3002025 10 26年 月 日 gszqgszqdadatemarkrk P.2 请仔细阅读本报告末页声明 内容目录 LLM/VLM 到 VLA 再到世界模型,人形机器人“大脑”发展迅猛 ................................................................... 3 全球人形机器人模型各异,Tesla optimus 模型拟人化程度高 ....................................................................... 8 风险提示 ..............................................................................................................................................15 图表目录 图表 1: LLM 功能 ................................................................................................................................. 3 图表 2: LLM 工作机制 ........................................................................................................................... 3 图表 3: VLM 功能示例 ........................................................................................................................... 4 图表 4: 训练使用 PrefixLM 技术的 VLM 的示例 ......................................................................................... 4 图表 5: RT-1 的架构、数据集与评估概况 ................................................................................................ 5 图表 6: RT-2 的训练中使用的动作字符串的表示形式 ................................................................................ 5 图表 7: Magma 工作原理 ................................................................................................
[国盛证券]:机械设备行业专题研究:机器人大脑是商业化焦点,Sim2real或成主流训练方案,点击即可下载。报告格式为PDF,大小3.08M,页数16页,欢迎下载。



