工业行业-人形机器人再探讨:具身智能的曙光
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 工业 人形机器人再探讨:具身智能的曙光 华泰研究 机械设备 增持 (维持) 通用机械 增持 (维持) 研究员 倪正洋 SAC No. S0570522100004 SFC No. BTM566 nizhengyang@htsc.com +(86) 21 2897 2228 联系人 王自 SAC No. S0570123070064 wangzi022582@htsc.com +(86) 21 2897 2228 行业走势图 资料来源:Wind,华泰研究 2023 年 7 月 31 日│中国内地 专题研究 大模型为机器人装上“大脑”,具身智能迎来曙光 谷歌 DeepMind 7 月 28 日推出全球首个控制机器人的视觉-语言-动作(VLA)模型 RT-2;斯坦福大学李飞飞教授研究团队 7 月 12 日推出 VoxPoser,通过大语言模型加视觉语言模型指导机器人行动。搭载此类模型的机器人可以像 ChatGPT 一样被操纵,可理解自然语言指令并且无需预定义的运动原语或额外的数据和训练,具身智能迎来曙光(具身智能指具有身体并支持物理交互的智能体,可借助智能算法实现理解推理并与物理世界互动)。大模型的发展使机器人更容易理解人类指令并执行动作以完成更好的交互,在以六维力矩传感器为代表的硬件配合下,人形机器人产业化进度有望加快。 RT-2/VoxPoser 实现自然语言编程,机器人“善解人意” RT-2/VoxPoser 的一大突破是使具身智能机器人可以理解自然语言指令,无需复杂的编程语言便可完成人机交互。RT-2 模型建立在视觉-语言模型(VLM)的基础上,赋予机器人语义理解和基本推理能力,使其可以听懂并自主推理出已灭绝动物(恐龙)和哪种饮料最适合疲惫的人 (能量饮料);李飞飞团队 VoxPoser 模型只需接收到“打开上面的抽屉,小心花瓶!”类似的指令即可执行任务;在华为天才少年彭志辉创业公司智元机器人所发布的视频中,机器人也可根据简单的文字或语音指令对桌面上不同颜色的方块进行选取、调位和叠放等操作。 无需训练即可完成复杂指令,未知场景下 RT-2 模型泛化能力翻倍 新模型的另一大突破是无需预定义的运动原语或额外的数据和训练,模型泛化能力增强,加速机器人通用化。过去算法下实现机器人扔垃圾的动作须训练机器人区分、捡起、扔掉垃圾各个步骤,而 RT-2 可以将网络相关知识传给机器人,使其无需明确的训练即可学会扔垃圾。面对之前从未见过的任务情形,RT-2 成功率达到 62%,泛化性能较 RT-1 提高一倍。VoxPoser 则是在接受环境信息和指令后,由 VLM 编写代码并指导系统生成相应的操作指示地图,再使用动作规划器直接合成操作轨迹,达到在无需额外数据和训练的情况下完成各种任务,如绕过障碍,开瓶子、拔充电线等。 多模态数据是交互基础,力矩传感器加速人形机器人产业化 具身智能重点在于具有身体体验的能力,与环境交互获得视、听、触觉等多模态数据再做出反应,需要模型与传感器等硬件相互配合。李飞飞教授团队在论文中提到,具身智能依赖于外部感知模块,在需要整体视觉推理或理解细粒度物体几何形状的任务中具有局限性,需要更高级的视觉传感器或其他传感方式。根据我们 7 月 28 日发布的《机器人论文前瞻:手部物品姿态估计》,在视觉感知表现不佳时机器人可借助六维力/力矩传感器和本体感知方法完成对物体的姿态估计和几何形状理解。因此在以六维力矩传感器为代表的硬件配合下,人形机器人产业化进度有望加快。 风险提示:实际场景应用困难,模型泛化能力不足,新技术出现。 (22)(16)(10)(3)3Aug-22Nov-22Mar-23Jul-23(%)机械设备通用机械沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 工业 附录 图表1: RT-2 可理解自然语言指令并且无需预定义的运动原语或额外的数据和训练 资料来源:《RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control》(Google DeepMind,2023),华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 3 工业 免责声明 分析师声明 本人,倪正洋,兹证明本报告所表达的观点准确地反映了分析师对标的证券或发行人的个人意见;彼以往、现在或未来并无就其研究报告所提供的具体建议或所表迖的意见直接或间接收取任何报酬。 一般声明及披露 本报告由华泰证券股份有限公司(已具备中国证监会批准的证券投资咨询业务资格,以下简称“本公司”)制作。本报告所载资料是仅供接收人的严格保密资料。本报告仅供本公司及其客户和其关联机构使用。本公司不因接收人收到本报告而视其为客户。 本报告基于本公司认为可靠的、已公开的信息编制,但本公司及其关联机构(以下统称为“华泰”)对该等信息的准确性及完整性不作任何保证。 本报告所载的意见、评估及预测仅反映报告发布当日的观点和判断。在不同时期,华泰可能会发出与本报告所载意见、评估及预测不一致的研究报告。同时,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。以往表现并不能指引未来,未来回报并不能得到保证,并存在损失本金的可能。华泰不保证本报告所含信息保持在最新状态。华泰对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本公司不是 FINRA 的注册会员,其研究分析师亦没有注册为 FINRA 的研究分析师/不具有 FINRA 分析师的注册资格。 华泰力求报告内容客观、公正,但本报告所载的观点、结论和建议仅供参考,不构成购买或出售所述证券的要约或招揽。该等观点、建议并未考虑到个别投资者的具体投资目的、财务状况以及特定需求,在任何时候均不构成对客户私人投资建议。投资者应当充分考虑自身特定状况,并完整理解和使用本报告内容,不应视本报告为做出投资决策的唯一因素。对依据或者使用本报告所造成的一切后果,华泰及作者均不承担任何法律责任。任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。 除非另行说明,本报告中所引用的关于业绩的数据代表过往表现,过往的业绩表现不应作为日后回报的预示。华泰不承诺也不保证任何预示的回报会得以实现,分析中所做的预测可能是基于相应的假设,任何假设的变化可能会显著影响所预测的回报。 华泰及作者在自身所知情的范围内,与本报告所指的证券或投资标的不存在法律禁止的利害关系。在法律许可的情况下,华泰可能会持有报告中提到的公司所发行的证券头寸并进行交易,为该公司提供投资银行、财务顾问或者金融产品等相关服务或向该公司招揽业务。 华泰的销售人员、交易人员或其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本报告意见及建议不一致的市场评论和/或交易观点。华泰没有将此意见及建议向报告所有接收者进行更新的义务。华泰的资产管理部门、自营部门以及其他投资业务部
[华泰证券]:工业行业-人形机器人再探讨:具身智能的曙光,点击即可下载。报告格式为PDF,大小0.84M,页数5页,欢迎下载。



