虚拟数字人行业专题报告：有“智”者事竟成

数字经济行业系列报告2023年12月05日中航证券研究所发布证券研究报告请务必阅读正文后的免责条款部分行业评级：增持虚拟数字人行业专题报告：有“智”者事竟成中航证券社会服务团队分析师：裴伊凡证券执业证书号：S0640516120002邮箱：peiyf@avicsec.com虚拟数字人应用框架资料来源：中航证券研究所整理图表1：虚拟数字人行业逻辑框架人物形象、语音生成、动画生成、音视频合成显示、交互演变升维应用技术变为现实AI加持下实现“智”变迎合下游需求，变现多元技术底座政策支持建模、驱动、渲染虚拟数字人生成大模型等AI赋能虚拟人生产流程虚拟人应用行业加速发展需求端供给端B端为核C端为辅多类型、千行百业的数字人商业模式：订阅费用、根据产出收费和出售API接口等电商教育文旅政企务游戏影视媒体泛娱乐供需共振赋能金融军事3演进：技术突破，从概念变成现实01PART1.1 “虚拟数字人”的源起◼GPT带来智能化变革，驱动虚拟数字人产业快速发展：虚拟数字人行业的发展与底层技术的突破进步密不可分，可根据AI技术及其基础设施能力突破情况分为四个阶段，即萌芽期、探索期、初级阶段与成长阶段。2023年GPT-4横空出世后，数字人朝着智能化、便捷化、精细化、多样化方向发展，进入加速增长阶段。典型事件技术进展时间阶段尝试将虚拟人物引入到现实世界技巧以手绘为主手绘技巧被CG、动作捕捉等计算机技术颠覆突破技术革新造价不菲深度学习算法取得突破，数字人制作过程得到有效简化局限在单一场景朝着智能化、便捷化、精细化、多样化发展技术全面提升与突破20世纪80年代，英国推出“第一位计算机生成的电视节目主持人—Max Headroom”，但实际上该角色是由真人扮演在特定拍摄环境下呈现的。1977年乔治-卢卡斯导演的《星球大战》运用CG技术构建大量虚拟场景。1995 年，由皮克斯制作的《玩具总动员》成为第一部完全通过 CG 技术制作的电影。萌芽期探索期初级阶段成长阶段2001年上线的《指环王》中的“咕噜”角色就是运用CG以及动作捕捉技术制作的虚构人物。2007年，日本推出的“初音未来”是基于语音合成引擎技术的虚拟女性歌手，在全球掀起广泛影响。2011年，一位名为Ami Yamato的YouTuber上传了第一支以虚拟形象为主角的视频。2014年，微软Bing中国团队发布第一款智能聊天机器人—微软小冰，融合了自然语言处理、计算机语言和计算机视觉等技术的完备的人工智能底层框架。2018年，搜狗与新华社联合发布全球首个全仿真智能AI支持人。2018年，英伟达发布StyleGAN，该应用可自动生成高清逼真的人脸照片。2021年，燃麦科技发布国内首个3D写实虚拟人物—AYAYI，在电商、营销等领域，带来了长足的经济效益。2022年，气象局以主持人冯殊作为训练对象，依托小冰公司的框架推出气象服务AI虚拟人—冯小殊2023年，OpenAI发布GPT-4多模态模型，完善“事实性、可控性和拒绝超越边界”方面。资料来源：中国人工智能产业发展联盟、光明网、量子位、新华网等，中航证券研究所整理图表2：虚拟数字人行业发展历程1.2 “虚拟数字人”的技术底座◼ 虚拟数字人怎么生成的？虚拟数字人系统一般情况下由人物形象、语音生成、动画生成、音视频合成显示、交互等五个模块构成，其核心技术可归纳为建模、驱动、渲染三大流程。资料来源：量子位、中国人工智能产业发展联盟，中航证券研究所整理图表3：虚拟数字人的制作流程虚拟形象设计策划原画设计人物建模绑定生成内容算法驱动手工建模扫描建模真人语音AI建模合成语音骨骼绑定混合变形绑定表演捕捉真人交互智能交互训练各类驱动模型内容制作驱动实时渲染离线渲染真人驱动建模驱动/动作捕捉渲染1.2 “虚拟数字人”的技术底座资料来源：中国人工智能产业发展联盟、中国通信院等，中航证券研究所整理图表：虚拟数字人的制作流程◼ 技术层面，虚拟人制作涉及人工智能、CG、虚拟现实等多个技术领域，根据制作环节可归纳为建模、驱动、渲染三大关键技术。⚫ 建模：相机阵列扫描静态重建为主流，动态光场重建为发展重点；⚫ 驱动：智能合成、动作捕捉为虚拟人主流动作生成方式；⚫ 渲染：硬件与算法不断突破，渲染真实与实时性和画面分辨率大幅提升。图表4：虚拟数字人的技术架构建模适用于静态目标静态扫描动态扫描结构光扫描搭建相机阵列扫描重建技术类型技术分类人体动态三维重建光场成像核心特点高速拍照扫描采集动态数据，可重建运动信息存储光线的方向和角度，产出反射和阴影视频类型驱动2D视频3D视频数学表达动作形式像素表达BlendShape向量表达动作有限动作灵活表现形式只呈现正面可呈现三维立体形象动作捕捉惯性捕捉计算机视觉捕捉光学捕捉抗遮挡精度对环境要求硬件成本算法开发难度高低低低高低高低低高中低中低高方案渲染离线渲染实时渲染渲染方式长短多少高欠佳渲染时间计算资源渲染质量1.3 “虚拟数字人”的分类图表5：虚拟数字人的分类资料来源：中国人工智能产业发展联盟、量子位、华丽智库、央广网、中国经济网、SDI数字创新等，中航证券研究所整理◼ 虚拟人可按技术、商业模式、结构组成、角色设计、设计风格和产品应用等多个维度进行分类。➢ ①技术类型：算法驱动型（实时AI和捏脸技术）和真人驱动型（动作捕捉）；②商业模式：IP类型（KOL、歌舞、品牌、娱乐偶像、明星分身）和非IP类型（功能、学术、身份）；③角色设计：完美偶像型、前沿实验型、真实生活型等多种类型；④产品应用：服务型（提供功能和服务）和身份型（在特定身份或角色中应用）；⑤设计风格：二次元动漫化、类人渲染、超写实和未来科幻等；⑥视觉维度：2D型和3D型算法驱动型按技术划分AI实时或捏脸真人驱动型动作捕捉IP类型按商业模式划分KOL型歌舞型品牌型偶像型分身型非IP类动作捕捉按角色人设划分完美偶像型前沿实验型真实生活型智能助手型行业专家型按产品应用划分身份型服务型按视觉维度划分3D型2D型按设计风格划分二次元动漫化类人渲染超写实未来科幻◼ 按驱动方式分类：⚫ 真人驱动型（动作捕捉）：通过真人（俗称皮套人/中之人）来驱动数字人，生成的往往是一个静态模型，主要原理是真人根据视频监控系统传来的用户视频，与用户实时语音，同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上，从而与用户进行交互，例如翎_Ling（来自EE-Media）、小C（来自百度智能云）等；⚫ 算法驱动型（AI实时或捏脸）：通过智能系统自动读取并解析识别外界输入信息，根据解析结果决策虚拟数字人后续的输出文本，然后驱动人物模型生成相应的语音与动作来使虚拟数字人跟用户互动，该人物模型是预先通过AI技术训练得到的，基于深度学习模型的三维场景表达和对应的神经渲染管线，可以自驱动学习模特说话时的唇动、表情、语音以及姿态和动作等，例如天妤（来自元圆科技）、希加加（来自百度）等。资料来源：世优科技、微媒数字会议、新浪网、央视网、同花顺财经、封面新闻等，中航证券研究所整理图表6：真人驱动型 VS 算法驱动型虚拟数字人 1.3.1 真人驱动型 VS 算法驱动型：后者源于多模态技术和深度学习技术的技术更迭真人驱动型技术流程

立即下载

教育

2023-12-12

中航证券

裴伊凡

41页

3.44M

[中航证券]:虚拟数字人行业专题报告：有“智”者事竟成，点击即可下载。报告格式为PDF，大小3.44M，页数41页，欢迎下载。

本报告共41页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共41页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

虚拟数字人行业专题报告：有“智”者事竟成

关于我们

联系我们

虚拟数字人行业专题报告：有“智”者事竟成

关于我们

联系我们

小程序

公众号