传媒行业专题研究:解析GEN-2-视频生成式AI新突破

免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 传媒 解析 GEN-2:视频生成式 AI 新突破 华泰研究 传媒 增持 (维持) 研究员 朱珺 SAC No. S0570520040004 SFC No. BPX711 zhujun016731@htsc.com +(86) 10 6321 1166 研究员 吴晓宇 SAC No. S0570522100002 wuxiaoyu@htsc.com +(86) 755 2399 3324 行业走势图 资料来源:Wind,华泰研究 2023 年 4 月 03 日│中国内地 专题研究 Gen-2 生成式 AI 视频模型发布,多模态领域一大跨越 2023 年 3 月 20 日 Runway 发布文字生成视频模型 GEN-2,宣传语为“say it, see it”,仅需用户输入文字、图像或文字加图像的描述,Gen-2 即可短时间内生成相关视频。目前,Gen-2 是市场上第一个公开可用的文本到视频模型,Gen-2 在延续 Gen-1 将图片或文本提示的构图和风格应用于原视频的功能上,突破了“直接生成视频”的功能。我们认为,伴随着 Gen-2 生成质量的提升和功能的优化,生成式 AI 视频有望在游戏、影视、营销等领域实现更广泛应用。Gen-2 能够降低成本与难度、提高视频制作效率、提升视频内容风格多样性与创意度。 八大工作模式,全方位视频生成 GEN-2 的工作模式包括文字生成视频、提示词+图片生成视频、图片生成视频、风格化模式、故事板模式、蒙版模式、渲染模式、自定义模式。其中风格化、故事版、蒙版、渲染、自定义为延续 Gen-1 功能,能够对现有视频进行更改风格、真实渲染、选择性修改等操作;文字、图片生成视频功能为Gen-2 的主要新增模式。Gen-1 可以在原视频的基础上编辑出符合用户要求的视频,而 Gen-2 可以从头开始生成视频。根据内测用户反映,Gen-2 可生成包括日系动画、写实风格的镜头特写、魔幻特效的电影大片风格在内的各类视频。 Runway 公司深耕 AI 技术前沿,探索图像视频 AI 编辑技术 Runway 是致力于图片和视频 AI 编辑软件的开发、营销和服务的人工智能公司。Runway 拥有较强的研发实力和创新能力,现已拥有数十种包括文本到图像、图像到图像、替换背景、擦除与替换在内多重功能的人工智能工具。截至目前,公司已经参与开发了 Latent Diffusion,Stable Diffusion,Gen-1,Gen-2 在内的 AI 图像视频编辑软件,拥有强大的文本生成图像或视频模型,能够在短时间生成清晰度高、还原度佳的 AI 图片,在功能方面实现了单点AI 工具到云视频编辑套件、从编辑视频到生成视频的功能。 AI 生成视频有望在游戏、影视、营销等方面落地 移动互联网的繁荣催生了各类社交和流媒体平台,人们对其内容的需求旺盛,铸造了规模庞大的泛内容产业。我们认为随着 Gen-2 功能优化,Gen-2有望实现更广泛的应用。游戏方面,Gen-2 可简单快速生成宣传视频、游戏内容视频等,提升游戏内容的创作质量及效率,为用户带来优质的游戏内容及体验。影视方面,Gen-2 将提供专属的创作模块,比如特效、运镜、转场等模块化工具,辅助视频获得更好效果。营销方面,通过 Gen-2 能够快速设计准确反映其品牌和信息的营销材料,包括宣传视频、营销广告等物料,实现个性化内容生产并助力降本增效。 风险提示:监管波动风险,商业化落地不及预期。本报告基于公开客观信息整理,不代表提及公司的覆盖与推荐。 (22)(13)(3)716Apr-22Aug-22Nov-22Mar-23(%)传媒沪深300 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 2 传媒 GEN-2 发布,生成式 AI 视频迈出新一步 随着视频中心平台的普及,对更加直观、性能更好的视频编辑工具的需求上升。2023 年 3月 20 日 Runway 发布 AI 生成视频模型 GEN-2,多模态领域迈出新一步。GEN-2 宣传语为“say it, see it”,仅仅通过文字、图像或文字加图像的描述,GEN-2 即可短时间内生成相关视频。根据官网介绍,Gen-2 为“生成式人工智能的下一步:一个多模态人工智能系统,可以生成带有文本、图像或视频剪辑的新颖视频”。 目前,Gen-2 是市场上第一个公开可用的文本到视频模型,并且能够真实一致的将图像或文本提示的构图和风格应用于视频生成。Gen-2 代表了重大的研究里程碑,向生成式 AI 迈出了巨大一步,任何人都可以打破时空与技术的局限生成各种风格的视频。Gen-2 的发布代表了实验室外文本转视频生成的最成功案例。谷歌和 Meta 在 2022 年都展示出了文本转视频技术 Demo,成熟产品仍在研发探索中。 图表1: Runway 解读 Gen-2 定位 注:用户输入文字为:傍晚的阳光透过纽约城阁楼的窗户照进来。 资料来源:Runway 官网、华泰研究 延续 Gen-1 优势,实现文生视频突破 在 2023 年 2 月 runway 发布 Gen-1。Gen-1 是一款主打改变视频视觉风格的新型视频编辑模型,主要功能为根据用户输入的文字或图片风格将现有视频转换成新风格视频。 图表2: 通过文字或图片更改视频风格 资料来源:Runway 官网、华泰研究 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 3 传媒 Gen-1 主要提供了五大模式的功能特征,包括:1)程式化:将图像或文字提示的样式转移到视频的每一帧;2)故事版:对原视频画面渲染为另一种风格;3)蒙版:将原视频中的主体分离并对其按照文本格式进行修改,将图片中的物体、动物、人物实别进行分离,单独对其进行修改,例如将视频中的宠物狗毛色进行修改;4)渲染:将简单建模的原视频渲染为符合要求的视频输出,如对原先无渲染的简单人物渲染为具备细致纹理的精细视频;5)自定义模型以获得更好的效果。如用户可以将视频自定义为动画化风格模型,可以将上传的视频直接变为特定动画风格。 Gen-2 在原有技术的基础上增添了文本生成视频、图片生成视频、及文字+图片生成视频的新功能,实现了从头直接生成视频的技术突破。Gen-2 在功能、用户体验层面均有所提升:1)功能方面,Gen-2 在延续 Gen-1 将图片或文本提示的构图和风格应用于原视频的功能上,突破了“直接生成视频”的功能,通过用户输入文字或图片,Gen-2 可创建全新视频内容,且在风格、分辨率、贴合程度等方面都有较好表现。2)用户体验层面,对于图像到图像和视频到视频的转换,来自第二代的结果比现有方法更受欢迎。73.53%的用户认为优于 Stable Diffusion 1.5,88.24%的用户认为优于 Text2Live。 八种工作模式,全方位生成视频 具体而言,GEN-2 的工作模式包括文字生成视频、提示词+图片生成视频、图片生成视频、风格化模式、故事板模式、蒙版模式、渲染模式、自定义模式。

立即下载
互联网
2023-04-04
华泰证券
13页
2.1M
收藏
分享

[华泰证券]:传媒行业专题研究:解析GEN-2-视频生成式AI新突破,点击即可下载。报告格式为PDF,大小2.1M,页数13页,欢迎下载。

本报告共13页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共13页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
传媒-游戏板块重点公司估值表
互联网
2023-04-04
来源:传媒行业AIGC系列之十:微软GDC中国行之后,如何看待被低估的AI+游戏
查看原文
A 股部分游戏公司 18 年以来 Forward PE 变化(单位:倍)
互联网
2023-04-04
来源:传媒行业AIGC系列之十:微软GDC中国行之后,如何看待被低估的AI+游戏
查看原文
手游时长占国内移动互联网市场比例(%)
互联网
2023-04-04
来源:传媒行业AIGC系列之十:微软GDC中国行之后,如何看待被低估的AI+游戏
查看原文
全球游戏用户渗透率对比
互联网
2023-04-04
来源:传媒行业AIGC系列之十:微软GDC中国行之后,如何看待被低估的AI+游戏
查看原文
AI 游戏直播虚拟人示例 图 17:社交软件 Glow 的 AI 对话界面
互联网
2023-04-04
来源:传媒行业AIGC系列之十:微软GDC中国行之后,如何看待被低估的AI+游戏
查看原文
《逆水寒》手游与智能 NPC 对话 图 15:Talking Tom 用户界面
互联网
2023-04-04
来源:传媒行业AIGC系列之十:微软GDC中国行之后,如何看待被低估的AI+游戏
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起