通信行业深度:AI文生视频,多模态应用的下一站

请仔细阅读本报告末页声明 证券研究报告|行业深度 2023 年 10 月 09 日 通信 AI 文生视频:多模态应用的下一站 市场认为,AI 应用已经逐渐步入成熟期,但未见杀手级应用。本篇报告中,我们谨以“文生视频”这一多模态应用为例,阐述 AI 应用的发展尚处于早期,相对应地,算力需求远未见顶。 文生视频是多模态 AIGC 圣杯,优化迭代速度慢。视频是多帧图像的组合,然而文生视频在文生图的基础上增加了时间维度,技术实现更困难。即便是 Meta 和 Google 这样的硅谷人工智能巨头,在文生视频上进展缓慢,它们分别推出的 Make-A-Video 和 Phenaki 均尚未公测。 文生视频底层模型及技术仍在优化,未筛选出最优模型。文生视频技术主要发展过程经历了基于 GAN 和 VAE、基于 Transformer 模型、基于扩散模型三个阶段。目前主流的文生视频模型主要依托 Transformer 模型和扩散模型。1)基于 Transformer 的代表 Phenaki 突破了视频生成时长限制,但效果相对粗糙缺少细节。2)基于扩散模型的代表 Make-A-Video 重在提升视频质量,但其视频时长均在 4s 以内。 文生视频效果各异,总体质量较低。当前文生视频可公测应用较少,仅有 RunwayGen-2、ZeroScope 及 Pika Labs 等少数几个,它们有如下共同问题:1)复杂人物动作生成帧连续效果较差;2)非日常场景的视频架构能力连续能力一般;3)多主体视频生成缺乏逻辑连续性等。 文生视频当前商用化程度较低,可从图片生成看其商业前景。1)根据七麦数据,图片生成类应用在多模态大模型中,表现出较强的收费能力,应用数量上占比最高。2)当前唯一收费的文生视频应用(Runway Gen-2),商业模式与图片生成趋同,即主要按照生成量定价。 看好人像生成细分领域,但营收持续增长能力仍待验证。1)Lensa AI推出人像生成功能后,去年 12 月前 12 日内创收 2930 万美元,但 2023年 7 月全球收入已回落为 100 万美元;2)妙鸭相机上线即火爆,半月营收估计超过 29 万美元,后续须上线新模板、新玩法维持营收增长。 看 好 算 力 储 备 大 厂 在 多 模 态 生 成 领 域 的 发 展 。 1 ) 文 生 图 应 用Midjourney 日活达 1500 万,年收入超 1 亿美元,它推出的多版无限量套餐、高速 GPU 服务反映出市场对算力的巨大需求。2)目前国内文生图多为计次付费,尚未出现无限量套餐,或因算力受限,我们认为,具有算力储备的云服务厂商在发展视频生成类应用上具有天然优势。 看好业务协同向发展,看好文生视频与文生图、图生视频的联动。AI 对产品价值的拉动表现为:1)促活、拉新:Adobe、Microsoft 365 Copilot 分别在软件原有基础上推出 AI 工具;2)提升产品价格:Office Copilot 是基于 GPT-4 API 的应用,Copilot 加入后 Office 当前四种商业版整体订阅价格涨幅达 53-240%。我们看好文生视频能与原有产品产生协同,降本增效的公司,例如游戏、影视制作等领域的公司。 投资建议:1)算力:AIGC 蓬勃发展的基石,建议关注光通信,包括中际旭创、天孚通信、新易盛、太辰光、德科立;算力设备:盛科通信、恒为科技、锐捷网络、寒武纪、美格智能、紫光股份、工业富联、中兴通讯等;算力租赁:中贝通信、云赛智联等;2)模型层:建议关注金山办公、万兴科技、科大讯飞等;3)应用层:看好游戏的迭代创新,建议关注恺英网络、神州泰岳、盛天网络、游族网络等。 风险提示:伦理风险、知识产权及版权风险、计算资源限制。 增持(维持) 行业走势 作者 分析师宋嘉吉 执业证书编号:S0680519010002 邮箱:songjiaji@gszq.com 分析师孙爽 执业证书编号:S0680521050001 邮箱:sunshuang@gszq.com 相关研究 1、《通信:亚马逊重金投资 Anthropic,AI 战场的合纵连横》2023-09-26 2、《通信:AI 算力再起,开启全球共振》2023-09-24 3、《通信:“文生游戏”诞生,Roblox 开启游戏 AIGC革命》2023-09-18 -16%0%16%32%48%64%80%2022-102023-022023-062023-09通信沪深3002023 年 10 月 09 日 P.2 请仔细阅读本报告末页声明 内容目录 1 文生视频,多模态 AIGC 圣杯 ............................................................................................................................... 4 1.1 相较于文字和图片,视频能承载的信息量更大 ............................................................................................. 4 1.2 当前公测的文生视频应用数量较少 .............................................................................................................. 4 1.3 文生视频,难在哪里? ............................................................................................................................... 5 2 技术路线沿革:文生视频,哪种技术更强? .......................................................................................................... 6 2.1 阶段一:基于 GAN 和 VAE,以 Text2Filter 为代表......................................................................................... 6 2.2 阶段二:基于 Transformer,以 Phenaki 为代表 ............................................................................................ 6 2.3 阶段三:基于扩散模型,以 Make-A-Video 和阿里通义为代表 ....................................................

立即下载
信息科技
2023-10-19
国盛证券
24页
2.1M
收藏
分享

[国盛证券]:通信行业深度:AI文生视频,多模态应用的下一站,点击即可下载。报告格式为PDF,大小2.1M,页数24页,欢迎下载。

本报告共24页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共24页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
23Q2通信芯片板块经营同比变化
信息科技
2023-10-19
来源:通信行业23年中报综述:Q2经营环比改善,算力网络产业、工业智能化景气上行
查看原文
2023Q2子板块毛利率同比变化(pp) 图: 2023Q2子板块毛利率环比变化(pp)
信息科技
2023-10-19
来源:通信行业23年中报综述:Q2经营环比改善,算力网络产业、工业智能化景气上行
查看原文
表 1 可信数据流通关键技术说明
信息科技
2023-10-19
来源:可信数据流通网络(TDN)白皮书2023
查看原文
图12 我国域名注册量TOP20顶级域市场份额
信息科技
2023-10-19
来源:2023年互联网域名产业报告_中国信通院_202308
查看原文
图11 我国域名注册量地理分布
信息科技
2023-10-19
来源:2023年互联网域名产业报告_中国信通院_202308
查看原文
图10 我国已获许可的域名服务机构数量省份分布(截至2022年12月)
信息科技
2023-10-19
来源:2023年互联网域名产业报告_中国信通院_202308
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起