AIGC行业趋势:Sora横空出世,向多模态应用加速迈进

互联网行业 | 行业追踪 本研究报告由浦银国际证券有限公司分析师编制,请仔细阅读本报告最后部分的分析师披露、商业关系披露及免责声明。 AIGC 行业趋势:Sora 横空出世,向多模态应用加速迈进 近期,OpenAI 的 Sora 的横空出世再一次引发市场对 AIGC 的关注,文生视频领域取得重大突破,效果远超预期。我们将围绕Sora 的核心优势、技术特点、行业影响、未来趋势等方面进行阐述。 相较于此前的文生视频模型,Sora 取得哪些突破? 近期,OpenAI 发布了文生视频模型 Sora,可以用文字指令生成长达 1 分钟的高清视频。相较于此前市场上的同类模型,如Runway、Pika 等,Sora 的生成效果有大幅提升,远超预期:  首先,视频长度方面,Sora 可以生成长达 60 秒的视频,长度远远大于其他 AI 视频模型的几秒钟长度。  其次,Sora 在视频内容质量稳定性方面有大幅的提升,镜头多角度切换,视频中的主角和背景能够保持高度一致性和稳定性。  此外,Sora 还展示了其对物理世界部分规律的理解,这也是一重大突破,甚至能够实现一定程度的物理交互。 Sora 的核心优势和技术特点体现在哪些方面? Sora 的技术优势在于“Patches”和深度语言理解。Sora 是一个在不同时长、分辨率和宽高比的视频及图像上训练而成的扩散模型,同时采用了 Transformer 架构。Sora 模型的技术优势和特点主要在于:  视觉数据 Patches 化:相较于大语音模型把所有的文本、符号、代码都抽象为 Tokens,Sora 则把视频抽象为 Patches(补片),是一种具备高度扩展性且适用于视频和图片生成式模型训练的有效表示(图表 1);  视频压缩网络(Video compression network):将原始视频进行压缩,从而降低视觉数据维度,用于训练并生成视频;  时空补片技术(Spacetime latent patches):给定一个压缩的输入视频,模型提取一系列时空补片(patches),用于对不同分辨率、时长和长宽比的视频和图像进行训练;  扩展 Transformer 视频生成:Sora 是一个扩散 Transformer 模型,通过输入噪声 patches 训练来预测除噪的原始 patches。OpenAI 在这项研究中发现,扩散型 Transformer 同样能在视频模型领域中完成高效扩展(图表 2);  视频多样化:相较于一些模型使用标准尺寸视频用于训练或生成,Sora 能够处理不同分辨率、时长、宽高比的视频,在采样灵活性、改进框架和构图方面有显著优势;  语言理解:基于 GPT 模型的深度语言理解,能够更加准确地理解提示词所表达的真实需求;  图生视频、视频生视频:除了文生视频外,Sora 也能够通过输入图像和视频用于生成视频,能够实现静态图片动态化、视频向前和向后拓展、视频编辑等能力(图表 3)。 浦银国际 行业追踪 AIGC 行业趋势 赵丹 首席互联网分析师 dan_zhao@spdbi.com (852) 2808 6436 杨子超,CFA 互联网分析师 charles_yang@spdbi.com (852) 2808 6409 2024 年 2 月 21 日 扫码关注 浦银国际研究 互联网行业 | 行业追踪 本研究报告由浦银国际证券有限公司分析师编制,请仔细阅读本报告最后部分的分析师披露、商业关系披露及免责声明。 Sora 模型对哪些行业影响更大? Sora 最直接的影响主要是对视频行业造成冲击,这将对于广告业、电影预告片、短视频行业以及游戏带来颠覆。Sora 大大降低了视频制作的门槛和成本。  对于国内 AI 创业公司的影响:和 ChatGPT 一样,我们认为 Sora的出现也会吸引国内玩家追随,但由于文生视频模型的训练难度和成本更大,准入门槛也进一步提高。  Sora 影响最大的将是短视频行业,未来或将极大地提升内容供给及创作质量,尤其是流量热点驱动的内容,或将进入“全民创作”时代。同时,文生视频技术或将为当下热门的短剧市场带来变数,短剧重心有望回归高质量剧本创作。  长视频由于对内容质量等专业化要求较高,AI 生成视频在精准度、可编辑性等方面仍需进一步打磨,高额的成本也或是短期应用落地阻碍,但长期来看其未来发展空间足够广阔。  对于游戏行业,Sora 模型有助于进一步提高开发效率。文生视频能力可降低游戏 CG 和 PV 制作成本,可用于丰富游戏剧情和故事情节,提升玩家代入感。  视频相较于文字而言,对于算力的需求将会是几何式的增长。我们认为算力限制可能是影响文生视频类应用开放使用的重要因素。 2024 年 AIGC 行业有哪些趋势? 多模态模型或在 2024 年迎来爆发。此前大模型在各个领域的应用,主要集中在文生文、文生图之上,而在文生视频领域却进步缓慢。此次文生视频模型 Sora 的发布,将给长短视频,游戏和广告行业带来颠覆性创新。随着文生图、图片对话技术的成熟,文生视频已成为多模态大模型下一步发展的重点。大模型领域的竞争将进一步白热化,多模态大模型将成为生成式 AI 的重点发展方向,并有望推动本轮 AI 行情进一步扩散。 除了在计算机视觉、自然语言处理等特定领域模型的发展,多模态大模型的进一步交叉融合或将成为未来重要的应用方向。未来人与机器之间的交互方式将更加丰富,或通过文字、视觉、语音等多维度沟通,进而提升效率。AI 所创造的虚拟世界与现实世界的边界逐渐模糊,逐渐向 AGI 方向迈进。 投资风险:行业监管,内容合规,成本控制,商业模式。 2024-02-21 3 图表 1:视频数据 Patches 化 资料来源:OpenAI、浦银国际 图表 2:扩散 Transformer 模型训练生成视频 资料来源:OpenAI、浦银国际 图表 3:静态图片生成视频 资料来源:OpenAI、浦银国际 2024-02-21 4 免责声明 本报告之收取者透过接受本报告(包括任何有关的附件),表示及保证其根据下述的条件下有权获得本报告,且同意受此中包含的限制条件所约束。任何没有遵循这些限制的情况可能构成法律之违反。 本报告是由从事证券及期货条例(香港法例第 571 章)中第一类(证券交易)及第四类(就证券提供意见)受规管活动之持牌法团–浦银国际证券有限公司 (统称“浦银国际证券”)利用集团信息及其他公开信息编制而成。所有资料均搜集自被认为是可靠的来源,但并不保证数据之准确性、可信性及完整性,亦不会因资料引致的任何损失承担任何责任。报告中的资料来源除非另有说明,否则信息均来自本集团。本报告的内容涉及到保密数据,所以仅供阁下为其自身利益而使用。除了阁下以及受聘向阁下提供咨询意见的人士(其同意将本材

立即下载
综合
2024-02-22
浦银国际
5页
1.28M
收藏
分享

[浦银国际]:AIGC行业趋势:Sora横空出世,向多模态应用加速迈进,点击即可下载。报告格式为PDF,大小1.28M,页数5页,欢迎下载。

本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共5页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
表 11、中国财险利润表(单位:百万元人民币)
综合
2024-02-22
来源:中国财险(02328.HK)业精于勤,行成于思
查看原文
图 55、中国财险 2012 年以来 PB-ROE 分位数情况
综合
2024-02-22
来源:中国财险(02328.HK)业精于勤,行成于思
查看原文
图 54、中国财险历史估值复盘
综合
2024-02-22
来源:中国财险(02328.HK)业精于勤,行成于思
查看原文
图 53、近年来中国财险的归母净利润稳步提升
综合
2024-02-22
来源:中国财险(02328.HK)业精于勤,行成于思
查看原文
表 8、中国财险持有华夏银行情况(单位:亿元人民币)
综合
2024-02-22
来源:中国财险(02328.HK)业精于勤,行成于思
查看原文
表 7、中国财险 2018-2022 年投资收益率波动较低
综合
2024-02-22
来源:中国财险(02328.HK)业精于勤,行成于思
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起