计算机行业跟踪报告:OpenAI推出首个文生视频大模型Sora,引领AI文生视频行业跨越式发展
[Table_RightTitle] 证券研究报告|计算机 [Table_Title] OpenAI 推出首个文生视频大模型 Sora,引领 AI 文生视频行业跨越式发展 [Table_IndustryRank] 强于大市(维持) [Table_ReportType] ——计算机行业跟踪报告 [Table_ReportDate] 2024 年 02 月 18 日 [Table_Summary] 行业核心观点: 文生视频大模型 Sora 重磅发布,可生成长达 1 分钟的视频。2 月 16 日,OpenAI 推出其首个文生视频大模型 Sora。根据官网介绍,Sora 可以生成长达 1 分钟时长的视频,同时还能保证视频质量,并遵循用户的提示(prompt)。 投资要点: Sora 是一个扩散 transformer,具有强大的语言理解能力,通过在潜在空间训练 patches 生成视频。对标 tokens,OpenAI 将视觉数据转换为patches,有效用于 Sora 大模型训练。Sora 是一种扩散模型,通过给出输入的静态噪声以及相关的文本提示(prompt)等调节信息,训练生成原始的“干净”patches。在推理时,OpenAI 还可以通过在适当大小的网格中排列随机初始化的 patches 来控制生成视频的大小。与 GPT 模型类似,Sora 使用 transformer 架构,释放出卓越的扩展性能。立足 DALL·E 3和 GPT 模型,Sora 具有强大的语言理解能力,能够生成更加准确遵循用户提示的高质量视频。此外,在固定种子和输入的情况下,可以看到训练计算的增加能显著提升样本视频的质量。 多维度跨越式突破,视频质量飞跃性提升。Sora 的采样更具有灵活性,同时改进了框架和构图。Sora 可以采样宽屏 1920x1080p 的视频、垂直1080x1920 的视频以及介于两者之间的所有视频。这让 Sora 可直接以不同的原始长宽比创建内容。OpenAI 还通过经验发现,在视频的原始长宽比上进行训练可以改善构图和框架。Sora 还支持图生视频、视频生视频,能执行广泛的图像和视频编辑任务,创建完美的循环视频、动画静态图像、向前或向后扩展视频等。在连接视频上,Sora 能将两个输入视频无缝衔接在一起。虽然目前 Sora 仍然有一些缺陷和局限性,但已经开始理解物理意义,并出现许多有趣的涌现能力,如三维一致性。 重塑 AI 文生视频行业格局,或冲击 AI 文生图赛道。Sora 在生成视频长度上大幅领先,多角度镜头能力也显著领先行业竞品。同样的 prompt,Sora 生成的视频长度、质量都显著领先。Sora 可以生成可变大小的图像,最高可达 2048×2048 分辨率,图片画质有了大幅提升。我们认为随着文生视频画质能力的提升,图片作为单帧的视频,文生视频领域的产品或将冲击文生图行业。 投资建议:1)AI 文生视频行业发展带动 AI 行业应用落地的机遇;2)AI行业发展对算力、光模块等基础设施的持续需求;3)AIGC 在媒体、游戏等行业的加速落地带来的投资机遇。 风险提示:AI 产业发展不及预期;AI 带来的版权、隐私及技术风险;国内 AI 应用落地不及预期;中美科技摩擦风险。 [Table_Chart] 行业相对沪深 300 指数表现 数据来源:聚源,万联证券研究所 [Table_ReportList] 相关研究 Q4 基金重仓略微超配,前十大重仓股组成不变 人工智能行业应用多点开花 工信部就《国家人工智能产业综合标准化体系建设指南》公开征求意见 [Table_Authors] 分析师: 夏清莹 执业证书编号: S0270520050001 电话: 075583223620 邮箱: xiaqy1@wlzq.com.cn -50%-40%-30%-20%-10%0%10%20%30%计算机沪深300证券研究报告 行业跟踪报告 行业研究 3492 [Table_Pagehead] 证券研究报告 万联证券研究所 www.wlzq.cn 第 2 页 共 10 页 $$start$$ 正文目录 1 OpenAI 发布 Sora,AI 文生视频大模型跨越性突破 ................................................... 3 1.1 OpenAI 首个文生视频大模型 SORA 重磅推出 ................................................... 3 1.2 多维度跨越式突破,视频质量飞跃性提升 ........................................................ 5 1.3 重塑 AI 文生视频行业格局,或冲击 AI 文生图赛道 ........................................ 7 2 投资建议 ........................................................................................................................... 9 3 风险提示 ........................................................................................................................... 9 图表 1: Sora 一分钟展示视频的 prompt 及部分截图 .................................................... 3 图表 2: Sora 将视觉数据转换为 patches 的示意图 ........................................................ 3 图表 3: Sora 通过扩散还原视频的示意图 ...................................................................... 4 图表 4: 不同训练计算生成的样本视频对比 .................................................................. 4 图表 5: 使用正方形裁剪(左)与使用原始大小(右)的训练视频效果对比 .......... 5 图表 6: 向后扩展视频示意 .............................................................................................. 5 图表 7: 从左上图逐渐转化至右下图的场景示意 .......................................................... 6 图表 8: Sora 三维一致性示意图 ............................
[万联证券]:计算机行业跟踪报告:OpenAI推出首个文生视频大模型Sora,引领AI文生视频行业跨越式发展,点击即可下载。报告格式为PDF,大小1.79M,页数10页,欢迎下载。
