计算机行业动态报告:Sora对算力需求影响几何?

www.chinastock.com.cn证券研究报告请务必阅读正文最后的中国银河证券股份有限公司免责声明[Table_Header]行业动态报告●计算机行业2024 年 2 月 24 日[Table_Title]Sora 对算力需求影响几何?核心观点:[Table_Summary]Sora 算力需求将呈指数级增长,带动算力基础设施需求。北京时间 2 月 16日凌晨,OpenAI 发布了首个文生视频模型 Sora,可以用文字指令生成长达 60秒的高清流畅视频,在生成视频长度、连贯性、多镜头切换方面具备显著优势。本文基于大语言模型推导算力需求方法,对 Sora 单次训练算力需求进行推演,据相关研究推测,Sora 参数规模估算在 30B(待确认),如果按此参数测算,我们推演出 Sora 训练单次算力需求或可达到 8.4×10^23Flops,相当于GPT-3 175B 的 2.7 倍。我们认为,目前 Sora 还在初级阶段,仍然存在如能以准确模拟物理运动规律及场景、混淆左右方向、混淆空间细节等,但伴随 Sora不断迭代调优,训练数据集规模增大,未来算力需求将呈现指数级爆发式增长,持续看好上游算力基础设施投资机会。Sora 基于 DiT 架构,采用 Transformer 替换 U-Net。Sora 实际上是一种基于DiT(Diffusion Transformer,扩散变换器)的模型搭建。,同时采用了 Diffusion与 Transformer,是一种用于扩散模型的新架构。Sora 受到大语言模型的启发,用 Transformer 替换扩散模型中的 U-Net,通过将 Transformer 与 Diffusion 结合成为一种基于扩散变换的模型 DiT,趋于标准 Transformer 架构,同时保留其可扩展性。与大语言模型将文本转换为可被理解的 token 类似,Sora 将视频转换成一系列 Patch(视觉编码块)并将其进行降维,用 Patch 作为视觉图像统一表现形式,将噪声通过去噪来预测原始图像信息,进而生成视频。Sora 实现跨越式提升,文生视频大模型开启新纪元。Sora 可以将 Prompt 转换成长达 60 秒视频,相对于此前文生视频大模型 Runway、Pika、Stable Video等提升几个级别。同时在视频分辨率以及质量方面,Sora 可以生成 1080P 清晰度视频,并且能够相对完整实现对世界及物体运动规律理解及模拟,在镜头切换方面保持稳定性。此外,Sora 还支持图片格式输入、视频扩展、视频拼接等,是文生视频领域突破性技术变革。投资建议:Sora 是人工智能发展进程中的“里程碑”,推动 AGI 时代加速到来,算力需求将持续爆发,持续看好产业链投资机会。建议重点关注国内上市公司:1、国内多模态大模型:科大讯飞、海康威视、大华股份;2、算力基础设施:工业富联、中科曙光、软通动力、神州数码、曙光数创、润泽科技、拓维信息;3、AI 应用端:万兴科技、金山办公、超图软件、彩讯股份、拓尔思、卫宁健康、嘉和美康等。风险提示:技术研发进度不及预期风险;供应链风险;政策推进不及预期风险;消费需求不及预期风险;行业竞争加剧风险等。[Table_IndustryName]计算机行业[Table_InvestRank]推荐维持评级分析师[Table_Authors]吴砚靖:(8610)66568589:wuyanjing@chinastock.com.cn分析师证书编码:S0130519070001研究助理胡天昊:(8610)80927637:hutianhao_yj@chinastock.com.cn相对沪深 300 表现图2024-2-22[Table_Chart]资料来源:wind,中国银河证券研究院请务必阅读正文最后的中国银河证券股份有限公司免责声明。2[Table_ReportTypeInde×]行业动态报告/计算机行业目 录一、 Sora 大模型横空出世,AGI 时代加速到来.............................................................................................................................3二、 Sora 基于 DiT 模型搭建,更适用文生视频领域....................................................................................................................4三、 Sora 算力分析框架详解,是 GPT-3 175B 所需算力 0.5 倍................................................................................................. 6四、 Sora 对算力需求将呈指数级增长.............................................................................................................................................7请务必阅读正文最后的中国银河证券股份有限公司免责声明。3[Table_ReportTypeInde×]行业动态报告/计算机行业一、Sora 大模型横空出世,AGI 时代加速到来北京时间 2 月 16 日凌晨,OpenAI 发布了首个文生视频大模型 Sora,并配有 48 个生成案例及技术报告,能够通过自然语言指令生成长达 60 秒的高清流畅视频,在生成视频长度、清晰度、连贯性、多镜头切换方面都有显著提升。图 1:Sora 对同类产品对比资料来源:数字经济先锋号,中国银河证券研究院Sora 在文生视频领遥遥领先。Sora 可以将简短文本描述转换成一分钟流畅视频,相对于 Runway、Pika、Stable Video 等提升了几个代级。1)生成视频长度:Runway、Pika 等传统文生视频大模型平均时长在 3-5 秒,Runway 用户可以最多延长视频长度至 16 秒,Sora 相对传统视频生成工具提升 15-20倍;2)视频质量显著提升:生成;3)可实现多镜头切换:可以理解和模拟运动中的物理规律,可以实现复杂的运动相机模拟;4)视频连贯性与稳定性更好:在建模能力上表现更好,可以依赖关系进行建模,能初步理解及模拟物理运动规律;5)高可拓展性:支持多种数据格式输入,具备实现文生视频、图生视频、向前或向后视频扩展能力,同时支持视频连接。表 1:Sora 与其他文生视频大模型能力对比细分能力项Sora其他文生视频大模型视频基本参数视频时长60 秒平均 3-5 秒,最多可延长至 16 秒视频分辨率1920×1080固定尺寸,如 16:9,1:1 等视频质量视频清晰度1080Pupscale 后达到 4K真实世界模拟强弱运动相机模拟强弱输入类型文本√√图片√√视频√√建模

立即下载
电子设备
2024-02-25
银河证券
10页
1.46M
收藏
分享

[银河证券]:计算机行业动态报告:Sora对算力需求影响几何?,点击即可下载。报告格式为PDF,大小1.46M,页数10页,欢迎下载。

本报告共10页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共10页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
鸿蒙原生应用版图
电子设备
2024-02-25
来源:计算机行业周报:华为产业持续验证
查看原文
第五期鸿蒙学堂·创新实训营现场图
电子设备
2024-02-25
来源:计算机行业周报:华为产业持续验证
查看原文
HarmonyOS NEXT 鸿蒙星河版计划
电子设备
2024-02-25
来源:计算机行业周报:华为产业持续验证
查看原文
HarmonyOS NEXT 鸿蒙星河版开发者预览面向开发者开放申请
电子设备
2024-02-25
来源:计算机行业周报:华为产业持续验证
查看原文
OpenAtom OpenHarmony 社区生态建设进度 图表 17:累计已有 165 个厂家的 447 款产品通过鸿蒙生态兼容性测评
电子设备
2024-02-25
来源:计算机行业周报:华为产业持续验证
查看原文
中国智能手机市场份额(按操作系统类型)
电子设备
2024-02-25
来源:计算机行业周报:华为产业持续验证
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起