计算机行业专题报告:视频大模型最新进展如何?
请阅读最后一页的重要声明! 视频大模型最新进展如何? 证券研究报告 投资评级:看好(维持) 最近 12 月市场表现 分析师 杨烨 SAC 证书编号:S0160522050001 yangye01@ctsec.com 联系人 李宇轩 liyx02@ctsec.com 相关报告 1. 《大模型推理成本降低,AI 应用落地可期》 2024-06-10 2. 《AI 算力需求旺盛,液冷产业加速发展》 2024-06-02 3. 《低空经济政策催化持续,空域管理有望不断细化》 2024-05-26 核心观点 Sora 团队的负责人在 2024 智源大会开幕式分享多模态大模型领域近年来的发展历程以及未来的前进方向。DALL.E:通过压缩数据可以实现学习,但仅仅压缩并不能通向 AGI;CLIP:从在视觉世界学习过程中介入自然语言指导,与单纯压缩数据相比计算效率将显著提升;DALL·E 3:增强训练文本的描述性,训练文生图模型的效率也会更高,即使在推理时无法使用具有描述性的文本,也可以使用具有较强描述性的文本作为训练的框架得到更好的无条件模型;视觉上下文学习可能是实现通往所有类型应用的一条可行路径。 视频大模型应用商业化持续推进。Adobe Firefly 新增生成式扩展功能,生成音频和视频功能即将推出,Adobe Express 发布音频生成动画功能,为 C 端提供便捷的口播视频制作工具;美图构建 AI 短片工作流,提升 AI 生成可控性,加速文生视频商业化落地;Filmora 上线 13.5 版本,AI 功能持续更新,携手英伟达开启全新视频视觉体验。6 月 12 日,公司更新了视频创意软件新版本,并上线多个新功能;Luma AI 发布 Dream Machine,实现较高质量的文生视频、图生视频;快手发布可灵大模型,技术路线类似 Sora;Pika 再融资 5.8亿人民币,已构建起 AI 视频生成基础模型;Runway 更新 Gen-2 多重运动笔刷功能,提升视频可控性,获得 D 轮融资,与谷歌合作进一步加深。 投资建议:见正文。 风险提示:视频大模型技术迭代不及预期;商业化落地不及预期;竞争加剧风险;全球宏观经济风险 -44%-34%-23%-13%-3%8%计算机沪深300上证指数 谨请参阅尾页重要声明及财通证券股票和行业评级标准 2 行业专题报告/证券研究报告 1 OpenAI 视频大模型技术发展思路 ........................................................................................................ 3 2 视频大模型最新进展 ............................................................................................................................... 6 2.1 Adobe 即将推出生成音频和视频功能 ............................................................................................... 6 2.2 美图 MOKI 即将上线,重塑短片创作工作流 ................................................................................. 7 2.3 万兴 Filmora 上线 13.5 版本,新推声音复刻、文生贴纸等功能 .................................................. 8 2.4 Luma AI 发布 Dream Machine,可准确理解文字描述 .................................................................. 9 2.5 快手发布可灵大模型,“世界模拟器”对标 Sora .............................................................................. 9 2.6 Pika 再融资 5.8 亿元,发展潜力值得期待 ..................................................................................... 10 2.7 Runway 获得由谷歌领投的约 7 亿元 D 轮融资 ............................................................................. 11 3 文生视频大模型试用对比 ..................................................................................................................... 12 4 投资建议 ................................................................................................................................................. 14 5 风险提示 ................................................................................................................................................. 14 图 1. DALL·E 随着规模扩展模型能力也逐步增强 ...................................................................................... 3 图 2. CLIP 同时输入文本与图像数据对进行训练 ....................................................................................... 4 图 3. 如果模型规模较大,大算力支持下模型可以学习到语言无法描述的知识 ..................................... 5 图 4. 将描述性的文本注入视觉世界,使模型更具智能 ............................................................................. 5 图 5. Adobe Firefly 的 AI 产品矩阵日趋完善 ..............
[财通证券]:计算机行业专题报告:视频大模型最新进展如何?,点击即可下载。报告格式为PDF,大小2.21M,页数15页,欢迎下载。
