传媒行业重大事项点评:豆包大模型发布视频生成模型,具备影视级视觉效果
证 券 研 究 报 告 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 未经许可,禁止转载 传媒 2024 年 09 月 25 日 传媒行业重大事项点评 推荐 (维持) 豆包大模型发布视频生成模型,具备影视级 视觉效果 事项: 9 月 24 日,字节跳动在 2024 火山引擎 AI 创新巡展深圳站发布豆包 PixelDance和豆包 Seaweed 两种版本的视频生成大模型,现已邀请部分企业试用模型。 评论: 产品表现看,豆包视频生成模型具备高度语义理解和多镜头控制能力,能生成不同比例的画质高保真、风格多元的视频。根据火山引擎公众号,产品表现优势体现在 1)精准语义理解,解决多主体动作交互难题。可以遵从复杂的用户提示词,精确理解语义关系,解锁时序性多拍动作指令与多个主体间的交互能力;2)强大的运镜控制能力,能生成一致性多镜头视频。在一句提示词内,可实现多个镜头切换,能让视频在主体的大动态与镜头中来回切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。在镜头切换的同时,还能保持主体、风格和氛围的一致性;3)高保真高美感,支持多种风格及比例。风格包括黑白、3D 动画、2D 动画、国画、水彩、水粉等。比例方面,模型支持1:1、3:4、4:3、16:9、9:16、21:9 六个比例,适配电影、电视、电脑、手机等多种场景。 技术参数看,豆包视频生成模型在计算单元、训练方法和架构上进行了技术优化或创新。根据火山引擎公众号,包括 1)高效的 DiT 融合计算单元,更充分地压缩编码视频与文本;2)全新设计的扩散模型训练方法,支持一致性多镜头生成;3)深度优化的 Transformer 结构,能大幅提升视频生成的泛化能力。 应用场景看,可用于电商、影视、广告营销等多领域。根据智东西公众号,场景包括 1)电商营销:视频生成模型可生成商品的 3D 形态,从而动态多角度地展示商品。2)动画:视频生成模型可大幅降低动画的制作成本。3)其他:城市文旅、音乐 MV、微电影、短剧等。 我们认为,字节跳动是国内算力储备好+视频语料多+技术人才丰的科技大厂之一,豆包视频生成模型的发布标志着其在视频生成领域加速追赶海外,看好视频模型侧进展驱动广告营销、影视院线、电商等产业 AI 应用加速发展。 风险提示:政策监管趋严,AI 技术迭代发展不及预期,AI 产品商业化不及预期等。 证券分析师:刘欣 电话:010-63214660 邮箱:liuxin3@hcyjs.com 执业编号:S0360521010001 证券分析师:赵海楠 邮箱:zhaohainan@hcyjs.com 执业编号:S0360524070016 行业基本数据 占比% 股票家数(只) 142 0.02 总市值(亿元) 11,641.09 1.42 流通市值(亿元) 10,497.80 1.64 相对指数表现 % 1M 6M 12M 绝对表现 5.8% -27.8% -23.7% 相对表现 5.1% -22.3% -13.3% 相关研究报告 《传媒行业周观察(20240916-20240920):阿里通义万相发布视频生成模型,字节豆包亦发布在即;国庆档电影排片丰富》 2024-09-22 《传媒行业周观察(20240909-20240913):AI 产业趋势向上,OpenAI 发布新模型 o1,苹果推出 AI手机 iPhone16 》 2024-09-17 《影视行业跟踪报告:受供给波动影响短期大盘承压,积极关注 25 年产品释放》 2024-09-17 -28%-15%-2%12%23/0923/1224/0224/0524/0724/092023-09-25~2024-09-24传媒沪深300华创证券研究所 传媒行业重大事项点评 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 2 一、豆包视频生成模型具备影视级视觉效果 豆包视频生成模型具备高度语义理解和多镜头控制能力,能生成不同比例的画质高保真、风格多元的视频。根据火山引擎公众号,产品表现优势体现在 1)精准语义理解,解决多主体动作交互难题。可以遵从复杂的用户提示词,精确理解语义关系,解锁时序性多拍动作指令与多个主体间的交互能力;2)强大的运镜控制能力,能生成一致性多镜头视频。在一句提示词内,可实现多个镜头切换,能让视频在主体的大动态与镜头中来回切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。在镜头切换的同时,还能保持主体、风格和氛围的一致性;3)高保真高美感,支持多种风格及比例。风格包括黑白、3D 动画、2D 动画、国画、水彩、水粉等。比例方面,模型支持 1:1、3:4、4:3、16:9、9:16、21:9 六个比例,适配电影、电视、电脑、手机等多种场景。 图表 1 豆包·视频生成模型遵从复杂 prompt,解锁时序性多拍动作指令与多个主体间的交互能力 图表 2 豆包·视频生成模型拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力,灵活控制视角 资料来源:火山引擎公众号,华创证券 资料来源:火山引擎公众号,华创证券 图表 3 豆包·视频生成模型可实现多镜头切换的同时,保持主体、风格、氛围的一致性 图表 4 豆包·视频生成模型高保真高美感,支持多种风格与视频比例,适配各种终端 资料来源:火山引擎公众号,华创证券 资料来源:火山引擎公众号,华创证券 二、技术优化及创新,成就卓越生成能力 技术参数看,豆包视频生成模型在计算单元、训练方法和架构上进行了技术优化或创新。根据火山引擎公众号,包括 1)高效的 DiT 融合计算单元,更充分地压缩编码视频与文本;2)全新设计的扩散模型训练方法,支持一致性多镜头生成;3)深度优化的 Transformer结构,能大幅提升视频生成的泛化能力。 传媒行业重大事项点评 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 3 图表 5 视频生成模型技术介绍 资料来源:智东西公众号,华创证券 三、广阔应用场景,驱动产业创新变革 根据智东西公众号,视频生成模型可应用于电商营销、动画教育、城市文旅、微剧本等广阔商业场景中,实现降本增效及产业创新变革。例如,在电商营销场景,豆包·视频生成模型可快速把商品变成 3D 动态多角度展示,还能配合中秋、七夕、春节等节点替换背景和风格,生成不同尺寸快速上架;在动画教育场景,豆包·视频生成模型可以大幅降低动画的制作成本,生动的呈现童话故事情节;此外如城市文旅、音乐 MV、微电影、短剧等应用场景,可通过豆包·视频生成模型实现降本提效和创意合规。 图表 6 视频生成模型应用场景 资料来源:智东西公众号,华创证券 四、风险提示 政策监管趋严,AI 技术迭代发展不及预期,AI 产品商业化不及预期等。 传媒行业重大事项点评 证监会审核华创证券投资咨询业务资格批文号:证监许可(2009)1210 号 4 传媒组团队介绍 组长、首席分析师:刘欣 中国人民大学硕士。先后于中金公
[华创证券]:传媒行业重大事项点评:豆包大模型发布视频生成模型,具备影视级视觉效果,点击即可下载。报告格式为PDF,大小1.38M,页数6页,欢迎下载。
