传媒互联网行业周报:重视AI多模态带来的商业化价值
请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远 1 [Table_Title] 传媒互联网 重视 AI 多模态带来的商业化价值 [Table_Summary] 报告摘要 谷歌 Gemini 1.0 发布,测试表现远超现有多模态大模型 12 月 6 日,谷歌原生多模态大模型 Gemini 1.0 版正式上线,针对不同任务,其分为 Gemini Ultra,Gemini Pro 和 Gemini Nano。该模型具有复杂多模态推理能力,可以帮助理解复杂的书面和视觉信息,还可以同时识别和理解文本、图像、音频等内容。在编码方面,其具备擅长解决超越编码的复杂数学和理论计算机科学的竞争性编程问题的代码生成系统 AlphaCode2。不同于为不同模态训练独立组件后拼接的多模态模型创建方法,Gemini 1.0 先在不同模态上进行预训练,再用额外的多模态数据进行微调,以进一步提高其效果,这使得Gemini 可以从零开始无缝理解和推理不同类型的信息,表现远超现有的多模态模型。具体来看,Gemini Ultra 在 MMLU(大规模多任务语言理解)测试中,以 90.0%的高分首次超过人类专家;在包括跨领域多模态任务的 MMMU(大规模多学科多模态理解)基准测试中,Gemini Ultra 取得了 59.4%的高分,高于 GPT-4V 的 56.8%。我们认为,Gemini 1.0 是 AI 技术在多模态领域取得里程碑式进展的重要标志,其将为相关 AI 应用发展提供有力支持,促进应用产品丰富和应用场景拓展。 Pika 1.0 测评结果表现突出,进一步打开 C 端市场 2023 年 11 月 29 日,美国 AI 初创公司 Pika Labs 发布其视频生成模型 Pika 1.0,该模型具备使用文本生成和编辑多种风格视频的功能。 根据数字生命卡兹克的测评:1)在使用方面,Pika 1.0 相较于此前在 Discord 社区的公测版更易用。视频比例和帧率、镜头控制和速度、负面提示词及提示词相关性都由原来的手动输入改进为了页面点击设置,并且视频扩展、区域修改、放大增强和视频延长 4秒的功能在生成视频后的二次编辑窗口可直接点击使用。2)在生成视频的效果方面,Pika 1.0 模型的语义理解能力强,文生视频和图生视频的质量大幅提升,模型尤其擅长 3D 和 3D 动画风格。3)此外,视频扩展、区域修改、视频延长 4 秒、一键增强功能也表现突出。我们认为,Pika 1.0 模型各项功能的突出表现将吸引更多的视频创作者了解并使用多模态大模型辅助创作,进一步打开 C 端用户市场,扩大 AI 大模型的商业化空间。 走势对比 子行业评级 影视 出版 看好 看好 游戏 看好 相关研究报告 《AI 多模态提升商业化价值,应用多点开花验证景气度》 《抖音测试视频内容付费服务,探索盈利新模式》 证券分析师:郑磊 E-MAIL:zhenglei@tpyzq.com 执业资格证书编码:S1190523060001 01,0002,0003,0004,0002022-12-092023-06-09传媒指数沪深300[Table_Message] 2023-12-10 行业周报 看好/维持 传媒互联网 行业研究报告 太平洋证券股份有限公司证券研究报告 请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远 2 AI+视频新产品和新技术持续更新迭代,商业化价值有望提升 回顾近期受到市场关注的 AI+视频产品的进展:1)2022 年 7 月,诗云科技推出具备声音克隆、AI 数字人生成等功能的在线视频生成平台 HeyGen。2)2023 年 11 月 3 日,Runaway 对视频生成模型 Gen-2进行更新,提高生成视频的清晰度和一致性;11 月 20 日上线运动笔刷功能,实现视频局部区域的由静转动。3)11 月 16 日,Meta 发布基于扩散模型的文本/图像到视频的视频生成应用 Emu Video。4)11月 18 日,字节跳动发布高动态视频生成模型 PixelDance。5)11 月21 日,Stability AI 推出由文本/图像到视频的 Stable Video Diffusion(SVD)开源视频生成模型。6)11 月 28 日,Pika Labs 发布具备使用文本生成和编辑多种风格视频功能的视频生成模型 Pika 1.0。12 月 8 日,Pika Research 首次对外披露的技术细节显示,基于 DreamPropeller 方法,文本到 3D 的生成速度可提升 4.7 倍。我们认为,AI+视频领域正方兴未艾,新产品推出和技术迭代将持续推动该领域的发展。并且,过往由于 AI 应用主要集中于 B 端,商业化发展受到限制。随着多模态技术取得突破,C 端用户需求得到满足,AI 多模态有望进一步打开 C 端市场,提升商业化价值。 投资建议: 我们认为,谷歌 Gemini 1.0 发布标志着多模态领域取得里程碑式进展,产业趋势确定性进一步明确。在商业化方面,过往由于 AI 应用主要集中于 B 端,商业化发展受到限制。随着多模态新产品和新技术的持续迭代,Pika 在多模态领域取得突破,AIGC 有望在文娱行业拓展应用,进一步打开 C 端市场,提升商业化价值。今年是 AI 应用落地的元年,建议重视场景和用户的价值,推荐关注三条主线:1)大模型和 AI Agents:昆仑万维;2)多模态:文字 IP:中文在线、掌阅科技;形象 IP:上海电影,奥飞娱乐;多模态赋能视频:华策影视,光线传媒;3)AI 应用:AI 社交产品:盛天网络;AI 教育:皖新传媒,佳发教育;AI 校对:果麦文化;AI 游戏:恺英网络、三七互娱、吉比特、巨人网络、电魂网络、掌趣科技。 风险提示: AI 技术发展不及预期风险;政策监管风险;行业竞争加剧风险。 行业周报 P3 报告标题 请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远 3 目录 1 一周行情回顾 ...................................................... 6 2 行业运行数据 ...................................................... 7 2.1.游戏 ............................................................ 7 2.2.电影 ........................................................... 11 2.3.电视剧 ......................................................... 11 2.4.综艺节
[太平洋]:传媒互联网行业周报:重视AI多模态带来的商业化价值,点击即可下载。报告格式为PDF,大小2.03M,页数24页,欢迎下载。
