传媒互联网行业周报:OpenAI o1模型发布,强化学习有望突破Scaling Law瓶颈
请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远 1 [Table_Title] 传媒互联网 OpenAI o1 模型发布,强化学习有望突破 Scaling Law 瓶颈 (2024.09.09-09.15) [Table_Summary] 报告摘要 ➢ OpenAI o1 新系列模型发布,包括 o1 预览版和 o1-mini 9 月 13 日 OpenAI 发布 o1 新系列模型,即为此前曾透露的草莓模型。由于相较 GPT 系列模型,o1 系列模型更擅长推理并解决科学、编程、数学领域的复杂问题,因此 OpenAI 将模型名称重置回数字 1,并命名为 o1。o1 新系列模型包括 o1、o1 预览版和 o1-mini,此次仅发布了 o1 预览版和 o1-mini,o1 上线时间未定。 ➢ 通过生成思维链,o1 模型具备更强的推理能力 o1 模型是运用强化学习训练的新型语言模型。类比于丹尼尔·卡尼曼提出的人类大脑的两个思考系统,即依赖直觉和经验、快速且无意识的系统 1 和深思熟虑、谨慎且有意识的系统 2,o1 模型的发布意味着大模型从运用系统 1 发展到了运用系统 2。表现在使用过程中,即为大模型不再是对问题做出即刻响应,而是先进行一定时间的思考,生成解释推理过程的内部思维链。 通过思维链,o1 模型能对问题做出结构化的思考和推理,而不再像之前通过大量非结构化的文本数据进行模型训练,模型仅能根据上下文内容生成答案。并且通过强化学习,o1 模型能不断尝试直到找到正确的解答思路、完善思维链、学会识别和纠正错误等。这一改变极大地提高了模型的推理能力,o1 预览版在数学和编程竞赛测试中的得分较 GPT-4o 提升约 5-6 倍,o1 则提升约 8-9 倍,在博士级的科学问题测试中,o1 预览版和 o1 均超过了人类专家水平。 图表 1:GPT-4o、o1 预览版、o1-mini 测试得分对比 资料来源:OpenAI 官网,太平洋证券研究院 ◼ 走势对比 ◼ 子行业评级 ◼ 相关研究报告 《出版 24H1 总结:所得税致净利润承压,中期分红稳定全年预期》 《7 月游戏市场收入 278 亿,OpenAI 草莓模型有望年内上线》 ◼ 证券分析师:郑磊 E-MAIL:zhenglei@tpyzq.com 执业资格证书编码:S1190523060001 [Table_Message] 2024-09-15 行业周报 看好/维持 传媒互联网 行业研究报告 太平洋证券股份有限公司证券研究报告 请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远 2 ➢ o1 模型响应时间更长,使用次数有限 在使用上,目前 o1 主要为以文本形式进行问题的分析解答,仍不具备浏览网页信息、上传文件和图像等 ChatGPT 已有的功能。从官方演示视频来看,o1 预览版单次响应时间为 32 秒,o1-mini 为 9 秒,长于 GPT 系列。o1 预览版和 o1-mini 已在发布当天逐步向 ChatGPT Plus 和 Team 用户开放,但使用次数有所限制,o1 预览版每周 30 条,o1-mini 每周 50 条。并且从下周开始,这两款模型也将向 ChatGPT企业版和高校版用户开放。未来 OpenAI 考虑将 o1-mini 向所有免费用户开放。在 API 调用方面,符合条件的开发者可调用 o1 预览版和o1-mini 的 API,o1-mini 的价格比 o1 预览版便宜 80%。 ➢ 强化学习有望突破 Scaling Law 瓶颈 OpenAI 发现随着强化学习规模(训练时间计算)和思考时长(测试时间计算)的提升,o1 模型性能持续提高。这意味着除了增加训练数据数量,模型性能还可通过同时增加推理时长实现提升。Scaling Law 的范式正在向推理环节发展,并且扩展这一方法的限制与此前预训练方法的限制不同,目前仍在继续探索和研究中。我们认为,OpenAI 一直是 AI 技术的先行者,o1 模型的发布及强化学习方法的提出有望加速产业内其他公司对该方法的探索,突破 Scaling Law的发展瓶颈。 图表 2:o1 模型性能随强化学习规模和思考时长提升而提高 资料来源:OpenAI 官网,太平洋证券研究院 ➢ 核心观点 我们认为,目前传媒指数已回落至 2023 年 AI 行情起涨点,随 o1 模型发布及后续强化学习对大模型技术路径发展的突破,有望迎来海外 AI 产业催化。建议关注:1)AI 模型:昆仑万维;2)文字 IP:中文在线;3)AI 视频工具:上海电影、博纳影业,华策影视、因赛集团;4)AI 游戏:掌趣科技、巨人网络等。 ➢ 风险提示 AI 技术发展不及预期的风险、政策监管风险、行业竞争加剧的风险。 行业周报 P3 报告标题 请务必阅读正文之后的免责条款部分 守正 出奇 宁静 致远 3 目录 1 一周行情回顾.................................................. 6 2 行业运行数据.................................................. 7 2.1.游戏 ..........................................................7 2.2.AI ...........................................................11 2.3.电影 .........................................................12 2.4.电视剧 .......................................................13 2.5.综艺节目 .....................................................14 2.6.渠道 .........................................................14 2.7.直播电商 .....................................................15 2.8.广告营销 .....................................................15 3 重点公司重要公告速览 ......................................... 16 4 行业要闻 .................................................... 17 4.1.AI ..............................
[太平洋证券]:传媒互联网行业周报:OpenAI o1模型发布,强化学习有望突破Scaling Law瓶颈,点击即可下载。报告格式为PDF,大小2.31M,页数25页,欢迎下载。
