算力周跟踪:OpenAI发布o1大模型,开启强化学习新范式
行业研究行业定期报告证券研究报告诚信专业发现价值1请务必阅读报告末页的声明电子2024 年 09 月 19 日电子OpenAI 发布 o1 大模型,开启强化学习新范式-算力周跟踪投资要点:本周 CPU/GPU 板块出现回调,云计算板块普涨。(1)CPU/GPU 板块:本周(0916-0918)英伟达-4.81%,海光信息-4.17%,寒武纪-4.76%,龙芯中科-3.03%。英特尔+5.65%,当地时间 9 月 16 日,英特尔公布业务调整消息,剥离芯片代工业务。(2)云计算板块:商汤科技+5.77%,9 月 14日公布商汤科技 5.2 亿中标移动天津 2024 年智算中心一期。最新一周数据显示文本大模型总体访问量持续亮眼。据 similarweb 最新数据(0906-0912):(1)ChatGPT 和 Perplexity 访问量持续攀升。(2)豆包访问量长期增长。9 月 14 日,“豆包爱学”全新升级,推出了很多辅助学习的实用功能。(3)Runway 访问量继续提升。9 月 14 日,Runway推出一种新的控制机制,可以通过参考视频来精确控制运动、表现力和意图,大大提高 AI 制作电影、游戏特效方向的可行性。据七麦最新数据(0911-0917):阿里通义下载量增长稳定。通义万相 AI 生视频将在 9 月19 日上线,现已开启预约,支持文或图生视频,支持多语音与可变分辨率生成。OpenAI 公开 o1 大模型,强化学习 Scaling Law 提出算力需求。9 月13 日,OpenAI 正式公开 o1 大模型,即此前宣传的草莓大模型。它具备真正的通用推理能力,在高难度基准测试中展现出色的表现,相比 GPT-4o 有显著提升。OpenAI 还发布了成本效率更高的 o1-mini 模型,尤其擅长编程任务。目前,ChatGPT Plus 和 Team 用户可以开始使用 o1 模型,但使用量有限。OpenAI 计划未来增加更多功能,如网络浏览、文件和图像上传等,以提升模型的实用性。观点#1:思维链深化推理能力,强化学习突破 LLM 推理极限。从方法上,o1 大模型首次证明了语言模型可以进行真正的强化学习——给越多算力,就输出越多智能,一直到超越人类水平。o1 还引入了思维链(CoT)推理,也就是该模型在作出反应之前,需要像人类一样,花更多时间思考问题。通过训练,它们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。CoT 显著扩展了模型的表达能力,使其能够处理更复杂的问题。观点#2:OpenAI o1 打破 Scaling law 瓶颈,反哺多模态通用模型。目前普遍认为通过增加数据和模型规模来提升大模型效果的 Scaling law 模式,其增长速度在放缓。目前面临的问题包括数据资源的枯竭,因为像 GPT-4这样的模型已经使用了大量可用数据,导致“数据荒”。同时,大模型的训练需要大量 GPU 资源,这也使得算力和数据的扩展面临瓶颈。OpenAI 发现,随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1 的性能持续提高,而且扩展这种方法的限制与大模型预训练的限制有很大不同。可以通过 o1 增强最重要的基座模型逻辑推理能力,再把这种能力迁移到 GPT 4o 这种多模态通用模型上。比如通过直接用 o1 基座模型替换GPT 4o 的基座、或者利用 o1 模型生成逻辑推理方面的合成数据增强 GPT4o、再或者用 o1 蒸馏 GPT 4o 模型。建议关注- 国产算力链:寒武纪、海光信息、龙芯中科、盛科通信等。- 数据中心硬件:中际旭创、工业富联、新易盛、天孚通信、沃尔核材、英维克、沪电股份、胜宏科技。风险提示强于大市(维持评级)一年内行业相对大盘走势团队成员分析师: 陈海进(S0210524060003)chj30590@hfzq.com.cn分析师: 徐巡(S0210524060004)xx30511@hfzq.com.cn联系人: 李雅文(S0210124040076)lyw30508@hfzq.com.cn相关报告1、20240918 周报: 关注端侧 AI+折叠屏等创新技术的加速渗透——2024.09.182、当前坚定看好半导体底部机会-半导体周跟踪——2024.09.163、苹果、华为新机持续亮相,Meta9 月发布会在即——消费电子系列跟踪——2024.09.14华福证券华福证券诚信专业发现价值2请务必阅读报告末页的重要声明行业定期报告 | 电子技术发展及落地不及预期;下游终端出货不及预期;下游需求不及预期;市场竞争加剧风险;地缘政治风险。华福证券华福证券诚信专业发现价值3请务必阅读报告末页的声明行业定期报告 | 电子图表 1:算力股价本周复盘(0916-0918)来源:Wind,iFinD,华福证券研究所注:以上市值、涨跌幅信息截至北京时间 2024 年 9 月 18 日图表 2:文本大模型网站访问量周度数据(单位:万次)图表 3:文本大模型网站访问量周度数据(单位:万次)来源:Similarweb,华福证券研究所来源:Similarweb,华福证券研究所图表 4:图片大模型网站访问量周度数据(单位:万次)图表 5:视频大模型网站访问量周度数据(单位:万次)来源:Similarweb,华福证券研究所来源:Similarweb,华福证券研究所华福证券华福证券诚信专业发现价值4请务必阅读报告末页的声明行业定期报告 | 电子图表 6:国内头部大模型 App 下载量月度数据(单位:万次)来源:七麦数据,华福证券研究所注:文小言即为原文心一言华福证券华福证券诚信专业发现价值5请务必阅读报告末页的声明行业定期报告 | 电子分析师声明本人具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师,以勤勉的职业态度,独立、客观地出具本报告。本报告清晰准确地反映了本人的研究观点。本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。一般声明华福证券有限责任公司(以下简称“本公司”)具有中国证监会许可的证券投资咨询业务资格。本报告仅供本公司的客户使用。本公司不会因接收人收到本报告而视其为客户。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。本报告的信息均来源于本公司认为可信的公开资料,该等公开资料的准确性及完整性由其发布者负责,本公司及其研究人员对该等信息不作任何保证。本报告中的资料、意见及预测仅反映本公司于发布本报告当日的判断,之后可能会随情况的变化而调整。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息及资料保持在最新状态,对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。在任何情况下,本报告所载的信息或所做出的任何建议、意见及推测并不构成所述证券买卖的出价或询价,也不构成对所述金融产品、产品发行或管理人作出任何形式的保证。在任何情况下,本公司仅承诺以勤勉的职业态度,独立、客观地出具本报告以供投资者参考,但不就本报告中的任何内容对任何投资做出任何形式的承诺或担保。投资者应自行决策,自担投资风险。本报告版权归“华福证券有
[华福证券]:算力周跟踪:OpenAI发布o1大模型,开启强化学习新范式,点击即可下载。报告格式为PDF,大小1M,页数5页,欢迎下载。