AI周观察:OpenAI发布会o3压轴,iOS18.2正式版发布
敬请参阅最后一页特别声明 1 摘要 - OpenAI 12 Days 发布会结束,o3 系列模型作为压轴发布,o3 在数学能力上的提升显著,但推理成本也十分昂贵,高算力版本单任务超过 1000 美元,证明了 scaling law 新方向的存在。Google 也频繁发布新模型争抢热度,Gemini 2.0 flash 和推理思考版本的发布和快速投入使用标志着 Google 仍在 AI 和大模型应用的第一梯队。 - 海外 AI 聊天助手类应用受圣诞假期影响,访问量多数出现下滑,ChatGPT 访问量基本不变。Sora 的访问量开始快速下滑,主要原因是其生成质量低于预期,并且竞争对手在快速更新模型。 - 美光科技 2025 财年第一季度财报显示,尽管面临传统消费存储市场的低迷,AI 驱动的存储需求和数据中心业务的强劲增长成为公司业绩的主要亮点。随着 AI 技术的普及,高带宽存储(HBM)和高性能 DRAM 产品需求快速增长,推动了美光在数据中心领域的业务扩展。与此同时,传统的 PC 和手机存储需求复苏缓慢,库存调整压力仍在。展望未来,存储市场的增长将继续由 AI 和高性能计算需求主导,各大存储巨头正加大在数据中心和 AI 存储领域的投资布局。 - iOS18.2、iPadOS 18.2 和 macOS Sequoia 15.2 等操作系统的正式发布标志着苹果完成 Apple Intelligence 的第一步。随着更多实用、可玩性更高的 AI 应用加入端侧,我们认为用户对于 AI 手机的接受度也会更高,受苹果推动,2024 年四季度及 2025 年 AI 手机的渗透率将会进一步提高。同时苹果对隐私的高要求也促使苹果数据中心摆脱对大型云厂的依赖转向自建数据中心,建议关注其中产业链相关机会。 风险提示 芯片制程发展与良率不及预期 中美科技领域政策恶化 智能手机销量不及预期 行业周报(简报) 敬请参阅最后一页特别声明 2 扫码获取更多服务 内容目录 OpenAI 12Days 发布会结束,o3 压轴发布,Google 连夜狙击 ........................................... 3 受圣诞假期影响,海外 AI 应用热度下降,国内应用仍快速增长......................................... 4 视频生成模型在快速发布期,Sora 热度下降明显 ..................................................... 5 AI 与数据中心推动增长,传统存储市场挑战加剧 ..................................................... 6 iOS18.2 正式版发布,Apple Intelligence 获得更多功能支持.......................................... 7 风险提示........................................................................................ 7 行业周报(简报) 敬请参阅最后一页特别声明 3 扫码获取更多服务 OpenAI 12Days 发布会结束,o3 压轴发布,Google 连夜狙击 OpenAI 在为期 12 天的连续发布会的最后一天,压轴推出了其 o 系列模型的续作——o3 及o3 mini。o3 模型在推理能力上取得了巨大突破,尤其在复杂推理任务中表现出色,其核心技术依然是“思维链”,通过模拟人类的思考过程进行逐步推理,更接近通用人工智能(AGI)。在专门为 AGI 设计的测试 ARC-AGI 中,o3 高计算版本达到了 88%的正确率,同时单任务成本也超过 1000 美元。在 EpochAI 的 Frontier Math 基准测试中,o3 解决了 25.2%的问题,而其他模型的解决率都没有超过 2%。我们认为,o3 的测试结果和成本证实了,大模型的 Scaling Law 正在预训练之外的方向生效,总体的模型能力的提升的 Scaling Law 仍然存在。 图表1:OpenAI o3 系列模型在 ARC-AGI 测试集上的表现 来源:arcprize、国金证券研究所 在第 7 天和第 8 天,OpenAI 分别推出了 Projects In ChatGPT 功能和 ChatGPT 搜索功能。前者整合了 ChatGPT 的多种功能,便于用户创建和管理项目文件夹;后者则增强了其联网检索能力。紧接着,在第 9 天的发布会上,OpenAI 宣布了定价和价格调整策略,并开放了o1 模型的 API。根据新定价,o1 模型每分析约 75 万字收费 15 美元,每生成约 75 万字收费 60 美元,这一费用是最新非推理模型 GPT-4o 的 3 到 4 倍。第 10 天,OpenAI 进推出了“热线”互动方式,允许新用户通过电话和 WhatsApp 与 ChatGPT 进行交流,提升了用户接入和互动的便捷性。在第 11 天,OpenAI 对 ChatGPT 应用程序进行了重要升级,新增了原生自动化协作功能。演示案例显示,ChatGPT 在编程方面表现尤为突出,能够主动理解用户需求,解决如分析代码库数据、处理复杂编码逻辑等问题,显著提高开发效率,节省大量时间。这一功能与 AI 代理(AI Agent)类似,但在操作复杂任务时更加高效。 Google 在 OpenAI 的 12 天发布会中一反之前被动的态势,从被“截胡”开始主动出击,无论是在 Sora 发布后公开效果更好的视频生成模型 Veo 2,还是率先推出下一代模型Gemini 2.0 Flash,并且在 o3 发布前推出 Gemini 2.0 Flash Thinking 这种类似的推理思考模型。我们认为 Google 在大模型和应用方面开始回到正轨,配合 TPU 的成本优势,在明年的 AI 市场上竞争力会大幅提升。 行业周报(简报) 敬请参阅最后一页特别声明 4 扫码获取更多服务 受圣诞假期影响,海外 AI 应用热度下降,国内应用仍快速增长 图表2:聊天助手类 AI 应用日活跃度 来源:SimilarWeb、国金证券研究所 行业周报(简报) 敬请参阅最后一页特别声明 5 扫码获取更多服务 海外 AI 聊天助手类应用受圣诞假期影响,访问量上周除了 ChatGPT 基本不变,其他应用多数出现下降。国内多数 AI 聊天应用在持续上升,其中字节豆包增速最快,环比增长 26.5%,网页周均日访问量超过 1M,通义千文和 Kimi 有个位数的增长。 视频生成模型在快速发布期,Sora 热度下降明显 图表3:视频生成类 AI 应用日活跃度 来源:SimilarWeb、国金证券研究所 Sora 的访问量开始快速回落,环比下降 53.7%,主要原因是视频生成效果和时长不及预期并且伴随着竞争对手的快速更新迭代。其他视频生成应用多数仍在增长,如即梦、可灵国内版、Pika,而 Runway 和可灵海外版出现个位数的
[国金证券]:AI周观察:OpenAI发布会o3压轴,iOS18.2正式版发布,点击即可下载。报告格式为PDF,大小1.58M,页数9页,欢迎下载。
