计算机行业AI动态跟踪系列(八):GPT-5降幻觉、强编码,全面提升大模型实际应用效果

AI 动态跟踪系列(八) GPT-5 降幻觉、强编码,全面提升大模型实际应用效果 行业动态跟踪报告 请通过合法途径获取本公司研究报告,如经由未经许可的渠道获得研究报告,请慎重使用并注意阅读研究报告尾页的声明内容。 行业报告 计算机计算机 2025 年 08 月 13 日 强于大市(维持) 行情走势图 相关研究报告 【平安证券】行业动态跟踪报告*计算机*AI 动态跟踪系列(七)国产大模型竞争力持续提升,坚定看好我国 AI 产业发展*强于大市 20250731 证券分析师 闫磊 投资咨询资格编号 S1060517070006 YANLEI511@pingan.com.cn 黄韦涵 投资咨询资格编号 S1060523070003 HUANGWEIHAN235@pingan.com.cn 王佳一 投资咨询资格编号 S1060525070001 WANGJIAYI446@pingan.com.cn 事项: 当地时间 8 月 7 日,OpenAI 推出 GPT-5。 平安观点:  GPT-5 实现全方位性能提升,幻觉显著降低。GPT-5 为 OpenAI 迄今为止最智能、最快、最有用的模型,具有内置思维,提供专家级智能。1)模型性能全方位提升,特别是在数学(AIME 2025 without tools 94.6%)、真实世界编码(SWE-bench Verify 74.9%,Aider Polyglot 88%)、多模态理解(MMMU 84.2%)和健康(HealthBench Hard 46.2%)方面。2)思考更高效,大幅降低幻觉。GPT-5 thinking 在视觉推理、代理编码和研究生水平科学问题解决等的输出 tokens 同等准确度下较 o3 减少了 50-80%,同时幻觉大约为 o3 的六分之一。3)ChatGPT 三种最常见功能(编码、写作和健康)的性能提升。GPT-5 是 OpenAI 迄今为止最强大的编码模型,只需一个提示即可创建美观且响应迅速的网站、应用程序和游戏,并注重审美。GPT-5 能够更可靠地处理涉及结构歧义的写作,在尊重形式的同时保持表达清晰。GPT-5 HealthBench 得分明显高于之前的任何模型,是 OpenAI 迄今为止解决健康相关问题的最佳模型。  擅长代理编码和智能体任务,API 定价更具竞争力。在 API 中,OpenAI将发布 GPT-5、GPT-5 mini、GPT-5 nano 三种大小的模型,总上下文长度均为 400K tokens。OpenAI 称 GPT-5 为用于编码和智能体任务的先进模型,不仅体现于 GPT-5 在关键编码基准测试中取得 SOTA,还体现在:1)前端工程,GPT-5 生成前端代码时更具美观性、执行跨度更大、更具准确性,相较 o3,在 70%的时间更受内部测试人员的青睐。2)编码协作,特别体现在 Cursor、Windsurf、GitHub Copilot 和 Codex CLI 等代理编码产品中。GPT-5 在完成跨度大的任务方面更加积极主动,不会等待指令暂停,也不会因高复杂性而犹豫不决。3)擅长代理任务,GPT-5 在遵循指令和代理工具使用基准上创下新记录,能够更可靠地将动作串联起来以完成现实世界的任务。值得注意的是,GPT-5 的 API定价相较于 OpenAI o3等之前的模型以及同业可比模型都更具竞争力。  投资建议:GPT-5 实现全方位性能提升,尤其优化了编码、写作、健康等常见功能的性能,同时显著降低幻觉,提升思考效率,API 定价也更具性价比。OpenAI 作为全球大模型巨头持续提升大模型产品力,注重大模型在实践中的使用效果,降低使用成本,专注于提升用户体验。我们认为,当前全球 AI 大模型领域竞争依然白热化,有利于持续推动大模型应用的落地普及,也将带来对 AI 算力在训练端及推理端的持续旺盛需求,从而拉动 AI 算力市场持续高景气。我们坚定看好我国 AI 产业的未来发展,建议关注 AI 主题的投资机会。标的方面:1)AI 算法和应用:强烈推荐恒生电子、中科创达、盛视科技,推荐道通科技、金山办公、同花顺、宇信科技、福昕软件、万兴科技、彩讯股份,建议关注鼎捷数智、汉得信息、赛意信息、普联软件、泛微网络、致远互联。2)AI 算力:推荐海光信息、龙芯中科、工业富联、浪潮信息、紫光股份、中科曙光、神州数码、深信服,建议关注寒武纪、华勤技术、景嘉微、软通动力、拓维信息。  风险提示:1)国产 AI 算力芯片发展不及预期。2)大模型产品的应用落地低于预期。3)国内大模型算法发展可能不及预期。 证券研究报告 请通过合法途径获取本公司研究报告,如经由未经许可的渠道获得研究报告,请慎重使用并注意阅读研究报告尾页的声明内容。 计算机·行业动态跟踪报告 2/ 11 一、 GPT-5 实现全方位性能提升,幻觉显著降低 OpenAI 推出 GPT-5,称其为 OpenAI 迄今为止最智能、最快、最有用的模型,具有内置思维,提供专家级智能。GPT-5作为一个统一的系统,知道何时快速响应,何时思考更长时间以提供专家级响应。GPT-5 不仅在基准测试上优于以前的模型,并能更快地回答问题,这对现实世界的查询更有用。GPT-5 可供所有用户使用,Plus 订阅者可以使用更多,而 Pro 订阅者可以访问 GPT-5 pro,该版本具有扩展推理功能,可提供更全面、更准确的答案。  模型性能全方位提升 GPT-5 是 OpenAI 之前所有模型在智能方面的重大飞跃,在编码、数学、写作、健康、视觉感知等方面具有最先进的性能。 基础性能角度,OpenAI 称,GPT-5 在各个方面都更加智能,特别是在数学(AIME 2025 without tools 取得 94.6%)、真实世界编码(SWE-bench Verify 取得 74.9%,Aider Polyglot 取得 88%)、多模态理解(MMMU 取得 84.2%)和健康(HealthBench Hard 取得 46.2%)方面。此外凭借 GPT-5 pro 的扩展推理,该模型还在 GPQA (专家科学问答基准)上设定了新的 SOTA,无需工具即可得分 88.4%。 图表1 GPT-5 编码能力更进一步 图表2 GPT-5 pro 在 GPQA 上设立新 SOTA 资料来源:OpenAI 官网,平安证券研究所 资料来源:OpenAI 官网,平安证券研究所 Agent 角度,GPT-5 在测试指令遵循和代理工具使用的基准测试中取得了显著进展,这些功能使其能够可靠地执行多步骤请求、跨不同工具进行协调并适应上下文变化。这意味着 GPT-5 在实践中更擅长处理复杂的、不断变化的任务,可以更忠实地遵循指示,并使用其可用的工具实现端到端完成更多工作。 请通过合法途径获取本公司研究报告,如经由未经许可的渠道获得研究报告,请慎重使用并注意阅读研究报告尾页的声明内容。 计算机·行业动态跟踪报告 3/ 11 图表3 GPT-5 在遵循指令和代理工具使用基准上取得进展 资料来源:OpenAI 官网,平安证券研究所 多模态角度,GPT

立即下载
电子设备
2025-08-18
平安证券
11页
1.32M
收藏
分享

[平安证券]:计算机行业AI动态跟踪系列(八):GPT-5降幻觉、强编码,全面提升大模型实际应用效果,点击即可下载。报告格式为PDF,大小1.32M,页数11页,欢迎下载。

本报告共11页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共11页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
可比公司估值表
电子设备
2025-08-18
来源:优必选(09880.HK)人形机器人全栈式技术布局,迎接商业化浪潮
查看原文
优必选重要财务指标
电子设备
2025-08-18
来源:优必选(09880.HK)人形机器人全栈式技术布局,迎接商业化浪潮
查看原文
公司费用及费用率
电子设备
2025-08-18
来源:优必选(09880.HK)人形机器人全栈式技术布局,迎接商业化浪潮
查看原文
公司 2020-2024 毛利润及毛利率 图表52: 公司 2020-2024 净利润及净利率
电子设备
2025-08-18
来源:优必选(09880.HK)人形机器人全栈式技术布局,迎接商业化浪潮
查看原文
公司前五大客户销售额情况 图表50: 公司最大客户销售额情况
电子设备
2025-08-18
来源:优必选(09880.HK)人形机器人全栈式技术布局,迎接商业化浪潮
查看原文
公司收入分地区构成 图表48: 公司 2024 年分地区收入占比
电子设备
2025-08-18
来源:优必选(09880.HK)人形机器人全栈式技术布局,迎接商业化浪潮
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起