计算机行业AI动态跟踪系列(八)：GPT-5降幻觉、强编码，全面提升大模型实际应用效果

AI 动态跟踪系列（八） GPT-5 降幻觉、强编码，全面提升大模型实际应用效果行业动态跟踪报告请通过合法途径获取本公司研究报告，如经由未经许可的渠道获得研究报告，请慎重使用并注意阅读研究报告尾页的声明内容。行业报告计算机计算机 2025 年 08 月 13 日强于大市（维持）行情走势图相关研究报告【平安证券】行业动态跟踪报告*计算机*AI 动态跟踪系列（七）国产大模型竞争力持续提升，坚定看好我国 AI 产业发展*强于大市 20250731 证券分析师闫磊投资咨询资格编号 S1060517070006 YANLEI511@pingan.com.cn 黄韦涵投资咨询资格编号 S1060523070003 HUANGWEIHAN235@pingan.com.cn 王佳一投资咨询资格编号 S1060525070001 WANGJIAYI446@pingan.com.cn 事项：当地时间 8 月 7 日，OpenAI 推出 GPT-5。平安观点：  GPT-5 实现全方位性能提升，幻觉显著降低。GPT-5 为 OpenAI 迄今为止最智能、最快、最有用的模型，具有内置思维，提供专家级智能。1）模型性能全方位提升，特别是在数学（AIME 2025 without tools 94.6%）、真实世界编码（SWE-bench Verify 74.9%，Aider Polyglot 88%）、多模态理解（MMMU 84.2%）和健康（HealthBench Hard 46.2%）方面。2）思考更高效，大幅降低幻觉。GPT-5 thinking 在视觉推理、代理编码和研究生水平科学问题解决等的输出 tokens 同等准确度下较 o3 减少了 50-80%，同时幻觉大约为 o3 的六分之一。3）ChatGPT 三种最常见功能（编码、写作和健康）的性能提升。GPT-5 是 OpenAI 迄今为止最强大的编码模型，只需一个提示即可创建美观且响应迅速的网站、应用程序和游戏，并注重审美。GPT-5 能够更可靠地处理涉及结构歧义的写作，在尊重形式的同时保持表达清晰。GPT-5 HealthBench 得分明显高于之前的任何模型，是 OpenAI 迄今为止解决健康相关问题的最佳模型。  擅长代理编码和智能体任务，API 定价更具竞争力。在 API 中，OpenAI将发布 GPT-5、GPT-5 mini、GPT-5 nano 三种大小的模型，总上下文长度均为 400K tokens。OpenAI 称 GPT-5 为用于编码和智能体任务的先进模型，不仅体现于 GPT-5 在关键编码基准测试中取得 SOTA，还体现在：1）前端工程，GPT-5 生成前端代码时更具美观性、执行跨度更大、更具准确性，相较 o3，在 70%的时间更受内部测试人员的青睐。2）编码协作，特别体现在 Cursor、Windsurf、GitHub Copilot 和 Codex CLI 等代理编码产品中。GPT-5 在完成跨度大的任务方面更加积极主动，不会等待指令暂停，也不会因高复杂性而犹豫不决。3）擅长代理任务，GPT-5 在遵循指令和代理工具使用基准上创下新记录，能够更可靠地将动作串联起来以完成现实世界的任务。值得注意的是，GPT-5 的 API定价相较于 OpenAI o3等之前的模型以及同业可比模型都更具竞争力。  投资建议：GPT-5 实现全方位性能提升，尤其优化了编码、写作、健康等常见功能的性能，同时显著降低幻觉，提升思考效率，API 定价也更具性价比。OpenAI 作为全球大模型巨头持续提升大模型产品力，注重大模型在实践中的使用效果，降低使用成本，专注于提升用户体验。我们认为，当前全球 AI 大模型领域竞争依然白热化，有利于持续推动大模型应用的落地普及，也将带来对 AI 算力在训练端及推理端的持续旺盛需求，从而拉动 AI 算力市场持续高景气。我们坚定看好我国 AI 产业的未来发展，建议关注 AI 主题的投资机会。标的方面：1）AI 算法和应用：强烈推荐恒生电子、中科创达、盛视科技，推荐道通科技、金山办公、同花顺、宇信科技、福昕软件、万兴科技、彩讯股份，建议关注鼎捷数智、汉得信息、赛意信息、普联软件、泛微网络、致远互联。2）AI 算力：推荐海光信息、龙芯中科、工业富联、浪潮信息、紫光股份、中科曙光、神州数码、深信服，建议关注寒武纪、华勤技术、景嘉微、软通动力、拓维信息。  风险提示：1）国产 AI 算力芯片发展不及预期。2）大模型产品的应用落地低于预期。3）国内大模型算法发展可能不及预期。证券研究报告请通过合法途径获取本公司研究报告，如经由未经许可的渠道获得研究报告，请慎重使用并注意阅读研究报告尾页的声明内容。计算机·行业动态跟踪报告 2/ 11 一、 GPT-5 实现全方位性能提升，幻觉显著降低 OpenAI 推出 GPT-5，称其为 OpenAI 迄今为止最智能、最快、最有用的模型，具有内置思维，提供专家级智能。GPT-5作为一个统一的系统，知道何时快速响应，何时思考更长时间以提供专家级响应。GPT-5 不仅在基准测试上优于以前的模型，并能更快地回答问题，这对现实世界的查询更有用。GPT-5 可供所有用户使用，Plus 订阅者可以使用更多，而 Pro 订阅者可以访问 GPT-5 pro，该版本具有扩展推理功能，可提供更全面、更准确的答案。  模型性能全方位提升 GPT-5 是 OpenAI 之前所有模型在智能方面的重大飞跃，在编码、数学、写作、健康、视觉感知等方面具有最先进的性能。基础性能角度，OpenAI 称，GPT-5 在各个方面都更加智能，特别是在数学（AIME 2025 without tools 取得 94.6%）、真实世界编码（SWE-bench Verify 取得 74.9%，Aider Polyglot 取得 88%）、多模态理解（MMMU 取得 84.2%）和健康（HealthBench Hard 取得 46.2%）方面。此外凭借 GPT-5 pro 的扩展推理，该模型还在 GPQA （专家科学问答基准）上设定了新的 SOTA，无需工具即可得分 88.4%。图表1 GPT-5 编码能力更进一步图表2 GPT-5 pro 在 GPQA 上设立新 SOTA 资料来源：OpenAI 官网，平安证券研究所资料来源：OpenAI 官网，平安证券研究所 Agent 角度，GPT-5 在测试指令遵循和代理工具使用的基准测试中取得了显著进展，这些功能使其能够可靠地执行多步骤请求、跨不同工具进行协调并适应上下文变化。这意味着 GPT-5 在实践中更擅长处理复杂的、不断变化的任务，可以更忠实地遵循指示，并使用其可用的工具实现端到端完成更多工作。请通过合法途径获取本公司研究报告，如经由未经许可的渠道获得研究报告，请慎重使用并注意阅读研究报告尾页的声明内容。计算机·行业动态跟踪报告 3/ 11 图表3 GPT-5 在遵循指令和代理工具使用基准上取得进展资料来源：OpenAI 官网，平安证券研究所多模态角度，GPT

立即下载

电子设备

2025-08-18

平安证券

11页

1.32M

[平安证券]:计算机行业AI动态跟踪系列(八)：GPT-5降幻觉、强编码，全面提升大模型实际应用效果，点击即可下载。报告格式为PDF，大小1.32M，页数11页，欢迎下载。

本报告共11页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共11页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

计算机行业AI动态跟踪系列(八)：GPT-5降幻觉、强编码，全面提升大模型实际应用效果

关于我们

联系我们

计算机行业AI动态跟踪系列(八)：GPT-5降幻觉、强编码，全面提升大模型实际应用效果

关于我们

联系我们

小程序

公众号