计算机行业GenAI系列报告之68：2026大模型幻觉能被抑制吗？

请务必仔细阅读正文之后的各项信息披露与声明行业及产业行业研究/行业深度证券研究报告计算机 2026 年 01 月 22 日 2026 大模型幻觉能被抑制吗？看好 ——GenAI 系列报告之 68 相关研究 - 证券分析师黄忠煌 A0230519110001 huangzh@swsresearch.com 洪依真 A0230519060003 hongyz@swsresearch.com 曹峥 A0230525040002 caozheng@swsresearch.com 研究支持曹峥 A0230525040002 caozheng@swsresearch.com 联系人曹峥 A0230525040002 caozheng@swsresearch.com 本期投资提示： ⚫ 当我们在说模型进步的时候，我们在说什么？智能化水平的提升和错误率（幻觉）的下降。智能化水平的提升，打开了 AI 大模型能力的上限，而幻觉的控制，则是保障模型的下限，而我们认为，下限是让 AI 应用真正落地的核心。 ⚫ 何谓幻觉？即语言模型常产生过度自信的似真谬误，这种错误模式就被称为幻觉。当下AI 大模型的幻觉主要包括无中生有、事实错误、语境误解、逻辑谬误等。根据哥德尔不完备定理，一个系统或者大模型是不能自证清白的，必定有一些幻觉是无法消灭的。因此幻觉控制和智能化水平提升一样，是一个始终伴随 AI 算法发展的重要命题。 ⚫ 围绕“幻觉”这个命题，我们产生了四个核心思考：1）导致幻觉的因素有哪些；2）如何降低幻觉，从模型算法、数据、工程化几个维度探讨；3）Agent 进化的痛点：多步执行如何解决错误累积问题？ 4）幻觉对于不同领域 AI 应用落地的影响？怎么评估？已经看到的趋势？ ⚫ 幻觉来自于：1）模型架构；2）有毒数据；3）奖励目标对于准确性要求的缺失；4）上下文窗口限制了模型理解力。因此控制幻觉的方案，也应对着这四个因素。模型层面，使用更多人类偏好数据对齐，同时扩大上下文窗口（32K—>128K），以提升模型的理解能力；架构创新则主要从模型记忆入手，来解决注意力机制导致的幻觉问题。 ⚫ 数据端，最核心是喂给模型高质量的数据。因此当下业界聚焦高质量数据集的构建，海天瑞声、Scale AI 采用 “AI + 人工” 模式清洗标注，减少训练噪声；推理阶段通过自动过滤矛盾信息，提升输入数据可靠性。 ⚫ 工程化方面，RAG 技术成 2B 标配，Gartner 预计 2025 年企业采用率将达 68%，搭配 D&Q 问题分解框架，将问题拆解为多个相互依赖的子问题，并通过深度优先搜索的方式逐步推进推理路径，从而减少幻觉的发生。 ⚫ 我们对幻觉问题的回答是，2026 年，AI 模型的幻觉会得到有效控制。Vectara HHEM测评中，全球幻觉率最低的 TOP25 个大模型。其幻觉率低于 8%。通过工程化+RAG 方式，部分严肃场景下 AI 模型的可用性也正在提升。 ⚫ 在幻觉能够得到控制的前提下，我们看好三大方向：1）最先成熟的 AI 应用：税友股份、合合信息、鼎捷数智、卓易信息、汉得信息、万兴科技等；2）幻觉不敏感，商业化速度快的营销 AI：迈富时、新致软件、光云科技等；3）数据+AI infra：海天瑞声、深信服等。 ⚫ 风险提示：技术迭代不及预期风险；数据质量与合规风险；商业化进展不及预期风险等。行业深度请务必仔细阅读正文之后的各项信息披露与声明第2页共23页简单金融成就梦想投资案件结论和投资分析意见 2026 年，AI 模型的幻觉能够得到有效控制。AI 幻觉不可避免，但通过算法、数据、工程化等控制，全球幻觉率最低的 TOP25 个大模型已降低至 8%以内，达到可落地水平。我们看好三大方向： 1）最先成熟的 AI 应用：税友股份、合合信息、鼎捷数智、卓易信息、汉得信息、万兴科技等； 2）幻觉不敏感，商业化速度快的营销 AI：迈富时、新致软件、光云科技等； 3）数据+AI infra：海天瑞声、深信服等。原因与逻辑幻觉来自于：1）模型架构；2）有毒数据；3）奖励目标对于准确性要求的缺失；4）上下文窗口限制了模型理解力。因此控制幻觉的方案，也应对着这四个因素。模型层面，使用更多人类偏好数据对齐，同时扩大上下文窗口（32K—>128K），以提升模型的理解能力；架构创新则主要从模型记忆入手，解决注意力机制导致的幻觉问题。数据端，最核心是喂给模型高质量的数据。因此当下业界聚焦高质量数据集的构建，海天瑞声、Scale AI 采用 “AI + 人工” 模式清洗标注，减少训练噪声；推理阶段通过自动过滤矛盾信息，提升输入数据可靠性。工程化方面，RAG 技术成 2B 标配，Gartner 预计2025 年企业采用率将达 68%，搭配 D&Q 问题分解框架，将问题拆解为多个相互依赖的子问题，并通过深度优先搜索的方式逐步推进推理路径，从而减少幻觉的发生。有别于大众的认识市场认为，大模型的幻觉不可避免。我们认为，从数学原理上幻觉无法避免，但从模型训推范式、架构创新、推理部署侧工程化等多层面努力，大模型幻觉率正在不断降低。且全球已经初步形成了一套完整的幻觉评估及控制方法论，幻觉能够得到有效控制，根据 Vectara 的 HHEM 测评，目前全球大模型幻觉率最低可做到 1.8%。市场认为，AI 应用的落地受制于幻觉。我们认为正由于幻觉的存在，且通用模型的幻觉高于垂直领域专业模型，使得在行业内有丰富数据和 know-how 的 AI 应用厂商更有差异化优势，不会被大模型吞噬。市场认为，严肃场景下 AI 的渗透速度会非常慢。我们看到例如财税等严肃场景，通过丰富的知识库，和严谨的工程化手段（不仅是 RAG，还包括可纠错的 Agent 系统等），模型可用率和准确率正在提升，且部分厂商已经实现了有规模的 AI 商业化收入，渗透速度并不慢。行业深度请务必仔细阅读正文之后的各项信息披露与声明第3页共23页简单金融成就梦想 1．幻觉—模型能力的下限 ................................................ 5 2．幻觉来自哪里？ ........................................................... 5 3. 降低幻觉：从模型、数据、工程化和 Agent 说起 ......... 7

立即下载

电子设备

2026-01-22

申万宏源

23页

3.38M

[申万宏源]:计算机行业GenAI系列报告之68：2026大模型幻觉能被抑制吗？，点击即可下载。报告格式为PDF，大小3.38M，页数23页，欢迎下载。

本报告共23页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

本报告共23页，只提供前10页预览，清晰完整版报告请下载后查看，喜欢就下载吧！

立即下载

水滴研报所有报告均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

计算机行业GenAI系列报告之68：2026大模型幻觉能被抑制吗？

关于我们

联系我们

计算机行业GenAI系列报告之68：2026大模型幻觉能被抑制吗？

关于我们

联系我们

小程序

公众号