计算机行业GenAI系列报告之68:2026大模型幻觉能被抑制吗?

请务必仔细阅读正文之后的各项信息披露与声明 行业及产业 行业研究/行业深度 证券研究报告 计算机 2026 年 01 月 22 日 2026 大模型幻觉能被抑制吗? 看好 ——GenAI 系列报告之 68 相关研究 - 证券分析师 黄忠煌 A0230519110001 huangzh@swsresearch.com 洪依真 A0230519060003 hongyz@swsresearch.com 曹峥 A0230525040002 caozheng@swsresearch.com 研究支持 曹峥 A0230525040002 caozheng@swsresearch.com 联系人 曹峥 A0230525040002 caozheng@swsresearch.com 本期投资提示: ⚫ 当我们在说模型进步的时候,我们在说什么?智能化水平的提升和错误率(幻觉)的下降。智能化水平的提升,打开了 AI 大模型能力的上限,而幻觉的控制,则是保障模型的下限,而我们认为,下限是让 AI 应用真正落地的核心。 ⚫ 何谓幻觉?即语言模型常产生过度自信的似真谬误,这种错误模式就被称为幻觉。当下AI 大模型的幻觉主要包括无中生有、事实错误、语境误解、逻辑谬误等。根据哥德尔不完备定理,一个系统或者大模型是不能自证清白的,必定有一些幻觉是无法消灭的。因此幻觉控制和智能化水平提升一样,是一个始终伴随 AI 算法发展的重要命题。 ⚫ 围绕“幻觉”这个命题,我们产生了四个核心思考:1)导致幻觉的因素有哪些;2)如何降低幻觉,从模型算法、数据、工程化几个维度探讨;3)Agent 进化的痛点:多步执行如何解决错误累积问题? 4)幻觉对于不同领域 AI 应用落地的影响?怎么评估?已经看到的趋势? ⚫ 幻觉来自于:1)模型架构;2)有毒数据;3)奖励目标对于准确性要求的缺失;4)上下文窗口限制了模型理解力。因此控制幻觉的方案,也应对着这四个因素。模型层面,使用更多人类偏好数据对齐,同时扩大上下文窗口(32K—>128K),以提升模型的理解能力;架构创新则主要从模型记忆入手,来解决注意力机制导致的幻觉问题。 ⚫ 数据端,最核心是喂给模型高质量的数据。因此当下业界聚焦高质量数据集的构建,海天瑞声、Scale AI 采用 “AI + 人工” 模式清洗标注,减少训练噪声;推理阶段通过自动过滤矛盾信息,提升输入数据可靠性。 ⚫ 工程化方面,RAG 技术成 2B 标配,Gartner 预计 2025 年企业采用率将达 68%,搭配 D&Q 问题分解框架,将问题拆解为多个相互依赖的子问题,并通过深度优先搜索的方式逐步推进推理路径,从而减少幻觉的发生。 ⚫ 我们对幻觉问题的回答是,2026 年,AI 模型的幻觉会得到有效控制。Vectara HHEM测评中,全球幻觉率最低的 TOP25 个大模型。其幻觉率低于 8%。通过工程化+RAG 方式,部分严肃场景下 AI 模型的可用性也正在提升。 ⚫ 在幻觉能够得到控制的前提下,我们看好三大方向:1)最先成熟的 AI 应用:税友股份、合合信息、鼎捷数智、卓易信息、汉得信息、万兴科技等;2)幻觉不敏感,商业化速度快的营销 AI:迈富时、新致软件、光云科技等;3)数据+AI infra:海天瑞声、深信服等。 ⚫ 风险提示:技术迭代不及预期风险;数据质量与合规风险;商业化进展不及预期风险等。 行业深度 请务必仔细阅读正文之后的各项信息披露与声明 第2页 共23页 简单金融 成就梦想 投资案件 结论和投资分析意见 2026 年,AI 模型的幻觉能够得到有效控制。AI 幻觉不可避免,但通过算法、数据、工程化等控制,全球幻觉率最低的 TOP25 个大模型已降低至 8%以内,达到可落地水平。 我们看好三大方向: 1)最先成熟的 AI 应用:税友股份、合合信息、鼎捷数智、卓易信息、汉得信息、万兴科技等; 2)幻觉不敏感,商业化速度快的营销 AI:迈富时、新致软件、光云科技等; 3)数据+AI infra:海天瑞声、深信服等。 原因与逻辑 幻觉来自于:1)模型架构;2)有毒数据;3)奖励目标对于准确性要求的缺失;4)上下文窗口限制了模型理解力。因此控制幻觉的方案,也应对着这四个因素。模型层面,使用更多人类偏好数据对齐,同时扩大上下文窗口(32K—>128K),以提升模型的理解能力;架构创新则主要从模型记忆入手,解决注意力机制导致的幻觉问题。 数据端,最核心是喂给模型高质量的数据。因此当下业界聚焦高质量数据集的构建,海天瑞声、Scale AI 采用 “AI + 人工” 模式清洗标注,减少训练噪声;推理阶段通过自动过滤矛盾信息,提升输入数据可靠性。 工程化方面,RAG 技术成 2B 标配,Gartner 预计2025 年企业采用率将达 68%,搭配 D&Q 问题分解框架,将问题拆解为多个相互依赖的子问题,并通过深度优先搜索的方式逐步推进推理路径,从而减少幻觉的发生。 有别于大众的认识 市场认为,大模型的幻觉不可避免。我们认为,从数学原理上幻觉无法避免,但从模型训推范式、架构创新、推理部署侧工程化等多层面努力,大模型幻觉率正在不断降低。且全球已经初步形成了一套完整的幻觉评估及控制方法论,幻觉能够得到有效控制,根据 Vectara 的 HHEM 测评,目前全球大模型幻觉率最低可做到 1.8%。 市场认为,AI 应用的落地受制于幻觉。我们认为正由于幻觉的存在,且通用模型的幻觉高于垂直领域专业模型,使得在行业内有丰富数据和 know-how 的 AI 应用厂商更有差异化优势,不会被大模型吞噬。 市场认为,严肃场景下 AI 的渗透速度会非常慢。我们看到例如财税等严肃场景,通过丰富的知识库,和严谨的工程化手段(不仅是 RAG,还包括可纠错的 Agent 系统等),模型可用率和准确率正在提升,且部分厂商已经实现了有规模的 AI 商业化收入,渗透速度并不慢。 行业深度 请务必仔细阅读正文之后的各项信息披露与声明 第3页 共23页 简单金融 成就梦想 1.幻觉—模型能力的下限 ................................................ 5 2.幻觉来自哪里? ........................................................... 5 3. 降低幻觉:从模型、数据、工程化和 Agent 说起 ......... 7

立即下载
电子设备
2026-01-22
申万宏源
23页
3.38M
收藏
分享

[申万宏源]:计算机行业GenAI系列报告之68:2026大模型幻觉能被抑制吗?,点击即可下载。报告格式为PDF,大小3.38M,页数23页,欢迎下载。

本报告共23页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
本报告共23页,只提供前10页预览,清晰完整版报告请下载后查看,喜欢就下载吧!
立即下载
水滴研报所有报告均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
相关图表
国内高温合金主要厂商
电子设备
2026-01-22
来源:科技/工业/基础材料行业:商业航天拉动不锈钢及高温合金需求
查看原文
高温合金主要熔炼设备特点比较
电子设备
2026-01-22
来源:科技/工业/基础材料行业:商业航天拉动不锈钢及高温合金需求
查看原文
常见不锈钢型号成分及使用场景对比
电子设备
2026-01-22
来源:科技/工业/基础材料行业:商业航天拉动不锈钢及高温合金需求
查看原文
不锈钢价格 图表19: 2024 年钢铁下游消费需求划分
电子设备
2026-01-22
来源:科技/工业/基础材料行业:商业航天拉动不锈钢及高温合金需求
查看原文
全球钢铁生产量 图表17: 全球不锈钢年生产量
电子设备
2026-01-22
来源:科技/工业/基础材料行业:商业航天拉动不锈钢及高温合金需求
查看原文
猎鹰 9 号、星舰高温合金需求测算
电子设备
2026-01-22
来源:科技/工业/基础材料行业:商业航天拉动不锈钢及高温合金需求
查看原文
回顶部
报告群
公众号
小程序
在线客服
收起