GenAI系列报告之68：2026大模型幻觉能被抑制吗？.docxVIP

下载本文档

0
0
约2.26万字
约 39页
2026-01-27 发布于北京
举报

GenAI系列报告之68：2026大模型幻觉能被抑制吗？.docx

计算机行业及产业

计算机

行业及产业

行业研究/

行业研究/行业深度

看好

相关研究

】

2026大模型幻觉能被抑制吗？

——GenAI系列报告之68

本期投资提示：

l当我们在说模型进步的时候，我们在说什么？智能化水平的提升和错误率（幻觉）的下降。智能化水平的提升，打开了AI大模型能力的上限，而幻觉的控制，则是保障模型的下限，而我们认为，下限是让AI应用真正落地的核心。

l何谓幻觉？即语言模型常产生过度自信的似真谬误，这种错误模式就被称为幻觉。当下AI大模型的幻觉主要包括无中生有、事实错误、语境误解、逻辑谬误等。根据哥德尔不完备定理，一个系统或者大模型是不能自证清白的，必定有一些幻觉是无法消灭的。因此幻觉控制和智能化水平提升一样，是一个始终伴随AI算法发展的重要命题。

l围绕“幻觉”这个命题，我们产生了四个核心思考：1）导致幻觉的因素有哪些；2）如何降低幻觉，从模型算法、数据、工程化几个维度探讨；3）Agent进化的痛点：多步执行如何解决错误累积问题？4）幻觉对于不同领域AI应用落地的影响？怎么评估？已经看到的趋势？

l幻觉来自于：1）模型架构；2）有毒数据；3）奖励目标对于准确性要求的缺失；4）上下文窗口限制了模型理解力。因此控制幻觉的方案，也应对着这四个因素。模型层面，使用更多人类偏好数据对齐，同时扩大上下文窗口（32K—128K），以提升模型的理解能力；架构创新则主要从模型记忆入手，来解决注意力机制导致的幻觉问题。

l数据端，最核心是喂给模型高质量的数据。因此当下业界聚焦高质量数据集的构建，海天瑞声、ScaleAI采用“AI+人工”模式清洗标注，减少训练噪声；推理阶段通过自动过滤矛盾信息，提升输入数据可靠性。

l工程化方面，RAG技术成2B标配，Gartner预计2025年企业采用率将达68%，搭配DQ问题分解框架，将问题拆解为多个相互依赖的子问题，并通过深度优先搜索的方式逐步推进推理路径，从而减少幻觉的发生。

l我们对幻觉问题的回答是，2026年，AI模型的幻觉会得到有效控制。VectaraHHEM测评中，全球幻觉率最低的TOP25个大模型。其幻觉率低于8%。通过工程化+RAG方式，部分严肃场景下AI模型的可用性也正在提升。

l在幻觉能够得到控制的前提下，我们看好三大方向：1）最先成熟的AI应用：税友股份、合合信息、鼎捷数智、卓易信息、汉得信息、万兴科技等；2）幻觉不敏感，商业化速度快的营销AI：迈富时、新致软件、光云科技等；3）数据+AIinfra：海天瑞声、深信服等。

l风险提示：技术迭代不及预期风险；数据质量与合规风险；商业化进展不及预期风险等。

行业深度

第2页共22页

第2页共22页简单金融成就梦想

投资案件

结论和投资分析意见

2026年，AI模型的幻觉能够得到有效控制。AI幻觉不可避免，但通过算法、数据、工程化等控制，全球幻觉率最低的TOP25个大模型已降低至8%以内，达到可落地水平。

我们看好三大方向：

1）最先成熟的AI应用：税友股份、合合信息、鼎捷数智、卓易信息、汉得信息、万兴科技等；

2）幻觉不敏感，商业化速度快的营销AI：迈富时、新致软件、光云科技等；

3）数据+AIinfra：海天瑞声、深信服等。

原因与逻辑

幻觉来自于：1）模型架构；2）有毒数据；3）奖励目标对于准确性要求的缺失；4）上下文窗口限制了模型理解力。因此控制幻觉的方案，也应对着这四个因素。模型层面，使用更多人类偏好数据对齐，同时扩大上下文窗口（32K—128K），以提升模型的理解能力；架构创新则主要从模型记忆入手，解决注意力机制导致的幻觉问题。

数据端，最核心是喂给模型高质量的数据。因此当下业界聚焦高质量数据集的构建，海天瑞声、ScaleAI采用“AI+人工”模式清洗标注，减少训练噪声；推理阶段通过自动过滤矛盾信息，提升输入数据可靠性。

工程化方面，RAG技术成2B标配，Gartner预计2025年企业采用率将达68%，搭配DQ问题分解框架，将问题拆解为多个相互依赖的子问题，并通过深度优先搜索的方式逐步推进推理路径，从而减少幻觉的发生。

有别于大众的认识

市场认为，大模型的幻觉不可避免。我们认为，从数学原理上幻觉无法避免，但从模型训推范式、架构创新、推理部署侧工程化等多层面努力，大模型幻觉率正在不断降低。且全球已经初步形成了一套完整的幻觉评估及控制方法论，幻觉能够得到有效控制，根据Vectara的HHEM测评，

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

GenAI系列报告之68：2026大模型幻觉能被抑制吗？.docxVIP