- 1
- 0
- 约1.9万字
- 约 10页
- 2026-01-28 发布于北京
- 举报
2026大模型幻觉能被抑制吗?
——GenAI系列报告之68
本期投资提示:
l当我们在说模型进步的时候,我们在说什么?智能化水平的提升和错误率(幻觉)的下降。智能化水平的提升,打开了AI大模型能力的上限,而幻觉的控制,则是保障模型的下限,而我们认为,下限是让AI应用真正落地的核心。
l何谓幻觉?即语言模型常产生过度自信的似真谬误,这种错误模式就被称为幻觉。当下AI大模型的幻觉主要包括无中生有、事实错误、语境误解、逻辑谬误等。根据哥德尔不完备定理,一个系统或者大模型是不能自证清白的,必定有一些幻觉是无法消灭的。因此幻觉控制和智能化水平提升一样,是一个始终伴随AI算法发展的重要命题。
l围绕“幻觉”这个命题,我们产生了四个核心思考:1)导致幻觉的因素有哪些;2)如何降低幻觉,从模型算法、数据、工程化几个维度探讨;3)Agent进化的痛点:多步执行如何解决错误累积问题?4)幻觉对于不同领域AI应用落地的影响?怎么评估?已经看到的趋势?
l幻觉来自于:1)模型架构;2)有毒数据;3)奖励目标对于准确性要求的缺失;4)上下文窗口限制了模型理解力。因此控制幻觉的方案,也应对着这四个因素。模型层面,使用更多人类偏好数据对齐,同时扩大上下文窗口(32K—128K),以提升模型的理解能力;架构创新则主要从模型记忆入手,来解决注意力机制导致的幻觉问题。
l数据端,最核心是喂给模型高质量的数据。因此当下业界聚焦高质量数据集的构建,海天瑞声、ScaleAI采用“AI+人工”模式清洗标注,减少训练噪声;推理阶段通过自动过滤矛盾信息,提升输入数据可靠性。
l工程化方面,RAG技术成2B标配,Gartner预计2025年企业采用率将达68%,搭配DQ问题分解框架,将问题拆解为多个相互依赖的子问题,并通过深度优先搜索的方式逐步推进推理路径,从而减少幻觉的发生。
l我们对幻觉问题的回答是,2026年,AI模型的幻觉会得到有效控制。VectaraHHEM测评中,全球幻觉率最低的TOP25个大模型。其幻觉率低于8%。通过工程化+RAG方式,部分严肃场景下AI模型的可用性也正在提升。
l在幻觉能够得到控制的前提下,我们看好三大方向:1)最先成熟的AI应用:税友股份、合合信息、鼎捷数智、卓易信息、汉得信息、万兴科技等;2)幻觉不敏感,商业化速度快的营销AI:迈富时、新致软件、光云科技等;3)数据+AIinfra:海天瑞声、深信服等。
l风险提示:技术迭代不及预期风险;数据质量与合规风险;商业化进展不及预期风险等。
2026年01月22日
看好
相关研究
行业研究/行业深度
行业及产业
-
】
计算机
投资案件
结论和投资分析意见
2026年,AI模型的幻觉能够得到有效控制。AI幻觉不可避免,但通过算法、数据、工程化等控制,全球幻觉率最低的TOP25个大模型已降低至8%以内,达到可落地水平。
我们看好三大方向:
1)最先成熟的AI应用:税友股份、合合信息、鼎捷数智、卓易信息、汉得信息、万兴科技等;
2)幻觉不敏感,商业化速度快的营销AI:迈富时、新致软件、光云科技等;
3)数据+AIinfra:海天瑞声、深信服等。
原因与逻辑
幻觉来自于:1)模型架构;2)有毒数据;3)奖励目标对于准确性要求的缺失;4)上下文窗口限制了模型理解力。因此控制幻觉的方案,也应对着这四个因素。模型层面,使用更多人类偏好数据对齐,同时扩大上下文窗口(32K—128K),以提升模型的理解能力;架构创新则主要从模型记忆入手,解决注意力机制导致的幻觉问题。
数据端,最核心是喂给模型高质量的数据。因此当下业界聚焦高质量数据集的构建,海天瑞声、ScaleAI采用“AI+人工”模式清洗标注,减少训练噪声;推理阶段通过自动过滤矛盾信息,提升输入数据可靠性。
工程化方面,RAG技术成2B标配,Gartner预计2025年企业采用率将达68%,搭配DQ问题分解框架,将问题拆解为多个相互依赖的子问题,并通过深度优先搜索的方式逐步推进推理路径,从而减少幻觉的发生。
有别于大众的认识
市场认为,大模型的幻觉不可避免。我们认为,从数学原理上幻觉无法避免,但从模型训推范式、架构创新、推理部署侧工程化等多层面努力,大模型幻觉率正在不断降低。且全球已经初步形成了一套完整的幻觉评估及控制方法论,幻觉能够得到有效控制,根据Vectara的HHEM测评,目前全球大模型幻觉率最低可做到1.8%。
市场认为,AI应用的落地受制于幻觉。我们认为正由于
您可能关注的文档
- 产业前瞻系列1:“十五五”城市更新掘金蓝图-.pptx
- 存储行业深度报告:骐骥驰骋,AI“存”变,国产“储”势,星火燎原-.pptx
- 电子行业行业深度报告:技术跃升、市场爆发与生态构建之路-终端革命正当时,AI眼镜迈向规模化-.pptx
- 多元行业深度报告:公募基金改革陆续落地,推动行业高质量发展-.pptx
- 工程机械:攻守易形,走向慢牛!-.pptx
- 商业航天行业研究系列5:Rocket Lab:从小火箭之王到太空基建总包商,被低估的航天第二极.pptx
- 中国妇科药行业调研简报:行业跟踪:PCOS妊娠管理中西合璧,孕育新机.pptx
- 3D 打印行业系列报告(一):工业级与消费级应用双轮驱动,行业迈入快速发展期.docx
- 2025年保健食品趋势白皮书-第321期【试读版】-.docx
- 2025年医疗器械BD白皮书-.docx
最近下载
- 医院网络及信息安全自查工作计划报.docx VIP
- 国家钢琴谱五线谱 完整版原版.pdf
- 党员2025年度组织生活会“(对照贯彻党的创新理论方面,对照加强党性锤炼方面,对照联系服务群众方面,对照发挥先锋模范作用方面,对照改作风树新风方面)五个对照”对照检查材料.docx VIP
- 承包商安全管理专项检查表.doc VIP
- 四柱式万能液压机液压系统原理研究.pdf VIP
- 2024年五大名校模考压轴题合集(3A数学).pdf VIP
- GB212-2008煤的工业分析方法.docx VIP
- 公共场所卫生管理制度电子版(3篇).doc VIP
- 【医脉通指南频道】2011+血管和浅表器官超声检查指南(上篇).pdf VIP
- 2025年葫芦岛市生态环境局公开遴选工作人员备考题库及1套参考答案详解.docx VIP
原创力文档

文档评论(0)