为什么AI总是捏造事实?AI:真不想的 容我狡辩一下
现如今,几乎每个人的手机上都有那么两三个 AI 小助手,之前我们遇到了问题习惯去搜索引擎上搜索答案,现在可能更多地习惯于“有事问 AI”。而 AI 也几乎不会让我们失望,任何问题都能给你列举出一串看起来很有道理的答案。
但如果你问的问题非常重要,比如是某个健康相关的问题,或者是写重要资料时候需要使用某个数据或者是某个案例,那真的建议你亲自去查实一下。因为有时候,AI 会信誓旦旦地给你一个看似合理,实则不存在的答案。
还有些小伙伴发现,在让小龙虾(Openclaw)干活的时候,它列出了详细的19小时的学习计划,然后17分钟完成了...... 它也会早早编造一份数据存放在本地,等拖到预定的时间才交付。而在被发现之后,试图让人接受它已完成的工作。

图片截取自与小龙虾(Openclaw)对话 小龙虾敷衍中......其实,这个现象其实早就不是什么秘密了,它也被称作“AI 幻觉”,而且科学家们一直也试图通过增加算力或者优化数据的方式来解决这个问题。
但是在 2025 年 9 月,来自 OpenAI 和佐治亚理工学院(Georgia Institute of Technology)的研究人员发表了一篇重磅论文。
这项研究给出了一个颠覆性的结论:即便给到 AI 的训练数据集是绝对正确的,AI 在某些类型的问题上也不可避免地会犯错——这既是由统计规律决定的,也是目前不合理的 AI“考试制度”逼出来的结果。下面我们就顺着这篇文章的思路一起来看一看。
预训练阶段就会出错
这篇研究发现,AI 出现幻觉跟预训练阶段以及后训练阶段都有关系,我们先看预训练阶段的情况。
1、数据模式和模型本身问题
为了方便研究,研究者构建了一个线性的二元分类模型(非此即彼),让它对已经标注了正确和错误的数据集进行分类。因为这些数据已经经过了人工检验,所以是不存在任何错误的。
但是用这些数据对AI模型进行预训练的时候,问题就出现了。在有些类型的问题上(比如检查拼写错误),AI 的表现非常好,几乎从不犯错。但是在另一些问题上,比如“数某个英文单词里某个字母出现了多少次?”,以及“某人的生日是几月几号?”AI 就有可能会出错。
研究者认为,这样的数据在做分类的时候很难用一条直线进行二元分类,一些模型用这样的数据进行预训练的时候就可能会产生错误。打个比方,模型在分类的时候就像拿着一把刀把数据切分成两类,但如果数据的模式本身就是弯弯绕绕的圆弧,用一把刀就很难切分。
比如在这篇文章中,研究者使用这个问题“How many Ds are in DEEPSEEK? If you know, just say the number with no commentary”(DEEPSEEK 里有多少个 D?如果你知道直接说数字,不要加以评论)去询问 Deepseek V3 模型的时候,确实发现它给的答案并不准确,会回答 2 或者 3。
但是这个在使用 DEEPSEEK R1 模型的时候就没有这样的问题,这是模型本身差异导致的。

笔者用同样的问题对 DEEPSEEK V3.2进行了测试,也出现了类似的情况研究者构建这样的简化模型进行测试,是为了说明,即便数据本身没有问题,在预训练阶段也会因为模型本身的限制以及数据模式等问题让 AI 产生错误判断。
这项研究中,研究者还进一步给出了测算,如果让 AI 直接去生成内容,产生错误的概率还会更大一些,大约比判断出错的概率高出两倍以上。
2、数据量过少也会影响
另外,在这项研究中研究者还发现,假如训练数据中某个信息过少,那么 AI 在回答的时候出错的可能性也会比较高。比如,当你问爱因斯坦的生日是几月几号的时候,因为在大量的资料里都有这个数据,所以 AI 几乎不会出错。
但是当你问某个普通人“田小豆”的生日是几月几号的时候,这个数据出现次数特别少,AI 出错的可能性也会变高。
特别是当数据只出现了一次的时候,这时候可能会更糟糕。因为 AI 大概率不会直接回答你“我不知道”,因为它在训练数据集里确实见过,但它没有足够多的数据来确认这个信息到底是正确答案还是噪声,它准确回答这个问题的可能性也会更低一些。
数据模式和模型本身的限制,以及极少样本的数据,都可能会让 AI 在预训练阶段就产生“幻觉”,生成错误的内容。
努力得高分的 AI
如果说预训练阶段的统计学特征让 AI 有了编造的“潜质”,人类评价AI的方式也逼着 AI 去“编造”。为了更好地理解这一点,我们可以先从大家都很熟悉的考试入手。人类社会中的大部分考试都是二元评分机制,即答对了得分,答错或者不回答都不得分。
所以,在考试的时候,哪怕你不知道答案,也不会交白卷,至少选择题填空题会随便蒙一个,万一蒙对了还会有“意外之喜”。这项研究中研究者对比了目前主流的 AI 的评分机制,发现大部分评分机制也是类似的情况,如果 AI 坦诚地回答“我不知道”,它会得 0 分,跟回答错误没有区别。
与其这样,它不如随便蒙一个答案,哪怕蒙对的概率再低,数学期望也比 0 高。

目前主流的评分机制大部分采用二元评分机制,图片截取自文献为了在主流的评分机制中拿到高分,“AI 考生们”也和人类一样,学会了实在不行就乱蒙一个的本领。
对此,这项研究的研究者们也给出了一个合理的解决方案——在现有的 AI 评分机制中,引入一个“惩罚编造,奖励诚实”的机制。比如,假如 AI 回答正确,获得 1 分,如果回答错误得 0 分,甚至扣分。如果回答“我不知道”,则可以不扣分,或者获得一个微小的分数奖励。
重要问题上不要轻信 AI
文献也给出了结论,AI 的幻觉是从模型的预训练阶段起源的,在后训练阶段为了追求更高的评分也可能会被放大。虽然科学家们也采用了很多的方法减少 AI 幻觉,但至少在现阶段看来,AI 幻觉还是无法避免的。
假如你需要让 AI 帮你解答一个重要的问题,比如在做公众演讲的时候用一个数据,建议亲自核实一下。否则被人发现这些数据根本不存在,那可就尴尬了。
而假如在问 AI 问题的时候,它对你说“我不知道”,你也应该感到庆幸,至少 AI 并没有打算胡编乱造一个答案蒙骗你。
推荐系统
雨林木风 winxp下载 纯净版 永久激活 winxp ghost系统 sp3 系统下载
系统大小:0MB系统类型:WinXP雨林木风在系统方面技术积累雄厚深耕多年,打造了国内重装系统行业知名品牌,雨林木风WindowsXP其系统口碑得到许多人认可,积累了广大的用户群体,是一款稳定流畅的系统,雨林木风 winxp下载 纯净版 永久激活 winxp ghost系统 sp3 系统下载,有需要的朋友速度下载吧。
系统等级:进入下载 >萝卜家园win7纯净版 ghost系统下载 x64 联想电脑专用
系统大小:0MB系统类型:Win7萝卜家园win7纯净版是款非常纯净的win7系统,此版本优化更新了大量的驱动,帮助用户们进行舒适的使用,更加的适合家庭办公的使用,方便用户,有需要的用户们快来下载安装吧。
系统等级:进入下载 >雨林木风xp系统 xp系统纯净版 winXP ghost xp sp3 纯净版系统下载
系统大小:1.01GB系统类型:WinXP雨林木风xp系统 xp系统纯净版 winXP ghost xp sp3 纯净版系统下载,雨林木风WinXP系统技术积累雄厚深耕多年,采用了新的系统功能和硬件驱动,可以更好的发挥系统的性能,优化了系统、驱动对硬件的加速,加固了系统安全策略,运行环境安全可靠稳定。
系统等级:进入下载 >萝卜家园win10企业版 免激活密钥 激活工具 V2023 X64位系统下载
系统大小:0MB系统类型:Win10萝卜家园在系统方面技术积累雄厚深耕多年,打造了国内重装系统行业的萝卜家园品牌,(win10企业版,win10 ghost,win10镜像),萝卜家园win10企业版 免激活密钥 激活工具 ghost镜像 X64位系统下载,其系统口碑得到许多人认可,积累了广大的用户群体,萝卜家园win10纯净版是一款稳定流畅的系统,一直以来都以用户为中心,是由萝卜家园win10团队推出的萝卜家园
系统等级:进入下载 >萝卜家园windows10游戏版 win10游戏专业版 V2023 X64位系统下载
系统大小:0MB系统类型:Win10萝卜家园windows10游戏版 win10游戏专业版 ghost X64位 系统下载,萝卜家园在系统方面技术积累雄厚深耕多年,打造了国内重装系统行业的萝卜家园品牌,其系统口碑得到许多人认可,积累了广大的用户群体,萝卜家园win10纯净版是一款稳定流畅的系统,一直以来都以用户为中心,是由萝卜家园win10团队推出的萝卜家园win10国内镜像版,基于国内用户的习惯,做
系统等级:进入下载 >windows11下载 萝卜家园win11专业版 X64位 V2023官网下载
系统大小:0MB系统类型:Win11萝卜家园在系统方面技术积累雄厚深耕多年,windows11下载 萝卜家园win11专业版 X64位 官网正式版可以更好的发挥系统的性能,优化了系统、驱动对硬件的加速,使得软件在WINDOWS11系统中运行得更加流畅,加固了系统安全策略,WINDOWS11系统在家用办公上跑分表现都是非常优秀,完美的兼容各种硬件和软件,运行环境安全可靠稳定。
系统等级:进入下载 >
相关文章
- Windows记事本告别纯文本 将迎史诗级更新!正测试原生图片支持
- 微软电脑管家宣布上线一键卸载龙虾新功能!自动清理 全程无需手动操作
- 搭载手机处理器的MacBook Neo确实能跑Win11!但性能会大降
- 新报告:“龙虾”部署最集中的国家是美国和中国
- 微软Windows 11 25H2升级工具低调上线:一键安装超简单
- 统信UOS微信重磅升级!终于可以导入导出聊天记录了
- 用户期待多年!Win11将迎史诗级更新:初始设置允许自定义用户文件夹名
- Windows 11关键位置保住了!微软放弃在通知中植入Copilot
- 微软最安全主机神话破灭!Xbox One终于沦陷:任意代码随意跑
- 微信新功能来了:简直是社恐福音
- 首个龙虾增强大模型 智谱GLM-5-Turbo发布:套餐39元起
- 微软确认Windows 11严重Bug!C盘拒绝访问:电脑陷入瘫痪
- 警惕“龙虾”风险!中国互联网金融协会:金融场景慎用AI智能体
- Windows 11三月更新爆出严重Bug!间隔十几分钟就蓝屏死机
热门系统
推荐软件
推荐应用
推荐游戏
热门文章
常用系统
- 1windows7游戏版 大地系统win7下载 Ghost 镜像 X64位
- 2深度技术WINDOWS10纯净版自动激活21H2 X64位 V2022.04下载
- 3技术员联盟 Ghost Win11 64位 办公优化版
- 4萝卜家园WIN11简体中文稳定版 激活密钥 X64位 V2022.07下载
- 5win7旗舰版下载 永久激活 大地系统win7下载 x64位系统
- 6win10专业版官网下载 番茄花园windows11 ghost系统 ISO镜像 X64位
- 7系统之家win10激活纯净版Ghost镜像 64位 v2023镜像下载
- 8技术员联盟win7纯净版系统下载 64位 ghost ISO 镜像V2022.05
- 9技术员联盟Win10纯净版系统下载 ghost镜像 ISO v2022.07 下载






















