AI不是真的"懂"了——模型输出的概率本质
和AI聊天时,它说话的方式太像"真的懂了"。
语气自信,逻辑清晰,引用数据头头是道。你很容易产生一种感觉:它在思考,它在理解,它真的知道自己在说什么。
但实际上,AI的每一次输出,本质上都在做同一件事——预测下一个最可能的词是什么。
理解这一点,是正确使用AI的底层逻辑基础。
模型到底在做什么?
拆开来看,大语言模型的核心工作流程极其简单:
给它一段文字(你的问题加上之前的对话),它会计算:在所有可能的词中,哪个词作为"下一个词"出现的概率最高。
选完这个词之后,把它拼到原文后面,再计算下一个词的概率。
如此反复,一个词接一个词,直到生成完整的回答。
这就是所谓的自回归生成。每一步都在做概率预测,每一步都选"最可能"的那个词。
用一个例子来理解这个过程:
你问模型:"法国的首都是什么?"
模型看到"法国的首都是",在它的词表里计算每个词作为下一个词的概率:
- "巴黎":概率 0.92
- "里昂":概率 0.03
- "一个":概率 0.02
- "位于":概率 0.01
- 其他词:概率 < 0.01
它选"巴黎"。然后看到"法国的首都是巴黎",继续计算下一个词的概率:
- "。":概率 0.85
- ",":概率 0.10
- "这座":概率 0.02
它选"。"。回答就完成了。
看起来很简单对吧?但这个"简单"的过程涉及数十亿甚至数百亿参数的计算,是在一个极高维度的概率空间中进行的。模型通过这种"一个词一个词"的方式,生成了我们看到的流畅回答。
"最可能"不等于"最正确"
问题就出在这里。
模型选的是概率最高的词,不是正确的词。
什么决定了概率? 训练数据。模型在数万亿的人类文本上进行了训练,它"学到"的是人类表达的统计模式——在某些上下文之后,某些词出现的频率更高。
当训练数据中某种错误表达出现的频率很高时,模型就会认为这个错误表达是"大概率正确"的。它不知道对错,它只知道概率。
举个例子:如果你问模型"用一个规律知晓全部的规律是什么意思",它可能给你一段听起来很有哲理的回答。但实际上,它并不理解"归纳推理"是什么概念。它只是在预测:当人类问到"规律"和"知晓"这类词时,接下来最可能出现的文字序列是什么。
这就是为什么AI有时候会"一本正经地说错话"——它不是故意说错,而是在它学到的模式中,那个错误的答案概率更高。
我自己就有过这种经历:问一个AI工具"Transformer的自注意力时间复杂度是多少",它非常自信地给出了一个答案。我后来查了论文,发现是错的。它不是在瞎编,而是在训练数据中,某种错误表述出现的概率比较高,模型就按概率输出了。
更极端的例子: 有一个著名的"逆转诅咒"现象——模型从"A是B"的训练数据中,并不能自动推断出"B是A"。比如训练数据里有"汤姆·克鲁斯是演员",但模型不一定能正确回答"演员是汤姆·克鲁斯"。这是因为模型学习的是统计模式,而不是逻辑推理。很多看似简单的常识推理,AI都做不好——因为它的本质不是推理,而是模式匹配。
为什么模型看起来像在"理解"?
因为训练数据太好了。
模型在数万亿的人类文本上进行了训练,学会了人类表达的各种模式。当它生成的内容恰好和正确的理解吻合时,看起来就像是真的懂了。
但这只是统计模式匹配,不是真正的理解。
区别在哪里?真正理解一件事,意味着你能把它和现实世界对应起来,能在新情况下灵活运用,能发现逻辑矛盾。模型做不到这些。它能做的只是:在学过的模式中找到最匹配的,然后输出。
一个思想实验: 假设我们把所有的训练数据中的人名都替换成随机字符串。比如"张三"变成"XKJ92","李四"变成"PLM37"。模型仍然能生成语法正确的回答,甚至会遵循之前学到的"模式"。但你能说它"理解"了什么吗?它只是在操作符号,而不是理解符号背后的含义。
还有一个更直观的比喻:一个从没见过苹果的人,读了一万个关于苹果的描述后,能写出非常详细的"苹果介绍"。但他不知道苹果是什么味道,不知道拿在手里什么感觉,不知道咬一口会发生什么。
AI就是这样——它能写出看起来像"理解"的文字,但这个文字背后没有任何真实的"体验"作为支撑。它的"理解"是一种基于统计模式的近似,而不是我们通常所说的那种"理解"。
概率性输出的实际影响
理解了这一点,就能理解很多使用AI时的困惑:
为什么同一个问题问两次,答案可能不一样? 因为模型的输出有随机性,不是每次都选"概率最高"的那个词,而是按概率分布采样。就像掷骰子,每次结果可能不同。这个随机性是通过"temperature"参数控制的——temperature越高,随机性越大;temperature越低,输出越确定性。
为什么模型有时候对有时候错? 因为它的答案取决于训练数据中哪种模式占上风,而不是取决于事实本身。如果训练数据中关于某个主题的正确信息占多数,模型大概率会给出正确答案;如果错误信息占多数或者信息不够清晰,模型就可能给出错误答案。
为什么模型对简单问题很准,对复杂问题容易跑偏? 因为简单问题的模式在训练数据中非常一致,概率分布很集中。比如"法国的首都是什么"——训练数据中这个问题的答案几乎都是"巴黎",模型很容易选对。复杂问题的模式更多样,概率分布更分散,选到错误答案的概率更高。比如"如何评价某个历史事件"——训练数据中各种观点都有,模型生成的答案可能取决于哪种观点在训练数据中占比更高。
为什么模型在专业领域表现较弱? 因为专业领域的训练数据通常只占总数据的很小比例。虽然模型在通用知识上表现不错,但在小众专业领域,训练数据中相关知识的覆盖可能不够,导致模型的概率分布不够集中,回答质量下降。
为什么同一个模型在不同语言中表现不同? 因为不同语言在训练数据中的占比不同。英语占训练数据的最大比例,所以模型在英语上的表现通常最好。中文、西班牙语等主流语言次之。小语种的表现通常更弱——不是因为模型"歧视"小语种,而是训练数据统计分布的自然结果。
概率性与创造性的关系
概率性输出有一个"副作用"——它让AI具有一定的创造性。
因为模型不是每次都选概率最高的词,有一定的随机性,所以在生成创意内容时,它能组合出一些新颖的表达。这看似是一种"创造力",但实际上仍然是在已知模式的空间中做采样。
概率性输出能产生真正的新颖想法吗? 严格来说不能。模型的所有输出都是基于训练数据中已有的模式做重组和采样。它能产生"对你来说新颖"的组合,但它不能产生"这个世界上从未出现过的全新创意"。真正的创造力仍然来自人类——因为只有人类才能跳出已有的模式空间,真正做到"从0到1"。
对使用AI有什么启发?
不要把AI当作"理解者",把它当作**"概率性的文本生成器"**。
它生成的内容需要你用自己的判断力去验证。它说"数据显示",你就去查数据。它说"研究表明",你就去找那篇论文。它说"代码可以运行",你就自己去跑一遍。
不是因为它不可靠,而是因为它本身不具备验证对错的能力。
具体的使用建议:
-
对于事实性内容,务必交叉验证。 不要只信一个AI的答案——如果同一个事实需要确认,多问几次,多查几个来源。
-
设置合适的temperature。 如果你是问事实性问题,用较低的temperature(比如0.3);如果你是做创意头脑风暴,用较高的temperature(比如0.8)。
-
给AI提供高质量的上下文。 上下文的质量直接影响输出的质量——"垃圾上下文进,垃圾输出出"。
-
知道什么时候该信AI、什么时候不该信。 通用常识→可以信。专业细节→谨慎信。最新信息→大概率不信(因为训练数据有截止日期)。数值计算→大概率不信(因为模型本质上是语言处理器,不是计算器)。代码能跑但效率不明→检查确认。
-
对自己的判断力保持自信。 如果你觉得AI的回答"不太对",大概率它就是不对。相信自己的直觉,而不是盲目相信AI的输出。
概率性是AI输出的底层特征,不是缺陷。理解它,你就能用得更准确、更有分寸。
下篇文章我们会聊一个更具体的场景:当对话越来越长,上下文被压缩时,自注意力会发生什么变化。
