提示工程核心原理与价值

我曾经花了很长时间思考一个问题：提示工程到底算不算一门正经的技能？

原因很简单——每隔几个月就会有人出来说"提示工程已死"。GPT-4 出来的时候有人说这句话，Claude 3 出来的时候也有人说，后来 Sora、o1 横空出世，这句话又被翻出来。你看，每次 AI 能力变强一次，就有人觉得提示词不需要再讲究了。

但事情真的这么简单吗？

先说踩过的坑

我最开始用 ChatGPT 的时候，跟大多数人差不多。打开对话框，随便输入一个问题或者需求，然后等着答案出来。大多数时候答案还行，但总觉得差点意思——你要总结一篇文章，它总结得太泛；你要写一封邮件，它的语气完全不对；你要做一个技术方案，它给你列一堆正确的废话。

于是你开始不断补充："不对，我要的不是这个。""语气更正式一点。""能不能具体一点？""不要用列表，用段落。"来回折腾三四次，最后还不如自己直接写。

这个阶段持续了大概两周。

后来我开始认真研究别人怎么写提示词，发现差距不在什么神秘的"咒语"，而是一件很朴素的事情：我根本没有想清楚自己要什么。

这听起来像是废话，但细想一下，大多数时候我们脑子里有一个模糊的想法，觉得"AI 应该能理解我的意思"。现实是，AI 不会读心术。你脑子里那个完整的画面，如果不一点一点拆出来告诉它，它只能用最常见的模式来猜。

提示工程的本质是翻译

我后来的理解是：提示工程是一门翻译学。

不是语言之间的翻译，而是两种完全不同的思维模式之间的翻译。人类的思维是模糊的、跳跃的、充满隐含前提的。你说"帮我写个好的文案"，你脑子里其实已经预设了受众是谁、发在什么平台、什么调性、大概多长——但这些信息你一个字都没说。

AI 的思维则是精确的、基于概率的。你说什么它就按什么来，你没说它就自己补。而它补的方向，不一定是你要的方向。

所以提示工程做的事情，其实就是把脑子里那些默认的、模糊的、"不言自明"的东西，一条一条地显式化。这不是什么技巧，这是沟通的基本功。只不过以前我们沟通的对象是人类，人类会结合语境和常识来脑补；现在我们沟通的对象是 AI，它不会脑补，你没说的它真的不知道。

这一点我体会特别深。有一次我让 AI 帮我生成一份产品需求文档，简单说了产品是什么、面向什么用户。结果出来的文档结构完全不是我想要的。我想要的重点是"用户痛点和使用场景"，但它把大半篇幅放在了竞品分析和市场规模上。

原因很简单——它不知道你的优先级。"产品需求文档"这个词太宽泛了，不同公司、不同团队、不同阶段的 PRD 写法差了十万八千里。我后来花了两分钟补充了背景：我们是创业公司，这份文档给研发团队看，主要目的是让他们理解为什么做而不是怎么做。生成的内容一下就对了。

两分钟的信息补充，省掉了我来回改半小时的时间。这就是提示工程的价值所在。

为什么越强的模型反而越需要提示工程

这是很多人搞反了的地方。

弱模型的能力天花板很低，你写再好的提示词，它也做不出超出能力范围的事。就像一个英语很烂的人，你给他再详细的中文提示，他翻译出来的英文也好不到哪去。但是强模型不一样。强模型的能力边界非常大，你给它一个开放性问题，它会在一个巨大的可能性空间里选一个方向给你。这个方向不见得是你想要的。

打个比方。弱模型像一个实习生，你不用给太多指示，因为他也折腾不出什么——当然，也不会折腾坏到哪去。强模型像一个十八般武艺样样精通的专家，你说的每句话它都能理解，但如果你不说清楚要它做什么，它会凭自己的判断给你一个"它认为最好"的结果。至于这个判断是不是对的，那可就不一定了。

GPT-4 刚出来时的体验特别典型。很多人发现它太"聪明"了，写什么都洋洋洒洒一大篇，动不动就给你加段开场白和总结，你只是想让它翻译一句话它非要给你分析三种译法。这不是它不好，是你说得太少。

后来大家学会了说"只输出翻译结果，不要解释"，效果立刻就好了。第二个提示不是更高级的技巧，只是给了一个方向约束。

所以模型越强，越需要你说清楚要什么、不要什么。这不是提示工程在退化，恰恰是它在进化。

那些"AI 理解不了"的东西

有些东西，AI 天生就不可能知道。这就是为什么纯靠模型升级解决不了所有问题。

比如你用 AI 帮你写工作周报，但你没说你们公司的周报格式是三句话还是三段式。你让 AI 帮你回复客户邮件，但没说你们跟这个客户的沟通习惯是正式还是随意。你让 AI 帮你改一段代码，但没说团队用的是哪个框架的哪个版本、哪些 API 已经废弃了。

这些信息对你来说都是常识，是公司里的"空气"——你每天都在呼吸所以意识不到它的存在。但对 AI 来说，这些信息不在它的训练数据里，或者就算在，它也不知道对你来说哪一条是适用的。

这就是通用模型和你的具体使用场景之间始终存在的缝隙。而填补这个缝隙的方式，只能是提示工程。你可以在系统提示里注入你的项目上下文，可以在对话开始时交代清楚背景，可以在输出格式上做精确规定。这些不是在"教 AI 变聪明"，而是在告诉它你所在世界的规则。

这种做法不会因为下一个更强的模型发布而失效。因为不管你用什么模型，你都需要告诉它你的世界是什么样子。

真正有用的东西不在"技巧"里

网上流传着各种各样的提示词模板和框架。CRISP、CO-STAR、APE、RODES……名字很多，花样也很多。

我早期收藏了一堆模板，后来发现大部分用不上。不是说这些框架不好，而是它们解决的问题太具体了。一个为"数据分析师写 SQL"设计的框架，套到你"写小红书文案"的场景里根本水土不服。

真正反复在用的，其实就几件朴素的事情：

说清楚你的角色和目的。 "我是一个刚起步的自媒体博主，想写一篇关于XX话题的面向25-35岁女性的文章，风格轻松不说教。"这一段话比任何花哨的模板都管用。

给 AI 一个角色。 这一点确实有效。你让 AI 扮演一个有十年经验的房产中介，和你直接问"怎么卖房子"，回答的深度和角度完全不一样。这不是玄学，是因为角色设定改变了 AI 选择和组织信息的权重。

约束输出格式。 这点在实际工作中太重要了。你说是用表格还是列表，要不要标题，有没有字数限制——不说它就会用默认格式，而默认格式很少正好是你想要的。

给例子。 如果你能找一个你满意的输出样例贴进去，让 AI 参照这个风格生成，效果立竿见影。AI 对示例的理解力远超对抽象描述的解析力。

这几条没有任何门槛，但做到之后体验会完全不同。

关于"这门技能会不会被淘汰"

我的判断是不会，但形态会变。

就像图形界面没有消灭命令行，搜索引擎没有消灭图书馆，AI 越来越强也不会消灭提示工程。变化的只是"你需要提供多少细节"以及"哪些细节需要你提供"。

十年前的程序员不需要学面向对象的很多设计模式，因为语言帮他们做了很多事。但编程本身并没有消失。同样的逻辑，未来的 AI 也许能更好地理解模糊意图、自动推断上下文，但你还是需要清晰地知道你自己想要什么。

注意，关键在于"你自己想要什么"这件事。提示工程表面上是跟 AI 沟通，本质上是在逼自己把问题想清楚。

我自己有个很深的体会：很多时候给 AI 写完一段完整提示词，还没点发送，就已经意识到自己思路里的漏洞。因为把模糊的想法写成精确的文字的过程，本身就是思考。这个过程中偶尔会发现"啊，其实我并不确定我要什么"，然后重新想一遍，等想清楚了，提示词自然也写出来了。

这大概是提示工程最被低估的价值——它不只是在训练 AI，也是在训练你自己的思维清晰度。

最后说句实在的

提示工程这东西，学起来不花钱，但花时间。而这个时间主要不是花在"背模板"上，是花在一次又一次的试错和反思里：为什么这次的回答不是我想要的？我少了什么信息？下次怎么说更清楚？

这个能力跟你会不会编程、学历多高、英语好不好没有关系。它就是一种沟通能力——只不过以前你只跟人沟通，现在多了个 AI。

所以别把它想得太神秘，也别因为它看起来太简单就不当回事。把它当成一种新的写作训练就好：用最少的文字，准确地传达你的意图。这件事永远有价值。

提示工程核心原理与价值

提示工程核心原理与价值

先说踩过的坑

提示工程的本质是翻译

为什么越强的模型反而越需要提示工程

那些"AI 理解不了"的东西

真正有用的东西不在"技巧"里

关于"这门技能会不会被淘汰"

最后说句实在的

相关推荐

面试官问你：如何解决大模型的上下文长度限制——标准回答框架

大模型上下文长度限制完全指南：从原理到工程落地的 4 种方案

面试官问你：RAG 如何处理 PDF——别再说转文本切片了