提示工程核心原理与价值
我曾经花了很长时间思考一个问题:提示工程到底算不算一门正经的技能?
原因很简单——每隔几个月就会有人出来说"提示工程已死"。GPT-4 出来的时候有人说这句话,Claude 3 出来的时候也有人说,后来 Sora、o1 横空出世,这句话又被翻出来。你看,每次 AI 能力变强一次,就有人觉得提示词不需要再讲究了。
但事情真的这么简单吗?
先说踩过的坑
我最开始用 ChatGPT 的时候,跟大多数人差不多。打开对话框,随便输入一个问题或者需求,然后等着答案出来。大多数时候答案还行,但总觉得差点意思——你要总结一篇文章,它总结得太泛;你要写一封邮件,它的语气完全不对;你要做一个技术方案,它给你列一堆正确的废话。
于是你开始不断补充:"不对,我要的不是这个。""语气更正式一点。""能不能具体一点?""不要用列表,用段落。"来回折腾三四次,最后还不如自己直接写。
这个阶段持续了大概两周。
后来我开始认真研究别人怎么写提示词,发现差距不在什么神秘的"咒语",而是一件很朴素的事情:我根本没有想清楚自己要什么。
这听起来像是废话,但细想一下,大多数时候我们脑子里有一个模糊的想法,觉得"AI 应该能理解我的意思"。现实是,AI 不会读心术。你脑子里那个完整的画面,如果不一点一点拆出来告诉它,它只能用最常见的模式来猜。
提示工程的本质是翻译
我后来的理解是:提示工程是一门翻译学。
不是语言之间的翻译,而是两种完全不同的思维模式之间的翻译。人类的思维是模糊的、跳跃的、充满隐含前提的。你说"帮我写个好的文案",你脑子里其实已经预设了受众是谁、发在什么平台、什么调性、大概多长——但这些信息你一个字都没说。
AI 的思维则是精确的、基于概率的。你说什么它就按什么来,你没说它就自己补。而它补的方向,不一定是你要的方向。
所以提示工程做的事情,其实就是把脑子里那些默认的、模糊的、"不言自明"的东西,一条一条地显式化。这不是什么技巧,这是沟通的基本功。只不过以前我们沟通的对象是人类,人类会结合语境和常识来脑补;现在我们沟通的对象是 AI,它不会脑补,你没说的它真的不知道。
这一点我体会特别深。有一次我让 AI 帮我生成一份产品需求文档,简单说了产品是什么、面向什么用户。结果出来的文档结构完全不是我想要的。我想要的重点是"用户痛点和使用场景",但它把大半篇幅放在了竞品分析和市场规模上。
原因很简单——它不知道你的优先级。"产品需求文档"这个词太宽泛了,不同公司、不同团队、不同阶段的 PRD 写法差了十万八千里。我后来花了两分钟补充了背景:我们是创业公司,这份文档给研发团队看,主要目的是让他们理解为什么做而不是怎么做。生成的内容一下就对了。
两分钟的信息补充,省掉了我来回改半小时的时间。这就是提示工程的价值所在。
为什么越强的模型反而越需要提示工程
这是很多人搞反了的地方。
弱模型的能力天花板很低,你写再好的提示词,它也做不出超出能力范围的事。就像一个英语很烂的人,你给他再详细的中文提示,他翻译出来的英文也好不到哪去。但是强模型不一样。强模型的能力边界非常大,你给它一个开放性问题,它会在一个巨大的可能性空间里选一个方向给你。这个方向不见得是你想要的。
打个比方。弱模型像一个实习生,你不用给太多指示,因为他也折腾不出什么——当然,也不会折腾坏到哪去。强模型像一个十八般武艺样样精通的专家,你说的每句话它都能理解,但如果你不说清楚要它做什么,它会凭自己的判断给你一个"它认为最好"的结果。至于这个判断是不是对的,那可就不一定了。
GPT-4 刚出来时的体验特别典型。很多人发现它太"聪明"了,写什么都洋洋洒洒一大篇,动不动就给你加段开场白和总结,你只是想让它翻译一句话它非要给你分析三种译法。这不是它不好,是你说得太少。
后来大家学会了说"只输出翻译结果,不要解释",效果立刻就好了。第二个提示不是更高级的技巧,只是给了一个方向约束。
所以模型越强,越需要你说清楚要什么、不要什么。这不是提示工程在退化,恰恰是它在进化。
那些"AI 理解不了"的东西
有些东西,AI 天生就不可能知道。这就是为什么纯靠模型升级解决不了所有问题。
比如你用 AI 帮你写工作周报,但你没说你们公司的周报格式是三句话还是三段式。你让 AI 帮你回复客户邮件,但没说你们跟这个客户的沟通习惯是正式还是随意。你让 AI 帮你改一段代码,但没说团队用的是哪个框架的哪个版本、哪些 API 已经废弃了。
这些信息对你来说都是常识,是公司里的"空气"——你每天都在呼吸所以意识不到它的存在。但对 AI 来说,这些信息不在它的训练数据里,或者就算在,它也不知道对你来说哪一条是适用的。
这就是通用模型和你的具体使用场景之间始终存在的缝隙。而填补这个缝隙的方式,只能是提示工程。你可以在系统提示里注入你的项目上下文,可以在对话开始时交代清楚背景,可以在输出格式上做精确规定。这些不是在"教 AI 变聪明",而是在告诉它你所在世界的规则。
这种做法不会因为下一个更强的模型发布而失效。因为不管你用什么模型,你都需要告诉它你的世界是什么样子。
真正有用的东西不在"技巧"里
网上流传着各种各样的提示词模板和框架。CRISP、CO-STAR、APE、RODES……名字很多,花样也很多。
我早期收藏了一堆模板,后来发现大部分用不上。不是说这些框架不好,而是它们解决的问题太具体了。一个为"数据分析师写 SQL"设计的框架,套到你"写小红书文案"的场景里根本水土不服。
真正反复在用的,其实就几件朴素的事情:
说清楚你的角色和目的。 "我是一个刚起步的自媒体博主,想写一篇关于XX话题的面向25-35岁女性的文章,风格轻松不说教。"这一段话比任何花哨的模板都管用。
给 AI 一个角色。 这一点确实有效。你让 AI 扮演一个有十年经验的房产中介,和你直接问"怎么卖房子",回答的深度和角度完全不一样。这不是玄学,是因为角色设定改变了 AI 选择和组织信息的权重。
约束输出格式。 这点在实际工作中太重要了。你说是用表格还是列表,要不要标题,有没有字数限制——不说它就会用默认格式,而默认格式很少正好是你想要的。
给例子。 如果你能找一个你满意的输出样例贴进去,让 AI 参照这个风格生成,效果立竿见影。AI 对示例的理解力远超对抽象描述的解析力。
这几条没有任何门槛,但做到之后体验会完全不同。
关于"这门技能会不会被淘汰"
我的判断是不会,但形态会变。
就像图形界面没有消灭命令行,搜索引擎没有消灭图书馆,AI 越来越强也不会消灭提示工程。变化的只是"你需要提供多少细节"以及"哪些细节需要你提供"。
十年前的程序员不需要学面向对象的很多设计模式,因为语言帮他们做了很多事。但编程本身并没有消失。同样的逻辑,未来的 AI 也许能更好地理解模糊意图、自动推断上下文,但你还是需要清晰地知道你自己想要什么。
注意,关键在于"你自己想要什么"这件事。提示工程表面上是跟 AI 沟通,本质上是在逼自己把问题想清楚。
我自己有个很深的体会:很多时候给 AI 写完一段完整提示词,还没点发送,就已经意识到自己思路里的漏洞。因为把模糊的想法写成精确的文字的过程,本身就是思考。这个过程中偶尔会发现"啊,其实我并不确定我要什么",然后重新想一遍,等想清楚了,提示词自然也写出来了。
这大概是提示工程最被低估的价值——它不只是在训练 AI,也是在训练你自己的思维清晰度。
最后说句实在的
提示工程这东西,学起来不花钱,但花时间。而这个时间主要不是花在"背模板"上,是花在一次又一次的试错和反思里:为什么这次的回答不是我想要的?我少了什么信息?下次怎么说更清楚?
这个能力跟你会不会编程、学历多高、英语好不好没有关系。它就是一种沟通能力——只不过以前你只跟人沟通,现在多了个 AI。
所以别把它想得太神秘,也别因为它看起来太简单就不当回事。把它当成一种新的写作训练就好:用最少的文字,准确地传达你的意图。这件事永远有价值。
