AI绘画提示词:从"一只猫"到"能用的图"到底差在哪

AI绘画提示词:从\一只猫\到\能用的图\到底差在哪

刚开始用AI绘画的时候,我写提示词就是"一只猫,可爱,好看"——出来的图基本没法用。后来慢慢才明白,不是AI不行,是我说得太模糊了。

写好提示词这件事,说难不难,但确实有一些门道。

核心思路:越具体越好

AI不是你肚子里的蛔虫。你说"一个女孩",它不知道这个女孩多大、长什么样、穿什么、在干嘛、什么光线、什么风格。每一个模糊的地方,AI都会自己"猜",猜出来的结果往往跟你想的差很远。

对比一下:

模糊版:一个女孩在户外

具体版:一个二十岁的亚洲女孩,棕色中长发,穿着米色风衣,手里捧着一本书,站在秋日的银杏树林里,风吹起头发,下午金色的阳光透过树叶

第二个提示词出来的图,跟第一个完全不是一个级别。

这里的"具体"并不意味着堆砌形容词,而是每一个词都在描述画面中确实存在的东西。"一个女孩"给了模型极大的自由度——它可以画出任何它认为"常见"的女孩形象。而"二十岁、棕色中长发、米色风衣"这些描述每一条都在收窄模型的选择范围,让最终输出越来越接近你脑海中的画面。

需要注意的是,"具体"也要有主次之分。如果你把每个细节都描述得同样详细,模型反而会不知所措。关键是抓住画面中最核心的 2-3 个元素详细描述,其他部分让模型自行填充就好。

我用的四层结构

写了这么久提示词,我总结出一个比较好用的框架:

第一层:主体。 画什么?谁?在哪?在干嘛?这一层最重要,决定了画面的70%。

第二层:细节。 长什么样?穿什么?什么光线?什么构图?光线这个维度特别重要——"下午四点金色阳光透过树叶"这种描述,一下子就把画面质感拉起来了。

第三层:风格。 想要什么画风?照片级真实、日本动漫、油画、水彩、3D渲染……也可以直接说"新海诚风格"或者"专业人像摄影风格",效果立竿见影。风格别太多,一两个就够了。

第四层:参数。 quality相关的关键词,对画质有影响但没前三层那么关键。新手可以先不多管。

顺序记住:主体在前,风格中间,参数放最后。

这个四层结构的好处是:你可以独立调整每一层。比如,如果你想看看同一幅画面在不同画风下的效果,只需要改第三层,其他层级保持不变。这样系统化的思维方式,能让你的提示词调试效率提高不少。

关键词库:我的常用清单

积累了这么久,我把常用的关键词按类别整理了一下。不是让你每次都全用上,而是需要的时候翻一翻。

光线类(我的必备清单):
自然光、柔和光线、逆光、侧光、金色时刻、电影灯光、体积光、霓虹灯、烛光

光线是画面质感的关键。同样一个场景,"柔和的自然光"和"硬调的直射光"会营造出完全截然不同的氛围。如果你不确定该用什么光线,"柔和光线 + 金色时刻"是一个安全且常用的组合。

氛围/情绪类:
温馨、治愈、忧郁、神秘、史诗感、梦幻、宁静、孤独、怀旧、未来感

氛围词的作用是给画面定调。"一个女孩坐在窗边"本身很中性,但加上"宁静""柔和冬日晨光",画面就有了明确的情绪指向。注意:一个画面通常只需要一个主要氛围词,太多会互相冲突。

视角/构图类:
特写、中景、远景、鸟瞰、俯视、中心构图、三分法、对称构图、浅景深

构图词能帮助模型理解你想要的空间关系。如果你想突出人物表情,用"特写";如果想突出环境氛围,用"远景"和"大气透视";如果想营造庄重感,用"对称构图"。

质量类:
8K、细节丰富、电影级、专业摄影、大师作品、超高清、锐利清晰

负面提示词(SD用户必备):
变形、畸形、多余的手指、缺失的手指、丑陋、水印、文字、模糊、低质量、裁剪

负面提示词在画人物时特别重要。早期的 Stable Diffusion 如果不写负面提示词,很容易出现多余的手指、扭曲的面孔、诡异的身体比例等问题。这是因为 SD 的生成过程是"从噪声中逐渐清晰",而负面提示词的作用就是告诉模型"这些是要避免的方向",相当于在生成过程中设置了一道防线。

几个我踩过的坑

提示词不是越长越好。 我曾经写了一百多个关键词的提示词,结果AI记不住那么多,出来的图反而很乱。控制在20-50个关键词,最重要的放前面。

这是因为 Transformer 的注意力机制对靠前的 token 权重更高。关键词堆砌过多时,每个词都被"稀释"了,模型反而找不到重点。建议把最重要的词放在提示词的前三分之一的位置。

别写矛盾的风格。 "写实风格,动漫风格,3D渲染"——你让AI听谁的?风格要统一。

如果你确实想要"动漫和写实的混搭",更有效的做法是先确定主风格(比如动漫),然后用"材质细节上更写实"这种表述来引入次生风格,而不是并列多个同等权重的风格关键词。

负面提示词很重要。 特别是画人物的时候,不写负面提示词,多出两根手指是常有的事。

特别是 SD1.5 的时代,几乎没有谁能在不加负面提示词的前提下稳定画出正常的手部结构。虽然 SDXL 和 FLUX 在解剖结构上有了很大进步,但负面提示词仍然是提高出图稳定性的好习惯。

别指望一次出好图。 我现在的流程是:出一批草图→选最好的放大→在此基础上变化→调整提示词→再出几张。通常要迭代三四轮才能出满意的。

这个迭代过程其实是人类审美和AI生成之间的"对话"。你的第一轮输入可能只有30%接近脑海中的画面,但每一轮的调整都在缩小"现实"和"想象"之间的差距。经过几轮迭代,你往往会得到超出预期的结果。

别人的提示词别直接抄。 别人的提示词是基于他要画的东西写的,直接拿来用效果不一定好。理解每个关键词的作用,根据自己的需求组合。

这也是为什么我不推荐"提示词分享"社区里那种不加理解的照搬行为。最好学习别人是如何组织代词结构、如何选择关键词的,而不是单纯地复制粘贴。

Midjourney参数速查

如果你用Midjourney,这几个参数比较常用:

  • --ar 16:9 横屏,--ar 9:16 竖屏,--ar 1:1 方形
  • --v 5.2 模型版本
  • --s 750 风格化程度,越高越艺术
  • --no 水 负面提示词

通用默认我一般用:--ar 16:9 --v 5.2 --s 250

除了这些基本参数,还有一些进阶探索的方向值得了解。比如 --chaos 参数控制结果的随机性——数值越高,出图越多样;--stylize 控制风格的浓度——数值越高,画面越"艺术化",但也可能越来越偏离提示词。对于以"准确性"为优先的场景(比如产品设计图),建议保持较低的 --s 值;对于以"艺术感"为优先的场景(比如概念图创作),可以适当调高。

最后的建议

AI绘画的核心不是技术,而是你的审美和描述能力。工具会越来越强,但最终决定画面好坏的还是你的想象力。

建议你现在就打开AI绘画工具,试试上面说的四层结构。先从把主体描述清楚开始,慢慢加上光线、构图、风格。用不了多久你就会发现,AI绘画没你想的那么玄学。