AI绘画提示词：从\一只猫\到\能用的图\到底差在哪

刚开始用AI绘画的时候，我写提示词就是"一只猫，可爱，好看"——出来的图基本没法用。后来慢慢才明白，不是AI不行，是我说得太模糊了。

写好提示词这件事，说难不难，但确实有一些门道。

核心思路：越具体越好

AI不是你肚子里的蛔虫。你说"一个女孩"，它不知道这个女孩多大、长什么样、穿什么、在干嘛、什么光线、什么风格。每一个模糊的地方，AI都会自己"猜"，猜出来的结果往往跟你想的差很远。

对比一下：

模糊版：一个女孩在户外

具体版：一个二十岁的亚洲女孩，棕色中长发，穿着米色风衣，手里捧着一本书，站在秋日的银杏树林里，风吹起头发，下午金色的阳光透过树叶

第二个提示词出来的图，跟第一个完全不是一个级别。

这里的"具体"并不意味着堆砌形容词，而是每一个词都在描述画面中确实存在的东西。"一个女孩"给了模型极大的自由度——它可以画出任何它认为"常见"的女孩形象。而"二十岁、棕色中长发、米色风衣"这些描述每一条都在收窄模型的选择范围，让最终输出越来越接近你脑海中的画面。

需要注意的是，"具体"也要有主次之分。如果你把每个细节都描述得同样详细，模型反而会不知所措。关键是抓住画面中最核心的 2-3 个元素详细描述，其他部分让模型自行填充就好。

我用的四层结构

写了这么久提示词，我总结出一个比较好用的框架：

第一层：主体。 画什么？谁？在哪？在干嘛？这一层最重要，决定了画面的70%。

第二层：细节。 长什么样？穿什么？什么光线？什么构图？光线这个维度特别重要——"下午四点金色阳光透过树叶"这种描述，一下子就把画面质感拉起来了。

第三层：风格。 想要什么画风？照片级真实、日本动漫、油画、水彩、3D渲染……也可以直接说"新海诚风格"或者"专业人像摄影风格"，效果立竿见影。风格别太多，一两个就够了。

第四层：参数。 quality相关的关键词，对画质有影响但没前三层那么关键。新手可以先不多管。

顺序记住：主体在前，风格中间，参数放最后。

这个四层结构的好处是：你可以独立调整每一层。比如，如果你想看看同一幅画面在不同画风下的效果，只需要改第三层，其他层级保持不变。这样系统化的思维方式，能让你的提示词调试效率提高不少。

关键词库：我的常用清单

积累了这么久，我把常用的关键词按类别整理了一下。不是让你每次都全用上，而是需要的时候翻一翻。

光线类（我的必备清单）：
自然光、柔和光线、逆光、侧光、金色时刻、电影灯光、体积光、霓虹灯、烛光

光线是画面质感的关键。同样一个场景，"柔和的自然光"和"硬调的直射光"会营造出完全截然不同的氛围。如果你不确定该用什么光线，"柔和光线 + 金色时刻"是一个安全且常用的组合。

氛围/情绪类：
温馨、治愈、忧郁、神秘、史诗感、梦幻、宁静、孤独、怀旧、未来感

氛围词的作用是给画面定调。"一个女孩坐在窗边"本身很中性，但加上"宁静""柔和冬日晨光"，画面就有了明确的情绪指向。注意：一个画面通常只需要一个主要氛围词，太多会互相冲突。

视角/构图类：
特写、中景、远景、鸟瞰、俯视、中心构图、三分法、对称构图、浅景深

构图词能帮助模型理解你想要的空间关系。如果你想突出人物表情，用"特写"；如果想突出环境氛围，用"远景"和"大气透视"；如果想营造庄重感，用"对称构图"。

质量类：
8K、细节丰富、电影级、专业摄影、大师作品、超高清、锐利清晰

负面提示词（SD用户必备）：
变形、畸形、多余的手指、缺失的手指、丑陋、水印、文字、模糊、低质量、裁剪

负面提示词在画人物时特别重要。早期的 Stable Diffusion 如果不写负面提示词，很容易出现多余的手指、扭曲的面孔、诡异的身体比例等问题。这是因为 SD 的生成过程是"从噪声中逐渐清晰"，而负面提示词的作用就是告诉模型"这些是要避免的方向"，相当于在生成过程中设置了一道防线。

几个我踩过的坑

提示词不是越长越好。 我曾经写了一百多个关键词的提示词，结果AI记不住那么多，出来的图反而很乱。控制在20-50个关键词，最重要的放前面。

这是因为 Transformer 的注意力机制对靠前的 token 权重更高。关键词堆砌过多时，每个词都被"稀释"了，模型反而找不到重点。建议把最重要的词放在提示词的前三分之一的位置。

别写矛盾的风格。 "写实风格，动漫风格，3D渲染"——你让AI听谁的？风格要统一。

如果你确实想要"动漫和写实的混搭"，更有效的做法是先确定主风格（比如动漫），然后用"材质细节上更写实"这种表述来引入次生风格，而不是并列多个同等权重的风格关键词。

负面提示词很重要。 特别是画人物的时候，不写负面提示词，多出两根手指是常有的事。

特别是 SD1.5 的时代，几乎没有谁能在不加负面提示词的前提下稳定画出正常的手部结构。虽然 SDXL 和 FLUX 在解剖结构上有了很大进步，但负面提示词仍然是提高出图稳定性的好习惯。

别指望一次出好图。 我现在的流程是：出一批草图→选最好的放大→在此基础上变化→调整提示词→再出几张。通常要迭代三四轮才能出满意的。

这个迭代过程其实是人类审美和AI生成之间的"对话"。你的第一轮输入可能只有30%接近脑海中的画面，但每一轮的调整都在缩小"现实"和"想象"之间的差距。经过几轮迭代，你往往会得到超出预期的结果。

别人的提示词别直接抄。 别人的提示词是基于他要画的东西写的，直接拿来用效果不一定好。理解每个关键词的作用，根据自己的需求组合。

这也是为什么我不推荐"提示词分享"社区里那种不加理解的照搬行为。最好学习别人是如何组织代词结构、如何选择关键词的，而不是单纯地复制粘贴。

Midjourney参数速查

如果你用Midjourney，这几个参数比较常用：

--ar 16:9 横屏，--ar 9:16 竖屏，--ar 1:1 方形
--v 5.2 模型版本
--s 750 风格化程度，越高越艺术
--no 水 负面提示词

通用默认我一般用：--ar 16:9 --v 5.2 --s 250

除了这些基本参数，还有一些进阶探索的方向值得了解。比如 --chaos 参数控制结果的随机性——数值越高，出图越多样；--stylize 控制风格的浓度——数值越高，画面越"艺术化"，但也可能越来越偏离提示词。对于以"准确性"为优先的场景（比如产品设计图），建议保持较低的 --s 值；对于以"艺术感"为优先的场景（比如概念图创作），可以适当调高。

最后的建议

AI绘画的核心不是技术，而是你的审美和描述能力。工具会越来越强，但最终决定画面好坏的还是你的想象力。

建议你现在就打开AI绘画工具，试试上面说的四层结构。先从把主体描述清楚开始，慢慢加上光线、构图、风格。用不了多久你就会发现，AI绘画没你想的那么玄学。

AI绘画提示词：从"一只猫"到"能用的图"到底差在哪

AI绘画提示词：从\一只猫\到\能用的图\到底差在哪

核心思路：越具体越好

我用的四层结构

关键词库：我的常用清单

几个我踩过的坑

Midjourney参数速查

最后的建议

相关推荐

面试官问你：如何解决大模型的上下文长度限制——标准回答框架

大模型上下文长度限制完全指南：从原理到工程落地的 4 种方案

面试官问你：RAG 如何处理 PDF——别再说转文本切片了