AI绘画进阶参数实战心得
我为什么要写这篇文章
说来惭愧,我刚开始玩 Stable Diffusion 的时候,以为写好提示词就万事大吉了。参数?默认的不就行吗?结果就是疯狂抽卡,出一百张图,能用的不到三张,还搞不清楚为什么。
后来花了很多时间才慢慢搞清楚几个核心参数到底在干什么。这篇文章不想搞成参数大全,我只想把我自己真正吃透的几个讲清楚。那种"列出了15个参数每个写两段"的文章我看不出有什么用——你记不住的,记住了也不知道什么时候该动哪个。
所以我换个思路:假设你就在我旁边看我调参数,我告诉你我在想什么。
Seed:唯一值得你认真对待的参数
Seed 是你在 AI 绘画里能抓住的唯一确定性。
其他参数控制的是"怎么画",Seed 决定的是"画什么"。两个完全相同的提示词,不同 Seed 出来就是不同的构图、不同的人物姿态、不同的光影走向。
我的工作习惯是这样的:
探索阶段Seed 随便跑。 就是随机,出一批看感觉。这个阶段不纠结细节,就是看看提示词方向对不对。
一旦出了张构图喜欢的,立刻把 Seed 锁死。 然后在这个 Seed 上慢慢打磨——改提示词、加细节描述、换风格词。因为构图这东西一旦丢了,同一个提示词下次不一定出得来。
锁了 Seed 之后,只动一个变量。 比如今天只改人物表情的描述,明天只改背景。你要是同时改三个地方,出了问题根本不知道是谁的锅。
有一段时间我不知道 Seed 可以固定,每次看到好图只能截个图存着,再也复现不出来。那种感觉就像做了一个很美的梦但醒来忘了。
CFG Scale:越高越好是最大的误解
CFG 控制的是 AI 有多"听话"。提示词说了什么,CFG 越高,AI 就越严格执行。
听起来全是好处对吧?我以前也这么想。
后来发现 CFG 拉太高画面会炸——不是崩那种炸,是颜色过饱和到刺眼,光影对比强得不自然,像给你的照片套了个 Instagram 滤镜再拉满。人脸上的高光能白到没有细节。
太低呢,AI 开始放飞自我。你说画个蓝天白云,它给你整出个抽象画,构图确实不错但你也不知道这是什么。
我自己大部分时候用 7。偶尔画动漫风格会拉到 8,想要那种色彩浓烈的感觉。画偏写实、偏柔光的场景会降到 6,让 AI 自己发挥一点。
总结就是:6 到 8 是舒适区,大部分情况待在这个范围内别乱动。 看到网上有人 CFG 开 12、15,我不评价,但如果你的图看起来过曝或者颜色太脏,先试试把 CFG 降下来。
采样器:纠结这个不如纠结提示词
采样器的选择可能是新手最纠结的事之一。Euler a、DPM++ 2M Karras、DDIM、UniPC……名字一大堆,光是记住这些缩写就够烦了。
我的经验是这样的:选一个你觉得靠谱的,然后忘掉这个选项。
我用 DPM++ 2M Karras。原因很简单——它不太差,不太慢,不太出错。像一辆家用车,没什么激情但能带你去任何地方。
Euler a 我有时候换着玩,它每步的变化更大,出的图更有"惊喜感",适合探索阶段随手出一批看看感觉。但让我用它做最终出图我不太放心,因为它的结果不太可控。
有人花大量时间测试不同采样器对同一张图的影响。我的态度是:你的提示词写得越好,采样器的差异就越小。 一张细致的提示词,用哪个采样器出来都不会太差。相反的,提示词写得一塌糊涂,换什么采样器都救不了你。
如果非要给建议:新手用 DPM++ 2M Karras,步数设 28 到 35,别碰其他的,先把提示词练好。
分辨率:别贪大
这是我自己踩过最深的坑。
刚开始我总觉得分辨率越高越好,上来就 1024×1024 甚至更高。结果呢?画单人角色还好,一旦画面里有两三个人物,完蛋——两个头长在同一个身体上,或者出现三条腿。
原因其实不复杂。模型是在 512×512(SD 1.5)或 1024×1024(SDXL)这个分辨率上训练出来的。当你大幅超过这个尺寸,模型就开始"懵了",它不知道怎么填充多出来的空间,就开始重复、扭曲、编造。
正确的工作流是这样的:用基础分辨率出图,需要大的就后期放大。
具体说就是,SD 1.5 系模型,出图用 512×768 或者 768×512,觉得不够大就上 Hires Fix,放大 1.5 倍到 2 倍。这样出来的大图,细节、结构都比直接上大分辨率靠谱太多。
SDXL 系的模型基础就是 1024 了,在这个基础上稍微放大一点没问题。
我现在画人物特写常用 512×768(竖构图),出完走一遍 Hires Fix 拉到 768×1152,效果很稳定。偶尔画宽幅场景用 768×512,也是同理。
重绘幅度:图生图的灵魂参数
如果你经常做图生图(img2img),那重绘幅度(Denoising Strength)是除了 Seed 之外最重要的参数。没有之一。
它控制的是"改多少"。0 等于不改,1 等于全部重画。听起来简单,用起来很微妙。
我的几个常用场景:
想稍微修修细节,大体不变:0.25 到 0.35。 比如脸部画崩了想微调一下,或者想把某个地方的颜色改改但构图维持原样。
想换风格但保留构图:0.45 到 0.55。 这个区间很有意思——构图还在,但纹理、笔触全变了。像是同一个素描草稿被不同画家重新上色。
想大幅改动:0.65 到 0.75。 这时候画面已经离原图很远了,只剩下大体轮廓和位置关系还在。适合"我有个构思想重新画"的场景。
别超过 0.8。 高于 0.8 的话,你还不如直接重新生图。保留的信息太少,很多时候出来的图和原图已经没什么关系了。
Hires Fix 里的重绘幅度是一个常见坑。很多人开着 Hires Fix,重绘幅度设默认的 0.7,结果放大之后的图和原图差了十万八千里。Hires Fix 的重绘幅度建议 0.35 到 0.45,只是优化细节用的,不是让你重新设计的。
关于负面提示词
负面提示词这东西,说实话我觉得被很多人过度重视了。
网上流传各种"万能负面模板",几十甚至上百个词。我不否认它有用,但你要是每次都贴一百个负面词,有时候会出现奇怪的副作用——某些你本来想要的元素也被压制掉了。
我的做法是分场景,选择性加:
画人物的时候最在意手部,所以 bad hands、extra fingers、missing fingers 这些必加。画风景的时候手部问题不存在了,这些词就不需要。
另外有些负面词会影响画面风格。比如你加了"3D render"当负面词,那画面会强制偏手绘方向,这在某些情况下不是你想要的。
我现在自己的负面模板很短,就七八条,基本都是解剖结构相关的问题词。碰到特殊情况再加针对性的。
那些很少被提到的细节
批量生成的时候,一次出 4 张够了。 有人说一次出 8 张、16 张,但显存够不够是一回事,4 张看下来基本就知道这个提示词的方向对不对了。对了就锁定 Seed 精修,不对就改提示词重新来。
Clip Skip 这个参数,如果你用的模型推荐设置是 2,那就设 2。 别去调它。现在很多动漫向模型在训练时就用的 Clip Skip 2,你改了反而画风不对。
面部修复(Face Restoration)我基本不开。 CodeFormer 和 GFPGAN 修出来的脸有时候很假,像把别人的脸贴上去的。我宁可重新出一张也不愿意用修复——除非是构图极好但脸崩了,这种情况偶尔修一下可以接受。
我的工作流总结
这是我现在的标准流程,不保证对你有用,但对我来说效率不错:
先用简单提示词 + 随机 Seed + 20 步快速跑出 4 张,看构图方向。找到喜欢的,锁定 Seed,开始加细节描述、调风格词。构图满意之后,步数拉到 30-35,出高质量版。需要大图就加 Hires Fix。如果某个局部不满意,截图拿去做图生图,用低重绘幅度(0.3 左右)修细节。
这个流程的核心思路就是:先定构图,再补细节,最后做放大。每一步只做一件事。
最后说一句
参数这东西,看十篇文章不如自己动手调十次。很多参数的效果取决于你用的模型、写的提示词、想画的题材,别人的"最佳设置"放到你这里不一定好用。
我能给的建议就是:一次只调一个参数,调完对比效果,搞清楚它在干什么。 别同时改三个参数然后说"怎么变差了"——你不知道是哪个的亏。
能把 Seed、CFG、分辨率、重绘幅度这几个真正搞清楚,你就已经超过大部分随便填参数的人了。其他的参数,碰到了再去学就行。