Midjourney提示词实战:从「一只猫」到让我自己都惊到的图

Midjourney提示词实战:从「一只猫」到让我自己都惊到的图

我用Midjourney大概有大半年了。最开始的时候,我写的提示词是这样的:

一只猫

出来的图就是……一只猫。普普通通,跟百度图片搜的差不多。

后来我开始研究别人写的提示词,发现高手写的是这样的:

一只胖乎乎的橘猫,蓝色大眼睛,戴着红色围巾,坐在冬日的窗台上,窗外飘着雪花,温暖的室内灯光,治愈系插画,宫崎骏风格,柔和的自然光,特写构图,8K --ar 3:4 --v 6

同样的猫,出来的图却让人想截图保存。

这中间的差距在哪里?折腾了这么久,我想把我真正理解的东西写下来。

先搞清楚一件事:Midjourney在"听"什么

很多人写提示词喜欢堆关键词,恨不得把所有好词都塞进去。但我后来发现,Midjourney更像一个"理解语境"的画家,不是一个"匹配关键词"的搜索引擎。

你跟一个真正的画家说"画一只猫",他给你一只猫。但你说"画一只趴在窗台上的橘猫,外面在下雪,屋里很暖,要那种宫崎骏动画里的感觉",出来的东西完全不一样。

写提示词的核心不是堆词,而是描述一个场景。

一个好用的结构是:谁在做什么 + 环境是什么样的 + 什么风格 + 什么光线 + 什么构图 + 参数

不用每次都套这个框架,但当你不知道写什么的时候,按这个顺序想一遍,提示词自然就出来了。

我真正用明白的几个参数

--ar 宽高比:最容易被忽略的参数

新手从来不写 --ar,默认正方形。但宽高比对出图效果影响巨大。

我的经验:

  • 人像、手机壁纸--ar 2:3--ar 9:16
  • 风景、电影感--ar 16:9--ar 21:9
  • 社交媒体头图--ar 3:1
  • Instagram竖图--ar 4:5

一个赛博朋克城市的场景,用 --ar 1:1--ar 21:9 出来的感觉完全不同——后者才有那种电影宽屏的压迫感。

--s 风格化:控制AI的"想象力"

--s 的范围是 0-1000,默认 100。

  • --s 100:严格按你的描述来,AI不太自由发挥
  • --s 750:更有艺术感,AI会自己加戏
  • --s 1000:非常艺术化,有时候美得惊艳,有时候离谱到没法用

我的习惯:探索阶段用 --s 500 看看方向,定下来之后降到 --s 100 微调细节。

--style raw:写实照片的秘密武器

如果你想让Midjourney出"照片"而不是"画",加上 --style raw

这个参数让Midjourney不再那么"艺术化",出来的图更接近真实摄影。配合 --s 100 效果更好。

25岁女性肖像,自然光,窗边,索尼A7R4,85mm f1.4,皮肤细节 --ar 2:3 --v 6 --style raw --s 100

--no 排除不想要的东西

人物图最常见的坑:多一根手指、脸变形、背景里莫名其妙多个东西。

我的做法是每张图都加:

--no 变形,畸形,多余手指,水印,文字

不能保证100%避免,但能少踩很多坑。

--seed:复现好图的关键

出一张特别满意的图,想在此基础上微调?用 --seed

每张图都有一个随机种子,相同的seed + 相同的提示词 = 相似的图。你可以在Discord里对那张图的编号点信封表情,Bot会告诉你seed值。

我把每次出好图的seed都记在一个备忘录里。这个习惯帮了我大忙。

让我进步最快的几个认知

1. 用具体的词替换抽象的词

"好看"、"漂亮"、"高质量"这种词对AI来说等于没说。

  • ❌ "一张好看的照片"

  • ✅ "浅景深,散影柔和,黄金时刻光线,徕卡M10色调"

  • ❌ "一个酷炫的赛博朋克场景"

  • ✅ "雨天,霓虹灯,全息广告,蒸汽,暗调,电影布光"

具体的描述词比一百个形容词有用。

2. 艺术家名字真的有用

与其花200字描述一种风格,不如直接说"某某风格"。

  • "宫崎骏风格"——AI真的懂你要什么
  • "安塞尔·亚当斯风格"——黑白大画幅风景的质感直接就出来了
  • "新海诚风格"——那种通透的光线和天空

这些名字就是风格密码,比任何描述都高效。

3. 图生图是我最常用的工作流

纯文字描述有时候很难精确传达我脑子里的画面。我的做法是:

  1. 先随便出一张构图大概对了的图
  2. 把它作为参考图,加上 --iw 1.2
  3. 调整文字描述,反复迭代

--iw 控制参考图的权重,0.5-1.5 之间效果最好。太高了AI会被参考图限制住,太低了又没什么参考价值。

4. 好图都是改出来的,别指望一次出神图

我的标准流程:

  1. 探索:快速出一批草图(--q 0.5 省时间),找方向
  2. 选定:看到有潜力的,记下seed,开始微调
  3. 优化:改提示词、调参数、用Vary功能局部修改
  4. 出图:满意了用 --q 2 出最高质量版本

一张真正满意的图,平均要迭代10-20次。这不是夸张。

5. Vary (Region) 是V6最好用的功能

Midjourney V6的局部重绘功能,可以选中图片的某个区域单独修改。

比如一张人像,脸很好但手有问题——选中手部区域,写一句"自然的手,正确的五指",重新生成。不用整张图重来。

这个功能解决了我80%的"局部翻车"问题。

我常用的提示词片段

这些是我在无数次尝试中积累下来的"万能片段",可以直接组合使用:

光线类

黄金时刻光线, 伦勃朗布光, 体积光, 逆光轮廓光, 柔光箱, 烛光, 霓虹发光

摄影类

索尼A7R4 85mm f1.4, 徕卡M10 35mm f2, 哈苏X2D 90mm, 浅景深, 散景, 胶片颗粒

风格类

宫崎骏风格, 新海诚风格, 银翼杀手风格, 安塞尔·亚当斯风格, 莫兰迪色系, 赛博朋克调

氛围类

治愈感, 孤独感, 史诗感, 神秘, 怀旧, 未来感, 温馨, 不安

材质类

金属质感, 磨损皮革, 磨砂玻璃, 丝绸光泽, 做旧, 生锈, 半透明

把这些片段组合起来,就能快速写出高质量的提示词。

最后说一句

参数和技巧只是工具。真正决定你的图好不好看的,是你自己的审美和想象力。

多看好的摄影作品、好的电影、好的插画。你的眼睛到了什么水平,Midjourney的图就到什么水平。

技术可以学,审美只能养。