Midjourney 提示工程:完全指南
--niji 7、--oref、--q 2、--style raw 以及 --raw 弃用说明。基础知识请参阅官方文档;标志行为请参考 Blake 的参考资料。
更新于2026年4月25日
2026年4月更新:V8.1 Alpha已发布。 V8.1 Alpha于2026年4月14日在alpha.midjourney.com正式上线。27 HD现已成为默认设置——V8.1在默认任务中可原生生成2K画质,无需单独的放大步骤(Standard Resolution和”Run as HD”仍可使用)。HD模式比V8.0快3倍、便宜3倍;标准分辨率则快50%、便宜25%。V8.0过度处理的视觉风格已不复存在——V8.1回归到”承袭V7精神的一致而熟悉的美学”。图像提示词回归(支持权重),新增Prompt Shortener功能,在超出长度限制时会自动启用,Describe输出的内容也更长、更详细。Moodboards和srefs在V8.1中超级稳定——V8.0的主要薄弱环节得到修复。Midjourney表示,可能会”在V8.1发布几周后”弃用V8.0 Alpha。目前仍仅限alpha阶段——不在主站或Discord上线;V8.1 Alpha的创作内容不会显示在主网站上。即将推出的路线图(根据V8.1公告):先是V8放大器,然后是V8 edit / inpainting / outpainting模型升级。V8.1直接解决的V8.0已知问题(根据公告): 默认美学过度处理/过度抛光,以及moodboards / srefs不稳定。其他社区反馈的V8.0问题(极端值下--stylize范围缩减、抽象能力有限、年龄漂移、”Minecraft效应”块状纹理)在V8.1发布说明中未明确提及——V8.1早期测试将揭示其中哪些问题仍然存在。242527 V8.0背景信息——于2026年3月17日发布;Relax模式已加入Standard/Pro/Mega套餐(除--hd + --q 4组合外的所有命令)22;新版SREF/Moodboards --sv 7(速度快4倍、价格便宜4倍,支持--hd/--p/--stylize/--exp)。22 V8生成图像的速度比V7快约5倍,在指令遵循、连贯性和文字渲染方面有显著提升(使用”引号”效果最佳)。新参数:--hd用于原生2K分辨率,--q 4用于增强连贯性。V8支持--chaos、--weird、--exp、--raw和--stylize(推荐最高1000)。成本提示: 在alpha阶段,--hd、--q 4、--sref和Moodboard任务的成本是常规任务的4倍。21 V7个性化配置文件、moodboards和srefs与V8完全向后兼容。21 新UI功能:改进的对话模式以支持自然语言流程、用于聚焦大型图像集的”Grid Mode”,以及移至侧边栏的设置选项。21 V8后路线图:先是编辑模型,然后是V2视频模型(新的算力集群可支持训练更大规模的视频模型)。18 个性化功能支持多个命名配置文件,设置流程加速(快5倍),并可同时启用多个活跃配置文件。15 个性化界面于2026年2月26日重新设计:图像配对比较被更快速的点击滚动网格系统取代。19 Moodboards新增--profile参数,可直接通过ID使用,现在还能在单个prompt中与--sref代码混合使用。1517 Niji 7(2026年1月9日)带来更干净的线条、改进的眼部/反光细节,并显著减少了--sref风格漂移——--cref仍不可用,但截至2026年2月26日,Niji 7现已完全支持Personalization和Moodboards。319 Web UI新增了Describe on Web(右键点击任意图像可获得4条文本提示词)、新的宽高比选项以及最多2,000个项目的批量操作。1317 Rooms功能于2026年2月26日被移除。16 Video、Moodboards、Draft Mode和所有V7功能均保持现行有效。完整历史记录请参阅Changelog。1
我花费了数百小时测试Midjourney的每个版本、参数组合和风格方向。这份指南将这些经验提炼成我刚起步时希望存在的全面参考资料。无论您是在编写第一个prompt,还是在探索可能性的边界,相关技巧尽在其中。
Midjourney并非一个魔法般的prompt到图像转换器。它是一个精密的视觉语言系统,会响应特定的模式,遵循某些层级关系,并回馈那些理解其架构的人。普通AI艺术与令人惊叹、富有意图的图像之间的差距,就在于对这些模式的理解。
关键洞察:V7从根本上改变了prompt的工作方式。旧式的关键词堆砌方法(”beautiful, stunning, 8k, detailed, masterpiece”)实际上会降低生成效果。V7理解自然语言——写prompt时,要像在向一位资深摄影指导描述一张照片,而不是在为图库网站打标签。
本指南涵盖从初次安装到大多数用户从未发现的进阶技巧的方方面面。每个参数都附有实际范围、真实示例,以及让经验丰富的用户也会栽跟头的边界情况。
目录
第一部分:基础知识
第二部分:参数精通
第三部分:参考系统
第四部分:视频生成
第五部分:题材模板
第六部分:进阶技巧
第七部分:工作流与优化
第八部分:参考资料
什么是Midjourney?
Midjourney是一套从文字描述生成图像的生成式AI系统。与传统的图像编辑或图库摄影不同,您只需描述想要呈现的画面,Midjourney便会生成与您构想相匹配的原创图像。
Midjourney的独到之处:
| 维度 | Midjourney | 竞争对手 |
|---|---|---|
| 图像质量 | 业界领先的美学水准 | 参差不齐 |
| 自然语言 | V7能理解完整句子 | 通常依赖关键词 |
| 写实表现 | V7表现尤为出色 | 良好至优秀 |
| 动漫/插画 | Niji模型专门优化 | 通用型 |
| 视频 | 原生支持(2025年6月) | 需借助独立工具 |
| 社区 | 集成分享与发现 | 各有差异 |
您可以创作什么:
- 写实图像:人像、产品、建筑、自然
- 插画作品:概念艺术、书籍封面、编辑插图
- 动漫与漫画:通过专门的Niji模型
- 抽象艺术:实验性、超现实构图
- 视频:基于图像生成5至21秒的动画片段
Midjourney不是什么:
- 不是照片编辑器(请使用Photoshop)
- 不是角色一致性系统(尚未做到——但正在快速改进)
- 不是用于复刻特定版权角色的工具
- 不是免费的(订阅价格从每月10美元至120美元)
入门指南
账户设置
- 访问 midjourney.com
- 使用Discord登录或创建账户
- 选择订阅方案:
| 方案 | 价格 | Fast GPU | Relax GPU | 视频Relax |
|---|---|---|---|---|
| Basic | $10/月 | 3.3小时 | — | — |
| Standard | $30/月 | 15小时 | 无限 | — |
| Pro | $60/月 | 30小时 | 无限 | 是 |
| Mega | $120/月 | 60小时 | 无限 | 是 |
专家建议: 从Standard($30/月)起步。无限Relax模式对实验探索至关重要——学习过程中,Fast小时数会消耗得很快。
您的第一个提示词
打开网页界面 midjourney.com/imagine 并输入:
A golden retriever sitting in autumn leaves, soft afternoon sunlight
仅此而已。无需特殊语法。V7能够理解自然语言。
您将获得: 金毛犬在秋景中的四种变体。在此基础上,您可以:
- Upscale:点击U1-U4生成高分辨率版本
- Vary:点击V1-V4创建细微变体
- Reroll:使用相同提示词重新生成四个新变体
网页版与Discord对比
| 功能 | 网页界面 | Discord |
|---|---|---|
| 易用性 | 更简便 | 学习曲线较陡 |
| 图像管理 | 内置图库 | 散落在频道中 |
| 视频生成 | 完整支持 | 不可用 |
| 提示词编辑 | 可视化界面 | 文本命令 |
| 社区 | Explore标签页 | 频道浏览 |
| 推荐 | 从这里开始 | 资深用户 |
网页界面如今已成为主要的使用入口。Discord仍可使用,但缺少视频生成功能,工作流也不够直观。
核心概念
提示词的工作原理
每条Midjourney提示词都会经过这样的处理流程:
Your Text Prompt
↓
[Text Encoder] → Converts words to mathematical embeddings
↓
[Diffusion Model] → Generates image from noise, guided by embeddings
↓
[Upscaler] → Increases resolution and detail
↓
Final Image
这对您意味着什么:
- 词序至关重要:靠前的词比靠后的词影响更大
- 具体胜过笼统:”golden hour sunlight casting long shadows”远胜”nice lighting”
- 矛盾会引发混乱:”dark, bright, moody, cheerful”会相互抵消
- 少即是多:50至150个token通常优于300个以上的token
Token经济学
Midjourney看到的不是您的词语——而是token(大致相当于词的片段)。
| Token数量 | 效果 | 适用场景 |
|---|---|---|
| 10-30 | 解读非常开放 | 抽象、实验性 |
| 30-80 | 控制力均衡 | 大多数提示词 |
| 80-150 | 精细控制 | 特定场景 |
| 150+ | 收益递减 | 可能引发冲突 |
专家建议: 如果您的提示词超过150个token,很可能是过度描述了。删掉那些堆砌的形容词。
质量信号
V7对某些描述模式反应尤为强烈:
光照(影响最大): - “golden hour light casting long shadows across weathered stone” - “Rembrandt lighting with soft fill from camera left” - “bioluminescent glow illuminating the fog”
材质与纹理: - “oxidized copper with verdigris patina” - “worn leather showing decades of use” - “translucent jade catching the light”
氛围与情绪: - “melancholic twilight atmosphere” - “oppressive industrial ambiance” - “ethereal dreamlike quality”
专业摄影术语: - “shot on medium format, shallow depth of field” - “85mm lens, f/1.8 aperture” - “anamorphic lens flare, 2.39:1 aspect”
提示词层级
每条高效的提示词都遵循一定的层级。位于顶端的词具有最大的影响力。
┌─────────────────────────────────────────────────┐
│ 1. SUBJECT (who/what) ← Most important │
│ "elderly fisherman" │
├─────────────────────────────────────────────────┤
│ 2. SUBJECT DETAILS (descriptors) │
│ "weathered face, silver beard, kind eyes" │
├─────────────────────────────────────────────────┤
│ 3. CONTEXT (where/when) │
│ "on a wooden dock at dawn" │
├─────────────────────────────────────────────────┤
│ 4. STYLE/MOOD (how it feels) │
│ "documentary photography, contemplative" │
├─────────────────────────────────────────────────┤
│ 5. TECHNICAL (camera/lighting) │
│ "shot on Leica, natural morning light" │
├─────────────────────────────────────────────────┤
│ 6. PARAMETERS (--ar, --s, etc.) ← Fine-tuning │
│ "--ar 3:2 --s 100 --v 7" │
└─────────────────────────────────────────────────┘
提示词模板
[SUBJECT] [SUBJECT DETAILS], [CONTEXT], [STYLE/MOOD], [TECHNICAL] --parameters
应用层级的示例:
An elderly fisherman with a weathered face and silver beard, standing on a
wooden dock at dawn, documentary photography style, contemplative mood,
shot on Leica M11 with natural morning light, soft mist rising from the water
--ar 3:2 --s 100 --v 7
多数用户忽略的一点: 他们以风格开头(“beautiful cinematic photo of…”),而非主体。V7对靠前的token赋予较高权重——请用您真正想呈现的内容来开篇。
版本选择
V8 Alpha(2026年3月17日)
V8是Midjourney的下一代模型,目前正在alpha.midjourney.com进行alpha测试。21
优势:
- 图像生成速度比V7快约5倍
- 指令遵循能力和连贯性大幅提升
- 通过--hd参数实现原生2K分辨率
- 迄今最佳的文本渲染(在prompt中使用”引号”)
- 通过个性化、sref和moodboard增强美学理解
- 通过--q 4实现额外连贯模式
- 完全向后兼容V7的个性化配置文件、moodboard和sref
生成模式:
| 模式 | 速度 | 成本 | 最适合 |
|---|---|---|---|
| Fast | 比V7快约5倍 | 1x | 标准工作流 |
--hd |
慢4倍 | 4x | 原生2K分辨率 |
--q 4 |
慢4倍 | 4x | 额外连贯性 |
--sref / Moodboard |
慢4倍 | 4x | 风格引导生成 |
已知限制和问题(alpha):
- ~~Relax模式尚未可用~~ — Relax模式已于3月21日加入,适用于Standard、Pro和Mega订阅(--hd + --q 4组合除外)22
- 图像提示和变化的行为可能与V7不同
- 过度处理的美学:默认输出可能感觉过于精致和人工——使用--style raw来抵消24
- 风格化范围缩小:极高的--stylize值产生的剧烈变化比V7少24
- 抽象能力有限:模型倾向于将超现实或非具象的prompt”修正”为更易识别的内容24
- 年龄漂移:主体有时被渲染得比指定的年龄更老或更成熟25
- 输出不一致:相同的prompt可能产生三张优秀结果和一张偏离目标的图像(alpha不稳定性)24
- “Minecraft效应”:在某些prompt类型上偶尔出现块状纹理25
- 仅限网页:V8 Alpha需要alpha.midjourney.com — 无法通过Discord访问25
新UI功能: - 自然语言流的对话模式 - 用于聚焦大型图像集的”Grid Mode” - 设置位于侧边栏(不再阻挡视图)
用法:
a weathered lighthouse on volcanic cliffs at golden hour,
dramatic clouds, crashing waves --v 8 --hd
V8 Alpha提示词技巧:
- 使用--style raw减少默认的过度精致外观,获得更粗粝、更真实的结果24
- 精确指定电影摄影照明:”single overhead key light with no fill, hard shadows”胜过”dramatic lighting”24
- 通过姓名引用摄影师/导演来锚定风格(例如”Annie Leibovitz portraiture”、”Roger Deakins cinematography”)24
- 精确描述媒介:”35mm film photograph, grain, Kodak Portra 400 palette”会缩小解空间24
- 有效的--no模式:--no blur, depth of field用于扁平图形;--no smile, makeup用于中性肖像24
- --stylize 100-400在V8中产生最有用的范围;极端值不如V7中那样有效24
V8.1 Alpha — 2026年4月14日发布:
V8.1 Alpha于2026年4月14日在alpha.midjourney.com上线。27 HD现已成为默认设置 — V8.1在默认任务上无需单独的upscaler步骤即可生成原生2K(Standard Resolution和”Run as HD”仍然存在)。HD模式比V8.0 Alpha快3倍且便宜3倍。标准分辨率快50%且便宜25%。美学风格回归”V7的精神” — 告别V8.0默认的过度处理/过度精致风格。图像提示回归(带权重)。新的Prompt Shortener会在你超出prompt长度限制时自动启用。Describe已更新,可生成更长、更详细的输出。Moodboard和sref超级稳定。Midjourney表示”在V8.1发布几周后”可能会停用V8.0 Alpha。尚未上线主站或Discord — 仅限alpha。即将到来的路线图(根据V8.1帖子):V8 upscaler,然后是V8 edit / inpainting / outpainting模型升级。27
何时使用V8: - 当你需要最快的生成速度时 - 用于文本密集型图像 - 当连贯性最为重要时 - 利用原生2K分辨率
V7(2025年6月起为默认)
V7是Midjourney当前的旗舰模型,于2025年4月3日发布。2
优势: - 自然语言理解(写句子,而非关键词) - 迄今最佳的照片真实感 - 文本渲染大幅改善 - 更好的人体解剖(手部、身体) - 改进的空间关系 - 默认启用个性化
生成模式:
| 模式 | 速度 | 成本 | 最适合 |
|---|---|---|---|
| Turbo | 最快 | 正常的2x | 时间紧迫时的最终渲染 |
| Fast | 正常 | 1x | 标准工作流 |
| Relax | 排队 | 包含 | 探索、学习 |
| Draft | 快10倍 | 0.5x | 快速迭代 |
何时使用V7: - 照片真实感图像 - 任何包含复杂自然语言的prompt - 文本渲染 - 当质量最为重要时
Niji 7(2026年1月)
Niji 7是专门的动漫/漫画模型,于2026年1月9日发布。3
优势:
- 水晶般清澈的眼睛、反射和精细的背景细节3
- 复杂姿势和多臂设置的连贯性得到改善
- 更字面的prompt解读——精确处理特定颜色位置和发型
- 更好的文本渲染
- 增强的--sref性能,风格漂移显著减少3
- 干净、扁平的线条美学,旨在突出改进的线条质量
限制:
- 不支持--cref——团队暗示有”更强大的秘密惊喜”替代方案3
- 自2026年2月26日起,完全支持个性化(--p)和Moodboard19
- 比之前的Niji版本更字面化——调整氛围式的prompt
即将推出:
- 新的角色参考系统替代--cref(预计将超越--cref的能力)
用法:
A determined young mage with crimson hair, casting fire magic,
intense expression, ancient library background --niji 7
何时使用Niji 7: - 动漫和漫画风格插画 - 角色设计 - 东方美学插画 - 当你想要更干净的线条时
Niji 6(旧版)
仍可用于向后兼容。
何时使用Niji 6:
- 你需要风格预设(--style expressive、--style cute、--style scenic)
- 你的工作流依赖--cref
- 你偏好更柔和、不那么字面的解读
风格:
--niji 6 --style expressive # Dynamic, stylized
--niji 6 --style cute # Kawaii aesthetic
--niji 6 --style scenic # Background focus
--niji 6 --style original # Classic Niji look
版本对比
| 特性 | V7 | Niji 7 | Niji 6 |
|---|---|---|---|
| 照片真实感 | 优秀 | N/A | N/A |
| 动漫 | 良好 | 优秀 | 优秀 |
| 自然语言 | 最佳 | 良好 | 中等 |
| 文本渲染 | 最佳 | 良好 | 有限 |
--oref |
是 | 否 | 否 |
--cref |
否 | 否 | 是 |
--sref |
是 | 是(最佳) | 是 |
--p |
是 | 是(2026年2月)19 | 可选 |
| 风格预设 | 否 | 否 | 是 |
V8开发状态(2026年3月)
截至2026年3月4日的office hours,V8已功能完整并准备发布。18 蒸馏运行(速度优化)即将开始,大约需要一周时间;完成后,V8将作为可选加入的非默认模型发布,进入约30天的pre-alpha阶段,然后取代V7成为默认模型。1618 指南作者和版主于1月下旬开始内部测试,整个2月中旬期间举行了多次社区评分聚会。912
已确认的V8功能: - 原生2K分辨率(2048px)— 消除upscaler中间环节,输出真正更清晰14 - 文本渲染大幅改善(V7最薄弱的领域)14 - 更好地生成复杂主体(生物、半人马、不寻常的解剖结构) - 完整的架构重写(新代码库,原生支持64px至2048px+)14 - 全面支持style reference、moodboard、个性化、weird参数12 - 用于社区风格分享的Style Creator和web profile11 - 内置upscaling和编辑功能12 - 新的创作流程:64张256px图像用于快速探索,然后聚焦并放大优胜者10 - 基础设施从TPU切换到GPU,使用PyTorch(代码库支持更好,招聘更快)11 - 为低端硬件设计的V8”mini”变体11 - 推动实时预览生成 - 速度提升:即使对Turbo用户也很显著,对非Turbo工作流则是大幅提升18
发布注意事项:
- 图像提示和变化在初始推出期间的行为可能不同18
- ~~V8发布时Relax模式将不可用~~ — Relax模式现已可用,面向Standard、Pro和Mega订阅者(除--hd + --q 4组合外的所有命令)22
- 部分功能将根据发布后的用户反馈进行优化18
时间线(截至2026年3月13日):
- 内部测试:2026年1月9
- 评分聚会:2026年2月初至中旬12
- 最终评分轮(V8个性化校准):2026年2月20日20
- 功能完整:2026年3月4日确认18
- 蒸馏运行:即将开始(约1周时长)18
- V8 Alpha发布:2026年3月17日于alpha.midjourney.com(可选加入,非默认)21
- Relax模式加入:2026年3月21日22
- 新的SREF/Moodboard版本(--sv 7):快4倍,便宜4倍,支持--hd、--p、--stylize、--exp22
- V8.1 Alpha发布:2026年4月14日于alpha.midjourney.com(HD默认,快3倍且便宜3倍,图像提示回归,V7精神美学)27
- Pre-alpha:发布后约30天,然后成为默认16
- 移动应用改进计划在V8发布后进行9
- 具备摄像机移动和重新构图的3D功能正在开发中9
V8之后的下一步: - 编辑模型(V8发布后的第一优先级)18 - V2视频模型(2026年3月到货的新计算集群可训练更大的视频模型)18 - 硬件项目:四项正在进行中,包括一款可穿戴设备和一个仓库规模的组装项目10 - 带有用户偏好学习系统的batch模式扩展9 - 实时AI模型作为长期目标9
宽高比
--ar参数设置图像尺寸。默认为1:1(正方形)。
常用比例
| 比例 | 尺寸 | 使用场景 |
|---|---|---|
1:1 |
正方形 | 社交媒体、图标 |
4:5 |
竖向 | Instagram动态、移动端 |
5:4 |
横向 | 桌面、演示文稿 |
16:9 |
宽屏 | YouTube、演示文稿 |
6:11 |
高竖屏 | 手机壁纸、竖向海报 |
9:16 |
垂直 | Stories、TikTok、移动端 |
21:9 |
超宽 | 电影感、电影 |
3:2 |
经典 | 摄影印刷 |
2:3 |
竖向 | 垂直印刷 |
平台专属推荐
| 平台 | 比例 | 备注 |
|---|---|---|
| Instagram动态 | 1:1或4:5 |
4:5占据更多屏幕空间 |
| Instagram Story | 9:16 |
全竖屏 |
| Twitter/X | 16:9或1:1 |
16:9在动态中展开 |
1.91:1或16:9 |
专业横向 | |
2:3 |
竖向表现最佳 | |
| YouTube缩略图 | 16:9 |
标准视频格式 |
| 桌面壁纸 | 16:9或21:9 |
匹配你的显示器 |
构图影响
宽高比不仅仅是尺寸——它从根本上改变构图。
宽比例(16:9、21:9): - 强调环境和上下文 - 自然适合风景、城市景观 - 电影感 - 主体成为场景的一部分
高比例(4:5、9:16): - 将注意力集中在主体上 - 自然适合肖像、产品 - 亲密感 - 更多的垂直信息
专家提示: 对于电影感肖像,尝试4:5而不是显而易见的16:9。你可以获得肖像那种聚焦主体的取景,同时保留足够的上下文来讲述故事。
风格化
--s参数控制V7应用的艺术诠释程度。范围:0-1000。默认值:100。
风格化范围
| 范围 | 效果 | 最适合 |
|---|---|---|
| 0-50 | 最低限度的诠释 | 产品照片、技术准确性 |
| 50-150 | 平衡(默认) | 通用、人像 |
| 150-300 | 风格明显 | 艺术照片、氛围作品 |
| 300-500 | 风格强烈 | 插画、概念创作 |
| 500-1000 | 高度风格化 | 抽象、实验性 |
视觉示例
Portrait of a woman, soft window light --s 50
# Result: Clean, realistic, minimal embellishment
Portrait of a woman, soft window light --s 250
# Result: More artistic interpretation, enhanced mood
Portrait of a woman, soft window light --s 600
# Result: Distinctly stylized, dreamlike quality
决策框架
在以下情况下使用低风格化(0-100): - 创作产品摄影 - 需要照片级真实的准确性 - 技术或文档类图像 - 提示应被字面化解读
在以下情况下使用中等风格化(100-300): - 通用创意工作 - 编辑类摄影 - 希望增强画面但不走极端 - 在写实与艺术之间取得平衡
在以下情况下使用高风格化(300+): - 创作插画或概念艺术 - 抽象或实验性作品 - 希望Midjourney的美学占主导 - 突破创意边界
风格化 + Style Raw
为获得最大程度的照片级真实感,可将低风格化与--style raw结合使用:
Portrait of a businessman, office background --s 50 --style raw --v 7
--style raw告诉V7尽量减少自身的美学诠释,让结果更贴近对提示的字面呈现。
Chaos和Weird
Chaos(–chaos 0-100)
控制四张生成图像之间的差异程度。默认值:0。
| 数值 | 效果 |
|---|---|
| 0 | 输出非常相似 |
| 25 | 略有变化 |
| 50 | 中等多样性 |
| 75 | 多样性较高 |
| 100 | 不可预测性最大 |
何时使用chaos:
- 探索阶段:--chaos 50-75以查看多样化的诠释
- 最终渲染:--chaos 0-25以获得一致的结果
- 寻找方向:前期使用高chaos,精修阶段使用低chaos
Weird(–weird 0-3000)
引入非传统、出人意料的美学。默认值:0。
| 范围 | 效果 |
|---|---|
| 0 | 标准美学 |
| 100-500 | 微妙的怪异感 |
| 500-1000 | 明显的奇异感 |
| 1000-2000 | 非常异常 |
| 2000-3000 | 最大程度的怪异 |
何时使用weird: - 超现实或梦幻般的图像 - 摆脱通用的AI美学 - 概念艺术探索 - 当”常规”显得过于可预测时
组合使用Chaos和Weird
--chaos 50 --weird 500 # Varied outputs, each slightly quirky
--chaos 100 --weird 0 # Wild variations, normal aesthetic
--chaos 25 --weird 2000 # Similar outputs, all very weird
专家提示: 高weird值能产生真正不寻常的图像,但结果不稳定。建议在探索阶段使用,最终渲染时再调低。
实验性美学
--exp参数可增强细节、动感以及色调映射效果。范围:0-100。默认值:0。
效果级别
| 数值 | 效果 | 备注 |
|---|---|---|
| 0 | 关闭(默认) | 标准渲染 |
| 5 | 微妙增强 | 可安全与其他参数组合 |
| 10 | 细节明显提升 | 良好的起点 |
| 25 | 效果强烈 | 混合使用时建议的上限 |
| 50 | 非常强烈 | 可能降低提示准确性 |
| 100 | 最大值 | 可能压制–stylize和–p |
–exp的作用
- 更细腻的纹理与表面
- 更具张力、冲击力的构图
- 类似HDR的色调映射外观
- 增强视觉吸引力
推荐组合
--exp 10 --s 200 # Enhanced detail, balanced style
--exp 25 --s 100 # Strong exp, controlled stylize
--exp 5 --style raw # Subtle boost for photorealism
警告:参数冲突
在高数值下(25-50以上),--exp可能会:
- 压制--stylize设置
- 覆盖个性化(--p)
- 降低图像多样性
专家提示: 大多数工作中将--exp保持在10-25。更高的数值适用于特定的风格化效果,而非通用的质量提升。
Omni Reference
--oref参数可将参考图像中的主体特征转移到您的生成结果中。该参数在V7中取代了--cref。
基本用法
/imagine A woman in a red dress at a gala --oref [image URL]
可转移内容: - 面部及五官特征 - 体型和身材比例 - 服装与配饰 - 整体身份特征
权重控制(–ow)
--ow 0-1000 # Omni weight (default 100)
| 权重 | 效果 |
|---|---|
| 0-30 | 宽松启发,允许风格变化 |
| 30-60 | 中等影响 |
| 60-100 | 强烈相似(默认区间) |
| 100-300 | 非常接近的匹配 |
| 300-1000 | 最大保真度 |
权重交互
--ow参数会与--stylize和--exp争夺影响力。当使用较高的stylize或exp值时,应提高--ow以保持参考的一致性:
# High stylize needs higher ow to keep reference
--oref [url] --ow 200 --s 400
# High exp overwhelms default ow
--oref [url] --ow 300 --exp 25
# If you aren't using high stylize/exp, stay at moderate ow (100-400)
专家提示: 在不使用极端--stylize或--exp的大多数工作中,将--ow保持在400以下。仅当需要在强风格参数下保留精确的面部特征或服装细节时,才超出中等数值。
最佳实践
参考图像的质量很重要: - 高分辨率、主体清晰 - 正面照片最适合面部 - 参考图像中光线一致 - 背景干扰最小
根据风格变化调整权重:
# Photo to anime conversion - lower weight
--oref [photo URL] --ow 40 --niji 7
# Maintaining strict likeness
--oref [photo URL] --ow 200 --v 7
与style reference结合使用:
# Subject from one image, style from another
--oref [subject URL] --sref [style URL] --ow 100 --sw 150
Style Reference
--sref参数可将参考图像的美学特质转移到生成结果中。
基本用法
/imagine A mountain landscape at sunset --sref [style image URL]
可转移内容: - 配色方案 - 光影风格 - 艺术技法 - 整体氛围/情绪 - 构图倾向
权重控制(–sw)
--sw 0-1000 # Style weight (default 100)
| 权重 | 效果 |
|---|---|
| 0-50 | 微妙影响 |
| 50-150 | 平衡转移 |
| 150-300 | 风格匹配强烈 |
| 300-1000 | 风格主导 |
多个Style Reference
您可以组合多张风格图像:
--sref [url1] [url2]
各风格会相互融合。可用于创造独特的美学组合。
最佳实践
最适合: - 鲜明、一致的风格 - 清晰的美学特征 - 具有强烈视觉识别度的图像
效果较弱的情况: - 非常通用的照片 - 风格混杂或不明确 - “风格”并不显眼的图像
专家提示: Niji 7的--sref表现最佳。如果风格转移至关重要,即便不是动漫内容,也可考虑使用Niji 7。
使用旧版Style Reference代码
如果您持有V6时代的--sref代码,它们在V7中无法直接使用。请添加--sv 4以启用旧版风格代码:
/imagine A mountain landscape --sref 123456789 --sv 4
# --sv 4 tells V7 to interpret the code using the V6 style system
/imagine A mountain landscape --sref 123456789 --sv 6
# --sv 6 tells V7 to interpret the code using the V6.1 style system
V8 Alpha SREF更新(2026年3月): 全新的SREF/Moodboards版本(--sv 7)现已成为V8 Alpha中的默认版本。其速度比旧版本快4倍、成本低4倍,并支持--hd、--p、--stylize和--exp参数。Moodboards同样默认使用--sv 7,并享有相同改进。22
注意: 虽然--sv 4和--sv 6保持向后兼容,但建议在V7或V8中重新生成style reference,以便在新模型下获得更好的效果。
Image Weight
--iw参数控制参考图像对生成结果的影响程度。
基本用法
/imagine [prompt] [image URL] --iw 1.5
权重范围
范围:0-2(默认值1)
| 权重 | 效果 |
|---|---|
| 0-0.5 | 提示主导 |
| 0.5-1 | 平衡 |
| 1-1.5 | 图像主导 |
| 1.5-2 | 图像影响强烈 |
使用场景
低权重(0-0.5): 将图像作为宽松的灵感,由提示主导
平衡(0.5-1): 提示与图像影响力相当
高权重(1.5-2): 紧密基于图像创建变体
Moodboards(自定义风格档案)
Moodboards让您通过对图像评分来创建个性化风格档案。与使用单张--sref图像不同,您可以从多个示例中构建稳定的美学偏好。7 现在您可以创建多个具名档案、设置默认档案,甚至同时选择多个活跃档案。15
Moodboards的工作原理
- 在midjourney.com/personalize创建moodboard
- 通过点击并滚动浏览图像网格来为图像评分(已于2026年2月26日取代旧的1v1比较系统)——设置速度提升至原来的5倍1519
- 使用
--p应用默认moodboard - 使用
--p [mID]应用特定moodboard - 为不同项目或协作者命名并组织多个档案15
构建稳定的档案
| 评分数 | 稳定性 |
|---|---|
| 40 | 可用档案的最低数量15 |
| 200 | 较稳定,结果可靠15 |
| 2,000 | 极致精修,一致性最佳15 |
专家提示: 至少为200张图像评分以获得可靠的moodboard。同时包含喜欢与不喜欢的图像——不喜欢的评分有助于Midjourney理解应避免什么。您可以同时选择多个活跃档案以实现混合美学。15
使用Moodboards
/imagine A forest path at dawn --p
# Uses your default moodboard
/imagine A forest path at dawn --p abc123
# Uses specific moodboard with ID abc123
/imagine A forest path at dawn --profile abc123
# Alternative syntax using --profile parameter
Moodboards与Style Reference对比
| 方法 | 最适合 |
|---|---|
--sref |
来自单张图像的一次性风格 |
--p(Moodboard) |
跨项目保持一致的个人美学 |
将Moodboards与–sref混合使用
您可以在同一提示中将moodboards与style reference代码组合,实现细致入微的控制:17
/imagine A portrait --p --sref [url] --sw 50
# Your moodboard aesthetic + subtle style reference influence
/imagine A portrait --sref 142710498 --profile drgmjoi 2jrqbw6
# Mix sref codes with multiple moodboard profiles
您还可以将moodboard快照作为代码分享(例如--profile 2jrqbw6)供他人使用,或分享一个会随您的精修而更新的实时版本链接。17
Draft Mode
Draft mode以10倍速度生成图像,GPU成本仅为一半。是探索阶段的必备工具。
启用Draft Mode
/imagine [prompt] --draft
或在网页界面设置中切换。
Draft与Full对比
| 方面 | Draft | Full |
|---|---|---|
| 速度 | 约快10倍 | 标准 |
| GPU成本 | 50% | 100% |
| 细节 | 减少 | 完整 |
| 最适合 | 探索 | 最终输出 |
Draft工作流
1. Draft Mode Exploration (--draft)
├── Test 5-10 variations quickly
├── Identify promising directions
└── Note effective parameters
2. Full Render Refinement
├── Remove --draft flag
├── Apply learned parameters
└── Fine-tune with --seed
专家提示: 始终从Draft mode开始。节省的成本会日积月累,且您能探索更多选项。仅当找到值得深入打磨的方向时,才切换到完整渲染。
图像转视频基础
Midjourney的V1 Video Model于2025年6月19日发布,支持图像转视频动画。
工作原理
- 选择任意图像(Midjourney生成或上传的)
- 点击”Animate”按钮
- 选择选项(Auto、Manual、Loop)
- 生成5秒视频片段
运动参数
--motion low # Still scenes, slow motion, subtle movement (default)
--motion high # Big camera motions, larger character movements
--raw # Reduces creative flair, more prompt control
运动效果对比
| 设置 | 效果 | 适用场景 |
|---|---|---|
| Low | 微妙、电影感的运动 | 人像、静物、氛围画面 |
| High | 动感、充满活力的运动 | 动作、风景、人群 |
警告: 高强度运动可能产生不真实或失真的动作。建议从low开始,必要时再调高。
费用与方案
- 默认每个prompt生成4个视频;使用
--bs #可降至1或2,以节省GPU时间 - Standard、Pro和Mega方案可生成HD video(仅限Fast Mode)
- 仅Pro和Mega方案支持视频Relax Mode(仅SD)
| 方案 | Fast Video | Relax Video | HD Video |
|---|---|---|---|
| Basic | 是 | 否 | 否 |
| Standard | 是 | 否 | 是(仅Fast) |
| Pro | 是 | 是(仅SD) | 是(仅Fast) |
| Mega | 是 | 是(仅SD) | 是(仅Fast) |
HD Video模式
HD Video模式(2025年8月发布)提供4倍清晰度的分辨率——像素密度提升4倍,视频质量显著增强。8
如何使用HD Video: 1. 先生成标准视频 2. 在已完成的视频上点击HD选项 3. 等待高分辨率渲染
HD Video费用: - 比标准视频贵约3.2倍 - 仅限Pro和Mega方案使用 - 必须先有标准视频(无法直接生成HD)
| 模式 | 分辨率 | Batch 1 | Batch 2 | Batch 4(默认) |
|---|---|---|---|---|
| Standard (SD) | 基础 | 2分钟 | 4分钟 | 8分钟 |
| High Definition (HD) | 4倍像素 | 7分钟 | 13分钟 | 26分钟 |
何时使用HD: - 最终交付素材 - 大屏显示或投影 - 专业/商业作品 - 运动中需要呈现细节时
专家提示: 始终先在SD模式下测试。HD耗时更长、费用更高——只对最佳片段进行升级。
延长与循环
延长视频
任何视频均可额外延长4秒,最多延长4次(最长21秒)。
延长选项: - Auto:自动延续视频 - Manual:延长前可调整prompt
延长的最佳实践: - 开始前规划好叙事节奏 - 前5秒应建立场景 - 每次延长都应有明确目的 - 注意节奏——21秒比想象中要长
创建循环
Loop选项可创建首尾画面无缝衔接的循环视频。
Select image → Click "Loop" → Generate
适用场景: - 背景动画 - 社交媒体内容 - 氛围视觉 - 动态影像(Cinemagraph)
改善循环效果的技巧: - 简单、可重复的运动效果最佳 - 避免复杂的镜头运动 - 大气元素(云、水、火)天然适合循环
视频最佳实践
何时使用视频
适合视频的题材: - 氛围场景(雾、雨、火) - 微妙的动态(头发、织物、水流) - 带有环境运动的风景 - 动作幅度小的人像
不太适合视频的题材: - 复杂的动作序列 - 多角色场景 - 精确的编排动作 - 对技术准确性要求高的场景
为视频优化
动画化之前: 1. 先生成完美的静态图像 2. 思考各元素可能如何运动 3. 避免复杂、相互关联的主体 4. 简洁的构图更易于动画化
Prompt调整:
# Good for video
Lone figure standing on cliff edge, wind blowing cape, dramatic clouds
# Less ideal for video
Group of dancers in synchronized formation, precise movements
成本管理
视频成本是图像的8倍,累加起来非常可观:
高性价比工作流: 1. 在Draft mode下探索(图像) 2. 找到完美构图 3. 生成最终高质量静图 4. 仅对最佳版本进行动画化 5. 必要时再延长
电影感写实
实现照片级写实、电影感效果的最有效模式。
电影感模板
[Shot type] by [Director], [subject physical description],
[action/pose], [costume/styling], [setting details],
captured with [Camera Body] using [Lens], [lighting description],
[mood/atmosphere summary]
--ar [ratio] --s [value] --p --no anime, cartoon, illustration, painting
导演风格
| 导演 | 视觉风格 | 适用场景 |
|---|---|---|
| Ridley Scott | 富有氛围、质感丰富、情绪化 | 科幻、时代剧、特写 |
| Denis Villeneuve | 史诗规模、荒凉、几何感 | 风景、广角镜头 |
| David Fincher | 暗黑、精确、令人不安 | 惊悚片、情绪化人像 |
| Roger Deakins | 剪影、自然光、富有诗意 | 任何以光线为重点的画面 |
| Alfonso Cuarón | 沉浸感、亲密、跟拍 | 角色瞬间、紧张氛围 |
| Wes Anderson | 对称、粉彩、奇趣 | 风格化、居中构图 |
| Christopher Nolan | IMAX规模、实景、强烈 | 动作、建筑 |
| Terrence Malick | 黄金时刻、空灵、自然 | 风景、沉思感 |
相机机身参考
| 相机 | 美学风格 | 适用场景 |
|---|---|---|
| RED Komodo | 现代数字电影 | 特写、叙事 |
| ARRI ALEXA | 胶片质感、色彩浓郁 | 电影各类题材 |
| ARRI Alexa Mini | 与ALEXA相同,体积更小 | 纪录片、手持 |
| ARRI ALEXA 65 | 大画幅、史诗感 | 风景、IMAX质感 |
| RED V-Raptor | 8K、锐利、动态 | 动作、高细节 |
| Sony Venice | 全画幅、用途广泛 | 弱光、变形宽银幕 |
| Hasselblad | 中画幅、奢华 | 人像、时尚 |
| Leica M | 旁轴、经典 | 街头、纪录 |
镜头搭配
| 焦距 | 效果 | 适用场景 |
|---|---|---|
| 24mm f/1.4 | 广角、环境感 | 风景、场景建立 |
| 35mm f/2.0 | 自然、用途广泛 | 纪录、街头 |
| 50mm f/1.4 | 经典、平衡 | 通用 |
| 85mm f/1.8 | 人像、浅景深 | 特写、人像 |
| 105mm f/2.0 | 压缩感、亲密 | 头像 |
| 135mm f/2.0 | 最强压缩感 | 紧凑人像 |
完整电影感示例
特写人像:
Dramatic close-up portrait by Ridley Scott, young woman with pale skin
and auburn hair, intense green eyes staring directly at camera, subtle
freckles across nose, wearing dark wool coat, rain falling around her
face, captured with RED Komodo using 85mm f/1.8 lens, cold blue-silver
lighting with warm practical rim light, melancholic determined atmosphere
--ar 4:5 --s 150 --p --no anime, cartoon, illustration, painting
广角电影感:
Epic wide shot by Denis Villeneuve, lone figure in orange survival suit
walking across endless salt flats, geometric patterns in dried earth,
massive dust storm approaching on horizon, captured with ARRI ALEXA 65
using 24mm f/2.0 lens, harsh afternoon sun creating stark shadows,
desolate apocalyptic atmosphere
--ar 21:9 --s 200 --p --no anime, cartoon, illustration, painting
关键提示: 切勿使用演员姓名。请用外貌描述人物。用”young woman with pale skin and auburn hair”而非”Emma Stone”。演员姓名会产生恐怖谷效应。
人像摄影
布光模式
| 模式 | 效果 | 设置方式 |
|---|---|---|
| Rembrandt | 戏剧化、古典 | 主光45°侧打,眼下形成三角光斑 |
| Butterfly | 魅力、显瘦 | 主光位于上方且偏前 |
| Split | 戏剧化、神秘 | 光从纯侧面打来 |
| Rim/Edge | 分离感、纵深 | 光从背后打来 |
| Loop | 微妙阴影 | 比Rembrandt角度略小 |
人像模板
[Subject description], [expression/emotion], [pose],
[lighting pattern] lighting, shallow depth of field,
[background description], shot on [camera] with [lens]
--ar 4:5 --s 100 --v 7
人像示例
环境人像:
Middle-aged craftsman with salt-and-pepper beard, focused expression,
hands working on leather saddle, Rembrandt lighting from workshop window,
shallow depth of field, blurred tool-filled background, shot on
Hasselblad with 80mm f/1.9, documentary authenticity
--ar 4:5 --s 75 --style raw --v 7
棚拍人像:
Professional woman in her 30s, confident subtle smile, shoulders
turned slightly, butterfly lighting with soft fill, pure white
seamless background, shot on Phase One with 110mm f/2.8, clean
commercial aesthetic
--ar 4:5 --s 50 --v 7
产品摄影
产品模板
[Product] on [surface/platform], [background style],
[lighting setup], commercial photography, high detail,
[brand aesthetic description]
--ar 1:1 --s 50 --v 7 --style raw
表面与背景选项
表面: - 抛光大理石(奢华) - 原始混凝土(工业) - 天然木材(有机) - 拉丝金属(科技) - 彩色亚克力(现代)
背景: - 渐变(平滑过渡) - 无缝(纯色) - 情境(使用场景) - 抽象(艺术化)
产品示例
奢华化妆品:
Minimalist perfume bottle with gold cap on polished black marble surface,
gradient background from deep purple to black, dramatic rim lighting with
soft front fill, commercial photography, high detail, premium luxury
aesthetic, subtle reflections on marble
--ar 1:1 --s 25 --v 7 --style raw
科技产品:
Wireless earbuds case open showing earbuds inside, floating on
pure white seamless background, soft even lighting from all sides,
commercial product photography, high detail, clean Apple-style
minimalism, subtle shadow beneath
--ar 1:1 --s 50 --v 7 --style raw
奇幻与科幻
奇幻模板
[Character/scene description], [fantasy world details],
[magical elements], [lighting style],
[art style: painterly | concept art | illustration],
[artist influence if applicable]
--ar 16:9 --s 500 --weird 100 --v 7
奇幻示例
史诗奇幻:
Ancient elven queen seated on crystalline throne in vast cavern hall,
iridescent robes flowing with captured starlight, bioluminescent
flowers floating around her, massive glowing runes carved into
obsidian walls, ethereal volumetric lighting, painterly fantasy
illustration influenced by Craig Mullins and Alphonse Mucha
--ar 16:9 --s 600 --weird 150 --v 7
黑暗奇幻:
Battle-scarred knight in tarnished armor standing in ruined cathedral,
sword planted in cracked stone floor, pale moonlight streaming through
shattered rose window, crows circling above, mist swirling at feet,
dark atmospheric concept art, Beksinski and Zdzisław influence
--ar 16:9 --s 400 --weird 200 --v 7
科幻模板
[Subject/scene], [technology details], [environment],
[lighting: neon | holographic | industrial | sterile],
[aesthetic: cyberpunk | hard sci-fi | retro-futurism],
[mood description]
--ar 21:9 --s 300 --v 7
科幻示例
赛博朋克:
Solo mercenary in worn tactical gear navigating rain-soaked neon alley,
holographic advertisements flickering overhead, steam rising from
street grates, distant megastructures visible through smog, cyan and
magenta neon reflections on wet pavement, Blade Runner cyberpunk
aesthetic, oppressive urban atmosphere
--ar 21:9 --s 350 --v 7
硬科幻:
Interior of generation ship agricultural bay, massive cylindrical
space with terraced farms curving overhead, artificial sun strip
running along central axis, workers in utilitarian jumpsuits tending
crops, visible structural engineering, hard science fiction aesthetic,
The Expanse influence, functional yet beautiful
--ar 21:9 --s 250 --v 7
使用 Niji 7 创作动漫
Niji 7 特性
Niji 7 生成的作品更干净、更扁平,线稿质量也得到提升。它对prompt的解读比以往版本更为字面化。
Niji 7 模板
[Character description], [pose/action], [expression],
[setting/background], [specific style notes],
[color palette]
--niji 7 --ar [ratio]
Niji 7 示例
动作场景:
Young mage with flowing crimson hair and determined golden eyes,
casting powerful fire spell with both hands raised, intense focused
expression, ancient library crumbling around her, debris floating
in magical energy, dynamic diagonal composition, warm orange and
red color palette with cool blue shadows
--niji 7 --ar 3:4
角色肖像:
Elegant noblewoman with silver hair in elaborate updo, wearing dark
blue Victorian-inspired gown with gold embroidery, subtle knowing
smile, half-body portrait, ornate palace balcony background with
moonlit garden visible, soft romantic atmosphere, detailed lace
and fabric textures
--niji 7 --ar 4:5
在 Niji 7 中使用风格迁移
Niji 7 拥有最佳的 --sref 表现:
[Your prompt] --niji 7 --sref [style image URL] --sw 150
从 --sw 150 起步并进行调整:
- 较低值(50-100)用于轻微影响
- 较高值(200-300)用于强烈的风格匹配
从 Niji 6 迁移
Niji 6 写法:
anime girl, beautiful, detailed eyes, colorful --niji 6 --style expressive
Niji 7 写法:
Young woman with vibrant teal hair and large expressive amber eyes,
wearing casual summer dress, cheerful smile, urban cafe background,
afternoon sunlight, contemporary anime style
--niji 7
关键变化:
- 撰写完整描述,而非关键词列表
- 更加字面化和具体
- 不再有风格预设——直接描述你想要的效果
- 使用 --sref 保持风格一致
建筑
建筑模板
[Building/space type], [architectural style],
[time of day/lighting], [weather/atmosphere],
[perspective: eye-level | aerial | interior | detail],
architectural photography, clean lines
--ar 16:9 --s 150 --v 7 --style raw
建筑风格
| 风格 | 特征 | 关键词 |
|---|---|---|
| 粗野主义(Brutalist) | 裸露混凝土、体量巨大、几何感强 | Exposed concrete, monolithic |
| 极简主义(Minimalist) | 线条干净、白色、稀疏 | Negative space, pure forms |
| 装饰艺术(Art Deco) | 繁复、几何、奢华 | Gold accents, sunburst patterns |
| 哥特式(Gothic) | 尖拱、垂直、戏剧化 | Flying buttresses, rose windows |
| 日式 | 木材、纸张、与自然融合 | Shoji screens, engawa, zen |
| 参数化(Parametric) | 流动、计算生成、有机感 | Zaha Hadid, algorithmic curves |
建筑示例
粗野主义:
Brutalist concrete museum interior with dramatic skylights, afternoon
sun creating strong geometric shadows on exposed concrete walls, vast
empty gallery space with single sculpture, eye-level perspective
showing depth and scale, architectural photography by Hélène Binet
--ar 16:9 --s 100 --v 7 --style raw
参数化:
Futuristic parametric architecture concert hall exterior, flowing white
curves inspired by Zaha Hadid, blue hour lighting with building interior
warmly illuminated, long exposure car light trails on surrounding roads,
wide establishing shot, architectural photography
--ar 16:9 --s 150 --v 7
抽象与实验
抽象模板
[Concept/emotion to express], [visual elements],
[color palette], [texture/material qualities],
[movement/energy description], abstract composition
--s 750 --weird 500 --chaos 50 --v 7
抽象示例
情感抽象:
The feeling of nostalgia dissolving into hope, fragmented memories
reforming as light, soft blues transitioning to warm amber, watercolor
textures bleeding into geometric shapes, gentle upward movement,
abstract emotional landscape
--ar 1:1 --s 800 --weird 750 --chaos 40 --v 7
质感抽象:
Microscopic landscape of oxidized copper and crystalline salt
formations, verdigris greens and rust oranges, extreme macro detail,
mineral textures catching diffused light, abstract geological patterns
--ar 1:1 --s 500 --weird 300 --v 7
突破边界
对于真正具有实验性的作品:
- 将 --weird 推至 1000 以上
- 与 --chaos 75+ 配合使用
- 运用抽象的情感语言
- 参考非主流艺术家
The architecture of forgotten dreams, impossible geometries folding
through chromatic space, Escher meets Kandinsky, synesthetic color
relationships, visual music
--ar 1:1 --s 1000 --weird 2000 --chaos 75 --v 7
词权重
使用 :: 语法控制特定元素的强调程度。
语法
word::2 # Double emphasis
word::1.5 # 50% more emphasis
word::1 # Normal (default)
word::0.5 # Half emphasis
word::-1 # Negative (avoid)
示例
ethereal::2 portrait of a warrior, dramatic lighting::1.5, mist::0.5
此prompt的效果: - 强烈强调空灵气质 - 适度强调戏剧性光线 - 减弱雾气的存在感
何时使用权重
适用场景: - 微调元素之间的平衡 - 抑制不希望出现的解读 - 强化关键特征
应避免的场景: - 初稿探索阶段 - 无需权重也能奏效的简单prompt - 你尚不清楚该强调什么时
专家提示: 词权重是用于精细化调整的工具,而非起手第一步。先让基础prompt奏效,再用权重进行微调。
否定prompt
--no 参数用于在生成时排除特定元素。
基本用法
/imagine Beautiful landscape --no people, text, watermark
高效的否定项
| 目标 | 否定项 |
|---|---|
| 照片级真实感 | --no anime, cartoon, illustration, painting, drawing |
| 干净的画面 | --no text, watermark, signature, frame, border |
| 自然观感 | --no oversaturated, HDR, artificial |
| 严肃基调 | --no cute, chibi, kawaii |
| 简洁构图 | --no busy, cluttered, crowded |
最佳实践
应当: - 使用具体、清晰的术语 - 针对实际输出中出现的问题 - 保持列表精炼(3-5 项)
避免: - 列出你不想要的所有内容 - 使用模糊词汇(”bad”、”ugly”) - 否定本就不太可能出现的内容
电影感否定项
为获得稳定的照片级真实结果:
--no anime, cartoon, illustration, painting, drawing, sketch, CGI, 3D render
种子控制
种子可实现可复现性与可控的变体。
基本用法
/imagine [prompt] --seed 12345
相同prompt + 相同种子 = 高度相似的输出。
查找种子
生成结束后,点击图片信息即可查看所使用的种子。请记录下来以便复现。
种子工作流
变体工作流: 1. 使用随机种子生成 2. 找到一个满意的结果 3. 记下种子 4. 在保持相同种子的前提下对prompt做小幅调整 5. 对比变体
批量一致性:
Scene in morning light --seed 54321
Scene in afternoon light --seed 54321
Scene in evening light --seed 54321
在多条相关prompt中使用同一种子,可获得更一致的构图。
多主体构图
包含多个主体的复杂场景需要精心构建prompt。
层级法
按重要性顺序列出主体:
[Primary subject], [secondary subject], [tertiary subject],
[their relationship/interaction], [setting], [style]
空间语言
使用清晰的空间描述:
In the foreground, [subject A]
In the middle ground, [subject B]
In the background, [subject C]
或:
On the left, [subject A]
In the center, [subject B]
On the right, [subject C]
示例
Elderly grandmother and young granddaughter baking together in
sunlit kitchen, grandmother guiding child's hands rolling dough,
flour dusting the wooden counter, warm afternoon light from window,
vintage kitchen appliances in background, intimate family moment,
documentary photography style
--ar 3:2 --s 100 --v 7
文字渲染
V7 大幅改进了图像中的文字渲染效果。
最佳实践
保持文字简短: - 单个单词效果最佳 - 短语(2-4 个词)通常可行 - 长句子往往会失败
使用引号:
Neon sign reading "OPEN" in storefront window
指定字体风格:
Vintage poster with "JAZZ NIGHT" in art deco typography
文字示例
招牌:
Rainy city street at night, neon diner sign reading "EAT" glowing
red through rain-streaked window, film noir atmosphere
--ar 16:9 --s 150 --v 7
字体排印:
Minimalist book cover design, large serif typography reading "THE END"
centered on cream paper texture, literary fiction aesthetic
--ar 2:3 --s 100 --v 7
局限性
文字渲染目前仍存在以下问题: - 长句子 - 复杂字体 - 繁忙画面中的小号文字 - 多处文字元素
专家提示: 如果文字至关重要,请先生成不含文字的图像,再在后期处理时添加排版。
迭代循环
Midjourney 的专业工作流程:
阶段 1:探索(Draft Mode)
1. Enable Draft mode (--draft)
2. Write basic prompt with core concept
3. Generate 4-8 batches quickly
4. Identify promising directions
5. Note what works/doesn't
目标: 寻找方向,而非追求完美。速度至关重要。
阶段 2:精炼
1. Disable Draft mode
2. Take best concepts from Phase 1
3. Add specific details
4. Adjust parameters (--s, --chaos, etc.)
5. Generate in Fast mode
6. Compare variations
目标: 缩小到 2-3 个强力候选方案。
阶段 3:完善
1. Select best candidate
2. Note the seed
3. Make micro-adjustments to prompt
4. Use same seed for consistency
5. Upscale final choice
目标: 打磨最终胜出者。
时间分配
| 阶段 | 占比 | 模式 |
|---|---|---|
| 探索 | 60% | Draft |
| 精炼 | 30% | Fast |
| 完善 | 10% | Fast |
大多数用户的做法恰恰相反,在最初的几次尝试上花费过多时间精雕细琢。多探索,少完善。
Describe on Web
在网页界面中右键点击任意图像,选择”Describe”即可从图像生成四段文字 prompt。17这对于反向解析您欣赏的风格非常有价值——在 Explore 页面对一张图像执行 describe,然后修改生成的 prompt 以契合您的构想。刷新页面后 prompt 会自动清除。
成本管理
理解 GPU 时间
- Fast Mode:消耗订阅中的 GPU 小时
- Relax Mode:无限量但需排队(Standard 及以上套餐)
- Draft Mode:GPU 消耗为常规模式的一半
- Video:成本约为图像的 8 倍
订阅价值
| 套餐 | Fast 时长 | Relax | Video Relax | 每 GPU 小时单价 |
|---|---|---|---|---|
| Basic | 3.3 小时 | 否 | 否 | $3.03 |
| Standard | 15 小时 | 是 | 否 | $2.00 |
| Pro | 30 小时 | 是 | 是 | $2.00 |
| Mega | 60 小时 | 是 | 是 | $2.00 |
洞见: Standard 及以上套餐每 GPU 小时的性价比明显更高,且包含无限 Relax。
成本节约策略
- 使用 Draft mode 探索 - 成本减半,速度快 10 倍
- 用 Relax 进行探索 - 免费(Standard 及以上)
- 将 Fast 留给最终成稿 - 仅在追求质量时使用
- 批量处理相似 prompt - 比零散生成更高效
- 生成前先规划 - 先思考,再生成
使用量估算
| 操作 | 大约 GPU 分钟 |
|---|---|
| 4 张图像(standard) | ~1 分钟 |
| 4 张图像(draft) | ~0.5 分钟 |
| Upscale | ~0.5 分钟 |
| 视频(4 段 5 秒) | ~8 分钟 |
故障排查
常见问题
| 问题 | 原因 | 解决方法 |
|---|---|---|
| 面部模糊 | –s 过低或风格冲突 | 使用 --style raw,增加细节描述 |
| 比例错误 | 默认 1:1 | 显式指定 --ar |
| 过于艺术化 | –s 过高 | 降至 50-100 |
| 过于直白 | –s 过低 | 提高至 200+ |
| 输出不一致 | chaos 过低 | 使用 --seed 保持一致 |
| 风格压制主体 | –sw 过高 | 降低 --sw 权重 |
| 文字无法呈现 | V7 限制 | 文字保持简短,使用引号 |
| 手部异常 | AI 局限 | 裁剪或重新生成 |
| 找不到 Rooms | 该功能于 2026 年 2 月 26 日移除16 | 改用文件夹及 Organize 页面 |
参数冲突
避免组合:
- --style raw + 高 --s(互相矛盾)
- --v 7 + --niji(择其一)
- 多个高权重参考同时使用 100% 权重
- --exp 50+ + --stylize(exp 会压制)
- --exp 50+ + --p(exp 会覆盖)
协同良好:
- --oref + --sref 配合中等权重
- --chaos + --seed(多样且可复现)
- --style raw + 低 --s(最大化照片真实感)
- --exp 10-25 + --s 100-200(增强且可控)
一切都不奏效时
- 简化 - 移除参数,缩短 prompt
- 拆分 - 主体和风格分别尝试
- 种子寻优 - 大量生成,找到好种子,迭代精炼
- 参考 - 使用
--sref配合一张展示目标的图像 - 版本 - 尝试不同模型版本
版本迁移
V6 到 V7 的迁移
旧 V6 风格:
portrait, beautiful woman, dramatic lighting, 8k, detailed, masterpiece
新 V7 风格:
A contemplative portrait of a woman in her 30s, Rembrandt lighting
casting gentle shadows across her face, medium format photography
aesthetic with shallow depth of field
关键变化
| 方面 | V6 | V7 |
|---|---|---|
| Prompt 风格 | 关键词 | 自然语言 |
| 质量描述词 | 有帮助 | 基本被忽略 |
| 角色参考 | --cref |
--oref |
| 个性化 | 可选 | 默认开启 |
| 默认表现 | 风格化 | 更直白 |
应停止的做法
- 关键词堆砌(”beautiful, stunning, amazing”)
- 质量修饰词(”8k, ultra detailed, masterpiece”)
- 使用
--cref(现已改为--oref) - 简短的逗号分隔 prompt
应开始的做法
- 撰写完整句子
- 描述所见,而非所求
- 具体描述光线、材质、氛围
- 使用相机/镜头术语
- 善用 personalization(
--p)
参数速查表
MODELS
--v 8 V8 Alpha (~5x faster, native 2K, best text) (Mar 2026)
--v 7 Default, best overall (June 2025)
--niji 7 Anime/manga (Jan 2026, best coherence)
--niji 6 Anime/manga (legacy, has --style options)
--draft Fast iteration, 10x faster, half cost
V8-SPECIFIC
--hd Native 2K resolution (4x cost)
--q 4 Extra coherence mode (4x cost)
ASPECT
--ar 16:9 Widescreen
--ar 21:9 Cinematic ultrawide
--ar 4:5 Portrait (Instagram)
--ar 6:11 Tall portrait (phone wallpapers)
--ar 9:16 Vertical (Stories)
--ar 1:1 Square
--ar 3:2 Classic photo
--ar 2:3 Portrait print
STYLE
--s 0-100 Photorealistic
--s 100-300 Balanced
--s 300-1000 Artistic
--style raw Minimal AI interpretation
--p Apply personalization (V7 default)
EXPERIMENTAL
--exp 0-100 Enhanced detail (10-25 sweet spot)
--chaos 0-100 Output variety
--weird 0-3000 Unconventional aesthetics
REFERENCES
--oref [url] Subject/character (V7)
--ow 0-1000 Omni weight (default 100)
--sref [url] Style transfer
--sw 0-1000 Style weight (default 100)
--iw 0-2 Image weight (default 1)
VIDEO (Web only)
--motion low Subtle movement (default)
--motion high Dynamic movement
--raw More prompt control
QUALITY (V7 values: 1, 2, 4 — different from V6)
--q 1 Standard quality (default)
--q 2 Higher detail, 2x cost
--q 4 Maximum detail, 4x cost
--seed [num] Reproducibility
NEGATIVE
--no [items] Exclude elements
更新日志
| 日期 | 变更 | 来源 |
|---|---|---|
| 2026-04-25 | V8.1 Alpha 于 2026 年 4 月 14 日在 alpha.midjourney.com 发布。HD 现已成为默认设置(默认任务无需 upscaler 步骤即可输出原生 2K;Standard Resolution 和”Run as HD”仍然保留)。HD 模式比 V8.0 Alpha 快 3 倍且便宜 3 倍;标准分辨率快 50% 且便宜 25%。美学回归:V8.1 回归到”延续 V7 精神的一致且熟悉的美学”——V8.0 那种过度处理/过度精修的默认风格已不复存在。图像 prompt 回归且支持权重。Prompt Shortener 在超出 prompt 长度限制时自动生效。Describe 更新后会返回更长、更详尽的输出。Moodboards 和 sref 在 V8.1 中极为稳定(这是 V8.0 的主要短板之一)。Midjourney 表示很可能会在”V8.1 推出几周后”停用 V8.0 Alpha。目前仍仅限 alpha——尚未上线主站或 Discord。即将到来的路线图(据 V8.1 公告):先是 V8 upscalers,然后是 V8 编辑/inpainting/outpainting 模型升级。 |
27 |
| 2026-04-04 | 发布前追踪(现已被 4 月 14 日 V8.1 上线所取代):当时社区报道指向 4 月 6-8 日所在周;3 月 21 日的官方说法是 1-3 周。这一时期遗留的阻碍因素 / 4-10 倍成本蒸馏的说法已随实际发布得到解决。 | 2326 |
| 2026-04-01 | 增加 V8.1 训练运行细节(3 月 21 日宣布,目标为改进美学/连贯性/图像 prompt,1-3 周)。增加 V8 Alpha 已知问题(过度处理的美学、风格化范围缩窄、抽象能力受限、年龄漂移、Minecraft 效应、alpha 不稳定性)。增加 V8 Alpha prompt 技巧(–style raw、电影感布光、中等精度、否定 prompt 模式)。指出当前 V8 Alpha 是临时软件,将由 V8.1 取代。 | 232425 |
| 2026-03-23 | V8 Alpha 上线后更新:Standard/Pro/Mega 现已支持 Relax mode(--hd 与 --q 4 组合除外)。新版 SREF/Moodboards(--sv 7)速度/成本提升 4 倍,支持 --hd、--p、--stylize、--exp。Moodboards 默认使用 --sv 7。更新指南时间线以反映实际发布。 |
22 |
| 2026-03-17 | V8 Alpha 上线 alpha.midjourney.com。生成速度提升约 5 倍,通过 --hd 实现原生 2K,通过 --q 4 提供额外连贯性,文本渲染和指令遵循显著改进。支持 --chaos、--weird、--exp、--raw、--stylize。--hd/--q 4/sref/Moodboard 任务成本为 4 倍。发布时不可用 Relax mode。完全向后兼容 V7 profiles/moodboards/srefs。新 UI:对话模式、Grid Mode、侧边栏设置。 |
21 |
| 2026-03-13 | 增加 V8 最终评分轮(2 月 20 日,个性化校准)。增加 V8 发布时不可用 Relax mode 的注意事项。修正 V7 quality 参数取值(1、2、4)。为 V6.1 sref 编码增加 --sv 6。截至 3 月 13 日 V8 仍未发布。 |
20 |
| 2026-03-12 | 确认 Niji 7 完全支持 Personalization 和 Moodboards(2 月 26 日更新)。更新 personalization 界面描述(网格界面取代 1v1 比较)。从 Niji 7 章节移除”可能尚未完全可用”的注意事项。截至 3 月 12 日 V8 仍未发布。 | 19 |
| 2026-03-07 | 确认 V8 在功能上完成并已具备发布条件(3 月 4 日 office hours)。时间线更新为 3 月中旬发布。增加发布注意事项(image prompting/variations 可能存在差异)。增加 V8 后路线图(编辑模型、采用新计算集群的 V2 视频模型)。增加精确的视频 GPU 分钟成本,并依据官方文档更新套餐表,加入 HD/Relax 详情。 | 18 |
| 2026-03-03 | 更新 V8 时间线(2 月底蒸馏运行、3 月初 opt-in 发布、默认前约 30 天 pre-alpha)。增加 --profile moodboard 语法及与 --sref 编码的混合方式。增加 Describe on Web 功能。增加 Rooms 移除(2 月 26 日)。 |
1617 |
| 2026-02-28 | 更新 V8 状态(截至 2 月 28 日仍未发布,原生 2K 已确认,架构重写)。增强 moodboard/profiles 章节(多个命名 profile、设置速度提升 5 倍、稳定性层级细化为 40/200/2000)。 | 1415 |
| 2026-02-17 | V8 状态:进入最终打磨阶段,2 月中旬多场评分会议,发布在即。确认 V8 功能(style refs、moodboards、编辑)。增加 6:11 比例、–ow 交互指南、网页平台更新(批量操作、参数自动清理)。 | 1213 |
| 2026-02-09 | 更新 V8 状态(内部测试、评分会议、TPU→GPU 切换、新创作流程),增强 Niji 7 细节(–sref 漂移、眼睛质量、–cref 替代方案) | 910 |
| 2026-01-20 | 增加 HD Video 模式章节(4 倍分辨率,约 3.2 倍成本,仅限 Pro/Mega) | 8 |
| 2026-01-17 | 增加 V8 开发状态、Moodboards 章节、用于旧版 sref 编码的 –sv 4 | Web scan |
| 2026-01-16 | 增加 V7.1 路线图信息,验证 Niji 7 覆盖范围 | Web scan |
| 2026-01-13 | 指南创建,覆盖 V7、Niji 7、视频内容 | Multiple |
| 2026-01-09 | Niji 7 发布,连贯性提升 | 3 |
| 2025-06-19 | V1 Video Model 发布 | 4 |
| 2025-06-17 | V7 成为默认模型 | 2 |
| 2025-04-30 | V7 更新:–exp 参数、编辑器改进 | 5 |
| 2025-04-03 | V7 发布 | 2 |
参考资料
-
Midjourney Updates。官方更新日志与公告。 ↩
-
Midjourney Version Documentation。”Version 7 于2025年4月3日发布,并于2025年6月17日成为默认模型。” ↩↩↩
-
V1 Video Model。视频生成功能于2025年6月19日发布。 ↩
-
V7 Update, Editor, and –exp。2025年4月30日更新详情。 ↩
-
V8 Development Discussion。社区关于V8训练的讨论,以及来自David Holz问答中的路线图细节。 ↩
-
Moodboards Feature。通过Moodboards与图像评分实现Midjourney个性化。 ↩
-
HD Video Mode。”HD Video模式可生成清晰度提升4倍的AI视频片段……成本约为SD的3.2倍。”2025年8月。 ↩↩
-
Office Hours Feb 12。Rating party预示V8发布,硬件项目,实时3D研究。 ↩↩↩
-
V8 Development Overview。从TPU切换至GPU/PyTorch,V8 mini变体,Style Creator,新数据集。 ↩↩↩
-
V8 Rating Party Updates。2月16日当周举行多场rating party,V8预计随后发布。已确认功能:style refs、moodboards、个性化、weird、style creator、upscaling、editing。 ↩↩↩↩↩
-
Web Updates Jan 20, 2026。新增6:11、4:5、5:4、21:9宽高比,支持2000项批量操作,自动剥离无关参数。 ↩↩
-
V8 Release Status。”Midjourney V8可能于下周发布”——原生2K分辨率,架构完全重写,文本渲染显著改进。2026年2月下旬。 ↩↩↩↩
-
Profiles and Moodboards。多个命名profiles,设置速度提升5倍,可同时选择多个active profiles,40次评分即可起步,200次趋于稳定,直至2000次仍持续改进。 ↩↩↩↩↩↩↩↩↩↩
-
V8 Distillation and Release Timeline。最终蒸馏运行于2月下旬启动,持续约1周,随后opt-in发布,约30天pre-alpha后才会成为默认模型。Rooms功能于2026年2月26日下线。 ↩↩↩↩↩
-
Describe on Web + Moodboard Blending。右键Describe可从任意图像生成4条文本prompt。Moodboard blending支持
--sref代码,以及通过--profile参数直接使用moodboard ID。 ↩↩↩↩↩↩ -
V8 Functionally Complete — March 4 Office Hours。David Holz确认V8”功能完整,已可发布”。蒸馏即将开始。即使Turbo用户也能感受到显著的速度提升。初期推出阶段图像prompt和variations表现可能存在差异。V8之后的路线图:先是editing模型,然后是V2视频模型(3月新增的算力集群可支持更大规模的视频模型)。另见:Geeky Gadgets V8 overview。 ↩↩↩↩↩↩↩↩↩↩↩
-
Personalization and Web Updates。2026年2月26日。新版个性化界面以更快的点击+滚动网格取代1v1图像比较。Personalization与Moodboards已加入Niji 7。Rooms功能停用。 ↩↩↩↩↩↩
-
V8 Rating Party - FINAL ROUND。2026年2月20日。最终一轮专门为V8校准个性化系统。V8发布临近。另见:V8 Release Analysis——V8发布时Relax模式将不可用;Basic/Standard用户在初期推出阶段被强制使用Fast/Turbo。 ↩↩
-
V8 Alpha Announcement。2026年3月17日。V8 Alpha已在alpha.midjourney.com上线。生成速度提升约5倍,通过
--hd原生2K,通过--q 4获得额外的连贯性,文本渲染改进(使用”引号”),建议--stylize最高至1000。--hd/--q 4/sref/Moodboard任务费用为4倍。Relax模式不可用。完全向后兼容V7。新UI:conversation mode、Grid Mode、侧边栏设置。 ↩↩↩↩↩↩ -
Relax Mode for V8 Alpha。2026年3月21日。Relax模式现已对V8 Alpha中的Standard、Pro与Mega订阅用户开放(除
--hd与--q 4组合外,所有命令均支持)。新的默认SREF/Moodboards版本(--sv 7)速度提升4倍、成本降低4倍,支持--hd、--p、--stylize和--exp。Moodboards也默认采用--sv 7。 ↩↩↩↩↩↩↩↩ -
V8.1 Training Announcement。2026年3月21日。在Relax模式公布的同时宣布”针对V8新版本的大规模训练运行(可能命名为V8.1)”。目标是改进默认美学、创造力、连贯性、图像prompt、更优的moodboards/srefs,并可能将2K作为默认分辨率。预计1-3周。当前V8 Alpha被描述为临时软件,将被替换。 ↩↩↩
-
Midjourney V8 Alpha Strengths, Weaknesses, and Prompt Tips。MindStudio对V8 Alpha的分析。过度处理的美学风格,极端值下
--stylize范围收窄,抽象化能力受限。Prompt技巧:具体的电影摄影光线描述,使用--style raw获得自然效果,引用摄影师/导演,中等精度,有效运用--no模式。 ↩↩↩↩↩↩↩↩↩↩↩↩ -
Midjourney 8 vs 7: Why AI Creators Are Switching Back。Geeky Gadgets对比分析。记录了”Minecraft效应”、年龄漂移、仅限网页访问的限制,以及社区对V8 Alpha艺术局限性的批评。V8.1已规划改进。 ↩↩↩↩↩
-
Midjourney V8.1 Is Coming Next Week。Christie C.,2026年4月。社区来源报道V8.1预计于4月6-8日当周发布。以”version 8.1”形式发布(而非”V8 beta”)。剩余瓶颈:蒸馏优化(未蒸馏模型成本高出4-10倍)。V8.0将在发布后约2周弃用。注:此非Midjourney官方来源——官方说法见23,自3月21日起1-3周内。 ↩
-
V8.1 Alpha Launch。Midjourney官方,2026年4月14日。V8.1 Alpha已在
alpha.midjourney.com上线。HD模式现已成为默认任务的默认配置(原生2K,无需upscaler步骤),且速度比V8.0 Alpha快3倍、成本降低3倍;Standard Resolution与”Run as HD”仍然可用。Standard分辨率速度提升50%、成本降低25%。美学风格回归”与V7精神一致的稳定且熟悉的美学”——V8.0过度处理的默认风格已不复存在。图像prompt回归并支持权重。新增的Prompt Shortener会在prompt超出长度限制时自动激活。Describe已更新,可输出更长、更详尽的描述。Moodboards与srefs极其稳定。根据公告:”在V8.1上线数周后,我们很可能会停用V8.0模型。”目前仍仅限alpha——尚未上线主站或Discord;V8.1 Alpha的创作不会显示在主网站上。未来路线图(根据V8.1公告):V8 upscalers,随后是V8 edit/inpainting/outpainting模型升级。(V9在Midjourney早期沟通中曾被提及,但未出现在V8.1公告中。)社区反馈渠道:Discord#ideas-and-features。 ↩↩↩↩↩↩