AI Image Generation

Midjourney提示词工程:完全指南

Midjourney提示词工程:完全指南

2862 words 25 分钟阅读 Updated 2026-03-21

更新于2026年3月17日

2026年3月更新:V8 Alpha 已上线。 2026年3月17日,Midjourney 在 alpha.midjourney.com 面向社区开放了 V8 Alpha 测试。21 V8 的图像生成速度比 V7 快约5倍,在指令遵循、画面一致性和文字渲染方面均有显著提升(使用引号可获得最佳效果)。新增参数:--hd 支持原生2K分辨率,--q 4 可增强画面一致性。V8 支持 --chaos--weird--exp--raw--stylize(建议上限为1000)。费用提示:Alpha 测试期间,--hd--q 4--sref 及 Moodboard 任务的消耗为普通任务的 4倍21 V8 暂不支持 Relax 模式——新的服务器基础设施正在开发中。V7 的个性化配置文件、Moodboards 和 srefs 与 V8 完全向后兼容21 新增界面功能:改进的对话模式支持自然语言交互流程,”Grid Mode”方便浏览大量图像集,设置项移至侧边栏。21 V8 后续路线图:首先推出编辑模型,然后是 V2 视频模型(新计算集群支持训练更大规模的视频模型)。18 个性化功能支持多个命名配置文件,设置速度提升5倍,并可同时激活多个配置文件。15 个性化界面于2026年2月26日重新设计:图像配对比较替换为更快捷的点击滚动网格系统。19 Moodboards 新增 --profile 参数,支持直接通过 ID 调用,还可在同一 prompt 中与 --sref 代码混合使用。1517 Niji 7(2026年1月9日发布)带来更干净的线条、改进的眼部与反射细节,并显著减少了 --sref 的风格偏移——--cref 仍不可用,但截至2026年2月26日,Niji 7 已全面支持个性化和 Moodboards。319 网页界面新增 Describe on Web 功能(右键点击任意图像可获得4条文本 prompt)、新宽高比选项,以及支持2000个项目的批量操作。1317 Rooms 功能已于2026年2月26日移除。16 Video、Moodboards、Draft Mode 及所有 V7 功能仍保持可用。完整更新历史请参阅更新日志1

我花费了数百小时测试 Midjourney 的各个版本、参数组合与风格方向。本指南将这些实践经验提炼为一份全面的参考手册——正是我入门时期望拥有的那份。无论你是在编写第一个 prompt,还是在探索创作的极限,所需的技巧尽在其中。

Midjourney 并非简单的 prompt 转图像工具,而是一套精密的视觉语言系统。它响应特定的模式,遵循确定的层级关系,并回馈那些深谙其架构的使用者。泛泛的 AI 生成图像与令人惊叹的精准创作之间的差距,就在于对这些模式的理解。

关键洞察:V7 从根本上改变了 prompt 的运作方式。过去堆砌关键词的做法(”beautiful, stunning, 8k, detailed, masterpiece”)在 V7 中反而会降低出图质量。V7 能够理解自然语言——编写 prompt 时,应当像向一位专业摄影指导描述画面那样,而非给图库照片打标签。

本指南涵盖从安装入门到大多数用户从未发现的高级技巧。每个参数都配有实际数值范围、真实示例,以及容易让老手栽跟头的边界情况。


目录

第一部分:基础知识

  1. 什么是 Midjourney?
  2. 入门指南
  3. 核心概念
  4. Prompt 层级结构

第二部分:参数精通

  1. 版本选择
  2. 宽高比
  3. 风格化
  4. Chaos 与 Weird
  5. 实验性美学

第三部分:引用系统

  1. Omni Reference
  2. Style Reference
  3. Image Weight
  4. Draft Mode

第四部分:视频生成

  1. 图片转视频基础
  2. 延伸与循环
  3. 视频最佳实践

第五部分:风格模板

  1. 电影级写实
  2. 人像摄影
  3. 产品摄影
  4. 奇幻与科幻
  5. Niji 7 动漫风格
  6. 建筑
  7. 抽象与实验

第六部分:进阶技巧

  1. 词语权重
  2. 负面提示词
  3. Seed 控制
  4. 多主体构图
  5. 文字渲染

第七部分:工作流与优化

  1. 迭代循环
  2. 成本管理
  3. 问题排查
  4. 版本迁移

第八部分:参考资料

  1. 参数速查表
  2. 更新日志

什么是 Midjourney?

Midjourney 是一个通过文本描述生成图像的生成式 AI 系统。与传统的图像编辑或素材摄影不同,您只需描述想要看到的内容,Midjourney 就会生成与您构想相匹配的原创图像。

Midjourney 的独特之处:

方面 Midjourney 竞争对手
图像质量 业界领先的美学表现 参差不齐
自然语言 V7 能理解完整句子 通常依赖关键词
照片级真实感 V7 表现卓越 良好到优秀
动漫/插画 Niji 模型专门优化 通用型
视频 原生支持(2025年6月) 需要额外工具
社区 集成分享/发现功能 各有不同

您可以创作的内容:

  • 照片级真实图像:人像、产品、建筑、自然风光
  • 插画:概念艺术、书籍封面、编辑配图
  • 动漫与漫画:通过专用 Niji 模型实现
  • 抽象艺术:实验性、超现实构图
  • 视频:由图像生成的5-21秒动态片段

Midjourney 不是什么:

  • 不是图片编辑器(请使用 Photoshop)
  • 不是角色一致性系统(尚在快速改进中)
  • 不是用于重现特定受版权保护角色的工具
  • 不是免费的(订阅价格从每月10-120美元不等)

入门指南

账户设置

  1. 访问 midjourney.com
  2. 使用 Discord 登录或创建新账户
  3. 选择订阅方案
方案 价格 Fast GPU Relax GPU Video Relax
Basic $10/月 3.3小时
Standard $30/月 15小时 无限
Pro $60/月 30小时 无限
Mega $120/月 60小时 无限

专家建议: 从 Standard($30/月)开始。无限制的 Relax 模式对于实验探索至关重要——在学习阶段,Fast 时长会消耗得非常快。

您的第一个 Prompt

打开网页界面 midjourney.com/imagine,输入:

A golden retriever sitting in autumn leaves, soft afternoon sunlight

就是这么简单。无需特殊语法。V7 能理解自然语言。

您将得到: 四张金毛犬在秋叶中的变体图像。接下来,您可以:

  • Upscale:点击 U1-U4 生成高分辨率版本
  • Vary:点击 V1-V4 创建细微变体
  • Reroll:使用相同 prompt 生成四张全新变体

网页端与 Discord 对比

功能 网页界面 Discord
易用性 更简单 学习曲线较陡
图像管理 内置图库 散布在各频道
视频生成 完整支持 不可用
Prompt 编辑 可视化界面 文本命令
社区 探索标签页 浏览频道
推荐 从这里开始 适合高级用户

网页界面现在是主要的使用入口。Discord 仍然可用,但缺少视频生成功能,且工作流不够直观。


核心概念

Prompt 的工作原理

每个 Midjourney prompt 都会经过以下处理流程:

Your Text Prompt
      
[Text Encoder]  Converts words to mathematical embeddings
      
[Diffusion Model]  Generates image from noise, guided by embeddings
      
[Upscaler]  Increases resolution and detail
      
Final Image

这对您意味着什么:

  1. 词序很重要:靠前的词比靠后的词影响力更大
  2. 具体描述胜出:”golden hour sunlight casting long shadows”(黄金时刻的阳光投下长长的影子)远胜于”nice lighting”(好看的光线)
  3. 矛盾描述会造成混乱:”dark, bright, moody, cheerful”(暗、亮、阴郁、欢快)这类描述会互相抵消
  4. 少即是多:50-150个 token 通常比300+个 token 效果更好

Token 经济学

Midjourney 看到的不是您的文字,而是 token(大致等同于词片段)。

Token 数量 效果 最适合
10-30 非常开放的解读空间 抽象、实验性创作
30-80 控制力均衡 大多数 prompt
80-150 精细控制 特定场景
150+ 收益递减 可能导致冲突

专家建议: 如果您的 prompt 超过150个 token,很可能是过度描述了。请精简多余的形容词。

质量信号

V7 对某些描述模式反应特别强烈:

光线(影响最大): - “golden hour light casting long shadows across weathered stone” - “Rembrandt lighting with soft fill from camera left” - “bioluminescent glow illuminating the fog”

材质与纹理: - “oxidized copper with verdigris patina” - “worn leather showing decades of use” - “translucent jade catching the light”

氛围与情绪: - “melancholic twilight atmosphere” - “oppressive industrial ambiance” - “ethereal dreamlike quality”

专业摄影术语: - “shot on medium format, shallow depth of field” - “85mm lens, f/1.8 aperture” - “anamorphic lens flare, 2.39:1 aspect”


Prompt 层级结构

每个有效的 prompt 都遵循一个层级结构。位于顶层的词语拥有最大的影响力。

┌─────────────────────────────────────────────────┐
  1. SUBJECT (who/what)           Most important 
     "elderly fisherman"                          
├─────────────────────────────────────────────────┤
  2. SUBJECT DETAILS (descriptors)               
     "weathered face, silver beard, kind eyes"   
├─────────────────────────────────────────────────┤
  3. CONTEXT (where/when)                        
     "on a wooden dock at dawn"                  
├─────────────────────────────────────────────────┤
  4. STYLE/MOOD (how it feels)                   
     "documentary photography, contemplative"     
├─────────────────────────────────────────────────┤
  5. TECHNICAL (camera/lighting)                 
     "shot on Leica, natural morning light"      
├─────────────────────────────────────────────────┤
  6. PARAMETERS (--ar, --s, etc.)   Fine-tuning 
     "--ar 3:2 --s 100 --v 7"                    
└─────────────────────────────────────────────────┘

Prompt 模板

[SUBJECT] [SUBJECT DETAILS], [CONTEXT], [STYLE/MOOD], [TECHNICAL] --parameters

应用层级结构的示例:

An elderly fisherman with a weathered face and silver beard, standing on a
wooden dock at dawn, documentary photography style, contemplative mood,
shot on Leica M11 with natural morning light, soft mist rising from the water
--ar 3:2 --s 100 --v 7

大多数用户忽略的要点: 他们习惯以风格开头(”beautiful cinematic photo of…”),而非以主体开头。V7 对靠前的 token 赋予更高权重——请以您真正想要呈现的内容作为开头。


版本选择

V8 Alpha(2026年3月17日)

V8 是 Midjourney 的下一代模型,目前在 alpha.midjourney.com 进行 Alpha 测试。21

优势: - 图像生成速度约为 V7 的5倍 - 指令遵循能力和一致性大幅提升 - 通过 --hd 参数原生支持2K分辨率 - 迄今最佳的文字渲染效果(在 prompt 中使用引号) - 通过个性化设置、srefs 和 Moodboards 增强美学理解 - 通过 --q 4 启用额外一致性模式 - 完全向后兼容 V7 的个性化配置、Moodboards 和 srefs

生成模式:

模式 速度 成本 最佳用途
Fast 约为 V7 的5倍 1x 标准工作流
--hd 慢4倍 4x 原生2K分辨率
--q 4 慢4倍 4x 额外一致性
--sref / Moodboard 慢4倍 4x 风格引导生成

已知限制(Alpha 阶段): - Relax 模式尚不可用——新服务器基础设施正在开发中 - Basic/Standard 计划用户需要专用 Fast 模式 - 图像提示和变体功能的表现可能与 V7 不同

新 UI 功能: - 对话模式,支持自然语言交互 - “Grid Mode”用于聚焦大量图像集 - 设置面板移至侧边栏(不再遮挡视野)

用法:

a weathered lighthouse on volcanic cliffs at golden hour,
dramatic clouds, crashing waves --v 8 --hd

何时使用 V8: - 追求最快的生成速度 - 包含大量文字的图像 - 对一致性要求最高的场景 - 充分利用原生2K分辨率

V7(自2025年6月起为默认版本)

V7 是 Midjourney 目前的旗舰模型,于2025年4月3日发布。2

优势: - 自然语言理解(用完整句子描述,而非关键词堆砌) - 迄今最佳的照片写实效果 - 文字渲染能力显著提升 - 人体解剖更加准确(手部、身体) - 空间关系处理更优 - 默认启用个性化

生成模式:

模式 速度 成本 最佳用途
Turbo 最快 2倍 时间紧迫的最终渲染
Fast 正常 1x 标准工作流
Relax 排队 已包含 探索、学习
Draft 快10倍 0.5x 快速迭代

何时使用 V7: - 照片写实类图像 - 包含复杂自然语言的 prompt - 文字渲染 - 对质量要求最高的场景

Niji 7(2026年1月)

Niji 7 是专门针对动漫/漫画风格的模型,于2026年1月9日发布。3

优势: - 晶莹剔透的眼睛、反射效果和精细的背景细节3 - 复杂姿势和多臂设定的一致性提升 - 更忠实的 prompt 解读——能精确处理特定颜色位置和发型 - 文字渲染效果更佳 - --sref 性能增强,风格漂移显著减少3 - 简洁、平滑的线条美学,旨在突出改进后的线条质量

限制: - 不支持 --cref——团队暗示将推出”更强大的神秘替代方案”3 - 自2026年2月26日起,全面支持个性化(--p)和 Moodboards19 - 比前代 Niji 版本更加写实——需要调整偏意境类的 prompt

即将推出: - 全新角色参考系统将取代 --cref(预计将超越 --cref 的能力)

用法:

A determined young mage with crimson hair, casting fire magic,
intense expression, ancient library background --niji 7

何时使用 Niji 7: - 动漫和漫画风格的插画 - 角色设计 - 东方美学风格的插画 - 追求更简洁的线条效果

Niji 6(旧版)

仍可使用,以保持向后兼容。

何时使用 Niji 6: - 需要风格预设(--style expressive--style cute--style scenic) - 工作流依赖 --cref - 偏好更柔和、不那么写实的解读风格

风格预设:

--niji 6 --style expressive  # Dynamic, stylized
--niji 6 --style cute        # Kawaii aesthetic
--niji 6 --style scenic      # Background focus
--niji 6 --style original    # Classic Niji look

版本对比

功能 V7 Niji 7 Niji 6
照片写实 优秀 不适用 不适用
动漫 良好 优秀 优秀
自然语言 最佳 良好 一般
文字渲染 最佳 良好 有限
--oref
--cref
--sref 是(最佳)
--p 是(2026年2月)19 可选
风格预设

V8 开发状态(2026年3月)

截至2026年3月4日的 Office Hours,V8 已功能完成,可以发布18 蒸馏运行(速度优化)即将开始,大约需要一周时间;完成后,V8 将以可选、非默认模型的形式发布,经历约30天的预 Alpha 阶段,之后取代 V7 成为默认模型。1618 指南编写者和版主于1月下旬开始内部测试,2月中旬前进行了多次社区评分活动。912

已确认的 V8 功能: - 原生2K分辨率(2048px)——省去放大器中间环节,输出画质更加锐利14 - 文字渲染大幅改进(V7 的最大短板)14 - 复杂主题生成能力增强(生物、半人马、非常规解剖结构) - 全面架构重写(全新代码库,原生支持64px至2048px+)14 - 支持 Style references、Moodboards、个性化和 weird 参数12 - Style Creator 和网页个人资料,用于社区风格分享11 - 内置放大和编辑功能12 - 全新创作流程:先以256px生成64张图像快速探索,然后筛选并放大优胜作品10 - 基础设施从 TPU 迁移至 GPUs,采用 PyTorch(代码库更易维护,招聘更便捷)11 - V8 “mini” 变体,专为低配硬件设计11 - 向实时预览生成方向推进 - 速度提升:Turbo 用户也能感受到显著改善,非 Turbo 工作流的提升更为明显18

发布注意事项: - 初始推出期间,图像提示和变体功能的表现可能与预期不同18 - V8 发布时 Relax 模式不可用——Basic 和 Standard 计划用户在初始阶段需要专用 Fast 或 Turbo 模式20 - 部分功能将根据发布后的用户反馈持续优化18

时间线(截至2026年3月13日): - 内部测试:2026年1月9 - 评分活动:2026年2月上旬至中旬12 - 最终评分轮次(V8 个性化校准):2026年2月20日20 - 功能完成:2026年3月4日确认18 - 蒸馏运行:即将开始(约1周)18 - 发布:预计2026年3月中旬,以可选、非默认形式上线1618 - 预 Alpha 阶段:可选发布后约30天,之后成为默认模型16 - V8 发布后将改进移动端应用9 - 3D 功能(含相机运动和重构图)正在开发中9

V8 之后的规划: - 编辑模型(V8 发布后的首要任务)18 - V2 视频模型(2026年3月到位的新计算集群将支持训练更大规模的视频模型)18 - 硬件项目:四个正在推进中,包括一款可穿戴设备和一个仓库规模的组装项目10 - 批处理模式扩展,配合用户偏好学习系统9 - 实时 AI 模型作为长期目标9


宽高比

--ar 参数用于设置图像尺寸。默认为1:1(正方形)。

常用比例

比例 尺寸 适用场景
1:1 正方形 社交媒体、图标
4:5 竖版 Instagram 动态、移动端
5:4 横版 桌面端、演示文稿
16:9 宽屏 YouTube、演示文稿
6:11 高竖版 手机壁纸、竖版海报
9:16 竖屏 Stories、TikTok、移动端
21:9 超宽屏 电影感、影片
3:2 经典 摄影冲印
2:3 竖版 竖幅冲印

各平台推荐比例

平台 比例 备注
Instagram 动态 1:14:5 4:5 占据更多屏幕空间
Instagram Story 9:16 全竖屏
Twitter/X 16:91:1 16:9 在信息流中展开显示
LinkedIn 1.91:116:9 专业横版
Pinterest 2:3 竖版效果最佳
YouTube 缩略图 16:9 标准视频格式
桌面壁纸 16:921:9 匹配显示器

构图影响

宽高比不仅仅是尺寸问题——它从根本上改变构图方式。

宽比例(16:9、21:9): - 强调环境和背景 - 天然适合风景、城市景观 - 营造电影感 - 主体融入场景之中

窄比例(4:5、9:16): - 将注意力集中在主体上 - 天然适合人像、产品 - 营造亲密感 - 包含更多纵向信息

进阶技巧: 拍摄电影感人像时,不妨尝试 4:5 而非直觉上的 16:9。既能获得人像构图对主体的聚焦效果,又保留了足够的环境信息来讲述故事。


风格化

--s 参数控制 V7 施加的艺术诠释程度。范围:0-1000。默认值:100。

风格化数值范围

范围 效果 最佳用途
0-50 最小诠释 产品照片、技术精确度
50-150 均衡(默认) 通用场景、人像
150-300 明显风格化 艺术照片、氛围作品
300-500 强烈风格化 插画、概念设计
500-1000 极度风格化 抽象、实验性创作

视觉示例

Portrait of a woman, soft window light --s 50
# Result: Clean, realistic, minimal embellishment

Portrait of a woman, soft window light --s 250
# Result: More artistic interpretation, enhanced mood

Portrait of a woman, soft window light --s 600
# Result: Distinctly stylized, dreamlike quality

决策框架

使用低风格化(0-100)的场景: - 产品摄影 - 追求照片级写实精度 - 技术/文档类图像 - 需要 prompt 被严格字面解读

使用中等风格化(100-300)的场景: - 一般创意工作 - 编辑类摄影 - 希望适度增强但不走极端 - 在写实与艺术之间取得平衡

使用高风格化(300+)的场景: - 插画或概念艺术创作 - 抽象或实验性作品 - 希望 Midjourney 的美学风格占据主导 - 突破创意边界

风格化 + Style Raw

若追求极致写实效果,可将低风格化与 --style raw 组合使用:

Portrait of a businessman, office background --s 50 --style raw --v 7

--style raw 指示 V7 尽量减少自身的美学诠释,使结果更接近 prompt 的字面描述。


Chaos 与 Weird

Chaos(–chaos 0-100)

控制四张生成图像之间的差异程度。默认值:0。

数值 效果
0 输出高度相似
25 略有差异
50 中等变化
75 差异较大
100 最大不可预测性

何时使用 Chaos: - 探索阶段--chaos 50-75 查看多样化的诠释 - 最终渲染--chaos 0-25 确保结果一致 - 寻找方向:前期高 chaos,后期精修时降低

Weird(–weird 0-3000)

引入非常规、出人意料的美学效果。默认值:0。

范围 效果
0 标准美学
100-500 微妙的奇特感
500-1000 明显的异样感
1000-2000 非常不寻常
2000-3000 最大怪异度

何时使用 Weird: - 超现实或梦幻般的意象 - 突破千篇一律的 AI 美学 - 概念艺术探索 - “正常”感觉过于平淡时

组合使用 Chaos 与 Weird

--chaos 50 --weird 500   # Varied outputs, each slightly quirky
--chaos 100 --weird 0    # Wild variations, normal aesthetic
--chaos 25 --weird 2000  # Similar outputs, all very weird

进阶技巧: 高 weird 值能产出真正不寻常的图像,但结果不太稳定。建议在探索阶段使用,最终渲染时适当降低。


实验性美学效果

--exp 参数可增强细节、动态感和色调映射效果。范围:0-100。默认值:0。

效果级别

效果 备注
0 关闭(默认) 标准渲染
5 细微增强 可安全与其他参数组合
10 明显的细节提升 推荐起点
25 强烈效果 混合使用时建议的上限
50 非常强烈 可能降低提示词准确度
100 最大值 可能覆盖 –stylize 和 –p 的效果

–exp 的作用

  • 纹理和表面细节更加丰富
  • 构图更具动感和冲击力
  • 呈现类似 HDR 色调映射的外观
  • 整体视觉表现力增强

推荐组合

--exp 10 --s 200           # Enhanced detail, balanced style
--exp 25 --s 100           # Strong exp, controlled stylize
--exp 5 --style raw        # Subtle boost for photorealism

警告:参数冲突

--exp 值较高时(超过 25-50),可能会: - 覆盖 --stylize 设置 - 压制个性化配置(--p) - 降低图像多样性

进阶技巧: 日常创作建议将 --exp 控制在 10-25 之间。更高的值适用于特定的风格化效果,而非通用的画质提升。


Omni Reference

--oref 参数可将参考图像中的主体特征迁移到生成的图像中。该参数在 V7 中取代了 --cref

基本用法

/imagine A woman in a red dress at a gala --oref [image URL]

可迁移的特征: - 面部和五官特征 - 体型与身材比例 - 服装和配饰 - 整体身份特征

权重控制(–ow)

--ow 0-1000    # Omni weight (default 100)
权重 效果
0-30 松散的灵感参考,允许风格变化
30-60 中等影响
60-100 强相似度(默认区间)
100-300 高度匹配
300-1000 最大保真度

权重交互

--ow 参数会与 --stylize--exp 争夺影响力。当使用较高的 stylize 或 exp 值时,需要相应提高 --ow 以保持参考一致性:

# High stylize needs higher ow to keep reference
--oref [url] --ow 200 --s 400

# High exp overwhelms default ow
--oref [url] --ow 300 --exp 25

# If you aren't using high stylize/exp, stay at moderate ow (100-400)

进阶技巧: 如果没有使用极端的 --stylize--exp 值,建议将 --ow 保持在 400 以下。只有在需要对抗强风格参数、精确保留面部特征或服装细节时,才需要将权重调高。

最佳实践

参考图像的质量至关重要: - 高分辨率、主体清晰 - 正面照片最适合面部迁移 - 参考图光线均匀一致 - 背景干扰尽量少

根据风格变化调整权重:

# Photo to anime conversion - lower weight
--oref [photo URL] --ow 40 --niji 7

# Maintaining strict likeness
--oref [photo URL] --ow 200 --v 7

与 style reference 组合使用:

# Subject from one image, style from another
--oref [subject URL] --sref [style URL] --ow 100 --sw 150

Style Reference

--sref 参数可将参考图像的美学特质迁移到生成作品中。

基本用法

/imagine A mountain landscape at sunset --sref [style image URL]

可迁移的特质: - 色彩调性 - 光影风格 - 艺术手法 - 整体氛围与情绪 - 构图倾向

权重控制(–sw)

--sw 0-1000    # Style weight (default 100)
权重 效果
0-50 细微影响
50-150 均衡迁移
150-300 强风格匹配
300-1000 风格主导

多个 Style Reference

可以同时组合多张风格图像:

--sref [url1] [url2]

多种风格会自然融合,适合创造独特的美学组合。

最佳实践

效果最佳的情况: - 风格鲜明且统一的参考图 - 美学特征清晰明确 - 视觉辨识度高的图像

效果欠佳的情况: - 过于普通的照片 - 风格混杂或不明确的图像 - “风格”不够突出的图像

进阶技巧: Niji 7 的 --sref 表现最为出色。如果风格迁移是关键需求,即使生成非动漫内容,也不妨考虑使用 Niji 7。

使用旧版 Style Reference 代码

如果手头有 V6 时代的 --sref 代码,它们无法直接在 V7 中使用。添加 --sv 4 即可兼容旧版风格代码:

/imagine A mountain landscape --sref 123456789 --sv 4
# --sv 4 tells V7 to interpret the code using the V6 style system
/imagine A mountain landscape --sref 123456789 --sv 6
# --sv 6 tells V7 to interpret the code using the V6.1 style system

注意: 虽然此方式可保持向后兼容,但建议在 V7 中重新生成 style reference,以获得与新模型更匹配的效果。


Image Weight

--iw 参数控制参考图像对生成结果的影响程度。

基本用法

/imagine [prompt] [image URL] --iw 1.5

权重范围

范围:0-2(默认值 1)

权重 效果
0-0.5 提示词主导
0.5-1 均衡
1-1.5 图像主导
1.5-2 强图像影响

使用场景

低权重(0-0.5): 仅将图像作为松散灵感,提示词占主导地位

均衡(0.5-1): 提示词和图像的影响力相当

高权重(1.5-2): 基于图像进行紧密的变体创作


Moodboards(自定义风格配置)

Moodboards 允许通过对图像评分来创建个性化的风格配置。无需依赖单一 --sref 图像,而是基于多个示例构建稳定的美学偏好。7 现在支持创建多个命名配置,设置默认配置,甚至同时激活多个配置。15

Moodboards 的工作原理

  1. 创建 moodboard,访问 midjourney.com/personalize
  2. 为图像评分——点击并滚动浏览图像网格(2026年2月26日起取代了旧版 1v1 对比系统),初始设置速度提升多达 5 倍1519
  3. 使用 --p 应用默认 moodboard
  4. 使用 --p [mID] 应用特定 moodboard
  5. 命名和整理多个配置,适用于不同项目或协作者15

构建稳定的配置

评分数量 稳定性
40 可用配置的最低门槛15
200 较为稳定,结果可靠15
2,000 最大精炼程度,一致性最佳15

进阶技巧: 建议至少评分 200 张图像以获得可靠的 moodboard。喜欢和不喜欢的都要评——不喜欢的评分能帮助 Midjourney 理解需要规避的风格。还可以同时激活多个配置,实现美学融合。15

使用 Moodboards

/imagine A forest path at dawn --p
# Uses your default moodboard

/imagine A forest path at dawn --p abc123
# Uses specific moodboard with ID abc123

/imagine A forest path at dawn --profile abc123
# Alternative syntax using --profile parameter

Moodboards 与 Style Reference 对比

方式 最适合
--sref 基于单张图像的一次性风格迁移
--p(Moodboard) 跨项目保持一致的个人美学风格

将 Moodboards 与 –sref 混合使用

可以在同一提示词中组合 moodboards 和 style reference 代码,实现精细控制:17

/imagine A portrait --p --sref [url] --sw 50
# Your moodboard aesthetic + subtle style reference influence

/imagine A portrait --sref 142710498 --profile drgmjoi 2jrqbw6
# Mix sref codes with multiple moodboard profiles

Moodboard 快照可以作为代码分享(例如 --profile 2jrqbw6),他人可直接使用;也可以分享实时链接,随着持续精炼而同步更新。17


Draft Mode

Draft mode 以 10 倍速度生成图像,GPU 消耗仅为一半。探索阶段的利器。

启用 Draft Mode

/imagine [prompt] --draft

也可在网页界面的设置中切换。

Draft 与完整渲染对比

维度 Draft 完整渲染
速度 约快 10 倍 标准
GPU 消耗 50% 100%
细节 有所削减 完整
最适合 探索方向 最终出图

Draft 工作流程

1. Draft Mode Exploration (--draft)
   ├── Test 5-10 variations quickly
   ├── Identify promising directions
   └── Note effective parameters

2. Full Render Refinement
   ├── Remove --draft flag
   ├── Apply learned parameters
   └── Fine-tune with --seed

进阶技巧: 建议始终从 Draft mode 开始。节省的成本积少成多,而且能探索更多可能性。只有在确定了值得深入的方向后,再切换到完整渲染。


图生视频基础

Midjourney 的 V1 视频模型于 2025年6月19日发布,支持从图像生成视频动画。

工作原理

  1. 选择任意图像(Midjourney 生成的或自行上传的均可)
  2. 点击 “Animate” 按钮
  3. 选择模式(Auto、Manual、Loop)
  4. 生成 5 秒视频片段

运动参数

--motion low    # Still scenes, slow motion, subtle movement (default)
--motion high   # Big camera motions, larger character movements
--raw           # Reduces creative flair, more prompt control

运动效果对比

设置 效果 最适合
Low 细腻、电影感的运动 人像、静物、氛围营造
High 动感、充满活力的运动 动作场景、风景、人群

警告: 高运动值可能产生不自然或有瑕疵的动作效果。建议从 low 开始,确有需要时再逐步提高。

费用与方案

  • 默认每条提示词批量生成 4 个视频;使用 --bs # 可减少至 1 或 2 个以节省 GPU 时间
  • Standard、Pro 和 Mega 方案可生成 HD 视频(仅限 Fast Mode)
  • 仅 Pro 和 Mega 方案支持 Relax Mode 视频(仅限 SD)
方案 Fast 视频 Relax 视频 HD 视频
Basic 支持 不支持 不支持
Standard 支持 不支持 支持(仅 Fast)
Pro 支持 支持(仅 SD) 支持(仅 Fast)
Mega 支持 支持(仅 SD) 支持(仅 Fast)

HD 视频模式

HD 视频模式(2025年8月推出)提供 4 倍清晰度——像素密度是标准视频的四倍,画质显著提升。8

使用方法: 1. 先生成标准视频 2. 在已完成的视频上点击 HD 选项 3. 等待高分辨率渲染完成

HD 视频费用: - 约为标准视频的 3.2 倍 - 仅 Pro 和 Mega 方案可用 - 必须先有标准视频(无法直接生成 HD)

模式 分辨率 批量 1 批量 2 批量 4(默认)
标准(SD) 基础 2 分钟 4 分钟 8 分钟
高清(HD) 4 倍像素 7 分钟 13 分钟 26 分钟

适用场景: - 最终交付素材 - 大屏幕或投影展示 - 专业/商业用途 - 动态画面中细节至关重要时

进阶技巧: 务必先在 SD 下测试。HD 耗时更长、成本更高——只对最满意的片段进行升级。


延伸与循环

延伸视频

可以为任意视频额外延伸 4 秒,最多延伸 4 次(总时长上限 21 秒)。

延伸选项: - Auto:自动延续视频内容 - Manual:延伸前可调整提示词

延伸的最佳实践: - 开始前规划好叙事弧线 - 前 5 秒应建立场景基调 - 每次延伸都应有明确目的 - 注意节奏把控——21 秒比想象中长

创建循环视频

Loop 选项可生成首尾无缝衔接的循环视频。

Select image  Click "Loop"  Generate

最适合: - 背景动画 - 社交媒体内容 - 氛围类视觉素材 - 动态静照(Cinemagraphs)

提升循环效果的技巧: - 简单、可重复的运动效果最佳 - 避免复杂的镜头运动 - 大气元素(云、水、火)天然适合循环


视频最佳实践

何时使用视频

适合视频化的场景: - 氛围感场景(雾气、雨水、火焰) - 细微运动(头发、织物、水面) - 带有环境动态的风景 - 动作幅度较小的人像

不太适合视频化的场景: - 复杂的动作序列 - 多角色场景 - 需要精确编排的动作 - 对技术精确度要求高的内容

视频优化技巧

在生成动画之前: 1. 先生成一张完美的静态图 2. 考虑画面中的元素可能如何运动 3. 避免复杂、相互关联的主体 4. 构图越简洁,动画效果越好

提示词调整建议:

# Good for video
Lone figure standing on cliff edge, wind blowing cape, dramatic clouds

# Less ideal for video
Group of dancers in synchronized formation, precise movements

成本管理

视频费用是图像的8倍,开销增长迅速:

高性价比的工作流程: 1. 在 Draft mode 下探索构图(仅生成图像) 2. 找到理想构图 3. 生成最终的高质量静态图 4. 仅对最满意的版本进行动画化 5. 仅在必要时才进行延长


电影级写实风格

这是实现照片级真实感和电影质感最有效的方法。

电影模板

[Shot type] by [Director], [subject physical description],
[action/pose], [costume/styling], [setting details],
captured with [Camera Body] using [Lens], [lighting description],
[mood/atmosphere summary]
--ar [ratio] --s [value] --p --no anime, cartoon, illustration, painting

导演风格参考

导演 视觉风格 最适合
Ridley Scott 氛围浓厚、质感丰富、阴郁 科幻、年代剧、特写
Denis Villeneuve 史诗级规模、荒凉、几何感 风景、广角镜头
David Fincher 暗黑、精密、令人不安 悬疑、阴郁人像
Roger Deakins 剪影、自然光、诗意 一切以光影为核心的镜头
Alfonso Cuarón 沉浸感、亲密、跟拍 角色刻画、张力营造
Wes Anderson 对称、柔和色调、趣味盎然 风格化居中构图
Christopher Nolan IMAX级规模、实拍质感、紧张 动作、建筑
Terrence Malick 黄金时段光线、空灵、自然 风景、沉思感

机身参考

机身 美学特征 最适合
RED Komodo 现代数字电影感 特写、叙事
ARRI ALEXA 类胶片质感、色彩饱满 全类型电影
ARRI Alexa Mini 与 ALEXA 相同,更轻便 纪录片、手持拍摄
ARRI ALEXA 65 大画幅、史诗感 风景、IMAX 质感
RED V-Raptor 8K、锐利、动态范围高 动作、高细节
Sony Venice 全画幅、用途广泛 暗光、变形宽荧幕
Hasselblad 中画幅、高端质感 人像、时尚
Leica M 旁轴、经典韵味 街拍、纪录片

镜头搭配

焦距 效果 最适合
24mm f/1.4 广角、环境交代 风景、开场建立镜头
35mm f/2.0 自然、万能 纪录片、街拍
50mm f/1.4 经典、均衡 通用
85mm f/1.8 人像、浅景深 特写、人像
105mm f/2.0 压缩感、亲密 头部特写
135mm f/2.0 最大压缩效果 紧凑人像

完整电影级示例

特写人像:

Dramatic close-up portrait by Ridley Scott, young woman with pale skin
and auburn hair, intense green eyes staring directly at camera, subtle
freckles across nose, wearing dark wool coat, rain falling around her
face, captured with RED Komodo using 85mm f/1.8 lens, cold blue-silver
lighting with warm practical rim light, melancholic determined atmosphere
--ar 4:5 --s 150 --p --no anime, cartoon, illustration, painting

宽画幅电影镜头:

Epic wide shot by Denis Villeneuve, lone figure in orange survival suit
walking across endless salt flats, geometric patterns in dried earth,
massive dust storm approaching on horizon, captured with ARRI ALEXA 65
using 24mm f/2.0 lens, harsh afternoon sun creating stark shadows,
desolate apocalyptic atmosphere
--ar 21:9 --s 200 --p --no anime, cartoon, illustration, painting

重要提醒: 切勿使用演员姓名,而应通过外貌特征来描述人物。例如用”年轻女性,肤色白皙,红棕色头发”代替”Emma Stone”。使用演员姓名会产生恐怖谷效应。


人像摄影

布光方案

布光方式 效果 设置方法
Rembrandt 戏剧性、古典 主灯置于侧面45°,在眼下形成三角光
Butterfly 迷人、修饰性强 主灯置于正前上方
Split 戏剧性、神秘 纯侧面布光
Rim/Edge 分离感、层次感 从背后打光
Loop 柔和阴影 比 Rembrandt 角度略小

人像模板

[Subject description], [expression/emotion], [pose],
[lighting pattern] lighting, shallow depth of field,
[background description], shot on [camera] with [lens]
--ar 4:5 --s 100 --v 7

人像示例

环境人像:

Middle-aged craftsman with salt-and-pepper beard, focused expression,
hands working on leather saddle, Rembrandt lighting from workshop window,
shallow depth of field, blurred tool-filled background, shot on
Hasselblad with 80mm f/1.9, documentary authenticity
--ar 4:5 --s 75 --style raw --v 7

棚拍人像:

Professional woman in her 30s, confident subtle smile, shoulders
turned slightly, butterfly lighting with soft fill, pure white
seamless background, shot on Phase One with 110mm f/2.8, clean
commercial aesthetic
--ar 4:5 --s 50 --v 7

产品摄影

产品模板

[Product] on [surface/platform], [background style],
[lighting setup], commercial photography, high detail,
[brand aesthetic description]
--ar 1:1 --s 50 --v 7 --style raw

台面与背景选项

台面材质: - 抛光大理石(奢华感) - 裸露混凝土(工业感) - 天然木材(自然感) - 拉丝金属(科技感) - 彩色亚克力(现代感)

背景风格: - 渐变(平滑过渡) - 无缝纯色(单色背景) - 场景化(使用中的实景) - 抽象(艺术化处理)

产品示例

奢侈品美妆:

Minimalist perfume bottle with gold cap on polished black marble surface,
gradient background from deep purple to black, dramatic rim lighting with
soft front fill, commercial photography, high detail, premium luxury
aesthetic, subtle reflections on marble
--ar 1:1 --s 25 --v 7 --style raw

科技产品:

Wireless earbuds case open showing earbuds inside, floating on
pure white seamless background, soft even lighting from all sides,
commercial product photography, high detail, clean Apple-style
minimalism, subtle shadow beneath
--ar 1:1 --s 50 --v 7 --style raw

奇幻与科幻

奇幻模板

[Character/scene description], [fantasy world details],
[magical elements], [lighting style],
[art style: painterly | concept art | illustration],
[artist influence if applicable]
--ar 16:9 --s 500 --weird 100 --v 7

奇幻示例

史诗奇幻:

Ancient elven queen seated on crystalline throne in vast cavern hall,
iridescent robes flowing with captured starlight, bioluminescent
flowers floating around her, massive glowing runes carved into
obsidian walls, ethereal volumetric lighting, painterly fantasy
illustration influenced by Craig Mullins and Alphonse Mucha
--ar 16:9 --s 600 --weird 150 --v 7

暗黑奇幻:

Battle-scarred knight in tarnished armor standing in ruined cathedral,
sword planted in cracked stone floor, pale moonlight streaming through
shattered rose window, crows circling above, mist swirling at feet,
dark atmospheric concept art, Beksinski and Zdzisław influence
--ar 16:9 --s 400 --weird 200 --v 7

科幻模板

[Subject/scene], [technology details], [environment],
[lighting: neon | holographic | industrial | sterile],
[aesthetic: cyberpunk | hard sci-fi | retro-futurism],
[mood description]
--ar 21:9 --s 300 --v 7

科幻示例

赛博朋克:

Solo mercenary in worn tactical gear navigating rain-soaked neon alley,
holographic advertisements flickering overhead, steam rising from
street grates, distant megastructures visible through smog, cyan and
magenta neon reflections on wet pavement, Blade Runner cyberpunk
aesthetic, oppressive urban atmosphere
--ar 21:9 --s 350 --v 7

硬科幻:

Interior of generation ship agricultural bay, massive cylindrical
space with terraced farms curving overhead, artificial sun strip
running along central axis, workers in utilitarian jumpsuits tending
crops, visible structural engineering, hard science fiction aesthetic,
The Expanse influence, functional yet beautiful
--ar 21:9 --s 250 --v 7

使用 Niji 7 创作动漫风格

Niji 7 特性

Niji 7 生成的画面更干净、更扁平化,线条表现力大幅提升。相比之前的版本,它对提示词的解读更为忠实。

Niji 7 模板

[Character description], [pose/action], [expression],
[setting/background], [specific style notes],
[color palette]
--niji 7 --ar [ratio]

Niji 7 示例

动作场景:

Young mage with flowing crimson hair and determined golden eyes,
casting powerful fire spell with both hands raised, intense focused
expression, ancient library crumbling around her, debris floating
in magical energy, dynamic diagonal composition, warm orange and
red color palette with cool blue shadows
--niji 7 --ar 3:4

角色立绘:

Elegant noblewoman with silver hair in elaborate updo, wearing dark
blue Victorian-inspired gown with gold embroidery, subtle knowing
smile, half-body portrait, ornate palace balcony background with
moonlit garden visible, soft romantic atmosphere, detailed lace
and fabric textures
--niji 7 --ar 4:5

Niji 7 风格迁移

Niji 7 拥有最出色的 --sref 表现:

[Your prompt] --niji 7 --sref [style image URL] --sw 150

建议从 --sw 150 开始,根据需要调整: - 较低值(50-100):微妙的风格影响 - 较高值(200-300):强烈的风格匹配

从 Niji 6 迁移

Niji 6 写法:

anime girl, beautiful, detailed eyes, colorful --niji 6 --style expressive

Niji 7 写法:

Young woman with vibrant teal hair and large expressive amber eyes,
wearing casual summer dress, cheerful smile, urban cafe background,
afternoon sunlight, contemporary anime style
--niji 7

关键变化: - 用完整描述代替关键词堆叠 - 描述要更具体、更写实 - 不再有风格预设——直接描述想要的效果 - 使用 --sref 保持风格一致性


建筑

建筑模板

[Building/space type], [architectural style],
[time of day/lighting], [weather/atmosphere],
[perspective: eye-level | aerial | interior | detail],
architectural photography, clean lines
--ar 16:9 --s 150 --v 7 --style raw

建筑风格

风格 特征 关键词
野兽派 裸露混凝土、厚重、几何造型 Exposed concrete, monolithic
极简主义 简洁线条、白色、稀疏 Negative space, pure forms
装饰艺术 华丽、几何、奢华 Gold accents, sunburst patterns
哥特式 尖拱、垂直感、戏剧性 Flying buttresses, rose windows
日式 木材、纸质、自然融合 Shoji screens, engawa, zen
参数化 流动、计算生成、有机感 Zaha Hadid, algorithmic curves

建筑示例

野兽派:

Brutalist concrete museum interior with dramatic skylights, afternoon
sun creating strong geometric shadows on exposed concrete walls, vast
empty gallery space with single sculpture, eye-level perspective
showing depth and scale, architectural photography by Hélène Binet
--ar 16:9 --s 100 --v 7 --style raw

参数化:

Futuristic parametric architecture concert hall exterior, flowing white
curves inspired by Zaha Hadid, blue hour lighting with building interior
warmly illuminated, long exposure car light trails on surrounding roads,
wide establishing shot, architectural photography
--ar 16:9 --s 150 --v 7

抽象与实验性创作

抽象模板

[Concept/emotion to express], [visual elements],
[color palette], [texture/material qualities],
[movement/energy description], abstract composition
--s 750 --weird 500 --chaos 50 --v 7

抽象示例

情感抽象:

The feeling of nostalgia dissolving into hope, fragmented memories
reforming as light, soft blues transitioning to warm amber, watercolor
textures bleeding into geometric shapes, gentle upward movement,
abstract emotional landscape
--ar 1:1 --s 800 --weird 750 --chaos 40 --v 7

质感抽象:

Microscopic landscape of oxidized copper and crystalline salt
formations, verdigris greens and rust oranges, extreme macro detail,
mineral textures catching diffused light, abstract geological patterns
--ar 1:1 --s 500 --weird 300 --v 7

突破边界

要实现真正具有实验性的作品: - 将 --weird 推到 1000 以上 - 搭配 --chaos 75+ 使用 - 运用抽象的情感化语言 - 引用非传统艺术家

The architecture of forgotten dreams, impossible geometries folding
through chromatic space, Escher meets Kandinsky, synesthetic color
relationships, visual music
--ar 1:1 --s 1000 --weird 2000 --chaos 75 --v 7

词语权重

使用 :: 语法控制对特定元素的强调程度。

语法

word::2      # Double emphasis
word::1.5    # 50% more emphasis
word::1      # Normal (default)
word::0.5   # Half emphasis
word::-1     # Negative (avoid)

示例

ethereal::2 portrait of a warrior, dramatic lighting::1.5, mist::0.5

此 prompt 的效果: - 大幅强调空灵感 - 适度强调戏剧性光影 - 降低雾气的存在感

何时使用权重

适合使用的场景: - 微调元素间的平衡 - 抑制不需要的视觉解读 - 突出关键特征

不建议使用的场景: - 初步探索阶段 - 本身效果已经不错的简单 prompt - 尚不确定需要强调什么

进阶技巧: 词语权重是精细调整的工具,而非起步手段。先让基础 prompt 达到理想效果,再用权重进行微调。


负面提示

--no 参数用于在生成中排除特定元素。

基本用法

/imagine Beautiful landscape --no people, text, watermark

有效的负面提示

目标 负面提示
照片写实 --no anime, cartoon, illustration, painting, drawing
画面干净 --no text, watermark, signature, frame, border
自然观感 --no oversaturated, HDR, artificial
严肃基调 --no cute, chibi, kawaii
简洁构图 --no busy, cluttered, crowded

最佳实践

建议: - 使用具体、明确的术语 - 针对输出中实际存在的问题 - 保持列表精简(3-5 项)

避免: - 穷举所有不想出现的内容 - 使用模糊词汇(”bad”、”ugly”) - 排除本来就不太可能出现的元素

电影感负面提示

用于获得一致的照片写实效果:

--no anime, cartoon, illustration, painting, drawing, sketch, CGI, 3D render

种子控制

种子(Seed)可实现结果的可复现性和可控变化。

基本用法

/imagine [prompt] --seed 12345

相同 prompt + 相同种子 = 高度相似的输出结果。

查找种子

生成后,点击图像信息即可找到所使用的种子值。记录下来以便复现。

种子工作流

变体工作流: 1. 使用随机种子生成 2. 找到满意的结果 3. 记录种子值 4. 保持种子不变,微调 prompt 5. 对比各版本差异

批量一致性:

Scene in morning light --seed 54321
Scene in afternoon light --seed 54321
Scene in evening light --seed 54321

在关联 prompt 中使用相同种子,可获得更一致的构图。


多主体构图

包含多个主体的复杂场景需要精心组织 prompt 结构。

层级法

按重要性排列主体:

[Primary subject], [secondary subject], [tertiary subject],
[their relationship/interaction], [setting], [style]

空间描述语言

使用清晰的空间方位描述:

In the foreground, [subject A]
In the middle ground, [subject B]
In the background, [subject C]

或:

On the left, [subject A]
In the center, [subject B]
On the right, [subject C]

示例

Elderly grandmother and young granddaughter baking together in
sunlit kitchen, grandmother guiding child's hands rolling dough,
flour dusting the wooden counter, warm afternoon light from window,
vintage kitchen appliances in background, intimate family moment,
documentary photography style
--ar 3:2 --s 100 --v 7

文字渲染

V7 大幅提升了图像中的文字渲染能力。

最佳实践

文字尽量简短: - 单个词效果最佳 - 短语(2-4 个词)通常没问题 - 长句往往效果不理想

使用引号:

Neon sign reading "OPEN" in storefront window

指定字体风格:

Vintage poster with "JAZZ NIGHT" in art deco typography

文字示例

标牌:

Rainy city street at night, neon diner sign reading "EAT" glowing
red through rain-streaked window, film noir atmosphere
--ar 16:9 --s 150 --v 7

字体排版:

Minimalist book cover design, large serif typography reading "THE END"
centered on cream paper texture, literary fiction aesthetic
--ar 2:3 --s 100 --v 7

局限性

文字渲染在以下情况仍有不足: - 长句 - 复杂字体 - 繁忙画面中的小字 - 多个文字元素

进阶技巧: 如果文字至关重要,建议先生成不含文字的图像,再通过后期处理添加排版。


迭代循环

Midjourney 专业工作流:

第一阶段:探索(Draft Mode)

1. Enable Draft mode (--draft)
2. Write basic prompt with core concept
3. Generate 4-8 batches quickly
4. Identify promising directions
5. Note what works/doesn't

目标: 找到方向,而非追求完美。速度优先。

第二阶段:精炼

1. Disable Draft mode
2. Take best concepts from Phase 1
3. Add specific details
4. Adjust parameters (--s, --chaos, etc.)
5. Generate in Fast mode
6. Compare variations

目标: 缩小范围至 2-3 个优选方案。

第三阶段:完善

1. Select best candidate
2. Note the seed
3. Make micro-adjustments to prompt
4. Use same seed for consistency
5. Upscale final choice

目标: 打磨最终作品。

时间分配

阶段 时间占比 模式
探索 60% Draft
精炼 30% Fast
完善 10% Fast

多数用户恰恰将这个比例颠倒,在最初几张图上花费过多时间去完善。多探索,少打磨。

网页端 Describe 功能

在网页界面右键点击任意图像,选择”Describe”即可根据该图像生成四条文字 prompt。17 这是逆向工程视觉风格的利器——在 Explore 页面 Describe 一张图像,然后修改生成的 prompt 来匹配自己的创作意图。Prompt 在页面刷新后会自动清除。


费用管理

了解 GPU 时间

  • Fast Mode:消耗订阅套餐中的 GPU 时长
  • Relax Mode:无限制但需排队(Standard 及以上套餐)
  • Draft Mode:GPU 消耗仅为常规模式的一半
  • Video:约为图像的 8 倍费用

订阅方案性价比

套餐 Fast 时长 Relax Video Relax 每 GPU 小时价格
Basic 3.3 小时 $3.03
Standard 15 小时 $2.00
Pro 30 小时 $2.00
Mega 60 小时 $2.00

要点: Standard 及以上套餐每 GPU 小时的性价比显著更高,且享有无限 Relax 模式。

节省费用策略

  1. 在 Draft mode 中探索 —— 费用减半,速度提升 10 倍
  2. 使用 Relax 进行探索 —— 免费(Standard 及以上)
  3. 将 Fast 留给最终出图 —— 仅在追求画质时使用
  4. 批量处理相似 prompt —— 比逐个生成更高效
  5. 先构思再生成 —— 想清楚了再动手

用量估算

操作 大约 GPU 分钟数
4 张图像(标准) ~1 分钟
4 张图像(draft) ~0.5 分钟
Upscale ~0.5 分钟
视频(4 段 5 秒) ~8 分钟

疑难排解

常见问题

问题 原因 解决方法
面部模糊 –s 值过低或风格冲突 使用 --style raw,增加细节描述
比例不对 默认 1:1 明确指定 --ar
过于艺术化 –s 值过高 降低至 50-100
过于写实 –s 值过低 提高至 200+
输出不一致 chaos 值过低 使用 --seed 保持一致性
风格过强 –sw 值过高 降低 --sw 权重
文字无法渲染 V7 局限性 缩短文字,使用引号
手部变形 AI 局限性 裁剪或重新生成
找不到 Rooms 功能已于2026年2月26日移除16 改用文件夹和 Organize 页面

参数冲突

避免组合使用: - --style raw + 高 --s(相互矛盾) - --v 7 + --niji(只能二选一) - 多个强引用均设为 100% 权重 - --exp 50+ + --stylize(exp 会压制 stylize) - --exp 50+ + --p(exp 会覆盖 p)

推荐组合: - --oref + --sref 搭配适中权重 - --chaos + --seed(多样但可复现) - --style raw + 低 --s(最大化照片写实感) - --exp 10-25 + --s 100-200(增强效果,同时保持可控)

万策尽时

  1. 简化 —— 移除参数,精简 prompt
  2. 拆分 —— 分别尝试主体和风格
  3. 寻找种子 —— 大量生成,找到好种子后迭代
  4. 使用引用 —— 用 --sref 加载目标风格的参考图
  5. 切换版本 —— 尝试不同的模型版本

版本迁移

从 V6 迁移到 V7

旧版 V6 风格:

portrait, beautiful woman, dramatic lighting, 8k, detailed, masterpiece

新版 V7 风格:

A contemplative portrait of a woman in her 30s, Rembrandt lighting
casting gentle shadows across her face, medium format photography
aesthetic with shallow depth of field

关键变化

方面 V6 V7
提示词风格 关键词堆叠 自然语言描述
质量修饰词 有一定作用 基本被忽略
角色参考 --cref --oref
个性化 可选 默认启用
默认行为 风格化 更忠实于描述

应停止的做法

  • 关键词堆砌(”beautiful, stunning, amazing”)
  • 质量修饰词(”8k, ultra detailed, masterpiece”)
  • 使用 --cref(已更新为 --oref
  • 简短的逗号分隔式提示词

应开始的做法

  • 撰写完整句子
  • 描述所见画面,而非抽象期望
  • 具体说明光线、材质和氛围
  • 运用相机与镜头术语
  • 善用个性化功能(--p

参数速查表

MODELS
--v 8           V8 Alpha (~5x faster, native 2K, best text) (Mar 2026)
--v 7           Default, best overall (June 2025)
--niji 7        Anime/manga (Jan 2026, best coherence)
--niji 6        Anime/manga (legacy, has --style options)
--draft         Fast iteration, 10x faster, half cost

V8-SPECIFIC
--hd            Native 2K resolution (4x cost)
--q 4           Extra coherence mode (4x cost)

ASPECT
--ar 16:9       Widescreen
--ar 21:9       Cinematic ultrawide
--ar 4:5        Portrait (Instagram)
--ar 6:11       Tall portrait (phone wallpapers)
--ar 9:16       Vertical (Stories)
--ar 1:1        Square
--ar 3:2        Classic photo
--ar 2:3        Portrait print

STYLE
--s 0-100       Photorealistic
--s 100-300     Balanced
--s 300-1000    Artistic
--style raw     Minimal AI interpretation
--p             Apply personalization (V7 default)

EXPERIMENTAL
--exp 0-100     Enhanced detail (10-25 sweet spot)
--chaos 0-100   Output variety
--weird 0-3000  Unconventional aesthetics

REFERENCES
--oref [url]    Subject/character (V7)
--ow 0-1000     Omni weight (default 100)
--sref [url]    Style transfer
--sw 0-1000     Style weight (default 100)
--iw 0-2        Image weight (default 1)

VIDEO (Web only)
--motion low    Subtle movement (default)
--motion high   Dynamic movement
--raw           More prompt control

QUALITY (V7 values: 1, 2, 4  different from V6)
--q 1           Standard quality (default)
--q 2           Higher detail, 2x cost
--q 4           Maximum detail, 4x cost
--seed [num]    Reproducibility

NEGATIVE
--no [items]    Exclude elements

更新日志

日期 变更内容 来源
2026-03-17 V8 Alpha 发布,地址为 alpha.midjourney.com。生成速度提升约5倍,通过 --hd 支持原生 2K,--q 4 增强连贯性,文字渲染和指令遵循能力大幅改善。支持 --chaos--weird--exp--raw--stylize--hd/--q 4/sref/Moodboard 任务消耗4倍算力。Relax 模式暂不可用。完全兼容 V7 profiles/moodboards/srefs。全新界面:对话模式、Grid Mode、侧边栏设置。 21
2026-03-13 新增 V8 最终评分轮次(2月20日,个性化校准)。补充 V8 Relax 模式上线时不可用的说明。修正 V7 质量参数值(1、2、4)。新增 --sv 6 用于 V6.1 sref 代码。截至3月13日 V8 尚未发布。 20
2026-03-12 确认 Niji 7 全面支持 Personalization 和 Moodboards(2月26日更新)。更新个性化界面描述(网格取代1对1比较)。移除 Niji 7 章节中”可能尚未完全可用”的说明。截至3月12日 V8 尚未发布。 19
2026-03-07 V8 确认功能完成并已准备发布(3月4日办公时间)。时间线更新为3月中旬发布。补充发布注意事项(图像提示/变体可能有差异)。新增 V8 后续路线图(编辑模型、搭配新计算集群的 V2 视频模型)。补充精确的视频 GPU 分钟消耗及包含 HD/Relax 详情的计划层级表。 18
2026-03-03 更新 V8 时间线(2月底蒸馏运行、3月初选择性开放、默认启用前约30天预览期)。新增 --profile moodboard 语法及与 --sref 代码的混合使用。新增网页版 Describe 功能。Rooms 功能于2月26日移除。 1617
2026-02-28 更新 V8 状态(截至2月28日仍在进行中,确认原生 2K,架构重写)。增强 moodboards/profiles 章节(多个命名配置、5倍更快设置、稳定性层级细化为 40/200/2000)。 1415
2026-02-17 V8 状态:最终打磨阶段,2月中旬多次评分活动,即将发布。确认 V8 特性(style refs、moodboards、编辑)。新增 6:11 宽高比、–ow 交互指南、网页平台更新(批量操作、自动清理无关参数)。 1213
2026-02-09 更新 V8 状态(内部测试、评分活动、TPU→GPU 迁移、新创建流程),完善 Niji 7 详情(–sref 漂移、眼部质量、–cref 替代方案) 910
2026-01-20 新增 HD Video 模式章节(4倍分辨率,约3.2倍消耗,仅限 Pro/Mega) 8
2026-01-17 新增 V8 开发状态、Moodboards 章节、--sv 4 用于旧版 sref 代码 网页扫描
2026-01-16 新增 V7.1 路线图信息,验证 Niji 7 覆盖范围 网页扫描
2026-01-13 指南创建,涵盖 V7、Niji 7、视频功能 多个来源
2026-01-09 Niji 7 发布,连贯性显著提升 3
2025-06-19 V1 视频模型发布 4
2025-06-17 V7 成为默认模型 2
2025-04-30 V7 更新:新增 –exp 参数、编辑器改进 5
2025-04-03 V7 发布 2

参考资料


  1. Midjourney Updates。官方更新日志与公告。 

  2. Midjourney Version Documentation。”Version 7 was released on April 3, 2025, and became the default model on June 17, 2025.” 

  3. Niji V7 Announcement。”Niji V7 is now live”——2026年1月9日。 

  4. V1 Video Model。视频生成功能于2025年6月19日发布。 

  5. V7 Update, Editor, and –exp。2025年4月30日更新详情。 

  6. V8 Development Discussion。社区关于 V8 训练的讨论及 David Holz 问答中的路线图细节。 

  7. Moodboards Feature。通过 moodboards 和图像评分实现 Midjourney 个性化。 

  8. HD Video Mode。”HD Video mode delivers 4x sharper AI-generated clips… costs roughly 3.2 times more than SD.”2025年8月。 

  9. Office Hours Jan 22。V8 最终调优、3D 功能、移动应用计划、批量模式扩展。 

  10. Office Hours Feb 12。评分活动预示 V8 发布、硬件项目、实时 3D 研究。 

  11. V8 Development Overview。TPU 到 GPU/PyTorch 迁移、V8 mini 变体、Style Creator、新数据集。 

  12. V8 Rating Party Updates。2月16日当周多次评分活动,预计随后不久发布 V8。已确认功能:style refs、moodboards、personalization、weird、style creator、upscaling、editing。 

  13. Web Updates Jan 20, 2026。新增 6:11、4:5、5:4、21:9 宽高比,支持2000项批量操作,自动去除无关参数。 

  14. V8 Release Status。”Midjourney V8 could drop next week”——原生 2K 分辨率,全面架构重写,文字渲染大幅改善。2026年2月下旬。 

  15. Profiles and Moodboards。多个命名配置、5倍更快设置、可选择多个活跃配置、40次评分即可启用、200次趋于稳定、2000次持续优化。 

  16. V8 Distillation and Release Timeline。最终蒸馏运行于2月下旬开始,约1周完成,随后选择性开放,默认启用前约30天预览期。Rooms 功能于2026年2月26日移除。 

  17. Describe on Web + Moodboard Blending。右键 Describe 可从任意图像生成4条文字提示词。Moodboard 与 --sref 代码混合使用,--profile 参数直接调用 moodboard ID。 

  18. V8 Functionally Complete — March 4 Office Hours。David Holz 确认 V8”功能完成并已准备发布”。蒸馏即将开始。即使对 Turbo 用户速度提升也很显著。初始上线期间图像提示/变体可能有差异。V8 后续路线图:先推出编辑模型,再推出 V2 视频模型(3月新计算集群上线支持更大规模视频模型)。另见:Geeky Gadgets V8 overview。 

  19. Personalization and Web Updates。2026年2月26日。全新个性化界面以更快的点击滚动网格取代1对1图像比较。Niji 7 新增 Personalization 和 Moodboards 支持。Rooms 功能停用。 

  20. V8 Rating Party - FINAL ROUND。2026年2月20日。最终轮次专门为 V8 校准个性化系统。V8 发布在即。另见:V8 Release Analysis——V8 上线时 Relax 模式不可用;Basic/Standard 用户在初始阶段只能使用 Fast/Turbo。 

  21. V8 Alpha Announcement。2026年3月17日。V8 Alpha 可在 alpha.midjourney.com 使用。生成速度提升约5倍,--hd 支持原生 2K,--q 4 增强连贯性,文字渲染改善(使用”引号”),--stylize 建议设至1000。--hd/--q 4/sref/Moodboard 任务消耗4倍算力。Relax 模式不可用。完全兼容 V7。全新界面:对话模式、Grid Mode、侧边栏设置。