Midjourney Prompt Engineering: The Complete Guide
更新于2026年3月3日
2026年3月更新: V8于2月下旬进入最终蒸馏运行(速度优化),预计将在3月初作为可选的非默认模型发布——一旦上线,预计将经历约30天的预览阶段,之后才会取代V7成为默认模型。1416 V8已确认的功能包括原生2K分辨率(2048px)、大幅改进的文字渲染、style references、moodboards、个性化、weird参数、Style Creator、放大和编辑功能。12 V8的创作流程引入了快速低分辨率迭代模式:生成64张256px的图像,快速探索,然后放大优秀作品。10 Midjourney正在从TPU切换至GPUs并采用PyTorch,从而加速招聘和开发进度。11 个性化功能现已支持多个命名配置文件,设置速度提升5倍,并且您可以同时选择多个活跃配置文件。15 Moodboards新增了--profile参数用于直接基于ID的使用方式,现在还可以在单个prompt中与--sref代码混合使用。1517 Niji 7(2026年1月9日)带来了更清晰的线条、改进的眼部和反射细节,并显著减少了--sref的风格偏移——但--cref仍不可用。3 网页界面新增了Describe on Web功能(右键点击任意图像可获取4条文本prompt)、新的宽高比选项以及支持2,000个项目的批量操作。1317 Rooms功能已于2026年2月26日移除。16 Video、Moodboards、Draft Mode以及所有V7功能仍然可用。完整更新历史请参阅更新日志。1
我花费了数百小时测试Midjourney的每个版本、参数组合和风格方向。本指南将这些经验浓缩为我在入门时希望能拥有的全面参考资料。无论您是在撰写第一个prompt,还是在探索创作的极限,所需的技巧都在这里。
Midjourney并非一个简单的prompt转图像工具。它是一个复杂的视觉语言系统,能够响应特定的模式、遵循特定的层级结构,并回馈那些理解其架构的用户。普通AI生成图像与令人惊叹的、有意图的作品之间的差别,就在于对这些模式的理解。
核心洞察:V7从根本上改变了prompt的工作方式。过去那种堆砌关键词的方法(”beautiful, stunning, 8k, detailed, masterpiece”)实际上会降低您的出图质量。V7能够理解自然语言——撰写prompt时,应当像在向一位专业摄影指导描述画面那样,而非在为图库照片打标签。
本指南涵盖了从初始安装到大多数用户从未发现的高级技巧的所有内容。每个参数都配有实际范围、真实示例以及容易困扰资深用户的边界情况。
目录
第一部分:基础知识
第二部分:参数精通
第三部分:引用系统
第四部分:视频生成
第五部分:风格模板
第六部分:进阶技巧
第七部分:工作流与优化
第八部分:参考资料
什么是 Midjourney?
Midjourney 是一个通过文本描述生成图像的生成式 AI 系统。与传统的图像编辑或素材摄影不同,您只需描述想要看到的内容,Midjourney 就会生成与您构想相匹配的原创图像。
Midjourney 的独特之处:
| 方面 | Midjourney | 竞争对手 |
|---|---|---|
| 图像质量 | 业界领先的美学表现 | 参差不齐 |
| 自然语言 | V7 能理解完整句子 | 通常依赖关键词 |
| 照片级真实感 | V7 表现卓越 | 良好到优秀 |
| 动漫/插画 | Niji 模型专门优化 | 通用型 |
| 视频 | 原生支持(2025年6月) | 需要额外工具 |
| 社区 | 集成分享/发现功能 | 各有不同 |
您可以创作的内容:
- 照片级真实图像:人像、产品、建筑、自然风光
- 插画:概念艺术、书籍封面、编辑配图
- 动漫与漫画:通过专用 Niji 模型实现
- 抽象艺术:实验性、超现实构图
- 视频:由图像生成的5-21秒动态片段
Midjourney 不是什么:
- 不是图片编辑器(请使用 Photoshop)
- 不是角色一致性系统(尚在快速改进中)
- 不是用于重现特定受版权保护角色的工具
- 不是免费的(订阅价格从每月10-120美元不等)
入门指南
账户设置
- 访问 midjourney.com
- 使用 Discord 登录或创建新账户
- 选择订阅方案:
| 方案 | 价格 | Fast GPU | Relax GPU | Video Relax |
|---|---|---|---|---|
| Basic | $10/月 | 3.3小时 | — | — |
| Standard | $30/月 | 15小时 | 无限 | — |
| Pro | $60/月 | 30小时 | 无限 | 是 |
| Mega | $120/月 | 60小时 | 无限 | 是 |
专家建议: 从 Standard($30/月)开始。无限制的 Relax 模式对于实验探索至关重要——在学习阶段,Fast 时长会消耗得非常快。
您的第一个 Prompt
打开网页界面 midjourney.com/imagine,输入:
A golden retriever sitting in autumn leaves, soft afternoon sunlight
就是这么简单。无需特殊语法。V7 能理解自然语言。
您将得到: 四张金毛犬在秋叶中的变体图像。接下来,您可以:
- Upscale:点击 U1-U4 生成高分辨率版本
- Vary:点击 V1-V4 创建细微变体
- Reroll:使用相同 prompt 生成四张全新变体
网页端与 Discord 对比
| 功能 | 网页界面 | Discord |
|---|---|---|
| 易用性 | 更简单 | 学习曲线较陡 |
| 图像管理 | 内置图库 | 散布在各频道 |
| 视频生成 | 完整支持 | 不可用 |
| Prompt 编辑 | 可视化界面 | 文本命令 |
| 社区 | 探索标签页 | 浏览频道 |
| 推荐 | 从这里开始 | 适合高级用户 |
网页界面现在是主要的使用入口。Discord 仍然可用,但缺少视频生成功能,且工作流不够直观。
核心概念
Prompt 的工作原理
每个 Midjourney prompt 都会经过以下处理流程:
Your Text Prompt
↓
[Text Encoder] → Converts words to mathematical embeddings
↓
[Diffusion Model] → Generates image from noise, guided by embeddings
↓
[Upscaler] → Increases resolution and detail
↓
Final Image
这对您意味着什么:
- 词序很重要:靠前的词比靠后的词影响力更大
- 具体描述胜出:”golden hour sunlight casting long shadows”(黄金时刻的阳光投下长长的影子)远胜于”nice lighting”(好看的光线)
- 矛盾描述会造成混乱:”dark, bright, moody, cheerful”(暗、亮、阴郁、欢快)这类描述会互相抵消
- 少即是多:50-150个 token 通常比300+个 token 效果更好
Token 经济学
Midjourney 看到的不是您的文字,而是 token(大致等同于词片段)。
| Token 数量 | 效果 | 最适合 |
|---|---|---|
| 10-30 | 非常开放的解读空间 | 抽象、实验性创作 |
| 30-80 | 控制力均衡 | 大多数 prompt |
| 80-150 | 精细控制 | 特定场景 |
| 150+ | 收益递减 | 可能导致冲突 |
专家建议: 如果您的 prompt 超过150个 token,很可能是过度描述了。请精简多余的形容词。
质量信号
V7 对某些描述模式反应特别强烈:
光线(影响最大): - “golden hour light casting long shadows across weathered stone” - “Rembrandt lighting with soft fill from camera left” - “bioluminescent glow illuminating the fog”
材质与纹理: - “oxidized copper with verdigris patina” - “worn leather showing decades of use” - “translucent jade catching the light”
氛围与情绪: - “melancholic twilight atmosphere” - “oppressive industrial ambiance” - “ethereal dreamlike quality”
专业摄影术语: - “shot on medium format, shallow depth of field” - “85mm lens, f/1.8 aperture” - “anamorphic lens flare, 2.39:1 aspect”
Prompt 层级结构
每个有效的 prompt 都遵循一个层级结构。位于顶层的词语拥有最大的影响力。
┌─────────────────────────────────────────────────┐
│ 1. SUBJECT (who/what) ← Most important │
│ "elderly fisherman" │
├─────────────────────────────────────────────────┤
│ 2. SUBJECT DETAILS (descriptors) │
│ "weathered face, silver beard, kind eyes" │
├─────────────────────────────────────────────────┤
│ 3. CONTEXT (where/when) │
│ "on a wooden dock at dawn" │
├─────────────────────────────────────────────────┤
│ 4. STYLE/MOOD (how it feels) │
│ "documentary photography, contemplative" │
├─────────────────────────────────────────────────┤
│ 5. TECHNICAL (camera/lighting) │
│ "shot on Leica, natural morning light" │
├─────────────────────────────────────────────────┤
│ 6. PARAMETERS (--ar, --s, etc.) ← Fine-tuning │
│ "--ar 3:2 --s 100 --v 7" │
└─────────────────────────────────────────────────┘
Prompt 模板
[SUBJECT] [SUBJECT DETAILS], [CONTEXT], [STYLE/MOOD], [TECHNICAL] --parameters
应用层级结构的示例:
An elderly fisherman with a weathered face and silver beard, standing on a
wooden dock at dawn, documentary photography style, contemplative mood,
shot on Leica M11 with natural morning light, soft mist rising from the water
--ar 3:2 --s 100 --v 7
大多数用户忽略的要点: 他们习惯以风格开头(”beautiful cinematic photo of…”),而非以主体开头。V7 对靠前的 token 赋予更高权重——请以您真正想要呈现的内容作为开头。
版本选择
V7(自2025年6月起为默认版本)
V7是Midjourney当前的旗舰模型,于2025年4月3日发布。2
优势: - 自然语言理解能力(使用完整句子描述,而非关键词堆砌) - 迄今最佳的照片写实效果 - 文字渲染能力大幅提升 - 更优秀的人体结构表现(手部、身体) - 改进的空间关系处理 - 默认启用个性化功能
生成模式:
| 模式 | 速度 | 费用 | 最适用场景 |
|---|---|---|---|
| Turbo | 最快 | 2倍标准费用 | 时间紧迫时的最终渲染 |
| Fast | 标准 | 1倍 | 常规工作流程 |
| Relax | 排队等候 | 已含在内 | 探索和学习 |
| Draft | 快10倍 | 0.5倍 | 快速迭代 |
何时使用V7: - 照片写实风格图像 - 包含复杂自然语言描述的prompt - 文字渲染 - 对质量要求最高时
Niji 7(2026年1月)
Niji 7是专为动漫/漫画风格设计的模型,于2026年1月9日发布。3
优势:
- 水晶般清澈的眼睛、反射效果和精细的背景细节3
- 复杂姿势和多臂构图的连贯性提升
- 更忠实的prompt解读——能精准处理特定颜色位置和发型
- 更好的文字渲染
- 增强的--sref性能,风格漂移显著减少3
- 干净、扁平的线条美学,旨在突出改进后的线条质量
限制:
- 不支持--cref——团队暗示将有一个”更强大的神秘惊喜”替代方案3
- 个性化(--p)和Moodboards正在逐步推出(可能尚未完全可用)
- 比之前的Niji版本更加字面化——需要调整意境式prompt
即将推出:
- 全新角色参考系统将取代--cref(预计将超越--cref的能力)
用法:
A determined young mage with crimson hair, casting fire magic,
intense expression, ancient library background --niji 7
何时使用Niji 7: - 动漫和漫画风格插画 - 角色设计 - 东方美学风格插画 - 需要更干净的线条效果时
Niji 6(旧版)
仍可使用,以保持向后兼容性。
何时使用Niji 6:
- 需要使用风格预设(--style expressive、--style cute、--style scenic)
- 工作流程依赖于--cref
- 偏好更柔和、非字面化的解读方式
风格:
--niji 6 --style expressive # Dynamic, stylized
--niji 6 --style cute # Kawaii aesthetic
--niji 6 --style scenic # Background focus
--niji 6 --style original # Classic Niji look
版本对比
| 功能 | V7 | Niji 7 | Niji 6 |
|---|---|---|---|
| 照片写实 | 优秀 | 不适用 | 不适用 |
| 动漫 | 良好 | 优秀 | 优秀 |
| 自然语言 | 最佳 | 良好 | 一般 |
| 文字渲染 | 最佳 | 良好 | 有限 |
--oref |
支持 | 不支持 | 不支持 |
--cref |
不支持 | 不支持 | 支持 |
--sref |
支持 | 支持(最佳) | 支持 |
--p |
支持 | 不支持 | 可选 |
| 风格预设 | 无 | 无 | 有 |
V8开发进展(2026年3月)
V8于2026年2月下旬进入最终蒸馏运行阶段(速度优化),此前在2月中旬之前经历了多轮社区评分活动。121416 蒸馏过程大约需要一周时间;完成后,V8将作为可选启用、非默认模型发布,进入约30天的预Alpha阶段,之后才会取代V7成为默认模型。16 版主和指导员已于1月下旬开始内部测试。9
已确认的V8功能: - 原生2K分辨率(2048px)——无需中间放大步骤即可获得真正更锐利的输出14 - 文字渲染能力大幅提升(V7最薄弱的环节)14 - 更好地生成复杂主体(生物、半人马、异常体态) - 完全重写的架构(全新代码库,支持64px至2048px+原生分辨率)14 - 支持style reference、Moodboards、个性化和weird参数12 - Style Creator和网页个人资料,用于社区风格分享11 - 内置放大和编辑功能12 - 全新创作流程:以256px生成64张图像进行快速探索,然后缩小范围并放大优胜作品10 - 基础设施从TPU切换至GPU并使用PyTorch(更好的代码库支持,更快的招聘速度)11 - V8”mini”变体,专为较低端硬件设计11 - 朝着实时预览生成方向推进
时间线(截至2026年3月初): - 内部测试:2026年1月9 - 评分活动:2026年2月上旬至中旬12 - 蒸馏运行:2026年2月下旬开始(约1周)16 - 发布:预计2026年3月初作为可选非默认版本16 - 预Alpha:可选发布后约30天,之后成为默认版本16 - V8发布后计划改进移动端应用9 - 带摄像机运动和重构的3D功能正在开发中9
V8之后的展望: - 硬件项目:四个正在进行中,包括一款可穿戴设备和一个仓库规模的组装项目10 - 批量模式扩展,配合用户偏好学习系统9 - 实时AI模型作为长期目标9
宽高比
--ar参数用于设置图像尺寸。默认为1:1(正方形)。
常用比例
| 比例 | 尺寸 | 适用场景 |
|---|---|---|
1:1 |
正方形 | 社交媒体、图标 |
4:5 |
竖版 | Instagram信息流、移动端 |
5:4 |
横版 | 桌面端、演示文稿 |
16:9 |
宽屏 | YouTube、演示文稿 |
6:11 |
高竖版 | 手机壁纸、竖版海报 |
9:16 |
竖屏 | Stories、TikTok、移动端 |
21:9 |
超宽 | 电影画面、影片 |
3:2 |
经典 | 摄影冲印 |
2:3 |
竖版 | 竖版冲印 |
各平台推荐比例
| 平台 | 比例 | 备注 |
|---|---|---|
| Instagram信息流 | 1:1或4:5 |
4:5可获得更多屏幕空间 |
| Instagram Story | 9:16 |
全屏竖版 |
| Twitter/X | 16:9或1:1 |
16:9在信息流中自动展开 |
1.91:1或16:9 |
专业横版 | |
2:3 |
竖版效果最佳 | |
| YouTube缩略图 | 16:9 |
标准视频格式 |
| 桌面壁纸 | 16:9或21:9 |
匹配您的显示器 |
构图影响
宽高比不仅仅是尺寸问题——它从根本上改变构图方式。
宽幅比例(16:9、21:9): - 强调环境与背景 - 适合风景、城市景观 - 电影感 - 主体融入场景之中
窄高比例(4:5、9:16): - 将注意力集中在主体上 - 适合人像、产品摄影 - 亲密感 - 更多纵向信息
专家提示: 拍摄电影感人像时,不妨尝试4:5而非看似理所当然的16:9。您既能获得竖版构图的主体聚焦效果,又有足够的背景空间来营造叙事感。
风格化
--s参数控制V7对图像的艺术化诠释程度。范围:0-1000。默认值:100。
风格化范围
| 范围 | 效果 | 最适用场景 |
|---|---|---|
| 0-50 | 极少艺术化诠释 | 产品照片、技术精确性 |
| 50-150 | 平衡(默认) | 通用场景、人像 |
| 150-300 | 明显风格化 | 艺术摄影、氛围作品 |
| 300-500 | 强烈风格化 | 插画、概念创作 |
| 500-1000 | 高度风格化 | 抽象、实验性作品 |
视觉示例
Portrait of a woman, soft window light --s 50
# Result: Clean, realistic, minimal embellishment
Portrait of a woman, soft window light --s 250
# Result: More artistic interpretation, enhanced mood
Portrait of a woman, soft window light --s 600
# Result: Distinctly stylized, dreamlike quality
决策框架
使用低风格化(0-100)的场景: - 创建产品摄影 - 需要照片写实的精确度 - 技术/文档类图像 - 希望prompt被字面解读
使用中等风格化(100-300)的场景: - 一般创意工作 - 编辑类摄影 - 需要适度增强而非极端效果 - 在写实与艺术之间取得平衡
使用高风格化(300+)的场景: - 创建插画或概念艺术 - 抽象或实验性作品 - 希望Midjourney的美学风格占主导 - 突破创意边界
风格化 + Style Raw
若要获得最大程度的照片写实效果,可将低风格化与--style raw组合使用:
Portrait of a businessman, office background --s 50 --style raw --v 7
--style raw指示V7最大限度地减少自身的美学诠释,让结果更贴近prompt的字面含义。
Chaos和Weird
Chaos(–chaos 0-100)
控制四张生成图像之间的差异程度。默认值:0。
| 值 | 效果 |
|---|---|
| 0 | 输出非常相似 |
| 25 | 略有变化 |
| 50 | 中等差异 |
| 75 | 差异较大 |
| 100 | 最大不可预测性 |
何时使用chaos:
- 探索阶段:--chaos 50-75,查看多样化的诠释
- 最终渲染:--chaos 0-25,获得一致的结果
- 寻找方向:前期使用高chaos值,精修时降低
Weird(–weird 0-3000)
引入非常规、出人意料的美学风格。默认值:0。
| 范围 | 效果 |
|---|---|
| 0 | 标准美学 |
| 100-500 | 微妙的异趣 |
| 500-1000 | 明显的奇异感 |
| 1000-2000 | 非常独特 |
| 2000-3000 | 最大奇异度 |
何时使用weird: - 超现实或梦幻风格图像 - 打破千篇一律的AI美学 - 概念艺术探索 - 当”正常”感觉过于平淡时
组合使用Chaos和Weird
--chaos 50 --weird 500 # Varied outputs, each slightly quirky
--chaos 100 --weird 0 # Wild variations, normal aesthetic
--chaos 25 --weird 2000 # Similar outputs, all very weird
专家提示: 高weird值确实能产生极为独特的图像,但一致性较差。建议在探索阶段使用,最终渲染时回调数值。
实验性美学
--exp参数为图像添加增强细节、动态感和色调映射效果。范围:0-100。默认值:0。
效果等级
| 值 | 效果 | 备注 |
|---|---|---|
| 0 | 关闭(默认) | 标准渲染 |
| 5 | 微妙增强 | 可安全与其他参数组合 |
| 10 | 明显的细节提升 | 推荐起点 |
| 25 | 强烈效果 | 混合使用时的推荐上限 |
| 50 | 非常强烈 | 可能降低prompt准确性 |
| 100 | 最大值 | 可能压制–stylize和–p |
–exp的作用
- 更丰富的纹理和表面细节
- 更具动感、力量感的构图
- 类似色调映射HDR的视觉效果
- 增强画面的视觉吸引力
推荐组合
--exp 10 --s 200 # Enhanced detail, balanced style
--exp 25 --s 100 # Strong exp, controlled stylize
--exp 5 --style raw # Subtle boost for photorealism
注意:参数冲突
当数值较高时(超过25-50),--exp可能会:
- 压制--stylize设置
- 覆盖个性化(--p)效果
- 降低图像多样性
专家提示: 大多数工作中建议将--exp保持在10-25。更高的值适用于特定的风格化效果,而非一般性的质量提升。
Omni Reference
--oref 参数可将参考图像中的主体特征转移到您的生成结果中。此参数在 V7 中取代了 --cref。
基本用法
/imagine A woman in a red dress at a gala --oref [image URL]
可转移的特征: - 面部和面部特征 - 体型和身体比例 - 服装和配饰 - 整体身份特征
权重控制(–ow)
--ow 0-1000 # Omni weight (default 100)
| 权重 | 效果 |
|---|---|
| 0-30 | 松散参考,允许风格变化 |
| 30-60 | 中等影响 |
| 60-100 | 强相似度(默认范围) |
| 100-300 | 非常接近的匹配 |
| 300-1000 | 最大保真度 |
权重交互
--ow 参数会与 --stylize 和 --exp 竞争影响力。当使用较高的 stylize 或 exp 值时,需要增加 --ow 以保持参考一致性:
# High stylize needs higher ow to keep reference
--oref [url] --ow 200 --s 400
# High exp overwhelms default ow
--oref [url] --ow 300 --exp 25
# If you aren't using high stylize/exp, stay at moderate ow (100-400)
专家提示: 在不使用极端 --stylize 或 --exp 值的大多数工作中,建议将 --ow 保持在 400 以下。只有在需要对抗强风格参数以保留精确的面部特征或服装细节时,才需要将其提高到中等值以上。
最佳实践
参考图像质量至关重要: - 高分辨率、主体清晰 - 正面照片最适合用于面部参考 - 参考图像中的光线要一致 - 尽量减少背景干扰
根据风格变化调整权重:
# Photo to anime conversion - lower weight
--oref [photo URL] --ow 40 --niji 7
# Maintaining strict likeness
--oref [photo URL] --ow 200 --v 7
与 style reference 结合使用:
# Subject from one image, style from another
--oref [subject URL] --sref [style URL] --ow 100 --sw 150
Style Reference
--sref 参数可从参考图像中转移美学特质。
基本用法
/imagine A mountain landscape at sunset --sref [style image URL]
可转移的特质: - 色彩搭配 - 光影风格 - 艺术技法 - 整体氛围/情绪 - 构图倾向
权重控制(–sw)
--sw 0-1000 # Style weight (default 100)
| 权重 | 效果 |
|---|---|
| 0-50 | 细微影响 |
| 50-150 | 平衡转移 |
| 150-300 | 强风格匹配 |
| 300-1000 | 主导性风格 |
多个 Style Reference
您可以组合多张风格图像:
--sref [url1] [url2]
风格会混合在一起。可用于创建独特的美学组合。
最佳实践
最适合用于: - 风格鲜明、一致的图像 - 美学特征清晰的图像 - 具有强烈视觉辨识度的图像
效果较差的情况: - 非常普通的照片 - 风格混杂或不明确的图像 - “风格”不明显的图像
专家提示: Niji 7 的 --sref 性能最佳。如果风格转移至关重要,即使是非动漫内容也可以考虑使用 Niji 7。
使用旧版 Style Reference 代码
如果您有 V6 时代的 --sref 代码,它们无法直接在 V7 中使用。添加 --sv 4 即可使用旧版风格代码:
/imagine A mountain landscape --sref 123456789 --sv 4
# --sv 4 tells V7 to interpret the code using V6 style system
注意: 虽然这保持了向后兼容性,但建议在 V7 中重新生成 style reference,以获得与新模型更好的匹配效果。
Image Weight
--iw 参数控制参考图像对生成结果的影响程度。
基本用法
/imagine [prompt] [image URL] --iw 1.5
权重范围
范围:0-2(默认值 1)
| 权重 | 效果 |
|---|---|
| 0-0.5 | prompt 主导 |
| 0.5-1 | 平衡 |
| 1-1.5 | 图像主导 |
| 1.5-2 | 强图像影响 |
使用场景
低权重(0-0.5): 将图像作为松散灵感,同时让 prompt 占主导地位
平衡(0.5-1): prompt 和图像的影响力相当
高权重(1.5-2): 基于图像创建高度相似的变体
Moodboards(自定义风格配置文件)
Moodboards 允许您通过对图像评分来创建个性化风格配置文件。您无需使用单张 --sref 图像,而是从多个示例中构建稳定的美学偏好。7 现在您可以创建多个命名配置文件,设置默认配置,甚至同时选择多个活动配置文件。15
Moodboards 的工作原理
- 创建 moodboard,访问 midjourney.com/personalize
- 对图像评分(喜欢/不喜欢)来训练您的风格——设置速度现已提升 5 倍15
- 使用
--p应用您的默认 moodboard - 使用
--p [mID]应用特定的 moodboard - 为不同项目或合作者命名和组织多个配置文件15
建立稳定的配置文件
| 评分数量 | 稳定性 |
|---|---|
| 40 | 可用配置文件的最低要求15 |
| 200 | 相当稳定,结果可靠15 |
| 2,000 | 最大精细度,最佳一致性15 |
专家提示: 建议至少评分 200 张图像以获得可靠的 moodboard。同时包含喜欢和不喜欢的评分——不喜欢的评分能帮助 Midjourney 理解需要避免的内容。您可以同时选择多个活动配置文件以实现混合美学效果。15
使用 Moodboards
/imagine A forest path at dawn --p
# Uses your default moodboard
/imagine A forest path at dawn --p abc123
# Uses specific moodboard with ID abc123
/imagine A forest path at dawn --profile abc123
# Alternative syntax using --profile parameter
Moodboards 与 Style Reference 对比
| 方式 | 最适合用于 |
|---|---|
--sref |
基于单张图像的一次性风格参考 |
--p(Moodboard) |
跨项目的一致个人美学风格 |
将 Moodboards 与 –sref 混合使用
您可以在单个 prompt 中将 moodboards 与 style reference 代码组合使用,实现精细控制:17
/imagine A portrait --p --sref [url] --sw 50
# Your moodboard aesthetic + subtle style reference influence
/imagine A portrait --sref 142710498 --profile drgmjoi 2jrqbw6
# Mix sref codes with multiple moodboard profiles
您还可以将 moodboard 快照以代码形式分享(例如 --profile 2jrqbw6),供他人使用;或者分享一个实时更新的链接,随着您的不断完善而同步更新。17
Draft Mode
Draft mode 以 10 倍速度生成图像,且仅需一半的 GPU 成本。是探索阶段的必备工具。
启用 Draft Mode
/imagine [prompt] --draft
或在网页界面设置中切换。
Draft 与完整渲染对比
| 方面 | Draft | 完整渲染 |
|---|---|---|
| 速度 | 约快 10 倍 | 标准 |
| GPU 成本 | 50% | 100% |
| 细节 | 降低 | 完整 |
| 最适合 | 探索阶段 | 最终输出 |
Draft 工作流程
1. Draft Mode Exploration (--draft)
├── Test 5-10 variations quickly
├── Identify promising directions
└── Note effective parameters
2. Full Render Refinement
├── Remove --draft flag
├── Apply learned parameters
└── Fine-tune with --seed
专家提示: 始终从 Draft mode 开始。节省的成本会不断累积,而且您能探索更多选项。只有在找到值得投入的方向后,才切换到完整渲染。
图像转视频基础
Midjourney 的 V1 Video Model 于 2025 年 6 月 19 日发布,支持图像转视频动画功能。
工作原理
- 选择任意图像(Midjourney 生成的或上传的均可)
- 点击 “Animate” 按钮
- 选择选项(Auto、Manual、Loop)
- 生成 5 秒视频片段
运动参数
--motion low # Still scenes, slow motion, subtle movement (default)
--motion high # Big camera motions, larger character movements
--raw # Reduces creative flair, more prompt control
运动效果对比
| 设置 | 效果 | 最适合 |
|---|---|---|
| Low | 细腻的电影级运动 | 肖像、静物、氛围场景 |
| High | 动感十足的运动 | 动作、风景、人群场景 |
警告: High motion 可能产生不真实或出现瑕疵的运动。建议从 low 开始,仅在必要时提高。
费用与方案
- 视频任务的成本约为图像任务的 8 倍
- 每个任务生成四段 5 秒视频
- 仅在网页界面可用(不支持 Discord)
| 方案 | Fast Mode 视频 | Relax Mode 视频 |
|---|---|---|
| Basic | 是 | 否 |
| Standard | 是 | 否 |
| Pro | 是 | 是 |
| Mega | 是 | 是 |
HD Video Mode
HD Video mode(2025 年 8 月推出)提供 4 倍更清晰的分辨率——四倍像素密度,显著提升视频质量。8
HD Video 的使用方法: 1. 首先生成标准视频 2. 在已完成的视频上点击 HD 选项 3. 等待高分辨率渲染
HD Video 费用: - 成本约为标准视频的 3.2 倍 - 仅限 Pro 和 Mega 方案 - 需要先有标准视频(无法直接生成 HD)
| 模式 | 分辨率 | 相对成本 |
|---|---|---|
| Standard(SD) | 基准 | 1x |
| High Definition(HD) | 4 倍像素 | 约 3.2x |
适用场景: - 最终交付素材 - 大屏幕或投影展示 - 专业/商业用途 - 运动中细节至关重要时
专家提示: 始终先在 SD 模式下测试。HD 需要更长时间且成本更高——只升级您最佳的片段。
延伸与循环
延伸视频
您可以将任何视频额外延伸 4 秒,最多延伸 4 次(最长 21 秒)。
延伸选项: - Auto:自动续接视频 - Manual:在延伸前调整 prompt
延伸的最佳实践: - 在开始之前规划好叙事弧线 - 前 5 秒应建立场景 - 每次延伸都应有明确目的 - 注意节奏把控——21 秒比您想象的更长
创建循环
Loop 选项可创建无缝循环视频,使首帧和末帧完美衔接。
Select image → Click "Loop" → Generate
最适合用于: - 背景动画 - 社交媒体内容 - 氛围视觉效果 - 电影式动图
提升循环效果的技巧: - 简单、可重复的运动效果最佳 - 避免复杂的镜头运动 - 大气元素(云、水、火)天然适合循环
视频最佳实践
何时使用视频
适合转为视频的素材: - 氛围场景(雾、雨、火) - 细微运动(头发、织物、水) - 具有环境动态的风景 - 运动幅度极小的肖像
不太适合视频的情况: - 复杂的动作序列 - 多角色场景 - 精确的编排动作 - 对技术准确性要求高的内容
针对视频优化
动画化之前: 1. 首先生成完美的静态图像 2. 考虑各元素可能的运动方式 3. 避免复杂、相互关联的主体 4. 简洁的构图更适合动画化
Prompt 调整:
# Good for video
Lone figure standing on cliff edge, wind blowing cape, dramatic clouds
# Less ideal for video
Group of dancers in synchronized formation, precise movements
成本管理
视频成本为图像的 8 倍,费用会迅速累积:
高性价比工作流程: 1. 在 Draft mode 中探索(图像阶段) 2. 找到完美构图 3. 生成最终的高质量静态图像 4. 仅为最佳版本制作动画 5. 仅在必要时进行延伸
电影级写实风格
实现照片级真实感和电影级效果的最有效模式。
电影级模板
[Shot type] by [Director], [subject physical description],
[action/pose], [costume/styling], [setting details],
captured with [Camera Body] using [Lens], [lighting description],
[mood/atmosphere summary]
--ar [ratio] --s [value] --p --no anime, cartoon, illustration, painting
导演风格
| 导演 | 视觉风格 | 最佳用途 |
|---|---|---|
| Ridley Scott | 氛围感强、纹理丰富、情绪深沉 | 科幻、古装剧、特写镜头 |
| Denis Villeneuve | 史诗级规模、荒凉、几何感 | 风景、广角镜头 |
| David Fincher | 暗调、精准、不安感 | 惊悚片、情绪化肖像 |
| Roger Deakins | 剪影、自然光、诗意 | 任何以光影为重点的场景 |
| Alfonso Cuarón | 沉浸式、亲密感、跟踪镜头 | 人物刻画、紧张场景 |
| Wes Anderson | 对称构图、柔和色调、奇趣风格 | 风格化的居中构图 |
| Christopher Nolan | IMAX 级规模、实景拍摄、强烈冲击感 | 动作场景、建筑 |
| Terrence Malick | 黄金时段、空灵、自然 | 风景、沉思性画面 |
摄影机机身参考
| 摄影机 | 美学特征 | 最佳用途 |
|---|---|---|
| RED Komodo | 现代数字电影感 | 特写、叙事性影片 |
| ARRI ALEXA | 胶片质感、色彩浓郁 | 全类型电影 |
| ARRI Alexa Mini | 与 ALEXA 相同、更紧凑 | 纪录片、手持拍摄 |
| ARRI ALEXA 65 | 大画幅、史诗级 | 风景、IMAX 级效果 |
| RED V-Raptor | 8K、锐利、动态范围广 | 动作场景、高细节 |
| Sony Venice | 全画幅、用途广泛 | 低光环境、变形宽银幕 |
| Hasselblad | 中画幅、奢华质感 | 人像、时尚 |
| Leica M | 旁轴取景、经典风格 | 街拍、纪录片 |
镜头搭配
| 焦距 | 效果 | 最佳用途 |
|---|---|---|
| 24mm f/1.4 | 广角、环境感强 | 风景、建立镜头 |
| 35mm f/2.0 | 自然、全能 | 纪录片、街拍 |
| 50mm f/1.4 | 经典、均衡 | 通用 |
| 85mm f/1.8 | 人像、浅景深 | 特写、人像 |
| 105mm f/2.0 | 压缩感、亲密 | 头像特写 |
| 135mm f/2.0 | 最大压缩效果 | 紧凑人像 |
完整电影级示例
特写人像:
Dramatic close-up portrait by Ridley Scott, young woman with pale skin
and auburn hair, intense green eyes staring directly at camera, subtle
freckles across nose, wearing dark wool coat, rain falling around her
face, captured with RED Komodo using 85mm f/1.8 lens, cold blue-silver
lighting with warm practical rim light, melancholic determined atmosphere
--ar 4:5 --s 150 --p --no anime, cartoon, illustration, painting
电影级广角:
Epic wide shot by Denis Villeneuve, lone figure in orange survival suit
walking across endless salt flats, geometric patterns in dried earth,
massive dust storm approaching on horizon, captured with ARRI ALEXA 65
using 24mm f/2.0 lens, harsh afternoon sun creating stark shadows,
desolate apocalyptic atmosphere
--ar 21:9 --s 200 --p --no anime, cartoon, illustration, painting
关键提示: 切勿使用演员姓名。请用外貌特征描述人物。使用”年轻女性,皮肤白皙,红棕色头发”而非”Emma Stone”。演员姓名会产生恐怖谷效应。
人像摄影
布光模式
| 模式 | 效果 | 布光方式 |
|---|---|---|
| 伦勃朗光 | 戏剧性、古典感 | 主光源位于侧面45°,在眼下形成三角形光斑 |
| 蝴蝶光 | 时尚、修饰效果好 | 主光源位于正上方偏前 |
| 分割光 | 戏剧性、神秘感 | 光线来自纯侧面 |
| 轮廓光/边缘光 | 分离感、层次感 | 光线来自背后 |
| 环形光 | 细微阴影 | 比伦勃朗光角度稍小 |
人像模板
[Subject description], [expression/emotion], [pose],
[lighting pattern] lighting, shallow depth of field,
[background description], shot on [camera] with [lens]
--ar 4:5 --s 100 --v 7
人像示例
环境人像:
Middle-aged craftsman with salt-and-pepper beard, focused expression,
hands working on leather saddle, Rembrandt lighting from workshop window,
shallow depth of field, blurred tool-filled background, shot on
Hasselblad with 80mm f/1.9, documentary authenticity
--ar 4:5 --s 75 --style raw --v 7
棚拍人像:
Professional woman in her 30s, confident subtle smile, shoulders
turned slightly, butterfly lighting with soft fill, pure white
seamless background, shot on Phase One with 110mm f/2.8, clean
commercial aesthetic
--ar 4:5 --s 50 --v 7
产品摄影
产品模板
[Product] on [surface/platform], [background style],
[lighting setup], commercial photography, high detail,
[brand aesthetic description]
--ar 1:1 --s 50 --v 7 --style raw
台面与背景选择
台面材质: - 抛光大理石(奢华感) - 裸露混凝土(工业感) - 天然木材(自然感) - 拉丝金属(科技感) - 彩色亚克力(现代感)
背景: - 渐变(平滑过渡) - 无缝纸(纯色) - 场景化(使用场景展示) - 抽象(艺术化)
产品示例
奢侈品化妆品:
Minimalist perfume bottle with gold cap on polished black marble surface,
gradient background from deep purple to black, dramatic rim lighting with
soft front fill, commercial photography, high detail, premium luxury
aesthetic, subtle reflections on marble
--ar 1:1 --s 25 --v 7 --style raw
科技产品:
Wireless earbuds case open showing earbuds inside, floating on
pure white seamless background, soft even lighting from all sides,
commercial product photography, high detail, clean Apple-style
minimalism, subtle shadow beneath
--ar 1:1 --s 50 --v 7 --style raw
奇幻与科幻
奇幻模板
[Character/scene description], [fantasy world details],
[magical elements], [lighting style],
[art style: painterly | concept art | illustration],
[artist influence if applicable]
--ar 16:9 --s 500 --weird 100 --v 7
奇幻示例
史诗奇幻:
Ancient elven queen seated on crystalline throne in vast cavern hall,
iridescent robes flowing with captured starlight, bioluminescent
flowers floating around her, massive glowing runes carved into
obsidian walls, ethereal volumetric lighting, painterly fantasy
illustration influenced by Craig Mullins and Alphonse Mucha
--ar 16:9 --s 600 --weird 150 --v 7
黑暗奇幻:
Battle-scarred knight in tarnished armor standing in ruined cathedral,
sword planted in cracked stone floor, pale moonlight streaming through
shattered rose window, crows circling above, mist swirling at feet,
dark atmospheric concept art, Beksinski and Zdzisław influence
--ar 16:9 --s 400 --weird 200 --v 7
科幻模板
[Subject/scene], [technology details], [environment],
[lighting: neon | holographic | industrial | sterile],
[aesthetic: cyberpunk | hard sci-fi | retro-futurism],
[mood description]
--ar 21:9 --s 300 --v 7
科幻示例
赛博朋克:
Solo mercenary in worn tactical gear navigating rain-soaked neon alley,
holographic advertisements flickering overhead, steam rising from
street grates, distant megastructures visible through smog, cyan and
magenta neon reflections on wet pavement, Blade Runner cyberpunk
aesthetic, oppressive urban atmosphere
--ar 21:9 --s 350 --v 7
硬科幻:
Interior of generation ship agricultural bay, massive cylindrical
space with terraced farms curving overhead, artificial sun strip
running along central axis, workers in utilitarian jumpsuits tending
crops, visible structural engineering, hard science fiction aesthetic,
The Expanse influence, functional yet beautiful
--ar 21:9 --s 250 --v 7
使用 Niji 7 创作动漫风格
Niji 7 特性
Niji 7 能生成更干净、更扁平化的画面,并改进了线条表现。相比之前的版本,它对prompt的理解更加直白和精确。
Niji 7 模板
[Character description], [pose/action], [expression],
[setting/background], [specific style notes],
[color palette]
--niji 7 --ar [ratio]
Niji 7 示例
动作场景:
Young mage with flowing crimson hair and determined golden eyes,
casting powerful fire spell with both hands raised, intense focused
expression, ancient library crumbling around her, debris floating
in magical energy, dynamic diagonal composition, warm orange and
red color palette with cool blue shadows
--niji 7 --ar 3:4
角色肖像:
Elegant noblewoman with silver hair in elaborate updo, wearing dark
blue Victorian-inspired gown with gold embroidery, subtle knowing
smile, half-body portrait, ornate palace balcony background with
moonlit garden visible, soft romantic atmosphere, detailed lace
and fabric textures
--niji 7 --ar 4:5
使用 Niji 7 进行风格迁移
Niji 7 拥有最佳的 --sref 表现:
[Your prompt] --niji 7 --sref [style image URL] --sw 150
建议从 --sw 150 开始,然后逐步调整:
- 较低值(50-100):轻微的风格影响
- 较高值(200-300):强烈的风格匹配
从 Niji 6 迁移
Niji 6 的写法:
anime girl, beautiful, detailed eyes, colorful --niji 6 --style expressive
Niji 7 的写法:
Young woman with vibrant teal hair and large expressive amber eyes,
wearing casual summer dress, cheerful smile, urban cafe background,
afternoon sunlight, contemporary anime style
--niji 7
关键变化:
- 使用完整的描述性句子,而非关键词堆叠
- 描述应更加直白和具体
- 不再有风格预设——直接描述您想要的效果
- 使用 --sref 实现风格一致性
建筑摄影
建筑模板
[Building/space type], [architectural style],
[time of day/lighting], [weather/atmosphere],
[perspective: eye-level | aerial | interior | detail],
architectural photography, clean lines
--ar 16:9 --s 150 --v 7 --style raw
建筑风格
| 风格 | 特征 | 关键词 |
|---|---|---|
| 粗野主义 | 裸露混凝土、体量巨大、几何感强 | 裸露混凝土、巨构体 |
| 极简主义 | 线条干净、白色调、极简布置 | 留白、纯粹形体 |
| 装饰艺术 | 华丽装饰、几何图案、奢华感 | 金色点缀、放射状图案 |
| 哥特式 | 尖拱、垂直感强、戏剧性 | 飞扶壁、玫瑰窗 |
| 日式 | 木质、纸障、融入自然 | 障子门、缘侧、禅意 |
| 参数化 | 流线型、计算生成、有机感 | Zaha Hadid、算法曲线 |
建筑示例
粗野主义:
Brutalist concrete museum interior with dramatic skylights, afternoon
sun creating strong geometric shadows on exposed concrete walls, vast
empty gallery space with single sculpture, eye-level perspective
showing depth and scale, architectural photography by Hélène Binet
--ar 16:9 --s 100 --v 7 --style raw
参数化建筑:
Futuristic parametric architecture concert hall exterior, flowing white
curves inspired by Zaha Hadid, blue hour lighting with building interior
warmly illuminated, long exposure car light trails on surrounding roads,
wide establishing shot, architectural photography
--ar 16:9 --s 150 --v 7
抽象与实验风格
抽象模板
[Concept/emotion to express], [visual elements],
[color palette], [texture/material qualities],
[movement/energy description], abstract composition
--s 750 --weird 500 --chaos 50 --v 7
抽象示例
情感抽象:
The feeling of nostalgia dissolving into hope, fragmented memories
reforming as light, soft blues transitioning to warm amber, watercolor
textures bleeding into geometric shapes, gentle upward movement,
abstract emotional landscape
--ar 1:1 --s 800 --weird 750 --chaos 40 --v 7
质感抽象:
Microscopic landscape of oxidized copper and crystalline salt
formations, verdigris greens and rust oranges, extreme macro detail,
mineral textures catching diffused light, abstract geological patterns
--ar 1:1 --s 500 --weird 300 --v 7
突破边界
要创作真正的实验性作品:
- 将 --weird 提升至1000以上
- 搭配 --chaos 75+ 使用
- 使用抽象的情感化语言
- 参考非传统艺术家
The architecture of forgotten dreams, impossible geometries folding
through chromatic space, Escher meets Kandinsky, synesthetic color
relationships, visual music
--ar 1:1 --s 1000 --weird 2000 --chaos 75 --v 7
词汇权重
使用 :: 语法来控制特定元素的强调程度。
语法
word::2 # Double emphasis
word::1.5 # 50% more emphasis
word::1 # Normal (default)
word::0.5 # Half emphasis
word::-1 # Negative (avoid)
示例
ethereal::2 portrait of a warrior, dramatic lighting::1.5, mist::0.5
此 prompt 的效果: - 强烈强调空灵感 - 适度强调戏剧性光影 - 降低雾气的存在感
何时使用权重
适用场景: - 微调元素之间的平衡 - 抑制不需要的画面解读 - 强调关键特征
不建议使用的场景: - 初次探索阶段 - 无需权重即可正常运作的简单 prompt - 尚不确定需要强调什么时
专家提示: 词汇权重是精调工具,而非起步工具。先让基础 prompt 达到理想效果,再用权重进行微调。
负面提示
--no 参数用于从生成结果中排除特定元素。
基本用法
/imagine Beautiful landscape --no people, text, watermark
有效的负面提示
| 目标 | 负面提示 |
|---|---|
| 照片写实 | --no anime, cartoon, illustration, painting, drawing |
| 干净画面 | --no text, watermark, signature, frame, border |
| 自然质感 | --no oversaturated, HDR, artificial |
| 严肃基调 | --no cute, chibi, kawaii |
| 简洁构图 | --no busy, cluttered, crowded |
最佳实践
建议: - 使用具体、明确的词汇 - 针对实际输出中出现的问题进行处理 - 保持列表精简(3-5项)
不建议: - 创建穷举式的排除列表 - 使用模糊词汇(”bad”、”ugly”) - 排除本来就不太可能出现的元素
电影级负面提示
用于获得稳定的照片写实效果:
--no anime, cartoon, illustration, painting, drawing, sketch, CGI, 3D render
种子控制
种子(seed)可实现结果的可复现性和受控变化。
基本用法
/imagine [prompt] --seed 12345
相同的 prompt + 相同的种子 = 非常相似的输出结果。
查找种子
生成完成后,点击图片信息即可查看所使用的种子值。记录下来以便复现。
种子工作流
变体工作流: 1. 使用随机种子生成 2. 找到满意的结果 3. 记录种子值 4. 使用相同种子对 prompt 进行小幅调整 5. 对比不同变体
批量一致性:
Scene in morning light --seed 54321
Scene in afternoon light --seed 54321
Scene in evening light --seed 54321
在相关 prompt 中使用相同种子可以生成构图更一致的结果。
多主体构图
包含多个主体的复杂场景需要精心构建 prompt。
层级方法
按重要性排列主体:
[Primary subject], [secondary subject], [tertiary subject],
[their relationship/interaction], [setting], [style]
空间描述语言
使用清晰的空间描述词:
In the foreground, [subject A]
In the middle ground, [subject B]
In the background, [subject C]
或者:
On the left, [subject A]
In the center, [subject B]
On the right, [subject C]
示例
Elderly grandmother and young granddaughter baking together in
sunlit kitchen, grandmother guiding child's hands rolling dough,
flour dusting the wooden counter, warm afternoon light from window,
vintage kitchen appliances in background, intimate family moment,
documentary photography style
--ar 3:2 --s 100 --v 7
文字渲染
V7 大幅改进了图像中的文字渲染效果。
最佳实践
保持文字简短: - 单词效果最佳 - 短语(2-4个单词)通常可行 - 长句子往往会失败
使用引号:
Neon sign reading "OPEN" in storefront window
指定字体样式:
Vintage poster with "JAZZ NIGHT" in art deco typography
文字示例
招牌:
Rainy city street at night, neon diner sign reading "EAT" glowing
red through rain-streaked window, film noir atmosphere
--ar 16:9 --s 150 --v 7
字体排版:
Minimalist book cover design, large serif typography reading "THE END"
centered on cream paper texture, literary fiction aesthetic
--ar 2:3 --s 100 --v 7
局限性
文字渲染在以下情况仍有困难: - 长句子 - 复杂字体 - 繁杂画面中的小号文字 - 多个文字元素
专家提示: 如果文字至关重要,建议先生成不含文字的图像,再通过后期处理添加排版。
迭代循环
Midjourney 的专业工作流:
阶段一:探索(Draft Mode)
1. Enable Draft mode (--draft)
2. Write basic prompt with core concept
3. Generate 4-8 batches quickly
4. Identify promising directions
5. Note what works/doesn't
目标: 找到方向,而非追求完美。速度至上。
阶段二:精炼
1. Disable Draft mode
2. Take best concepts from Phase 1
3. Add specific details
4. Adjust parameters (--s, --chaos, etc.)
5. Generate in Fast mode
6. Compare variations
目标: 缩小范围至2-3个优选方案。
阶段三:完善
1. Select best candidate
2. Note the seed
3. Make micro-adjustments to prompt
4. Use same seed for consistency
5. Upscale final choice
目标: 打磨最终作品。
时间分配
| 阶段 | 时间 | 模式 |
|---|---|---|
| 探索 | 60% | Draft |
| 精炼 | 30% | Fast |
| 完善 | 10% | Fast |
大多数用户会将这一比例颠倒——在第一次尝试时就花费过多时间去完善。应该多探索,少打磨。
网页端 Describe 功能
在网页界面上右键点击任意图片并选择”Describe”,即可从图像生成四条文字 prompt。17 这对于逆向解析您欣赏的风格非常有价值——在 Explore 页面上描述一张图片,然后修改生成的 prompt 以匹配您的创意愿景。Prompt 在页面刷新后会自动清除。
成本管理
了解 GPU 时间
- Fast Mode:使用订阅计划中的 GPU 小时数
- Relax Mode:无限制但需排队(Standard及以上计划)
- Draft Mode:GPU 消耗为常规模式的一半
- Video:消耗约为图像的8倍
订阅方案性价比
| 计划 | Fast 小时数 | Relax | Video Relax | 每 GPU 小时费用 |
|---|---|---|---|---|
| Basic | 3.3小时 | 否 | 否 | $3.03 |
| Standard | 15小时 | 是 | 否 | $2.00 |
| Pro | 30小时 | 是 | 是 | $2.00 |
| Mega | 60小时 | 是 | 是 | $2.00 |
洞察: Standard及以上计划的每 GPU 小时性价比远优于Basic,且享有无限Relax模式。
节省成本的策略
- 使用 Draft mode 探索 — 成本减半,速度快10倍
- 使用 Relax 进行探索 — 免费(Standard及以上)
- 将 Fast 留给最终作品 — 仅在画质关键时使用
- 批量处理相似 prompt — 比逐个生成更高效
- 先构思再生成 — 想清楚,再动手
用量估算
| 操作 | 大约 GPU 分钟 |
|---|---|
| 4张图像(标准) | ~1分钟 |
| 4张图像(draft) | ~0.5分钟 |
| Upscale | ~0.5分钟 |
| Video(4段5秒) | ~8分钟 |
故障排查
常见问题
| 问题 | 原因 | 解决方法 |
|---|---|---|
| 面部模糊 | –s 值过低或风格冲突 | 使用 --style raw,增加细节描述 |
| 比例错误 | 默认1:1 | 明确指定 --ar |
| 过于艺术化 | –s 值过高 | 降低至50-100 |
| 过于写实 | –s 值过低 | 提高至200+ |
| 输出不一致 | 低chaos值 | 使用 --seed 保持一致性 |
| 风格过强 | –sw 值过高 | 降低 --sw 权重 |
| 文字无法渲染 | V7 局限性 | 保持文字简短,使用引号 |
| 手部异常 | AI局限性 | 裁剪或重新生成 |
| 找不到 Rooms | 功能已于2026年2月26日移除16 | 改用文件夹和 Organize 页面 |
参数冲突
避免同时使用:
- --style raw + 高 --s(互相矛盾)
- --v 7 + --niji(二选一)
- 多个权重均为100%的强引用
- --exp 50+ + --stylize(exp 会压制 stylize)
- --exp 50+ + --p(exp 会覆盖 p)
搭配效果良好:
- --oref + --sref 使用适中权重
- --chaos + --seed(多样但可复现)
- --style raw + 低 --s(最大化照片写实)
- --exp 10-25 + --s 100-200(增强但可控)
当一切方法都不奏效时
- 简化 — 移除参数,缩短 prompt
- 拆分 — 分别尝试主体和风格
- 寻找种子 — 大量生成,找到好的种子,然后迭代
- 使用参考 — 用
--sref配合展示目标效果的图片 - 切换版本 — 尝试不同的模型版本
版本迁移
V6 到 V7 迁移
旧版 V6 风格:
portrait, beautiful woman, dramatic lighting, 8k, detailed, masterpiece
新版 V7 风格:
A contemplative portrait of a woman in her 30s, Rembrandt lighting
casting gentle shadows across her face, medium format photography
aesthetic with shallow depth of field
关键变化
| 方面 | V6 | V7 |
|---|---|---|
| Prompt 风格 | 关键词堆叠 | 自然语言 |
| 画质词汇 | 有效 | 基本被忽略 |
| 角色参考 | --cref |
--oref |
| 个性化 | 可选 | 默认开启 |
| 默认行为 | 偏艺术化 | 更写实 |
应该停止的做法
- 关键词堆砌(”beautiful, stunning, amazing”)
- 画质修饰词(”8k, ultra detailed, masterpiece”)
- 使用
--cref(现已改为--oref) - 简短的逗号分隔式 prompt
应该开始的做法
- 撰写完整的句子
- 描述您所看到的画面,而非您想要的结果
- 具体描述光线、材质、氛围
- 使用相机/镜头术语
- 善用个性化功能(
--p)
参数速查表
MODELS
--v 7 Default, best overall (June 2025)
--niji 7 Anime/manga (Jan 2026, best coherence)
--niji 6 Anime/manga (legacy, has --style options)
--draft Fast iteration, 10x faster, half cost
ASPECT
--ar 16:9 Widescreen
--ar 21:9 Cinematic ultrawide
--ar 4:5 Portrait (Instagram)
--ar 6:11 Tall portrait (phone wallpapers)
--ar 9:16 Vertical (Stories)
--ar 1:1 Square
--ar 3:2 Classic photo
--ar 2:3 Portrait print
STYLE
--s 0-100 Photorealistic
--s 100-300 Balanced
--s 300-1000 Artistic
--style raw Minimal AI interpretation
--p Apply personalization (V7 default)
EXPERIMENTAL
--exp 0-100 Enhanced detail (10-25 sweet spot)
--chaos 0-100 Output variety
--weird 0-3000 Unconventional aesthetics
REFERENCES
--oref [url] Subject/character (V7)
--ow 0-1000 Omni weight (default 100)
--sref [url] Style transfer
--sw 0-1000 Style weight (default 100)
--iw 0-2 Image weight (default 1)
VIDEO (Web only)
--motion low Subtle movement (default)
--motion high Dynamic movement
--raw More prompt control
QUALITY
--q 1 Full quality (default)
--seed [num] Reproducibility
NEGATIVE
--no [items] Exclude elements
更新日志
| 日期 | 变更内容 | 来源 |
|---|---|---|
| 2026-03-03 | 更新V8时间线(蒸馏运行于2月下旬开始,选择性加入版本于3月初发布,成为默认前约30天预览期)。新增--profile Moodboards语法及与--sref代码混合功能。新增Web端Describe功能。新增Rooms移除信息(2月26日)。 |
1617 |
| 2026-02-28 | 更新V8状态(截至2月28日仍在开发中,确认原生2K分辨率,架构全面重写)。增强Moodboards/配置文件章节(多个命名配置文件、5倍更快的设置速度、稳定性阈值细化为40/200/2000)。 | 1415 |
| 2026-02-17 | V8状态:最终打磨阶段,2月中旬进行多次评分活动,即将发布。确认V8功能(style refs、Moodboards、编辑功能)。新增6:11宽高比、–ow交互指南、Web平台更新(批量操作、自动参数清理)。 | 1213 |
| 2026-02-09 | 更新V8状态(内部测试、评分活动、TPU→GPU迁移、新创建流程),增强Niji 7细节(–sref漂移、眼部质量、–cref替代方案) | 910 |
| 2026-01-20 | 新增HD Video模式章节(4倍分辨率,约3.2倍成本,仅限Pro/Mega订阅) | 8 |
| 2026-01-17 | 新增V8开发状态、Moodboards章节、用于旧版sref代码的–sv 4 | Web扫描 |
| 2026-01-16 | 新增V7.1路线图信息,验证Niji 7覆盖范围 | Web扫描 |
| 2026-01-13 | 创建指南,涵盖V7、Niji 7、视频生成 | 综合来源 |
| 2026-01-09 | Niji 7发布,连贯性显著提升 | 3 |
| 2025-06-19 | V1视频模型发布 | 4 |
| 2025-06-17 | V7成为默认模型 | 2 |
| 2025-04-30 | V7更新:–exp参数、编辑器改进 | 5 |
| 2025-04-03 | V7发布 | 2 |
参考文献
-
Midjourney Updates。官方更新日志与公告。 ↩
-
Midjourney Version Documentation。”Version 7 was released on April 3, 2025, and became the default model on June 17, 2025.” ↩↩↩
-
Niji V7 Announcement。”Niji V7 is now live”——2026年1月9日。 ↩↩↩↩↩↩
-
V1 Video Model。视频生成功能于2025年6月19日发布。 ↩
-
V7 Update, Editor, and –exp。2025年4月30日更新详情。 ↩
-
V8 Development Discussion。社区关于V8训练及David Holz问答中路线图细节的讨论。 ↩
-
Moodboards Feature。Midjourney通过Moodboards和图像评分实现个性化。 ↩
-
HD Video Mode。”HD Video mode delivers 4x sharper AI-generated clips… costs roughly 3.2 times more than SD.”2025年8月。 ↩↩
-
Office Hours Feb 12。评分活动预示V8发布临近、硬件项目、实时3D研究。 ↩↩↩↩
-
V8 Development Overview。TPU到GPU/PyTorch的迁移、V8 mini变体、Style Creator、新数据集。 ↩↩↩↩
-
V8 Rating Party Updates。2月16日当周进行多次评分活动,V8预计随后不久发布。已确认功能:style refs、Moodboards、个性化、weird、Style Creator、Upscale、编辑。 ↩↩↩↩↩↩
-
Web Updates Jan 20, 2026。新增6:11、4:5、5:4、21:9宽高比,支持2000项批量操作,自动移除无关参数。 ↩↩
-
V8 Release Status。”Midjourney V8 could drop next week”——原生2K分辨率、架构全面重写、文字渲染大幅改进。2026年2月下旬。 ↩↩↩↩↩↩
-
Profiles and Moodboards。多个命名配置文件、5倍更快的设置速度、可选择多个活跃配置文件、40次评分即可开始使用、200次趋于稳定、最高可至2000次持续优化。 ↩↩↩↩↩↩↩↩↩↩
-
V8 Distillation and Release Timeline。最终蒸馏运行于2月下旬开始,持续约1周,之后推出选择性加入版本,约30天预览期后成为默认模型。Rooms功能于2026年2月26日移除。 ↩↩↩↩↩↩↩↩↩
-
Describe on Web + Moodboard Blending。右键点击Describe可从任意图像生成4条文字prompt。Moodboard混合功能支持
--sref代码和--profile参数直接使用Moodboard ID。 ↩↩↩↩↩↩