AI Image Generation

Midjourney プロンプトエンジニアリング:完全ガイド

1780 words 24 min read Updated 2026-02-04

2026年1月20日更新

2026年1月アップデート: Midjourney V7がデフォルトモデルになり、自然言語理解、フォトリアリズム、テキストレンダリングが大幅に向上しました。Niji 7は2026年1月9日にリリースされ、アニメスタイルのコンテンツにおけるコヒーレンシーが大きく改善されています。ビデオ生成(V1)では、任意の画像から5〜21秒のクリップを作成できます。--expパラメータにより、ディテールとダイナミクスが強化されます。新機能:Moodboardsでは、アップロードした画像からカスタムスタイルを作成でき、--srefとブレンドすることも可能です。V7.1では手と体のコヒーレンスが改善される予定です。V8は現在開発中で、新しいアーキテクチャによる完全な書き直しとなり、2026年第1四半期のリリースが予定されています。1

私はMidjourneyのあらゆるバージョン、パラメータの組み合わせ、スタイルの方向性を数百時間かけてテストしてきました。このガイドは、その経験を凝縮した包括的なリファレンスです。私自身が始めた頃に欲しかったものを形にしました。初めてのプロンプトを作成する方も、可能性の限界に挑戦している方も、必要なテクニックはここにあります。

Midjourneyは魔法のようなプロンプト変換ツールではありません。特定のパターンに反応し、一定の階層構造を尊重し、そのアーキテクチャを理解した人に報いる、洗練されたビジュアル言語システムです。ありきたりなAIアートと、意図を持った印象的なイメージの違いは、これらのパターンを理解しているかどうかにあります。

重要なポイント:V7はプロンプトの仕組みを根本的に変えました。従来のキーワード羅列アプローチ(「beautiful, stunning, 8k, detailed, masterpiece」など)は、むしろ結果の質を下げてしまいます。V7は自然言語を理解します。ストックフォトにタグ付けするのではなく、熟練した映像監督に写真を説明するようにプロンプトを書いてください。

このガイドでは、最初のインストールから、ほとんどのユーザーが知らない高度なテクニックまで、すべてを網羅しています。各パラメータは実際の範囲、具体例、そして経験豊富なユーザーでもつまずきやすいエッジケースとともに解説しています。


目次

Part 1: 基礎編

  1. Midjourneyとは?
  2. はじめに
  3. 基本コンセプト
  4. プロンプトの階層構造

Part 2: パラメータをマスターする

  1. バージョン選択
  2. アスペクト比
  3. Stylization
  4. ChaosとWeird
  5. 実験的なアエステティクス

Part 3: リファレンスシステム

  1. Omni Reference
  2. Style Reference
  3. Image Weight
  4. Draft Mode

Part 4: 動画生成

  1. Image-to-Videoの基本
  2. 延長とループ
  3. 動画制作のベストプラクティス

Part 5: ジャンル別テンプレート

  1. シネマティックリアリズム
  2. ポートレート写真
  3. 商品写真
  4. ファンタジーとSF
  5. Niji 7でアニメ制作
  6. 建築
  7. 抽象・実験的表現

Part 6: 高度なテクニック

  1. ワードウェイト
  2. ネガティブプロンプト
  3. Seedコントロール
  4. 複数の被写体の構図
  5. テキストレンダリング

Part 7: ワークフローと最適化

  1. イテレーションループ
  2. コスト管理
  3. トラブルシューティング
  4. バージョン移行

Part 8: リファレンス

  1. パラメータチートシート
  2. 変更履歴

Midjourneyとは?

Midjourneyは、テキストの説明文から画像を生成するジェネレーティブAIシステムです。従来の画像編集やストックフォトとは異なり、見たいものを言葉で説明すると、Midjourneyがあなたのビジョンに合ったオリジナル画像を生成します。

Midjourneyの特徴:

特徴 Midjourney 競合他社
画質 業界トップクラスの美しさ ばらつきあり
自然言語理解 V7は完全な文章を理解 キーワード依存が多い
フォトリアリズム V7で卓越した表現 良好〜優秀
アニメ・イラスト Nijiモデルに最適化 汎用的
動画 ネイティブ対応(2025年6月〜) 別ツールが必要
コミュニティ 共有・発見機能を統合 サービスにより異なる

制作できるもの:

  • フォトリアリスティックな画像:ポートレート、商品、建築、自然
  • イラスト:コンセプトアート、ブックカバー、エディトリアル
  • アニメ・漫画:専用のNijiモデルで制作
  • 抽象アート:実験的、シュルレアリスティックな構図
  • 動画:画像から5〜21秒のアニメーションクリップを生成

Midjourneyではないもの:

  • 写真編集ツールではない(それにはPhotoshopを使用)
  • キャラクター一貫性システムではない(急速に改善中)
  • 特定の著作権キャラクターを再現するツールではない
  • 無料ではない(サブスクリプションは月額$10〜$120)

はじめに

アカウント設定

  1. アクセス midjourney.com
  2. サインイン Discordアカウントで、または新規アカウントを作成
  3. サブスクリプションを選択
プラン 価格 Fast GPU Relax GPU Video Relax
Basic $10/月 3.3時間
Standard $30/月 15時間 無制限
Pro $60/月 30時間 無制限 あり
Mega $120/月 60時間 無制限 あり

エキスパートのヒント: Standard($30/月)から始めることをお勧めします。無制限のRelax modeは実験に不可欠です。学習中はFast時間をすぐに使い切ってしまいます。

最初のプロンプト

midjourney.com/imagine のWebインターフェースを開いて、次のように入力します:

A golden retriever sitting in autumn leaves, soft afternoon sunlight

これだけです。特別な構文は必要ありません。V7は自然言語を理解します。

生成結果: 秋の風景の中にいるゴールデンレトリバーの4つのバリエーションが表示されます。ここから以下の操作ができます:

  • Upscale:U1〜U4をクリックして高解像度版を生成
  • Vary:V1〜V4をクリックして微妙なバリエーションを作成
  • Reroll:同じプロンプトで新しい4つのバリエーションを生成

Web vs Discord

機能 Webインターフェース Discord
使いやすさ より簡単 学習曲線がある
画像整理 内蔵ギャラリー チャンネルに散在
動画生成 フルサポート 利用不可
プロンプト編集 ビジュアルインターフェース テキストコマンド
コミュニティ Exploreタブ チャンネル閲覧
おすすめ ここから始めましょう パワーユーザー向け

現在はWebインターフェースがメインの体験です。Discordも使えますが、動画生成ができず、ワークフローも直感的ではありません。


基本コンセプト

プロンプトの仕組み

すべてのMidjourneyプロンプトはパイプラインで処理されます:

Your Text Prompt
      ↓
[Text Encoder] → Converts words to mathematical embeddings
      ↓
[Diffusion Model] → Generates image from noise, guided by embeddings
      ↓
[Upscaler] → Increases resolution and detail
      ↓
Final Image

これが意味すること:

  1. 単語の順序が重要:前の方にある単語は後の単語より影響力が大きい
  2. 具体性が勝つ:「golden hour sunlight casting long shadows」は「nice lighting」に勝る
  3. 矛盾は混乱を招く:「dark, bright, moody, cheerful」は互いに打ち消し合う
  4. 少ない方が良いことも多い:50〜150トークンは通常300+トークンより良い結果を出す

トークンエコノミー

Midjourneyはあなたの言葉を見ているのではなく、トークン(おおよそ単語の断片)を見ています。

トークン数 効果 最適な用途
10-30 非常に自由な解釈 抽象的、実験的
30-80 バランスの取れたコントロール ほとんどのプロンプト
80-150 詳細なコントロール 特定のシーン
150+ 収穫逓減 競合を引き起こす可能性

エキスパートのヒント: プロンプトが150トークンを超える場合、おそらく過剰に指定しています。形容詞の乱用を減らしましょう。

クオリティシグナル

V7は特定の記述パターンに強く反応します:

ライティング(最も影響大): - “golden hour light casting long shadows across weathered stone” - “Rembrandt lighting with soft fill from camera left” - “bioluminescent glow illuminating the fog”

素材とテクスチャ: - “oxidized copper with verdigris patina” - “worn leather showing decades of use” - “translucent jade catching the light”

雰囲気とムード: - “melancholic twilight atmosphere” - “oppressive industrial ambiance” - “ethereal dreamlike quality”

テクニカルなカメラ用語: - “shot on medium format, shallow depth of field” - “85mm lens, f/1.8 aperture” - “anamorphic lens flare, 2.39:1 aspect”


プロンプトの階層構造

効果的なプロンプトはすべて階層構造に従います。上位にある単語ほど影響力が大きくなります。

┌─────────────────────────────────────────────────┐
│  1. SUBJECT(誰/何を)          ← 最も重要      │
│     "elderly fisherman"                          │
├─────────────────────────────────────────────────┤
│  2. SUBJECT DETAILS(詳細な描写)               │
│     "weathered face, silver beard, kind eyes"   │
├─────────────────────────────────────────────────┤
│  3. CONTEXT(どこで/いつ)                      │
│     "on a wooden dock at dawn"                  │
├─────────────────────────────────────────────────┤
│  4. STYLE/MOOD(どんな雰囲気か)                │
│     "documentary photography, contemplative"     │
├─────────────────────────────────────────────────┤
│  5. TECHNICAL(カメラ/ライティング)            │
│     "shot on Leica, natural morning light"      │
├─────────────────────────────────────────────────┤
│  6. PARAMETERS(--ar、--sなど)  ← 微調整       │
│     "--ar 3:2 --s 100 --v 7"                    │
└─────────────────────────────────────────────────┘

プロンプトテンプレート

[SUBJECT] [SUBJECT DETAILS], [CONTEXT], [STYLE/MOOD], [TECHNICAL] --parameters

階層構造を適用した例:

An elderly fisherman with a weathered face and silver beard, standing on a
wooden dock at dawn, documentary photography style, contemplative mood,
shot on Leica M11 with natural morning light, soft mist rising from the water
--ar 3:2 --s 100 --v 7

多くのユーザーが見落としていること: 被写体ではなくスタイルから始めてしまう(「beautiful cinematic photo of…」など)。V7は前方のトークンを重視するため、実際に見たいものを先頭に置きましょう。


バージョン選択

V7(2025年6月よりデフォルト)

V7は2025年4月3日にリリースされた、Midjourneyの現行フラッグシップモデルです。2

強み: - 自然言語理解(キーワードではなく文章で書ける) - 過去最高のフォトリアリズム - 大幅に改善されたテキストレンダリング - 人体解剖学の向上(手、体) - 空間関係の改善 - パーソナライゼーションがデフォルトで有効

生成モード:

モード 速度 コスト 最適な用途
Turbo 最速 通常の2倍 時間が重要な最終レンダリング
Fast 通常 1倍 標準ワークフロー
Relax キュー待ち 含まれている 探索、学習
Draft 10倍速 0.5倍 高速イテレーション

V7を使うべき場面: - フォトリアリスティックな画像 - 複雑な自然言語を含むプロンプト - テキストレンダリング - 品質が最も重要な場合

Niji 7(2026年1月)

Niji 7は2026年1月9日にリリースされた、アニメ・漫画専用モデルです。3

強み: - クリスタルクリアな目と細部 - 複雑なポーズの一貫性向上 - より忠実なプロンプト解釈 - テキストレンダリングの改善 - --srefパフォーマンスの強化 - クリーンでフラットな線画の美学

制限事項: - --crefはサポートされていません—代替のcharacter referenceシステムを開発中 - パーソナライゼーション(--p)はまだ互換性なし—Moodboardsサポートは近日公開 - 以前のNijiバージョンより忠実—雰囲気重視のプロンプトは調整が必要

近日公開: - パーソナライズされたアニメ美学のためのMoodboardサポート - --crefに代わる新しいcharacter referenceシステム

使用例:

A determined young mage with crimson hair, casting fire magic,
intense expression, ancient library background --niji 7

Niji 7を使うべき場面: - アニメ・漫画スタイルのイラスト - キャラクターデザイン - 東洋的な美学のイラスト - よりクリーンな線画が欲しい場合

Niji 6(レガシー)

後方互換性のため引き続き利用可能です。

Niji 6を使うべき場面: - スタイルプリセットが必要な場合(--style expressive--style cute--style scenic) - ワークフローが--crefに依存している場合 - よりソフトで、忠実度の低い解釈を好む場合

スタイル:

--niji 6 --style expressive  # ダイナミック、スタイライズド
--niji 6 --style cute        # カワイイ美学
--niji 6 --style scenic      # 背景重視
--niji 6 --style original    # クラシックなNijiルック

バージョン比較

機能 V7 Niji 7 Niji 6
フォトリアリズム 優秀 N/A N/A
アニメ 良好 優秀 優秀
自然言語 最高 良好 中程度
テキストレンダリング 最高 良好 限定的
--oref あり なし なし
--cref なし なし あり
--sref あり あり(最高) あり
--p あり なし オプション
スタイルプリセット なし なし あり

V8開発状況(2026年Q1予定)

V8は現在開発中で、完全なアーキテクチャの書き換えを表しています。トレーニングは2025年後半に本格的に開始されました。6

期待される改善点: - テキストレンダリングの大幅な改善 - 複雑な被写体の生成向上(クリーチャー、ケンタウロス、特殊な解剖学) - 古いスタイルとの互換性問題を解消 - より良いデータセットと新しいアーキテクチャ - 「プロンプトレス」な制作への移行

タイムライン: - 2025年クリスマスにトレーニング実行 - V7.1ブリッジアップデートが先に予定(手/体の一貫性改善) - V8汎用画像モデルは2026年初頭に予定 - 専用の編集・動画モデルがその後に続く

V8が重要な理由: Midjourneyチームは、V7が期待された機能を完全には達成できなかったと述べており、V8はより革新的な機能を備えた「大きな違い」をもたらすとしています。


アスペクト比

--arパラメータで画像の寸法を設定します。デフォルトは1:1(正方形)です。

一般的な比率

比率 寸法 用途
1:1 正方形 SNS、アイコン
4:5 縦長 Instagramフィード、モバイル
5:4 横長 デスクトップ、プレゼンテーション
16:9 ワイドスクリーン YouTube、プレゼンテーション
9:16 縦長 ストーリーズ、TikTok、モバイル
21:9 ウルトラワイド シネマティック、映画
3:2 クラシック 写真プリント
2:3 縦長 縦向きプリント

プラットフォーム別の推奨

プラットフォーム 比率 備考
Instagramフィード 1:1または4:5 4:5の方が画面占有率が高い
Instagramストーリー 9:16 フル縦長
Twitter/X 16:9または1:1 16:9はフィードで展開される
LinkedIn 1.91:1または16:9 プロフェッショナルな横長
Pinterest 2:3 縦長が最もパフォーマンスが良い
YouTubeサムネイル 16:9 標準動画フォーマット
デスクトップ壁紙 16:9または21:9 モニターに合わせる

構図への影響

アスペクト比は単なる寸法ではありません。構図を根本的に変えます。

横長の比率(16:9、21:9): - 環境とコンテキストを強調 - 風景、都市景観に自然 - シネマティックな印象 - 被写体はシーンの一部になる

縦長の比率(4:5、9:16): - 被写体に注目を集中 - ポートレート、商品に自然 - 親密な印象 - より多くの縦方向の情報

エキスパートのヒント: シネマティックなポートレートには、定番の16:9ではなく4:5を試してみてください。ポートレートの被写体重視のフレーミングと、ストーリーテリングに十分なコンテキストの両方が得られます。


スタイライゼーション

--s パラメータは、V7が適用する芸術的解釈の度合いを制御します。範囲:0-1000。デフォルト:100。

スタイライゼーションの範囲

範囲 効果 最適な用途
0-50 最小限の解釈 商品写真、技術的な正確性
50-150 バランス型(デフォルト) 一般的な用途、ポートレート
150-300 目立つスタイル アーティスティックな写真、ムード表現
300-500 強いスタイル イラスト、コンセプチュアル
500-1000 非常にスタイライズ 抽象的、実験的

視覚的な例

Portrait of a woman, soft window light --s 50
# Midjourney プロンプトエンジニアリング:完全ガイド

Portrait of a woman, soft window light --s 250
# Result: More artistic interpretation, enhanced mood

Portrait of a woman, soft window light --s 600
# Result: Distinctly stylized, dreamlike quality

判断基準のフレームワーク

低いスタイライゼーション(0-100)を使用する場合: - 商品写真を作成する場合 - フォトリアリスティックな正確性が必要な場合 - 技術的/ドキュメント用画像 - プロンプトを文字通りに解釈させたい場合

中程度のスタイライゼーション(100-300)を使用する場合: - 一般的なクリエイティブワーク - エディトリアル写真 - 極端にならない程度の強調が必要な場合 - リアルとアーティスティックのバランスを取りたい場合

高いスタイライゼーション(300+)を使用する場合: - イラストやコンセプトアートを作成する場合 - 抽象的または実験的な作品 - Midjourneyの美学を前面に出したい場合 - クリエイティブな限界に挑戦したい場合

スタイライゼーション + Style Raw

最大限のフォトリアリズムを得るには、低いスタイライゼーションと --style raw を組み合わせます:

Portrait of a businessman, office background --s 50 --style raw --v 7

--style raw は、V7に独自の美的解釈を最小限に抑えるよう指示し、プロンプトにより忠実な結果を得られます。


Chaos と Weird

Chaos(–chaos 0-100)

生成される4枚の画像間のバリエーションを制御します。デフォルト:0。

効果
0 非常に似た出力
25 わずかなバリエーション
50 中程度の多様性
75 高い多様性
100 最大の予測不可能性

chaos を使用するタイミング: - 探索フェーズ--chaos 50-75 で多様な解釈を確認 - 最終レンダリング--chaos 0-25 で一貫した結果を得る - 方向性の発見:初期は高い chaos、洗練段階では低い chaos

Weird(–weird 0-3000)

型破りで予想外の美学を導入します。デフォルト:0。

範囲 効果
0 標準的な美学
100-500 微妙な個性
500-1000 目立つ奇妙さ
1000-2000 非常に特異
2000-3000 最大の奇妙さ

weird を使用するタイミング: - シュールまたは夢のような画像 - 一般的なAI美学から脱却したい場合 - コンセプトアートの探求 - 「普通」が予測可能すぎると感じる場合

Chaos と Weird の組み合わせ

--chaos 50 --weird 500   # Varied outputs, each slightly quirky
--chaos 100 --weird 0    # Wild variations, normal aesthetic
--chaos 25 --weird 2000  # Similar outputs, all very weird

上級者向けヒント: 高い weird は本当に独特な画像を生成できますが、一貫性がありません。探索には使用し、最終レンダリングでは控えめにしましょう。


実験的エステティクス

--exp パラメータは、ディテール、ダイナミクス、トーンマッピング効果を強化します。範囲:0-100。デフォルト:0。

効果レベル

効果 備考
0 オフ(デフォルト) 標準レンダリング
5 微妙な強調 他のパラメータとの組み合わせに安全
10 目立つディテール強化 良い出発点
25 強い効果 組み合わせ時の推奨最大値
50 非常に強い プロンプトの正確性が低下する可能性
100 最大 –stylize や –p を圧倒する可能性

–exp の効果

  • より詳細なテクスチャと表面
  • よりダイナミックでパンチのある構図
  • トーンマッピングされたHDRのような外観
  • 視覚的な興味の向上

推奨される組み合わせ

--exp 10 --s 200           # Enhanced detail, balanced style
--exp 25 --s 100           # Strong exp, controlled stylize
--exp 5 --style raw        # Subtle boost for photorealism

警告:パラメータの競合

高い値(25-50以上)では、--exp は以下の問題を引き起こす可能性があります: - --stylize 設定を圧倒する - パーソナライゼーション(--p)をオーバーライドする - 画像の多様性を低下させる

上級者向けヒント: ほとんどの作業では --exp を10-25に保ちましょう。高い値は一般的な品質向上ではなく、特定のスタイル効果のためのものです。


Omni Reference

--oref パラメータは、参照画像から被写体の特徴を生成画像に転送します。これはV7で --cref に代わるものです。

基本的な使用法

/imagine A woman in a red dress at a gala --oref [image URL]

転送される要素: - 顔と顔の特徴 - 体型とプロポーション - 服装とアクセサリー - 全体的なアイデンティティ

ウェイトコントロール(–ow)

--ow 0-1000    # Omni weight (default 100)
ウェイト 効果
0-30 緩やかなインスピレーション、スタイル変更を許容
30-60 中程度の影響
60-100 強い類似性(デフォルト範囲)
100-300 非常に近い一致
300-1000 最大の忠実度

ベストプラクティス

参照画像の品質が重要です: - 高解像度で、被写体が明確 - 顔の場合は正面写真が最適 - 参照画像の照明が一貫している - 背景の乱雑さを最小限に

スタイル変更のためのウェイト調整:

# Photo to anime conversion - lower weight
--oref [photo URL] --ow 40 --niji 7

# Maintaining strict likeness
--oref [photo URL] --ow 200 --v 7

スタイル参照との組み合わせ:

# Subject from one image, style from another
--oref [subject URL] --sref [style URL] --ow 100 --sw 150

Style Reference

--sref パラメータは、参照画像から美的特性を転送します。

基本的な使用法

/imagine A mountain landscape at sunset --sref [style image URL]

転送される要素: - カラーパレット - ライティングスタイル - 芸術的技法 - 全体的なムード/雰囲気 - 構図の傾向

ウェイトコントロール(–sw)

--sw 0-1000    # Style weight (default 100)
ウェイト 効果
0-50 微妙な影響
50-150 バランスの取れた転送
150-300 強いスタイル一致
300-1000 支配的なスタイル

複数のスタイル参照

複数のスタイル画像を組み合わせることができます:

--sref [url1] [url2]

スタイルがブレンドされます。独自の美的組み合わせを作成するために使用します。

ベストプラクティス

効果的な場合: - 特徴的で一貫したスタイル - 明確な美的特性 - 強いビジュアルアイデンティティを持つ画像

効果が低い場合: - 非常に一般的な写真 - 混在した、または不明確なスタイル - 「スタイル」が明確でない画像

上級者向けヒント: Niji 7は最も優れた --sref パフォーマンスを発揮します。スタイル転送が重要な場合、非アニメコンテンツでもNiji 7の使用を検討してください。

旧スタイル参照コードの使用

V6時代の --sref コードをお持ちの場合、V7では直接機能しません。レガシースタイルコードを使用するには --sv 4 を追加します:

/imagine A mountain landscape --sref 123456789 --sv 4
# --sv 4 tells V7 to interpret the code using V6 style system

注意: 後方互換性は維持されますが、新しいモデルでより良い結果を得るために、V7でスタイル参照を再生成することを検討してください。


Image Weight

--iw パラメータは、参照画像が生成にどの程度影響するかを制御します。

基本的な使用法

/imagine [prompt] [image URL] --iw 1.5

ウェイト範囲

範囲:0-2(デフォルト 1)

ウェイト 効果
0-0.5 プロンプトが優位
0.5-1 バランス型
1-1.5 画像が優位
1.5-2 強い画像影響

ユースケース

低ウェイト(0-0.5): プロンプトが支配的な状態で、画像を緩やかなインスピレーションとして使用

バランス型(0.5-1): プロンプトと画像からの影響が同等

高ウェイト(1.5-2): 画像に基づいたバリエーションを作成


Moodboards(カスタムスタイルプロファイル)

Moodboardsでは、画像を評価することでパーソナライズされたスタイルプロファイルを作成できます。単一の --sref 画像を使用する代わりに、複数の例から安定した美的嗜好を構築します。7

Moodboardsの仕組み

  1. ウェブインターフェースでmoodboardを作成
  2. 画像をアップロードして評価(いいね/よくない)してスタイルを学習させる
  3. --p で適用してデフォルトのmoodboardを使用
  4. --p [mID] で適用して特定のmoodboardを使用

安定したプロファイルの構築

評価数 安定性
10-20 初期の方向性が現れる
20-40 スタイルが一貫してくる
40+ 安定した信頼性のあるプロファイル

上級者向けヒント: 安定したmoodboardには少なくとも40枚の画像を評価しましょう。いいねと「よくない」の両方を含めてください—「よくない」はMidjourneyに何を避けるべきかを理解させるのに役立ちます。

Moodboardsの使用

/imagine A forest path at dawn --p
# Uses your default moodboard

/imagine A forest path at dawn --p abc123
# Uses specific moodboard with ID abc123

Moodboards vs Style Reference

アプローチ 最適な用途
--sref 単一画像からの一回限りのスタイル
--p(Moodboard) プロジェクト全体で一貫した個人的美学

Moodboardsと–srefのブレンド

両方を組み合わせて繊細なコントロールが可能です:

/imagine A portrait --p --sref [url] --sw 50
# Your moodboard aesthetic + subtle style reference influence

Draft Mode

Draft modeは、GPU コストの半分で10倍の速度で画像を生成します。探索に不可欠です。

Draft Modeの有効化

/imagine [prompt] --draft

またはウェブインターフェースの設定で切り替えます。

Draft vs Full の比較

項目 Draft Full
速度 約10倍高速 標準
GPU コスト 50% 100%
ディテール 低下 フル
最適な用途 探索 最終出力

Draft ワークフロー

1. Draft Mode Exploration (--draft)
   ├── Test 5-10 variations quickly
   ├── Identify promising directions
   └── Note effective parameters

2. Full Render Refinement
   ├── Remove --draft flag
   ├── Apply learned parameters
   └── Fine-tune with --seed

上級者向けヒント: 常にDraft modeから始めましょう。コスト削減が積み重なり、より多くのオプションを探索できます。コミットする価値のある方向性が見つかった場合にのみ、フルレンダリングに切り替えてください。


Image-to-Video の基本

MidjourneyのV1 Video Modelは2025年6月19日にローンチされ、画像からビデオへのアニメーション化が可能になりました。

仕組み

  1. 任意の画像を選択(Midjourney生成またはアップロード)
  2. 「Animate」ボタンをクリック
  3. オプションを選択(Auto、Manual、Loop)
  4. 5秒のビデオクリップを生成

モーションパラメータ

--motion low    # Still scenes, slow motion, subtle movement (default)
--motion high   # Big camera motions, larger character movements
--raw           # Reduces creative flair, more prompt control

モーションの比較

設定 効果 最適な用途
Low 繊細で映画的な動き ポートレート、静物、雰囲気
High ダイナミックでエネルギッシュな動き アクション、風景、群衆

警告: 高いモーションは非現実的またはグリッチのある動きを生成する可能性があります。lowから始めて、必要な場合のみ上げてください。

コストとプラン

  • ビデオジョブは画像ジョブの約8倍のコスト
  • 各ジョブで4つの5秒ビデオを生成
  • ウェブインターフェースでのみ利用可能(Discordでは不可)
プラン Fast Mode Video Relax Mode Video
Basic 不可
Standard 不可
Pro
Mega

HD Video Mode

HD Video mode(2025年8月ローンチ)は4倍シャープな解像度を提供し、ピクセル密度が4倍になることで劇的にビデオ品質が向上します。8

HD Videoの使用方法: 1. まず標準ビデオを生成 2. 完成したビデオのHDオプションをクリック 3. 高解像度レンダリングを待つ

HD Videoのコスト: - 標準ビデオの約3.2倍のコスト - ProおよびMegaプランでのみ利用可能 - 最初に標準ビデオが必要(直接HD生成は不可)

モード 解像度 相対コスト
Standard(SD) ベース 1x
High Definition(HD) 4倍ピクセル 約3.2x

HDを使用するタイミング: - 最終納品アセット - 大型ディスプレイやプロジェクション - プロフェッショナル/商業用途 - 動きの中でディテールが重要な場合

上級者向けヒント: 常にSDでテストしてください。HDは時間とコストがかかります—最高のクリップのみアップグレードしましょう。


エクステンドとループ

ビデオの延長

任意のビデオを追加で4秒延長でき、最大4回まで(最大21秒)可能です。

延長オプション: - Auto:自動的にビデオを続行 - Manual:延長前にプロンプトを調整

延長のベストプラクティス: - 開始前にナラティブアークを計画する - 最初の5秒でシーンを確立する - 各延長には目的を持たせる - ペーシングを考慮—21秒は思ったより長い

ループの作成

Loopオプションは、最初と最後のフレームが一致するシームレスなループビデオを作成します。

Select image → Click "Loop" → Generate

最適な用途: - 背景アニメーション - ソーシャルメディアコンテンツ - アンビエントビジュアル - シネマグラフ

より良いループのためのヒント: - シンプルで繰り返し可能な動きが最適 - 複雑なカメラ移動を避ける - 大気の要素(雲、水、炎)は自然にループする


ビデオのベストプラクティス

ビデオを使用するタイミング

ビデオに適した候補: - 大気のあるシーン(霧、雨、炎) - 微妙な動き(髪、布、水) - 環境の動きがある風景 - 最小限の動きのポートレート

ビデオにあまり適さない場合: - 複雑なアクションシーケンス - 複数キャラクターのシーン - 精密な振り付け - 技術的な正確性の要件

ビデオ向けの最適化

アニメーション化する前に: 1. まず完璧な静止画を生成する 2. 要素がどのように動くかを考慮する 3. 複雑で相互接続された被写体を避ける 4. シンプルな構図の方がアニメーション化しやすい

プロンプトの調整:

# Good for video
Lone figure standing on cliff edge, wind blowing cape, dramatic clouds

# Less ideal for video
Group of dancers in synchronized formation, precise movements

コスト管理

画像コストの8倍で、ビデオはすぐに高額になります:

コスト効率の良いワークフロー: 1. Draft mode(画像)で探索 2. 完璧な構図を見つける 3. 最終的な高品質静止画を生成 4. 最高のバージョンのみをアニメーション化 5. 必要な場合のみ延長


シネマティックリアリズム

フォトリアリスティックでシネマティックな結果を得るための最も効果的なパターンです。

シネマティックテンプレート

[Shot type] by [Director], [subject physical description],
[action/pose], [costume/styling], [setting details],
captured with [Camera Body] using [Lens], [lighting description],
[mood/atmosphere summary]
--ar [ratio] --s [value] --p --no anime, cartoon, illustration, painting

監督スタイル

監督 ビジュアルスタイル 最適な用途
Ridley Scott 大気的、テクスチャ豊か、ムーディー SF、時代劇、クローズアップ
Denis Villeneuve 壮大なスケール、荒涼とした、幾何学的 風景、ワイドショット
David Fincher ダーク、精密、不穏 スリラー、ムーディーなポートレート
Roger Deakins シルエット、自然光、詩的 ライティング重視のあらゆるショット
Alfonso Cuarón 没入感、親密、トラッキング キャラクターの瞬間、緊張感
Wes Anderson シンメトリカル、パステル、風変わり スタイライズド、センター構図
Christopher Nolan IMAXスケール、実写、インテンス アクション、建築
Terrence Malick ゴールデンアワー、幻想的、自然 風景、瞑想的

カメラボディリファレンス

カメラ 美学 最適な用途
RED Komodo モダンデジタルシネマ クローズアップ、ナラティブ
ARRI ALEXA フィルムライク、リッチな色彩 シネマ全般
ARRI Alexa Mini ALEXAと同様、小型 ドキュメンタリー、ハンドヘルド
ARRI ALEXA 65 ラージフォーマット、壮大 風景、IMAX感
RED V-Raptor 8K、シャープ、ダイナミック アクション、高精細
Sony Venice フルフレーム、汎用性 低照度、アナモルフィック
Hasselblad 中判、ラグジュアリー ポートレート、ファッション
Leica M レンジファインダー、クラシック ストリート、ドキュメンタリー

レンズの組み合わせ

焦点距離 効果 最適な用途
24mm f/1.4 ワイド、環境的 風景、エスタブリッシング
35mm f/2.0 ナチュラル、汎用的 ドキュメンタリー、ストリート
50mm f/1.4 クラシック、バランス 汎用
85mm f/1.8 ポートレート、浅い被写界深度 クローズアップ、ポートレート
105mm f/2.0 圧縮、親密 ヘッドショット
135mm f/2.0 最大圧縮 タイトなポートレート

シネマティックの完全な例

クローズアップポートレート:

Dramatic close-up portrait by Ridley Scott, young woman with pale skin
and auburn hair, intense green eyes staring directly at camera, subtle
freckles across nose, wearing dark wool coat, rain falling around her
face, captured with RED Komodo using 85mm f/1.8 lens, cold blue-silver
lighting with warm practical rim light, melancholic determined atmosphere
--ar 4:5 --s 150 --p --no anime, cartoon, illustration, painting

ワイドシネマティック:

Epic wide shot by Denis Villeneuve, lone figure in orange survival suit
walking across endless salt flats, geometric patterns in dried earth,
massive dust storm approaching on horizon, captured with ARRI ALEXA 65
using 24mm f/2.0 lens, harsh afternoon sun creating stark shadows,
desolate apocalyptic atmosphere
--ar 21:9 --s 200 --p --no anime, cartoon, illustration, painting

重要: 俳優名は絶対に使用しないでください。人物は身体的特徴で説明します。「Emma Stone」ではなく「Young woman with pale skin and auburn hair」と記述してください。俳優名を使用すると不気味の谷効果が生じます。


ポートレート写真

ライティングパターン

パターン 効果 セットアップ
Rembrandt ドラマティック、クラシカル キーライト45°サイド、目の下に三角形を作る
Butterfly グラマラス、フラッタリング キーライトを上方前方に
Split ドラマティック、ミステリアス 真横からの光
Rim/Edge 分離、奥行き 背後からの光
Loop 繊細な影 Rembrandtからやや角度をつける

ポートレートテンプレート

[Subject description], [expression/emotion], [pose],
[lighting pattern] lighting, shallow depth of field,
[background description], shot on [camera] with [lens]
--ar 4:5 --s 100 --v 7

ポートレートの例

環境ポートレート:

Middle-aged craftsman with salt-and-pepper beard, focused expression,
hands working on leather saddle, Rembrandt lighting from workshop window,
shallow depth of field, blurred tool-filled background, shot on
Hasselblad with 80mm f/1.9, documentary authenticity
--ar 4:5 --s 75 --style raw --v 7

スタジオポートレート:

Professional woman in her 30s, confident subtle smile, shoulders
turned slightly, butterfly lighting with soft fill, pure white
seamless background, shot on Phase One with 110mm f/2.8, clean
commercial aesthetic
--ar 4:5 --s 50 --v 7

プロダクトフォトグラフィー

プロダクトテンプレート

[Product] on [surface/platform], [background style],
[lighting setup], commercial photography, high detail,
[brand aesthetic description]
--ar 1:1 --s 50 --v 7 --style raw

サーフェスと背景のオプション

サーフェス: - ポリッシュドマーブル(ラグジュアリー) - ローコンクリート(インダストリアル) - ナチュラルウッド(オーガニック) - ブラッシュドメタル(テック) - カラーアクリル(モダン)

背景: - グラデーション(スムーズな遷移) - シームレス(単色) - コンテクスチュアル(使用シーン) - アブストラクト(アーティスティック)

プロダクトの例

ラグジュアリーコスメティック:

Minimalist perfume bottle with gold cap on polished black marble surface,
gradient background from deep purple to black, dramatic rim lighting with
soft front fill, commercial photography, high detail, premium luxury
aesthetic, subtle reflections on marble
--ar 1:1 --s 25 --v 7 --style raw

テックプロダクト:

Wireless earbuds case open showing earbuds inside, floating on
pure white seamless background, soft even lighting from all sides,
commercial product photography, high detail, clean Apple-style
minimalism, subtle shadow beneath
--ar 1:1 --s 50 --v 7 --style raw

ファンタジーとSF

ファンタジーテンプレート

[Character/scene description], [fantasy world details],
[magical elements], [lighting style],
[art style: painterly | concept art | illustration],
[artist influence if applicable]
--ar 16:9 --s 500 --weird 100 --v 7

ファンタジーの例

エピックファンタジー:

Ancient elven queen seated on crystalline throne in vast cavern hall,
iridescent robes flowing with captured starlight, bioluminescent
flowers floating around her, massive glowing runes carved into
obsidian walls, ethereal volumetric lighting, painterly fantasy
illustration influenced by Craig Mullins and Alphonse Mucha
--ar 16:9 --s 600 --weird 150 --v 7

ダークファンタジー:

Battle-scarred knight in tarnished armor standing in ruined cathedral,
sword planted in cracked stone floor, pale moonlight streaming through
shattered rose window, crows circling above, mist swirling at feet,
dark atmospheric concept art, Beksinski and Zdzisław influence
--ar 16:9 --s 400 --weird 200 --v 7

SFテンプレート

[Subject/scene], [technology details], [environment],
[lighting: neon | holographic | industrial | sterile],
[aesthetic: cyberpunk | hard sci-fi | retro-futurism],
[mood description]
--ar 21:9 --s 300 --v 7

SFの例

サイバーパンク:

Solo mercenary in worn tactical gear navigating rain-soaked neon alley,
holographic advertisements flickering overhead, steam rising from
street grates, distant megastructures visible through smog, cyan and
magenta neon reflections on wet pavement, Blade Runner cyberpunk
aesthetic, oppressive urban atmosphere
--ar 21:9 --s 350 --v 7

ハードSF:

Interior of generation ship agricultural bay, massive cylindrical
space with terraced farms curving overhead, artificial sun strip
running along central axis, workers in utilitarian jumpsuits tending
crops, visible structural engineering, hard science fiction aesthetic,
The Expanse influence, functional yet beautiful
--ar 21:9 --s 250 --v 7

Niji 7によるアニメ

Niji 7の特徴

Niji 7は、改善された線画と共に、よりクリーンでフラットなアートワークを生成します。以前のバージョンよりもプロンプトをより文字通りに解釈します。

Niji 7テンプレート

[Character description], [pose/action], [expression],
[setting/background], [specific style notes],
[color palette]
--niji 7 --ar [ratio]

Niji 7の例

アクションシーン:

Young mage with flowing crimson hair and determined golden eyes,
casting powerful fire spell with both hands raised, intense focused
expression, ancient library crumbling around her, debris floating
in magical energy, dynamic diagonal composition, warm orange and
red color palette with cool blue shadows
--niji 7 --ar 3:4

キャラクターポートレート:

Elegant noblewoman with silver hair in elaborate updo, wearing dark
blue Victorian-inspired gown with gold embroidery, subtle knowing
smile, half-body portrait, ornate palace balcony background with
moonlit garden visible, soft romantic atmosphere, detailed lace
and fabric textures
--niji 7 --ar 4:5

Niji 7でのスタイルトランスファー

Niji 7は最高の--srefパフォーマンスを発揮します:

[Your prompt] --niji 7 --sref [style image URL] --sw 150

--sw 150から始めて調整します: - 低め(50-100):繊細な影響 - 高め(200-300):強いスタイルマッチング

Niji 6からの移行

Niji 6のアプローチ:

anime girl, beautiful, detailed eyes, colorful --niji 6 --style expressive

Niji 7のアプローチ:

Young woman with vibrant teal hair and large expressive amber eyes,
wearing casual summer dress, cheerful smile, urban cafe background,
afternoon sunlight, contemporary anime style
--niji 7

主な変更点: - キーワードリストではなく、完全な説明を書く - より文字通りに、具体的に - スタイルプリセットは存在しない—欲しいものを説明する - 一貫したスタイルには--srefを使用


建築

建築テンプレート

[Building/space type], [architectural style],
[time of day/lighting], [weather/atmosphere],
[perspective: eye-level | aerial | interior | detail],
architectural photography, clean lines
--ar 16:9 --s 150 --v 7 --style raw

建築スタイル

スタイル 特徴 キーワード
ブルータリスト 打ちっ放しコンクリート、巨大、幾何学的 Exposed concrete, monolithic
ミニマリスト クリーンなライン、白、スパース Negative space, pure forms
アールデコ 装飾的、幾何学的、豪華 Gold accents, sunburst patterns
ゴシック 尖頭アーチ、垂直、ドラマティック Flying buttresses, rose windows
日本建築 木、紙、自然との調和 Shoji screens, engawa, zen
パラメトリック 流動的、コンピュテーショナル、有機的 Zaha Hadid, algorithmic curves

建築の例

ブルータリスト:

Brutalist concrete museum interior with dramatic skylights, afternoon
sun creating strong geometric shadows on exposed concrete walls, vast
empty gallery space with single sculpture, eye-level perspective
showing depth and scale, architectural photography by Hélène Binet
--ar 16:9 --s 100 --v 7 --style raw

パラメトリック:

Futuristic parametric architecture concert hall exterior, flowing white
curves inspired by Zaha Hadid, blue hour lighting with building interior
warmly illuminated, long exposure car light trails on surrounding roads,
wide establishing shot, architectural photography
--ar 16:9 --s 150 --v 7

アブストラクトと実験的表現

アブストラクトテンプレート

[Concept/emotion to express], [visual elements],
[color palette], [texture/material qualities],
[movement/energy description], abstract composition
--s 750 --weird 500 --chaos 50 --v 7

アブストラクトの例

エモーショナルアブストラクト:

The feeling of nostalgia dissolving into hope, fragmented memories
reforming as light, soft blues transitioning to warm amber, watercolor
textures bleeding into geometric shapes, gentle upward movement,
abstract emotional landscape
--ar 1:1 --s 800 --weird 750 --chaos 40 --v 7

テクスチュラルアブストラクト:

Microscopic landscape of oxidized copper and crystalline salt
formations, verdigris greens and rust oranges, extreme macro detail,
mineral textures catching diffused light, abstract geological patterns
--ar 1:1 --s 500 --weird 300 --v 7

境界を押し広げる

真に実験的な作品のために: - --weirdを1000以上に上げる - --chaos 75+と組み合わせる - 抽象的で感情的な言葉を使う - 型破りなアーティストを参照する

The architecture of forgotten dreams, impossible geometries folding
through chromatic space, Escher meets Kandinsky, synesthetic color
relationships, visual music
--ar 1:1 --s 1000 --weird 2000 --chaos 75 --v 7

ワードウェイティング

::構文を使用して、特定の要素への強調をコントロールします。

構文

word::2      # 2倍の強調
word::1.5    # 50%増しの強調
word::1      # 通常(デフォルト)
word::0.5   # 半分の強調
word::-1     # ネガティブ(回避)

ethereal::2 portrait of a warrior, dramatic lighting::1.5, mist::0.5

このプロンプトでは: - etherealな品質を強く強調 - ドラマティックなライティングを適度に強調 - ミストの存在を抑制

ウェイティングを使うタイミング

有用な場面: - 要素のバランスの微調整 - 望ましくない解釈の抑制 - 重要な特徴の強調

避けるべき場面: - 最初のドラフトの探索時 - ウェイティングなしで機能するシンプルなプロンプト - 何を強調すべきか分からないとき

エキスパートのヒント: ワードウェイティングは最初のステップではなく、調整ツールです。まず基本的なプロンプトを機能させてから、ウェイティングで微調整します。


ネガティブプロンプト

--noパラメータは、生成から要素を除外します。

基本的な使い方

/imagine Beautiful landscape --no people, text, watermark

効果的なネガティブ

目的 ネガティブ
フォトリアリズム --no anime, cartoon, illustration, painting, drawing
クリーンな画像 --no text, watermark, signature, frame, border
自然な見た目 --no oversaturated, HDR, artificial
シリアスなトーン --no cute, chibi, kawaii
シンプルな構図 --no busy, cluttered, crowded

ベストプラクティス

推奨: - 具体的で明確な用語を使用する - 出力で実際に発生している問題に対処する - リストを絞る(3〜5項目)

非推奨: - 望まないものすべての網羅的なリストを作成する - 曖昧な用語を使用する(「bad」、「ugly」) - そもそも現れにくいものを否定する

シネマティックネガティブ

一貫したフォトリアリスティックな結果のために:

--no anime, cartoon, illustration, painting, drawing, sketch, CGI, 3D render

シードコントロール

シードは再現性と制御された変化を可能にします。

基本的な使い方

/imagine [prompt] --seed 12345

同じプロンプト + 同じシード = 非常に類似した出力。

シードの確認方法

生成後、画像情報をクリックして使用されたシードを確認します。再現のためにメモしておきましょう。

シードワークフロー

バリエーションワークフロー: 1. ランダムシードで生成 2. 気に入った結果を見つける 3. シードをメモ 4. 同じシードで小さなプロンプト変更 5. バリエーションを比較

バッチの一貫性:

Scene in morning light --seed 54321
Scene in afternoon light --seed 54321
Scene in evening light --seed 54321

関連するプロンプト間で同じシードを使用すると、より一貫した構図が得られます。


マルチサブジェクト構図

複数の被写体を含む複雑なシーンでは、慎重なプロンプト構成が必要です。

階層アプローチ

重要度の順に被写体を並べます:

[Primary subject], [secondary subject], [tertiary subject],
[their relationship/interaction], [setting], [style]

空間的な言葉

明確な空間記述子を使用します:

In the foreground, [subject A]
In the middle ground, [subject B]
In the background, [subject C]

または:

On the left, [subject A]
In the center, [subject B]
On the right, [subject C]

Elderly grandmother and young granddaughter baking together in
sunlit kitchen, grandmother guiding child's hands rolling dough,
flour dusting the wooden counter, warm afternoon light from window,
vintage kitchen appliances in background, intimate family moment,
documentary photography style
--ar 3:2 --s 100 --v 7

テキストレンダリング

V7では画像内のテキストレンダリングが大幅に改善されました。

ベストプラクティス

テキストは短く: - 単語1つが最も効果的 - 短いフレーズ(2〜4語)は通常うまくいく - 長い文章は失敗することが多い

引用符を使用:

Neon sign reading "OPEN" in storefront window

タイポグラフィを指定:

Vintage poster with "JAZZ NIGHT" in art deco typography

テキストの例

看板:

Rainy city street at night, neon diner sign reading "EAT" glowing
red through rain-streaked window, film noir atmosphere
--ar 16:9 --s 150 --v 7

タイポグラフィ:

Minimalist book cover design, large serif typography reading "THE END"
centered on cream paper texture, literary fiction aesthetic
--ar 2:3 --s 100 --v 7

制限事項

テキストレンダリングは以下の場合にまだ苦手です: - 長い文章 - 複雑なフォント - 複雑な画像内の小さなテキスト - 複数のテキスト要素

上級者向けヒント: テキストが重要な場合は、テキストなしで画像を生成し、後処理でタイポグラフィを追加してください。


イテレーションループ

Midjourneyのプロフェッショナルワークフロー:

フェーズ1:探索(Draft Mode)

1. Enable Draft mode (--draft)
2. Write basic prompt with core concept
3. Generate 4-8 batches quickly
4. Identify promising directions
5. Note what works/doesn't

目標: 方向性を見つけること、完璧さではありません。スピードが重要です。

フェーズ2:絞り込み

1. Disable Draft mode
2. Take best concepts from Phase 1
3. Add specific details
4. Adjust parameters (--s, --chaos, etc.)
5. Generate in Fast mode
6. Compare variations

目標: 2〜3つの強力な選択肢に絞り込む。

フェーズ3:仕上げ

1. Select best candidate
2. Note the seed
3. Make micro-adjustments to prompt
4. Use same seed for consistency
5. Upscale final choice

目標: 最終候補を磨き上げる。

時間配分

フェーズ 時間 モード
探索 60% Draft
絞り込み 30% Fast
仕上げ 10% Fast

ほとんどのユーザーはこれを逆にして、最初の試みを完璧にすることに時間をかけすぎています。もっと探索し、仕上げは少なく。


コスト管理

GPU時間の理解

  • Fast Mode:サブスクリプションのGPU時間を使用
  • Relax Mode:無制限だがキュー待ち(Standard以上のプラン)
  • Draft Mode:通常の半分のGPUコスト
  • Video:画像の約8倍のコスト

サブスクリプションの価値

プラン Fast時間 Relax Video Relax $/GPU時間
Basic 3.3時間 なし なし $3.03
Standard 15時間 あり なし $2.00
Pro 30時間 あり あり $2.00
Mega 60時間 あり あり $2.00

ポイント: Standard以上のプランはGPU時間あたりのコストパフォーマンスが良く、さらに無制限のRelaxが使えます。

コスト節約戦略

  1. Draft modeで探索 - 半分のコスト、10倍速い
  2. 探索にRelaxを使用 - 無料(Standard以上)
  3. Fastは最終版に - 品質が重要なときだけ
  4. 類似プロンプトをまとめる - 単発より効率的
  5. 生成前に計画 - 考えてから生成

使用量の見積もり

アクション おおよそのGPU分
4枚の画像(standard) 約1分
4枚の画像(draft) 約0.5分
Upscale 約0.5分
Video(4本×5秒) 約8分

トラブルシューティング

よくある問題

問題 原因 解決策
顔がぼやける 低い–sまたはスタイルの競合 --style rawを使用、ディテールプロンプトを増やす
アスペクト比が違う デフォルト1:1 --arを明示的に指定
芸術的すぎる 高い–s 50-100に下げる
リテラルすぎる 低い–s 200以上に上げる
出力が不安定 低いchaos --seedで一貫性を確保
スタイルが強すぎる 高い–sw --swの重みを減らす
テキストが表示されない V7の制限 テキストを短く、引用符を使用
手がおかしい AIの制限 切り抜くか再生成

パラメータの競合

組み合わせを避ける: - --style raw + 高い--s(矛盾する) - --v 7 + --niji(どちらか1つを選ぶ) - 100%重みの複数の強いリファレンス - --exp 50+ + --stylize(expが圧倒する) - --exp 50+ + --p(expが上書きする)

相性が良い: - --oref + --srefを適度な重みで - --chaos + --seed(多様だが再現可能) - --style raw + 低い--s(最大のフォトリアリズム) - --exp 10-25 + --s 100-200(強化されつつ制御)

何をやってもうまくいかないとき

  1. シンプルにする - パラメータを削除、プロンプトを短く
  2. 分割する - 被写体とスタイルを別々に試す
  3. シードを探す - たくさん生成し、良いシードを見つけて反復
  4. リファレンスを使う - 目標を示す画像で--srefを使用
  5. バージョンを変える - 別のモデルバージョンを試す

バージョン移行

V6からV7への移行

旧V6スタイル:

portrait, beautiful woman, dramatic lighting, 8k, detailed, masterpiece

新V7スタイル:

A contemplative portrait of a woman in her 30s, Rembrandt lighting
casting gentle shadows across her face, medium format photography
aesthetic with shallow depth of field

主な変更点

項目 V6 V7
プロンプトスタイル キーワード 自然言語
品質ワード 効果あり ほぼ無視される
キャラクターref --cref --oref
パーソナライゼーション オプション デフォルト
デフォルト動作 スタイライズ よりリテラル

やめるべきこと

  • キーワードの羅列(”beautiful, stunning, amazing”)
  • 品質修飾子(”8k, ultra detailed, masterpiece”)
  • --crefの使用(今は--oref
  • 短いカンマ区切りのプロンプト

始めるべきこと

  • 完全な文章を書く
  • 欲しいものではなく、見えるものを描写する
  • ライティング、素材、ムードを具体的に
  • カメラ/レンズの用語を使用
  • パーソナライゼーション(--p)を活用

パラメータチートシート

MODELS
--v 7           Default, best overall (June 2025)
--niji 7        Anime/manga (Jan 2026, best coherence)
--niji 6        Anime/manga (legacy, has --style options)
--draft         Fast iteration, 10x faster, half cost

ASPECT
--ar 16:9       Widescreen
--ar 21:9       Cinematic ultrawide
--ar 4:5        Portrait (Instagram)
--ar 9:16       Vertical (Stories)
--ar 1:1        Square
--ar 3:2        Classic photo
--ar 2:3        Portrait print

STYLE
--s 0-100       Photorealistic
--s 100-300     Balanced
--s 300-1000    Artistic
--style raw     Minimal AI interpretation
--p             Apply personalization (V7 default)

EXPERIMENTAL
--exp 0-100     Enhanced detail (10-25 sweet spot)
--chaos 0-100   Output variety
--weird 0-3000  Unconventional aesthetics

REFERENCES
--oref [url]    Subject/character (V7)
--ow 0-1000     Omni weight (default 100)
--sref [url]    Style transfer
--sw 0-1000     Style weight (default 100)
--iw 0-2        Image weight (default 1)

VIDEO (Web only)
--motion low    Subtle movement (default)
--motion high   Dynamic movement
--raw           More prompt control

QUALITY
--q 1           Full quality (default)
--seed [num]    Reproducibility

NEGATIVE
--no [items]    Exclude elements

変更履歴

日付 変更内容 出典
2026-01-20 HD Videoモードセクションを追加(4倍解像度、約3.2倍コスト、Pro/Megaのみ) 8
2026-01-17 V8開発状況、Moodboardsセクション、レガシーsrefコード用–sv 4を追加 Webスキャン
2026-01-16 V7.1ロードマップ情報を追加、Niji 7カバレッジを確認 Webスキャン
2026-01-13 V7、Niji 7、ビデオカバレッジでガイド作成 複数
2026-01-09 Niji 7リリース(コヒーレンス改善) 3
2025-06-19 V1 Video Modelリリース 4
2025-06-17 V7がデフォルトモデルに 2
2025-04-30 V7アップデート:–expパラメータ、エディター改善 5
2025-04-03 V7リリース 2

参考文献


  1. Midjourney Updates. 公式変更履歴とお知らせ。 

  2. Midjourney Version Documentation. 「Version 7は2025年4月3日にリリースされ、2025年6月17日にデフォルトモデルになりました。」 

  3. Niji V7 Announcement. 「Niji V7が公開されました」- 2026年1月9日。 

  4. V1 Video Model. 2025年6月19日にビデオ生成がリリース。 

  5. V7 Update, Editor, and –exp. 2025年4月30日のアップデート詳細。 

  6. V8 Development Discussion. V8のトレーニングとDavid HolzのQ&Aからのロードマップ詳細に関するコミュニティディスカッション。 

  7. Moodboards Feature. Moodboardsと画像評価によるMidjourneyパーソナライゼーション。 

  8. HD Video Mode. 「HD Videoモードは4倍シャープなAI生成クリップを提供…SDの約3.2倍のコスト。」2025年8月。