AI Image Generation

Midjourney Prompt Engineering: Der vollständige Leitfaden

4579 words 23 min read Updated 2026-02-04

Aktualisiert am 20. Januar 2026

Update Januar 2026: Midjourney V7 ist jetzt das Standardmodell mit deutlich verbessertem natürlichem Sprachverständnis, Fotorealismus und Textdarstellung. Niji 7 wurde am 9. Januar 2026 mit erheblichen Verbesserungen der Kohärenz für Anime-Inhalte veröffentlicht. Die Videogenerierung (V1) ermöglicht 5-21 Sekunden lange Clips aus jedem Bild. Der Parameter --exp fügt verbesserte Details und Dynamik hinzu. Neu: Moodboards ermöglichen die Erstellung benutzerdefinierter Stile aus hochgeladenen Bildern, die mit --sref kombiniert werden können. V7.1 kommt mit verbesserter Hand- und Körperkohärenz. V8 befindet sich in aktiver Entwicklung—eine komplette Neuentwicklung mit neuer Architektur, erwartet im ersten Quartal 2026.1

Ich habe Hunderte von Stunden damit verbracht, Midjourney über alle Versionen, Parameterkombinationen und Stilrichtungen hinweg zu testen. Dieser Leitfaden destilliert diese Erfahrung in die umfassende Referenz, die ich mir gewünscht hätte, als ich anfing. Ob Sie Ihren ersten Prompt erstellen oder die Grenzen des Möglichen ausloten—die Techniken finden Sie hier.

Midjourney ist kein magischer Prompt-zu-Bild-Konverter. Es ist ein ausgeklügeltes visuelles Sprachsystem, das auf bestimmte Muster reagiert, bestimmte Hierarchien respektiert und diejenigen belohnt, die seine Architektur verstehen. Der Unterschied zwischen generischer KI-Kunst und atemberaubenden, intentionalen Bildern liegt im Verständnis dieser Muster.

Die wichtigste Erkenntnis: V7 hat die Funktionsweise von Prompts grundlegend verändert. Der alte Keyword-Ansatz („beautiful, stunning, 8k, detailed, masterpiece”) verschlechtert Ihre Ergebnisse aktiv. V7 versteht natürliche Sprache—schreiben Sie Prompts, als würden Sie einem erfahrenen Kameramann ein Foto beschreiben, nicht als würden Sie eine Stockfoto-Datenbank taggen.

Dieser Leitfaden behandelt alles von der ersten Installation bis hin zu fortgeschrittenen Techniken, die die meisten Benutzer nie entdecken. Jeder Parameter ist mit tatsächlichen Wertebereichen, echten Beispielen und den Grenzfällen dokumentiert, die selbst erfahrene Benutzer stolpern lassen.


Inhaltsverzeichnis

Teil 1: Grundlagen

  1. Was ist Midjourney?
  2. Erste Schritte
  3. Kernkonzepte
  4. Die Prompt-Hierarchie

Teil 2: Parameter-Beherrschung

  1. Versionsauswahl
  2. Seitenverhältnisse
  3. Stilisierung
  4. Chaos und Weird
  5. Experimentelle Ästhetik

Teil 3: Referenzsysteme

  1. Omni Reference
  2. Style Reference
  3. Image Weight
  4. Draft Mode

Teil 4: Videogenerierung

  1. Image-to-Video Grundlagen
  2. Verlängern und Loopen
  3. Video Best Practices

Teil 5: Genre-Vorlagen

  1. Filmischer Realismus
  2. Porträtfotografie
  3. Produktfotografie
  4. Fantasy und Sci-Fi
  5. Anime mit Niji 7
  6. Architektur
  7. Abstrakt und Experimentell

Teil 6: Fortgeschrittene Techniken

  1. Wortgewichtung
  2. Negative Prompts
  3. Seed-Kontrolle
  4. Multi-Subjekt-Komposition
  5. Textdarstellung

Teil 7: Workflows und Optimierung

  1. Der Iterationszyklus
  2. Kostenmanagement
  3. Fehlerbehebung
  4. Versionsmigration

Teil 8: Referenz

  1. Parameter-Spickzettel
  2. Änderungsprotokoll

Was ist Midjourney?

Midjourney ist ein generatives KI-System, das Bilder aus Textbeschreibungen erstellt. Anders als bei traditioneller Bildbearbeitung oder Stockfotografie beschreiben Sie, was Sie sehen möchten, und Midjourney generiert Originalbilder, die Ihrer Vision entsprechen.

Was Midjourney besonders macht:

Aspekt Midjourney Mitbewerber
Bildqualität Branchenführende Ästhetik Variabel
Natürliche Sprache V7 versteht vollständige Sätze Oft schlüsselwortabhängig
Fotorealismus Außergewöhnlich mit V7 Gut bis ausgezeichnet
Anime/Illustration Niji-Modelle optimiert Universell einsetzbar
Video Native Unterstützung (Juni 2025) Erfordert separate Tools
Community Integriertes Teilen/Entdecken Unterschiedlich

Was Sie erstellen können:

  • Fotorealistische Bilder: Porträts, Produkte, Architektur, Natur
  • Illustrationen: Concept Art, Buchcover, Editorial
  • Anime und Manga: Über spezialisierte Niji-Modelle
  • Abstrakte Kunst: Experimentelle, surreale Kompositionen
  • Videos: 5-21 Sekunden lange animierte Clips aus Bildern

Was Midjourney nicht ist:

  • Kein Bildbearbeitungsprogramm (nutzen Sie dafür Photoshop)
  • Kein System für charakterkonsistente Darstellung (noch nicht – verbessert sich rapide)
  • Kein Werkzeug zur Nachbildung urheberrechtlich geschützter Charaktere
  • Nicht kostenlos (Abonnements von 10-120$/Monat)

Erste Schritte

Kontoeinrichtung

  1. Besuchen Sie midjourney.com
  2. Melden Sie sich an mit Discord oder erstellen Sie ein Konto
  3. Wählen Sie ein Abonnement:
Plan Preis Fast GPU Relax GPU Video Relax
Basic 10$/Monat 3,3 Std.
Standard 30$/Monat 15 Std. Unbegrenzt
Pro 60$/Monat 30 Std. Unbegrenzt Ja
Mega 120$/Monat 60 Std. Unbegrenzt Ja

Expertentipp: Beginnen Sie mit Standard (30$/Monat). Der unbegrenzte Relax-Modus ist essentiell für Experimente – Sie werden beim Lernen schnell durch die Fast-Stunden brennen.

Ihr erster Prompt

Öffnen Sie die Web-Oberfläche unter midjourney.com/imagine und geben Sie ein:

A golden retriever sitting in autumn leaves, soft afternoon sunlight

Das war’s. Keine spezielle Syntax erforderlich. V7 versteht natürliche Sprache.

Was Sie erhalten: Vier Variationen eines Golden Retrievers in Herbstlandschaft. Von hier aus können Sie:

  • Upscale: Klicken Sie U1-U4, um eine hochauflösende Version zu generieren
  • Vary: Klicken Sie V1-V4, um subtile Variationen zu erstellen
  • Reroll: Generieren Sie vier neue Variationen mit demselben Prompt

Web vs Discord

Funktion Web-Oberfläche Discord
Bedienungsfreundlichkeit Einfacher Steilere Lernkurve
Bildorganisation Integrierte Galerie Verstreut in Kanälen
Videogenerierung Volle Unterstützung Nicht verfügbar
Prompt-Bearbeitung Visuelle Oberfläche Textbefehle
Community Explore-Tab Kanaldurchsuchen
Empfehlung Starten Sie hier Power-User

Die Web-Oberfläche ist jetzt das primäre Erlebnis. Discord funktioniert, aber es fehlt die Videogenerierung und der Workflow ist weniger intuitiv.


Kernkonzepte

Wie Prompts funktionieren

Jeder Midjourney-Prompt wird durch eine Pipeline verarbeitet:

Ihr Text-Prompt
      ↓
[Text Encoder] → Wandelt Wörter in mathematische Embeddings um
      ↓
[Diffusion Model] → Generiert Bild aus Rauschen, geleitet von Embeddings
      ↓
[Upscaler] → Erhöht Auflösung und Details
      ↓
Fertiges Bild

Was das für Sie bedeutet:

  1. Wortreihenfolge zählt: Frühere Wörter haben mehr Einfluss als spätere
  2. Spezifität gewinnt: „golden hour sunlight casting long shadows” schlägt „nice lighting”
  3. Widersprüche verwirren: „dark, bright, moody, cheerful” hebt sich gegenseitig auf
  4. Weniger ist oft mehr: 50-150 Token übertreffen typischerweise 300+ Token

Die Token-Ökonomie

Midjourney sieht nicht Ihre Wörter – es sieht Token (ungefähr Wortteile).

Token-Anzahl Effekt Am besten für
10-30 Sehr offene Interpretation Abstrakt, experimentell
30-80 Ausgewogene Kontrolle Die meisten Prompts
80-150 Detaillierte Kontrolle Spezifische Szenen
150+ Abnehmender Nutzen Kann Konflikte verursachen

Expertentipp: Wenn Ihr Prompt 150 Token überschreitet, überspezifizieren Sie wahrscheinlich. Reduzieren Sie den Adjektiv-Spam.

Qualitätssignale

V7 reagiert stark auf bestimmte Beschreibungsmuster:

Beleuchtung (wirkungsvollster Faktor): - „golden hour light casting long shadows across weathered stone” - „Rembrandt lighting with soft fill from camera left” - „bioluminescent glow illuminating the fog”

Materialien und Texturen: - „oxidized copper with verdigris patina” - „worn leather showing decades of use” - „translucent jade catching the light”

Atmosphäre und Stimmung: - „melancholic twilight atmosphere” - „oppressive industrial ambiance” - „ethereal dreamlike quality”

Technische Kamerabegriffe: - „shot on medium format, shallow depth of field” - „85mm lens, f/1.8 aperture” - „anamorphic lens flare, 2.39:1 aspect”


Die Prompt-Hierarchie

Jeder effektive Prompt folgt einer Hierarchie. Wörter oben haben den größten Einfluss.

┌─────────────────────────────────────────────────┐
│  1. SUBJEKT (wer/was)           ← Am wichtigsten │
│     "elderly fisherman"                          │
├─────────────────────────────────────────────────┤
│  2. SUBJEKT-DETAILS (Beschreibungen)            │
│     "weathered face, silver beard, kind eyes"   │
├─────────────────────────────────────────────────┤
│  3. KONTEXT (wo/wann)                           │
│     "on a wooden dock at dawn"                  │
├─────────────────────────────────────────────────┤
│  4. STIL/STIMMUNG (wie es sich anfühlt)         │
│     "documentary photography, contemplative"     │
├─────────────────────────────────────────────────┤
│  5. TECHNIK (Kamera/Beleuchtung)                │
│     "shot on Leica, natural morning light"      │
├─────────────────────────────────────────────────┤
│  6. PARAMETER (--ar, --s, etc.)   ← Feintuning  │
│     "--ar 3:2 --s 100 --v 7"                    │
└─────────────────────────────────────────────────┘

Prompt-Vorlage

[SUBJEKT] [SUBJEKT-DETAILS], [KONTEXT], [STIL/STIMMUNG], [TECHNIK] --parameter

Beispiel mit Anwendung der Hierarchie:

An elderly fisherman with a weathered face and silver beard, standing on a
wooden dock at dawn, documentary photography style, contemplative mood,
shot on Leica M11 with natural morning light, soft mist rising from the water
--ar 3:2 --s 100 --v 7

Was die meisten Nutzer übersehen: Sie beginnen mit dem Stil („beautiful cinematic photo of…”) statt mit dem Subjekt. V7 gewichtet frühe Token stark – beginnen Sie mit dem, was Sie tatsächlich sehen wollen.


Versionsauswahl

V7 (Standard seit Juni 2025)

V7 ist Midjourneys aktuelles Flaggschiff-Modell, veröffentlicht am 3. April 2025.2

Stärken: - Verständnis natürlicher Sprache (schreiben Sie Sätze, keine Schlüsselwörter) - Bester Fotorealismus bisher - Dramatisch verbesserte Textdarstellung - Bessere menschliche Anatomie (Hände, Körper) - Verbesserte räumliche Beziehungen - Personalisierung standardmäßig aktiviert

Generierungsmodi:

Modus Geschwindigkeit Kosten Am besten für
Turbo Am schnellsten 2x normal Endgültige Renders, wenn Zeit wichtig ist
Fast Normal 1x Standard-Workflow
Relax Warteschlange Inklusive Exploration, Lernen
Draft 10x schneller 0,5x Schnelle Iteration

Wann V7 verwenden: - Fotorealistische Bilder - Jeder Prompt mit komplexer natürlicher Sprache - Textdarstellung - Wenn Qualität am wichtigsten ist

Niji 7 (Januar 2026)

Niji 7 ist das spezialisierte Anime/Manga-Modell, veröffentlicht am 9. Januar 2026.3

Stärken: - Kristallklare Augen und feine Details - Verbesserte Kohärenz bei komplexen Posen - Wörtlichere Prompt-Interpretation - Bessere Textdarstellung - Verbesserte --sref-Performance - Saubere, flache Linienästhetik

Einschränkungen: - --cref wird NICHT unterstützt – ein Ersatz-Charakterreferenzsystem ist in Entwicklung - Personalisierung (--p) ist NOCH NICHT kompatibel – Moodboards-Unterstützung kommt bald - Wörtlicher als frühere Niji-Versionen – passen Sie stimmungsbasierte Prompts an

Demnächst verfügbar: - Moodboard-Unterstützung für personalisierte Anime-Ästhetik - Neues Charakterreferenzsystem als Ersatz für --cref

Verwendung:

A determined young mage with crimson hair, casting fire magic,
intense expression, ancient library background --niji 7

Wann Niji 7 verwenden: - Anime- und Manga-Stilillustrationen - Charakterdesign - Östliche ästhetische Illustrationen - Wenn Sie sauberere Linienführung wünschen

Niji 6 (Legacy)

Noch für Abwärtskompatibilität verfügbar.

Wann Niji 6 verwenden: - Sie benötigen Stil-Presets (--style expressive, --style cute, --style scenic) - Ihr Workflow hängt von --cref ab - Sie bevorzugen die weichere, weniger wörtliche Interpretation

Stile:

--niji 6 --style expressive  # Dynamisch, stilisiert
--niji 6 --style cute        # Kawaii-Ästhetik
--niji 6 --style scenic      # Hintergrundfokus
--niji 6 --style original    # Klassischer Niji-Look

Versionsvergleich

Funktion V7 Niji 7 Niji 6
Fotorealismus Ausgezeichnet N/A N/A
Anime Gut Ausgezeichnet Ausgezeichnet
Natürliche Sprache Beste Gut Mäßig
Textdarstellung Beste Gut Begrenzt
--oref Ja Nein Nein
--cref Nein Nein Ja
--sref Ja Ja (beste) Ja
--p Ja Nein Optional
Stil-Presets Nein Nein Ja

V8-Entwicklungsstatus (Erwartet Q1 2026)

V8 befindet sich in aktiver Entwicklung und stellt eine vollständige Architektur-Neuschreibung dar. Das Training begann ernsthaft Ende 2025.6

Erwartete Verbesserungen: - Massive Verbesserungen bei der Textdarstellung - Bessere Generierung komplexer Subjekte (Kreaturen, Zentauren, ungewöhnliche Anatomie) - Behobene Kompatibilitätsprobleme mit älteren Stilen - Bessere Datensätze und neue Architekturen - Entwicklung Richtung „promptlose” Kreation

Zeitplan: - Trainingsläufe über Weihnachten 2025 - V7.1 Bridge-Update wird zuerst erwartet (Verbesserungen bei Hand-/Körperkohärenz) - V8 generalistisches Bildmodell wird Anfang 2026 erwartet - Spezialisierte Bearbeitungs- und Videomodelle folgen

Warum V8 wichtig ist: Das Midjourney-Team erklärte, dass V7 seine erwarteten Funktionen nicht vollständig erreicht hat, daher wird V8 „signifikante Unterschiede” mit innovativeren Funktionen bringen.


Seitenverhältnisse

Der Parameter --ar legt die Bildabmessungen fest. Standard ist 1:1 (quadratisch).

Gängige Verhältnisse

Verhältnis Abmessungen Anwendungsfall
1:1 Quadratisch Social Media, Icons
4:5 Hochformat Instagram-Feed, Mobil
5:4 Querformat Desktop, Präsentationen
16:9 Breitbild YouTube, Präsentationen
9:16 Vertikal Stories, TikTok, Mobil
21:9 Ultrabreit Filmisch, Film
3:2 Klassisch Fotografie-Prints
2:3 Hochformat Vertikale Prints

Plattformspezifische Empfehlungen

Plattform Verhältnis Hinweise
Instagram Feed 1:1 oder 4:5 4:5 erhält mehr Bildschirmfläche
Instagram Story 9:16 Vollständig vertikal
Twitter/X 16:9 oder 1:1 16:9 expandiert im Feed
LinkedIn 1.91:1 oder 16:9 Professionelles Querformat
Pinterest 2:3 Vertikal performt am besten
YouTube-Thumbnail 16:9 Standard-Videoformat
Desktop-Hintergrund 16:9 oder 21:9 Passend zu Ihrem Monitor

Einfluss auf die Komposition

Das Seitenverhältnis betrifft nicht nur die Abmessungen – es verändert grundlegend die Komposition.

Breite Verhältnisse (16:9, 21:9): - Betonen Umgebung und Kontext - Natürlich für Landschaften, Stadtansichten - Filmisches Gefühl - Subjekte werden Teil einer Szene

Hohe Verhältnisse (4:5, 9:16): - Fokussieren Aufmerksamkeit auf das Subjekt - Natürlich für Porträts, Produkte - Intimes Gefühl - Mehr vertikale Information

Expertentipp: Für filmische Porträts versuchen Sie 4:5 statt des offensichtlichen 16:9. Sie erhalten die subjektfokussierte Rahmung des Hochformats mit genügend Kontext für Storytelling.


Stylization

Der Parameter --s steuert, wie viel künstlerische Interpretation V7 anwendet. Bereich: 0-1000. Standard: 100.

Stylization-Bereiche

Bereich Effekt Ideal für
0-50 Minimale Interpretation Produktfotos, technische Genauigkeit
50-150 Ausgewogen (Standard) Allgemeine Verwendung, Porträts
150-300 Spürbarer Stil Künstlerische Fotos, Stimmungsbilder
300-500 Starker Stil Illustrationen, Konzeptkunst
500-1000 Sehr stilisiert Abstrakt, experimentell

Visuelle Beispiele

Portrait of a woman, soft window light --s 50
# Midjourney Prompt Engineering: Der vollständige Leitfaden

Portrait of a woman, soft window light --s 250
# Result: More artistic interpretation, enhanced mood

Portrait of a woman, soft window light --s 600
# Result: Distinctly stylized, dreamlike quality

Entscheidungsrahmen

Verwenden Sie niedrige Stylization (0-100) wenn: - Sie Produktfotografie erstellen - Sie fotorealistische Genauigkeit wünschen - Technische Bilder oder Dokumentation benötigt werden - Der Prompt wörtlich interpretiert werden soll

Verwenden Sie mittlere Stylization (100-300) wenn: - Sie allgemeine kreative Arbeiten erstellen - Editorial-Fotografie gewünscht ist - Sie Verbesserung ohne Extreme möchten - Eine Balance zwischen realistisch und künstlerisch angestrebt wird

Verwenden Sie hohe Stylization (300+) wenn: - Sie Illustrationen oder Konzeptkunst erstellen - Abstrakte oder experimentelle Arbeiten gewünscht sind - Midjourneys Ästhetik dominieren soll - Sie kreative Grenzen ausloten möchten

Stylization + Style Raw

Für maximalen Fotorealismus kombinieren Sie niedrige Stylization mit --style raw:

Portrait of a businessman, office background --s 50 --style raw --v 7

--style raw weist V7 an, die eigene ästhetische Interpretation zu minimieren, wodurch Ihre Ergebnisse näher an der wörtlichen Prompt-Umsetzung liegen.


Chaos und Weird

Chaos (–chaos 0-100)

Steuert die Variation zwischen den vier generierten Bildern. Standard: 0.

Wert Effekt
0 Sehr ähnliche Ausgaben
25 Leichte Variationen
50 Moderate Vielfalt
75 Hohe Vielfalt
100 Maximale Unvorhersehbarkeit

Wann Sie Chaos verwenden sollten: - Erkundungsphase: --chaos 50-75 um verschiedene Interpretationen zu sehen - Finale Ausgabe: --chaos 0-25 für konsistente Ergebnisse - Richtungsfindung: Hoher Chaos-Wert am Anfang, niedriger Wert zur Verfeinerung

Weird (–weird 0-3000)

Führt unkonventionelle, unerwartete Ästhetik ein. Standard: 0.

Bereich Effekt
0 Standard-Ästhetik
100-500 Subtile Eigenheiten
500-1000 Spürbare Fremdartigkeit
1000-2000 Sehr ungewöhnlich
2000-3000 Maximale Verrücktheit

Wann Sie Weird verwenden sollten: - Surreale oder traumhafte Bilder - Um aus generischer KI-Ästhetik auszubrechen - Konzeptkunst-Erkundung - Wenn „normal” zu vorhersehbar wirkt

Chaos und Weird kombinieren

--chaos 50 --weird 500   # Varied outputs, each slightly quirky
--chaos 100 --weird 0    # Wild variations, normal aesthetic
--chaos 25 --weird 2000  # Similar outputs, all very weird

Expertentipp: Hohe Weird-Werte können wirklich ungewöhnliche Bilder erzeugen, aber die Ergebnisse sind inkonsistent. Verwenden Sie es zur Erkundung und reduzieren Sie den Wert für finale Ausgaben.


Experimental Aesthetics

Der Parameter --exp fügt verbesserte Details, Dynamik und Tone-Mapping-Effekte hinzu. Bereich: 0-100. Standard: 0.

Effektstufen

Wert Effekt Hinweise
0 Aus (Standard) Standard-Rendering
5 Subtile Verbesserung Sicher mit anderen Parametern kombinierbar
10 Spürbare Detailsteigerung Guter Ausgangspunkt
25 Starker Effekt Empfohlenes Maximum für Kombinationen
50 Sehr stark Kann Prompt-Genauigkeit reduzieren
100 Maximum Kann –stylize und –p überwältigen

Was –exp bewirkt

  • Detailliertere Texturen und Oberflächen
  • Dynamischere, eindrucksvollere Kompositionen
  • Tone-Mapping mit HDR-ähnlichem Erscheinungsbild
  • Verstärktes visuelles Interesse

Empfohlene Kombinationen

--exp 10 --s 200           # Enhanced detail, balanced style
--exp 25 --s 100           # Strong exp, controlled stylize
--exp 5 --style raw        # Subtle boost for photorealism

Warnung: Parameterkonflikte

Bei hohen Werten (über 25-50) kann --exp: - --stylize-Einstellungen überwältigen - Personalisierung (--p) überschreiben - Bildvielfalt reduzieren

Expertentipp: Halten Sie --exp bei den meisten Arbeiten zwischen 10-25. Höhere Werte sind für spezifische stilistische Effekte gedacht, nicht für allgemeine Qualitätsverbesserung.


Omni Reference

Der Parameter --oref überträgt Motivmerkmale von einem Referenzbild auf Ihre Generierung. Dies hat --cref in V7 ersetzt.

Grundlegende Verwendung

/imagine A woman in a red dress at a gala --oref [image URL]

Was übertragen wird: - Gesicht und Gesichtszüge - Körpertyp und Proportionen - Kleidung und Accessoires - Gesamte Identität

Gewichtungskontrolle (–ow)

--ow 0-1000    # Omni weight (default 100)
Gewichtung Effekt
0-30 Lockere Inspiration, erlaubt Stiländerungen
30-60 Moderater Einfluss
60-100 Starke Ähnlichkeit (Standardbereich)
100-300 Sehr enge Übereinstimmung
300-1000 Maximale Treue

Bewährte Praktiken

Qualität des Referenzbilds ist entscheidend: - Hohe Auflösung, klares Motiv - Frontalaufnahmen funktionieren am besten für Gesichter - Konsistente Beleuchtung im Referenzbild - Minimale Hintergrundablenkungen

Gewichtung für Stiländerungen anpassen:

# Photo to anime conversion - lower weight
--oref [photo URL] --ow 40 --niji 7

# Maintaining strict likeness
--oref [photo URL] --ow 200 --v 7

Mit Style Reference kombinieren:

# Subject from one image, style from another
--oref [subject URL] --sref [style URL] --ow 100 --sw 150

Style Reference

Der Parameter --sref überträgt ästhetische Eigenschaften von einem Referenzbild.

Grundlegende Verwendung

/imagine A mountain landscape at sunset --sref [style image URL]

Was übertragen wird: - Farbpalette - Beleuchtungsstil - Künstlerische Technik - Gesamte Stimmung/Atmosphäre - Kompositionelle Tendenzen

Gewichtungskontrolle (–sw)

--sw 0-1000    # Style weight (default 100)
Gewichtung Effekt
0-50 Subtiler Einfluss
50-150 Ausgewogene Übertragung
150-300 Starke Stilübereinstimmung
300-1000 Dominanter Stil

Mehrere Style References

Sie können mehrere Stilbilder kombinieren:

--sref [url1] [url2]

Die Stile verschmelzen miteinander. Verwenden Sie dies, um einzigartige ästhetische Kombinationen zu erstellen.

Bewährte Praktiken

Funktioniert am besten mit: - Markanten, konsistenten Stilen - Klaren ästhetischen Merkmalen - Bildern mit starker visueller Identität

Weniger effektiv bei: - Sehr generischen Fotos - Gemischten oder unklaren Stilen - Bildern, bei denen der „Stil” nicht offensichtlich ist

Expertentipp: Niji 7 hat die beste --sref-Leistung. Wenn Stilübertragung entscheidend ist, erwägen Sie Niji 7 auch für Nicht-Anime-Inhalte zu verwenden.

Alte Style Reference Codes verwenden

Wenn Sie --sref-Codes aus der V6-Ära haben, funktionieren diese nicht direkt in V7. Fügen Sie --sv 4 hinzu, um Legacy-Stilcodes zu verwenden:

/imagine A mountain landscape --sref 123456789 --sv 4
# --sv 4 tells V7 to interpret the code using V6 style system

Hinweis: Obwohl dies Abwärtskompatibilität gewährleistet, sollten Sie erwägen, Style References in V7 neu zu generieren, um bessere Ergebnisse mit dem neuen Modell zu erzielen.


Image Weight

Der Parameter --iw steuert, wie viel Einfluss ein Referenzbild auf Ihre Generierung hat.

Grundlegende Verwendung

/imagine [prompt] [image URL] --iw 1.5

Gewichtungsbereich

Bereich: 0-2 (Standard 1)

Gewichtung Effekt
0-0,5 Prompt dominant
0,5-1 Ausgewogen
1-1,5 Bild dominant
1,5-2 Starker Bildeinfluss

Anwendungsfälle

Niedrige Gewichtung (0-0,5): Das Bild als lockere Inspiration verwenden, während der Prompt dominiert

Ausgewogen (0,5-1): Gleicher Einfluss von Prompt und Bild

Hohe Gewichtung (1,5-2): Variationen erstellen, die eng auf dem Bild basieren


Moodboards (Benutzerdefinierte Stilprofile)

Mit Moodboards können Sie personalisierte Stilprofile erstellen, indem Sie Bilder bewerten. Anstatt ein einzelnes --sref-Bild zu verwenden, bauen Sie eine stabile ästhetische Präferenz aus mehreren Beispielen auf.7

Wie Moodboards funktionieren

  1. Erstellen Sie ein Moodboard in der Web-Oberfläche
  2. Laden Sie Bilder hoch und bewerten Sie sie (gefällt mir/gefällt mir nicht), um Ihren Stil zu trainieren
  3. Wenden Sie es mit --p an, um Ihr Standard-Moodboard zu verwenden
  4. Wenden Sie es mit --p [mID] an, um ein bestimmtes Moodboard zu verwenden

Ein stabiles Profil aufbauen

Bewertungen Stabilität
10-20 Erste Richtung erkennbar
20-40 Stil wird konsistenter
40+ Stabiles, zuverlässiges Profil

Expertentipp: Bewerten Sie mindestens 40 Bilder für ein stabiles Moodboard. Fügen Sie sowohl Likes ALS AUCH Dislikes hinzu – Dislikes helfen Midjourney zu verstehen, was vermieden werden soll.

Moodboards verwenden

/imagine A forest path at dawn --p
# Uses your default moodboard

/imagine A forest path at dawn --p abc123
# Uses specific moodboard with ID abc123

Moodboards vs Style Reference

Ansatz Ideal für
--sref Einmalige Stilübertragung von einem einzelnen Bild
--p (Moodboard) Konsistente persönliche Ästhetik über Projekte hinweg

Moodboards mit –sref kombinieren

Sie können beide für nuancierte Kontrolle kombinieren:

/imagine A portrait --p --sref [url] --sw 50
# Your moodboard aesthetic + subtle style reference influence

Draft Mode

Draft mode generiert Bilder mit 10-facher Geschwindigkeit bei halben GPU-Kosten. Unverzichtbar für die Erkundung.

Draft Mode aktivieren

/imagine [prompt] --draft

Oder in den Einstellungen der Web-Oberfläche umschalten.

Draft vs Full Vergleich

Aspekt Draft Full
Geschwindigkeit ~10x schneller Standard
GPU-Kosten 50% 100%
Details Reduziert Vollständig
Ideal für Erkundung Finale Ausgabe

Der Draft-Workflow

1. Draft Mode Exploration (--draft)
   ├── Test 5-10 variations quickly
   ├── Identify promising directions
   └── Note effective parameters

2. Full Render Refinement
   ├── Remove --draft flag
   ├── Apply learned parameters
   └── Fine-tune with --seed

Expertentipp: Beginnen Sie immer im Draft mode. Die Kosteneinsparungen summieren sich, und Sie erkunden mehr Optionen. Wechseln Sie erst zum vollständigen Rendering, wenn Sie eine Richtung gefunden haben, für die sich der Aufwand lohnt.


Image-to-Video Grundlagen

Midjourneys V1 Video Model wurde am 19. Juni 2025 eingeführt und ermöglicht Bild-zu-Video-Animation.

Funktionsweise

  1. Wählen Sie ein beliebiges Bild (Midjourney-generiert oder hochgeladen)
  2. Klicken Sie auf „Animate”
  3. Wählen Sie Optionen (Auto, Manual, Loop)
  4. Generieren Sie einen 5-Sekunden-Videoclip

Motion-Parameter

--motion low    # Still scenes, slow motion, subtle movement (default)
--motion high   # Big camera motions, larger character movements
--raw           # Reduces creative flair, more prompt control

Motion-Vergleich

Einstellung Effekt Ideal für
Low Subtile, cinematische Bewegung Porträts, Stillleben, Atmosphäre
High Dynamische, energetische Bewegung Action, Landschaften, Menschenmengen

Warnung: Hohe Motion-Werte können unrealistische oder fehlerhafte Bewegungen erzeugen. Beginnen Sie mit niedrigen Werten und erhöhen Sie nur bei Bedarf.

Kosten und Tarife

  • Video-Jobs kosten ~8x mehr als Bild-Jobs
  • Jeder Job produziert vier 5-Sekunden-Videos
  • Nur über die Web-Oberfläche verfügbar (nicht Discord)
Tarif Fast Mode Video Relax Mode Video
Basic Ja Nein
Standard Ja Nein
Pro Ja Ja
Mega Ja Ja

HD Video Mode

HD Video mode (eingeführt im August 2025) liefert 4x schärfere Auflösung – die vierfache Pixeldichte für dramatisch verbesserte Videoqualität.8

So verwenden Sie HD Video: 1. Generieren Sie zuerst ein Standard-Video 2. Klicken Sie bei einem fertigen Video auf die HD-Option 3. Warten Sie auf das hochauflösende Rendering

HD Video-Kosten: - Kostet ~3,2x mehr als Standard-Video - Nur bei Pro- und Mega-Tarifen verfügbar - Erfordert zuerst ein Standard-Video (keine direkte HD-Generierung möglich)

Modus Auflösung Relative Kosten
Standard (SD) Basis 1x
High Definition (HD) 4x Pixel ~3,2x

Wann Sie HD verwenden sollten: - Finale Auslieferungs-Assets - Große Displays oder Projektionen - Professionelle/kommerzielle Arbeiten - Wenn Details in der Bewegung wichtig sind

Expertentipp: Testen Sie immer zuerst in SD. HD dauert länger und kostet mehr – upgraden Sie nur Ihre besten Clips.


Extending und Looping

Videos verlängern

Sie können jedes Video um weitere 4 Sekunden verlängern, bis zu 4 Mal (maximal 21 Sekunden).

Verlängerungsoptionen: - Auto: Setzt das Video automatisch fort - Manual: Passen Sie den Prompt vor der Verlängerung an

Bewährte Praktiken für Verlängerungen: - Planen Sie Ihren narrativen Bogen, bevor Sie beginnen - Die ersten 5 Sekunden sollten die Szene etablieren - Jede Verlängerung sollte einen Zweck haben - Bedenken Sie das Tempo – 21 Sekunden sind länger, als Sie denken

Loops erstellen

Die Loop-Option erstellt nahtlos wiederholende Videos, bei denen das erste und letzte Bild übereinstimmen.

Select image → Click "Loop" → Generate

Ideal für: - Hintergrund-Animationen - Social-Media-Inhalte - Ambiente-Visuals - Cinemagraphs

Tipps für bessere Loops: - Einfache, wiederholbare Bewegungen funktionieren am besten - Vermeiden Sie komplexe Kamerabewegungen - Atmosphärische Elemente (Wolken, Wasser, Feuer) loopen natürlich


Video Best Practices

Wann Sie Video verwenden sollten

Gute Kandidaten für Video: - Atmosphärische Szenen (Nebel, Regen, Feuer) - Subtile Bewegung (Haare, Stoff, Wasser) - Landschaften mit Umgebungsbewegung - Porträts mit minimaler Bewegung

Weniger ideal für Video: - Komplexe Action-Sequenzen - Szenen mit mehreren Charakteren - Präzise Choreografie - Anforderungen an technische Genauigkeit

Für Video optimieren

Vor dem Animieren: 1. Generieren Sie zuerst das perfekte Standbild 2. Überlegen Sie, wie sich Elemente bewegen könnten 3. Vermeiden Sie komplexe, miteinander verbundene Motive 4. Einfache Kompositionen animieren besser

Prompt-Anpassungen:

# Good for video
Lone figure standing on cliff edge, wind blowing cape, dramatic clouds

# Less ideal for video
Group of dancers in synchronized formation, precise movements

Kostenmanagement

Bei 8-fachen Bildkosten summieren sich Videos schnell:

Kosteneffektiver Workflow: 1. Im Draft mode erkunden (Bilder) 2. Perfekte Komposition finden 3. Finales hochwertiges Standbild generieren 4. Nur die beste Version animieren 5. Nur bei Bedarf verlängern


Filmischer Realismus

Das effektivste Muster für fotorealistische, filmische Ergebnisse.

Die filmische Vorlage

[Shot type] by [Director], [subject physical description],
[action/pose], [costume/styling], [setting details],
captured with [Camera Body] using [Lens], [lighting description],
[mood/atmosphere summary]
--ar [ratio] --s [value] --p --no anime, cartoon, illustration, painting

Regisseur-Stile

Regisseur Visueller Stil Beste Verwendung
Ridley Scott Atmosphärisch, texturiert, stimmungsvoll Sci-Fi, Historiendramen, Nahaufnahmen
Denis Villeneuve Epische Weite, karg, geometrisch Landschaften, Weitwinkelaufnahmen
David Fincher Dunkel, präzise, beunruhigend Thriller, stimmungsvolle Porträts
Roger Deakins Silhouetten, natürliches Licht, poetisch Alle lichtfokussierten Aufnahmen
Alfonso Cuarón Immersiv, intim, fließend Charaktermomente, Spannung
Wes Anderson Symmetrisch, pastellfarben, verspielt Stilisierte, zentrierte Kompositionen
Christopher Nolan IMAX-Maßstab, praktische Effekte, intensiv Action, Architektur
Terrence Malick Goldene Stunde, ätherisch, naturverbunden Landschaften, kontemplativ

Kamera-Referenz

Kamera Ästhetik Beste Verwendung
RED Komodo Modernes digitales Kino Nahaufnahmen, narrativ
ARRI ALEXA Filmähnlich, satte Farben Alles Filmische
ARRI Alexa Mini Wie ALEXA, kompakter Dokumentation, Handkamera
ARRI ALEXA 65 Großformat, episch Landschaften, IMAX-Gefühl
RED V-Raptor 8K, scharf, dynamisch Action, hohe Detailtreue
Sony Venice Vollformat, vielseitig Schwaches Licht, anamorphisch
Hasselblad Mittelformat, luxuriös Porträts, Mode
Leica M Messsucherkamera, klassisch Street, Dokumentation

Objektiv-Kombinationen

Brennweite Effekt Beste Verwendung
24mm f/1.4 Weitwinkel, umgebungsbezogen Landschaften, Etablierung
35mm f/2.0 Natürlich, vielseitig Dokumentation, Street
50mm f/1.4 Klassisch, ausgewogen Allgemein einsetzbar
85mm f/1.8 Porträt, geringe Schärfentiefe Nahaufnahmen, Porträts
105mm f/2.0 Komprimiert, intim Kopfaufnahmen
135mm f/2.0 Maximale Kompression Enge Porträts

Vollständige filmische Beispiele

Nahaufnahme-Porträt:

Dramatic close-up portrait by Ridley Scott, young woman with pale skin
and auburn hair, intense green eyes staring directly at camera, subtle
freckles across nose, wearing dark wool coat, rain falling around her
face, captured with RED Komodo using 85mm f/1.8 lens, cold blue-silver
lighting with warm practical rim light, melancholic determined atmosphere
--ar 4:5 --s 150 --p --no anime, cartoon, illustration, painting

Filmische Totale:

Epic wide shot by Denis Villeneuve, lone figure in orange survival suit
walking across endless salt flats, geometric patterns in dried earth,
massive dust storm approaching on horizon, captured with ARRI ALEXA 65
using 24mm f/2.0 lens, harsh afternoon sun creating stark shadows,
desolate apocalyptic atmosphere
--ar 21:9 --s 200 --p --no anime, cartoon, illustration, painting

Wichtig: Verwenden Sie niemals Schauspielernamen. Beschreiben Sie Personen physisch. „Junge Frau mit blasser Haut und rotbraunem Haar” statt „Emma Stone.” Schauspielernamen erzeugen Uncanny-Valley-Effekte.


Porträtfotografie

Lichtführungsmuster

Muster Effekt Aufbau
Rembrandt Dramatisch, klassisch Hauptlicht 45° seitlich, erzeugt Dreieck unter dem Auge
Butterfly Glamourös, schmeichelhaft Hauptlicht von oben und vorne
Split Dramatisch, geheimnisvoll Licht von der reinen Seite
Rim/Edge Separation, Tiefe Licht von hinten
Loop Subtiler Schatten Leichte Abweichung von Rembrandt

Porträt-Vorlage

[Subject description], [expression/emotion], [pose],
[lighting pattern] lighting, shallow depth of field,
[background description], shot on [camera] with [lens]
--ar 4:5 --s 100 --v 7

Porträt-Beispiele

Umgebungsporträt:

Middle-aged craftsman with salt-and-pepper beard, focused expression,
hands working on leather saddle, Rembrandt lighting from workshop window,
shallow depth of field, blurred tool-filled background, shot on
Hasselblad with 80mm f/1.9, documentary authenticity
--ar 4:5 --s 75 --style raw --v 7

Studioporträt:

Professional woman in her 30s, confident subtle smile, shoulders
turned slightly, butterfly lighting with soft fill, pure white
seamless background, shot on Phase One with 110mm f/2.8, clean
commercial aesthetic
--ar 4:5 --s 50 --v 7

Produktfotografie

Produkt-Vorlage

[Product] on [surface/platform], [background style],
[lighting setup], commercial photography, high detail,
[brand aesthetic description]
--ar 1:1 --s 50 --v 7 --style raw

Oberflächen- und Hintergrundoptionen

Oberflächen: - Polierter Marmor (luxuriös) - Roher Beton (industriell) - Naturholz (organisch) - Gebürstetes Metall (technisch) - Farbiges Acryl (modern)

Hintergründe: - Gradient (sanfter Übergang) - Seamless (einfarbig) - Kontextuell (Anwendungsumgebung) - Abstrakt (künstlerisch)

Produkt-Beispiele

Luxuskosmetik:

Minimalist perfume bottle with gold cap on polished black marble surface,
gradient background from deep purple to black, dramatic rim lighting with
soft front fill, commercial photography, high detail, premium luxury
aesthetic, subtle reflections on marble
--ar 1:1 --s 25 --v 7 --style raw

Technikprodukt:

Wireless earbuds case open showing earbuds inside, floating on
pure white seamless background, soft even lighting from all sides,
commercial product photography, high detail, clean Apple-style
minimalism, subtle shadow beneath
--ar 1:1 --s 50 --v 7 --style raw

Fantasy und Sci-Fi

Fantasy-Vorlage

[Character/scene description], [fantasy world details],
[magical elements], [lighting style],
[art style: painterly | concept art | illustration],
[artist influence if applicable]
--ar 16:9 --s 500 --weird 100 --v 7

Fantasy-Beispiele

Epische Fantasy:

Ancient elven queen seated on crystalline throne in vast cavern hall,
iridescent robes flowing with captured starlight, bioluminescent
flowers floating around her, massive glowing runes carved into
obsidian walls, ethereal volumetric lighting, painterly fantasy
illustration influenced by Craig Mullins and Alphonse Mucha
--ar 16:9 --s 600 --weird 150 --v 7

Düstere Fantasy:

Battle-scarred knight in tarnished armor standing in ruined cathedral,
sword planted in cracked stone floor, pale moonlight streaming through
shattered rose window, crows circling above, mist swirling at feet,
dark atmospheric concept art, Beksinski and Zdzisław influence
--ar 16:9 --s 400 --weird 200 --v 7

Sci-Fi-Vorlage

[Subject/scene], [technology details], [environment],
[lighting: neon | holographic | industrial | sterile],
[aesthetic: cyberpunk | hard sci-fi | retro-futurism],
[mood description]
--ar 21:9 --s 300 --v 7

Sci-Fi-Beispiele

Cyberpunk:

Solo mercenary in worn tactical gear navigating rain-soaked neon alley,
holographic advertisements flickering overhead, steam rising from
street grates, distant megastructures visible through smog, cyan and
magenta neon reflections on wet pavement, Blade Runner cyberpunk
aesthetic, oppressive urban atmosphere
--ar 21:9 --s 350 --v 7

Hard Sci-Fi:

Interior of generation ship agricultural bay, massive cylindrical
space with terraced farms curving overhead, artificial sun strip
running along central axis, workers in utilitarian jumpsuits tending
crops, visible structural engineering, hard science fiction aesthetic,
The Expanse influence, functional yet beautiful
--ar 21:9 --s 250 --v 7

Anime mit Niji 7

Niji 7 Eigenschaften

Niji 7 erzeugt sauberere, flachere Kunstwerke mit verbesserter Linienführung. Es interpretiert Prompts wörtlicher als frühere Versionen.

Niji 7 Vorlage

[Character description], [pose/action], [expression],
[setting/background], [specific style notes],
[color palette]
--niji 7 --ar [ratio]

Niji 7 Beispiele

Actionszene:

Young mage with flowing crimson hair and determined golden eyes,
casting powerful fire spell with both hands raised, intense focused
expression, ancient library crumbling around her, debris floating
in magical energy, dynamic diagonal composition, warm orange and
red color palette with cool blue shadows
--niji 7 --ar 3:4

Charakterporträt:

Elegant noblewoman with silver hair in elaborate updo, wearing dark
blue Victorian-inspired gown with gold embroidery, subtle knowing
smile, half-body portrait, ornate palace balcony background with
moonlit garden visible, soft romantic atmosphere, detailed lace
and fabric textures
--niji 7 --ar 4:5

Stiltransfer mit Niji 7

Niji 7 hat die beste --sref Leistung:

[Your prompt] --niji 7 --sref [style image URL] --sw 150

Beginnen Sie mit --sw 150 und passen Sie an: - Niedriger (50-100) für subtilen Einfluss - Höher (200-300) für starke Stilanpassung

Migration von Niji 6

Niji 6 Ansatz:

anime girl, beautiful, detailed eyes, colorful --niji 6 --style expressive

Niji 7 Ansatz:

Young woman with vibrant teal hair and large expressive amber eyes,
wearing casual summer dress, cheerful smile, urban cafe background,
afternoon sunlight, contemporary anime style
--niji 7

Wichtige Änderungen: - Schreiben Sie vollständige Beschreibungen, keine Stichwortlisten - Seien Sie wörtlicher und spezifischer - Stil-Presets existieren nicht – beschreiben Sie, was Sie möchten - Verwenden Sie --sref für konsistenten Stil


Architektur

Architektur-Vorlage

[Building/space type], [architectural style],
[time of day/lighting], [weather/atmosphere],
[perspective: eye-level | aerial | interior | detail],
architectural photography, clean lines
--ar 16:9 --s 150 --v 7 --style raw

Architekturstile

Stil Merkmale Schlüsselwörter
Brutalist Roher Beton, massiv, geometrisch Exposed concrete, monolithic
Minimalist Klare Linien, weiß, spärlich Negative space, pure forms
Art Deco Ornamental, geometrisch, luxuriös Gold accents, sunburst patterns
Gothic Spitzbögen, vertikal, dramatisch Flying buttresses, rose windows
Japanese Holz, Papier, Naturintegration Shoji screens, engawa, zen
Parametric Fließend, computergeneriert, organisch Zaha Hadid, algorithmic curves

Architektur-Beispiele

Brutalistisch:

Brutalist concrete museum interior with dramatic skylights, afternoon
sun creating strong geometric shadows on exposed concrete walls, vast
empty gallery space with single sculpture, eye-level perspective
showing depth and scale, architectural photography by Hélène Binet
--ar 16:9 --s 100 --v 7 --style raw

Parametrisch:

Futuristic parametric architecture concert hall exterior, flowing white
curves inspired by Zaha Hadid, blue hour lighting with building interior
warmly illuminated, long exposure car light trails on surrounding roads,
wide establishing shot, architectural photography
--ar 16:9 --s 150 --v 7

Abstrakt und Experimentell

Abstrakt-Vorlage

[Concept/emotion to express], [visual elements],
[color palette], [texture/material qualities],
[movement/energy description], abstract composition
--s 750 --weird 500 --chaos 50 --v 7

Abstrakte Beispiele

Emotionale Abstraktion:

The feeling of nostalgia dissolving into hope, fragmented memories
reforming as light, soft blues transitioning to warm amber, watercolor
textures bleeding into geometric shapes, gentle upward movement,
abstract emotional landscape
--ar 1:1 --s 800 --weird 750 --chaos 40 --v 7

Texturale Abstraktion:

Microscopic landscape of oxidized copper and crystalline salt
formations, verdigris greens and rust oranges, extreme macro detail,
mineral textures catching diffused light, abstract geological patterns
--ar 1:1 --s 500 --weird 300 --v 7

Grenzen erweitern

Für wirklich experimentelle Arbeiten: - Erhöhen Sie --weird über 1000 - Kombinieren Sie mit --chaos 75+ - Verwenden Sie abstrakte, emotionale Sprache - Referenzieren Sie unkonventionelle Künstler

The architecture of forgotten dreams, impossible geometries folding
through chromatic space, Escher meets Kandinsky, synesthetic color
relationships, visual music
--ar 1:1 --s 1000 --weird 2000 --chaos 75 --v 7

Wortgewichtung

Verwenden Sie die :: Syntax, um die Betonung bestimmter Elemente zu steuern.

Syntax

word::2      # Doppelte Betonung
word::1.5    # 50% mehr Betonung
word::1      # Normal (Standard)
word::0.5   # Halbe Betonung
word::-1     # Negativ (vermeiden)

Beispiele

ethereal::2 portrait of a warrior, dramatic lighting::1.5, mist::0.5

Dieser Prompt: - Betont stark die ätherische Qualität - Betont moderat die dramatische Beleuchtung - Reduziert die Nebelpräsenz

Wann Sie Gewichtung verwenden sollten

Nützlich für: - Feinabstimmung der Elementbalance - Unterdrückung unerwünschter Interpretationen - Betonung wichtiger Merkmale

Vermeiden Sie es, wenn: - Sie erste Entwürfe erkunden - Einfache Prompts ohne Gewichtung funktionieren - Sie unsicher sind, was Sie betonen möchten

Expertentipp: Wortgewichtung ist ein Verfeinerungswerkzeug, kein erster Schritt. Bringen Sie den grundlegenden Prompt zum Funktionieren und verwenden Sie dann Gewichtung zur Feinabstimmung.


Negative Prompts

Der --no Parameter schließt Elemente von der Generierung aus.

Grundlegende Verwendung

/imagine Beautiful landscape --no people, text, watermark

Effektive Negationen

Ziel Negation
Fotorealismus --no anime, cartoon, illustration, painting, drawing
Sauberes Bild --no text, watermark, signature, frame, border
Natürlicher Look --no oversaturated, HDR, artificial
Seriöser Ton --no cute, chibi, kawaii
Einfache Komposition --no busy, cluttered, crowded

Bewährte Praktiken

Tun Sie: - Verwenden Sie spezifische, klare Begriffe - Adressieren Sie tatsächliche Probleme in Ihren Ausgaben - Halten Sie die Liste fokussiert (3-5 Punkte)

Vermeiden Sie: - Erschöpfende Listen von allem, was Sie nicht wollen - Vage Begriffe („schlecht”, „hässlich”) - Negation von Dingen, die ohnehin unwahrscheinlich erscheinen würden

Die filmische Negation

Für konsistente fotorealistische Ergebnisse:

--no anime, cartoon, illustration, painting, drawing, sketch, CGI, 3D render

Seed-Kontrolle

Seeds ermöglichen Reproduzierbarkeit und kontrollierte Variation.

Grundlegende Verwendung

/imagine [prompt] --seed 12345

Gleicher Prompt + gleicher Seed = sehr ähnliche Ausgabe.

Seeds finden

Nach der Generierung klicken Sie auf die Bildinformationen, um den verwendeten Seed zu finden. Notieren Sie ihn für die Reproduktion.

Seed-Workflows

Variations-Workflow: 1. Generieren Sie mit zufälligem Seed 2. Finden Sie ein Ergebnis, das Ihnen gefällt 3. Notieren Sie den Seed 4. Machen Sie kleine Prompt-Änderungen mit demselben Seed 5. Vergleichen Sie die Variationen

Batch-Konsistenz:

Scene in morning light --seed 54321
Scene in afternoon light --seed 54321
Scene in evening light --seed 54321

Die Verwendung desselben Seeds über verwandte Prompts hinweg erzeugt konsistentere Kompositionen.


Komposition mit mehreren Subjekten

Komplexe Szenen mit mehreren Subjekten erfordern eine sorgfältige Prompt-Konstruktion.

Hierarchie-Ansatz

Listen Sie Subjekte in der Reihenfolge ihrer Wichtigkeit auf:

[Primary subject], [secondary subject], [tertiary subject],
[their relationship/interaction], [setting], [style]

Räumliche Sprache

Verwenden Sie klare räumliche Beschreibungen:

In the foreground, [subject A]
In the middle ground, [subject B]
In the background, [subject C]

Oder:

On the left, [subject A]
In the center, [subject B]
On the right, [subject C]

Beispiel

Elderly grandmother and young granddaughter baking together in
sunlit kitchen, grandmother guiding child's hands rolling dough,
flour dusting the wooden counter, warm afternoon light from window,
vintage kitchen appliances in background, intimate family moment,
documentary photography style
--ar 3:2 --s 100 --v 7

Text-Rendering

V7 hat das Text-Rendering in Bildern dramatisch verbessert.

Best Practices

Halten Sie Text kurz: - Einzelne Wörter funktionieren am besten - Kurze Phrasen (2-4 Wörter) funktionieren meist - Lange Sätze scheitern oft

Verwenden Sie Anführungszeichen:

Neon sign reading "OPEN" in storefront window

Spezifizieren Sie die Typografie:

Vintage poster with "JAZZ NIGHT" in art deco typography

Text-Beispiele

Beschilderung:

Rainy city street at night, neon diner sign reading "EAT" glowing
red through rain-streaked window, film noir atmosphere
--ar 16:9 --s 150 --v 7

Typografie:

Minimalist book cover design, large serif typography reading "THE END"
centered on cream paper texture, literary fiction aesthetic
--ar 2:3 --s 100 --v 7

Einschränkungen

Text-Rendering hat weiterhin Schwierigkeiten mit: - Langen Sätzen - Komplexen Schriftarten - Kleinem Text in unruhigen Bildern - Mehreren Textelementen

Expertentipp: Wenn Text entscheidend ist, generieren Sie das Bild ohne Text und fügen Sie die Typografie in der Nachbearbeitung hinzu.


Die Iterationsschleife

Professioneller Workflow für Midjourney:

Phase 1: Erkunden (Draft Mode)

1. Enable Draft mode (--draft)
2. Write basic prompt with core concept
3. Generate 4-8 batches quickly
4. Identify promising directions
5. Note what works/doesn't

Ziel: Richtung finden, nicht Perfektion. Geschwindigkeit zählt.

Phase 2: Verfeinern

1. Disable Draft mode
2. Take best concepts from Phase 1
3. Add specific details
4. Adjust parameters (--s, --chaos, etc.)
5. Generate in Fast mode
6. Compare variations

Ziel: Eingrenzen auf 2-3 starke Optionen.

Phase 3: Perfektionieren

1. Select best candidate
2. Note the seed
3. Make micro-adjustments to prompt
4. Use same seed for consistency
5. Upscale final choice

Ziel: Den Gewinner polieren.

Zeitaufteilung

Phase Zeit Modus
Erkunden 60% Draft
Verfeinern 30% Fast
Perfektionieren 10% Fast

Die meisten Benutzer kehren dies um und verbringen zu viel Zeit damit, erste Versuche zu perfektionieren. Erkunden Sie mehr, perfektionieren Sie weniger.


Kostenmanagement

GPU-Zeit verstehen

  • Fast Mode: Verbraucht GPU-Stunden aus Ihrem Abonnement
  • Relax Mode: Unbegrenzt, aber in Warteschlange (Standard+ Pläne)
  • Draft Mode: Halbe GPU-Kosten im Vergleich zu regulär
  • Video: ~8x die Kosten von Bildern

Abonnement-Wert

Plan Fast-Stunden Relax Video Relax $/GPU-Stunde
Basic 3,3 Std. Nein Nein $3,03
Standard 15 Std. Ja Nein $2,00
Pro 30 Std. Ja Ja $2,00
Mega 60 Std. Ja Ja $2,00

Erkenntnis: Standard+ Pläne bieten deutlich besseren Wert pro GPU-Stunde, plus unbegrenztes Relax.

Kostensparstrategien

  1. Im Draft Mode erkunden - Halbe Kosten, 10x schneller
  2. Relax für Exploration nutzen - Kostenlos (Standard+)
  3. Fast für Finals aufsparen - Nur wenn Qualität wichtig ist
  4. Ähnliche Prompts bündeln - Effizienter als Einzelanfragen
  5. Vor dem Generieren planen - Denken, dann generieren

Nutzung einschätzen

Aktion Ungefähre GPU-Minuten
4 Bilder (standard) ~1 Min.
4 Bilder (draft) ~0,5 Min.
Upscale ~0,5 Min.
Video (4x 5 Sek.) ~8 Min.

Fehlerbehebung

Häufige Probleme

Problem Ursache Lösung
Unscharfe Gesichter Niedriges –s oder Stilkonflikt --style raw verwenden, Detail-Prompts erhöhen
Falsches Seitenverhältnis Standard 1:1 --ar explizit angeben
Zu künstlerisch Hohes –s Auf 50-100 senken
Zu wörtlich Niedriges –s Auf 200+ erhöhen
Inkonsistente Ausgaben Niedriges chaos --seed für Konsistenz verwenden
Stil überwältigend Hohes –sw --sw Gewichtung reduzieren
Text wird nicht gerendert V7-Einschränkung Text kurz halten, Anführungszeichen verwenden
Hände sehen falsch aus KI-Einschränkung Zuschneiden oder neu generieren

Parameter-Konflikte

Vermeiden Sie die Kombination von: - --style raw + hohes --s (widersprüchlich) - --v 7 + --niji (eines wählen) - Mehrere starke Referenzen mit 100% Gewichtung - --exp 50+ + --stylize (exp überwältigt) - --exp 50+ + --p (exp überschreibt)

Funktioniert gut: - --oref + --sref bei moderaten Gewichtungen - --chaos + --seed (variiert aber reproduzierbar) - --style raw + niedriges --s (maximaler Fotorealismus) - --exp 10-25 + --s 100-200 (verbessert, kontrolliert)

Wenn nichts funktioniert

  1. Vereinfachen - Parameter entfernen, Prompt kürzen
  2. Aufteilen - Subjekt und Stil separat versuchen
  3. Seed-Suche - Viele generieren, guten Seed finden, iterieren
  4. Referenz - --sref mit Bild verwenden, das Ihr Ziel zeigt
  5. Version - Andere Modellversion versuchen

Versionsmigration

Migration von V6 zu V7

Alter V6-Stil:

portrait, beautiful woman, dramatic lighting, 8k, detailed, masterpiece

Neuer V7-Stil:

A contemplative portrait of a woman in her 30s, Rembrandt lighting
casting gentle shadows across her face, medium format photography
aesthetic with shallow depth of field

Wichtige Änderungen

Aspekt V6 V7
Prompt-Stil Schlüsselwörter Natürliche Sprache
Qualitätswörter Hilfreich Meist ignoriert
Character ref --cref --oref
Personalization Optional Standard
Standardverhalten Stilisiert Wörtlicher

Was Sie nicht mehr tun sollten

  • Schlüsselwort-Spam („beautiful, stunning, amazing”)
  • Qualitätsmodifikatoren („8k, ultra detailed, masterpiece”)
  • --cref verwenden (es heißt jetzt --oref)
  • Kurze, kommagetrennte Prompts

Was Sie jetzt tun sollten

  • Vollständige Sätze schreiben
  • Beschreiben, was Sie sehen, nicht was Sie wollen
  • Spezifisch bei Beleuchtung, Materialien, Stimmung sein
  • Kamera-/Objektiv-Terminologie verwenden
  • Personalization nutzen (--p)

Parameter-Spickzettel

MODELS
--v 7           Default, best overall (June 2025)
--niji 7        Anime/manga (Jan 2026, best coherence)
--niji 6        Anime/manga (legacy, has --style options)
--draft         Fast iteration, 10x faster, half cost

ASPECT
--ar 16:9       Widescreen
--ar 21:9       Cinematic ultrawide
--ar 4:5        Portrait (Instagram)
--ar 9:16       Vertical (Stories)
--ar 1:1        Square
--ar 3:2        Classic photo
--ar 2:3        Portrait print

STYLE
--s 0-100       Photorealistic
--s 100-300     Balanced
--s 300-1000    Artistic
--style raw     Minimal AI interpretation
--p             Apply personalization (V7 default)

EXPERIMENTAL
--exp 0-100     Enhanced detail (10-25 sweet spot)
--chaos 0-100   Output variety
--weird 0-3000  Unconventional aesthetics

REFERENCES
--oref [url]    Subject/character (V7)
--ow 0-1000     Omni weight (default 100)
--sref [url]    Style transfer
--sw 0-1000     Style weight (default 100)
--iw 0-2        Image weight (default 1)

VIDEO (Web only)
--motion low    Subtle movement (default)
--motion high   Dynamic movement
--raw           More prompt control

QUALITY
--q 1           Full quality (default)
--seed [num]    Reproducibility

NEGATIVE
--no [items]    Exclude elements

Änderungsprotokoll

Datum Änderung Quelle
2026-01-20 HD Video Mode Abschnitt hinzugefügt (4x Auflösung, ~3,2x Kosten, nur Pro/Mega) 8
2026-01-17 V8-Entwicklungsstatus, Moodboards-Abschnitt, –sv 4 für Legacy-sref-Codes hinzugefügt Web-Scan
2026-01-16 V7.1-Roadmap-Informationen hinzugefügt, Niji 7-Abdeckung verifiziert Web-Scan
2026-01-13 Leitfaden erstellt mit V7, Niji 7, Video-Abdeckung Mehrere
2026-01-09 Niji 7 veröffentlicht mit verbesserter Kohärenz 3
2025-06-19 V1 Video Model veröffentlicht 4
2025-06-17 V7 wurde Standardmodell 2
2025-04-30 V7-Update: –exp Parameter, Editor-Verbesserungen 5
2025-04-03 V7 veröffentlicht 2

Referenzen


  1. Midjourney Updates. Offizielles Änderungsprotokoll und Ankündigungen. 

  2. Midjourney Version Documentation. „Version 7 was released on April 3, 2025, and became the default model on June 17, 2025.” 

  3. Niji V7 Announcement. „Niji V7 is now live” – 9. Januar 2026. 

  4. V1 Video Model. Videogenerierung veröffentlicht am 19. Juni 2025. 

  5. V7 Update, Editor, and –exp. Update-Details vom 30. April 2025. 

  6. V8 Development Discussion. Community-Diskussion über V8-Training und Roadmap-Details aus David Holz Q&A. 

  7. Moodboards Feature. Midjourney Personalization über Moodboards und Bildbewertung. 

  8. HD Video Mode. „HD Video mode delivers 4x sharper AI-generated clips… costs roughly 3.2 times more than SD.” August 2025.