Midjourney Prompt Engineering: The Complete Guide
Zaktualizowano 3 marca 2026
Aktualizacja z marca 2026: V8 rozpoczął ostatnią fazę destylacji (optymalizacja szybkości) pod koniec lutego, a premiera jest oczekiwana jako opcjonalny, niedomyślny model na początku marca — po uruchomieniu należy spodziewać się około 30-dniowej fazy pre-alpha, zanim zastąpi V7 jako model domyślny.1416 Potwierdzone funkcje V8 obejmują natywną rozdzielczość 2K (2048px), znacząco ulepszone renderowanie tekstu, style references, Moodboards, personalizację, parametr weird, Style Creator, upscaling i edycję.12 Nowy proces tworzenia w V8 wprowadza szybką iterację w niskiej rozdzielczości: 64 obrazy w 256px, szybka eksploracja, a następnie upscaling najlepszych wyników.10 Midjourney przechodzi z TPU na GPUs z PyTorch, co umożliwia szybszą rekrutację i rozwój.11 Personalizacja obsługuje teraz wiele nazwanych profili z przyspieszoną konfiguracją (5x szybciej), a jednocześnie można wybrać kilka aktywnych profili równocześnie.15 Moodboards zyskały parametr --profile do bezpośredniego użycia na podstawie ID i mogą być teraz łączone z kodami --sref w jednym prompcie.1517 Niji 7 (9 stycznia 2026) zapewnia czystsze linie, ulepszone detale oczu i odbić oraz znacząco zmniejszony dryft stylu przy --sref — choć --cref pozostaje niedostępny.3 Interfejs webowy otrzymał funkcję Describe on Web (kliknięcie prawym przyciskiem na dowolnym obrazie generuje 4 tekstowe prompty), nowe proporcje obrazu oraz operacje zbiorcze dla 2000 elementów.1317 Funkcja Rooms została usunięta 26 lutego 2026.16 Video, Moodboards, Draft Mode i wszystkie funkcje V7 pozostają aktualne. Pełna historia zmian znajduje się w sekcji Dziennik zmian.1
Spędziłem setki godzin testując Midjourney w każdej wersji, kombinacji parametrów i kierunku stylistycznym. Ten przewodnik destyluje to doświadczenie w kompleksowe kompendium, które chciałbym mieć na początku swojej drogi. Niezależnie od tego, czy tworzone są pierwsze prompty, czy testowane są granice możliwości — wszystkie techniki znajdują się tutaj.
Midjourney nie jest magicznym konwerterem promptów na obrazy. To zaawansowany system języka wizualnego, który reaguje na określone wzorce, respektuje określone hierarchie i nagradza tych, którzy rozumieją jego architekturę. Różnica między generyczną sztuką AI a oszałamiającymi, celowymi obrazami polega na zrozumieniu tych wzorców.
Kluczowa obserwacja: V7 fundamentalnie zmienił sposób działania promptów. Stare podejście polegające na zrzucaniu słów kluczowych („beautiful, stunning, 8k, detailed, masterpiece”) aktywnie pogarsza wyniki. V7 rozumie język naturalny — prompty powinny brzmieć jak opis fotografii dla doświadczonego operatora kamery, a nie jak tagowanie bazy zdjęć stockowych.
Ten przewodnik obejmuje wszystko — od pierwszej instalacji po zaawansowane techniki, które większość użytkowników nigdy nie odkrywa. Każdy parametr jest udokumentowany z rzeczywistymi zakresami, prawdziwymi przykładami i przypadkami brzegowymi, które stanowią pułapkę nawet dla doświadczonych użytkowników.
Spis treści
Część 1: Podstawy
Część 2: Opanowanie parametrów
Część 3: Systemy referencji
Część 4: Generowanie wideo
Część 5: Szablony gatunkowe
- Realizm filmowy
- Fotografia portretowa
- Fotografia produktowa
- Fantasy i Sci-Fi
- Anime z Niji 7
- Architektura
- Abstrakcja i eksperymenty
Część 6: Zaawansowane techniki
Część 7: Przepływy pracy i optymalizacja
Część 8: Materiały referencyjne
Czym jest Midjourney?
Midjourney to generatywny system AI, który tworzy obrazy na podstawie opisów tekstowych. W odróżnieniu od tradycyjnej edycji zdjęć czy fotografii stockowej, wystarczy opisać to, co chce się zobaczyć, a Midjourney wygeneruje oryginalne obrazy odpowiadające wizji użytkownika.
Co wyróżnia Midjourney:
| Aspekt | Midjourney | Konkurencja |
|---|---|---|
| Jakość obrazu | Wiodąca w branży estetyka | Zróżnicowana |
| Język naturalny | V7 rozumie pełne zdania | Często zależna od słów kluczowych |
| Fotorealizm | Wyjątkowy w V7 | Dobry do doskonałego |
| Anime/Ilustracja | Zoptymalizowane modele Niji | Ogólnego przeznaczenia |
| Wideo | Natywne wsparcie (czerwiec 2025) | Wymaga osobnych narzędzi |
| Społeczność | Zintegrowane udostępnianie/odkrywanie | Różnie |
Co można tworzyć:
- Fotorealistyczne obrazy: portrety, produkty, architektura, natura
- Ilustracje: concept art, okładki książek, grafika redakcyjna
- Anime i manga: za pomocą wyspecjalizowanych modeli Niji
- Sztuka abstrakcyjna: kompozycje eksperymentalne i surrealistyczne
- Wideo: animowane klipy o długości 5–21 sekund na podstawie obrazów
Czym Midjourney nie jest:
- Nie jest edytorem zdjęć (do tego służy Photoshop)
- Nie jest systemem zapewniającym spójność postaci (choć szybko się rozwija)
- Nie jest narzędziem do odtwarzania konkretnych postaci chronionych prawem autorskim
- Nie jest darmowy (subskrypcje od 10 do 120 USD/miesiąc)
Pierwsze kroki
Konfiguracja konta
- Należy odwiedzić midjourney.com
- Zalogować się za pomocą Discord lub utworzyć nowe konto
- Wybrać plan subskrypcji:
| Plan | Cena | Fast GPU | Relax GPU | Video Relax |
|---|---|---|---|---|
| Basic | 10 USD/mies. | 3,3 godz. | — | — |
| Standard | 30 USD/mies. | 15 godz. | Bez limitu | — |
| Pro | 60 USD/mies. | 30 godz. | Bez limitu | Tak |
| Mega | 120 USD/mies. | 60 godz. | Bez limitu | Tak |
Wskazówka eksperta: Warto zacząć od planu Standard (30 USD/mies.). Nieograniczony tryb Relax jest niezbędny do eksperymentowania — godziny w trybie Fast szybko się wyczerpią podczas nauki.
Pierwszy prompt
Należy otworzyć interfejs webowy pod adresem midjourney.com/imagine i wpisać:
A golden retriever sitting in autumn leaves, soft afternoon sunlight
To wszystko. Nie jest potrzebna żadna specjalna składnia. V7 rozumie język naturalny.
Co otrzymamy: Cztery warianty golden retrievera w jesiennej scenerii. Następnie można:
- Upscale: kliknąć U1–U4, aby wygenerować wersję w wysokiej rozdzielczości
- Vary: kliknąć V1–V4, aby stworzyć subtelne warianty
- Reroll: wygenerować cztery nowe warianty z tym samym promptem
Interfejs webowy a Discord
| Funkcja | Interfejs webowy | Discord |
|---|---|---|
| Łatwość obsługi | Łatwiejszy | Wyższa bariera wejścia |
| Organizacja obrazów | Wbudowana galeria | Rozproszone po kanałach |
| Generowanie wideo | Pełne wsparcie | Niedostępne |
| Edycja promptów | Interfejs graficzny | Polecenia tekstowe |
| Społeczność | Zakładka Explore | Przeglądanie kanałów |
| Rekomendacja | Zacznij tutaj | Dla zaawansowanych |
Interfejs webowy jest obecnie podstawowym sposobem korzystania z platformy. Discord działa, ale nie oferuje generowania wideo i ma mniej intuicyjny przepływ pracy.
Kluczowe pojęcia
Jak działają prompty
Każdy prompt w Midjourney przechodzi przez następujący proces:
Your Text Prompt
↓
[Text Encoder] → Converts words to mathematical embeddings
↓
[Diffusion Model] → Generates image from noise, guided by embeddings
↓
[Upscaler] → Increases resolution and detail
↓
Final Image
Co to oznacza w praktyce:
- Kolejność słów ma znaczenie: wcześniejsze słowa mają większy wpływ niż późniejsze
- Konkretność wygrywa: „golden hour sunlight casting long shadows” działa lepiej niż „nice lighting”
- Sprzeczności wprowadzają chaos: „dark, bright, moody, cheerful” wzajemnie się znosi
- Mniej często znaczy więcej: 50–150 tokenów zazwyczaj daje lepsze wyniki niż 300+
Ekonomia tokenów
Midjourney nie widzi słów — widzi tokeny (w przybliżeniu fragmenty wyrazów).
| Liczba tokenów | Efekt | Najlepsze zastosowanie |
|---|---|---|
| 10–30 | Bardzo otwarta interpretacja | Abstrakcja, eksperymenty |
| 30–80 | Zrównoważona kontrola | Większość promptów |
| 80–150 | Szczegółowa kontrola | Konkretne sceny |
| 150+ | Malejące korzyści | Może powodować konflikty |
Wskazówka eksperta: Jeśli prompt przekracza 150 tokenów, prawdopodobnie jest zbyt szczegółowy. Warto ograniczyć nadmiar przymiotników.
Sygnały jakości
V7 silnie reaguje na określone wzorce opisowe:
Oświetlenie (największy wpływ): - „golden hour light casting long shadows across weathered stone” - „Rembrandt lighting with soft fill from camera left” - „bioluminescent glow illuminating the fog”
Materiały i tekstury: - „oxidized copper with verdigris patina” - „worn leather showing decades of use” - „translucent jade catching the light”
Atmosfera i nastrój: - „melancholic twilight atmosphere” - „oppressive industrial ambiance” - „ethereal dreamlike quality”
Techniczne terminy fotograficzne: - „shot on medium format, shallow depth of field” - „85mm lens, f/1.8 aperture” - „anamorphic lens flare, 2.39:1 aspect”
Hierarchia promptu
Każdy skuteczny prompt opiera się na hierarchii. Słowa na szczycie mają największy wpływ.
┌─────────────────────────────────────────────────┐
│ 1. SUBJECT (who/what) ← Most important │
│ "elderly fisherman" │
├─────────────────────────────────────────────────┤
│ 2. SUBJECT DETAILS (descriptors) │
│ "weathered face, silver beard, kind eyes" │
├─────────────────────────────────────────────────┤
│ 3. CONTEXT (where/when) │
│ "on a wooden dock at dawn" │
├─────────────────────────────────────────────────┤
│ 4. STYLE/MOOD (how it feels) │
│ "documentary photography, contemplative" │
├─────────────────────────────────────────────────┤
│ 5. TECHNICAL (camera/lighting) │
│ "shot on Leica, natural morning light" │
├─────────────────────────────────────────────────┤
│ 6. PARAMETERS (--ar, --s, etc.) ← Fine-tuning │
│ "--ar 3:2 --s 100 --v 7" │
└─────────────────────────────────────────────────┘
Szablon promptu
[SUBJECT] [SUBJECT DETAILS], [CONTEXT], [STYLE/MOOD], [TECHNICAL] --parameters
Przykład zastosowania hierarchii:
An elderly fisherman with a weathered face and silver beard, standing on a
wooden dock at dawn, documentary photography style, contemplative mood,
shot on Leica M11 with natural morning light, soft mist rising from the water
--ar 3:2 --s 100 --v 7
Czego większość użytkowników nie dostrzega: Zaczynają od stylu („beautiful cinematic photo of…”) zamiast od podmiotu. V7 przypisuje dużą wagę początkowym tokenom — na pierwszym miejscu powinien znajdować się obiekt, który faktycznie ma się pojawić na obrazie.
Wybór wersji
V7 (domyślna od czerwca 2025)
V7 to aktualny flagowy model Midjourney, wydany 3 kwietnia 2025 roku.2
Mocne strony: - Rozumienie języka naturalnego (pisanie zdaniami, nie słowami kluczowymi) - Najlepszy fotorealizm w historii - Znacząco ulepszone renderowanie tekstu - Lepsza anatomia ludzka (dłonie, ciała) - Ulepszone relacje przestrzenne - Personalizacja włączona domyślnie
Tryby generowania:
| Tryb | Szybkość | Koszt | Najlepszy do |
|---|---|---|---|
| Turbo | Najszybszy | 2x normalnego | Finalne rendery, gdy liczy się czas |
| Fast | Normalny | 1x | Standardowy workflow |
| Relax | W kolejce | W cenie | Eksploracja, nauka |
| Draft | 10x szybszy | 0,5x | Szybka iteracja |
Kiedy używać V7: - Fotorealistyczne obrazy - Dowolny prompt ze złożonym językiem naturalnym - Renderowanie tekstu - Gdy jakość jest najważniejsza
Niji 7 (styczeń 2026)
Niji 7 to wyspecjalizowany model anime/manga, wydany 9 stycznia 2026 roku.3
Mocne strony:
- Krystalicznie czyste oczy, odbicia i drobne detale tła3
- Ulepszona spójność dla złożonych póz i układów z wieloma ramionami
- Bardziej dosłowna interpretacja promptów — precyzyjnie obsługuje konkretne pozycje kolorów i fryzury
- Lepsze renderowanie tekstu
- Ulepszona wydajność --sref ze znacząco zmniejszonym dryftem stylu3
- Czysta, płaska estetyka linii zaprojektowana w celu podkreślenia ulepszonej jakości linii
Ograniczenia:
- --cref NIE jest obsługiwany — zespół sugeruje „potężniejszą, tajemniczą niespodziankę” jako alternatywę3
- Personalizacja (--p) i Moodboards są wdrażane (mogą nie być jeszcze w pełni dostępne)
- Bardziej dosłowny niż poprzednie wersje Niji — należy dostosować nastrojowe prompty
Wkrótce:
- Nowy system referencji postaci, który zastąpi --cref (oczekuje się, że przewyższy możliwości --cref)
Użycie:
A determined young mage with crimson hair, casting fire magic,
intense expression, ancient library background --niji 7
Kiedy używać Niji 7: - Ilustracje w stylu anime i manga - Projektowanie postaci - Ilustracje o wschodniej estetyce - Gdy potrzebna jest czystsza kreska
Niji 6 (starszy model)
Nadal dostępny w celu zachowania kompatybilności wstecznej.
Kiedy używać Niji 6:
- Potrzebne są presety stylów (--style expressive, --style cute, --style scenic)
- Workflow zależy od --cref
- Preferowana jest łagodniejsza, mniej dosłowna interpretacja
Style:
--niji 6 --style expressive # Dynamic, stylized
--niji 6 --style cute # Kawaii aesthetic
--niji 6 --style scenic # Background focus
--niji 6 --style original # Classic Niji look
Porównanie wersji
| Funkcja | V7 | Niji 7 | Niji 6 |
|---|---|---|---|
| Fotorealizm | Doskonały | N/A | N/A |
| Anime | Dobry | Doskonały | Doskonały |
| Język naturalny | Najlepszy | Dobry | Umiarkowany |
| Renderowanie tekstu | Najlepsze | Dobre | Ograniczone |
--oref |
Tak | Nie | Nie |
--cref |
Nie | Nie | Tak |
--sref |
Tak | Tak (najlepszy) | Tak |
--p |
Tak | Nie | Opcjonalnie |
| Presety stylów | Nie | Nie | Tak |
Status rozwoju V8 (marzec 2026)
V8 rozpoczął końcowy przebieg destylacji (optymalizacja szybkości) pod koniec lutego 2026, po wielu sesjach oceny społecznościowej w połowie lutego.121416 Destylacja trwa około jednego tygodnia; po jej zakończeniu V8 zostanie udostępniony jako model opt-in, nie domyślny na około 30-dniową fazę pre-alpha, zanim zastąpi V7 jako domyślny.16 Przewodnicy i moderatorzy rozpoczęli wewnętrzne testy pod koniec stycznia.9
Potwierdzone funkcje V8: - Natywna rozdzielczość 2K (2048px) — eliminuje pośredni upscaler na rzecz rzeczywiście ostrzejszego wyniku14 - Ogromne ulepszenia w renderowaniu tekstu (najsłabszy punkt V7)14 - Lepsza generacja złożonych obiektów (stworzenia, centaury, nietypowa anatomia) - Całkowite przepisanie architektury (nowy codebase, obsługuje od 64px do 2048px+ natywnie)14 - Style references, Moodboards, personalizacja, parametr weird — wszystko obsługiwane12 - Style Creator i profile webowe do udostępniania stylów w społeczności11 - Wbudowane możliwości Upscale i edycji12 - Nowy flow tworzenia: 64 obrazy w 256px do szybkiej eksploracji, następnie zawężanie i upscalowanie zwycięzców10 - Przejście infrastruktury z TPU na GPU z PyTorch (lepiej wspierany codebase, szybsza rekrutacja)11 - Wariant V8 „mini” zaprojektowany dla słabszego sprzętu11 - Dążenie do generowania podglądu w czasie rzeczywistym
Harmonogram (stan na początek marca 2026): - Testy wewnętrzne: styczeń 20269 - Sesje oceny: początek–połowa lutego 202612 - Przebieg destylacji: rozpoczęty pod koniec lutego 2026 (~1 tydzień)16 - Wydanie: oczekiwane na początku marca 2026 jako opt-in, nie domyślny16 - Pre-alpha: ~30 dni po wydaniu opt-in, następnie staje się domyślny16 - Ulepszenia aplikacji mobilnej planowane po premierze V89 - Funkcjonalność 3D z ruchem kamery i reframingiem w trakcie rozwoju9
Co dalej po V8: - Projekty sprzętowe: cztery w toku, w tym urządzenie noszone i projekt montażowy w skali magazynu10 - Rozbudowa trybu wsadowego z systemem uczenia preferencji użytkownika9 - Modele AI w czasie rzeczywistym jako cel długoterminowy9
Proporcje obrazu
Parametr --ar ustawia wymiary obrazu. Domyślnie 1:1 (kwadrat).
Popularne proporcje
| Proporcje | Wymiary | Zastosowanie |
|---|---|---|
1:1 |
Kwadrat | Media społecznościowe, ikony |
4:5 |
Portret | Feed na Instagramie, urządzenia mobilne |
5:4 |
Krajobraz | Pulpit, prezentacje |
16:9 |
Panoramiczny | YouTube, prezentacje |
6:11 |
Wysoki portret | Tapety na telefon, pionowe plakaty |
9:16 |
Pionowy | Stories, TikTok, urządzenia mobilne |
21:9 |
Ultraszeroki | Kinowy, filmowy |
3:2 |
Klasyczny | Odbitki fotograficzne |
2:3 |
Portret | Pionowe odbitki |
Rekomendacje dla poszczególnych platform
| Platforma | Proporcje | Uwagi |
|---|---|---|
| Instagram Feed | 1:1 lub 4:5 |
4:5 zajmuje więcej miejsca na ekranie |
| Instagram Story | 9:16 |
Pełny format pionowy |
| Twitter/X | 16:9 lub 1:1 |
16:9 rozwija się w feedzie |
1.91:1 lub 16:9 |
Profesjonalny format krajobrazowy | |
2:3 |
Format pionowy sprawdza się najlepiej | |
| Miniatura YouTube | 16:9 |
Standardowy format wideo |
| Tapeta pulpitu | 16:9 lub 21:9 |
Dopasowanie do monitora |
Wpływ na kompozycję
Proporcje obrazu to nie tylko wymiary — fundamentalnie zmieniają kompozycję.
Szerokie proporcje (16:9, 21:9): - Podkreślają otoczenie i kontekst - Naturalne dla krajobrazów, panoram miejskich - Kinowy charakter - Obiekty stają się częścią sceny
Wysokie proporcje (4:5, 9:16): - Skupiają uwagę na obiekcie - Naturalne dla portretów, produktów - Intymny charakter - Więcej informacji w pionie
Wskazówka eksperta: Dla kinowych portretów warto wypróbować 4:5 zamiast oczywistego 16:9. Uzyskuje się kadrowanie skoncentrowane na obiekcie jak w portrecie, z wystarczającym kontekstem do opowiadania historii.
Stylizacja
Parametr --s kontroluje, ile artystycznej interpretacji V7 stosuje. Zakres: 0–1000. Domyślnie: 100.
Zakresy stylizacji
| Zakres | Efekt | Najlepszy do |
|---|---|---|
| 0–50 | Minimalna interpretacja | Zdjęcia produktowe, dokładność techniczna |
| 50–150 | Zrównoważony (domyślny) | Ogólne zastosowanie, portrety |
| 150–300 | Zauważalny styl | Artystyczne zdjęcia, kompozycje nastrojowe |
| 300–500 | Silny styl | Ilustracje, koncepcyjne |
| 500–1000 | Bardzo stylizowany | Abstrakcyjne, eksperymentalne |
Przykłady wizualne
Portrait of a woman, soft window light --s 50
# Result: Clean, realistic, minimal embellishment
Portrait of a woman, soft window light --s 250
# Result: More artistic interpretation, enhanced mood
Portrait of a woman, soft window light --s 600
# Result: Distinctly stylized, dreamlike quality
Schemat decyzyjny
Niska stylizacja (0–100) — kiedy stosować: - Tworzenie fotografii produktowej - Potrzebna jest fotorealistyczna dokładność - Obrazy techniczne/dokumentacyjne - Prompt powinien być interpretowany dosłownie
Średnia stylizacja (100–300) — kiedy stosować: - Ogólna praca kreatywna - Fotografia redakcyjna - Pożądane wzmocnienie bez skrajności - Równowaga między realizmem a artyzmem
Wysoka stylizacja (300+) — kiedy stosować: - Tworzenie ilustracji lub concept artu - Praca abstrakcyjna lub eksperymentalna - Estetyka Midjourney ma dominować - Przesuwanie granic kreatywnych
Stylizacja + Style Raw
Aby uzyskać maksymalny fotorealizm, należy połączyć niską stylizację z --style raw:
Portrait of a businessman, office background --s 50 --style raw --v 7
--style raw informuje V7, aby zminimalizował własną interpretację estetyczną, dając wyniki bliższe dosłownemu spełnieniu promptu.
Chaos i Weird
Chaos (–chaos 0–100)
Kontroluje zróżnicowanie między czterema wygenerowanymi obrazami. Domyślnie: 0.
| Wartość | Efekt |
|---|---|
| 0 | Bardzo podobne wyniki |
| 25 | Niewielkie różnice |
| 50 | Umiarkowana różnorodność |
| 75 | Duża różnorodność |
| 100 | Maksymalna nieprzewidywalność |
Kiedy używać chaos:
- Faza eksploracji: --chaos 50-75 aby zobaczyć różnorodne interpretacje
- Finalny render: --chaos 0-25 dla spójnych wyników
- Szukanie kierunku: wysoki chaos na początku, niski chaos przy dopracowywaniu
Weird (–weird 0–3000)
Wprowadza niekonwencjonalną, niespodziewaną estetykę. Domyślnie: 0.
| Zakres | Efekt |
|---|---|
| 0 | Standardowa estetyka |
| 100–500 | Subtelne dziwactwa |
| 500–1000 | Zauważalna osobliwość |
| 1000–2000 | Bardzo nietypowy |
| 2000–3000 | Maksymalna dziwność |
Kiedy używać weird: - Surrealistyczne lub oniryczne obrazy - Wyjście poza generyczną estetykę AI - Eksploracja concept artu - Gdy „normalne” wydaje się zbyt przewidywalne
Łączenie Chaos i Weird
--chaos 50 --weird 500 # Varied outputs, each slightly quirky
--chaos 100 --weird 0 # Wild variations, normal aesthetic
--chaos 25 --weird 2000 # Similar outputs, all very weird
Wskazówka eksperta: Wysoka wartość weird może generować naprawdę nietypowe obrazy, ale efekty bywają niespójne. Warto używać go do eksploracji, a następnie zmniejszyć wartość przy finalnych renderach.
Estetyka eksperymentalna
Parametr --exp dodaje wzmocnione detale, dynamikę i efekty tone mappingu. Zakres: 0–100. Domyślnie: 0.
Poziomy efektu
| Wartość | Efekt | Uwagi |
|---|---|---|
| 0 | Wyłączony (domyślny) | Standardowe renderowanie |
| 5 | Subtelne wzmocnienie | Bezpieczne do łączenia z innymi parametrami |
| 10 | Zauważalny wzrost detali | Dobry punkt wyjścia |
| 25 | Silny efekt | Zalecane maksimum do łączenia |
| 50 | Bardzo silny | Może obniżyć dokładność promptu |
| 100 | Maksymalny | Może zdominować –stylize i –p |
Co robi –exp
- Bardziej szczegółowe tekstury i powierzchnie
- Bardziej dynamiczne, wyraziste kompozycje
- Wygląd przypominający HDR z tone mappingiem
- Wzmocniona atrakcyjność wizualna
Zalecane kombinacje
--exp 10 --s 200 # Enhanced detail, balanced style
--exp 25 --s 100 # Strong exp, controlled stylize
--exp 5 --style raw # Subtle boost for photorealism
Ostrzeżenie: konflikty parametrów
Przy wysokich wartościach (powyżej 25–50) --exp może:
- Zdominować ustawienia --stylize
- Nadpisać personalizację (--p)
- Zmniejszyć różnorodność obrazów
Wskazówka eksperta: Wartość --exp na poziomie 10–25 sprawdza się w większości zastosowań. Wyższe wartości są przeznaczone do konkretnych efektów stylistycznych, a nie do ogólnej poprawy jakości.
Omni Reference
Parametr --oref przenosi cechy podmiotu z obrazu referencyjnego do generowanej grafiki. Zastąpił on --cref w V7.
Podstawowe użycie
/imagine A woman in a red dress at a gala --oref [image URL]
Co jest przenoszone: - Twarz i rysy twarzy - Typ sylwetki i proporcje - Ubranie i akcesoria - Ogólna tożsamość
Kontrola wagi (–ow)
--ow 0-1000 # Omni weight (default 100)
| Waga | Efekt |
|---|---|
| 0-30 | Luźna inspiracja, pozwala na zmiany stylu |
| 30-60 | Umiarkowany wpływ |
| 60-100 | Silne podobieństwo (domyślny zakres) |
| 100-300 | Bardzo bliskie dopasowanie |
| 300-1000 | Maksymalna wierność |
Interakcje wag
Parametr --ow konkuruje z --stylize i --exp o wpływ na wynik. Przy wysokich wartościach stylize lub exp należy zwiększyć --ow, aby zachować spójność z referencją:
# High stylize needs higher ow to keep reference
--oref [url] --ow 200 --s 400
# High exp overwhelms default ow
--oref [url] --ow 300 --exp 25
# If you aren't using high stylize/exp, stay at moderate ow (100-400)
Wskazówka eksperta: W większości przypadków, bez ekstremalnych wartości --stylize lub --exp, warto utrzymywać --ow poniżej 400. Wyższe wartości należy stosować tylko wtedy, gdy konieczne jest zachowanie dokładnych rysów twarzy lub detali ubioru w konfrontacji z silnymi parametrami stylu.
Najlepsze praktyki
Jakość obrazu referencyjnego ma znaczenie: - Wysoka rozdzielczość, wyraźny podmiot - Zdjęcia frontalne działają najlepiej w przypadku twarzy - Spójne oświetlenie w referencji - Minimalna ilość rozpraszających elementów tła
Dostosowywanie wagi przy zmianach stylu:
# Photo to anime conversion - lower weight
--oref [photo URL] --ow 40 --niji 7
# Maintaining strict likeness
--oref [photo URL] --ow 200 --v 7
Łączenie z style reference:
# Subject from one image, style from another
--oref [subject URL] --sref [style URL] --ow 100 --sw 150
Style Reference
Parametr --sref przenosi cechy estetyczne z obrazu referencyjnego.
Podstawowe użycie
/imagine A mountain landscape at sunset --sref [style image URL]
Co jest przenoszone: - Paleta kolorów - Styl oświetlenia - Technika artystyczna - Ogólny nastrój/atmosfera - Tendencje kompozycyjne
Kontrola wagi (–sw)
--sw 0-1000 # Style weight (default 100)
| Waga | Efekt |
|---|---|
| 0-50 | Subtelny wpływ |
| 50-150 | Zrównoważone przenoszenie |
| 150-300 | Silne dopasowanie stylu |
| 300-1000 | Dominujący styl |
Wiele referencji stylu
Można łączyć wiele obrazów referencyjnych stylu:
--sref [url1] [url2]
Style mieszają się ze sobą. Umożliwia to tworzenie unikatowych kombinacji estetycznych.
Najlepsze praktyki
Najlepiej sprawdza się z: - Wyrazistymi, spójnymi stylami - Wyraźnymi cechami estetycznymi - Obrazami o silnej tożsamości wizualnej
Mniej skuteczne dla: - Bardzo ogólnych zdjęć - Mieszanych lub niejasnych stylów - Obrazów, w których „styl” nie jest oczywisty
Wskazówka eksperta: Niji 7 oferuje najlepszą wydajność --sref. Jeśli przenoszenie stylu jest kluczowe, warto rozważyć użycie Niji 7 nawet dla treści nie związanych z anime.
Używanie starych kodów Style Reference
Kody --sref z ery V6 nie działają bezpośrednio w V7. Należy dodać --sv 4, aby użyć starszych kodów stylu:
/imagine A mountain landscape --sref 123456789 --sv 4
# --sv 4 tells V7 to interpret the code using V6 style system
Uwaga: Choć zapewnia to kompatybilność wsteczną, warto rozważyć ponowne wygenerowanie referencji stylu w V7, aby uzyskać lepsze wyniki z nowym modelem.
Image Weight
Parametr --iw kontroluje stopień wpływu obrazu referencyjnego na generowaną grafikę.
Podstawowe użycie
/imagine [prompt] [image URL] --iw 1.5
Zakres wag
Zakres: 0-2 (domyślnie 1)
| Waga | Efekt |
|---|---|
| 0-0,5 | Dominuje prompt |
| 0,5-1 | Równowaga |
| 1-1,5 | Dominuje obraz |
| 1,5-2 | Silny wpływ obrazu |
Przypadki użycia
Niska waga (0-0,5): Obraz jako luźna inspiracja, podczas gdy prompt dominuje
Równowaga (0,5-1): Równy wpływ promptu i obrazu
Wysoka waga (1,5-2): Tworzenie wariantów ściśle opartych na obrazie
Moodboards (spersonalizowane profile stylu)
Moodboards umożliwiają tworzenie spersonalizowanych profili stylu poprzez ocenianie obrazów. Zamiast korzystać z pojedynczego obrazu --sref, buduje się stabilne preferencje estetyczne na podstawie wielu przykładów.7 Można teraz tworzyć wiele nazwanych profili, ustawiać profil domyślny, a nawet aktywować jednocześnie kilka profili.15
Jak działają Moodboards
- Utworzenie moodboard na midjourney.com/personalize
- Ocenianie obrazów (lubię/nie lubię) w celu wytrenowania stylu — konfiguracja jest teraz do 5x szybsza15
- Zastosowanie za pomocą
--pw celu użycia domyślnego moodboard - Zastosowanie za pomocą
--p [mID]w celu użycia konkretnego moodboard - Nazywanie i organizowanie wielu profili dla różnych projektów lub współpracowników15
Budowanie stabilnego profilu
| Oceny | Stabilność |
|---|---|
| 40 | Minimum dla użytecznego profilu15 |
| 200 | Dość stabilny, wiarygodne wyniki15 |
| 2 000 | Maksymalne dopracowanie, najlepsza spójność15 |
Wskazówka eksperta: Należy ocenić co najmniej 200 obrazów, aby uzyskać wiarygodny moodboard. Warto uwzględniać zarówno polubienia, JAK I odrzucenia — odrzucenia pomagają Midjourney zrozumieć, czego unikać. Można aktywować jednocześnie kilka profili w celu uzyskania mieszanej estetyki.15
Używanie Moodboards
/imagine A forest path at dawn --p
# Uses your default moodboard
/imagine A forest path at dawn --p abc123
# Uses specific moodboard with ID abc123
/imagine A forest path at dawn --profile abc123
# Alternative syntax using --profile parameter
Moodboards a Style Reference
| Podejście | Najlepsze zastosowanie |
|---|---|
--sref |
Jednorazowy styl z pojedynczego obrazu |
--p (Moodboard) |
Spójna osobista estetyka w wielu projektach |
Łączenie Moodboards z –sref
Moodboards można łączyć z kodami style reference w jednym prompcie, aby uzyskać precyzyjną kontrolę:17
/imagine A portrait --p --sref [url] --sw 50
# Your moodboard aesthetic + subtle style reference influence
/imagine A portrait --sref 142710498 --profile drgmjoi 2jrqbw6
# Mix sref codes with multiple moodboard profiles
Można również udostępniać migawki moodboard jako kody (np. --profile 2jrqbw6), z których mogą korzystać inni, lub udostępnić link do wersji na żywo, która aktualizuje się w miarę dalszego dopracowywania.17
Draft mode
Draft mode generuje obrazy 10x szybciej za połowę kosztu GPU. Niezbędny przy eksploracji.
Włączanie Draft mode
/imagine [prompt] --draft
Lub przełączanie w ustawieniach interfejsu webowego.
Porównanie Draft a pełny render
| Aspekt | Draft | Pełny |
|---|---|---|
| Szybkość | ~10x szybszy | Standardowa |
| Koszt GPU | 50% | 100% |
| Szczegółowość | Zmniejszona | Pełna |
| Najlepszy do | Eksploracji | Końcowego wyniku |
Przepływ pracy z Draft
1. Draft Mode Exploration (--draft)
├── Test 5-10 variations quickly
├── Identify promising directions
└── Note effective parameters
2. Full Render Refinement
├── Remove --draft flag
├── Apply learned parameters
└── Fine-tune with --seed
Wskazówka eksperta: Zawsze warto zaczynać w Draft mode. Oszczędności kosztów się kumulują, a możliwości eksploracji są znacznie większe. Na pełny render należy przechodzić dopiero po znalezieniu kierunku wartego dalszego rozwijania.
Podstawy generowania wideo z obrazu
Model wideo Midjourney V1 został uruchomiony 19 czerwca 2025 roku, umożliwiając animację obrazów.
Jak to działa
- Wybranie dowolnego obrazu (wygenerowanego przez Midjourney lub przesłanego)
- Kliknięcie przycisku „Animate”
- Wybór opcji (Auto, Manual, Loop)
- Wygenerowanie 5-sekundowego klipu wideo
Parametry ruchu
--motion low # Still scenes, slow motion, subtle movement (default)
--motion high # Big camera motions, larger character movements
--raw # Reduces creative flair, more prompt control
Porównanie ustawień ruchu
| Ustawienie | Efekt | Najlepsze zastosowanie |
|---|---|---|
| Low | Subtelny, kinowy ruch | Portrety, martwa natura, atmosfera |
| High | Dynamiczny, energiczny ruch | Akcja, krajobrazy, tłumy |
Ostrzeżenie: Wysoki poziom ruchu może powodować nierealistyczne lub zniekształcone ruchy. Należy zaczynać od niskiego poziomu i zwiększać go tylko w razie potrzeby.
Koszt i plany
- Zadania wideo kosztują ~8x więcej niż zadania graficzne
- Każde zadanie generuje cztery 5-sekundowe filmy
- Dostępne wyłącznie w interfejsie webowym (nie w Discord)
| Plan | Wideo w Fast Mode | Wideo w Relax Mode |
|---|---|---|
| Basic | Tak | Nie |
| Standard | Tak | Nie |
| Pro | Tak | Tak |
| Mega | Tak | Tak |
HD Video Mode
HD Video mode (uruchomiony w sierpniu 2025) zapewnia 4x ostrzejszą rozdzielczość — czterokrotnie większą gęstość pikseli dla znacząco lepszej jakości wideo.8
Jak korzystać z HD Video: 1. Najpierw wygenerowanie standardowego wideo 2. Kliknięcie opcji HD na ukończonym wideo 3. Oczekiwanie na render w wysokiej rozdzielczości
Koszty HD Video: - Kosztuje ~3,2x więcej niż standardowe wideo - Dostępne wyłącznie w planach Pro i Mega - Wymaga najpierw standardowego wideo (nie można generować bezpośrednio w HD)
| Tryb | Rozdzielczość | Względny koszt |
|---|---|---|
| Standard (SD) | Bazowa | 1x |
| High Definition (HD) | 4x pikseli | ~3,2x |
Kiedy używać HD: - Finalne materiały do dostarczenia - Duże wyświetlacze lub projekcje - Praca profesjonalna/komercyjna - Gdy szczegóły w ruchu mają znaczenie
Wskazówka eksperta: Zawsze należy testować w SD. HD trwa dłużej i kosztuje więcej — warto ulepszać tylko najlepsze klipy.
Wydłużanie i zapętlanie
Wydłużanie wideo
Każde wideo można wydłużyć o dodatkowe 4 sekundy, maksymalnie 4 razy (do 21 sekund).
Opcje wydłużania: - Auto: Automatyczna kontynuacja wideo - Manual: Możliwość dostosowania promptu przed wydłużeniem
Najlepsze praktyki przy wydłużaniu: - Planowanie łuku narracyjnego przed rozpoczęciem - Pierwsze 5 sekund powinno ustanowić scenę - Każde wydłużenie powinno mieć swój cel - Uwzględnienie tempa — 21 sekund to więcej, niż się wydaje
Tworzenie pętli
Opcja Loop tworzy płynnie zapętlone wideo, w którym pierwszy i ostatni klatka są dopasowane.
Select image → Click "Loop" → Generate
Najlepsze zastosowania: - Animacje tła - Treści do mediów społecznościowych - Wizualizacje ambient - Cinemagraphs
Wskazówki dla lepszych pętli: - Prosty, powtarzalny ruch działa najlepiej - Unikanie złożonych ruchów kamery - Elementy atmosferyczne (chmury, woda, ogień) zapętlają się naturalnie
Najlepsze praktyki wideo
Kiedy używać wideo
Dobre kandydatury na wideo: - Sceny atmosferyczne (mgła, deszcz, ogień) - Subtelny ruch (włosy, tkanina, woda) - Krajobrazy z ruchem środowiskowym - Portrety z minimalnym ruchem
Mniej idealne do wideo: - Złożone sekwencje akcji - Sceny z wieloma postaciami - Precyzyjna choreografia - Wymagania dotyczące dokładności technicznej
Optymalizacja pod wideo
Przed animowaniem: 1. Najpierw wygenerowanie idealnego statycznego obrazu 2. Rozważenie, jak elementy mogą się poruszać 3. Unikanie złożonych, wzajemnie powiązanych podmiotów 4. Proste kompozycje animują się lepiej
Dostosowywanie promptu:
# Good for video
Lone figure standing on cliff edge, wind blowing cape, dramatic clouds
# Less ideal for video
Group of dancers in synchronized formation, precise movements
Zarządzanie kosztami
Przy 8-krotnym koszcie obrazu, wydatki na wideo szybko rosną:
Efektywny kosztowo przepływ pracy: 1. Eksploracja w Draft mode (obrazy) 2. Znalezienie idealnej kompozycji 3. Wygenerowanie końcowego obrazu wysokiej jakości 4. Animowanie wyłącznie najlepszej wersji 5. Wydłużanie tylko w razie konieczności
Realizm filmowy
Najskuteczniejszy wzorzec uzyskiwania fotorealistycznych, filmowych rezultatów.
Szablon filmowy
[Shot type] by [Director], [subject physical description],
[action/pose], [costume/styling], [setting details],
captured with [Camera Body] using [Lens], [lighting description],
[mood/atmosphere summary]
--ar [ratio] --s [value] --p --no anime, cartoon, illustration, painting
Style reżyserskie
| Reżyser | Styl wizualny | Najlepszy do |
|---|---|---|
| Ridley Scott | Atmosferyczny, teksturowany, nastrojowy | Sci-fi, dramat historyczny, zbliżenia |
| Denis Villeneuve | Epicka skala, pustynny, geometryczny | Krajobrazy, szerokie ujęcia |
| David Fincher | Mroczny, precyzyjny, niepokojący | Thrillery, nastrojowe portrety |
| Roger Deakins | Sylwetki, naturalne światło, poetycki | Każde ujęcie skupione na oświetleniu |
| Alfonso Cuarón | Immersyjny, intymny, śledzący | Sceny z postaciami, napięcie |
| Wes Anderson | Symetryczny, pastelowy, kapryśny | Stylizowane, wycentrowane kompozycje |
| Christopher Nolan | Skala IMAX, praktyczny, intensywny | Akcja, architektura |
| Terrence Malick | Złota godzina, eteryczny, natura | Krajobrazy, kontemplacja |
Kamery filmowe — przewodnik
| Kamera | Estetyka | Najlepsza do |
|---|---|---|
| RED Komodo | Współczesne kino cyfrowe | Zbliżenia, narracja |
| ARRI ALEXA | Filmowy obraz, bogate kolory | Wszystko w kinie |
| ARRI Alexa Mini | Jak ALEXA, mniejsza | Dokument, z ręki |
| ARRI ALEXA 65 | Wielki format, epicka skala | Krajobrazy, efekt IMAX |
| RED V-Raptor | 8K, ostry, dynamiczny | Akcja, wysoki detal |
| Sony Venice | Pełna klatka, wszechstronna | Słabe światło, anamorficzny |
| Hasselblad | Średni format, luksusowa | Portrety, moda |
| Leica M | Dalmierz, klasyczna | Street, dokument |
Dobór obiektywów
| Ogniskowa | Efekt | Najlepsza do |
|---|---|---|
| 24mm f/1.4 | Szeroki kąt, środowiskowy | Krajobrazy, ujęcia ustanawiające |
| 35mm f/2.0 | Naturalny, wszechstronny | Dokument, street |
| 50mm f/1.4 | Klasyczny, zrównoważony | Zastosowania ogólne |
| 85mm f/1.8 | Portretowy, płytka głębia ostrości | Zbliżenia, portrety |
| 105mm f/2.0 | Kompresja, intymny | Portrety głowy |
| 135mm f/2.0 | Maksymalna kompresja | Ciasne portrety |
Kompletne przykłady filmowe
Portret zbliżeniowy:
Dramatic close-up portrait by Ridley Scott, young woman with pale skin
and auburn hair, intense green eyes staring directly at camera, subtle
freckles across nose, wearing dark wool coat, rain falling around her
face, captured with RED Komodo using 85mm f/1.8 lens, cold blue-silver
lighting with warm practical rim light, melancholic determined atmosphere
--ar 4:5 --s 150 --p --no anime, cartoon, illustration, painting
Szerokie ujęcie filmowe:
Epic wide shot by Denis Villeneuve, lone figure in orange survival suit
walking across endless salt flats, geometric patterns in dried earth,
massive dust storm approaching on horizon, captured with ARRI ALEXA 65
using 24mm f/2.0 lens, harsh afternoon sun creating stark shadows,
desolate apocalyptic atmosphere
--ar 21:9 --s 200 --p --no anime, cartoon, illustration, painting
Ważna uwaga: Nigdy nie należy używać imion aktorów. Osoby należy opisywać fizycznie. „Young woman with pale skin and auburn hair”, a nie „Emma Stone”. Imiona aktorów tworzą efekt tzw. doliny niesamowitości.
Fotografia portretowa
Schematy oświetlenia
| Schemat | Efekt | Ustawienie |
|---|---|---|
| Rembrandt | Dramatyczny, klasyczny | Światło kluczowe pod kątem 45° z boku, tworzy trójkąt pod okiem |
| Butterfly | Glamour, pochlebczy | Światło kluczowe z góry i z przodu |
| Split | Dramatyczny, tajemniczy | Światło czysto z boku |
| Rim/Edge | Separacja, głębia | Światło od tyłu |
| Loop | Subtelny cień | Lekki kąt względem Rembrandta |
Szablon portretowy
[Subject description], [expression/emotion], [pose],
[lighting pattern] lighting, shallow depth of field,
[background description], shot on [camera] with [lens]
--ar 4:5 --s 100 --v 7
Przykłady portretów
Portret środowiskowy:
Middle-aged craftsman with salt-and-pepper beard, focused expression,
hands working on leather saddle, Rembrandt lighting from workshop window,
shallow depth of field, blurred tool-filled background, shot on
Hasselblad with 80mm f/1.9, documentary authenticity
--ar 4:5 --s 75 --style raw --v 7
Portret studyjny:
Professional woman in her 30s, confident subtle smile, shoulders
turned slightly, butterfly lighting with soft fill, pure white
seamless background, shot on Phase One with 110mm f/2.8, clean
commercial aesthetic
--ar 4:5 --s 50 --v 7
Fotografia produktowa
Szablon produktowy
[Product] on [surface/platform], [background style],
[lighting setup], commercial photography, high detail,
[brand aesthetic description]
--ar 1:1 --s 50 --v 7 --style raw
Powierzchnie i tła
Powierzchnie: - Polerowany marmur (luksus) - Surowy beton (industrialny) - Naturalne drewno (organiczny) - Szczotkowany metal (technologia) - Kolorowy akryl (nowoczesny)
Tła: - Gradient (płynne przejście) - Bezszwowe (jednolity kolor) - Kontekstowe (w scenerii użycia) - Abstrakcyjne (artystyczne)
Przykłady produktów
Luksusowy kosmetyk:
Minimalist perfume bottle with gold cap on polished black marble surface,
gradient background from deep purple to black, dramatic rim lighting with
soft front fill, commercial photography, high detail, premium luxury
aesthetic, subtle reflections on marble
--ar 1:1 --s 25 --v 7 --style raw
Produkt technologiczny:
Wireless earbuds case open showing earbuds inside, floating on
pure white seamless background, soft even lighting from all sides,
commercial product photography, high detail, clean Apple-style
minimalism, subtle shadow beneath
--ar 1:1 --s 50 --v 7 --style raw
Fantasy i sci-fi
Szablon fantasy
[Character/scene description], [fantasy world details],
[magical elements], [lighting style],
[art style: painterly | concept art | illustration],
[artist influence if applicable]
--ar 16:9 --s 500 --weird 100 --v 7
Przykłady fantasy
Epickie fantasy:
Ancient elven queen seated on crystalline throne in vast cavern hall,
iridescent robes flowing with captured starlight, bioluminescent
flowers floating around her, massive glowing runes carved into
obsidian walls, ethereal volumetric lighting, painterly fantasy
illustration influenced by Craig Mullins and Alphonse Mucha
--ar 16:9 --s 600 --weird 150 --v 7
Mroczne fantasy:
Battle-scarred knight in tarnished armor standing in ruined cathedral,
sword planted in cracked stone floor, pale moonlight streaming through
shattered rose window, crows circling above, mist swirling at feet,
dark atmospheric concept art, Beksinski and Zdzisław influence
--ar 16:9 --s 400 --weird 200 --v 7
Szablon sci-fi
[Subject/scene], [technology details], [environment],
[lighting: neon | holographic | industrial | sterile],
[aesthetic: cyberpunk | hard sci-fi | retro-futurism],
[mood description]
--ar 21:9 --s 300 --v 7
Przykłady sci-fi
Cyberpunk:
Solo mercenary in worn tactical gear navigating rain-soaked neon alley,
holographic advertisements flickering overhead, steam rising from
street grates, distant megastructures visible through smog, cyan and
magenta neon reflections on wet pavement, Blade Runner cyberpunk
aesthetic, oppressive urban atmosphere
--ar 21:9 --s 350 --v 7
Twarde sci-fi:
Interior of generation ship agricultural bay, massive cylindrical
space with terraced farms curving overhead, artificial sun strip
running along central axis, workers in utilitarian jumpsuits tending
crops, visible structural engineering, hard science fiction aesthetic,
The Expanse influence, functional yet beautiful
--ar 21:9 --s 250 --v 7
Anime z Niji 7
Cechy Niji 7
Niji 7 tworzy czystsze, bardziej płaskie grafiki z ulepszonym rysunkiem linii. Interpretuje prompty bardziej dosłownie niż poprzednie wersje.
Szablon Niji 7
[Character description], [pose/action], [expression],
[setting/background], [specific style notes],
[color palette]
--niji 7 --ar [ratio]
Przykłady Niji 7
Scena akcji:
Young mage with flowing crimson hair and determined golden eyes,
casting powerful fire spell with both hands raised, intense focused
expression, ancient library crumbling around her, debris floating
in magical energy, dynamic diagonal composition, warm orange and
red color palette with cool blue shadows
--niji 7 --ar 3:4
Portret postaci:
Elegant noblewoman with silver hair in elaborate updo, wearing dark
blue Victorian-inspired gown with gold embroidery, subtle knowing
smile, half-body portrait, ornate palace balcony background with
moonlit garden visible, soft romantic atmosphere, detailed lace
and fabric textures
--niji 7 --ar 4:5
Transfer stylu z Niji 7
Niji 7 oferuje najlepszą wydajność --sref:
[Your prompt] --niji 7 --sref [style image URL] --sw 150
Należy zacząć od --sw 150 i dostosować:
- Niższe wartości (50–100) dla subtelnego wpływu
- Wyższe wartości (200–300) dla silnego dopasowania stylu
Migracja z Niji 6
Podejście Niji 6:
anime girl, beautiful, detailed eyes, colorful --niji 6 --style expressive
Podejście Niji 7:
Young woman with vibrant teal hair and large expressive amber eyes,
wearing casual summer dress, cheerful smile, urban cafe background,
afternoon sunlight, contemporary anime style
--niji 7
Kluczowe zmiany:
- Należy pisać pełne opisy, nie listy słów kluczowych
- Opisy powinny być bardziej dosłowne i szczegółowe
- Presety stylów nie istnieją — należy opisać pożądany efekt
- Warto używać --sref dla zachowania spójności stylu
Architektura
Szablon architektoniczny
[Building/space type], [architectural style],
[time of day/lighting], [weather/atmosphere],
[perspective: eye-level | aerial | interior | detail],
architectural photography, clean lines
--ar 16:9 --s 150 --v 7 --style raw
Style architektoniczne
| Styl | Cechy charakterystyczne | Słowa kluczowe |
|---|---|---|
| Brutalizm | Surowy beton, masywny, geometryczny | Odsłonięty beton, monolityczny |
| Minimalizm | Czyste linie, biel, oszczędność | Przestrzeń negatywna, czyste formy |
| Art Deco | Ozdobny, geometryczny, luksusowy | Złote akcenty, wzory promieniste |
| Gotyk | Łuki ostrołukowe, wertykalny, dramatyczny | Łuki przyporowe, rozety |
| Japoński | Drewno, papier, integracja z naturą | Ekrany shoji, engawa, zen |
| Parametryczny | Płynny, obliczeniowy, organiczny | Zaha Hadid, krzywe algorytmiczne |
Przykłady architektury
Brutalizm:
Brutalist concrete museum interior with dramatic skylights, afternoon
sun creating strong geometric shadows on exposed concrete walls, vast
empty gallery space with single sculpture, eye-level perspective
showing depth and scale, architectural photography by Hélène Binet
--ar 16:9 --s 100 --v 7 --style raw
Parametryczny:
Futuristic parametric architecture concert hall exterior, flowing white
curves inspired by Zaha Hadid, blue hour lighting with building interior
warmly illuminated, long exposure car light trails on surrounding roads,
wide establishing shot, architectural photography
--ar 16:9 --s 150 --v 7
Abstrakcja i eksperymenty
Szablon abstrakcyjny
[Concept/emotion to express], [visual elements],
[color palette], [texture/material qualities],
[movement/energy description], abstract composition
--s 750 --weird 500 --chaos 50 --v 7
Przykłady abstrakcji
Abstrakcja emocjonalna:
The feeling of nostalgia dissolving into hope, fragmented memories
reforming as light, soft blues transitioning to warm amber, watercolor
textures bleeding into geometric shapes, gentle upward movement,
abstract emotional landscape
--ar 1:1 --s 800 --weird 750 --chaos 40 --v 7
Abstrakcja teksturalna:
Microscopic landscape of oxidized copper and crystalline salt
formations, verdigris greens and rust oranges, extreme macro detail,
mineral textures catching diffused light, abstract geological patterns
--ar 1:1 --s 500 --weird 300 --v 7
Przesuwanie granic
Aby uzyskać naprawdę eksperymentalne rezultaty:
- Można ustawić --weird powyżej 1000
- Połączyć z --chaos 75+
- Używać abstrakcyjnego, emocjonalnego języka
- Odwoływać się do niekonwencjonalnych artystów
The architecture of forgotten dreams, impossible geometries folding
through chromatic space, Escher meets Kandinsky, synesthetic color
relationships, visual music
--ar 1:1 --s 1000 --weird 2000 --chaos 75 --v 7
Wagi słów
Składnia :: pozwala kontrolować nacisk na poszczególne elementy.
Składnia
word::2 # Double emphasis
word::1.5 # 50% more emphasis
word::1 # Normal (default)
word::0.5 # Half emphasis
word::-1 # Negative (avoid)
Przykłady
ethereal::2 portrait of a warrior, dramatic lighting::1.5, mist::0.5
Ten prompt: - Silnie podkreśla eteryczną jakość - Umiarkowanie wzmacnia dramatyczne oświetlenie - Zmniejsza obecność mgły
Kiedy używać wag
Przydatne do: - Precyzyjnego regulowania równowagi elementów - Tłumienia niechcianych interpretacji - Podkreślania kluczowych cech
Lepiej unikać, gdy: - Dopiero eksplorujemy pomysł - Prosty prompt działa bez tego - Nie ma pewności, co podkreślić
Wskazówka ekspercka: Wagi słów to narzędzie do szlifowania, nie punkt wyjścia. Najpierw należy dopracować podstawowy prompt, a dopiero potem używać wag do precyzyjnego dostrojenia.
Negatywne prompty
Parametr --no wyklucza elementy z generowanego obrazu.
Podstawowe użycie
/imagine Beautiful landscape --no people, text, watermark
Skuteczne wykluczenia
| Cel | Wykluczenie |
|---|---|
| Fotorealizm | --no anime, cartoon, illustration, painting, drawing |
| Czysty obraz | --no text, watermark, signature, frame, border |
| Naturalny wygląd | --no oversaturated, HDR, artificial |
| Poważny ton | --no cute, chibi, kawaii |
| Prosta kompozycja | --no busy, cluttered, crowded |
Najlepsze praktyki
Warto: - Używać konkretnych, precyzyjnych terminów - Reagować na rzeczywiste problemy w wynikach - Ograniczać listę do 3–5 pozycji
Lepiej unikać: - Tworzenia wyczerpujących list wszystkiego, czego nie chcemy - Używania ogólnikowych określeń („bad”, „ugly”) - Wykluczania elementów, które i tak raczej się nie pojawią
Wykluczenie kinematograficzne
Aby uzyskać spójne fotorealistyczne rezultaty:
--no anime, cartoon, illustration, painting, drawing, sketch, CGI, 3D render
Kontrola seed
Wartości seed umożliwiają powtarzalność i kontrolowaną zmienność.
Podstawowe użycie
/imagine [prompt] --seed 12345
Ten sam prompt + ten sam seed = bardzo podobny wynik.
Znajdowanie wartości seed
Po wygenerowaniu obrazu można kliknąć informacje o obrazie, aby sprawdzić użyty seed. Warto go zanotować na potrzeby reprodukcji.
Przepływy pracy z seed
Przepływ pracy z wariacjami: 1. Generowanie z losowym seed 2. Znalezienie wyniku, który się podoba 3. Zanotowanie wartości seed 4. Wprowadzenie drobnych zmian w prompcie przy tym samym seed 5. Porównanie wariacji
Spójność w seriach:
Scene in morning light --seed 54321
Scene in afternoon light --seed 54321
Scene in evening light --seed 54321
Użycie tego samego seed w powiązanych promptach tworzy bardziej spójne kompozycje.
Kompozycja wielopodmiotowa
Złożone sceny z wieloma podmiotami wymagają starannej konstrukcji promptu.
Podejście hierarchiczne
Podmioty należy wymieniać w kolejności od najważniejszego:
[Primary subject], [secondary subject], [tertiary subject],
[their relationship/interaction], [setting], [style]
Język przestrzenny
Warto używać jasnych deskryptorów przestrzennych:
In the foreground, [subject A]
In the middle ground, [subject B]
In the background, [subject C]
Lub:
On the left, [subject A]
In the center, [subject B]
On the right, [subject C]
Przykład
Elderly grandmother and young granddaughter baking together in
sunlit kitchen, grandmother guiding child's hands rolling dough,
flour dusting the wooden counter, warm afternoon light from window,
vintage kitchen appliances in background, intimate family moment,
documentary photography style
--ar 3:2 --s 100 --v 7
Renderowanie tekstu
V7 znacząco poprawił renderowanie tekstu w obrazach.
Najlepsze praktyki
Tekst powinien być krótki: - Pojedyncze słowa działają najlepiej - Krótkie frazy (2–4 słowa) zazwyczaj działają - Długie zdania często się nie udają
Należy używać cudzysłowów:
Neon sign reading "OPEN" in storefront window
Warto określić typografię:
Vintage poster with "JAZZ NIGHT" in art deco typography
Przykłady tekstu
Szyldy:
Rainy city street at night, neon diner sign reading "EAT" glowing
red through rain-streaked window, film noir atmosphere
--ar 16:9 --s 150 --v 7
Typografia:
Minimalist book cover design, large serif typography reading "THE END"
centered on cream paper texture, literary fiction aesthetic
--ar 2:3 --s 100 --v 7
Ograniczenia
Renderowanie tekstu wciąż ma problemy z: - Długimi zdaniami - Złożonymi czcionkami - Małym tekstem w zatłoczonych obrazach - Wieloma elementami tekstowymi
Wskazówka ekspercka: Jeśli tekst jest kluczowy, lepiej wygenerować obraz bez tekstu i dodać typografię w postprodukcji.
Pętla iteracji
Profesjonalny przepływ pracy w Midjourney:
Faza 1: Eksploracja (Draft Mode)
1. Enable Draft mode (--draft)
2. Write basic prompt with core concept
3. Generate 4-8 batches quickly
4. Identify promising directions
5. Note what works/doesn't
Cel: Znaleźć kierunek, nie perfekcję. Szybkość ma znaczenie.
Faza 2: Dopracowywanie
1. Disable Draft mode
2. Take best concepts from Phase 1
3. Add specific details
4. Adjust parameters (--s, --chaos, etc.)
5. Generate in Fast mode
6. Compare variations
Cel: Zawęzić wybór do 2–3 mocnych opcji.
Faza 3: Perfekcjonowanie
1. Select best candidate
2. Note the seed
3. Make micro-adjustments to prompt
4. Use same seed for consistency
5. Upscale final choice
Cel: Wypolerować zwycięzcę.
Podział czasu
| Faza | Czas | Tryb |
|---|---|---|
| Eksploracja | 60% | Draft |
| Dopracowywanie | 30% | Fast |
| Perfekcjonowanie | 10% | Fast |
Większość użytkowników odwraca te proporcje, poświęcając zbyt dużo czasu na perfekcjonowanie pierwszych prób. Warto więcej eksplorować, a mniej szlifować.
Describe w interfejsie webowym
Można kliknąć prawym przyciskiem myszy dowolny obraz w interfejsie webowym i wybrać „Describe”, aby wygenerować cztery prompty tekstowe na podstawie obrazu.17 Jest to nieocenione narzędzie do analizy stylów — wystarczy opisać obraz ze strony Explore, a następnie zmodyfikować uzyskane prompty zgodnie z własną wizją. Prompty są automatycznie czyszczone po odświeżeniu strony.
Zarządzanie kosztami
Zrozumienie czasu GPU
- Fast Mode: Wykorzystuje godziny GPU z subskrypcji
- Relax Mode: Nieograniczony, ale kolejkowany (plany Standard+)
- Draft Mode: Połowa kosztu GPU w porównaniu ze standardowym
- Video: Około 8x koszt obrazów
Wartość subskrypcji
| Plan | Godziny Fast | Relax | Video Relax | $/godz. GPU |
|---|---|---|---|---|
| Basic | 3,3 godz. | Nie | Nie | 3,03 $ |
| Standard | 15 godz. | Tak | Nie | 2,00 $ |
| Pro | 30 godz. | Tak | Tak | 2,00 $ |
| Mega | 60 godz. | Tak | Tak | 2,00 $ |
Ważne: Plany Standard+ oferują znacznie lepszą wartość za godzinę GPU oraz nieograniczony tryb Relax.
Strategie oszczędzania
- Eksploracja w Draft mode — połowa kosztu, 10x szybciej
- Relax do eksploracji — bez dodatkowych kosztów (Standard+)
- Fast tylko na finały — wyłącznie gdy jakość ma znaczenie
- Grupowanie podobnych promptów — bardziej efektywne niż pojedyncze generacje
- Planowanie przed generowaniem — najpierw przemyśleć, potem generować
Szacowanie zużycia
| Czynność | Przybliżone minuty GPU |
|---|---|
| 4 obrazy (standard) | ~1 min |
| 4 obrazy (draft) | ~0,5 min |
| Upscale | ~0,5 min |
| Video (4x 5 s) | ~8 min |
Rozwiązywanie problemów
Najczęstsze problemy
| Problem | Przyczyna | Rozwiązanie |
|---|---|---|
| Rozmazane twarze | Niskie –s lub konflikt stylów | Użyć --style raw, zwiększyć szczegółowość w prompcie |
| Nieprawidłowe proporcje | Domyślne 1:1 | Określić --ar jawnie |
| Zbyt artystyczny | Wysokie –s | Obniżyć do 50–100 |
| Zbyt dosłowny | Niskie –s | Zwiększyć do 200+ |
| Niespójne wyniki | Niski chaos | Użyć --seed dla spójności |
| Styl dominuje | Wysokie –sw | Zmniejszyć wagę --sw |
| Tekst się nie renderuje | Ograniczenie V7 | Krótki tekst, cudzysłowy |
| Dziwne dłonie | Ograniczenie AI | Przyciąć lub wygenerować ponownie |
| Pokoje nie znalezione | Funkcja usunięta 26 lutego 202616 | Używać folderów i strony Organize |
Konflikty parametrów
Lepiej nie łączyć:
- --style raw + wysokie --s (sprzeczne)
- --v 7 + --niji (trzeba wybrać jedno)
- Wielu silnych referencji z wagą 100%
- --exp 50+ + --stylize (exp przytłacza)
- --exp 50+ + --p (exp nadpisuje)
Dobrze współgrają:
- --oref + --sref przy umiarkowanych wagach
- --chaos + --seed (zróżnicowane, ale powtarzalne)
- --style raw + niskie --s (maksymalny fotorealizm)
- --exp 10-25 + --s 100-200 (wzbogacone, kontrolowane)
Gdy nic nie działa
- Uprościć — usunąć parametry, skrócić prompt
- Rozdzielić — spróbować podmiotu i stylu osobno
- Szukać seed — wygenerować wiele wariantów, znaleźć dobry seed, iterować
- Referencja — użyć
--srefz obrazem pokazującym cel - Wersja — wypróbować inną wersję modelu
Migracja między wersjami
Migracja z V6 do V7
Stary styl V6:
portrait, beautiful woman, dramatic lighting, 8k, detailed, masterpiece
Nowy styl V7:
A contemplative portrait of a woman in her 30s, Rembrandt lighting
casting gentle shadows across her face, medium format photography
aesthetic with shallow depth of field
Kluczowe zmiany
| Aspekt | V6 | V7 |
|---|---|---|
| Styl promptu | Słowa kluczowe | Język naturalny |
| Słowa jakościowe | Pomocne | W większości ignorowane |
| Referencja postaci | --cref |
--oref |
| Personalizacja | Opcjonalna | Domyślna |
| Domyślne zachowanie | Stylizowane | Bardziej dosłowne |
Czego przestać robić
- Spamować słowami kluczowymi („beautiful, stunning, amazing”)
- Używać modyfikatorów jakości („8k, ultra detailed, masterpiece”)
- Używać
--cref(teraz jest--oref) - Pisać krótkie prompty oddzielane przecinkami
Co zacząć robić
- Pisać pełne zdania
- Opisywać to, co widzimy, nie to, czego chcemy
- Precyzyjnie określać oświetlenie, materiały, nastrój
- Używać terminologii fotograficznej (aparaty, obiektywy)
- Korzystać z personalizacji (
--p)
Ściągawka parametrów
MODELS
--v 7 Default, best overall (June 2025)
--niji 7 Anime/manga (Jan 2026, best coherence)
--niji 6 Anime/manga (legacy, has --style options)
--draft Fast iteration, 10x faster, half cost
ASPECT
--ar 16:9 Widescreen
--ar 21:9 Cinematic ultrawide
--ar 4:5 Portrait (Instagram)
--ar 6:11 Tall portrait (phone wallpapers)
--ar 9:16 Vertical (Stories)
--ar 1:1 Square
--ar 3:2 Classic photo
--ar 2:3 Portrait print
STYLE
--s 0-100 Photorealistic
--s 100-300 Balanced
--s 300-1000 Artistic
--style raw Minimal AI interpretation
--p Apply personalization (V7 default)
EXPERIMENTAL
--exp 0-100 Enhanced detail (10-25 sweet spot)
--chaos 0-100 Output variety
--weird 0-3000 Unconventional aesthetics
REFERENCES
--oref [url] Subject/character (V7)
--ow 0-1000 Omni weight (default 100)
--sref [url] Style transfer
--sw 0-1000 Style weight (default 100)
--iw 0-2 Image weight (default 1)
VIDEO (Web only)
--motion low Subtle movement (default)
--motion high Dynamic movement
--raw More prompt control
QUALITY
--q 1 Full quality (default)
--seed [num] Reproducibility
NEGATIVE
--no [items] Exclude elements
Historia zmian
| Data | Zmiana | Źródło |
|---|---|---|
| 2026-03-03 | Zaktualizowano harmonogram V8 (przebieg destylacji pod koniec lutego, wydanie opt-in na początku marca, ~30-dniowa faza pre-alpha przed ustawieniem jako domyślny). Dodano składnię moodboard --profile oraz łączenie z kodami --sref. Dodano funkcję Describe on Web. Dodano usunięcie Rooms (26 lutego). |
1617 |
| 2026-02-28 | Zaktualizowano status V8 (wciąż w toku na 28 lutego, potwierdzona natywna rozdzielczość 2K, przebudowa architektury). Rozszerzono sekcję moodboard/profile (wiele nazwanych profili, 5x szybsza konfiguracja, doprecyzowane progi stabilności do 40/200/2000). | 1415 |
| 2026-02-17 | Status V8: faza końcowego dopracowywania, wiele rating parties w połowie lutego, wydanie wkrótce. Potwierdzone funkcje V8 (style refs, moodboards, edycja). Dodano proporcje 6:11, wskazówki dotyczące interakcji z –ow, aktualizacje platformy webowej (operacje zbiorcze, automatyczne czyszczenie parametrów). | 1213 |
| 2026-02-09 | Zaktualizowano status V8 (testy wewnętrzne, rating party, przejście z TPU na GPU, nowy przepływ tworzenia), rozszerzono szczegóły dotyczące Niji 7 (dryf –sref, jakość oczu, alternatywa –cref) | 910 |
| 2026-01-20 | Dodano sekcję HD Video mode (4x rozdzielczość, ~3,2x koszt, tylko Pro/Mega) | 8 |
| 2026-01-17 | Dodano status rozwoju V8, sekcję Moodboards, –sv 4 dla starszych kodów sref | Skan webowy |
| 2026-01-16 | Dodano informacje o planie rozwoju V7.1, zweryfikowano pokrycie Niji 7 | Skan webowy |
| 2026-01-13 | Utworzono przewodnik obejmujący V7, Niji 7 i funkcje wideo | Wiele źródeł |
| 2026-01-09 | Wydano Niji 7 z ulepszoną spójnością | 3 |
| 2025-06-19 | Wydano V1 Video Model | 4 |
| 2025-06-17 | V7 stał się domyślnym modelem | 2 |
| 2025-04-30 | Aktualizacja V7: parametr –exp, ulepszenia edytora | 5 |
| 2025-04-03 | Wydano V7 | 2 |
Źródła
-
Midjourney Updates. Oficjalny dziennik zmian i ogłoszenia. ↩
-
Midjourney Version Documentation. „Version 7 was released on April 3, 2025, and became the default model on June 17, 2025.” ↩↩↩
-
Niji V7 Announcement. „Niji V7 is now live” — 9 stycznia 2026. ↩↩↩↩↩↩
-
V1 Video Model. Generowanie wideo udostępnione 19 czerwca 2025. ↩
-
V7 Update, Editor, and –exp. Szczegóły aktualizacji z 30 kwietnia 2025. ↩
-
V8 Development Discussion. Dyskusja społeczności na temat trenowania V8 i szczegółów planu rozwoju z sesji Q&A z Davidem Holzem. ↩
-
Moodboards Feature. Personalizacja Midjourney poprzez moodboards i ocenianie obrazów. ↩
-
HD Video Mode. „HD Video mode delivers 4x sharper AI-generated clips… costs roughly 3.2 times more than SD.” Sierpień 2025. ↩↩
-
Office Hours Jan 22. V8 w fazie końcowego strojenia, funkcjonalność 3D, plany aplikacji mobilnej, rozszerzenie trybu wsadowego. ↩↩↩↩↩↩↩
-
Office Hours Feb 12. Rating party sygnalizujące wydanie V8, projekty sprzętowe, badania nad 3D w czasie rzeczywistym. ↩↩↩↩
-
V8 Development Overview. Przejście z TPU na GPU/PyTorch, wariant V8 mini, Style Creator, nowy zbiór danych. ↩↩↩↩
-
V8 Rating Party Updates. Wiele rating parties w tygodniu od 16 lutego, wydanie V8 spodziewane wkrótce potem. Potwierdzone funkcje: style refs, moodboards, personalization, weird, style creator, upscaling, edycja. ↩↩↩↩↩↩
-
Web Updates Jan 20, 2026. Dodano proporcje 6:11, 4:5, 5:4, 21:9, operacje zbiorcze dla 2000 elementów, automatyczne usuwanie nieistotnych parametrów. ↩↩
-
V8 Release Status. „Midjourney V8 could drop next week” — natywna rozdzielczość 2K, kompletna przebudowa architektury, znacząco ulepszone renderowanie tekstu. Koniec lutego 2026. ↩↩↩↩↩↩
-
Profiles and Moodboards. Wiele nazwanych profili, 5x szybsza konfiguracja, wybór wielu aktywnych profili, 40 ocen na start, stabilność od 200, poprawa do 2000. ↩↩↩↩↩↩↩↩↩↩
-
V8 Distillation and Release Timeline. Ostatni przebieg destylacji rozpoczął się pod koniec lutego, ~1 tydzień trwania, następnie wydanie opt-in z ~30-dniową fazą pre-alpha przed ustawieniem jako domyślny. Funkcja Rooms usunięta 26 lutego 2026. ↩↩↩↩↩↩↩↩↩
-
Describe on Web + Moodboard Blending. Funkcja Describe po kliknięciu prawym przyciskiem generuje 4 tekstowe prompty z dowolnego obrazu. Łączenie moodboard z kodami
--srefi parametrem--profiledo bezpośredniego użycia identyfikatora moodboard. ↩↩↩↩↩↩