AI Image Generation

Midjourney Prompt Engineering: The Complete Guide

5817 words 22 min read Updated 2026-03-05

Zaktualizowano 3 marca 2026

Aktualizacja z marca 2026: V8 rozpoczął ostatnią fazę destylacji (optymalizacja szybkości) pod koniec lutego, a premiera jest oczekiwana jako opcjonalny, niedomyślny model na początku marca — po uruchomieniu należy spodziewać się około 30-dniowej fazy pre-alpha, zanim zastąpi V7 jako model domyślny.1416 Potwierdzone funkcje V8 obejmują natywną rozdzielczość 2K (2048px), znacząco ulepszone renderowanie tekstu, style references, Moodboards, personalizację, parametr weird, Style Creator, upscaling i edycję.12 Nowy proces tworzenia w V8 wprowadza szybką iterację w niskiej rozdzielczości: 64 obrazy w 256px, szybka eksploracja, a następnie upscaling najlepszych wyników.10 Midjourney przechodzi z TPU na GPUs z PyTorch, co umożliwia szybszą rekrutację i rozwój.11 Personalizacja obsługuje teraz wiele nazwanych profili z przyspieszoną konfiguracją (5x szybciej), a jednocześnie można wybrać kilka aktywnych profili równocześnie.15 Moodboards zyskały parametr --profile do bezpośredniego użycia na podstawie ID i mogą być teraz łączone z kodami --sref w jednym prompcie.1517 Niji 7 (9 stycznia 2026) zapewnia czystsze linie, ulepszone detale oczu i odbić oraz znacząco zmniejszony dryft stylu przy --sref — choć --cref pozostaje niedostępny.3 Interfejs webowy otrzymał funkcję Describe on Web (kliknięcie prawym przyciskiem na dowolnym obrazie generuje 4 tekstowe prompty), nowe proporcje obrazu oraz operacje zbiorcze dla 2000 elementów.1317 Funkcja Rooms została usunięta 26 lutego 2026.16 Video, Moodboards, Draft Mode i wszystkie funkcje V7 pozostają aktualne. Pełna historia zmian znajduje się w sekcji Dziennik zmian.1

Spędziłem setki godzin testując Midjourney w każdej wersji, kombinacji parametrów i kierunku stylistycznym. Ten przewodnik destyluje to doświadczenie w kompleksowe kompendium, które chciałbym mieć na początku swojej drogi. Niezależnie od tego, czy tworzone są pierwsze prompty, czy testowane są granice możliwości — wszystkie techniki znajdują się tutaj.

Midjourney nie jest magicznym konwerterem promptów na obrazy. To zaawansowany system języka wizualnego, który reaguje na określone wzorce, respektuje określone hierarchie i nagradza tych, którzy rozumieją jego architekturę. Różnica między generyczną sztuką AI a oszałamiającymi, celowymi obrazami polega na zrozumieniu tych wzorców.

Kluczowa obserwacja: V7 fundamentalnie zmienił sposób działania promptów. Stare podejście polegające na zrzucaniu słów kluczowych („beautiful, stunning, 8k, detailed, masterpiece”) aktywnie pogarsza wyniki. V7 rozumie język naturalny — prompty powinny brzmieć jak opis fotografii dla doświadczonego operatora kamery, a nie jak tagowanie bazy zdjęć stockowych.

Ten przewodnik obejmuje wszystko — od pierwszej instalacji po zaawansowane techniki, które większość użytkowników nigdy nie odkrywa. Każdy parametr jest udokumentowany z rzeczywistymi zakresami, prawdziwymi przykładami i przypadkami brzegowymi, które stanowią pułapkę nawet dla doświadczonych użytkowników.


Spis treści

Część 1: Podstawy

  1. Czym jest Midjourney?
  2. Pierwsze kroki
  3. Kluczowe pojęcia
  4. Hierarchia promptu

Część 2: Opanowanie parametrów

  1. Wybór wersji
  2. Proporcje obrazu
  3. Stylizacja
  4. Chaos i Weird
  5. Estetyka eksperymentalna

Część 3: Systemy referencji

  1. Omni Reference
  2. Style Reference
  3. Image Weight
  4. Draft Mode

Część 4: Generowanie wideo

  1. Podstawy konwersji obrazu na wideo
  2. Wydłużanie i zapętlanie
  3. Najlepsze praktyki wideo

Część 5: Szablony gatunkowe

  1. Realizm filmowy
  2. Fotografia portretowa
  3. Fotografia produktowa
  4. Fantasy i Sci-Fi
  5. Anime z Niji 7
  6. Architektura
  7. Abstrakcja i eksperymenty

Część 6: Zaawansowane techniki

  1. Wagi słów
  2. Prompty negatywne
  3. Kontrola ziarna
  4. Kompozycja z wieloma podmiotami
  5. Renderowanie tekstu

Część 7: Przepływy pracy i optymalizacja

  1. Pętla iteracyjna
  2. Zarządzanie kosztami
  3. Rozwiązywanie problemów
  4. Migracja między wersjami

Część 8: Materiały referencyjne

  1. Ściągawka parametrów
  2. Historia zmian

Czym jest Midjourney?

Midjourney to generatywny system AI, który tworzy obrazy na podstawie opisów tekstowych. W odróżnieniu od tradycyjnej edycji zdjęć czy fotografii stockowej, wystarczy opisać to, co chce się zobaczyć, a Midjourney wygeneruje oryginalne obrazy odpowiadające wizji użytkownika.

Co wyróżnia Midjourney:

Aspekt Midjourney Konkurencja
Jakość obrazu Wiodąca w branży estetyka Zróżnicowana
Język naturalny V7 rozumie pełne zdania Często zależna od słów kluczowych
Fotorealizm Wyjątkowy w V7 Dobry do doskonałego
Anime/Ilustracja Zoptymalizowane modele Niji Ogólnego przeznaczenia
Wideo Natywne wsparcie (czerwiec 2025) Wymaga osobnych narzędzi
Społeczność Zintegrowane udostępnianie/odkrywanie Różnie

Co można tworzyć:

  • Fotorealistyczne obrazy: portrety, produkty, architektura, natura
  • Ilustracje: concept art, okładki książek, grafika redakcyjna
  • Anime i manga: za pomocą wyspecjalizowanych modeli Niji
  • Sztuka abstrakcyjna: kompozycje eksperymentalne i surrealistyczne
  • Wideo: animowane klipy o długości 5–21 sekund na podstawie obrazów

Czym Midjourney nie jest:

  • Nie jest edytorem zdjęć (do tego służy Photoshop)
  • Nie jest systemem zapewniającym spójność postaci (choć szybko się rozwija)
  • Nie jest narzędziem do odtwarzania konkretnych postaci chronionych prawem autorskim
  • Nie jest darmowy (subskrypcje od 10 do 120 USD/miesiąc)

Pierwsze kroki

Konfiguracja konta

  1. Należy odwiedzić midjourney.com
  2. Zalogować się za pomocą Discord lub utworzyć nowe konto
  3. Wybrać plan subskrypcji:
Plan Cena Fast GPU Relax GPU Video Relax
Basic 10 USD/mies. 3,3 godz.
Standard 30 USD/mies. 15 godz. Bez limitu
Pro 60 USD/mies. 30 godz. Bez limitu Tak
Mega 120 USD/mies. 60 godz. Bez limitu Tak

Wskazówka eksperta: Warto zacząć od planu Standard (30 USD/mies.). Nieograniczony tryb Relax jest niezbędny do eksperymentowania — godziny w trybie Fast szybko się wyczerpią podczas nauki.

Pierwszy prompt

Należy otworzyć interfejs webowy pod adresem midjourney.com/imagine i wpisać:

A golden retriever sitting in autumn leaves, soft afternoon sunlight

To wszystko. Nie jest potrzebna żadna specjalna składnia. V7 rozumie język naturalny.

Co otrzymamy: Cztery warianty golden retrievera w jesiennej scenerii. Następnie można:

  • Upscale: kliknąć U1–U4, aby wygenerować wersję w wysokiej rozdzielczości
  • Vary: kliknąć V1–V4, aby stworzyć subtelne warianty
  • Reroll: wygenerować cztery nowe warianty z tym samym promptem

Interfejs webowy a Discord

Funkcja Interfejs webowy Discord
Łatwość obsługi Łatwiejszy Wyższa bariera wejścia
Organizacja obrazów Wbudowana galeria Rozproszone po kanałach
Generowanie wideo Pełne wsparcie Niedostępne
Edycja promptów Interfejs graficzny Polecenia tekstowe
Społeczność Zakładka Explore Przeglądanie kanałów
Rekomendacja Zacznij tutaj Dla zaawansowanych

Interfejs webowy jest obecnie podstawowym sposobem korzystania z platformy. Discord działa, ale nie oferuje generowania wideo i ma mniej intuicyjny przepływ pracy.


Kluczowe pojęcia

Jak działają prompty

Każdy prompt w Midjourney przechodzi przez następujący proces:

Your Text Prompt
      
[Text Encoder]  Converts words to mathematical embeddings
      
[Diffusion Model]  Generates image from noise, guided by embeddings
      
[Upscaler]  Increases resolution and detail
      
Final Image

Co to oznacza w praktyce:

  1. Kolejność słów ma znaczenie: wcześniejsze słowa mają większy wpływ niż późniejsze
  2. Konkretność wygrywa: „golden hour sunlight casting long shadows” działa lepiej niż „nice lighting”
  3. Sprzeczności wprowadzają chaos: „dark, bright, moody, cheerful” wzajemnie się znosi
  4. Mniej często znaczy więcej: 50–150 tokenów zazwyczaj daje lepsze wyniki niż 300+

Ekonomia tokenów

Midjourney nie widzi słów — widzi tokeny (w przybliżeniu fragmenty wyrazów).

Liczba tokenów Efekt Najlepsze zastosowanie
10–30 Bardzo otwarta interpretacja Abstrakcja, eksperymenty
30–80 Zrównoważona kontrola Większość promptów
80–150 Szczegółowa kontrola Konkretne sceny
150+ Malejące korzyści Może powodować konflikty

Wskazówka eksperta: Jeśli prompt przekracza 150 tokenów, prawdopodobnie jest zbyt szczegółowy. Warto ograniczyć nadmiar przymiotników.

Sygnały jakości

V7 silnie reaguje na określone wzorce opisowe:

Oświetlenie (największy wpływ): - „golden hour light casting long shadows across weathered stone” - „Rembrandt lighting with soft fill from camera left” - „bioluminescent glow illuminating the fog”

Materiały i tekstury: - „oxidized copper with verdigris patina” - „worn leather showing decades of use” - „translucent jade catching the light”

Atmosfera i nastrój: - „melancholic twilight atmosphere” - „oppressive industrial ambiance” - „ethereal dreamlike quality”

Techniczne terminy fotograficzne: - „shot on medium format, shallow depth of field” - „85mm lens, f/1.8 aperture” - „anamorphic lens flare, 2.39:1 aspect”


Hierarchia promptu

Każdy skuteczny prompt opiera się na hierarchii. Słowa na szczycie mają największy wpływ.

┌─────────────────────────────────────────────────┐
  1. SUBJECT (who/what)           Most important 
     "elderly fisherman"                          
├─────────────────────────────────────────────────┤
  2. SUBJECT DETAILS (descriptors)               
     "weathered face, silver beard, kind eyes"   
├─────────────────────────────────────────────────┤
  3. CONTEXT (where/when)                        
     "on a wooden dock at dawn"                  
├─────────────────────────────────────────────────┤
  4. STYLE/MOOD (how it feels)                   
     "documentary photography, contemplative"     
├─────────────────────────────────────────────────┤
  5. TECHNICAL (camera/lighting)                 
     "shot on Leica, natural morning light"      
├─────────────────────────────────────────────────┤
  6. PARAMETERS (--ar, --s, etc.)   Fine-tuning 
     "--ar 3:2 --s 100 --v 7"                    
└─────────────────────────────────────────────────┘

Szablon promptu

[SUBJECT] [SUBJECT DETAILS], [CONTEXT], [STYLE/MOOD], [TECHNICAL] --parameters

Przykład zastosowania hierarchii:

An elderly fisherman with a weathered face and silver beard, standing on a
wooden dock at dawn, documentary photography style, contemplative mood,
shot on Leica M11 with natural morning light, soft mist rising from the water
--ar 3:2 --s 100 --v 7

Czego większość użytkowników nie dostrzega: Zaczynają od stylu („beautiful cinematic photo of…”) zamiast od podmiotu. V7 przypisuje dużą wagę początkowym tokenom — na pierwszym miejscu powinien znajdować się obiekt, który faktycznie ma się pojawić na obrazie.


Wybór wersji

V7 (domyślna od czerwca 2025)

V7 to aktualny flagowy model Midjourney, wydany 3 kwietnia 2025 roku.2

Mocne strony: - Rozumienie języka naturalnego (pisanie zdaniami, nie słowami kluczowymi) - Najlepszy fotorealizm w historii - Znacząco ulepszone renderowanie tekstu - Lepsza anatomia ludzka (dłonie, ciała) - Ulepszone relacje przestrzenne - Personalizacja włączona domyślnie

Tryby generowania:

Tryb Szybkość Koszt Najlepszy do
Turbo Najszybszy 2x normalnego Finalne rendery, gdy liczy się czas
Fast Normalny 1x Standardowy workflow
Relax W kolejce W cenie Eksploracja, nauka
Draft 10x szybszy 0,5x Szybka iteracja

Kiedy używać V7: - Fotorealistyczne obrazy - Dowolny prompt ze złożonym językiem naturalnym - Renderowanie tekstu - Gdy jakość jest najważniejsza

Niji 7 (styczeń 2026)

Niji 7 to wyspecjalizowany model anime/manga, wydany 9 stycznia 2026 roku.3

Mocne strony: - Krystalicznie czyste oczy, odbicia i drobne detale tła3 - Ulepszona spójność dla złożonych póz i układów z wieloma ramionami - Bardziej dosłowna interpretacja promptów — precyzyjnie obsługuje konkretne pozycje kolorów i fryzury - Lepsze renderowanie tekstu - Ulepszona wydajność --sref ze znacząco zmniejszonym dryftem stylu3 - Czysta, płaska estetyka linii zaprojektowana w celu podkreślenia ulepszonej jakości linii

Ograniczenia: - --cref NIE jest obsługiwany — zespół sugeruje „potężniejszą, tajemniczą niespodziankę” jako alternatywę3 - Personalizacja (--p) i Moodboards są wdrażane (mogą nie być jeszcze w pełni dostępne) - Bardziej dosłowny niż poprzednie wersje Niji — należy dostosować nastrojowe prompty

Wkrótce: - Nowy system referencji postaci, który zastąpi --cref (oczekuje się, że przewyższy możliwości --cref)

Użycie:

A determined young mage with crimson hair, casting fire magic,
intense expression, ancient library background --niji 7

Kiedy używać Niji 7: - Ilustracje w stylu anime i manga - Projektowanie postaci - Ilustracje o wschodniej estetyce - Gdy potrzebna jest czystsza kreska

Niji 6 (starszy model)

Nadal dostępny w celu zachowania kompatybilności wstecznej.

Kiedy używać Niji 6: - Potrzebne są presety stylów (--style expressive, --style cute, --style scenic) - Workflow zależy od --cref - Preferowana jest łagodniejsza, mniej dosłowna interpretacja

Style:

--niji 6 --style expressive  # Dynamic, stylized
--niji 6 --style cute        # Kawaii aesthetic
--niji 6 --style scenic      # Background focus
--niji 6 --style original    # Classic Niji look

Porównanie wersji

Funkcja V7 Niji 7 Niji 6
Fotorealizm Doskonały N/A N/A
Anime Dobry Doskonały Doskonały
Język naturalny Najlepszy Dobry Umiarkowany
Renderowanie tekstu Najlepsze Dobre Ograniczone
--oref Tak Nie Nie
--cref Nie Nie Tak
--sref Tak Tak (najlepszy) Tak
--p Tak Nie Opcjonalnie
Presety stylów Nie Nie Tak

Status rozwoju V8 (marzec 2026)

V8 rozpoczął końcowy przebieg destylacji (optymalizacja szybkości) pod koniec lutego 2026, po wielu sesjach oceny społecznościowej w połowie lutego.121416 Destylacja trwa około jednego tygodnia; po jej zakończeniu V8 zostanie udostępniony jako model opt-in, nie domyślny na około 30-dniową fazę pre-alpha, zanim zastąpi V7 jako domyślny.16 Przewodnicy i moderatorzy rozpoczęli wewnętrzne testy pod koniec stycznia.9

Potwierdzone funkcje V8: - Natywna rozdzielczość 2K (2048px) — eliminuje pośredni upscaler na rzecz rzeczywiście ostrzejszego wyniku14 - Ogromne ulepszenia w renderowaniu tekstu (najsłabszy punkt V7)14 - Lepsza generacja złożonych obiektów (stworzenia, centaury, nietypowa anatomia) - Całkowite przepisanie architektury (nowy codebase, obsługuje od 64px do 2048px+ natywnie)14 - Style references, Moodboards, personalizacja, parametr weird — wszystko obsługiwane12 - Style Creator i profile webowe do udostępniania stylów w społeczności11 - Wbudowane możliwości Upscale i edycji12 - Nowy flow tworzenia: 64 obrazy w 256px do szybkiej eksploracji, następnie zawężanie i upscalowanie zwycięzców10 - Przejście infrastruktury z TPU na GPU z PyTorch (lepiej wspierany codebase, szybsza rekrutacja)11 - Wariant V8 „mini” zaprojektowany dla słabszego sprzętu11 - Dążenie do generowania podglądu w czasie rzeczywistym

Harmonogram (stan na początek marca 2026): - Testy wewnętrzne: styczeń 20269 - Sesje oceny: początek–połowa lutego 202612 - Przebieg destylacji: rozpoczęty pod koniec lutego 2026 (~1 tydzień)16 - Wydanie: oczekiwane na początku marca 2026 jako opt-in, nie domyślny16 - Pre-alpha: ~30 dni po wydaniu opt-in, następnie staje się domyślny16 - Ulepszenia aplikacji mobilnej planowane po premierze V89 - Funkcjonalność 3D z ruchem kamery i reframingiem w trakcie rozwoju9

Co dalej po V8: - Projekty sprzętowe: cztery w toku, w tym urządzenie noszone i projekt montażowy w skali magazynu10 - Rozbudowa trybu wsadowego z systemem uczenia preferencji użytkownika9 - Modele AI w czasie rzeczywistym jako cel długoterminowy9


Proporcje obrazu

Parametr --ar ustawia wymiary obrazu. Domyślnie 1:1 (kwadrat).

Popularne proporcje

Proporcje Wymiary Zastosowanie
1:1 Kwadrat Media społecznościowe, ikony
4:5 Portret Feed na Instagramie, urządzenia mobilne
5:4 Krajobraz Pulpit, prezentacje
16:9 Panoramiczny YouTube, prezentacje
6:11 Wysoki portret Tapety na telefon, pionowe plakaty
9:16 Pionowy Stories, TikTok, urządzenia mobilne
21:9 Ultraszeroki Kinowy, filmowy
3:2 Klasyczny Odbitki fotograficzne
2:3 Portret Pionowe odbitki

Rekomendacje dla poszczególnych platform

Platforma Proporcje Uwagi
Instagram Feed 1:1 lub 4:5 4:5 zajmuje więcej miejsca na ekranie
Instagram Story 9:16 Pełny format pionowy
Twitter/X 16:9 lub 1:1 16:9 rozwija się w feedzie
LinkedIn 1.91:1 lub 16:9 Profesjonalny format krajobrazowy
Pinterest 2:3 Format pionowy sprawdza się najlepiej
Miniatura YouTube 16:9 Standardowy format wideo
Tapeta pulpitu 16:9 lub 21:9 Dopasowanie do monitora

Wpływ na kompozycję

Proporcje obrazu to nie tylko wymiary — fundamentalnie zmieniają kompozycję.

Szerokie proporcje (16:9, 21:9): - Podkreślają otoczenie i kontekst - Naturalne dla krajobrazów, panoram miejskich - Kinowy charakter - Obiekty stają się częścią sceny

Wysokie proporcje (4:5, 9:16): - Skupiają uwagę na obiekcie - Naturalne dla portretów, produktów - Intymny charakter - Więcej informacji w pionie

Wskazówka eksperta: Dla kinowych portretów warto wypróbować 4:5 zamiast oczywistego 16:9. Uzyskuje się kadrowanie skoncentrowane na obiekcie jak w portrecie, z wystarczającym kontekstem do opowiadania historii.


Stylizacja

Parametr --s kontroluje, ile artystycznej interpretacji V7 stosuje. Zakres: 0–1000. Domyślnie: 100.

Zakresy stylizacji

Zakres Efekt Najlepszy do
0–50 Minimalna interpretacja Zdjęcia produktowe, dokładność techniczna
50–150 Zrównoważony (domyślny) Ogólne zastosowanie, portrety
150–300 Zauważalny styl Artystyczne zdjęcia, kompozycje nastrojowe
300–500 Silny styl Ilustracje, koncepcyjne
500–1000 Bardzo stylizowany Abstrakcyjne, eksperymentalne

Przykłady wizualne

Portrait of a woman, soft window light --s 50
# Result: Clean, realistic, minimal embellishment

Portrait of a woman, soft window light --s 250
# Result: More artistic interpretation, enhanced mood

Portrait of a woman, soft window light --s 600
# Result: Distinctly stylized, dreamlike quality

Schemat decyzyjny

Niska stylizacja (0–100) — kiedy stosować: - Tworzenie fotografii produktowej - Potrzebna jest fotorealistyczna dokładność - Obrazy techniczne/dokumentacyjne - Prompt powinien być interpretowany dosłownie

Średnia stylizacja (100–300) — kiedy stosować: - Ogólna praca kreatywna - Fotografia redakcyjna - Pożądane wzmocnienie bez skrajności - Równowaga między realizmem a artyzmem

Wysoka stylizacja (300+) — kiedy stosować: - Tworzenie ilustracji lub concept artu - Praca abstrakcyjna lub eksperymentalna - Estetyka Midjourney ma dominować - Przesuwanie granic kreatywnych

Stylizacja + Style Raw

Aby uzyskać maksymalny fotorealizm, należy połączyć niską stylizację z --style raw:

Portrait of a businessman, office background --s 50 --style raw --v 7

--style raw informuje V7, aby zminimalizował własną interpretację estetyczną, dając wyniki bliższe dosłownemu spełnieniu promptu.


Chaos i Weird

Chaos (–chaos 0–100)

Kontroluje zróżnicowanie między czterema wygenerowanymi obrazami. Domyślnie: 0.

Wartość Efekt
0 Bardzo podobne wyniki
25 Niewielkie różnice
50 Umiarkowana różnorodność
75 Duża różnorodność
100 Maksymalna nieprzewidywalność

Kiedy używać chaos: - Faza eksploracji: --chaos 50-75 aby zobaczyć różnorodne interpretacje - Finalny render: --chaos 0-25 dla spójnych wyników - Szukanie kierunku: wysoki chaos na początku, niski chaos przy dopracowywaniu

Weird (–weird 0–3000)

Wprowadza niekonwencjonalną, niespodziewaną estetykę. Domyślnie: 0.

Zakres Efekt
0 Standardowa estetyka
100–500 Subtelne dziwactwa
500–1000 Zauważalna osobliwość
1000–2000 Bardzo nietypowy
2000–3000 Maksymalna dziwność

Kiedy używać weird: - Surrealistyczne lub oniryczne obrazy - Wyjście poza generyczną estetykę AI - Eksploracja concept artu - Gdy „normalne” wydaje się zbyt przewidywalne

Łączenie Chaos i Weird

--chaos 50 --weird 500   # Varied outputs, each slightly quirky
--chaos 100 --weird 0    # Wild variations, normal aesthetic
--chaos 25 --weird 2000  # Similar outputs, all very weird

Wskazówka eksperta: Wysoka wartość weird może generować naprawdę nietypowe obrazy, ale efekty bywają niespójne. Warto używać go do eksploracji, a następnie zmniejszyć wartość przy finalnych renderach.


Estetyka eksperymentalna

Parametr --exp dodaje wzmocnione detale, dynamikę i efekty tone mappingu. Zakres: 0–100. Domyślnie: 0.

Poziomy efektu

Wartość Efekt Uwagi
0 Wyłączony (domyślny) Standardowe renderowanie
5 Subtelne wzmocnienie Bezpieczne do łączenia z innymi parametrami
10 Zauważalny wzrost detali Dobry punkt wyjścia
25 Silny efekt Zalecane maksimum do łączenia
50 Bardzo silny Może obniżyć dokładność promptu
100 Maksymalny Może zdominować –stylize i –p

Co robi –exp

  • Bardziej szczegółowe tekstury i powierzchnie
  • Bardziej dynamiczne, wyraziste kompozycje
  • Wygląd przypominający HDR z tone mappingiem
  • Wzmocniona atrakcyjność wizualna

Zalecane kombinacje

--exp 10 --s 200           # Enhanced detail, balanced style
--exp 25 --s 100           # Strong exp, controlled stylize
--exp 5 --style raw        # Subtle boost for photorealism

Ostrzeżenie: konflikty parametrów

Przy wysokich wartościach (powyżej 25–50) --exp może: - Zdominować ustawienia --stylize - Nadpisać personalizację (--p) - Zmniejszyć różnorodność obrazów

Wskazówka eksperta: Wartość --exp na poziomie 10–25 sprawdza się w większości zastosowań. Wyższe wartości są przeznaczone do konkretnych efektów stylistycznych, a nie do ogólnej poprawy jakości.


Omni Reference

Parametr --oref przenosi cechy podmiotu z obrazu referencyjnego do generowanej grafiki. Zastąpił on --cref w V7.

Podstawowe użycie

/imagine A woman in a red dress at a gala --oref [image URL]

Co jest przenoszone: - Twarz i rysy twarzy - Typ sylwetki i proporcje - Ubranie i akcesoria - Ogólna tożsamość

Kontrola wagi (–ow)

--ow 0-1000    # Omni weight (default 100)
Waga Efekt
0-30 Luźna inspiracja, pozwala na zmiany stylu
30-60 Umiarkowany wpływ
60-100 Silne podobieństwo (domyślny zakres)
100-300 Bardzo bliskie dopasowanie
300-1000 Maksymalna wierność

Interakcje wag

Parametr --ow konkuruje z --stylize i --exp o wpływ na wynik. Przy wysokich wartościach stylize lub exp należy zwiększyć --ow, aby zachować spójność z referencją:

# High stylize needs higher ow to keep reference
--oref [url] --ow 200 --s 400

# High exp overwhelms default ow
--oref [url] --ow 300 --exp 25

# If you aren't using high stylize/exp, stay at moderate ow (100-400)

Wskazówka eksperta: W większości przypadków, bez ekstremalnych wartości --stylize lub --exp, warto utrzymywać --ow poniżej 400. Wyższe wartości należy stosować tylko wtedy, gdy konieczne jest zachowanie dokładnych rysów twarzy lub detali ubioru w konfrontacji z silnymi parametrami stylu.

Najlepsze praktyki

Jakość obrazu referencyjnego ma znaczenie: - Wysoka rozdzielczość, wyraźny podmiot - Zdjęcia frontalne działają najlepiej w przypadku twarzy - Spójne oświetlenie w referencji - Minimalna ilość rozpraszających elementów tła

Dostosowywanie wagi przy zmianach stylu:

# Photo to anime conversion - lower weight
--oref [photo URL] --ow 40 --niji 7

# Maintaining strict likeness
--oref [photo URL] --ow 200 --v 7

Łączenie z style reference:

# Subject from one image, style from another
--oref [subject URL] --sref [style URL] --ow 100 --sw 150

Style Reference

Parametr --sref przenosi cechy estetyczne z obrazu referencyjnego.

Podstawowe użycie

/imagine A mountain landscape at sunset --sref [style image URL]

Co jest przenoszone: - Paleta kolorów - Styl oświetlenia - Technika artystyczna - Ogólny nastrój/atmosfera - Tendencje kompozycyjne

Kontrola wagi (–sw)

--sw 0-1000    # Style weight (default 100)
Waga Efekt
0-50 Subtelny wpływ
50-150 Zrównoważone przenoszenie
150-300 Silne dopasowanie stylu
300-1000 Dominujący styl

Wiele referencji stylu

Można łączyć wiele obrazów referencyjnych stylu:

--sref [url1] [url2]

Style mieszają się ze sobą. Umożliwia to tworzenie unikatowych kombinacji estetycznych.

Najlepsze praktyki

Najlepiej sprawdza się z: - Wyrazistymi, spójnymi stylami - Wyraźnymi cechami estetycznymi - Obrazami o silnej tożsamości wizualnej

Mniej skuteczne dla: - Bardzo ogólnych zdjęć - Mieszanych lub niejasnych stylów - Obrazów, w których „styl” nie jest oczywisty

Wskazówka eksperta: Niji 7 oferuje najlepszą wydajność --sref. Jeśli przenoszenie stylu jest kluczowe, warto rozważyć użycie Niji 7 nawet dla treści nie związanych z anime.

Używanie starych kodów Style Reference

Kody --sref z ery V6 nie działają bezpośrednio w V7. Należy dodać --sv 4, aby użyć starszych kodów stylu:

/imagine A mountain landscape --sref 123456789 --sv 4
# --sv 4 tells V7 to interpret the code using V6 style system

Uwaga: Choć zapewnia to kompatybilność wsteczną, warto rozważyć ponowne wygenerowanie referencji stylu w V7, aby uzyskać lepsze wyniki z nowym modelem.


Image Weight

Parametr --iw kontroluje stopień wpływu obrazu referencyjnego na generowaną grafikę.

Podstawowe użycie

/imagine [prompt] [image URL] --iw 1.5

Zakres wag

Zakres: 0-2 (domyślnie 1)

Waga Efekt
0-0,5 Dominuje prompt
0,5-1 Równowaga
1-1,5 Dominuje obraz
1,5-2 Silny wpływ obrazu

Przypadki użycia

Niska waga (0-0,5): Obraz jako luźna inspiracja, podczas gdy prompt dominuje

Równowaga (0,5-1): Równy wpływ promptu i obrazu

Wysoka waga (1,5-2): Tworzenie wariantów ściśle opartych na obrazie


Moodboards (spersonalizowane profile stylu)

Moodboards umożliwiają tworzenie spersonalizowanych profili stylu poprzez ocenianie obrazów. Zamiast korzystać z pojedynczego obrazu --sref, buduje się stabilne preferencje estetyczne na podstawie wielu przykładów.7 Można teraz tworzyć wiele nazwanych profili, ustawiać profil domyślny, a nawet aktywować jednocześnie kilka profili.15

Jak działają Moodboards

  1. Utworzenie moodboard na midjourney.com/personalize
  2. Ocenianie obrazów (lubię/nie lubię) w celu wytrenowania stylu — konfiguracja jest teraz do 5x szybsza15
  3. Zastosowanie za pomocą --p w celu użycia domyślnego moodboard
  4. Zastosowanie za pomocą --p [mID] w celu użycia konkretnego moodboard
  5. Nazywanie i organizowanie wielu profili dla różnych projektów lub współpracowników15

Budowanie stabilnego profilu

Oceny Stabilność
40 Minimum dla użytecznego profilu15
200 Dość stabilny, wiarygodne wyniki15
2 000 Maksymalne dopracowanie, najlepsza spójność15

Wskazówka eksperta: Należy ocenić co najmniej 200 obrazów, aby uzyskać wiarygodny moodboard. Warto uwzględniać zarówno polubienia, JAK I odrzucenia — odrzucenia pomagają Midjourney zrozumieć, czego unikać. Można aktywować jednocześnie kilka profili w celu uzyskania mieszanej estetyki.15

Używanie Moodboards

/imagine A forest path at dawn --p
# Uses your default moodboard

/imagine A forest path at dawn --p abc123
# Uses specific moodboard with ID abc123

/imagine A forest path at dawn --profile abc123
# Alternative syntax using --profile parameter

Moodboards a Style Reference

Podejście Najlepsze zastosowanie
--sref Jednorazowy styl z pojedynczego obrazu
--p (Moodboard) Spójna osobista estetyka w wielu projektach

Łączenie Moodboards z –sref

Moodboards można łączyć z kodami style reference w jednym prompcie, aby uzyskać precyzyjną kontrolę:17

/imagine A portrait --p --sref [url] --sw 50
# Your moodboard aesthetic + subtle style reference influence

/imagine A portrait --sref 142710498 --profile drgmjoi 2jrqbw6
# Mix sref codes with multiple moodboard profiles

Można również udostępniać migawki moodboard jako kody (np. --profile 2jrqbw6), z których mogą korzystać inni, lub udostępnić link do wersji na żywo, która aktualizuje się w miarę dalszego dopracowywania.17


Draft mode

Draft mode generuje obrazy 10x szybciej za połowę kosztu GPU. Niezbędny przy eksploracji.

Włączanie Draft mode

/imagine [prompt] --draft

Lub przełączanie w ustawieniach interfejsu webowego.

Porównanie Draft a pełny render

Aspekt Draft Pełny
Szybkość ~10x szybszy Standardowa
Koszt GPU 50% 100%
Szczegółowość Zmniejszona Pełna
Najlepszy do Eksploracji Końcowego wyniku

Przepływ pracy z Draft

1. Draft Mode Exploration (--draft)
   ├── Test 5-10 variations quickly
   ├── Identify promising directions
   └── Note effective parameters

2. Full Render Refinement
   ├── Remove --draft flag
   ├── Apply learned parameters
   └── Fine-tune with --seed

Wskazówka eksperta: Zawsze warto zaczynać w Draft mode. Oszczędności kosztów się kumulują, a możliwości eksploracji są znacznie większe. Na pełny render należy przechodzić dopiero po znalezieniu kierunku wartego dalszego rozwijania.


Podstawy generowania wideo z obrazu

Model wideo Midjourney V1 został uruchomiony 19 czerwca 2025 roku, umożliwiając animację obrazów.

Jak to działa

  1. Wybranie dowolnego obrazu (wygenerowanego przez Midjourney lub przesłanego)
  2. Kliknięcie przycisku „Animate”
  3. Wybór opcji (Auto, Manual, Loop)
  4. Wygenerowanie 5-sekundowego klipu wideo

Parametry ruchu

--motion low    # Still scenes, slow motion, subtle movement (default)
--motion high   # Big camera motions, larger character movements
--raw           # Reduces creative flair, more prompt control

Porównanie ustawień ruchu

Ustawienie Efekt Najlepsze zastosowanie
Low Subtelny, kinowy ruch Portrety, martwa natura, atmosfera
High Dynamiczny, energiczny ruch Akcja, krajobrazy, tłumy

Ostrzeżenie: Wysoki poziom ruchu może powodować nierealistyczne lub zniekształcone ruchy. Należy zaczynać od niskiego poziomu i zwiększać go tylko w razie potrzeby.

Koszt i plany

  • Zadania wideo kosztują ~8x więcej niż zadania graficzne
  • Każde zadanie generuje cztery 5-sekundowe filmy
  • Dostępne wyłącznie w interfejsie webowym (nie w Discord)
Plan Wideo w Fast Mode Wideo w Relax Mode
Basic Tak Nie
Standard Tak Nie
Pro Tak Tak
Mega Tak Tak

HD Video Mode

HD Video mode (uruchomiony w sierpniu 2025) zapewnia 4x ostrzejszą rozdzielczość — czterokrotnie większą gęstość pikseli dla znacząco lepszej jakości wideo.8

Jak korzystać z HD Video: 1. Najpierw wygenerowanie standardowego wideo 2. Kliknięcie opcji HD na ukończonym wideo 3. Oczekiwanie na render w wysokiej rozdzielczości

Koszty HD Video: - Kosztuje ~3,2x więcej niż standardowe wideo - Dostępne wyłącznie w planach Pro i Mega - Wymaga najpierw standardowego wideo (nie można generować bezpośrednio w HD)

Tryb Rozdzielczość Względny koszt
Standard (SD) Bazowa 1x
High Definition (HD) 4x pikseli ~3,2x

Kiedy używać HD: - Finalne materiały do dostarczenia - Duże wyświetlacze lub projekcje - Praca profesjonalna/komercyjna - Gdy szczegóły w ruchu mają znaczenie

Wskazówka eksperta: Zawsze należy testować w SD. HD trwa dłużej i kosztuje więcej — warto ulepszać tylko najlepsze klipy.


Wydłużanie i zapętlanie

Wydłużanie wideo

Każde wideo można wydłużyć o dodatkowe 4 sekundy, maksymalnie 4 razy (do 21 sekund).

Opcje wydłużania: - Auto: Automatyczna kontynuacja wideo - Manual: Możliwość dostosowania promptu przed wydłużeniem

Najlepsze praktyki przy wydłużaniu: - Planowanie łuku narracyjnego przed rozpoczęciem - Pierwsze 5 sekund powinno ustanowić scenę - Każde wydłużenie powinno mieć swój cel - Uwzględnienie tempa — 21 sekund to więcej, niż się wydaje

Tworzenie pętli

Opcja Loop tworzy płynnie zapętlone wideo, w którym pierwszy i ostatni klatka są dopasowane.

Select image  Click "Loop"  Generate

Najlepsze zastosowania: - Animacje tła - Treści do mediów społecznościowych - Wizualizacje ambient - Cinemagraphs

Wskazówki dla lepszych pętli: - Prosty, powtarzalny ruch działa najlepiej - Unikanie złożonych ruchów kamery - Elementy atmosferyczne (chmury, woda, ogień) zapętlają się naturalnie


Najlepsze praktyki wideo

Kiedy używać wideo

Dobre kandydatury na wideo: - Sceny atmosferyczne (mgła, deszcz, ogień) - Subtelny ruch (włosy, tkanina, woda) - Krajobrazy z ruchem środowiskowym - Portrety z minimalnym ruchem

Mniej idealne do wideo: - Złożone sekwencje akcji - Sceny z wieloma postaciami - Precyzyjna choreografia - Wymagania dotyczące dokładności technicznej

Optymalizacja pod wideo

Przed animowaniem: 1. Najpierw wygenerowanie idealnego statycznego obrazu 2. Rozważenie, jak elementy mogą się poruszać 3. Unikanie złożonych, wzajemnie powiązanych podmiotów 4. Proste kompozycje animują się lepiej

Dostosowywanie promptu:

# Good for video
Lone figure standing on cliff edge, wind blowing cape, dramatic clouds

# Less ideal for video
Group of dancers in synchronized formation, precise movements

Zarządzanie kosztami

Przy 8-krotnym koszcie obrazu, wydatki na wideo szybko rosną:

Efektywny kosztowo przepływ pracy: 1. Eksploracja w Draft mode (obrazy) 2. Znalezienie idealnej kompozycji 3. Wygenerowanie końcowego obrazu wysokiej jakości 4. Animowanie wyłącznie najlepszej wersji 5. Wydłużanie tylko w razie konieczności


Realizm filmowy

Najskuteczniejszy wzorzec uzyskiwania fotorealistycznych, filmowych rezultatów.

Szablon filmowy

[Shot type] by [Director], [subject physical description],
[action/pose], [costume/styling], [setting details],
captured with [Camera Body] using [Lens], [lighting description],
[mood/atmosphere summary]
--ar [ratio] --s [value] --p --no anime, cartoon, illustration, painting

Style reżyserskie

Reżyser Styl wizualny Najlepszy do
Ridley Scott Atmosferyczny, teksturowany, nastrojowy Sci-fi, dramat historyczny, zbliżenia
Denis Villeneuve Epicka skala, pustynny, geometryczny Krajobrazy, szerokie ujęcia
David Fincher Mroczny, precyzyjny, niepokojący Thrillery, nastrojowe portrety
Roger Deakins Sylwetki, naturalne światło, poetycki Każde ujęcie skupione na oświetleniu
Alfonso Cuarón Immersyjny, intymny, śledzący Sceny z postaciami, napięcie
Wes Anderson Symetryczny, pastelowy, kapryśny Stylizowane, wycentrowane kompozycje
Christopher Nolan Skala IMAX, praktyczny, intensywny Akcja, architektura
Terrence Malick Złota godzina, eteryczny, natura Krajobrazy, kontemplacja

Kamery filmowe — przewodnik

Kamera Estetyka Najlepsza do
RED Komodo Współczesne kino cyfrowe Zbliżenia, narracja
ARRI ALEXA Filmowy obraz, bogate kolory Wszystko w kinie
ARRI Alexa Mini Jak ALEXA, mniejsza Dokument, z ręki
ARRI ALEXA 65 Wielki format, epicka skala Krajobrazy, efekt IMAX
RED V-Raptor 8K, ostry, dynamiczny Akcja, wysoki detal
Sony Venice Pełna klatka, wszechstronna Słabe światło, anamorficzny
Hasselblad Średni format, luksusowa Portrety, moda
Leica M Dalmierz, klasyczna Street, dokument

Dobór obiektywów

Ogniskowa Efekt Najlepsza do
24mm f/1.4 Szeroki kąt, środowiskowy Krajobrazy, ujęcia ustanawiające
35mm f/2.0 Naturalny, wszechstronny Dokument, street
50mm f/1.4 Klasyczny, zrównoważony Zastosowania ogólne
85mm f/1.8 Portretowy, płytka głębia ostrości Zbliżenia, portrety
105mm f/2.0 Kompresja, intymny Portrety głowy
135mm f/2.0 Maksymalna kompresja Ciasne portrety

Kompletne przykłady filmowe

Portret zbliżeniowy:

Dramatic close-up portrait by Ridley Scott, young woman with pale skin
and auburn hair, intense green eyes staring directly at camera, subtle
freckles across nose, wearing dark wool coat, rain falling around her
face, captured with RED Komodo using 85mm f/1.8 lens, cold blue-silver
lighting with warm practical rim light, melancholic determined atmosphere
--ar 4:5 --s 150 --p --no anime, cartoon, illustration, painting

Szerokie ujęcie filmowe:

Epic wide shot by Denis Villeneuve, lone figure in orange survival suit
walking across endless salt flats, geometric patterns in dried earth,
massive dust storm approaching on horizon, captured with ARRI ALEXA 65
using 24mm f/2.0 lens, harsh afternoon sun creating stark shadows,
desolate apocalyptic atmosphere
--ar 21:9 --s 200 --p --no anime, cartoon, illustration, painting

Ważna uwaga: Nigdy nie należy używać imion aktorów. Osoby należy opisywać fizycznie. „Young woman with pale skin and auburn hair”, a nie „Emma Stone”. Imiona aktorów tworzą efekt tzw. doliny niesamowitości.


Fotografia portretowa

Schematy oświetlenia

Schemat Efekt Ustawienie
Rembrandt Dramatyczny, klasyczny Światło kluczowe pod kątem 45° z boku, tworzy trójkąt pod okiem
Butterfly Glamour, pochlebczy Światło kluczowe z góry i z przodu
Split Dramatyczny, tajemniczy Światło czysto z boku
Rim/Edge Separacja, głębia Światło od tyłu
Loop Subtelny cień Lekki kąt względem Rembrandta

Szablon portretowy

[Subject description], [expression/emotion], [pose],
[lighting pattern] lighting, shallow depth of field,
[background description], shot on [camera] with [lens]
--ar 4:5 --s 100 --v 7

Przykłady portretów

Portret środowiskowy:

Middle-aged craftsman with salt-and-pepper beard, focused expression,
hands working on leather saddle, Rembrandt lighting from workshop window,
shallow depth of field, blurred tool-filled background, shot on
Hasselblad with 80mm f/1.9, documentary authenticity
--ar 4:5 --s 75 --style raw --v 7

Portret studyjny:

Professional woman in her 30s, confident subtle smile, shoulders
turned slightly, butterfly lighting with soft fill, pure white
seamless background, shot on Phase One with 110mm f/2.8, clean
commercial aesthetic
--ar 4:5 --s 50 --v 7

Fotografia produktowa

Szablon produktowy

[Product] on [surface/platform], [background style],
[lighting setup], commercial photography, high detail,
[brand aesthetic description]
--ar 1:1 --s 50 --v 7 --style raw

Powierzchnie i tła

Powierzchnie: - Polerowany marmur (luksus) - Surowy beton (industrialny) - Naturalne drewno (organiczny) - Szczotkowany metal (technologia) - Kolorowy akryl (nowoczesny)

Tła: - Gradient (płynne przejście) - Bezszwowe (jednolity kolor) - Kontekstowe (w scenerii użycia) - Abstrakcyjne (artystyczne)

Przykłady produktów

Luksusowy kosmetyk:

Minimalist perfume bottle with gold cap on polished black marble surface,
gradient background from deep purple to black, dramatic rim lighting with
soft front fill, commercial photography, high detail, premium luxury
aesthetic, subtle reflections on marble
--ar 1:1 --s 25 --v 7 --style raw

Produkt technologiczny:

Wireless earbuds case open showing earbuds inside, floating on
pure white seamless background, soft even lighting from all sides,
commercial product photography, high detail, clean Apple-style
minimalism, subtle shadow beneath
--ar 1:1 --s 50 --v 7 --style raw

Fantasy i sci-fi

Szablon fantasy

[Character/scene description], [fantasy world details],
[magical elements], [lighting style],
[art style: painterly | concept art | illustration],
[artist influence if applicable]
--ar 16:9 --s 500 --weird 100 --v 7

Przykłady fantasy

Epickie fantasy:

Ancient elven queen seated on crystalline throne in vast cavern hall,
iridescent robes flowing with captured starlight, bioluminescent
flowers floating around her, massive glowing runes carved into
obsidian walls, ethereal volumetric lighting, painterly fantasy
illustration influenced by Craig Mullins and Alphonse Mucha
--ar 16:9 --s 600 --weird 150 --v 7

Mroczne fantasy:

Battle-scarred knight in tarnished armor standing in ruined cathedral,
sword planted in cracked stone floor, pale moonlight streaming through
shattered rose window, crows circling above, mist swirling at feet,
dark atmospheric concept art, Beksinski and Zdzisław influence
--ar 16:9 --s 400 --weird 200 --v 7

Szablon sci-fi

[Subject/scene], [technology details], [environment],
[lighting: neon | holographic | industrial | sterile],
[aesthetic: cyberpunk | hard sci-fi | retro-futurism],
[mood description]
--ar 21:9 --s 300 --v 7

Przykłady sci-fi

Cyberpunk:

Solo mercenary in worn tactical gear navigating rain-soaked neon alley,
holographic advertisements flickering overhead, steam rising from
street grates, distant megastructures visible through smog, cyan and
magenta neon reflections on wet pavement, Blade Runner cyberpunk
aesthetic, oppressive urban atmosphere
--ar 21:9 --s 350 --v 7

Twarde sci-fi:

Interior of generation ship agricultural bay, massive cylindrical
space with terraced farms curving overhead, artificial sun strip
running along central axis, workers in utilitarian jumpsuits tending
crops, visible structural engineering, hard science fiction aesthetic,
The Expanse influence, functional yet beautiful
--ar 21:9 --s 250 --v 7

Anime z Niji 7

Cechy Niji 7

Niji 7 tworzy czystsze, bardziej płaskie grafiki z ulepszonym rysunkiem linii. Interpretuje prompty bardziej dosłownie niż poprzednie wersje.

Szablon Niji 7

[Character description], [pose/action], [expression],
[setting/background], [specific style notes],
[color palette]
--niji 7 --ar [ratio]

Przykłady Niji 7

Scena akcji:

Young mage with flowing crimson hair and determined golden eyes,
casting powerful fire spell with both hands raised, intense focused
expression, ancient library crumbling around her, debris floating
in magical energy, dynamic diagonal composition, warm orange and
red color palette with cool blue shadows
--niji 7 --ar 3:4

Portret postaci:

Elegant noblewoman with silver hair in elaborate updo, wearing dark
blue Victorian-inspired gown with gold embroidery, subtle knowing
smile, half-body portrait, ornate palace balcony background with
moonlit garden visible, soft romantic atmosphere, detailed lace
and fabric textures
--niji 7 --ar 4:5

Transfer stylu z Niji 7

Niji 7 oferuje najlepszą wydajność --sref:

[Your prompt] --niji 7 --sref [style image URL] --sw 150

Należy zacząć od --sw 150 i dostosować: - Niższe wartości (50–100) dla subtelnego wpływu - Wyższe wartości (200–300) dla silnego dopasowania stylu

Migracja z Niji 6

Podejście Niji 6:

anime girl, beautiful, detailed eyes, colorful --niji 6 --style expressive

Podejście Niji 7:

Young woman with vibrant teal hair and large expressive amber eyes,
wearing casual summer dress, cheerful smile, urban cafe background,
afternoon sunlight, contemporary anime style
--niji 7

Kluczowe zmiany: - Należy pisać pełne opisy, nie listy słów kluczowych - Opisy powinny być bardziej dosłowne i szczegółowe - Presety stylów nie istnieją — należy opisać pożądany efekt - Warto używać --sref dla zachowania spójności stylu


Architektura

Szablon architektoniczny

[Building/space type], [architectural style],
[time of day/lighting], [weather/atmosphere],
[perspective: eye-level | aerial | interior | detail],
architectural photography, clean lines
--ar 16:9 --s 150 --v 7 --style raw

Style architektoniczne

Styl Cechy charakterystyczne Słowa kluczowe
Brutalizm Surowy beton, masywny, geometryczny Odsłonięty beton, monolityczny
Minimalizm Czyste linie, biel, oszczędność Przestrzeń negatywna, czyste formy
Art Deco Ozdobny, geometryczny, luksusowy Złote akcenty, wzory promieniste
Gotyk Łuki ostrołukowe, wertykalny, dramatyczny Łuki przyporowe, rozety
Japoński Drewno, papier, integracja z naturą Ekrany shoji, engawa, zen
Parametryczny Płynny, obliczeniowy, organiczny Zaha Hadid, krzywe algorytmiczne

Przykłady architektury

Brutalizm:

Brutalist concrete museum interior with dramatic skylights, afternoon
sun creating strong geometric shadows on exposed concrete walls, vast
empty gallery space with single sculpture, eye-level perspective
showing depth and scale, architectural photography by Hélène Binet
--ar 16:9 --s 100 --v 7 --style raw

Parametryczny:

Futuristic parametric architecture concert hall exterior, flowing white
curves inspired by Zaha Hadid, blue hour lighting with building interior
warmly illuminated, long exposure car light trails on surrounding roads,
wide establishing shot, architectural photography
--ar 16:9 --s 150 --v 7

Abstrakcja i eksperymenty

Szablon abstrakcyjny

[Concept/emotion to express], [visual elements],
[color palette], [texture/material qualities],
[movement/energy description], abstract composition
--s 750 --weird 500 --chaos 50 --v 7

Przykłady abstrakcji

Abstrakcja emocjonalna:

The feeling of nostalgia dissolving into hope, fragmented memories
reforming as light, soft blues transitioning to warm amber, watercolor
textures bleeding into geometric shapes, gentle upward movement,
abstract emotional landscape
--ar 1:1 --s 800 --weird 750 --chaos 40 --v 7

Abstrakcja teksturalna:

Microscopic landscape of oxidized copper and crystalline salt
formations, verdigris greens and rust oranges, extreme macro detail,
mineral textures catching diffused light, abstract geological patterns
--ar 1:1 --s 500 --weird 300 --v 7

Przesuwanie granic

Aby uzyskać naprawdę eksperymentalne rezultaty: - Można ustawić --weird powyżej 1000 - Połączyć z --chaos 75+ - Używać abstrakcyjnego, emocjonalnego języka - Odwoływać się do niekonwencjonalnych artystów

The architecture of forgotten dreams, impossible geometries folding
through chromatic space, Escher meets Kandinsky, synesthetic color
relationships, visual music
--ar 1:1 --s 1000 --weird 2000 --chaos 75 --v 7

Wagi słów

Składnia :: pozwala kontrolować nacisk na poszczególne elementy.

Składnia

word::2      # Double emphasis
word::1.5    # 50% more emphasis
word::1      # Normal (default)
word::0.5   # Half emphasis
word::-1     # Negative (avoid)

Przykłady

ethereal::2 portrait of a warrior, dramatic lighting::1.5, mist::0.5

Ten prompt: - Silnie podkreśla eteryczną jakość - Umiarkowanie wzmacnia dramatyczne oświetlenie - Zmniejsza obecność mgły

Kiedy używać wag

Przydatne do: - Precyzyjnego regulowania równowagi elementów - Tłumienia niechcianych interpretacji - Podkreślania kluczowych cech

Lepiej unikać, gdy: - Dopiero eksplorujemy pomysł - Prosty prompt działa bez tego - Nie ma pewności, co podkreślić

Wskazówka ekspercka: Wagi słów to narzędzie do szlifowania, nie punkt wyjścia. Najpierw należy dopracować podstawowy prompt, a dopiero potem używać wag do precyzyjnego dostrojenia.


Negatywne prompty

Parametr --no wyklucza elementy z generowanego obrazu.

Podstawowe użycie

/imagine Beautiful landscape --no people, text, watermark

Skuteczne wykluczenia

Cel Wykluczenie
Fotorealizm --no anime, cartoon, illustration, painting, drawing
Czysty obraz --no text, watermark, signature, frame, border
Naturalny wygląd --no oversaturated, HDR, artificial
Poważny ton --no cute, chibi, kawaii
Prosta kompozycja --no busy, cluttered, crowded

Najlepsze praktyki

Warto: - Używać konkretnych, precyzyjnych terminów - Reagować na rzeczywiste problemy w wynikach - Ograniczać listę do 3–5 pozycji

Lepiej unikać: - Tworzenia wyczerpujących list wszystkiego, czego nie chcemy - Używania ogólnikowych określeń („bad”, „ugly”) - Wykluczania elementów, które i tak raczej się nie pojawią

Wykluczenie kinematograficzne

Aby uzyskać spójne fotorealistyczne rezultaty:

--no anime, cartoon, illustration, painting, drawing, sketch, CGI, 3D render

Kontrola seed

Wartości seed umożliwiają powtarzalność i kontrolowaną zmienność.

Podstawowe użycie

/imagine [prompt] --seed 12345

Ten sam prompt + ten sam seed = bardzo podobny wynik.

Znajdowanie wartości seed

Po wygenerowaniu obrazu można kliknąć informacje o obrazie, aby sprawdzić użyty seed. Warto go zanotować na potrzeby reprodukcji.

Przepływy pracy z seed

Przepływ pracy z wariacjami: 1. Generowanie z losowym seed 2. Znalezienie wyniku, który się podoba 3. Zanotowanie wartości seed 4. Wprowadzenie drobnych zmian w prompcie przy tym samym seed 5. Porównanie wariacji

Spójność w seriach:

Scene in morning light --seed 54321
Scene in afternoon light --seed 54321
Scene in evening light --seed 54321

Użycie tego samego seed w powiązanych promptach tworzy bardziej spójne kompozycje.


Kompozycja wielopodmiotowa

Złożone sceny z wieloma podmiotami wymagają starannej konstrukcji promptu.

Podejście hierarchiczne

Podmioty należy wymieniać w kolejności od najważniejszego:

[Primary subject], [secondary subject], [tertiary subject],
[their relationship/interaction], [setting], [style]

Język przestrzenny

Warto używać jasnych deskryptorów przestrzennych:

In the foreground, [subject A]
In the middle ground, [subject B]
In the background, [subject C]

Lub:

On the left, [subject A]
In the center, [subject B]
On the right, [subject C]

Przykład

Elderly grandmother and young granddaughter baking together in
sunlit kitchen, grandmother guiding child's hands rolling dough,
flour dusting the wooden counter, warm afternoon light from window,
vintage kitchen appliances in background, intimate family moment,
documentary photography style
--ar 3:2 --s 100 --v 7

Renderowanie tekstu

V7 znacząco poprawił renderowanie tekstu w obrazach.

Najlepsze praktyki

Tekst powinien być krótki: - Pojedyncze słowa działają najlepiej - Krótkie frazy (2–4 słowa) zazwyczaj działają - Długie zdania często się nie udają

Należy używać cudzysłowów:

Neon sign reading "OPEN" in storefront window

Warto określić typografię:

Vintage poster with "JAZZ NIGHT" in art deco typography

Przykłady tekstu

Szyldy:

Rainy city street at night, neon diner sign reading "EAT" glowing
red through rain-streaked window, film noir atmosphere
--ar 16:9 --s 150 --v 7

Typografia:

Minimalist book cover design, large serif typography reading "THE END"
centered on cream paper texture, literary fiction aesthetic
--ar 2:3 --s 100 --v 7

Ograniczenia

Renderowanie tekstu wciąż ma problemy z: - Długimi zdaniami - Złożonymi czcionkami - Małym tekstem w zatłoczonych obrazach - Wieloma elementami tekstowymi

Wskazówka ekspercka: Jeśli tekst jest kluczowy, lepiej wygenerować obraz bez tekstu i dodać typografię w postprodukcji.


Pętla iteracji

Profesjonalny przepływ pracy w Midjourney:

Faza 1: Eksploracja (Draft Mode)

1. Enable Draft mode (--draft)
2. Write basic prompt with core concept
3. Generate 4-8 batches quickly
4. Identify promising directions
5. Note what works/doesn't

Cel: Znaleźć kierunek, nie perfekcję. Szybkość ma znaczenie.

Faza 2: Dopracowywanie

1. Disable Draft mode
2. Take best concepts from Phase 1
3. Add specific details
4. Adjust parameters (--s, --chaos, etc.)
5. Generate in Fast mode
6. Compare variations

Cel: Zawęzić wybór do 2–3 mocnych opcji.

Faza 3: Perfekcjonowanie

1. Select best candidate
2. Note the seed
3. Make micro-adjustments to prompt
4. Use same seed for consistency
5. Upscale final choice

Cel: Wypolerować zwycięzcę.

Podział czasu

Faza Czas Tryb
Eksploracja 60% Draft
Dopracowywanie 30% Fast
Perfekcjonowanie 10% Fast

Większość użytkowników odwraca te proporcje, poświęcając zbyt dużo czasu na perfekcjonowanie pierwszych prób. Warto więcej eksplorować, a mniej szlifować.

Describe w interfejsie webowym

Można kliknąć prawym przyciskiem myszy dowolny obraz w interfejsie webowym i wybrać „Describe”, aby wygenerować cztery prompty tekstowe na podstawie obrazu.17 Jest to nieocenione narzędzie do analizy stylów — wystarczy opisać obraz ze strony Explore, a następnie zmodyfikować uzyskane prompty zgodnie z własną wizją. Prompty są automatycznie czyszczone po odświeżeniu strony.


Zarządzanie kosztami

Zrozumienie czasu GPU

  • Fast Mode: Wykorzystuje godziny GPU z subskrypcji
  • Relax Mode: Nieograniczony, ale kolejkowany (plany Standard+)
  • Draft Mode: Połowa kosztu GPU w porównaniu ze standardowym
  • Video: Około 8x koszt obrazów

Wartość subskrypcji

Plan Godziny Fast Relax Video Relax $/godz. GPU
Basic 3,3 godz. Nie Nie 3,03 $
Standard 15 godz. Tak Nie 2,00 $
Pro 30 godz. Tak Tak 2,00 $
Mega 60 godz. Tak Tak 2,00 $

Ważne: Plany Standard+ oferują znacznie lepszą wartość za godzinę GPU oraz nieograniczony tryb Relax.

Strategie oszczędzania

  1. Eksploracja w Draft mode — połowa kosztu, 10x szybciej
  2. Relax do eksploracji — bez dodatkowych kosztów (Standard+)
  3. Fast tylko na finały — wyłącznie gdy jakość ma znaczenie
  4. Grupowanie podobnych promptów — bardziej efektywne niż pojedyncze generacje
  5. Planowanie przed generowaniem — najpierw przemyśleć, potem generować

Szacowanie zużycia

Czynność Przybliżone minuty GPU
4 obrazy (standard) ~1 min
4 obrazy (draft) ~0,5 min
Upscale ~0,5 min
Video (4x 5 s) ~8 min

Rozwiązywanie problemów

Najczęstsze problemy

Problem Przyczyna Rozwiązanie
Rozmazane twarze Niskie –s lub konflikt stylów Użyć --style raw, zwiększyć szczegółowość w prompcie
Nieprawidłowe proporcje Domyślne 1:1 Określić --ar jawnie
Zbyt artystyczny Wysokie –s Obniżyć do 50–100
Zbyt dosłowny Niskie –s Zwiększyć do 200+
Niespójne wyniki Niski chaos Użyć --seed dla spójności
Styl dominuje Wysokie –sw Zmniejszyć wagę --sw
Tekst się nie renderuje Ograniczenie V7 Krótki tekst, cudzysłowy
Dziwne dłonie Ograniczenie AI Przyciąć lub wygenerować ponownie
Pokoje nie znalezione Funkcja usunięta 26 lutego 202616 Używać folderów i strony Organize

Konflikty parametrów

Lepiej nie łączyć: - --style raw + wysokie --s (sprzeczne) - --v 7 + --niji (trzeba wybrać jedno) - Wielu silnych referencji z wagą 100% - --exp 50+ + --stylize (exp przytłacza) - --exp 50+ + --p (exp nadpisuje)

Dobrze współgrają: - --oref + --sref przy umiarkowanych wagach - --chaos + --seed (zróżnicowane, ale powtarzalne) - --style raw + niskie --s (maksymalny fotorealizm) - --exp 10-25 + --s 100-200 (wzbogacone, kontrolowane)

Gdy nic nie działa

  1. Uprościć — usunąć parametry, skrócić prompt
  2. Rozdzielić — spróbować podmiotu i stylu osobno
  3. Szukać seed — wygenerować wiele wariantów, znaleźć dobry seed, iterować
  4. Referencja — użyć --sref z obrazem pokazującym cel
  5. Wersja — wypróbować inną wersję modelu

Migracja między wersjami

Migracja z V6 do V7

Stary styl V6:

portrait, beautiful woman, dramatic lighting, 8k, detailed, masterpiece

Nowy styl V7:

A contemplative portrait of a woman in her 30s, Rembrandt lighting
casting gentle shadows across her face, medium format photography
aesthetic with shallow depth of field

Kluczowe zmiany

Aspekt V6 V7
Styl promptu Słowa kluczowe Język naturalny
Słowa jakościowe Pomocne W większości ignorowane
Referencja postaci --cref --oref
Personalizacja Opcjonalna Domyślna
Domyślne zachowanie Stylizowane Bardziej dosłowne

Czego przestać robić

  • Spamować słowami kluczowymi („beautiful, stunning, amazing”)
  • Używać modyfikatorów jakości („8k, ultra detailed, masterpiece”)
  • Używać --cref (teraz jest --oref)
  • Pisać krótkie prompty oddzielane przecinkami

Co zacząć robić

  • Pisać pełne zdania
  • Opisywać to, co widzimy, nie to, czego chcemy
  • Precyzyjnie określać oświetlenie, materiały, nastrój
  • Używać terminologii fotograficznej (aparaty, obiektywy)
  • Korzystać z personalizacji (--p)

Ściągawka parametrów

MODELS
--v 7           Default, best overall (June 2025)
--niji 7        Anime/manga (Jan 2026, best coherence)
--niji 6        Anime/manga (legacy, has --style options)
--draft         Fast iteration, 10x faster, half cost

ASPECT
--ar 16:9       Widescreen
--ar 21:9       Cinematic ultrawide
--ar 4:5        Portrait (Instagram)
--ar 6:11       Tall portrait (phone wallpapers)
--ar 9:16       Vertical (Stories)
--ar 1:1        Square
--ar 3:2        Classic photo
--ar 2:3        Portrait print

STYLE
--s 0-100       Photorealistic
--s 100-300     Balanced
--s 300-1000    Artistic
--style raw     Minimal AI interpretation
--p             Apply personalization (V7 default)

EXPERIMENTAL
--exp 0-100     Enhanced detail (10-25 sweet spot)
--chaos 0-100   Output variety
--weird 0-3000  Unconventional aesthetics

REFERENCES
--oref [url]    Subject/character (V7)
--ow 0-1000     Omni weight (default 100)
--sref [url]    Style transfer
--sw 0-1000     Style weight (default 100)
--iw 0-2        Image weight (default 1)

VIDEO (Web only)
--motion low    Subtle movement (default)
--motion high   Dynamic movement
--raw           More prompt control

QUALITY
--q 1           Full quality (default)
--seed [num]    Reproducibility

NEGATIVE
--no [items]    Exclude elements

Historia zmian

Data Zmiana Źródło
2026-03-03 Zaktualizowano harmonogram V8 (przebieg destylacji pod koniec lutego, wydanie opt-in na początku marca, ~30-dniowa faza pre-alpha przed ustawieniem jako domyślny). Dodano składnię moodboard --profile oraz łączenie z kodami --sref. Dodano funkcję Describe on Web. Dodano usunięcie Rooms (26 lutego). 1617
2026-02-28 Zaktualizowano status V8 (wciąż w toku na 28 lutego, potwierdzona natywna rozdzielczość 2K, przebudowa architektury). Rozszerzono sekcję moodboard/profile (wiele nazwanych profili, 5x szybsza konfiguracja, doprecyzowane progi stabilności do 40/200/2000). 1415
2026-02-17 Status V8: faza końcowego dopracowywania, wiele rating parties w połowie lutego, wydanie wkrótce. Potwierdzone funkcje V8 (style refs, moodboards, edycja). Dodano proporcje 6:11, wskazówki dotyczące interakcji z –ow, aktualizacje platformy webowej (operacje zbiorcze, automatyczne czyszczenie parametrów). 1213
2026-02-09 Zaktualizowano status V8 (testy wewnętrzne, rating party, przejście z TPU na GPU, nowy przepływ tworzenia), rozszerzono szczegóły dotyczące Niji 7 (dryf –sref, jakość oczu, alternatywa –cref) 910
2026-01-20 Dodano sekcję HD Video mode (4x rozdzielczość, ~3,2x koszt, tylko Pro/Mega) 8
2026-01-17 Dodano status rozwoju V8, sekcję Moodboards, –sv 4 dla starszych kodów sref Skan webowy
2026-01-16 Dodano informacje o planie rozwoju V7.1, zweryfikowano pokrycie Niji 7 Skan webowy
2026-01-13 Utworzono przewodnik obejmujący V7, Niji 7 i funkcje wideo Wiele źródeł
2026-01-09 Wydano Niji 7 z ulepszoną spójnością 3
2025-06-19 Wydano V1 Video Model 4
2025-06-17 V7 stał się domyślnym modelem 2
2025-04-30 Aktualizacja V7: parametr –exp, ulepszenia edytora 5
2025-04-03 Wydano V7 2

Źródła


  1. Midjourney Updates. Oficjalny dziennik zmian i ogłoszenia. 

  2. Midjourney Version Documentation. „Version 7 was released on April 3, 2025, and became the default model on June 17, 2025.” 

  3. Niji V7 Announcement. „Niji V7 is now live” — 9 stycznia 2026. 

  4. V1 Video Model. Generowanie wideo udostępnione 19 czerwca 2025. 

  5. V7 Update, Editor, and –exp. Szczegóły aktualizacji z 30 kwietnia 2025. 

  6. V8 Development Discussion. Dyskusja społeczności na temat trenowania V8 i szczegółów planu rozwoju z sesji Q&A z Davidem Holzem. 

  7. Moodboards Feature. Personalizacja Midjourney poprzez moodboards i ocenianie obrazów. 

  8. HD Video Mode. „HD Video mode delivers 4x sharper AI-generated clips… costs roughly 3.2 times more than SD.” Sierpień 2025. 

  9. Office Hours Jan 22. V8 w fazie końcowego strojenia, funkcjonalność 3D, plany aplikacji mobilnej, rozszerzenie trybu wsadowego. 

  10. Office Hours Feb 12. Rating party sygnalizujące wydanie V8, projekty sprzętowe, badania nad 3D w czasie rzeczywistym. 

  11. V8 Development Overview. Przejście z TPU na GPU/PyTorch, wariant V8 mini, Style Creator, nowy zbiór danych. 

  12. V8 Rating Party Updates. Wiele rating parties w tygodniu od 16 lutego, wydanie V8 spodziewane wkrótce potem. Potwierdzone funkcje: style refs, moodboards, personalization, weird, style creator, upscaling, edycja. 

  13. Web Updates Jan 20, 2026. Dodano proporcje 6:11, 4:5, 5:4, 21:9, operacje zbiorcze dla 2000 elementów, automatyczne usuwanie nieistotnych parametrów. 

  14. V8 Release Status. „Midjourney V8 could drop next week” — natywna rozdzielczość 2K, kompletna przebudowa architektury, znacząco ulepszone renderowanie tekstu. Koniec lutego 2026. 

  15. Profiles and Moodboards. Wiele nazwanych profili, 5x szybsza konfiguracja, wybór wielu aktywnych profili, 40 ocen na start, stabilność od 200, poprawa do 2000. 

  16. V8 Distillation and Release Timeline. Ostatni przebieg destylacji rozpoczął się pod koniec lutego, ~1 tydzień trwania, następnie wydanie opt-in z ~30-dniową fazą pre-alpha przed ustawieniem jako domyślny. Funkcja Rooms usunięta 26 lutego 2026. 

  17. Describe on Web + Moodboard Blending. Funkcja Describe po kliknięciu prawym przyciskiem generuje 4 tekstowe prompty z dowolnego obrazu. Łączenie moodboard z kodami --sref i parametrem --profile do bezpośredniego użycia identyfikatora moodboard.