De details zijn subliem: zo gebruik je Midjourney v6
De wereld staat nooit stil. Sinds eind december is het voor iedereen met een abonnement op Midjourney mogelijk om te werken met Midjourney v6. Dit is alweer de zesde, levensveranderende iteratie van de tool in anderhalf jaar tijd. De vorige grote update, v5, verscheen in maart 2023. Wat brengt v6 met zich mee, in vergelijking tot v5?
Let wel: op het moment van schrijven is v6 alleen nog beschikbaar als Alpha. Dat betekent dat deze versie nog in de beginfase is. Alle beloften die ze met v6 doen, zullen in latere versie van dit nieuwe model beter werken.
Wat is Midjourney ook alweer?
Kort samengevat is Midjourney een server op Discord, waarin je geschreven prompts aanlevert die de tool omzet in AI gegenereerde afbeeldingen. Zodra je een abonnement afsluit, krijg je toegang tot gesprekken met Midjourney bot. Deze bot maakt vervolgens vier afbeeldingen op basis van jouw tekst. Hoe meer je betaalt, hoe meer opties je hebt. Abonnementen op Midjourney variëren qua prijs tussen $10,- en $120,- per maand.
Zo gebruik je Midjourney
- Ga naar midjourney.com/home
- Klik op ‘Join the beta’
- Maak een account aan op Discord
- Sluit een abonnement naar keuze af
- Log in op Discord
- Klik linksboven op het paarse icoontje (het logo van Discord)
- Klik vervolgens in het menu ernaast onder ‘directe berichten’ op Midjourney Bot
- Typ /imagine en schrijf uit wat je wil zien
Stel Discord op de correcte manier in
Aangezien Midjourney v6 momenteel in de Alpha fase zit, gebruik je dit niet standaard. Als je voor het eerst Midjourney opstart, maak je gebruik van v5.2. Typ daarom eerst /settings en druk op enter. Daarmee verschijnt het volgende scherm in beeld:
Klik vervolgens op het dropdownmenu en selecteer Midjourney Model V6 [ALPHA]. Nu kun je beginnen met het prompten van afbeeldingen in het nieuwste model. Typ /imagine en schrijf wat je wil zien.
Wat is nieuw in Midjourney v6?
Het is altijd weer een verrassing wat elke upgrade van Midjourney met zich meebrengt. Ik zet hieronder de 4 grootste wijzigingen op een rijtje:
1. Vernieuwd promptsysteem
Houd er allereerst rekening mee dat het hele promptsysteem overhoop is gehaald. Je zult specifieker moeten zijn in wat je wil zien. In v5 kun je het systeem vragen om termen als ‘fotorealistisch’ of ‘4K’. Dat zal nu geen effect hebben. Wel kun je om een specifieke resolutie of stijl vragen die jij voor ogen hebt. Hoe duidelijker jij communiceert, hoe groter de kans is op betere output.
2. Langere prompts
Het is nu mogelijk om langere, uitgebreidere prompts te schrijven. Zo kun je veel meer sturing geven aan de output die je wil. Ook is het mogelijk om een scene te beschrijven met daarin meerdere objecten. Midjourney is over het algemeen slim genoeg om die objecten van elkaar te onderscheiden en het plaatje wat jij voor ogen hebt te creëren.
3. Realistischere output
In Midjourney v5 is het al mogelijk om nagenoeg fotorealistische output te krijgen met een goed prompt. Toch is er bijna altijd wel iets te vinden in een afbeelding waardoor je denkt: aha, dit is door AI gegenereerd. Met v6 is de volgende stap richting fotorealisme gezet en is het de bedoeling dat het onderscheid straks nog minder is.
4. Tekst in je afbeelding
In eerdere versies van Midjourney was het al mogelijk om te vragen om teksten in je te genereren afbeelding op te nemen. In de praktijk leek de tekst dan wel op wat je vroeg, maar helaas was het nooit helemaal wat je zocht. De tekst had iets weg tussen Russisch, Egyptische hiërogliefen en jouw input. In v6 zou dit verleden tijd moeten zijn.
Midjourney v6 vergeleken met v5 en v1
In mijn vorige artikel over de introductie van Midjourney v5, vergeleek ik de output van dezelfde prompts met elkaar. Ditmaal ga ik opnieuw naar dezelfde prompts en leg ik alle drie de versies naast elkaar. Hierbij wel een kanttekening: Midjourney v6 vraagt om een andere manier van prompten, die ik hierin nog niet meeneem. Daar ga ik later in dit artikel dieper op in.
Zoals je ziet, is het verschil in de kwaliteit tussen v1 en v5 veel groter dan de kleine subtiele verschillen tussen v5 en v6. Daarnaast zijn de gebruikte prompts zeer matig. De manier waarop mensen, dus ik ook, in het begin prompten, vergeleken met nu, is gigantisch veranderd. Daarom duiken we nu dieper in op de laatste afbeelding hierboven van de Batman-kat. Hoe zorg je ervoor dat je optimaal gebruikmaakt van de promptmogelijkheden om deze afbeelding nog sterker te maken?
Batman-kat v6: het optimaliseren van prompts
We hebben nu alleen te maken met Batman-kat zonder enige context. We krijgen daarom een simpel portret van Batman-kat. Niets meer en niets minder. Daarom gaan we het prompt optimaliseren om meer uit Midjourney v6 te halen. Daarvoor heb ik het volgende prompt geschreven:
‘Batman cat is standing on the roof of a large skyscraper, in the center of Gotham City. His body language shows he is ready for the upcoming battle against Joker dog –ar 16:9 –style raw –v 6.0’
Met – – ar16:9 geef ik dimensies mee in het prompt en met – – style raw zorg ik ervoor dat de output minder opgepoetst is. Een van de resultaten is als volgt:
Kijk, dat begint al ergens op te lijken. We hebben Batman-kat nu in een setting geplaatst. Helaas is het perspectief van de kat van de achterkant, terwijl ik van de voorkant in mijn gedachten had. Dus ik herschrijf het prompt iets verder tot het volgende:
‘Batman is a cat is standing on the roof of a large skyscraper, in the center of Gotham City. His body language shows he is ready for the upcoming battle against Joker dog. Give me an image from the front, where we see Batman cats face –ar 16:9 –style raw –v 6.0’
Een van de gegenereerde afbeeldingen is de afbeelding hierboven. Maar wat nu opvalt, is dat het regenachtige weer ineens is verdwenen. Nog een element om mee te nemen in het te schrijven prompt om betere resultaten te genereren.
Op deze manier kom je steeds dichter bij de essentie van Midjourney. Itereren op je vorige prompt, nieuwe elementen toevoegen die je wilt laten terugkeren en weer door. En daar is Midjourney V6 bij uitstek geschikt voor, want je kunt veel uitgebreidere en gedetailleerde prompts schrijven. Als laatste voeg ik daarom regen toe aan het prompt:
‘Batman cat is standing on the roof of a large skyscraper, in the center of Gotham City. His body language shows he is ready for the upcoming battle against Joker dog. Give me an image from the front, where we see Batman cats face. It is raining. –ar 16:9 –style raw’
En dan komen we uit op dit resultaat. Zoals je merkt, staat Batman-kat nu niet meer bovenop een wolkenkrabber, maar op een lager gebouw of zelfs op de grond. Hoe dan ook: het resultaat ziet er prachtig uit, maar je blijft toch nog lang bezig met het herschrijven van je prompts om de output te optimaliseren. Daar zit het meeste werk in.
En hoe zien die teksten eruit?
Zoals eerder in dit artikel uitgelegd zou het nu ook mogelijk moeten zijn om teksten toe te voegen aan afbeeldingen, zonder dat ze uitvagen tot rare tekens. In de praktijk is dit helaas nog niet geoptimaliseerd. Voor het gemak heb ik hetzelfde prompt als hierboven gebruikt en daar het volgende aan toegevoegd:
Below is a text in the centre middle saying “Batmancat”.
Door met de dubbele quotaties te werken – “tekst” – geef je aan welke tekst in de afbeelding moet terugkeren. Dat is nieuw. Om je een idee te geven wat voor resultaten dit oplevert, deel ik hieronder een plaatje van vier gegenereerde afbeeldingen die hieruit voortkwamen:
Hier is nog wel wat werk aan de winkel. Ik verwacht wel dat Midjourney v6.1 of v6.2 straks veel beter omgaat met het verwerken van teksten in AI gegenereerde afbeeldingen. De toekomst zal het ons leren.
Oneindig blijven sleutelen
Zoals je merkt, kun je oneindig blijven sleutelen aan ideeën in je hoofd. Midjourney v6 biedt je opties om uitgebreidere prompts te schrijven en dieper op details in te gaan. De tool is slim genoeg om onderscheid te maken in de vereisten die je meegeeft.
Als je op zoek bent naar enige vorm van consistentie in de te genereren stijl van de afbeeldingen, dan kom je met juist prompten een stuk dichter bij dan voorheen. Om daar te komen is alleen nog steeds veel tijd en moeite nodig. Teksten genereren op afbeeldingen gaat nog niet zo uitgebreid als beloofd, maar ik verwacht dat dit in komende updates wel bijtrekt. Nu blijft er in ieder geval ruimte over om zelf creatief te blijven of toch hulp in te schakelen van een ervaren designer.