De nieuwe AI-tool Sora van OpenAI: met 1 prompt een realistische video
Van tekst naar beeld: dat kennen we inmiddels wel. Maar OpenAI komt nu met de volgende stap: van tekst naar video! Met de AI-tool Sora kun je ‘realistic and imaginative scenes’ creëren op basis van tekstuele input. En de eerste output is het bekijken waard.
Hoe werkt de AI-tool Sora?
In de LinkedIn-post van OpenAI die deze nieuwe tool aankondigt, laten ze weten dat Sora video’s tot 60 seconden kan creëren. En dat met gedetailleerde scenes, complexe camerabewegingen en meerdere karakters met levendige emoties. Zowel realistische beelden als surrealisme en animatie-stijl: het is allemaal mogelijk.
Het creatie-proces met Sora lijkt op de werking van bijvoorbeeld ChatGPT voor tekst en Midjourney voor beeld. Je bedenkt een prompt, hoe uitgebreider hoe beter, en de tool doet vervolgens het werk. Bekijk de onderstaande met Sora gemaakte video maar eens (klik op de afbeelding voor de video en scroll een beetje naar beneden).
Deze video is uit de tool komen rollen na de volgende prompt:
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
Op de website van OpenAI hebben ze 9 voorbeelden staan, waarbij je voorbeeld 3 en 4 zo in een film kunt gebruiken, voorbeeld 5 het begin van een nieuwe animatie-film kan zijn en 8 een reclame voor koffie (of cola).
Zelf aan de slag met Sora
Helaas moeten we hiervoor nog even geduld hebben. Sora wordt momenteel door deskundigen getest op de mogelijke schadelijke gevolgen die deze tool met zich mee kan brengen. Daarnaast heeft een team van visual artists, designers en filmmakers toegang om vanuit hun kennis en kunde feedback te geven op de in- en output van deze AI-tool.
Optimalisatie van de tool
Voordat het grote publiek ermee aan de slag mag, worden er dus eerst nog wat puntjes op de i gezet. Zo laat OpenAI bijvoorbeeld weten dat de tool nog moeite heeft met het onderscheiden van links en rechts, zoals je in het onderstaande voorbeeld ziet. De man op de loopband loopt zo te zien niet de goede kant op.
De prompt die bij deze video hoort, is:
Prompt: Step-printing scene of a person running, cinematic film shot in 35mm.
Nog een voorbeeld dat ze noemen: je kunt Sora een video laten maken van een persoon die een hap neemt van een koekje, maar vervolgens in de output zien dat er, na het nemen van de hap, geen stuk van het koekje mist. Dit klinkt bekend in de oren: AI-tools als Midjourney hadden in de begindagen natuurlijk ook meer ‘last’ van zogenaamde hallucinaties (simpel uitgelegd: dingen die niet kloppen). Denk aan mensen met 11 vingers of 3 ogen.
👉 Bekijk in dit artikel nog meer Sora-video’s.
Yay or nay?
Ik hoop dat OpenAI zo zorgvuldig is met de ontwikkeling van deze tool als ze op hun website claimen. Net zoals we zien met de creatie van beeld, kan ook deze tool leiden tot veel nepnieuws en andere fake content. Maar laten we vooral niet alleen de risico’s zien: dit is uiteraard weer een hele mooie stap in contentcreatie met AI. Ik zie veel kansen! Jij ook?