KI und kein Ende – an Textgeneratoren wie ChatGPT hat man sich fast schon gewöhnt. Auch ”Text zu Bild”-Apps sind längst überall in den News. Doch nun geht es einen entscheidenden Schritt weiter: automatisch generierte Videos.
So hat jüngst Hashem Al-Ghaili den etwa zehnminütigen Kurzfilm ”Last Stand” auf Tik-Tok und Youtube veröffentlicht, in dem pyramidenförmige Alien -Raumschiffe aus dem Nichts auftauchen und von der Menschheit als Bedrohung wahrgenommen werden.
Als Beschreibung hat Al-Ghaili hinzugefügt: der Film sei ”größtenteils von der KI erstellt, die das Drehbuch schrieb, die Konzeptgrafik erstellte, alle Stimmen generierte und an einigen kreativen Entscheidungen beteiligt war. Die in diesem Film verwendeten KI-generierten Stimmen spiegeln nicht die Meinungen und Gedanken ihrer ursprünglichen Besitzer wieder. Dieser Kurzfilm wurde als Demonstration des Potenzials der KI beim Filmemachen erstellt.” Zur Sicherheit heißt es gleich am Anfang als “Disclaimer”: ”Nichts davon ist real. Es ist nur ein Film.”
KI erinnert an ”Krieg der Welten”
Angesicht solcher Warnungen fühlt man sich beinahe an den Medienstreich von Orson Welles erinnert, der im Jahr 1938 mit seiner damals unglaublich realistisch wirkenden ”Live-Radioreportage” Krieg der Welten (in Wahrheit als Hörspiel nach dem Roman von H.G. Wells inszeniert) eine Panik in New York auslöste, so dass die Menschen vor den angeblichen Invasoren vom Mars tatsächlich geflohen sind.
So leicht lässt man sich heute als Fake-News-gehärtete User nicht mehr ins Bockshorn jagen, aber beeindruckend ist der KI-Kurzfilm auf jeden Fall, zumal im Rahmen des weltweiten Konflikts ganz real aktuelle Personen auftreten wie US-Präsident Joe Biden, Wladimir Putin und andere bekannte Politiker und Personen der Gegenwart. Auch der frühere und jetzt unter Anklage stehende US-Präsident Donald Trump gibt seinen unvermeidlichen Senf dazu ab. Das wirkt alles unfassbar real und ist aus echten Kontexten gezogen, doch in diesem imaginären ”Krieg der Welten”-Zusammenhang eine reine Erfindung.
KI zur Video-Generierung schreitet rasant voran
Zwar wird bei diesem Beispiel nicht ganz klar, wie viel die KI genau allein gemacht hat, und ab wo der Macher selbst Hand angelegte, um dieses überaus realistische und spannende Video zu produzieren – aber der KI-Kurzfilm lohnt sich bis zum Ende, mit einem trotz aller bekannten Klischees überraschenden Schluss.
Doch das ist nur der Anfang, denn nach einem Bericht von Futurezone.at hat das Forschungsteam Runway Research (bekannt für den Text-zu-Bild-Generator Stable Diffusion) sein neues Programm ”Gen-2” der Öffentlichkeit vorgestellt, dessen Zweck es ist, aus reinen Texteingaben etwa 3 Sekunden lange Videos zu generieren. Dazu benutzt das Projekt als weiter entwickelte KI G-2 statt wie bisher G-1.
Dem Bericht zufolge lassen sich Text und Bilder durch die künstliche Intelligenz kombinieren, um Bewegtbilder zu erstellen. Selbst aus einem einzelnen Foto könne die Software einen kurzen Videoclip anfertigen. In einem kurzen Video auf Youtube präsentiert der Entwickler die neuen, beeindruckenden Möglichkeiten.
Kurzclips auch aus Standbildern
Zwar befindet sich das Projekt noch in der Betaphase, doch mit der künstlichen Intelligenz könne man auch bestehende Videos bearbeiten. So lässt sich ein ”echtes” Video mit einem abstrakten Bild kombinieren, zum Beispiel einem Selbstporträt von Vincent van Gogh, dann werde der Stil des Bildes auf das gesamte Video übertragen. Mit Gen-2 könne man außerdem Objekte oder Personen per Tastenklick aus bestehenden Videos entfernen oder hinzufügen. Selbst aus Pappe gebastelte Attrappen reichen demnach aus, um mittels des KI-Filters mehr oder weniger realistische Landschaften oder Häuser entstehen zu lassen.
Die Entwickler gehen davon aus, dass künstliche Intelligenz eine ”Revolution in der Filmbranche” auslösen werde. ”Stell dir vor, du schaust dir einen Film an und bist der Hauptdarsteller – mit deiner Stimme, deinem Körper und deinem Gesicht“, wird Runway-Chef Cristobal Valenzuela aus einem Interview gegenüber dem US-Medium Forbes zitiert. Sobald die Software wie geplant der Allgemeinheit zur Verfügung gestellt wird, kann das jeder selbst ausprobieren. Bis zur kompletten Täuschung, dass auch die mitwirkenden Personen fotorealistisch wirken, ist es aber noch ein ganzes Stück hin. Futurezone weist darauf hin, dass auch die Konkurrenz nicht schläft und beispielsweise Google oder Facebook (Meta) an vergleichbaren Programmen arbeiten, ebenso wie der chinesische Handelskonzern Alibaba.
Noch viel Luft nach oben – aber es dürfte rasch voranschreiten
Runway präsentiert seine neue Text-zu-Video-KI auf dieser Homepage mit weiteren Erklärungen und vielen Beispielen. Dort sieht man auch deutlich, dass die trickfilmartigen Erzeugnisse wesentlich überzeugender wirken, als die ansatzweise fotorealistischen,. Doch sollte man sich nicht täuschen lassen – die Entwicklung geht rasant vorwärts, und was andere Start-ups noch im Keller oder in der Garage produzieren, um dann überraschend damit an die Öffentlichkeit zu gehen, bleibt bei allen Bedenken spannend. Ein Moratorium für KI welcher Art und Dauer auch immer, wie zuletzt von Elon Musk mit Steve Wozniak und anderen gefordert, dürfte bloßes Wunschdenken natürlicher Intelligenzen bleiben…