Zum Inhalt springen

KI generiert Videos Ist die neue Video-KI Sora ein Gamechanger?

Die Video-KI der ChatGPT-Macher OpenAI liefert beeindruckende Resultate. Um ihren Job müssen sich Video-Creator jedoch noch nicht sorgen.

Seit letzter Woche ist die Video-KI Sora der Öffentlichkeit zugänglich (allerdings noch nicht in Europa). Auf einen entsprechenden Text-Prompt hin – etwa: «ein Dalmatiner mit Sonnenbrille fährt Skateboard» – generiert der Dienst ein Video, auf dem ein Skateboard fahrender Hund mit Sonnenbrille zu sehen ist.

Sora ist in der Schweiz noch nicht verfügbar

Box aufklappen Box zuklappen

In der EU und auch in der Schweiz herrschen beim Datenschutz strengere Richtlinien als in den USA. Unternehmen hinter KI-Diensten wie Sora müssen deshalb Wege finden, ihre Produkte im Einklang mit diesen Vorgaben funktionieren zu lassen.

Das verzögert deren Einführung, macht sie in der Regel aber nicht unmöglich: Bereits in der Vergangenheit hat Sora-Macher OpenAI neue Dienste erst ausserhalb der EU und der Schweiz lanciert, um sie nach ein paar Wochen oder Monaten auch hierzulande zugänglich zu machen.

Ob und wann das auch bei Sora der Fall sein wird, ist noch offen. Von Seiten OpenAI heisst es nur, das Unternehmen gebe sein Bestes, um bald auch in Europa an den Start zu gehen.

Einige der so generierten Inhalte lassen sich auf den ersten Blick kaum von echten Filmen unterschieden. Ausserdem bietet Sora neben anderen Werkzeugen die Möglichkeit, mit einem Storyboard gleich mehrere Szenen zu einer längeren Sequenz zusammenzufügen.

Hollywood muss sich (noch) keine Sorgen machen

Schnell werden aber auch die Grenzen der Technologie sichtbar: Videos können höchstens in HD-Qualität generiert werden, aber nicht in 4K-Auflösung. Und sie haben eine Dauer von fünf bis höchstens 20 Sekunden. Von der Vorstellung, dass die KI auf Knopfdruck einen ganzen Kurz- oder gar Kinofilm ausspuckt, ist man noch weit entfernt.

Nicht zuletzt auch darum, weil die künstliche «Intelligenz» kein wirkliches Verständnis unserer Welt besitzt. Sie hat nur mithilfe von sehr viel Trainingsmaterial gelernt, welches Bild am wahrscheinlichsten auf das nächste folgt. In den errechneten Sequenzen kann das zuweilen unfreiwillig komisch aussehen: Menschen laufen unnatürlich, Objekte bewegen sich entgegen den Gesetzen der Physik oder verschwinden von einem Bild zum nächsten, weil die KI Probleme mit der Objektpermanenz hat.

Lieber KI statt Stock-Videos?

Klar: OpenAI wird Sora weiter entwickeln und kommende Versionen werden noch bessere Resultate liefern. Das Grundproblem, dass die KI nicht weiss, was sie da eigentlich tut, wird aber auch das nicht lösen. So werden auch in Zukunft viele Versuche nötig sein, bis eine Sequenz in etwa dem entspricht, was man sich gewünscht hat.

In den meisten Industrien wird so eine Video-KI kein Job-Killer sein, sondern bloss ein mehr oder weniger nützliches Werkzeug, das Kreative bei der Arbeit unterstützen und auf neue Ideen bringen kann. Anders sieht es aus, wenn es um sogenannte Stock-Videos geht – um generische Filme also, die etwa bei Präsentationen oder in der Werbung zum Einsatz kommen. Hier könnte es bald einfacher werden, sich von der KI ein massgeschneidertes Video erstellen zu lassen, statt im Angebot der Bildagenturen nach etwas zu suchen, das einigermassen passt.

Zu teuer für Private, zu schlecht für Professionelle?

Auch Private könnten Video-KIs wie Sora in Zukunft nutzen, um in den sozialen Medien mit lustigen oder spektakulären Videos auf sich aufmerksam zu machen. Wohin das führen kann, haben frei zugängliche KI-Bildgeneratoren wie Dall-E oder Midjourney gezeigt: Plattformen wie Facebook werden heute von Bildern regelrecht überschwemmt, die mithilfe von künstlicher Intelligenz erzeugt wurden.

Allerdings: Der Aufwand für das Training und den Unterhalt eines Systems wie Sora ist ausgesprochen hoch. So hoch, dass ein gewinnbringendes Geschäftsmodell für Nutzende wohl mit derart hohen Kosten verbunden sein müsste, dass der Gebrauch für Private bald zu teuer wird.

Für den professionellen Einsatz dagegen sind die Resultate heute noch zu unzuverlässig und werden es wohl auch in Zukunft bleiben, solange die KI kein wirkliches Verständnis von dem hat, was sie eigentlich macht. Es kann also sein, dass ein Dienst wie Sora, so beeindruckend er auch sein mag, in der Praxis zwischen Stuhl und Bank fällt.

Radio SRF 2 Kultur, 16.12.2024, 17:50 Uhr

Meistgelesene Artikel