Auf Twitter und Instagram tauchten in letzter Zeit skurrile Bilderserien auf: Welten, die nicht zusammengehören, verzogene Gesichter, comicartige Arrangements.
Da ist zum Beispiel Donald Trump, wie er im Game «Mario Kart» seine Runden dreht:
Oder diese seltsame Mischung aus dem Kiwi-Vogel und der gleichnamigen Frucht:
Oder der «Star Wars»-Bösewicht Darth Vader am Rasenmähen:
Es scheint ein regelrechter Wettkampf um die schrägsten Kombinationen entbrannt. Ausgedacht in den Köpfen von Menschen – ausgeführt von einer künstlichen Intelligenz (KI).
Was hat es damit auf sich? Möglich macht’s die Anwendung Dall-E, benannt in Anlehnung an den Künstler Salvador Dalí. Sie wurde darauf trainiert, schriftliche Befehle in Bildform umzusetzen.
Wir kennen KI schon aus vielen Bereichen, etwa der Gesichtserkennung auf Fotos. Aber dass sie nun zur Schöpferin von Werken wird, ist eine neue Dimension.
Wer steckt dahinter? Die Forschergruppe Open AI, finanziert von Tesla-Gründer Elon Musk und von Microsoft. Deren Anwendung Dall-E gibt es seit rund eineinhalb Jahren, die Nutzung ist aber auf einen kleinen Kreis beschränkt.
Seit es eine kostenlose, frei zugängliche, aber etwas einfachere Version gibt, experimentieren Userinnen und User rege damit. Dalle-E Mini hiess diese und wurde jetzt in Craiyon umbenannt, um eine Verwechslung mit dem Original zu vermeiden.
Hier geht's zum Bildgenerator
Wie arbeitet Dall-E oder eben Craiyon? Nach dem Befehl dauert es in der Regel ein paar Minuten, bis die KI neun Vorschläge ausspuckt. Die Maschine setzt dazu Puzzleteile aus dem Netz neu zusammen. Fehlende Informationen muss sie dazu erfinden – was mal besser, mal schlechter funktioniert. Die Gratisversion benutzt als Grundlage etwa 15 Millionen Bilder, die Profi-Variante etwa die 27-fache Datenmenge.
Überzeugen die Resultate? Die Bilder der Gratis-Anwendung sind oft verzerrt, falsch zusammengesetzt oder schwammig. Manchmal sehen die Bilder aus wie realistische Fotos, meist aber eher wie surreale Gemälde. Das hat seinen eigenen Reiz, aber die KI muss noch dazulernen.
Auf den Befehl «Bruce Springsteen mit Billie Eilish auf der Bühne» oder «Papst auf einem E-Scooter» erkennt man im Resultat zwar die gewünschten Figuren, doch die Qualität ist weit von fotorealistisch entfernt. «Heidi, gemalt von Van Gogh» klappt ganz gut, «Blocher von Ferdinand Hodler» hingegen nicht.
Was ist von der Technik noch zu erwarten? Die neuste, leistungsfähige Version Dall-E 2 kann offenbar nicht nur Stile imitieren, sondern selbst komplexe Anforderungen und Charakteristika von Kunstwerken nachahmen. Für Aufsehen gesorgt hat das Beispiel eines Seeotters anstelle des Mädchens mit dem Perl-Ohrring im berühmten Bild von Jan Vermeer. Die Qualität ist verblüffend.
Der Unterschied zur Gratisversion ist offensichtlich. Diese scheitert an der Aufgabe.
Wie wird die Dall-E künftig genutzt? Die Profi-Anwendung Dall-E 2 soll bald für zahlungspflichtige Kunden angeboten werden. Auch Google arbeitet an einem eigenen System. Die schnell zunehmende Qualität könnte in gewissen Bereichen zu einer ernsthaften Konkurrenz für Illustratorinnen, Bildbearbeitern oder Fotografinnen werden, die etwa Stockbilder anfertigen.
Wenn KI fotorealistische Bilder anfertigt: Erhöht das die Gefahr von Missbrauch? Das ist ein Grund, wieso die Technik bisher nur ausgewählten Testnutzern zugänglich ist. Open AI und Google versichern, dass sie die KI künstlich einschränken, was Gesichter von Menschen und Nacktheit betrifft. Das soll Deepfakes verhindern, dass also Gesichter in anderen Situationen zweckentfremdet werden.
Tatsächlich sind in den Beispielen von Open AI bisher keine Gesichter zu sehen, sondern nur Tiere, Landschaften oder andere Arrangements.