An einem sonnigen Nachmittag Anfang Juli 2022 traf ich den Musiker und Schriftsteller Tom Combo zufällig auf dem Kirchplatz in Winterthur. Er erzählte mir von einem Programm im Web, dem er aus Neugierde folge. Es sei eine Künstliche Intelligenz, die Bilder erschaffe aufgrund einer rein verbalen Eingabe. «Ein Haus auf einer Wiese, darum herum Kühe» zum Beispiel.
So etwas werde die Welt komplett verändern, natürlich nicht zum Guten, gerade für mich als Illustrator und Cartoonist.
Die ersten Einblicke
Kurz darauf bemühte ich mich auch, Zugang zu dieser Betaversion von Midjourney.com zu erhalten – einfach, weil ich es fast nicht glauben konnte.
Wirklich konsumentenfreundlich war (und ist) das alles noch nicht. Man musste einen Account eröffnen und bei einem Kanal mitmachen, in dem man auch immer sah, was andere Anwenderinnen gerade generierten. Doch genau darin lag auch die erste Chance.
Was die Maschine innert weniger Sekunden generierte, haute mich fast um.
Mir fiel sogleich auf, dass weit über die Hälfte der permanent entstehenden Bilder von anderen Usern plumpe Science-Fiction-Darstellungen waren, Fantasy- und Horrorbilder – fast fotorealistisch. Genau das machte mir keine Angst, denn es ist ein Genre, das schon in der konventionellen Illustration den grössten Anteil hat. Eines, welches mich in den wenigsten Fällen interessiert.
Aber zwischendurch gab es Beiträge, die einfach wunderschön waren, wirkliche grafische Qualität und Einmaligkeit besassen. Wer oder was erschuf das?
Kraftwerk-Papageien und Pilzköpfe
Meine allererste Eingabe, mit der ich die KI fütterte, lautete: «/Imagine: The German Techno Group Kraftwerk Is Playing in the Jungle With Parrots On Their Heads». (Die deutsche Technogruppe Kraftwerk spielt im Dschungel mit Papageien auf den Köpfen.)
Was die Maschine dann innert weniger Sekunden generierte, haute mich fast um. Sie folgte nämlich nur am Rande meiner Anweisung. Sie arbeitet – und das machte mir sogleich Angst – assoziativ.
Sie nahm die Gestalt der Band Kraftwerk, die vier Musiker hinter ihren vier Synthesizern, und kreuzte sie mit Papageien, die auf Papageienstangen sitzen. Die Synthesizerständer wurden zu Papageienstangen, die roten Hemden der Kraftwerker zu Papageienfedern. Eine gespenstische Verschmelzung dieser Bestandteile, wie in einem komischen Traum. Ich war verunsichert. Das assoziative Denken hielt ich bisher für eine meiner Stärken.
An diesem Punkt wurde aber auch meine Kreativität geweckt. Was macht die Maschine, wenn ich ihr Dinge zurufe, die ich selbst weiss?
The Beatles, besonders in ihrer Früh-1960er-Anzug-Phase und Kraftwerk, beides vier Männer, haben doch optisch gewisse Gemeinsamkeiten. Getreu meiner Vermutung verschmolz Midjourney die Silhouette von Kraftwerk mit den Beatles zu einer Synthieband mit Pilzköpfen. Grafisch, black & white, puh… krass.
Die KI übt mit Vermeer
Doch warum wählte die Maschine genau diese Machart? Denn man kann diese beschriebenen Dinge in ganz unterschiedlichen Stilen darstellen. Naturalistisch, fotorealistisch, grafisch reduziert. Man könnte sie stechen, als Holzschnitt machen, mit Aquarell malen, in Öl.
Ich empfand Midjourney in diesem Moment als Werkzeug und nicht als Monster. Aber nur fast.
Hier machte es die KI dann doch so, wie es ihr gefiel. Dann stellte ich fest, dass ich selbst einfach noch hinschreiben könnte, dass ich es mir von Vermeer gemalt wünsche, oder im Bauhaus-Stil. Die Maschine lieferte sekundenschnell das Gewünschte – nicht immer perfekt, aber doch erstaunlich gut.
Das ist auch kein Wunder, denn je bekannter eine Künstlerin oder ein Künstler ist, desto mehr von seinem Werk gibt es im Netz. Diese Bilder sind das Gedächtnis der KI, sie greift auf das alles zu und liefert daraus etwas Drittes. Je mehr Leute mitmachen, desto besser wird die KI. Wie ein Lebewesen.
Atomstrom direkt ab Hof
Meine Atomkraftwerk-Serie entsprang einerseits dieser KI-Zukunftsangst, und andererseits dem damit verbundenen trotzigen Bedürfnis, diese unheimliche Technologie für meine Zwecke zu nutzen, um sie damit zumindest symbolisch für mich kontrollieren zu können.
Ausgangspunkt dieser spontan in gut zwei Stunden gemachten Arbeit war ein Cartoon von mir, den ich 2011 für die WOZ zeichnete. Darauf war ein von mir erfundenes AKW in Marthalen (ZH) aus dem 17. Jahrhundert abgebildet, das in der typischen Riegelhausarchitektur des Zürcher Weinlands gehalten ist – romantisches Landleben, inklusive «Strom direkt ab Hof»-Schild.
Ich stellte mir nämlich vor, wie es wäre, wenn es schon in den «guten alten Zeiten» Atomkraftwerke gegeben hätte. Bei diesem Bild machte ich eine Fusion der AKW-Architektur mit der Riegelhausarchitektur.
Das brauchte einerseits Fantasie, formal assoziatives Denken, aber auch Recherche in Architektur. An dieser Zeichnung habe ich heute noch Freude, und bei meinen Cartoon-Lesungen erzeugt sie immer noch Gelächter.
Ein AKW im alten Venedig
Zwölf Jahre später nahm es mich wunder, wie Midjourney historische AKWs erzeugen würde. Meine erste Idee waren venezianische AKWs. Ich spekulierte nämlich – das ist ja etwas, was die KI selbst nicht kann – dass Midjourney die Kuppeln der venezianischen Kirchen zu Reaktorgebäuden machen würde.
Und wo sieht man diese Kuppeln sehr gut? Auf den Gemälden des Venedig-Malers Canaletto. Auch um eine historische «Glaubwürdigkeit» erzeugen zu können, war der Stil Canalettos ideal. Meine Eingabe lautete folglich: «/Imagine: A venezian nuclear power plant, in the style of Canaletto». (Ein venezianisches AKW im Stil von Canaletto.)
Tatsächlich lieferte die KI die Bilder, immer deren vier, fast so, wie ich sie mir ungefähr vorgestellt hatte. Ich empfand Midjourney in diesem Moment als Werkzeug und nicht als Monster. Aber nur fast. Denn es war schon unheimlich, wie die KI in wenigen Sekunden vollwertige Bilder erschuf.
Und welche architektonischen Gimmicks sie einbaute – Renaissance-Portale, kleine angebaute typisch italienische Nebengebäude, jeweils eine ulkige, fast romantische Wolke darüber, die natürlich von einem nicht vorhandenen Kühlturm stammen müsste, aber wie sollte das die KI wissen? Sie sah einfach AKW-Bilder im Netz, und bei vielen von denen schwebt eine Dampffahne über einem Kühlturm.
AKWs von den Azteken und Rudolf Steiner
So machte ich weiter, denn ich wollte nun auch altägyptische AKWs sehen, römische, babylonische, chinesische aus der Kaiserzeit und – nicht zu vergessen – aztekische AKWs und solche der Inka im Urwald von Guatemala.
Auch ein AKW an der Limmat im Zürich des 19. Jahrhunderts generierte ich – und da staunte ich dann schon, denn der Reaktor hat eine gewisse Ähnlichkeit mit der Sternwarte Urania.
Ich kam ins Feuer, ich wollte auch sehen, wie Hieronymus Bosch Atomkraftwerke gemalt hätte, Vermeer, Ferdinand Hodler, der Expressionist Otto Dix. Oder wie hätte Rudolf Steiner das AKW Dornach 1 und 2 gestaltet? Brasilia-Architekt Oscar Niemeyer seins?
Die KI malt mir die Welt
Mir fiel auf, dass die KI kulissenhaft arbeitet, und manche räumlichen Volumen nicht stimmen. Sie baut sich kein 3D-Modell, sondern setzt in ihrer ganzen Beschränktheit nur zusammen, was sie findet. Das aber ausgesprochen gut.
Ich war so in diese Welt eingetaucht, dass ich nach dem Abschalten des Handys selbst meine Wohnung als von KI gemalt wahrnahm. Ich hatte auch ein schlechtes Gewissen. Denn eigentlich spreche ich mich gegen KI aus, und nun habe ich davon gekostet – schon viel gekostet.
Ein KI-freies Gütesiegel
Eine Journalistin hatte mich mit einem KI-Bild konfrontiert, das «painted by Ruedi Widmer» sei. Es war schon viel näher an meinen eigenen Zeichnungen als meine Versuche ein halbes Jahr davor.
Die KI scheint meinen Namen und meine Zeichnungen inzwischen flüchtig zu kennen. Aber sie ist trotzdem noch weit weg davon, für mich wirklich gefährlich zu sein – notabene hat sie ja (noch) nicht die Fähigkeit, Witze zu erfinden.
Ich hatte häufig eine typische Reaktion erlebt: Diese Schöpfungen sähen alle unlebendig und immer gleich aus.
Aber viele zeichnende Kolleginnen und Kollegen müssen sich in Acht nehmen. Denn reine Stimmungsbilder, ein abendlicher Weiher zum Beispiel, ein Zelt unter Sternenhimmel – darin ist die KI gut, und da besteht auch die Gefahr, dass viele Zeitungsredaktionen weiter sparen und ihre Illustrationen selbst machen.
Es bräuchte also eine Art Gütesiegel für «KI-freie» Illustrationen (und natürlich auch Texte). Gar Bekenntnisse der Medienhäuser, KI-frei zu sein. Denn es wird voraussichtlich bald militante Gegner geben, ähnlich wie bei Gentech.
Das KI-Unwohlsein geht um
Die Reaktionen von Illustratorinnen und Illustratoren weltweit auf KI-Kunst von Midjourney, Dall-E oder Stable Diffusion sind teilweise heftig. Der amerikanische Produktdesigner Ammaar Reshi, Verfasser eines komplett mit ChatGPT geschriebenen und mit Midjourney gezeichneten Kinderbuchs, erhielt Todesdrohungen.
Viele Kreative sagen, dass diese KIs auch Material mit ihrem eigenen Copyright stehlen und daraus etwas Neues machen. Aber das ist ja das, was auch wir Kreativen die ganze Zeit tun. Wir imitieren, entwickeln es weiter, bis es zu etwas Eigenem wird. Niemand macht auf Weiss etwas komplett Neues.
Unwohlsein und Fatalismus sind auch in meinem gestalterischen Umfeld spürbar. Die einen haben sich noch gar nicht damit abgegeben. Ein Illustrator-Kollege erzählte hingegen, er habe tatsächlich Angst davor, verdränge diese Gefühle aber auch.
Auf Facebook hatte ich letzten Sommer häufig eine typische Reaktion erlebt: Diese Schöpfungen sähen alle unlebendig und immer gleich aus. Maschinell, unmenschlich. Ein bisschen recht musste ich geben, aber das war vor einem halben Jahr. Eine lange Zeit in der Entwicklung einer künstlichen Intelligenz.
Wem gehören meine AKW-Bilder? Mir? Midjourney? Den Erben von Canaletto?
Jemand anderes sagte, Ideen werde eine solche «Software» nie haben – man erkennt auch am Begriff «Software» den Duktus des Bekannten. KI ist keine Software. Eine Grafiker-Kollegin war wie ich kritisch-fasziniert, machte sogleich einen Zugriff, und war kurz danach auch schon am Ausprobieren. Vielleicht nicht der schlechteste Weg, dieser neuen Welt zu begegnen.
Helferlein oder Frankenstein
Ich kann mir gut vorstellen, dass KI im grafischen Bereich viel smarter eingesetzt werden könnte, als Helferlein sozusagen, während des digitalen Illustrierens. Ähnlich einer automatischen Rechtschreibhilfe oder eines Spurassistenten beim Auto, das die Absicht schon voraussehen kann, und dafür eine ideale Lösung einwebt, obwohl man die Werkzeuge nicht aus der Hand gibt.
Aber es kann auch brutal werden. Die KIs sind eben doch Frankensteins Monster, Höllenmaschinen. Sie machen ganze Märkte kaputt. Sie machen das digitale Bild wertlos. Sie machen sogar Ideen wertlos und Millionen von Menschen arbeitslos. Sie können für Hasskampagnen eingesetzt werden. Unsere Gesichter missbrauchen.
Einmal mehr liegt mir Angela Merkel von 2018 in den Ohren, die den prophetischen Satz sagte: «Das Internet ist für uns alle Neuland.» Was wurde die Bundeskanzlerin ausgelacht im Netz. Genau von den Techies, die einfach machen, was man technisch machen kann – und hinterher müssen dann die Politikerinnen, die Juristen, Philosophinnen, die Künstler alles in geordnete Bahnen lenken.
Nur schon juristisch: Wem gehören zum Beispiel meine AKW-Bilder? Mir? Midjourney? Den Erben von Canaletto? Ein US-Gericht entschied kürzlich, dass man erst ein Urheberrecht auf ein von einer KI erzeugten Bildes haben kann, wenn man selbst nochmals Hand anlegt. Das habe ich bei den AKWs nicht getan. Also hätten alle das Recht, diese Bilder weiterzuentwickeln. Man könnte sie zum Beispiel in Öl auf Leinwand wieder abmalen.
Mit Midjourney machen wir etwas Neues, völlig Ungewohntes. Wir fotografieren eigentlich unsere Gedanken. Früher zeichneten wir sie.