Wie heisst der Avatar?
Der Avatar spricht mit einer weiblichen Stimme. Wir haben die KI deshalb «Ava» getauft.
Was ist der Zweck von «Ava»?
Wir setzen «Ava» in verschiedenen Radio- und TV-Sendungen ein, um zu zeigen, wozu generative KI heute schon in der Lage ist und wo gleichzeitig ihre Grenzen liegen. Wir setzen das System live ein. Dabei sind reale Antworten des Sprachmodells zu hören, anhand derer wir die Funktionsweise und Eigenheiten moderner KI-Systeme erklären können.
Wie funktioniert «Ava»?
«Ava» versteht Schweizerdeutsch und kann in Mundart angesprochen werden. Sie antwortet auf Hochdeutsch.
Im Hintergrund läuft folgendes ab: Das System transkribiert die Mundart-Frage in hochdeutschen Text. Dieser Text wird dann als Frage an ein Sprachmodell (eine generative KI) geschickt, welches eine Text-Antwort generiert. Dieser Text wird in eine hochdeutsche Stimme verwandelt und animiert ein comicartiges Gesicht.
Über einen sogenannten System-Prompt kann «Ava» unterstützt werden. So können wir ihre Aussprache, die Länge der Antworten oder den Tonfall beeinflussen – oder ihr Kontext-Informationen geben (zum Beispiel wie die Sendung heisst, in der «Ava» gerade auftritt).
Warum ist «Ava» comicartig gestaltet?
Die Täuschungsgefahr durch KI-generierte Videos mit Realitätsbezug und insbesondere der Darstellung von Menschen ist gross. So dürfen bei SRF zum Beispiel KI-generierte menschliche Bots oder Avatare als Repräsentanten von Moderatorinnen und Moderatoren nur im Rahmen von deklarierten Experimenten verwendet werden. Mit der visuellen Umsetzung von «Ava» betonen wir die Künstlichkeit und vermeiden Missverständnisse.
SRF hat den Umgang mit KI in den Publizistischen Leitlinien sowie in den KI-Handlungsanweisungen definiert.
Was kann «Ava» und was nicht?
«Ava» kann eine Frage in Mundart interpretieren und darauf eine Antwort in Hochdeutsch geben. Die Transkription in hochdeutschen Text funktioniert meistens zuverlässig, macht aber ab und zu Fehler. Die Antworten bilden die Fähigkeiten von GPT-4o ab, sind also oft erstaunlich gut – regelmässig aber auch inhaltlich falsch oder unlogisch.
«Ava» kann nicht verstehen oder fühlen, «Ava» weiss nicht, was sie sagt. «Ava» benötigt Funkdisziplin: Sie kann nicht zwischen verschiedenen Stimmen unterscheiden, Personen erkennen, mehrere Fragen gleichzeitig beantworten, von selbst etwas sagen oder an einer natürlich fliessenden Gesprächsrunde teilnehmen.
Hat «Ava» eine Persönlichkeit?
Nein. Wir können dem Sprachmodell hinter «Ava» die Anweisung geben, sich wie eine Person mit bestimmten Eigenschaften zu verhalten. Das beeinflusst statistisch die Auswahl der Wörter in der Antwort. Wenn wir «Ava» beispielsweise die Anweisung geben, «fröhlich, manchmal etwas frech» zu sein, berechnet das Modell die Wahrscheinlichkeit gewisser Wörter in der Antwort höher als andere und wählt sie entsprechend eher aus.
Wie wird verhindert, dass «Ava» unanständige Dinge sagt?
Wir setzen Software eines kommerziellen Anbieters ein, die einschränkt, was das Sprachmodell antworten kann. Zusätzlich verwenden wir einen System-Prompt, um «Ava» Anweisungen zu geben, wie sie sich verhalten soll. Nur ausgewählte, geschulte Personen von SRF sprechen mit «Ava» – dadurch haben wir unter Kontrolle, welche Fragen überhaupt gestellt werden. «Ava» tritt in den meisten Fällen in Begleitung eines Fachredaktors auf, der das Verhalten des Modells erklären und einordnen kann.
Ist «Ava» öffentlich verfügbar?
Nein, das System kann nur SRF-intern eingesetzt werden.
Wird SRF «Ava» auch nach der Themenwoche «KI und wir» einsetzen?
«Ava» wurde erstellt, um die Fähigkeiten und Grenzen moderner generativer KI während der Themenwoche «KI und wir» zu demonstrieren. Weitere Einsätze in der Wissensvermittlung sind theoretisch möglich, aktuell jedoch nicht geplant.