Unsere Stimme gebe eine riesengrosse Menge von Informationen über uns preis, weiss Rita Singh. Sie kennt sich aus: Singh forscht an der US-Universität Carnegie Mellon in Pittsburgh dazu, was sich dank des Einsatzes von künstlicher Intelligenz alles aus der Stimme erfahren lässt.
Und dann setzt sie mit ruhiger Stimme an, all die Informationen aufzuzählen: Informationen über die Form des Gesichtes oder die Struktur des Skelettes, über die Grösse, das Gewicht, das Alter, ob jemand Medikamente nimmt oder krank ist – physisch oder psychisch.Dazu kommen Informationen über Verhaltensmerkmale einer Person: «Zum Beispiel wie dominant sie ist oder ob sie Führungsqualitäten hat. Informationen über den demographischen Hintergrund, über den Ausbildungsgrad und sogar darüber, wie viel jemand verdient», sagt Singh.
Und nicht nur über die Person, die spricht, soll die Stimme Auskunft geben, sondern auch über ihre Umgebung: Ob sich beispielsweise der Sprecher oder die Sprecherin in einem Raum befindet, wie gross dieser Raum ist, wie die Wände beschaffen sind und wie die Decke, was am Boden liegt. «Da gibt es sehr viele Informationen!», stellt die Computerwissenschaftlerin lachend fest.
In der Stimme stecken Informationen zur Grösse, zum Gewicht oder zum Alter einer Person. Aber auch dazu, ob jemand krank ist, wie dominant diese Person ist oder welche Führungsqualitäten sie hat.
Allerdings: Noch ist die Technologie nicht so weit, um all diese Informationen tatsächlich zuverlässig aus der Stimme herauszulesen. Doch Rita Singh verspricht sich rasche Durchbrüche. Nicht zuletzt dank Fortschritten im Gebiet der künstlichen Intelligenz. Denn mit dieser Technik kann der Computer Informationen aus winzigen Tonfragmenten gewinnen, die nicht länger als ein Vierzigstel einer Sekunde dauern.
Rita Singh: «Ich würde die derzeitige Situation mit dem Stand der Genforschung in den 1980er-Jahren vergleichen. Bloss dass es bei uns noch schneller vorwärtsgehen wird als damals in diesem Feld, weil sich viel mehr Leute mit der Forschung zur künstlichen Intelligenz beschäftigen.»
Neuen Möglichkeiten schaffen auch neue Probleme. Denn unsere Stimme wird immer öfter aufgezeichnet – sei es an Hotlines von Telefonanbietern oder Banken, bei Sprachassistenten auf dem Smartphone oder bei intelligenten Lautsprechern wie Google Home, Amazon Echo und neu dem Home Pod von Apple. Die Hersteller dieser Produkte hätten die Möglichkeit, unsere Stimme auf ihren Servern zu speichern, auszuwerten und so detaillierte Benutzerprofile zu erstellen.
Die einzelnen Anbieter gehen mit diesen Möglichkeiten ganz unterschiedlich um: «Bei der Swisscom dient die Stimme ausschliesslich zur Identifikation der Kunden. Es werden keine Daten gespeichert oder zu Profilen verarbeitet», sagt Pressesprecherin Sabrina Hubacher. Auch Apple rühmt sich, Nutzerdaten höchstens in anonymisierter Form auf den eigenen Servern zu speichern.
Amazon dagegen will auf die Anfrage, wie die Stimmen der Benutzerinnen und Benutzer heute und in Zukunft ausgewertet werden, keine Stellung nehmen. Und bei Google heisst es, dass heute keine solchen Auswertungen gemacht werden. Über die Zukunft lasse sich nicht spekulieren.
Was die rechtlichen Bestimmungen angeht, ist die Lage in der Schweiz klar. Auch nach einem Hinweis, dass die Stimme aufgezeichnet wird, ist eine spätere, heimliche Analyse dieser Daten nicht erlaubt. «Eine weitergehende Analyse mit künstlicher Intelligenz ist selbstverständlich durch das Datenschutzgesetz untersagt», erklärt der eidgenössische Datenschutzbeauftragte Adrian Lobsiger.
Das heimliche Auswerten der Stimme ist in der Schweiz verboten.
Wenn schon, dann müssten die Benutzerinnen und Benutzer genau darüber aufgeklärt werden, dass ihre Stimme ausgewertet wird, zu welchem Zweck das geschieht und mit welchen Mitteln. Sogar wie die künstliche Intelligenz funktioniert, die dabei eingesetzt wird, und weshalb sie zu welchen Schlüssen kommt, müsse offen liegen. Und selbst da wäre Adrian Lobsiger sehr zurückhaltend, eine solche Praktik zu erlauben.
Die Computer-Wissenschaftlerin Rita Singh hat noch eine andere Idee, wie mit dem Problem umzugehen: «Mehr Technologie!» Nämlich Algorithmen, die alle Informationen aus der Stimme herausfiltern, die für die Steuerung eines Gerätes oder die Übermittlung einer Nachricht nicht wirklich notwendig sind.
Noch seien diese Algorithmen zu langsam, um kommerziell eingesetzt zu werden. Aber wenn die Technik einmal so weit sei, dann müssten wir uns um unsere Privatsphäre bei der Sprachsteuerung von Apps und elektronischen Geräten keine Sorgen mehr machen.