Es erstaunt grundsätzlich nicht, dass derartige Spracherkennungsdienste Audioaufnahmen auswerten, denn das wird von den Firmen grundsätzlich so kommuniziert. Dass aber auch Mitarbeiter die Aufnahmen hören, notieren und somit auswerten wurde in den Geschäftsbedingungen zuvor nicht explizit erwähnt.
Auch private Informationen betroffen
Wofür die Aufzeichnungen gebraucht werden, wissen nur die Unternehmen selbst. Offiziell wird verlautet, dass die Aufnahmen der Verbesserung der künstlichen Intelligenz (KI) der Spracherkennung dienen. Ausgewertet werden Audioausschnitte, die von den Programmen nicht korrekt verstanden wurden. Mitarbeiter transkribieren die aufgezeichneten Audioausschnitte und trainieren damit die Software. So kann die KI Lücken in der Erkennung schliessen und damit die Präzision der Spracherkennung verbessern.
Grundsätzlich sollten nur direkte Aufforderungen an die Systeme selbst aufgezeichnet werden. Es passiert aber immer wieder, dass die Spracherkennung fälschlicherweise aktiviert wird und intime Situationen aufzeichnen. Mitarbeitende der Firmen berichten von sehr privaten Informationen, die sie mitangehört hätten wie beispielsweise Bankkonto-Informationen, Arztgespräche oder Beziehungsprobleme.
Alle grossen Techkonzerne machen mit
Bei Microsoft ist der Telefon-Dienst Skype betroffen. Aufgezeichnet wurden jene Gespräche, bei denen die Übersetzungsfunktion in Anspruch genommen wird, berichtete die Webseite «Motherboard» am Mittwoch. Auch der Microsoft-Sprachassistent «Cortana» speichert Befehle und anderweitige Kommunikation ab, um diese zur Systemverbesserung zu verwenden.
Bereits im April wurde bekannt, dass auch Amazon mehrere tausend Mitarbeiter beschäftigte, welche Aufnahmen auswerteten. Betroffen waren das Sprachassistenzprogramm «Alexa», welches in den Echo-Lautsprechern von Amazon integriert ist sowie zum Teil Kunden der Cloud-Dienstleistungen. Nutzer haben nun die Möglichkeit, die Verwendung von Audio-Mitschnitten in den Einstellungen abzulehnen.
Apple und Google krebsen zurück
Bei Siri – dem Sprachassistenten von Apple – wurden weniger als ein Prozent der Siri-Aufnahmen wurden analysiert. Die nur wenige Sekunden langen Tonschnippsel werden bis zu zwei Jahre abgespeichert, können aber angeblich nicht mit einem zugehörigen Account identifiziert werden. Siri funktioniert auch auf Apple Watches und dem Apple HomePod. Die Analysen zur Verbesserung der Sprachassistenz werden zurzeit nicht mehr ausgewertet. Zukünftig soll der Kunde aktiv der Auswertung zustimmen müssen, verspricht Apple.
Der Assistent von Google, Google Home, speichert rund 0.2 Prozent der aufgenommenen Sequenzen zur Auswertung. Das behauptet das Unternehmen. Mitschnitte zur Verbesserung der Funktionen der Sprachassistenz werden in Europa seit Juli bis November nicht mehr ausgewertet. Dies aber nur, weil der Hamburger Datenschutzbeauftragte in einem Verwaltungsverfahren juristischen Druck aufsetzte.
Die Situation in der Schweiz
Laut einer 2019 durchgeführten Social-Media-Studie stehen momentan in jedem fünften Schweizer Haushalt Sprachassistenten von Google, Apple oder Amazon. Diese bieten zurzeit aber keine Lösung, um auch auf Schweizerdeutsch mit den Sprachassistenten sprechen zu können. Start-Ups wie Recapp aber auch die Swisscom arbeiten jedoch an der Perfektionierung der Mundart-Erkennung.