Darum geht’s: Forschende der Universität Michigan arbeiten an einer KI, die das Hundebellen in Echtzeit entschlüsselt – von der Rasse bis zur Stimmung des Vierbeiners. Die KI soll helfen, Hunde besser zu verstehen. Dazu hat das Team bestehende Computermodelle, die auf Basis menschlicher Sprache trainiert wurden, umfunktioniert. Das Team ist überzeugt, dass die Fortschritte in der künstlichen Intelligenz unser Verständnis der Tierkommunikation revolutionieren könnten. SRF-Digitalredaktor Guido Berger zufolge ist die KI aber noch weit entfernt von einem Übersetzungstool.
Das Vorgehen: KI-gestützte Systeme werden in der Forschung eingesetzt, um Nuancen in Tonfall, Tonhöhe und Akzent zu unterscheiden, was wiederum Technologien wie Spracherkennungssoftwares ermöglichen. Sie erstellten Tonaufnahmen von 74 bellenden, knurrenden und winselnden Hunden. Mithilfe von Machine Learning und anhand dieser Tonaufnahmen könnte man herausfinden, um welchen Hund es sich handelt, welchem Geschlecht und welcher Rasse er zugehört und in welcher Stimmung er sich befindet – ist er aggressiv, müde oder aufgeregt.
Die Schwierigkeit: Eines der Haupthindernisse für die Entwicklung von KI-Modellen, die Tierstimmen analysieren können, ist der Mangel an öffentlich verfügbaren Daten. Tiere erzeugen nicht einfach auf Knopfdruck Laute. Das Aufnehmen und Produzieren der Tierstimmen ist laut Berger deshalb schwierig. «KI-Technologien funktionieren nur dann gut, wenn sie mit Milliarden von Wörtern gefüttert werden. Bei der Studie mit den Hunden gab es insgesamt etwa 17'000 Aufnahmen von Hundegeräuschen», erklärt Berger. Das sei im Vergleich zu anderen KI-Modellen ein kleiner Datensatz.
Die Erkennungsraten waren zwar deutlich besser als mit früheren Methoden, insgesamt aber immer noch ziemlich tief.
Die Erkenntnisse: «Das Erkennen der Hundelaute hat mit diesem Trick deutlich besser funktioniert als bei früheren Studien», so Berger. Insbesondere die Rasse und die Situation, in der sich der Hund befindet, konnten besser erkannt werden. Bei der Erkennung des Geschlechts der Hunde fiel das Ergebnis aber eher schlechter aus.
Die Grenzen des Ansatzes: «Die Erkennungsraten waren zwar deutlich besser als mit früheren Methoden, insgesamt aber immer noch ziemlich tief, teilweise sogar nahe am Zufall», sagt Berger. Aus seiner Sicht ist es noch offen, ob diese menschlichen Trainingsdaten wirklich zu einem besseren Verständnis zwischen Menschen und Hunden führen. Ein wesentlicher Punkt sei auch, dass Hunde hauptsächlich nonverbal kommunizierten, so Berger. Viele Informationen würden über die Bewegung der Vierbeiner vermittelt und nicht über das Bellen. «Es ist auch noch offen, ob diese menschlichen Trainingsdaten wirklich helfen, oder ob es dann schliesslich doch mehr Daten von Hunden braucht», führt Berger weiter aus.
Andere Tiere: Das Forschungsteam möchte diese Methode auch bei Vogelgeräuschen anwenden. Von Vögeln gibt es viel mehr Aufnahmen als von Hunden und die Forscherinnen und Forscher erhoffen sich so ein besseres Ergebnis. «Ich persönlich fände die Analyse von Katzenaufnahmen interessant, weil man ja sagt, dass Katzen von den Menschen Töne lernen und mit den Menschen anders kommunizieren als untereinander», sagt Berger. Eine Studie sei dazu aber noch nicht geplant.