Zum Inhalt springen

Künstliche Intelligenz Studie: KI kann Fehldiagnosen nicht verhindern

Am Berner Inselspital sind die Diagnosen von 1200 Notfallpatientinnen und -patienten untersucht worden, die teils von KI unterstützt und teils nur von Menschen erstellt worden sind. Dabei zeigte sich bei beiden Modellen in 18 Prozent der Diagnosen ein «Qualitätsrisiko». Die enttäuschende Bilanz erkläre sich auch durch die hochvolatilen Natur von Notfallsituationen, erklärt Studienautor Wolf Hautz, Leitender Arzt Notfallmedizin der Universitätsklinik.

Wolf Hautz

Personen-Box aufklappen Personen-Box zuklappen

Wolf Hautz ist Leitender Arzt für Notfallmedizin der Universitätsklinik in Bern. Er koordiniert seit 2015 am Inselspital als Leiter Forschung die wissenschaftlichen Aktivitäten der Klinik.

SRF News: Wie sehr hat Sie das Resultat überrascht, dass KI-unterstützte Diagnosen nicht besser abgeschnitten haben?

Wolf Hautz: Wir hatten es befürchtet, aber es ist doch enttäuschend. Es wäre schön gewesen, ein Instrument zu haben, das Fehldiagnosen verhindert oder zumindest reduziert. Denn Fehldiagnosen sind in der Notfallmedizin häufig und haben für Patientinnen und Patienten teilweise erhebliche Konsequenzen.

Sie testeten ein etabliertes Diagnosesystem. Wie funktioniert es?

Es wurde das beste System im Markt untersucht. Es nimmt alle Daten entgegen, die man erheben kann: Befunde, Symptome und Laborwerte. Daraus generiert es eine Liste von bis zu zehn möglichen Differenzialdiagnosen. Es erweitert so den Entscheidungsraum von Ärztinnen und Ärzten mit Aspekten, an die möglicherweise nicht gedacht wurde.

Wie wird das Diagnosesystem eingesetzt und wie lief die Studie ab?

Einige Notfallaufnahmen setzen das KI-System gelegentlich ein, so auch jene am Inselspital Bern. Vor allem in den USA und Grossbritannien ist das System sehr verbreitet. Insgesamt machten vier Notaufnahmen an der Studie mit: das Inselspital in Bern, das Bürgerspital in Solothurn sowie zwei kleinere ländliche Notaufnahmen. Die Notaufnahmen wurden bestimmten Zeiträumen zugelost, in denen sie Diagnosen mit und ohne KI-Hilfe liefern sollten. Die Teilnahmewilligen wurden danach während 14 Tagen nachverfolgt, um zu sehen, wie sich deren Krankheitsgeschichte weiterentwickelt.

Der klinische Alltag bietet so viel mehr Möglichkeiten, um auf andere Weise zu einer falschen Diagnose zu kommen.

Es ist die erste Studie zu KI in der Diagnostik weltweit. Wurden die Systeme nicht bereits vorher getestet?

Dieser Umstand zeigt mir, dass es wohl einen gewissen Nachholbedarf gibt. Bei einem neuen Medikament etwa muss in klinischen Studien Wirkung, Nutzen und Fortschritt bewiesen werden. Bei Software dagegen, die in diagnostische oder therapeutische Prozesse eingreift, werden bisher vor allem Fallvignetten untersucht. Der klinische Alltag bietet hingegen so viel mehr Möglichkeiten, um auf andere Weise zu einer falschen Diagnose zu kommen: Ärzte etwa, die ständig unterbrochen werden oder die falschen Fragen stellen. Oder Befunde, die aus Zeitgründen gar nicht erst erhoben werden können oder falsch interpretiert werden. Bei all diesen Fehlermöglichkeiten hilft KI aktuell gar nicht.

Von der Zeit, wo eine KI in solch hochvolatilen Situationen eine sinnvolle Unterstützung bringen kann, sind wir noch sehr weit entfernt.

Was kann getan werden?

Es braucht viel mehr Forschung zu diesem Thema. Die KI liefert zurzeit gute oder herausragende Leistungen in hochkontrollierten Umgebungen wie etwa den bildverarbeitenden Disziplinen von Radiologie und Pathologie. Die Daten stehen hier in einem strukturierten Format in grossen Mengen zur Verfügung. Es geht hier nicht um zeitkritische Entscheidungen von Sekunden. In der Notfallmedizin jedoch muss, je kränker ein Patient, oft schon ohne ganz konkrete Diagnose gehandelt werden, und oft trägt die Reaktion des Patienten auf eine Behandlung zur Diagnose bei. Von der Zeit, wo eine KI in solch hochvolatilen Situationen eine sinnvolle Unterstützung bringen kann, sind wir noch sehr weit entfernt.

Folgenreiche Fehldiagnosen

Box aufklappen Box zuklappen

Bis zu 15 Prozent aller Patientinnen und Patienten, die eine medizinische Behandlung in Anspruch nehmen, erhalten eine Fehldiagnose. Fehldiagnosen gehören somit zu den häufigsten und kostspieligsten medizinischen Problemen weltweit. Besonders herausfordernd ist die Diagnosestellung in Notaufnahmen, wo oft unter grossem Zeitdruck eine Vielzahl von Menschen mit unterschiedlichen Beschwerden behandelt werden. 

Um Fehldiagnosen zu reduzieren, kommen zunehmend computergestützte diagnostische Entscheidungshilfesysteme «Computerized Diagnostic Decision Support Systems» (CDDSS) zum Einsatz. Diese Systeme sollen durch die Analyse von Symptomen und Befunden die diagnostische Genauigkeit erhöhen und das medizinische Fachpersonal bei der Diagnosestellung unterstützen. (Quelle: Studie)

Weitere Informationen:

Das Gespräch führte Rachel Beroggi.

SRF 4 News, 04.02.2025, 07:45 Uhr ; 

Meistgelesene Artikel