Fortschritte bei der Weiterentwicklung intelligenter Diagnostik
Laut der US-amerikanischen Gesellschaft zur Verbesserung medizinischer Diagnosen (Society to Improve Diagnosis in Medicine) sterben allein in den Vereinigten Staaten jährlich 40 000 bis 80 000 Menschen an den Folgen von Fehldiagnosen. Sie kommen bei schätzungsweise 10 bis 15 % aller Krankheitsfälle vor, und zwar in allen medizinischen Fachrichtungen. „Die Gründe sind in der Regel mangelnde medizinische Erfahrung, Zeitdruck oder Voreingenommenheit bzw. Urteilsverzerrungen sowie Ankereffekte, wenn voreilige Schlüsse gezogen werden“, erklärt Eitan Ron, Koordinator des EU-finanzierten Projekts Kahun. Als Gegenmaßnahme entwickelte Kahun KI-gesteuerte diagnostische Entscheidungsunterstützungssysteme, die „erstmals menschliche klinische Expertise technologisch simulieren können“, erläutert Ron.
Klinische Bewertung mittels Chatbot und innovativer App
Nach der ersten App-Version Anfang 2021 ließen sich bereits rund 7 000 medizinische Fachkräfte bei der klinischen Bewertung Zehntausender Fälle von der kostenfreien Version unterstützen. Weiterhin traf das koordinierende Unternehmen Kahun Medical mit dem Fachblatt „New England Journal of Medicine“ eine Übereinkunft, Fachdaten in das medizinische Online-Simulationstool NEJM Healer einzuspeisen. „Um die Akzeptanz in der medizinischen Fachwelt zu fördern, entwickelten wir auch einen auf derselben Technologie basierenden Chatbot zur klinischen Bewertung, der in Vorbereitung der ärztlichen Konsultation eine Anamnese durchführt“, so Ron. Der Chatbot ist bereits Teil der virtuellen klinischen Voruntersuchung des US-amerikanischen Akut-Telemedizindienstes HelixVM und wird auch vom Cloud-basierten Praxisverwaltungssystem Healthbridge in Südafrika verwendet, das in 3 000 Kliniken installiert ist.
Medizinische Entscheidungsfindung: KI-unterstützt und von medizinischen Fachkräften dokumentiert
Grundlage der vom Projekt entwickelten KI-gestützten Bewertung ist eine strukturierte Datentabelle, die auf medizinischer Fachliteratur gründet und von medizinischen Fachkräften dokumentiert wird. „Derzeit umfasst die Dokumentation mehr als 30 Millionen Einträge zu Zusammenhängen zwischen Krankheit, Befund, Komplikationen, Laborergebnissen, Risikofaktoren usw.“, erläutert Ron weiter. Mit der ersten medizinischen App, die sowohl auf Apple- als auch Android-Betriebssystemen läuft, werden die von der medizinischen Fachkraft eingegebenen Patientendaten wie Alter, Geschlecht, klinische Details (Symptome) und Testergebnisse in eine dedizierte Schnittstelle übernommen. Dann erstellt der KI-Algorithmus der Arbeitsgruppe anhand der Datentabelle eine Differentialdiagnose und empfiehlt gegebenfalls weitere Tests, wobei die Originalquellen angegeben sind, die der Algorithmus verwendet hat. Schließlich führt ein Online-Chatbot eine Patientenbefragung für die klinische Bewertung durch. Für die Befragung legt der KI-Algorithmus die Datentabelle zugrunde. Anhand jeder Antwort wird dann die offensichtlichste Folgefrage ausgewählt, damit das System die begonnene Differenzialdiagnose kontinuierlich aktualisieren kann. Die Befragung ist abgeschlossen, wenn der Algorithmus ausreichend Informationen erfasst hat. Anschließend wird eine Zusammenfassung einschließlich Krankheitsgeschichte, Systemanamnese, Vorschläge zur Differenzialdiagnose und Folgeschritte in der entsprechenden Patientenakte abgelegt.
Tests bestätigten die hervorragende Genauigkeit der Differenzialdiagnose.
Die diagnostische Leistung von Kahun wurde an klinischen Fällen aus dem Prüfungsregister für das medizinische Staatsexamen der Vereinigten Staaten (United States Medical Licensing Examination Step 2 Clinical Skills, USMLE Step 2 CS) getestet. Die Fälle wurden in Kahun eingegeben und die Genauigkeit der Differenzialdiagnose ausgewertet, wobei für jede Diagnose die diagnostische Sensitivität und fallspezifische Erfolgsrate geprüft wurde. Die Studie umfasste 91 klinische Fälle mit 78 verschiedenen Leitsymptomen und einem Mittelwert von 38 Befunden pro Fall. Insgesamt sollten 272 Diagnosen gestellt werden. Dabei lag Kahun mit 231 Vorschlägen unter den ersten 20 Diagnosen, mit 209 Vorschlägen unter den ersten 10 und mit 168 Vorschlägen unter den ersten 5 Diagnosen. „Insgesamt lieferte unser Tool ein breites Spektrum klinischer Befunde mit bestätigter diagnostischer Genauigkeit“, schließt Ron. Eine weitere Studie bewertete die Datenerfassung durch acht Chatbot-Symptomprüfer, die 28 Fallvignetten beurteilten. Dabei war der Kahun-Patienten-Chatbot am effizientesten, da er die höchste Recall-Rate bzw. Sensitivität bei relevanten Fallbefunden aufwies.
Schlüsselbegriffe
Kahun, Diagnose, Klinik, Schlussfolgerungsmaschine, KI-Algorithmus, KI, Patient, Patientin, Chatbot, Algorithmus, Telemedizin