MADRID, 10. Mai. (EUROPA PRESS) –
Eine von der University of California in San Francisco (USA) durchgeführte Studie kommt zu dem Schluss, dass künstliche Intelligenz genauso gut wie ein Arzt darin ist, Prioritäten zu setzen, welche Patienten zuerst behandelt werden sollten, wie in „JAMA Network Open“ veröffentlicht.
Anhand anonymisierter Aufzeichnungen von 251.000 Besuchen in der Notaufnahme von Erwachsenen bewerteten Forscher der UC San Francisco, wie gut ein Modell der künstlichen Intelligenz in der Lage war, Symptome aus den klinischen Notizen der Patienten zu extrahieren, um ihren Bedarf an sofortiger Behandlung zu ermitteln. Anschließend verglichen sie die KI-Analyse mit den Patientenbewertungen auf dem Emergency Severity Index, einer Skala von 1 bis 5, die Notaufnahme-Pflegekräfte verwenden, wenn Patienten eintreffen, um Pflege und Ressourcen je nach größtem Bedarf zuzuweisen – ein Prozess, der als Triage bekannt ist.
Für die Studie wurden die Patientendaten von ihrer tatsächlichen (anonymisierten) Identität getrennt. Die Forscher werteten die Daten mithilfe des ChatGPT-4 Large Language Model (LLM) aus und greifen darauf über die sichere generative KI-Plattform der UCSF zu, die über umfassende Datenschutzmaßnahmen verfügt.
Die Forscher testeten die Leistung des LLM anhand einer Stichprobe von 10.000 übereinstimmenden Paaren (insgesamt 20.000 Patienten), darunter ein Patient mit einer schwerwiegenden Erkrankung, beispielsweise einem Schlaganfall, und ein anderer mit einer weniger dringenden Erkrankung, beispielsweise einem gebrochenen Handgelenk. Unter Berücksichtigung nur der Symptome der Patienten konnte die KI in 89 % der Fälle identifizieren, welcher Notaufnahmepatient des Paares eine schwerwiegendere Erkrankung hatte. In einer Teilstichprobe von 500 Paaren, die sowohl von einem Arzt als auch vom LLM beurteilt wurden, war die KI in 88 % der Fälle korrekt, verglichen mit 86 % beim Arzt.
Durch den Einsatz von KI im Triage-Prozess könnten Ärzte wertvolle Zeit für die Behandlung von Patienten mit den schwerwiegendsten Erkrankungen gewinnen und gleichzeitig Entscheidungsunterstützungstools für Ärzte bereitstellen, die mehrere dringende Anfragen bearbeiten müssen.
„Stellen Sie sich zwei Patienten vor, die ins Krankenhaus transportiert werden müssen, aber es gibt nur einen Krankenwagen. Oder es gibt einen Arzt auf Abruf und drei Personen rufen sie gleichzeitig an, und sie muss zuerst entscheiden, an wen sie sich wenden soll.“ veranschaulicht den Hauptautor Christopher Williams, einen UCSF-Postdoktoranden in Bakar Computational Health Sciences. Institut.
Die Studie ist eine der wenigen, die ein LLM anhand realer klinischer Daten statt simulierter Szenarien bewertet, und ist die erste, die mehr als 1.000 klinische Fälle für diesen Zweck verwendet. Es ist auch die erste Studie, die Daten von Besuchen in der Notaufnahme nutzt, wo es ein breites Spektrum möglicher medizinischer Erkrankungen gibt.
Trotz des Erfolgs dieser Studie warnte Williams, dass KI ohne weitere Validierung und klinische Studien noch nicht für einen verantwortungsvollen Einsatz in der Notaufnahme bereit sei.
Eine wichtige Frage, die es zu klären gilt, ist, wie Verzerrungen aus dem Modell entfernt werden können. Frühere Untersuchungen haben gezeigt, dass diese Modelle rassistische und geschlechtsspezifische Vorurteile im Gesundheitswesen aufrechterhalten können, da die für das Training verwendeten Daten verzerrt sind. Williams sagte, dass diese Modelle, bevor sie verwendet werden können, geändert werden müssen, um diese Verzerrung zu beseitigen.