BOSTON / MÜNCHEN (IT BOLTWISE) – ChatGPT hat in einem Vergleichstest in den USA bei der Diagnose von Krankheiten bessere Punktzahlen erreicht als gut ausgebildetes medizinisches Personal. Allerdings streute die KI auch haarsträubende Fehler ein.
- News von IT Boltwise® bei LinkedIn abonnieren!
- AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
- Neue Meldungen bequem per eMail via Newsletter erhalten!
- IT Boltwise® bei Facebook als Fan markieren!
- RSS-Feed 2.0 von IT Boltwise® abonnieren!
ChatGPT-4 hat die Leistungen von Ober- und Assistenzärzten bei der Verarbeitung medizinischer Daten und im Hinblick auf klinische Argumentation übertroffen. Der Vergleichstest wurde am Beth Israel Deaconess Medical Center (BIDMC) in Boston durchgeführt. Grundlage war ein bei Medizinern anerkanntes Punktesystem, der sogenannte „r-IDEA Score“.
Die Forscher rekrutierten 21 Oberärztinnen und -ärzte sowie 18 Assistenzärztinnen und -ärzte, die jeweils einen von 20 ausgewählten klinischen Fällen bearbeiteten, die aus vier aufeinanderfolgenden Phasen des diagnostischen Denkens bestanden. Die Autoren wiesen die Ärzte an, ihre Differentialdiagnosen in jeder Phase aufzuschreiben und zu begründen. Der Chatbot GPT-4 erhielt identische Anweisungen für alle 20 Fälle. Die Antworten wurden dann hinsichtlich des klinischen Urteilsvermögens (r-IDEA-Score) und verschiedener anderer Maßstäbe für das logische Denken bewertet.
Beim r-IDEA-Score lag ChatGPT am Ende mit durchschnittlich zehn von zehn Punkten vorn. Die Oberärztinnen und -ärzte kamen auf durchschnittlich neun von zehn, das Assistenzpersonal auf acht von zehn Punkte. In einzelnen Teilbereichen machte der Chatbot aber auch offensichtliche Fehler, die das menschliche Personal nicht beging. Das Ergebnis unterstreicht deshalb laut der Forschungsgruppe, dass KI wahrscheinlich dann am nützlichsten ist, wenn sie den menschlichen Denkprozess unterstützt, aber nicht ersetzt.
„Es sind weitere Studien erforderlich, um festzustellen, wie große Sprachmodelle am besten in die klinische Praxis integriert werden können“, sagen die Studienautoren, „aber schon jetzt könnten sie als Kontrollinstanz nützlich sein und uns helfen, sicherzustellen, dass wir nichts übersehen.“
Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.