Die Mammographie ist ein Verfahren, bei dem Röntgenbilder der weiblichen Brust angefertigt werden. Ziel ist es, eine Krebserkrankung möglichst früh zu erkennen, genauer zu erfassen, oder auszuschließen. Die schwierige Aufgabe erfordert ein langes Fachstudium, und selbst Radiologen mit großer Erfahrung liegen mit ihren Beurteilungen nicht selten daneben. Die Folge sind falsche Alarme („falsch Positive“), die zur Verunsicherung der Frauen führen und zu Nachuntersuchungen, die sich erst im Rückblick als unnötig herausstellen. Dazu kommen noch Tumoren, die übersehen werden („falsch Negative“), und die weniger gut behandelt werden können, wenn sie schließlich doch auffällig werden.

Genauere Diagnosen erhofft man sich von der Technik der künstlichen Intelligenz (KI), die von Firmen wie Google und Microsoft erforscht und zunehmend eingesetzt wird. Ein Schwerpunkt liegt dabei auf der selbstlernenden Computerprogrammen, die Anhand von Bildern und anderen Mustern Vorhersagen treffen sollen.

Eine Studie, die jetzt in der Fachzeitschrift „Nature“ veröffentlicht – und von Google finanziert – wurde zeigt, wohin die Reise gehen könnte: Ein Forscherteam trainierte die Software mit Mammographie-Bildern von 26.000 Frauen aus Großbritannien und 3000 aus den USA. Ob die Diagnosen richtig waren, konnte man überprüfen, weil die Frauen etwa 3 Jahre später erneut untersucht wurden.

Beim Vergleich der Vorhersage-Genauigkeit hatte die Software sowohl weniger falsche Alarme verursacht, als auch weniger Tumoren übersehen. Auch als die Forscher das KI-System lediglich mit den britischen Daten trainierten, und anschließend anhand der US-Daten testeten, war „Dr. Google“ überlegen. Gegenüber den US-Ärzten hatte die Software 3,5 Prozentpunkte weniger falsch Positive und 8,1 Prozentpunkte weniger falsch Negative. Dies zeigt, dass die Software länderübergreifend zum Einsatz kommen könnte und nicht nur in jenen Regionen, wo sie ursprünglich getestet wurde. Theoretisch könnten daher weltweit Engpässe in der Versorgung gelindert und vielerorts die Qualität verbessert werden.

Kritisch anzumerken ist allerdings, dass die Studie die Praxisbedingungen in vielen Ländern mit guter Versorgung ignoriert hat. So war die „statistisch signifikante“ Überlegenheit der Google-Software in Großbritannien nicht besonders ausgeprägt und bezog sich nur auf die jeweils ersten Radiologen, die dort die Mammogramme begutachtet haben. Üblich ist im britischen System – wie auch im deutschen – allerdings die Prüfung durch (mindestens) 2 Radiologen, von denen der zweite den Befund des ersten kennt. Legt man diesen Maßstab an, so war KI-System weniger gut als jeweils 2 Fachärzte. Der Unterschied war allerdings gering, und es ist abzusehen, dass lernfähige KI-Systeme wie das hier getestete schon bald zur Ausstattung einer modernen Praxis gehören werden. Wenn schon nicht als „Dr. Google“ dann vielleicht als „Assistent Google“.

Quelle:

McKinney SM, Sieniek M, Godbole V, et al. International evaluation of an AI system for breast cancer screening. Nature. 2020;577(7788):89–94. doi:10.1038/s41586-019-1799-6.

(Publikumsversion eines nur für Ärzte zugänglichen Fachartikels für Univadis.de, erschienen am 5. Januar 2020)