FFT-Methode Fall-Validität

Dr. Google – Welcher Gesundheitsinformation kann ich vertrauen?

Herausforderung Entscheiden unter Unsicherheit

Mangelt es an belastbaren Daten zum Eintreffen spezifischer Ereignisse oder an Wissen über Entscheidungskonsequenzen, liegt ein Problem der Unsicherheit vor. Bessere Entscheidungen können dabei kaum durch den geübten Umgang mit Statistiken oder ihre transparente Kommunikation erreicht werden. Stattdessen ist die zentrale Fragestellung, wie der einzelne Verbraucher die Unsicherheit in seiner Entscheidungssituation reduzieren kann. Hierbei sind zwei Szenarien zentral:

Wie kann Unsicherheit für Problemstellungen alltagstauglich (schnell, praktisch) reduziert werden, bei denen der Verbraucher auf sich allein gestellt ist?

Wie kann Unsicherheit für Problemstellungen alltagstauglich (schnell, praktisch) reduziert werden, bei denen ein Experte dem Verbraucher Rat gibt?

 

Warum ist es schwierig, Entscheidungsunterstützung bei Problemen der Unsicherheit zu geben?

Entscheidungsprobleme der Unsicherheit zeichnen sich durch einen Mangel an belastbaren Daten aus. Dadurch ist eine direkte Auswahl der besten Entscheidungsoption im Grunde ausgeschlossen. Die Unterstützung besteht darin, entscheidende Strategien zu kennen, um Unsicherheit zu reduzieren. Was muss ich fragen, um die Auswahl möglicher Informationen bzw. Optionen zu reduzieren? Wonach muss ich suchen? Was muss ich prüfen, um unpassende Optionen auszusortieren, welche die Mindestanforderungen nicht erfüllen?

Welcher wissenschaftliche Lösungsansatz bietet sich an?

Im Gegensatz zu Verbrauchern sind Experten in einem bestimmten Fachgebiet in der Lage, anhand weniger heuristischer Merkmale objektive Standardunterschreitungen bei einem Entscheidungsproblem zu identifizieren. Mithilfe einer Analyse von konkreten Entscheidungssituationen von Verbrauchern werden mögliche Expertenheuristiken in Entscheidungsbäume destilliert. Diese fassen das auf Erfahrung basierte Bauchgefühl der Experten zusammen und leihen dem Verbraucher eine robuste Expertise, mit der er, dem Experten ähnlich, die Spreu vom Weizen zu trennen vermag. 

Dies ist nicht nur für Fragestellungen bedeutsam, bei denen Verbraucher auf sich allein gestellt sind. Auch für Beratungssituationen lassen sich mögliche Entscheidungsheuristiken in Entscheidungsbäumen kombinieren: Hier geht es darum, dem Berater die wichtigsten Fragen zu stellen, um diese Situation robust einschätzen zu können. 

Geeignete Entscheidungsbäume, die transparent, für Verbraucher nachvollziehbar und zugleich von hoher Güte sein können, sind die Fast-and-Frugal Trees (FFTs). Diese FFTs stellen eine Abfolge von zu prüfenden Merkmalen dar (Martignon et al., 2008). Es gibt immer nur eine Abzweigung (Stopp) oder man kommt zum nächsten Prüfmerkmal, aber es gibt keine weiteren Verzweigungen (s.u. das Themenbeispiel). Dies unterscheidet die FFTs von üblichen Entscheidungsbäumen. Erst beim letzten Merkmal in der Kette gibt es zwei Abzweigungen. 

Es wurde gezeigt, dass FFTs in verschiedensten Entscheidungssituationen unter Unsicherheit schnelle und zuverlässige Entscheidungen ermöglichen, u.a. in der Psychiatrie, in der Anästhesiologie, aber auch in der Finanzwelt (Aikman et al., 2014; Green & Mehr, 1997; Jenny et al., 2013). FFTs lassen sich in Form einer grafisch aufgearbeiteten, einfachen Baumstruktur sowohl digital (z.B. App, Internetseite) als auch analog zu den Verbrauchern bringen (z.B. auf Postern oder in Broschüren). Somit sind sie ein evidenzbasiertes Instrument zur Entscheidungsunterstützung, das einfach zu implementieren ist. Im RisikoAtlas-Projekt wurde es erstmals für die alltägliche Verbraucherpraxis entwickelt und umgesetzt. Der Einsatz der FFTs ist zudem lebensdienlich, da ihre Benutzung Fähigkeiten trainiert. Die Verwendung der FFTs erleichtert das Verinnerlichen von Schlüsselmerkmalen für Problemstellungen und regt kritisches Denken an.

Die Reihenfolge der Merkmale in einem FFT ist kritisch und muss aufwendig im Vorhinein ermittelt werden. Hierbei sind manuelle, aber auch komplexere Ansätze mithilfe der Methoden des maschinellen Lernens vorhanden. Einmal statistisch ermittelt, ermöglicht diese Merkmalskombination einem Verbraucher, Entscheidungsoptionen robust zu klassifizieren (z.B. dahingehend, ob eine informierte Entscheidung ermöglicht wird), indem er die Ausprägung der Merkmale eigenständig überprüft.

 

Wie konstruiert man einen Entscheidungsbaum für ein Verbraucherproblem – die FFT-Methode fallbasierter Merkmalsvalidität

A. Was benötigen Sie?

Für die evidenzbasierte Entwicklung von FFTs benötigt man bei allen Ansätzen (inkl. der FFT-Methode fallbasierte Merkmalsvalidität) eine Datenbasis mit drei Teilen: Merkmale des Problems, Fälle der Problemstellung und die jeweilige Fallbewertung.

  1. Teil – Merkmale des Problems 

Es ist zunächst erforderlich zu klären, was das Problem ist, und zu definieren, über welche konkrete Entscheidung oder Bewertung informiert werden soll. Was soll der Entscheidungsbaum liefern? Unter diesem Gesichtspunkt recherchiert man mithilfe von Experten (z.B. Workshops), Kollegen, Laien und der Fachliteratur (Fachzeitschriften, White Papers, Regierungs- bis hin zu Erfahrungsberichten) Kandidatenmerkmale. Kandidatenmerkmale sind all jene Eigenschaften der Problemsituation, die möglicherweise ein Indikator für eine gute oder schlechte Entscheidung bei dem Problem sein könnten. Es kann lohnenswert sein, auch neue Merkmale, eigene Vermutungen, Intuitionen hinzuzuziehen. 

Jedes Kandidatenmerkmal muss durch einen Laien verstehbar und prüfbar sein. Die Liste sollte idealerweise ähnliche Merkmale zusammenfassen, gerade wenn es zu viele Merkmale werden. Man kann sagen, dass die von Experten gestützte Merkmalsauswahl im Vorhinein die wichtigste Stellschraube ist, vor allem um kosteneffektiv zu entwickeln. Denn jedes Merkmal zusätzlich verlangt mehr Fälle, um eine robuste Entwicklung zu ermöglichen. Als Faustregel kann man im Grunde 20 bis 50 Fälle für jedes Merkmal rechnen. Und jeder Fall bedeutet Aufwand: Jeder Fall muss einzeln in allen Merkmalen kodiert und eine Bewertung gewonnen werden. Wenn Sie hierbei Unterstützung benötigen, konsultieren Sie bitte den Abschlussbericht zum RisikoAtlas-Projekt ab Juli 2020 oder richten Sie eine Anfrage an uns. Die Kontaktdaten finden Sie im Reiter Kontakt.

  1. Teil – Fälle der Problemstellung

Wenn man einmal die Auswahl von Kandidatenmerkmalen getroffen hat, muss man herausfinden, wie oft sie unter welchen Umständen in der echten Welt vorzufinden sind. Hierfür sammelt man Material typischer Entscheidungssituationen, z.B. echte Kaufangebote, Videos echter Beratungssituationen oder echte Informationsangebote. 

Liegt solches Material vor, sind mit einem systematischen Ansatz möglichst realitätsgetreue Fälle dieser Entscheidungssituationen auszuwählen. Hierfür muss man sowohl berücksichtigen, wie viele Kandidatenmerkmale man untersuchen möchte, aber auch wie selten der Prüfgegenstand ist, also was der Entscheidungsbaum zu identifizieren helfen soll. Wenn Sie hierbei Unterstützung benötigen, konsultieren Sie bitte den Abschlussbericht zum RisikoAtlas-Projekt ab Juli 2020 oder richten Sie eine Anfrage an uns. Die Kontaktdaten finden Sie im Reiter Kontakt.

Liegt solches Fallmaterial von typischen Entscheidungssituationen nicht vor, ist die FFT-Methode fallbasierter Merkmalsvalidität nicht geeignet. In einem solchen Fall muss man auf eine andere Methode ausweichen.

  1. Teil – Fallbewertungen

Für jeden Fall in Ihrer Datengrundlage müssen Sie wissen oder festlegen, ob das Zielkriterium erfüllt ist oder nicht. Im Fall einer Gesundheitsinformation wäre beispielsweise eine positive Bewertung das Zielkriterium, wenn durch sie eine informierte Entscheidung ermöglicht wird, andernfalls eine negative Bewertung. Ohne diese Basis von bereits entschiedenen Fällen ist kein Modell für zukünftige Entscheidungsunterstützung denkbar. Ein Ansatz wäre, dass Sie jeden Fall testen, d.h. ermitteln, wie er ausgegangen ist. In der Regel ist dieser Aufwand nicht zu leisten, weil es hieße, 500 bis 700 Fälle experimentell zu untersuchen. 

Die Alternative ist der „Blick des Experten“, auf welchen der hier vorgestellte Modellansatz von Beginn an abzielte. Mehrere voneinander unabhängige Experten bewerten jeden einzelnen Fall mit Blick auf das Zielkriterium, z.B.: „Ermöglicht diese Gesundheitsinformation eine informierte Entscheidung?“ Die Urteile müssen dann zusammengeführt werden. Der Medianwert über ihre Urteile erweist sich zum Zusammenführen der einzelnen Bewertungen als robuster als arithmetische Mittelwerte. Wenn Sie hierbei Unterstützung benötigen, konsultieren Sie bitte den Abschlussbericht zum RisikoAtlas-Projekt ab Juli 2020 oder richten Sie eine Anfrage an uns. Die Kontaktdaten finden Sie im Reiter Kontakt

B. Wie gehen Sie vor?

Sie müssen nun herausfinden, welche Merkmale die von ihnen ausgewählten Fälle (z.B. echte Kaufangebote) aufweisen oder nicht aufweisen. Während Sie diese Fälle in ihren Kandidatenmerkmalen beschreiben, lernen Sie viel über die tatsächliche Prüfbarkeit der Merkmale durch Laien. Es ist anzunehmen, dass Sie sich als Konsequenz bereits einiger Merkmale entledigen, für die eine korrekte Überprüfung durch Verbraucher schwierig gewesen wäre.

Parallel zur Kodierung der Fälle in den Merkmalen sind die Expertenbewertungen „einzusammeln". Hierbei erhalten alle Experten immer nur das Fallmaterial, niemals die Merkmale oder gar die Merkmalskodierung. Ziel ist, die Expertenbewertungen (den Blick des Experten) unabhängig zu modellieren.

Da die Kodierung von zahlreichen Kandidatenmerkmalen sehr aufwendig ist, verspricht ein früher Zeitpunkt einer weiteren Reduzierung der Merkmalsanzahl große Effizienzgewinne. Bevor man allerdings eine Auswahl mithilfe von Laien vornimmt, indem man testet, wie gut sie die Merkmale verstehen, ist eine statistische Antwort in der Regel günstiger und einfacher. Bereits nach 100 Fällen lohnt sich eine einfache statistische Merkmalsselektion. Hierbei stehen verschiedene Werkzeuge zur Verfügung, z.B. das boruta-Paket oder das caret-Paket (beides in der Open-Source-Lösung R implementiert). Mit boruta wird die grundsätzliche Bedeutung der einzelnen Merkmale durch sogenannte Random Forests überprüft. Verhält sich ein Merkmal mit Blick auf die Expertenbewertungen wie eine Zufallszahl, lautet die statistische Empfehlung, es mangels Bedeutung in der weiteren Entwicklung beiseite zu lassen. Auch hier gilt wie bei allen statistischen Ansätzen, die auf Stichproben basieren: Wenn Ihr Hintergrundwissen sagt, dass das Merkmal eigentlich bedeutsam sein sollte, nehmen Sie es eine weitere Runde mit und kodieren es ebenfalls in den nächsten 100 Fällen.

Diesen Vorgang aus Kodieren, Bewerten und statistischer Merkmalsauswahl wiederholen Sie alle 100 Fälle und versuchen so auch das Set der Merkmale handhabbarer zu gestalten. Dies wirkt sich positiv auf den Aufwand zur Kodierung, der Expertenbewertungen und auch der Modellfindung aus.

Wenn sich bei der Merkmalsauswahl nichts mehr ändert, Sie je nach Merkmalsanzahl 500 bis 1000 Fälle bewertet haben oder Sie Gefahr laufen, sechs Merkmale zu unterschreiten, lohnt sich eine Modellierung des Entscheidungsbaums auf Basis dieser Fall-Merkmals-Bewertungs-Profile. 

Die Pipeline zur Entwicklung lässt sich in einer vereinfachten Darstellung zusammenfassen:

Pipeline zur Entwicklung - fallbasiert

Die Modellierung aus Baumerstellung und Kreuzvalidierung ist händisch möglich, im Sinne einer effektiven Modellfindung mithilfe der Open-Source-Lösung R jedoch leichter. Neben dem Paket FFTrees (Phillips et al., 2017) können Sie auch eine Weblösung von Evaldas Jablonskis und Uwe Czienskowski unter http://www.adaptivetoolbox.net/Library/Trees/TreesHome#/nutzen. Wenn Sie hierbei Unterstützung benötigen, konsultieren Sie bitte den Abschlussbericht zum RisikoAtlas-Projekt ab Juli 2020 oder richten Sie eine Anfrage an. Die Kontaktdaten finden Sie im Reiter Kontakt.

Sie werden einen Fast-and-Frugal Tree (FFT) modellieren mithilfe des Teils der Fälle, den Sie als Trainingsdaten auswählen; oft 50% bis 80% der Fälle. Dieser FFT hat eine gewisse Fähigkeit richtige Entscheidungen zu fällen (Bewertung). D.h., er wird in der echten Welt Fälle übersehen und bei anderen fehlalarmieren. Um diese Fähigkeit quantifizieren zu können, führen Sie entweder eine statistische Kreuzvalidierung durch (Sie wenden den ermittelten Entscheidungsbaum auf zufällig wiederholt gezogene Fälle an; Testdatenfälle) oder Sie wenden ihn einmal auf eine Sammlung von Fällen mit Bewertungen an, die Sie vor der Modellierung zur Seite gelegt haben (20% bis 50% der Daten). Alternativ können Sie auch noch eine völlig neue Stichprobe von Fällen mit Merkmalskodierungen und Bewertungen sammeln (out-of-sample), auf die Sie den Entscheidungsbaum anwenden (Zusatzaufwand).

Welche Güte ausreichend ist, hängt sehr von den Fehlerarten und den an Fehlentscheidungen geknüpften Kosten ab. Abschließend muss das Modell in der Praxis mit Laien erprobt werden. Hierbei ist eine randomisierte kontrollierte Studie zweckmäßig, bei der man Entscheidungsintentionen von Verbrauchern, denen man den Entscheidungsbaum zur Hand gibt, mit solchen, die nichts oder ein Standardinformationsblatt haben, vergleicht. Wenn Sie bei Güte oder Evaluation Unterstützung benötigen, konsultieren Sie bitte den Abschlussbericht zum RisikoAtlas-Projekt ab Juli 2020 oder richten Sie eine Anfrage an uns. Die Kontaktdaten finden Sie im Reiter Kontakt.

Literaturempfehlungen zu den methodischen Grundlagen
  • Aikman, D., Galesic, M., Gigerenzer, G., Kapadia, S., Katsikopoulos, K. V., Kothiyal, A., ... & Neumann, T. (2014). Taking uncertainty seriously: Simplicity versus complexity in financial regulation. Bank of England Financial Stability Paper, 28.
  • Green, L., & Mehr, D. R. (1997). What alters physicians' decisions to admit to the coronary care unit?. Journal of Family Practice, 45(3), 219–226.
  • Jablonskis, E., & Czienskowski, U. (2017). Decision trees online. http://www.adaptivetoolbox.net/Library/Trees/TreesHome#/
  • Jenny, M. A., Pachur, T., Williams, S. L., Becker, E., & Margraf, J. (2013). Simple rules for detecting depression. Journal of Applied Research in Memory and Cognition, 2(3), 149–157.
  • Luan, S., Schooler, L. J., & Gigerenzer, G. (2011). A signal-detection analysis of fast-and-frugal trees. Psychological Review, 118(2), 316.
  • Martignon, L., Katsikopoulos, K. V., & Woike, J. K. (2008). Categorization with limited resources: A family of simple heuristics. Journal of Mathematical Psychology, 52(6), 352–361.
Wie können Sie die Methode übernehmen?

Wenn Sie ein Verbraucherthema von unserer Internetseite übernehmen möchten, können Sie das über die folgenden drei Wege tun: 

  1. Sie verwenden eine digitale Kopie. Entweder Sie speichern sich direkt eine Grafik bzw. laden unser PDF herunter oder Sie binden die Grafik mittels Link(a href) oder iframe ein.
  2. Sie ziehen Ihre analoge Kopie und drucken sich unser PDF aus. Die Auflösung ist für Poster und Broschüren geeignet.
  3. Sie empfehlen die App und verweisen auf den RisikoKompass aus PlayStore und AppStore.

Wenn Sie ein eigenes Modell entwickeln möchten, konsultieren Sie bitte den Abschlussbericht zum RisikoAtlas-Projekt ab Juli 2020 oder richten Sie eine Anfrage an uns. Die Kontaktdaten finden Sie im Reiter Kontakt.

Wir bitten darum, bei der Nutzung der Instrumente den Zuwendungsgeber, das Bundesministerium der Justiz und für Verbraucherschutz, sowie das Harding-Zentrum für Risikokompetenz als verantwortliche Entwickler zu erwähnen.

Die Logos zum Download finden Sie hier.

Links zu weiteren Methoden
Fast-and-frugal Tree - Gesundheitsinformationen prüfen

Wer kennt das nicht – bei Krankheitssymptomen wird schnell mal Dr. Google konsultiert. Im Internet findet man eine Fülle an medizinischen Informationen, die dem Verbraucher anbieten, sich selbst über Symptome, Nutzen oder Schäden von Behandlungsoptionen zu informieren. Leider variiert die Qualität digitaler Gesundheitsinformationen drastisch. Irreführende Informationen über medizinische Interventionen führen zu Fehleinschätzungen von Risiken und verhindern informierte Entscheidungen mit teils gravierenden Konsequenzen. Um das zu verhindern, ist es wichtig, dass Sie die Qualität von Gesundheitsinformationen im Internet erkennen können. Unser Entscheidungsbaum als digitale Checkliste zeigt Ihnen, worauf Sie dabei achten müssen. 

 

Wann brauche ich die Grafik?

Wenn Sie Gesundheitsinformationen im Internet suchen und Informationen finden, die Ihnen möglicherweise helfen könnten, können Sie den folgenden Entscheidungsbaum verwenden.

 

Verhindert die Internetseite, informiert zu entscheiden?

 

Was zeigt die Grafik?

Die Grafik zeigt einen Entscheidungsbaum, mit dem Sie jede beliebige Gesundheitsinformation prüfen können. Hierbei prüfen Sie, ob das vorliegende Informationsangebot Ihnen hilft, eine informierte Entscheidung zu treffen oder nicht. 

Eine Warnung bedeutet, dass Sie auf Basis der vorliegenden Gesundheitsinformation wahrscheinlich keine informierte Entscheidung treffen können. Dafür kann es viele Gründe geben: Es kann daran liegen, dass wesentliche Informationen vorenthalten werden. Es kann Werbung oder unprofessionell aufbereitet sein. In manchen Fällen kann auch der Entscheidungsbaum zu einer falschen Schlussfolgerung gelangen.

Eine Entwarnung bedeutet, dass die Gesundheitsinformation verwendet werden kann, um eine informierte Entscheidung zu unterstützen. Es bleibt die Möglichkeit eines Restirrtums des Entscheidungsbaums.

Sie können das vorliegende Informationsangebot auch nach weiteren Qualitätskriterien prüfen. Beachten Sie jedoch bitte, dass kein Informationsangebot und auch keine Prüfliste jemals perfekt ist. Mit jedem weiteren Merkmal, welches Sie prüfen, steigt das Risiko einer falschen Einschätzung des Informationsangebots. Weitere Merkmale sind:

  • Wird eine gesundheitsbezogene Maßnahme beschrieben, für/gegen die man sich entscheiden könnte?
  • Wird auf eine Empfehlung, was man tun sollte, verzichtet?
  • Ist eine mögliche Bewertung der Entscheidungsoptionen klar von den Fakten abgegrenzt bzw. gibt es gar keine Bewertung?
  • Wird die Qualität der für die Gesundheitsinformation verwendeten Studien thematisiert?
  • Werden Zahlen gleichzeitig sowohl positiv als auch negativ ausgedrückt, z.B. wird beschrieben, wie viele sich verbessern und wie viele sich nicht verbessern?
  • Ist ersichtlich, auf welche Weise der Anbieter die vorliegende und andere Gesundheitsinformationen erstellt?

Weitere etablierte Kriterien qualitätsgesicherter Gesundheitsinformationen finden Sie in den Checklisten des Instituts für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWIG) und des Ärztlichen Zentrums für Qualität in der Medizin (ÄZQ).

Quelle und Qualität der Daten

Woher stammen die Daten, auf denen der Entscheidungsbaum basiert?

Fälle – Welche Gesundheitsinformationen dienten als Grundlage?

662 Angebote von Gesundheitsinformationen (Fälle) deutschsprachiger Internetseiten wurden zusammengetragen. Davon wurden 487 Fälle durch Experten vom Harding-Zentrum für Risikokompetenz recherchiert.

(1) Internetseiten der Kategorie Health aus Webkatalogen wie SimilarWeb. 

(2) Suchergebnisse bei Bing und Google nach folgenden Begriffen bzw. Begriffskombinationen (vgl. Bertelsmann, 2018): Gesundheitsinformationen; Gesundheitsleitfaden; Krankheiten; Kälte; Migräne; Bauchschmerzen; Gelenkschmerzen; Hautekzeme; Karpaltunnelsyndrom; Krebs; Prostatakrebs; Prostatitis; Brustkrebs; Psoriasis; Bandscheibenvorfall; Rückenschmerzen; Osteoarthritis; Sarkoidose; Grippe; Wie erkenne ich ...; Was tue ich bei ...; Was wirkt gegen ...; Sollte ich einen Arzt bei ...; Wie gefährlich ist ...; Welche Hausmittel helfen gegen ...; Wie lange hilft ...; Wovon ...; Wie kann ich ... verhindern?

(3) Die Stichprobe wurde künstlich durch zufällig gezogene Seiten von Internetseiten angereichert, die sich nach eigener Auskunft an der Leitlinie Gute Praxis Gesundheitsinformation orientieren („oversampling" von selteneren Fällen mit der Ausprägung „unterstützt informiertes Entscheiden“ gegenüber einer zufälligen Auswahl).

175 zusätzliche Fälle wurden von Laien im Rahmen einer Studie zusammengetragen: zu den Themen Antibiotika bei Infekten der oberen Atemwege, Früherkennung von Eierstockkrebs und der Mumps-Masern-Röteln-Impfung für Kinder.

Zielbewertung – Wie wurde bestimmt, ob „informiertes Entscheiden“ ermöglicht wird?

42 Experten aus der Forschung zu Gesundheitsinformationen, von Krankenversicherungen, aus dem Netzwerk Evidenzbasierte Medizin sowie Vertreter von Gesundheitsverbänden mit Berufserfahrung im Bereich Gesundheitsinformationen bewerteten die Fälle. 

Jedes Informationsangebot wurde von je drei Experten hinsichtlich einer Frage bewertet: „Ermöglicht diese Gesundheitsinformation eine informierte Entscheidung?“ Ein vierstufiges Antwortformat wurde verwendet. Der Medianwert von je drei Experten wurde als Kriteriumswert für den einzelnen Fall verwendet. Die Experten erhielten im Rahmen der Studie keinerlei Informationen über die verwendeten Kandidatenmerkmale.

Kandidatenmerkmale – Welche Merkmale wurden in den Blick genommen?

Basierend auf der „Guten Praxis Gesundheitsinformation“ (DNEBM, 2016) bzw. nach den DISCERN-Standards (ÄZQ, 2019) wurden 31 bzw. 39 Merkmale vom RisikoAtlas-Team als prinzipiell durch Laien überprüfbar erkannt. Eine Gegenprobe mit weiteren Publikationen (Bernstam et al., 2008; Bunge et al., 2010; Zhang et al., 2015) zu dieser Fragestellung und die Entfernung von redundanten Merkmalen führte zu 65 Kandidatenmerkmalen.

Merkmalsauswahl und Modellierung

Die Vorauswahl von Merkmalen hatte das Ziel, die Anzahl der Kandidaten für den Entscheidungsbaum zur Unterscheidung von Gesundheitsinformationen zu begrenzen. Die Merkmalsselektion wurde unter zwei Gesichtspunkten durchgeführt: Laienprüfbarkeit und statistische Bedeutung; in sieben Schritten:

  1. Die Fälle 1–100 (Informationsangebote) wurden von zwei unabhängigen wissenschaftlichen Assistenten in den 65 Merkmalen kodiert, verglichen, diskutiert und harmonisiert. Anschließend wurde eine statistische Merkmalsselektion (anhand von Random Forests mit boruta im Statistikprogramm R) durchgeführt und verschiedene Merkmale aufgrund der Rückmeldungen der Kodierer ausgeschlossen (erwiesen sich in der Praxis als schwierig von Laien verwendbar). 22 Merkmale verblieben.
  2. Die Fälle 101–499 wurden von zwei weiteren unabhängigen Assistenten in 100er-Gruppen kodiert, verglichen, diskutiert und harmonisiert und weitere vier statistische Merkmalsselektionen durchgeführt, welche zum Ausschluss sieben weiterer Merkmale führten.
  3. Die Fälle 500–598 wurden genutzt, um das Kodierverhalten von Laien gegenüber einem geübten wissenschaftlichen Assistenten zu überprüfen. Jeweils fünf Clickworker erreichten keine zufriedenstellende Übereinstimmung bei drei Merkmalen. Die statistische Merkmalsselektion brachte keine Veränderung.
  4. Laien kodierten im Rahmen einer Laborstudie die Fälle 600–675 hinsichtlich der verbleibenden zwölf Merkmale. Die statistische Merkmalsselektion brachte keine Veränderung.

Die Modelle

Zum oben anzeigten Basismodell.

Zum einen wurde für die Modellidentifikation der recursive-Algorithmus von Marcus Buckmann und Özgür Simşek (Manuskript in Vorbereitung) eingesetzt, zum anderen das Paket FFTrees (Phillips et al., 2017). Hierbei wurde der Algorithmus ifan zur Optimierung auf balanced accuracy eingesetzt.

Modell II – speziell für Internetseiten, die über konkrete medizinische Maßnahmen informieren

Das zweite Modell geht nicht nur von der Annahme aus, dass derjenige, der Gesundheitsinformationen im Internet sucht, die Entscheidung über eine konkrete medizinische Maßnahme vorbereitet, sondern auch, dass er in der Lage ist zu erkennen, ob eine Internetseite überhaupt diesen Zweck hat. Dadurch werden Informationsangebote, die nur den Charakter allgemeiner Wissensvermittlung haben oder Diskussionsplattformen sind, nicht berücksichtigt.

Verhindert die Internetseite, informiert zu entscheiden?

 

Wie hoch ist die Qualität des Modells?

Die Daten (gesammelte Fälle der Gesundheitsinformationen) wurden zwischen 2017 und 2018 gesammelt und in ihren Merkmalen kodiert sowie von Experten bewertet. 661 Fälle waren vollständig. Die Datensätze wurden zufällig in Trainings- (zwei Drittel) und Testdatensets (ein Drittel) aufgeteilt. Die Modelle haben folgende Qualität:

Zum Basismodell.

Im Rahmen einer Kreuzvalidierung des identifizierten Entscheidungsbaums ergaben sich folgende Gütemaße: balanced accuracy = 0,74; Spezifität in der Zurückweisung von Informationsangeboten, die keine informierte Entscheidung ermöglichen (Anteil von 86% im Testset), von 0,91. Dies bedeutet, dass 91 von 100 Informationsangeboten, die keine informierte Entscheidung ermöglichen, durch den Entscheidungsbaum aufgedeckt werden. 

Sensitivität in der Bestätigung von Gesundheitsinformationen, die eine solche Entscheidung ermöglichen (Anteil von 14% im Testset), von 0,57.

Modell II – speziell für Internetseiten, die über konkrete medizinische Maßnahmen informieren

Im Rahmen einer Kreuzvalidierung des identifizierten Entscheidungsbaums ergaben sich folgende Gütemaße: balanced accuracy = 0,75; Spezifität in der Zurückweisung von Informationsangeboten, die keine informierte Entscheidung ermöglichen (Anteil von 79% im Testset), von 0,91. Dies bedeutet, dass 91 von 100 Informationsangeboten, die keine informierte Entscheidung ermöglichen, durch den Entscheidungsbaum aufgedeckt werden. 

Sensitivität in der Bestätigung von Gesundheitsinformationen, die eine solche Entscheidung ermöglichen (Anteil von 21% im Testset), von 0,59.

Entwicklungspotenzial

  1. Kontinuierliche Weiterentwicklung der Basis von Trainingsdaten aufgrund der Veränderung der Angebotssituation

  2. Höherer Anteil von laiengesammelten Gesundheitsinformationen, um dem tatsächlichen Suchverhalten gerecht zu werden

  3. Fälle mit experimentell belegten „informierten Entscheidungen“ – jenseits von Expertenurteilen – zur zusätzlichen Validierung nutzen.

  4. Weiterentwicklung für andere Sprachen, die eigene Trainingsdaten benötigen.

 

Zur empirischen Evaluation mit Verbrauchern

Alle Forschungsergebnisse zu den Grundlagen und zur Wirksamkeit der RisikoAtlas-Werkzeuge bezüglich Kompetenzförderung, Informationssuche und Risikokommunikation werden mit dem Projekt-Forschungsbericht am 30. Juni 2020 veröffentlicht. Bei vorausgehendem Interesse sprechen Sie uns bitte direkt an (Felix Rebitschek, rebitschek@mpib-berlin.mpg.de).

 

Quellen

  • ÄZQ (2019). Qualität von Gesundheitsinformationen im Internet. https://www.patienten-information.de/checklisten/qualitaet-von-gesundheitsinformationen.
  • Bernstam, E. V., Walji, M. F., Sagaram, S., Sagaram, D., Johnson, C. W., & Meric‐Bernstam, F. (2008). Commonly cited website quality criteria are not effective at identifying inaccurate online information about breast cancer. Cancer, 112(6), 1206–1213.
  • Bertelsmann (2018). Suche nach Gesundheitsinformationen. Bericht.
  • Buckmann, M., & Simsek, Ö. (Manuskript in Vorbereitung). Rekursiver FFT-Algorithmus.
  • Bunge, M., Mühlhauser, I., & Steckelberg, A. (2010). What constitutes evidence-based patient information? Overview of discussed criteria. Patient Education and Counseling, 78(3), 316–328.
  • DNEBM (2016). Leitlinie Gute Praxis Gesundheitsinformation.
  • Phillips, N. D., Neth, H., Woike, J. K., & Gaissmaier, W. (2017). FFTrees: A toolbox to create, visualize, and evaluate fast-and-frugal decision trees. Judgment and Decision Making, 12(4), 344–368.
  • Steckelberg, A., Berger, B., Köpke, S., Heesen, C., & Mühlhauser, I. (2005). Kriterien für evidenzbasierte Patienteninformationen. Zeitschrift für ärztliche Fortbildung und Qualität im Gesundheitswesen, 99, 6.
  • Zhang, Y., Sun, Y., & Xie, B. (2015). Quality of health information for consumers on the web: A systematic review of indicators, criteria, tools, and evaluation results. Journal of the Association for Information Science and Technology, 66(10), 2071–2084.

Datum der letzten Aktualisierung: 27. November 2019

Links zu weiteren Themen