Statistik als surreales Kunstwerk

Die wunderbare Welt der „3301-Studie“

Eine Fundamentalkritik der Epidemiologe. Teil 5 

Jene verweilt so viel bei dem Einzelnen der Dinge, dass sie die gemeinsame Wirksamkeit unbeachtet lässt; die übrigen betrachten dagegen diese Wirksamkeit mit solchem Erstaunen, dass sie zur Einfachheit der Natur nicht hindurchdringen. Deshalb muss man mit diesen Betrachtungsweisen wechseln und eine neben der andern gebrauchen; dann wird der Verstand sowohl durchdringend als empfänglich, und die früher erwähnten daraus hervorgehenden Uebel und Götzenbilder werden vermieden. (Francis Bacon, Neues Organon) 

Eigentlich dachte ich ja, über die DKFZ-Publikation „Passivrauchen – ein unterschätztes Risiko, die „3301-Studie“, in der nämlich 3301 Todesfälle durch Passivrauchen errechnet wurden, hätte ich längst alles gesagt, was zu ihr zu sagen ist. Aufgrund der prinzipiellen Bedeutung der Aussagen von Professor Günter Ropohl zur Kausalität seien nun aber doch einige Abschnitte aus seinem Artikel „Passivrauchen als statistisches Konstrukt“ wiederholt, mit denen er sich auf jene Publikation bezieht. Ropohl schreibt: 

Unschwer erkennt man in diesem Gedankengang (3.301 Tote) die problematischen Voraussetzungen der Epidemiologie, zum einen die monokausale Reduktion auf einen einzigen Faktor, hier den Umgebungsrauch, und zum anderen die Annahme, eine statistische Korrelation beweise einen Kausalnexus.“ Vor allem dieser grundlegende Denkfehler belastet das Papier, für das „ein kausaler Zusammenhang zwischen Passivrauch und Lungenkrebs als nachgewiesen gilt“, obwohl die herangezogenen Quellen lediglich statistische Korrelationen ermittelt haben. Das Papier genügt also elementaren wissenschaftstheoretischen Standards in keiner Weise. […] Die statistischen Manipulationen arbeiten mit quantitativen Annahmen, deren Brauchbarkeit selbst in der Epidemiologie umstritten ist. Statistische Korrelationen, wie immer sie zustande gekommen sind, werden unreflektiert zu Kausalerklärungen umgedeutet.

Ropohl, der als Autor eines Grundlagenwerks zur Allgemeinen Systemtheorie sehr genau im Bilde darüber ist, dass multifaktorielle Analysen nicht dasselbe sind wie eine systemorientierte Herangehensweise, hat die damit einhergehende Problematik folgendermaßen beschrieben (Hervorhebungen durch mich):  

Die medizinische Wissenschaft will Erkrankungen mit eindeutigen Ursachen erklären, um prophylaktisch und therapeutisch gegen solche Ursachen anzugehen und damit die Erkrankungen zu vermeiden oder zu heilen. Diese ätiologische Perspektive ist das medizinwissenschaftliche Ideal: Immer wenn eine bestimmte Ursache auftritt, folgt daraus notwendig eine bestimmte Erkrankung. Doch schon für die Infektionskrankheiten muss die ursprüngliche Annahme ergänzt werden, weil von zwei Personen, die derselben Erregerkontamination ausgesetzt sind, u.U. nur die eine erkrankt, während die andere mit ihrem Immunsystem die Infektion erfolgreich abwehrt. Korrigiert heißt dann die Hypothese: Immer wenn eine externe Ursache auftritt und eine interne Bedingung vorliegt, folgt daraus die Erkrankung. Aber auch diese Erklärung ist vielen Erkrankungen nicht angemessen. Für den Lungenkrebs kommen zwei Dutzend, für Herz-Kreislauf-Erkrankungen sogar mehr als 200 mögliche Ursachen in Betracht. Die ätiologische Hypothese nimmt dann die folgende Form an: Immer wenn eine oder mehrere externe Ursachen auftreten und eine oder mehrere interne Bedingungen vorliegen, folgt daraus die betreffende Erkrankung. In dieser multifaktoriellen Formulierung ist diese Hypothese nun zwar logisch korrekt, doch in substanzieller Hinsicht stellt sie den Medizinwissenschaftler vor kaum überwindbare Anwendungsprobleme. […] Vielfach ist es unmöglich, eine Erkrankung ganz bestimmten externen oder internen Faktoren eindeutig zuzuschreiben.

Dr. Joseph Kuhn schreibt in seiner Replik (Hervorhebung durch mich): 

Die durch das Passivrauchen verursachten zusätzlichen Sterbefälle lassen sich nur in mathematisch aufwendigen Verfahren ermitteln, wenn man Sterberaten von Passivrauchexponierten und Nichtexponierten so vergleicht, dass möglichst viele andere Einflussfaktoren auf die Sterblichkeit herausgerechnet werden. 

Kuhn sagt hier also sinngemäß, ein multifaktorielles Vorgehen (nämlich eines, das „möglichst viele andere Einflussfaktoren“ erfasst) sei sinnvoll und erforderlich (und suggeriert zugleich, es sei auch ausreichend), um realitätsnahe Ergebnisse zu erhalten. Er scheint nicht bemerkt zu haben, dass damit Ropohls Behauptung keineswegs widerlegt ist, ein multifaktorielles Vorgehen stelle vor gravierende Anwendungsprobleme und ändere dennoch nichts daran, dass es vielfach unmöglich sei, die Ursache einer Erkrankung genau zu ermitteln – das letztere deckt sich mit Erfahrungen, die auch die meisten Laien schon einmal gemacht haben, wenn sie von ihrem Arzt gerne erfahren hätten, was sie nun eigentlich krank gemacht habe.  

Völlig absurd wird es an der folgenden Stelle, wenn Kuhn ausgerechnet dem Fachmann Ropohl komplexe Systeme zu erklären versucht. Man verzeihe mir den Vergleich: Das ist, als ob ein Truthahn sich dazu berufen fühlte, einem Adler das Fliegen beizubringen: 

Ropohl versucht dagegen, die Komplexität des Themas zu umgehen. Er simuliert verständliche Wissenschaft, indem er der Unanschaulichkeit der multifaktoriellen Analysen in der Epidemiologie eine scheinbar einfache Rechnung entgegensetzt […]

Wohl jeder von uns hat in der Schule gelernt, wie man Überschlagsrechnungen macht. Taugte der Lehrer etwas, wissen wir auch, wozu so etwas gut ist: Nicht, um die exakte Rechnung zu ersetzen, sondern um mit einfachen Hilfsmitteln zu prüfen, ob die exakte, aber unanschauliche Rechnung auf dem Papier oder mit einem Taschenrechner oder Computerprogramm überhaupt stimmen kann. Manchmal ist das nämlich nicht der Fall, etwa weil man sich vertippt oder einen Rechenfehler eingebaut hat. In diesem Fall ist die Zahl aus der Überschlagsrechnung wesentlich näher an der Realität als das zunächst exakt erscheinende Ergebnis. 

Die einfache Rechnung des Professor Ropohl dient einem ähnlichen Zweck. Sie simuliert nichts, sie wendet nur ein einfaches Verfahren an, um zu prüfen, ob die epidemiologischen Berechnungen bei einem Vergleich mit tatsächlichen Todesfällen denn in etwa so stimmen können, wie sie dastehen. Seiner Meinung nach haben die 3301-Berechnungen diese Grobüberprüfung nicht bestanden, und ich stimme ihm zu. 

Das ergibt sich alleine schon, wenn man diese Berechnungen an der Messlatte wissenschaftlicher Standards misst, wie denen von Bradford Hill, durch deren Einhaltung epidemiologisch-wissenschaftliche Aussagen anerkanntermaßen an einen höheren Grad der Wahrscheinlichkeit für Kausalität herangeführt werden können (auch wenn ein Beweis damit immer noch nicht vorliegt). Die Bradford-Hill-Kriterien sind in der Epidemiologie allgemein akzeptiert, in einem Maße, dass ihre Erfüllung, was wiederum falsch ist, als Beweis für Kausalität missverstanden wird. Diesen Anspruch hat Bradford Hill zu Recht auch nie erhoben. Seine Kriterien orientieren sich, das ist ihre Schwäche, an der deterministisch-mechanistischen Methode (also Ursache x führt zu Wirkung y) und sind damit in einer systemorientierten Betrachtung zum Teil gar nicht anwendbar bzw. müssten modifiziert werden. Aber wer die deterministisch-mechanistische Methode anzuwenden gewohnt ist, für die sollten die Bradford-Hill-Kriterien keine ganz unwichtige Messlatte sein, um die Qualität von epidemiologischen Aussagen zu beurteilen. 

Der Begriff der Ätiologie hat schon immer die gesamten Wirkfaktoren, die eine Erkrankung auslösen, als Grundlage gehabt. Beim Passivrauchen ist diese Definition der Ätiologe ebenso wie eine Prüfung nach den Bradford-Hill-Kriterien als Standard wissenschaftlich-epidemiologischer Kausalbetrachtung weltweit kaum je berücksichtigt worden, wenn es um die getroffenen Aussagen ging. Weder das klassische noch das moderne, geschweige denn das systemorientierte Vorgehen standen also Pate, wo beispielsweise die Autoren der 3301-Publikation von einem „nachgewiesenen“ oder „bestätigten“ Kausalzusammenhang zwischen Passivrauchen und dem Lungencarcinom schrieben (etwa auf S. 20 jener Publikation). Ein solcher Nachweis wurde weder von ihnen selbst geführt, noch konnten sie auf ihn zurückgreifen.

Legen wir einmal die Bradford-Hill-Kriterien an die Ergebnisse der Forschungen zum Passivrauchen an,wie sie die Grundlage der 3301-Publikation waren. Beschreibt die beobachtete Assoziation nach diesen Kriterien mit Wahrscheinlichkeit eine Ursache-Wirkungs-Beziehung? 

1. Stärke des Effekts

Stark erhöhte Risiken sprechen eher für einen kausalen Zusammenhang als gering erhöhte Risiken.

Antwort: Nein.

Das relative Risiko wird in der 3301-Studie wie folgt wiedergegeben:

Lungencarcinom: 1,25

COPD: 1,24 (Männer)/1,26 (Frauen)

Schlaganfall: 1,18

Herzinfarkt: 1,25

Wie bereits beschrieben, ist damit die einfache Wahrscheinlichkeit – es spricht mehr für als gegen einen Kausalzusammenhang – nicht gegeben, denn der Mindestwert dafür läge bei einem RR von 2,0. Die Stärke der Assoziation ist in den aufgezählten Fällen niemals ausreichend, zumal dieser Wert noch nicht einmal das Passivrauchen als einzigen Einwirkfaktor für die spezifische Passivrauchexposition wiedergibt. Dass es sich auch keineswegs um „das relative Risiko von Passivrauchern“ in einem allgemeinen Sinne handelt, verdient ebenfalls eine Erwähnung, denn untersucht wurden zum weitaus größten Teil die Erkrankungswahrscheinlichkeiten der nichtrauchenden Partnerinnen von Rauchern durch Rauchen in der eigenen Wohnung, während die Erkrankungsrisiken, die auf eine Exposition in der Öffentlichkeit (Arbeitsplatz, Freizeit, Gastronomie) zurückzuführen wären, sehr viel seltener untersucht wurden. 

2. Konsistenz 

Mehrere Studien an verschiedenen Orten, zu verschiedenen Zeiten führen zu gleichen Ergebnissen.

Antwort: Nein.

Die Ergebnisse, aus denen in der 3301-Studie als „Mittelwert“ ein RR von 1,25 für Lungenkrebs herausdestilliert wurde, liegen weit auseinander. Beispielhaft eine der Metaanalysen, die dabei ihren Angaben gemäß eingeflossen sind. Verarbeitet wurden 37 Studien zum Lungencarcinom und Passivrauchen von nichtrauchenden Partnern von Rauchern mit zusammengenommen 4626 Erkrankungsfällen bei weiblichen sowie 274 bei männlichen Patienten, die relative Risiken zwischen 0,75 und 2,68 ergeben hatten. (Betrachtet man nur die 13 aussagekräftigeren Studien mit einer Fallzahl von mindestens 100, schwanken die Ergebnisse zwischen 0,79 und 1,66.) Aus diesen 37 Einzelergebnissen wurde ein relatives Risiko von 1,24 als Gesamtergebnis errechnet, das dank komplexer mathematischer Berechnungsformeln angeblich das Risiko realistischer wiedergeben soll als die jeweiligen Einzelergebnisse. 

Das Instrument der Meta-Analyse offenbart ein Kernproblem der Epidemiologie der Passivrauchforschung: Die Überführung in eine abstraktere Form ist nämlich das Gegenteil dessen, was sinnvoll wäre, um in der Frage der Kausalität Antworten zu finden. Im Vergleich zu den einzelnen Studienergebnissen entfernt sich die Meta-Analyse von einer Abbildung der Realität, statt sich ihr weiter anzunähern. Wie bereits in meinem Buch beschrieben, sind Meta-Analysen daneben fehler-, aber auch fälschungsanfällige Instrumente, wie eine Replikationsstudie ergab, die wir in Auftrag gegeben hatten (dabei ging es um eine andere als die oben erwähnte, nämlich eine Metaanalyse, bei der 22 Studien zum Lungencarcinom durch Passivrauchen am Arbeitsplatz zusammengefasst worden waren).  

In meinem Buch fasste ich das Urteil des Gutachters zusammen: 

Es gibt unterschiedliche methodische Ansätze, die bei Meta-Analysen angewandt werden können. Wurde die Methode der Autoren übernommen, dann ließ sich ihr Ergebnis nachvollziehen – Fehler hatten sie also keine gemacht. Dennoch war ihr Ergebnis letzten Endes ein Zufallsergebnis. Denn wählte man andere, ebenso gebräuchliche Ansätze, veränderte man damit auch das Ergebnis. Die Spannbreite reichte von RR 1,0 – also einem Null-Risiko – bis zu 1,7, einer Risikoerhöhung von 70 Prozent. Der Zufall als ergebnisbeeinflussender Faktor spielte aber auch an anderer Stelle eine Rolle, die eigentlich nicht sein dürfte: Nahm man eine einzelne Studie von den 22 aus der Meta-Analyse heraus, konnte das, je nachdem, welche der Studien man wählte, in manchen Fällen das Ergebnis stark verändern. Im Fall einer dieser Studien war etwa plötzlich gar kein statistisch bedeutsamer Zusammenhang mehr zwischen Dauer der Passivrauchbelastung und Erkrankungsgefahr mehr vorhanden. Die Herausnahme einer anderen Studie hingegen verstärkte diesen Faktor ganz erheblich.

Aus systemorientierter Sicht ist das nicht überraschend. Die verschiedenen Untersucher haben es mit unterschiedlichen gleichzeitig mit dem Passivrauchen vorliegenden Wirkfaktoren zu tun, die nicht berücksichtigt werden oder gar nicht bekannt sind, von den Wechselwirkungen gar nicht erst anzufangen. Vor allem die asiatischen Studien sind mit größter Vorsicht zu genießen, wo die Lebensgewohnheiten (Koch- und Heizfeuer, toxische Küchendämpfe, Arbeitsumgebung etc.) sowie die genetischen Voraussetzungen völlig anders als bei den Vergleichsgruppen sind. 

3. Spezifität 

Die Exposition löst ein ganz spezifisches Krankheitsbild eines bestimmten Organs aus.

Antwort: Nein.

Dass eine Ursache zu einer Wirkung führen muss, ist in einem komplexen System von vornherein nicht möglich. Dies sei an dieser Stelle ausgeklammert, da die Bradford-Hill-Kriterien ja auf eine deterministische Betrachtungsweise angelegt wurden. Mit Interventionsmaßnahmen wie Nichtraucherschutzgesetzgebung mit Erfolgsmessung über experimentelle Epidemiologie gelingt das im seriösen Wissenschaftsbereich nicht, wenn schon vor der Intervention keine erhöhten Erkrankungswerte vorlagen, also die Exposition offenbar kein Krankheitsauslöser ist.

4. Temporalität

Die Exposition geht zeitlich der Wirkung voraus.

Antwort: Ja.

5. Biologischer Gradient

Das Erkrankungsrisiko ist bei stärkerer Exposition höher als bei niedriger Exposition.

Antwort: Nicht nachweisbar.

Nicht feststellbar, da es sich bei der 3301-Studie um rein mathematisch-statistische Berechnungen ohne Untersuchung der Realität handelte. Probleme würden sich andernfalls auch bei der Messstrategie ergeben, da die Latenzzeiten und die multifaktorielle Ätiopathogenese im Weg stehen.

6. Plausibilität 

Ein Zusammenhang ist biologisch plausibel.

Antwort: Nicht nachweisbar.

Wirkmechanismen mit Latenzzeiten von Jahrzehnten und einem breiten Spektrum von Einwirkungen anderer Art mit gleichem Erkrankungsergebnis lassen eine biologisch plausible Kausalbetrachtung nicht mehr zu. Bisher sind als biologisch grundsätzlich plausibel einige Schädigungsmechanismen durch Tabakrauch bekannt, während die gewaltigen Ressourcen der Reparaturmechanismen – die prinzipiell auch bekannt sind – aber ebenfalls zu berücksichtigen wären, die z. B. dafür mitverantwortlich sein könnten, dass 90 Prozent der aktiven Raucher nicht an Lungenkrebs erkranken. Hier ist angesichts des rasch fortschreitenden Wissens um genetische Faktoren darauf zu hoffen, dass neue Erkenntnisse den Faktor finden, der im Falle des Passivrauchens dann ebenfalls beachtet werden könnte.

7. Kohärenz 

Der vermutete Zusammenhang steht im Einklang mit anderen Ergebnissen (statistische Morbiditiät und Mortalität)

Nein.

In Experimentaluntersuchungen ließen sich zwar Störungen des Zellverbands nachweisen, bei denen aber nicht mituntersucht wurde, inwieweit eine Elimination des Schadens über Neutralisation durch Organ- oder Zellantwort erfolgt. Anders als im Falle des aktiven Rauchens ist eine Wirkung des Passivrauchens bei den in Deutschland untersuchten Großgruppen wie Kellner, Büroangestellte, Flugbegleitpersonal statistisch nicht nachweisbar, also schlagen sich die Laborergebnisse nicht in relevanten Erkrankungszahlen nieder.

8. Experiment

Interventionen, die einen vermuteten Risikofaktor reduzieren, sollten zu einer Senkung der Erkrankungsraten führen.

Antwort: Nicht zu ermitteln.

Dies ist eines der wichtigsten Kriterien zur epidemiologischen Kausalität, nicht nur in der deterministischen Herangehensweise, sondern auch bei der Betrachtung komplexer Systeme und der Ursachenbündel, die krankheitsauslösend wirken können, wie im Fall des Bäckerasthmas. Auf Basis hochgerechneter Zahlen ist eine Prüfung dieses Kriteriums allerdings von vornherein nicht möglich. Das Vorliegen dieses Kriteriums wenigstens zu simulieren wird im Moment im Bereich funktionaler Beziehungen von Herzinfarkten zu den Nichtraucherschutzgesetzen versucht, zu deren gravierenden Mängeln ich mich bereits an anderer Stelle geäußert habe. 

9. Analogie 

Es besteht eine Analogie mit einer anderen Erkrankung oder Exposition.

Antwort: Ja.

Etwa zu Dieselruß, Industrieemissionen oder Radon. Die Analogbetrachtung ist allerdings dazu gedacht, die Aussage zu einer Einzelursache einzuschränken, nicht sie zu bestätigen. Denn je mehr unterschiedliche Einwirkungen eine bestimmte Erkrankung hervorrufen können, desto geringer ist die Wahrscheinlichkeit, dass eine bestimmte unter diesen Einwirkungen sie hervorgerufen hat.

Dies ist eines der Bradford-Hill-Kriterien, die sich nicht für die Analyse komplexer Systeme eignen, da jene eine Fülle von Ursachenbündeln unterschiedlichster Zusammensetzung für ein und dieselbe Erkrankung anbieten, die in einem biosozial-psycho-technologischen System begründet sind, während dieses Kriterium sich im Wesentlichen auf Exposition mit stofflichen Einzelelementen, die allerdings auch in Vielzahl auftreten können, befasst. Variablen des Individuums, wie Genetik, Rahmenbedingungen stofflicher und nichtstofflicher Natur, soziale ,psychische und technologische Faktoren bleiben unberücksichtigt. Allerdings verbessert dieses Kriterium die graduelle Evidenz im Sinne des Zusammentragens von Indizien, wie es Kreienbrock beschreibt.

Ergebnis: Außer der „zeitlichen Abfolge“ erfüllt die 3301-Studie keines der Bradford-Hill-Kriterien zur Verbesserung der Aussagen zur Erhöhung der Wahrscheinlichkeit der epidemiologischen Kausalitätsaussage und erfüllt damit eindeutig nicht den wissenschaftlichen Standard. Auch unter Zugrundelegung deterministischer Wissenschaftsmethodik können die Ergebnisse jener Arbeit keine Kausalität beweisen oder auch nur nahelegen. 

Was hat es also zu bedeuten, dass diese mangelhafte Arbeit in Dr. Kuhn einen so engagierten Verteidiger gefunden hat? Dieser Frage werde ich im abschließenden Teil nachgehen. 

Advertisements
Dieser Beitrag wurde unter Diskussionen, Medizin, Naturwissenschaften, Passivrauchen, Prävention / Gesundheitsförderung, Wissenschaftliche Prinzipien abgelegt und mit , , , , , , , , , , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s