Ich möchte zu Beginn dieses Artikels eine kleine Geschichte erzählen. Sie begab sich zu jener Zeit, als meine Mutter noch an einer Universität der ehemaligen DDR studierte – also nicht gerade gestern. Ich glaube jedoch, dass sie bis heute nichts von ihrer Relevanz verloren hat.

Die zahnmedizinische Fakultät der besagten Uni hatte nach studentischen Probanden gesucht, die an einem Experiment von historischer Wichtigkeit mitzuwirken bereit waren. Meine Mutter zählte zu denjenigen, die sich selbstlos in den Dienste der Wissenschaft stellten. Von nun an lautete ihr Auftrag, sich nach jedem Essen, gleich welchen Umfangs und gleich zu welcher Tageszeit, sofort die Zähne zu putzen. Sie ließ brav alle Vor-, Zwischen- und Nachuntersuchungen über sich ergehen, an ihrem Lebensstil änderte sie indes: gar nichts. "Wie sollte ich auch? Ich habe den Großteil meiner Mahlzeiten außer Haus eingenommen. Und wenn man mal feiern war … die öffentlichen Toiletten waren damals ja auch noch schlimmer als heutzutage", sagt sie heute ohne jedes schlechte Gewissen. Das Ergebnis der Studie kenne ich nicht. Kann wohl auch nicht so wirklich richtungsweisend sein.


Augenzeugenberichte lehren uns: die Forschung ist manchmal so lebensnah wie die Dialoge und Handlungsstränge in "Bauer sucht Frau" (die übrigens – auch hier ist mir ein Kronzeuge bekannt – komplett fiktiv sind). Unsere Ehrfurcht gegenüber den mit akademischen Titeln reich dekorierten Wissenschaftlern ist so groß, dass sie uns nach Belieben in der Hand halten können. Erkenntnisse aus seltsam gestalteten Studien verändern manchmal das Verhalten der Interessierten über Jahre, über Jahrzehnte, ohne dass sich jemand von gegensätzlichen Meinungen überzeugen ließe.

Ein Beispiel: die Kombination von Kreatin und Koffein wird schon seit Jahren intensiv beleuchtet, seit eine Studie aus den 80er-Jahren überraschenderweise eine verminderte Wirkung des Kreatins bei Koffeinkonsum feststellte. Bis heute sind unzählige Untersuchungen publiziert worden, die zu gegenteiligen Meinungen kommen, aber die Jünger der Anti-Koffein-Bewegung lassen sich nicht unterkriegen. Ob sie sich im Recht befinden wird sich, dessen bin ich mir fast sicher, wohl nie herausstellen.

In diesem Sport wird alles auf die Goldwaage gelegt. Es geht ja nicht nur darum, den Ball ins Netz zu bringen, oder um andere banale Dinge, sondern um einen halben Zentimeter mehr Umfang, ein Prozent weniger Fett am Körper. Wir wissen, dass Perfektion nicht zufällig passiert. Wir hängen daher am Nabel der Wissenschaft. Deren Erkenntnisse sind manchmal, eigentlich sogar meistens, von rein psychologischem Wert. Wer gelesen hat, dass der Hormonhaushalt in den Abendstunden die günstigsten Voraussetzungen für ein gutes Training bietet, der ist natürlich "total mies drauf heute", wenn er denn mal morgens trainieren muss. Wen interessiert schon, wie signifikant der hormonelle Unterschied ausfällt? Mehr als die Überschrift, im Höchstfall das Abstract einer Studie, liest doch so und so niemand. Und wen interessiert, ob sich der eigene Hormonhaushalt nicht der Erkenntnis widersetzt? Wir analysieren lieber Ursachen, bevor die Wirkung eingetreten ist. Unser Ansinnen ist viel zu bedeutsam, als dass wir irgendetwas erstmal einfach am eigenen Leibe ausprobieren würden.

Aber der Nabel, an dem wir hängen, ist längst nicht so verlässlich wie man meinen könnte. In vielen Fällen reduziert sich die Wissenschaft auf simple Statistik. Und der sollte man ja nicht glauben, wenn man sie nicht selbst gefälscht hat. In diesem Zusammenhang seien kurz verschiedene Designformen wissenschaftlicher Studien angesprochen.

Die Kohorten-Studie

Die auch als Längsschnittstudie bezeichnete Kohorten-Studie blickt von der Ursache auf die Wirkung. Sie will hiermit ermitteln, ob bestimmte Faktoren die Wahrscheinlichkeit für das Eintreten eines Ereignisses, bzw. im medizinischen Zusammenhang das Risiko für eine Erkrankung, erhöhen.

Als Kohorte wird eine Personengruppe mit einer gemeinsamen Eigenschaft bezeichnet. Für die Längsschnittstudie wird eine exponierte Kohorte, also eine Gruppe mit Trägern der interessierenden Eigenschaft, und zumeist zusätzlich eine nichtexponierte Kohorte, logischerweise eine Gruppe, deren Zugehörige die Eigenschaft nicht besitzen, über einen längeren Zeitraum beobachtet. Dessen Endpunkt kann vorab definiert werden oder an das Eintreten des erwarteten Ereignisses gebunden sein.

Die Kohorten-Studie basiert rein auf Beobachtungen, es erfolgt keine medikamentöse oder sonstige Beeinflussung der Teilnehmer. Sie wird prospektiv, also anhand von Daten aus Gegenwart und Zukunft, durchgeführt.

Ein Beispiel: die Exponierten konsumieren täglich Süßstoff, die Kohorte mit den Nicht-Exponierten verzichtet hierauf vollständig. Nach 10 Jahren wird die Häufigkeit des Auftretens von Krebserkrankungen in beiden Gruppen miteinander verglichen.

Die Fall-Kontroll-Studie

Anders als die Kohorten- untersucht die Fall-Kontroll-Studie mit Blickrichtung von der Wirkung zurück auf mögliche Ursachen.

Die Fall-Kontroll-Studie kann als retrograde oder anders ausgedrückt umgekehrte Variante der oben beschriebenen verstanden werden. Wiederum werden zumeist zwei Personengruppen betrachtet, wobei in einer von beiden ein Ereignis, z.B. eine Krankheit, eingetreten ist. Rückblickend soll herausgefunden werden, ob es ein oder mehrere Eigenschaften gab, die die Wahrscheinlichkeit, bzw. das Risiko des Ereigniseintritts erhöht haben.

Ein Beispiel: eine Personengruppe, deren Mitglieder an Krebs erkrankt sind, und eine mit gesunden Mitgliedern, werden zu ihrem Süßstoffkonsum in der Vergangenheit befragt.

Die kontrollierte klinische Studie

Diese Studienform ist wohl das Verfahren, das noch am ehesten unseren Vorstellungen von Forschung entspricht. Sie dient der Überprüfung der Wirksamkeiten von Medikamenten, Therapien, Supplementen etc., unterscheidet sich also von den bereits beschriebenen Verfahren, die auf passiver Beobachtung basieren, durch die aktive Verabreichungen von Behandlungen.

Besonders wertvolle Erkenntnisgewinnung entsteht aus einem placebokontrollierten Design heraus, das in der Praxis häufig zur Anwendung kommt. Hierbei wird einer Gruppe ein tatsächlicher Wirkstoff oder eine tatsächlich wirksame Therapie verabreicht, während eine Kontrollgruppe ein Placebo erhält (diese aufwendige Erweiterung des Verfahrens lohnt selbstverständlich nicht bei Tierversuchen, in denen die psychologische Komponente vernachlässigt werden kann). Es sind noch diverse weitere Variationsmöglichkeiten der klinischen Studie möglich, z.B. eine randomisierte, also zufällige Verteilung der Probanden auf die Interventions- oder die Kontrollgruppe, Cross-over-Formen, in denen derselbe Teilnehmer sowohl die zu untersuchende als auch die vergleichende (Placebo-)Behandlung erhält, Blind-Studien, in denen der Teilnehmer nichts von seiner Gruppenzugehörigkeit weiß oder auch Doppelblind-Studien, in denen auch der untersuchende Wissenschaftler die Einordnung der Probanden nicht kennt usw.

**********************


Experten behaupten, dass der Ursprung für Fehler in Studienergebnissen in mehr als Zweidritteln aller Fälle in einem mangelhaften Studiendesign liegt. Ein besonderer Schwerpunkt liegt hierbei auf dem Teilnehmerumfang. Es sind Untersuchungsergebnisse auf der ganzen mittlerweile immerhin 7 Milliarden Einwohner umfassenden Welt populär und richtungsweisend geworden, die aus Forschungen an einer Handvoll Probanden resultieren. In der Statistik sollte der Stichprobenumfang aber an die Stärke des erwarteten Effektes angepasst werden – je geringer dieser ausfällt, desto mehr Untersuchungsobjekte sollten einbezogen werden. Viele Studien untersuchen äußerst zweifelhafte, teilweise kuriose Zusammenhänge (z.B. die Steigerung der Gedächtnisleistung von Schnecken durch die Fütterung mit Schokolade) anhand einer lächerlich geringen Anzahl von Studienteilnehmern. Natürlich springt irgendein Zahlenwert in jedem Fall raus; Fraglich ist nur, wie die Signifikanz der Zusammenhänge ausfällt. Aber eine Schlagzeile in der Bild braucht keine Signifikanz. Man kann jedes noch so absurde Ursachen-Wirkungsgefälle herbei rechnen – die Mathematik erlaubt es uns.

Klar, es gibt viele eindrucksvolle Studien, die tausende, zehntausende Menschen, manchmal über halbe Jahrhunderte hinweg, untersuchen. Aber selbst dann ist nicht alles Gold was glänzt. Kohorten- und Fallkontrollstudien etwa bleiben den Nachweis einer Kausalität schuldig, und grade in sehr umfangreichen Untersuchungen steigert sich die Zahl einflussnehmender Umweltfaktoren ins Unendliche. Sie können die Stärke von Zusammenhängen statistisch berechnen, aber sie ersparen dem Interessierten keine eigenständige Interpretation. Ich erinnere mich, vor einigen Jahren von einer Studie gehört zu haben, nach der Personen, die ein Tagebuch führen, überdurchschnittlich häufig an vor allem psychischen Erkrankungen leiden. Die dazugehörige Schlagzeile: "Tagebuchschreiben macht krank". Ein Schock für all die Blogger da draußen! Nur wer sich zu einem sogenannten Denkprozess, aufrafft kommt evtl. zu dem Schluss, dass viele Menschen das Tagebuchschreiben nur beginnen, weil sie bereits erkrankt sind. Aber wer hat schon Lust auf dieses ganze mühsame Gedenke? Besonders dann nicht, wenn eine Studie zu Ergebnissen gekommen ist, denen wir gern Glauben schenken wollen …

Und dann ist da ja auch noch das leidige Thema mit den Tierversuchen. In wieweit deren Erkenntnisse auf den Menschen übertragbar sind, darüber streitet die Wissenschaft noch. Laut eines Artikels auf SPIEGEL Online unterscheiden sich der Mensch und das beliebteste Versuchstier, die Maus, in nur 3% ihres Genoms. Veröffentlichungen der Deutschen Forschungsgemeinschaft gehen davon aus, dass sich 70% der am Tier gezeigten Ergebnisse auf den Menschen übertragen lassen. Britische Forscher wiederum wollen empirisch erkannt haben, dass Rückschlüsse vom Tier auf den Menschen in der Hälfte aller Fälle fehlerhaft waren. In jedem Fall sind die unwirtlichen Bedingungen in Tierversuchen nicht mit jenen zu vergleichen, unter denen humane Experimente durchgeführt werden. Eine Maus hätte keine Chance gehabt, das Zähneputzen zu schwänzen. Aber was ist, wenn wieder die Wirkung der Ernährungsform oder der Trainingsmethode XY am Menschen getestet werden soll? Wie konsequent halten die Probanden sich im Alltag an das Protokoll?

Und dann ist da ja noch die psychische Komponente. Mag sein, dass der Teilnehmer besonders gut aufbaute, als er sich High carb ernährte. Vielleicht ist er auch einfach motivierter ins Training gegangen. Vielleicht wollte er einfach besser sein als die Teilnehmer der Kontrollgruppe. Weil man ja immer besser sein will. Oder er ist ein Trainingsanfänger, der ohnehin auf jedem Weg zum Erfolg kommt, während du dich schon vor Jahren ans genetische Limit gekämpft hast. Besonders amüsant sind auch solche Studien, deren Auswertung auf Fragebogenangaben der Probanden bezüglich ihres subjektiven Empfindens basiert.

**********************


Die Relevanz einer Studie ist nicht unerheblich an ihre Mittelgeber gebunden. Forschung ist kostenintensiv, grade im medizinischen Sektor! Ein großer Teil der benötigten Gelder wird durch das Bundesministerium für Forschung und Bildung bereitgestellt und an Forschungseinrichtungen, z.B. die Institute der Max Planck-Gemeinschaft oder Universitäten, sowie an forschende Unternehmen vergeben. Die einzelnen Länder tragen große Teile der Grundlagenforschung, weil diese allein auf Erkenntnisgewinnung ohne Zweckgebundenheit abzielt und sich daher wirtschaftlich für die wenigstens Unternehmen lohnt. Auch die EU stellt mithilfe ihres Forschungsrahmenprogramms FRP umfangreiche Förderungen zur Verfügung. Weitere Mittel kommen aus diversen Stiftungen.

Zusätzlich stammen viele sog. Drittmittel aus der Industrie. Die deutschen Hochschulen beziehen rund ein Viertel ihrer Forschungsressourcen von gewerblichen Unternehmen. In anderen Staaten wie z.B. den USA ist die Forschung noch kommerzieller ausgelegt. Nicht immer lässt die Geberlaune der Wirtschaft auf Gutmenschentum schließen. Der sich aus jeder Spendenbereitschaft ergebende Imagegewinn soll häufig durch die Verbreitung von Erkenntnissen, die das eigene Produkt besser darstellen, ergänzt werden. Wie wir gesehen haben, können Studien schon vorab durch ein wenig Schrauben am Design beinahe beliebig in die gewünschte Richtung geschoben werden. Der Süßstoffhersteller könnte ja in die Gruppe der Süßstoff-Konsumenten zufällig die gesundheitsbewussten, sportlichen Probanden stecken und in die Kontrollgruppe alle Raucher, Solariumgänger und erblich Vorbelasteten. Jetzt mal überspitzt formuliert. In der Praxis passiert es eben so. Wo Geld fließt, wird bisweilen die Neutralität überschwemmt.

Es bleibt festzuhalten, was zuvor schon mehrfach anklang: wer nicht vom Diktat all dieser Lobbyisten zum Narren gehalten werden will, der kommt am Denken nicht vorbei. Oder noch besser: am Ausprobieren! Die Fähigkeit zum kritischen Hinterfragen gehört heutzutage gewiss zu den ganz grundlegenden Softskills. Die kann durch Forschungsmillionen nicht ersetzt werden.