Anfänge einer Revolution

Um das Jahr 2010 herum häuften sich in der Psychologie Ereignisse, die für sich genommen als Einzelfälle abgetan werden konnten, gemeinsam aber ein negatives Bild der Wissenschaft zeichneten. Die Fälle fallen in zwei Kategorien: Bei der Stapel-Affäre handelte es sich um eindeutigen Betrug durch das “Erfinden” von Daten oder Berichten von Studien, die nie durchgeführt wurden. Die anderen Fälle sind kein eindeutiger Betrug, stattdessen wurden dabei innerhalb der Wissenschaft zu diesem Zeitpunkt anerkannte Methoden verwendet um Ergebnisse zu produzieren.

Stapel-Affäre

Durch einen Zufall entdeckten Nachwuchswissenschaftler im Jahr 2011, dass die Daten einer Studie ihres Kollegen, Diederik Stapel, von niemandem jemals erhoben wurden. Sie waren ausgedacht bzw. fabriziert. Stand Juli 2024 wurden 58 von Stapels Fachartikel identifiziert und zurückgezogen, deren Daten fabriziert oder geschönt wurden.1 Wissenschaftliche Institutionen wie der Begutachtungsprozess von Artikeln durch Fachkolleg*inen, deren Zweck die Qualitätssicherung war, hatten versagt. Seit dem Vorfall sind einige weitere Fälle bekannt geworden, teilweise durch erneute Analyse von Daten der jeweiligen Studien (O’Grady 2021) und oft durch Whistleblower, also durch wissende Personen, die zu ihrem Schutz anonym bleiben wollen. Umfragen in den Niederlanden unter Forschenden haben ergeben, dass Fälschung oder Schönigung von Daten von bis zu 10% aller Personen durchgeführt wird (Gopalakrishna u. a. 2021). Dabei ist zu beachten, dass Studien durch gefälschte Daten besonders innovativ, überraschend, oder klar werden - Eigenschaften, die die Veröffentlichung in einer Fachzeitschrift wahrscheinlicher machen.

Bem: Die Zukunft erfühlen

Kurze Zeit später veröffentliche Daryl Bem, bekannt durch grundlegende psychologisch-philosophische Theorien wie der Self-Perception-Theory (Bem 1967), den Befund, dass Personen die Zukunft vorhersagen können (Bem 2011). Genauer gesagt, können manche Personen unter bestimmten Voraussetzungen die Zukunft vorhersagen. In acht Studien fand die Forschendengruppe heraus, dass Personen Vorhersagen über erotische Bilder machen konnten. Die Ergebnisse wurden in der hoch angesehenen Fachzeitschrift Journal of Personality and Social Psychology veröffentlicht. Vielen Psycholog*innen war sofort klar: Entweder, grundlegende Annahmen ihres Weltbildes waren falsch (“Personen können nicht die Zukunft vorhersagen”) oder es stimmte etwas mit den Ergebnissen nicht. Mehrere Forschende versuchten sich daran zu erklären, wie es zu den Ergebnissen kam. Analysen der veröffentlichten Daten mit alternativen statistischen Methoden führten zur selben Schlussfolgerung (Wagenmakers u. a. 2011), Replikationen durch unabhängige Forschende schlugen jedoch fehl Roe, Grierson, und Lomas (2012).

Bargh: Beeinflussen durch Priming

Seine Studien wurden im Marketing gefeiert und als neurowissenschaftliche Erkenntnisse verkauft: Wer ein heißes Getränk (im Vergleich zu einem kalten) trinkt, schätzt andere Personen als “wärmer” (großzügig, rücksichtsvoll) ein (Williams und Bargh 2008). Wer Anagramme löst, die etwas mit hohem Alter zu tun haben (z.B. GEPLEHIMEF statt PFLEGEHEIM, URGA statt GRAU, oder zum selbst probieren GHOSTECK), geht danach in langsamerem Tempo (Bargh, Chen, und Burrows 1996). Viele dieser Studien wurden repliziert: Forschenden fiel in der Anagramme-Studie auf, dass Bargh und Kolleg*innen die Zeit mit Stoppuhren gemessen hatten und dabei wussten, welche Person die “Alt”-Wörter und welche die neutralen Anagramme gelöst hatten - dabei lernt jede*r Psychologie-Studierende im ersten Jahr, dass das nicht der Fall sein sollte und Versuchsleiter*innen “blind” gegenüber dem Untersuchungszweck und der Zuordnung der Personen zu den Gruppen sein sollte. In ihrer Replikation (Doyen u. a. 2012) ließen Doyen und Kolleg*innen die Zeit mit Lichtschranken erfassen und maßen selbst wie Bargh et al. in der Originalstudie. Bei der problematischen Messung kam dasselbe raus, die Lichtschranken, denen vorher nicht verraten wurde, welche Hypothese mit ihnen untersucht werden sollten und welche Personen welche Anagramme lösen mussten, konnten den Effekt jedoch nicht replizieren.

Wichtige Ereignisse jenseits der Psychologie

In der Verhaltensbiologie zeigten Crabbe, Wahlsten, und Dudek (1999) bereits viel früher, dass Befunde zum Einfluss der Gene auf das Verhalten stark davon abhingen, in welchem Labor die Mäuse untersucht wurden. Während Verbesserungen im Forschungsprozess seitdem immer wieder gefordert wurden (Kafkafi u. a. 2018) blieb eine Revolution wie in der Psychologie aus.

Ein etwas anderes Problem ergab sich im Rahmen der Sequenzierung der menschlichen DNS: Dort beantragten Unternehmen noch während des Erforschungsprozess die Rechte daran (Intellectual Property). Die negativen sozialen und wissenschaftlichen Folgen wurden früh diskutiert (Moore 2000) und sind noch immer Teil von wissenschaftlichen und politischen Diskussionen.

Literatur

Bargh, John A, Mark Chen, und Lara Burrows. 1996. „Automaticity of social behavior: Direct effects of trait construct and stereotype activation on action.“ Journal of personality and social psychology 71 (2): 230.
Bem, Daryl J. 1967. „Self-perception: An alternative interpretation of cognitive dissonance phenomena“. Psychological Review 74 (3): 183–200. https://doi.org/10.1037/h0024835.
———. 2011. „Feeling the future: experimental evidence for anomalous retroactive influences on cognition and affect“. Journal of Personality and Social Psychology 100 (3): 407–25. https://doi.org/10.1037/a0021524.
Crabbe, J C, D Wahlsten, und B C Dudek. 1999. „Genetics of mouse behavior: interactions with laboratory environment“. Science 284 (5420): 1670–72.
Doyen, Stéphane, Olivier Klein, Cora-Lise Pichon, und Axel Cleeremans. 2012. „Behavioral priming: it’s all in the mind, but whose mind?“ PloS one 7 (1): e29081. https://doi.org/10.1371/journal.pone.0029081.
Gopalakrishna, Gowri, Gerben ter Riet, Maarten J. L. F. Cruyff, Gerko Vink, Ineke Stoop, Jelte M. Wicherts, und Lex Bouter. 2021. „Prevalence of questionable research practices, research misconduct and their potential explanatory factors: a survey among academic researchers in The Netherlands“. https://doi.org/10.31222/osf.io/vk9yt.
Kafkafi, Neri, Joseph Agassi, Elissa J Chesler, John C Crabbe, Wim E Crusio, David Eilam, Robert Gerlai, u. a. 2018. „Reproducibility and replicability of rodent phenotyping in preclinical studies“. Neurosci. Biobehav. Rev. 87 (April): 218–32.
Moore, A D. 2000. „Owning genetic information and gene enhancement techniques: why privacy and property rights may undermine social control of the human genome“. Bioethics 14 (2): 97–119.
Muhmenthaler, Michèle C, Mirela Dubravac, und Beat Meier. 2022. „The future failed: No evidence for precognition in a large scale replication attempt of Bem (2011).“ Psychology of Consciousness: Theory, Research, and Practice.
O’Grady, Cathleen. 2021. „Honesty study was based on fabricated data“. Science 373 (65-58): 950–51.
Robinson, Eric. 2011. „Not feeling the future: A failed replication of retroactive facilitation of memory recall.“ Journal of the Society for Psychical Research 75 (904).
Roe, Chris A, Sarah Grierson, und Aaron Lomas. 2012. „Feeling the future: two independent replication attempts“.
Wagenmakers, Eric-Jan, Ruud Wetzels, Denny Borsboom, und Han L. J. van der Maas. 2011. „Why psychologists must change the way they analyze their data: the case of psi: comment on Bem (2011)“. Journal of Personality and Social Psychology 100 (3): 426–32. https://doi.org/10.1037/a0022790.
Williams, Lawrence E, und John A Bargh. 2008. „Experiencing physical warmth promotes interpersonal warmth“. Science 322 (5901): 606–7.

  1. Mittels der Retraction Database lassen sich nach Thema, Autor*in, Zeitschrift, usw. zurückgezogene Artikel durchsuchen: http://retractiondatabase.org/↩︎