Das Simpson-Paradoxon ist ein statistischer Effekt, bei dem eine Analyse der Gesamtheit von Daten einen bestimmten Trend oder Zusammenhang offenbart, der sich jedoch umkehrt, sobald man die Daten in Untergruppen oder Cluster aufteilt.

Vereinfachtes Beispiel

Angenommen, diese Art von Grafik liegt vor:

Simpson-Paradoxon Visualisierung

Beispielsweise könnten jüngere und ältere Personengruppen jeweils durch die Einnahme von Omega-3-Fettsäuren bessere Blutwerte erzielen. Werden diese Daten jedoch zusammengefasst und in einem einzigen Graphen dargestellt, könnte eine irreführende negative Korrelation sichtbar werden, die fälschlicherweise den Schluss zulässt, dass Omega-3 die Blutwerte verschlechtert. Der Effekt entsteht, weil die Altersgruppen selbst eine Störvariable darstellen, die das Gesamtergebnis beeinflusst.


Die Problematik

Aktuell gibt es sehr viele Fitness- bzw. Gesundheitsinfluencer, die entweder:

Diese Fehlinformationen können eventuell Schaden anrichten. Bei der Verbreitung der Informationen erreichen sie auch oft mehr Menschen, als ein Beitrag Aufrufzahlen hat, wenn jemand solch einen Beitrag sieht und davon am Mittagstisch, auf der Arbeit oder sonst wo erzählt.


Fazit

Korrelationen müssen noch kritischer betrachtet werden – sowohl von den Konsumenten der Informationen als auch von den Influencern, die sie verbreiten.

Ich appelliere an Forscher, mehr darauf zu achten, potenzielle Cluster zu identifizieren, diese mit statistischen Tools über Programme darzustellen und eventuelle Fehlschlüsse zu vermeiden.


Grafik: (Von Schutz – Eigenes Werk, Gemeinfrei)