Statistische Signifikanz

"Behauptet die Nullhypothese, es existiere kein Effekt (also z.B. kein Zusammenhang oder kein Unterschied), zählen auch kleinste Effekte als Beleg für die Richtigkeit der Alternativhypothese, wenn sich diese als statistisch signifikant erweisen. Da aber ... die Größe eines statistisch signifikanten Effekts vom Umfang der untersuchten Stichprobe abhängt, ist die Nullhypothese als theoretische Aussage ... gewissermaßen chancenlos." (Bortz, 1984, S. 487).

Statistische Signifikanz gibt an, wie groß die Wahrscheinlichkeit (p) ist, dass der mittlere Wert einer Messreihe von einem angenommenen Wert abweicht, das heißt, ob die Hypothese (Ho), die Abweichung sei rein zufällig, zurückgewiesen werden kann. Je größer die Anzahl der Messungen, je präziser das Messinstrument und je größer der gewählte p-Wert, desto kleiner ist der Unterschied, der "entdeckt" werden kann.
Voraussetzung: Bei den Messungen handelt es sich um rein zufällige Wiederholungen der Messung eines Objekts, das sich durch und während der Messung nicht verändert. In diesem und nur in diesem Fall kann angenommen werden, dass der 'Messfehler' ab einer bestimmten anzahl von Messungen (>10) nahezu normalverteilt ist, also eine 'Glockenkurve' bildet.
Merke: Es handelt sich hier um eine rein 'statistische Signifikanz'. Die Frage, ob eine Unterschied auch theoretisch (psychologisch, pädagogisch etc.) und praktisch signifikant (bedeutsam) ist, hängt von der jeweiligen Fragestellung ab.
- Anwendung: Sinnvoll, wenn sehr kleine Unterschiede entdeckt werden sollen, der aus theoretischen oder praktischen Gründen von großer Bedeutung ist. In diesem Fall wählt man die Zahl der Messungen so groß, dass der Messfehler bzw. das 'Konfidenzintervall' kleiner wird als der zu entdeckende Effekt. Beispiel: Die gerinfügige Ablenkung des Lichts durch große Massen, wie sie von der speziellen Relativitätstheorie von Einstein vorhergesagt wird. Selbst eine nur gerngfügige, aber nicht durch Messfehler erklärbare Ablenkung genügte, um diese Theorie zu bestätigen. Von praktischer Relevanz wurde diese Bestätigung durch die Raumfahrt, wo auf lange Distanz bereits sehr geringe Ungenauigkeiten der Richtungsmessung zu großen Abweichung bei der Zielgenauigkeit und damit zum Scheitern ein Expedition führen können. (Beispiel)
- Gegen-Indikation: Wenn der vermutete oderr vorhergesagte Unterschied deutlich größer ist als zu entdeckende Bei sehr großen Mess-Stichproben (über N = 100) werden selbst sehr geringe und unbedeutsame Unterscheide "signifikant". Wichtig: Man sollte hier immer von "statistischer Signifikanz bzw. Bedeutsamkeit" sprechen.
  Nicht einsetzbar, wenn die Schwankungen nicht zufällig bzw. normalverteilt sind.
  Es ist nicht möglich, die Stärke eines Effekts mit Hilfe von statistischen Signifikanzmaßen zu quantifizieren. Es ist sinnlos zu sagen "Unterschied A sei 'signifikanter' als Unterschied B", oder "Unterschied A sei 'fast' signifikant geworden".

Literatur:

Thompson (1996 ) AERA editorial policies regarding statistical significance testing: three suggested reforms. Educational Researcher, 25(2), 26-30
... mehr

Letzte Änderung: 13.1.2004(c) Georg Lind