… oder warum es besser sein kann, den Median zu verwenden.
Wenn Daten in Form von Erhebungen, Umfragen oder Stichproben gesammelt werden und darüber berichtet wird, dann ist der Durchschnitt in der Regel nur ein Eck entfernt. Wie sonst soll aus einer (riesigen) Gruppe Information für ein einzelnes Mitglied gezogen werden? Zum Beispiel beim Einkommen, oder bei der Körpergröße? Was ist jedoch die Aussage des Durchschnittes? Oder anders gefragt, kann mit dem Durchschnitt auch eine vernünftige Aussage für einen Großteil der betrachteten Gruppe getroffen werden?
Dazu ein kleiner Exkurs in die Statistik. Die kennt nicht nur einen Mittelwert, sondern einen ganzen Haufen davon – wie bereits ein kurzer Klick auf Wikipedia zeigt. Warum diese Vielzahl an Mittelwerten?
Einer der Gründe sind (statistische) Ausreißer. Denn die unterschiedlichen Mittelwerte reagieren ganz anders auf (kleine) Veränderungen der Stichprobe. Je nachdem wie die Stichprobe aussieht, können hier relativ große Unterschiede zu Tage kommen. Nehmen wir als Beispiel das Einkommen. Hier ist es in der Regel so, dass der Großteil der Bevölkerung ähnlich viel (bzw. wenig) verdient, während es ein paar wenige Großverdiener gibt. Der „klassische“ Durchschnitt (auch arithmetisches Mittel genannt) wird berechnet indem alle Einkommen zusammengezählt (addiert) und dann durch ihre Anzahl geteilt (dividiert) werden. Dadurch beeinflusst jeder einzelne Wert aus der Stichprobe das Ergebnis gleich viel (oder wenig, falls die Stichprobe groß ist).
Die Basis für die Berechnung des Medians ist hingegen eine andere. Hier kommt es auf die Anzahl der Werte an, denn der Median teilt eine Stichprobe in zwei Hälften. Es werden alle Werte aufsteigend geordnet und dann die „Mittellinie“ gezogen. Wenn in der Stichprobe eine ungerade Anzahl von Werten sind, so ist der mittlere Wert der Median dieser Stichprobe. Bei einer geraden Anzahl von Werten ist der Median der klassische Durchschnitt der zwei mittleren Zahlen.
Im folgenden Beispiel wird der Unterschied zwischen Durchschnitt und Median plakativ gemacht (drücke unten auf „+1“ bis der Median „kippt“ ;).
Es ist schön zu erkennen, dass der Median viel robuster (also weniger anfällig) gegenüber Ausreißern ist als der klassische, instabile Durchschnitt. Der Median kippt erst dann, wenn die Anzahl der Ausreißer gleich groß wird, wie jene der Ausgangswerte. In dem Fall lässt sich aber nur mehr schwer von Ausreißern schreiben, da bereits die Hälfte aller Werte „Ausreißer“ sind. Der Median eignet sich daher dort, wo es darum geht eine große, relativ ähnliche Gruppe zu beschreiben, ohne das etwaigen Ausreißern die Statistik verzerren. So wird von der Statistik Austria beim Einkommen immer der Median angegeben, das arithmetische Mittel (klassischer Durchschnitt) hingegen bestenfalls aus Zusatz.
Und da die meisten Stichproben mit Ausreißern behaftet sind, ist es im Allgemeinen keine schlechte Idee den Median zu verwenden (zumindest als Zusatz zum Durchschnitt).
Weiterführender Link: In diesem Gastkommentar in der Presse werden die Vorteile des (robusteren) Medians für volkswirtschaftliche Betrachtungen erörtert.