Wie es funktioniert
Die Standardabweichung misst die Streuung eines Datensatzes um seinen Mittelwert — um wie viel einzelne Werte im Schnitt vom Mittelwert abweichen. Eine kleine Standardabweichung bedeutet, die Daten sind eng um den Mittelwert geschart; eine große, dass sie weit gestreut sind. Zwei Datensätze können denselben Mittelwert, aber sehr unterschiedliche Formen haben, und die Standardabweichung ist die häufigste einzelne Zahl, um diesen Unterschied zu beschreiben. Klassisches Beispiel: Gehälter in einem Startup mit Mittelwert 80 000 € — bei Standardabweichung 5 000 € verdienen alle rund 80k; bei 40 000 € verdienen die Gründer 200k und die ersten Angestellten kommen mit 50k aus. Der Mittelwert allein verbirgt die Ungleichheit.
Es gibt zwei Varianten der Standardabweichung, und die Wahl matters. Die Populationsstandardabweichung (σ, dividiert durch n) wird genutzt, wenn Daten über jedes Mitglied der interessierenden Gruppe vorliegen — z. B. Körpergrößen aller Spieler eines bestimmten Basketballteams. Die Stichproben-Standardabweichung (s, dividiert durch n−1) wird genutzt, wenn der Datensatz eine Zufallsstichprobe aus einer größeren Population ist und man die Streuung der Population schätzen will — z. B. 100 zufällig ausgewählte Personen messen, um die Streuung im ganzen Land zu schätzen. Das n−1 (Bessel-Korrektur) kompensiert, dass der Stichprobenmittelwert selbst eine Schätzung ist, was die wahre Populationsvarianz leicht unterschätzt, wenn man naiv n nimmt. Stichproben-SD für nahezu jede inferenzstatistische Arbeit; Populations-SD nur, wenn man wirklich die gesamte Population hat (selten in der Praxis).
Varianz ist einfach die Standardabweichung im Quadrat — selbe Information, andere Einheiten. Die Standardabweichung steht in denselben Einheiten wie die Originaldaten (€, Sekunden, kg), was sie interpretierbar macht; die Varianz in Quadrateinheiten (€², s², kg²) ist mathematisch praktisch für Beweise und Rechnungen, aber schwerer zu deuten. Die Faustregel (68-95-99,7) gibt eine Intuition für „normalverteilte" Daten: etwa 68 % der Werte liegen innerhalb 1 Standardabweichung vom Mittelwert, 95 % innerhalb 2, und 99,7 % innerhalb 3. Im Gehaltsbeispiel mit Mittelwert 80k und SD 10k erwarten Sie, dass ~68 % der Angestellten zwischen 70k und 90k verdienen. Reale Daten sind oft nicht perfekt normal (insbesondere Einkommen, rechtsschief), aber die Regel ist ein nützlicher Plausibilitätscheck.
Die Formel
xᵢ sind die einzelnen Datenpunkte. n ist die Anzahl. μ (mu) ist der Populationsmittelwert; x̄ (x-quer) der Stichprobenmittelwert — beide identisch berechnet, aber konventionell mit unterschiedlichen Symbolen je nach Behandlung. Σ steht für die Summe über alle Datenpunkte. Das n−1 in der Stichprobenformel ist die Bessel-Korrektur.
Beispielrechnung
- Datensatz: 4, 8, 6, 5, 3, 7. n = 6.
- Mittelwert = (4 + 8 + 6 + 5 + 3 + 7) / 6 = 33 / 6 = 5,5.
- Quadratische Abweichungen: (4−5,5)² = 2,25, (8−5,5)² = 6,25, (6−5,5)² = 0,25, (5−5,5)² = 0,25, (3−5,5)² = 6,25, (7−5,5)² = 2,25. Summe = 17,5.
- Populationsvarianz = 17,5 / 6 ≈ 2,917; Populations-SD = √2,917 ≈ 1,708. Stichprobenvarianz = 17,5 / 5 = 3,5; Stichproben-SD = √3,5 ≈ 1,871. Der Stichprobenwert ist wegen n−1 stets etwas größer.
Häufig gestellte Fragen
Soll ich die Stichproben- (n−1) oder Populations-Version (n) nutzen?
Standardmäßig Stichprobe (n−1), außer Sie haben wirklich Daten zu jedem Mitglied der interessierenden Gruppe. Die n−1-Formel kompensiert, dass der Stichprobenmittelwert selbst eine Schätzung ist, die die echte Populationsvarianz unterschätzt, wenn man n nimmt. In der Praxis: wissenschaftliche Analyse, A/B-Tests, Umfragedaten, ML-Feature-Engineering, Finanz-Renditeanalyse — alles Stichprobe. Populationsformeln gelten nur, wenn der Datensatz buchstäblich die gesamte Population ist (eine Klasse von 30 Schülern, alle Spiele eines Teams, alle Transaktionen einer abgeschlossenen Periode). Im Zweifel Stichprobe — der Unterschied verschwindet bei großem n, und Stichprobe statt Population ist deutlich weniger falsch als umgekehrt.
Wie unterscheidet sich Standardabweichung vom Standardfehler?
Die Standardabweichung beschreibt die Streuung einzelner Datenpunkte innerhalb einer Stichprobe. Der Standardfehler beschreibt die Streuung der Stichprobenmittelwerte über viele hypothetische Stichproben hinweg — er beantwortet „Wie sehr würde sich der Mittelwert ändern, wenn ich eine andere Zufallsstichprobe zöge?". Mathematisch: Standardfehler = Standardabweichung / √n, schrumpft also mit wachsender Stichprobe (mehr Daten, mehr Vertrauen in den Mittelwert). Unterschiedliche Zwecke: SD zum Beschreiben der Datenvariabilität; SE zum Ausdrücken der Schätzunsicherheit (z. B. „der Populationsmittelwert ist 50 ± 2", wobei 2 der SE ist). Konfidenzintervalle und p-Werte basieren auf SE, nicht SD.
Kann die Standardabweichung negativ sein?
Nein. Die Standardabweichung ist die Quadratwurzel der Varianz, und die Varianz ist eine Summe quadrierter Abweichungen geteilt durch eine positive Anzahl — beide Zwischengrößen sind stets nicht-negativ, also muss das Ergebnis ≥ 0 sein. Sie ist genau 0, wenn jeder Datenpunkt gleich dem Mittelwert ist (alle Werte identisch, keine Variabilität). Negative Ergebnisse aus einem Rechner deuten immer auf einen Eingabe- oder Rechenfehler hin. Die „Abweichung" eines Einzelpunkts (xᵢ − μ) kann negativ oder positiv sein, aber die Standardabweichung ist die typische Größenordnung dieser Abweichungen, ausgedrückt als positive Zahl.