Gepoolte Standardabweichung
Formel, Herleitung und praktische Beispiele zur gepoolten Standardabweichung zweier Stichproben
Die gepoolte Standardabweichung ist ein gewichteter Durchschnitt der Standardabweichungen mehrerer Gruppen oder Stichproben. Sie wird verwendet, um eine gemeinsame Schätzung der Streuung bereitzustellen, wenn die zugrundeliegenden Populationen dieselbe Standardabweichung aufweisen.
Im Gegensatz zu einfacher Mittelwertbildung der Standardabweichungen werden größeren Stichprobenumfängen mehr „Gewicht" beigemessen, was zu einer robusteren und präziseren Schätzung führt. Sie ist eng mit der gepoolten Varianz verwandt — die gepoolte Standardabweichung ist einfach die Quadratwurzel der gepoolten Varianz.
Grundkonzept der gepoolten Standardabweichung
Die gepoolte Standardabweichung kombiniert Informationen aus zwei oder mehr Stichproben zu einer einzigen Schätzung der Populationsstandardabweichung. Dies ist besonders wertvoll bei:
- t-Tests und ANOVA: Standardmethode zur Varianzschätzung
- Varianzhomogenität: Die Populationsstandardabweichungen sind gleich
- Kleine Stichprobengrößen: Die gepoolte Schätzung ist stabiler
- Ungleiche Stichprobengrößen: Größere Stichproben erhalten höhere Gewichte
- Konfidenzintervalle: Präzisere Intervalle durch bessere Schätzung
Die gepoolte Standardabweichung ist die Quadratwurzel der gepoolten Varianz: \(\text{SD}_p = \sqrt{S_p^2}\)
Formeln der gepoolten Standardabweichung
Hauptformel für zwei Stichproben
Bedeutung der Symbole:
- \(SD_p\): Gepoolte Standardabweichung
- \(SD_x^2\): Varianz der ersten Stichprobe (quadrierte Standardabweichung)
- \(SD_y^2\): Varianz der zweiten Stichprobe (quadrierte Standardabweichung)
- \(n\): Größe der ersten Stichprobe
- \(m\): Größe der zweiten Stichprobe
Stichprobenstandardabweichung (Grundformel)
Für eine einzelne Stichprobe mit Größe \(n\):
Alternative Darstellung
Direkt über die Summe der Quadratischen Abweichungen:
Herleitung und Konzept
Die gepoolte Standardabweichung wird aus der gepoolten Varianz abgeleitet. Der Prozess besteht aus zwei Schritten:
- Gepoolte Varianz berechnen: Gewichteter Durchschnitt der beiden Varianzen
- Quadratwurzel ziehen: Die Standardabweichung ist die Quadratwurzel der Varianz
Warum Gewichte?
Die Freiheitsgrade \((n-1)\) und \((m-1)\) dienen als Gewichte und reflektieren die „Zuverlässigkeit" jeder Stichprobe. Eine größere Stichprobe mit mehr Freiheitsgraden trägt stärker zur Schätzung bei. Der Nenner \(n+m-2\) ist die Gesamtzahl der Freiheitsgrade.
Praktisches Beispiel: Schritt-für-Schritt
Zwei Gruppen von Schülern werden in einem Test bewertet. Berechnen Sie die gepoolte Standardabweichung.
Schritt 1: Datensätze vorbereiten
Daten erfassen
Schritt 2: Mittelwerte berechnen
Arithmetische Mittel
Schritt 3: Stichprobenstandardabweichungen berechnen
Standardabweichungen \(SD_x\) und \(SD_y\)
Schritt 4: Gepoolte Standardabweichung berechnen
Abschließende Berechnung
Beziehung zur gepoolten Varianz
Die gepoolte Standardabweichung ist mathematisch direkt mit der gepoolten Varianz verknüpft:
Dies bedeutet, dass Sie die gepoolte Varianz berechnen können und dann die Quadratwurzel ziehen, um die gepoolte Standardabweichung zu erhalten. In unserem Beispiel:
Anwendungen und Besonderheiten
- t-Test (unabhängig): Wird zur Berechnung der Teststastistik benötigt
- Welch-Test: Eine Variante für ungleiche Varianzen
- Konfidenzintervalle: Für die Differenz zweier Mittelwerte
- Effektstärke (Cohen's d): Verwendet die gepoolte Standardabweichung als Nenner
- Power-Analysen: Bestimmung von Stichprobengrößen
Die gepoolte Standardabweichung setzt voraus, dass die Populationsstandardabweichungen gleich sind (Varianzhomogenität). Überprüfen Sie dies immer mit dem Levene-Test oder einem anderen Test. Wenn diese Annahme verletzt ist, verwenden Sie stattdessen den Welch-Test.
Tipps und häufige Fehler
- Von Varianz zur Standardabweichung: Berechnen Sie erst die gepoolte Varianz, dann die Wurzel
- Freiheitsgrade nicht vergessen: Der Nenner muss \(n+m-2\) sein
- Varianzhomogenität prüfen: Wichtigste Voraussetzung vor Anwendung
- Einheiten beachten: Die Standardabweichung hat die gleichen Einheiten wie die Daten
- Interpretation: Größere Werte bedeuten größere Streuung
- FALSCH: Nenner als \(n+m\) verwenden | RICHTIG: Nenner ist \(n+m-2\)
- FALSCH: Quadratwurzel vergessen | RICHTIG: \(\sqrt{\text{Varianz}} = \text{Standardabweichung}\)
- FALSCH: Varianzhomogenität nicht prüfen | RICHTIG: Levene-Test durchführen
- FALSCH: Einfacher Durchschnitt der SDs | RICHTIG: Mit Freiheitsgraden gewichten
- FALSCH: SD mit Varianz verwechseln | RICHTIG: SD = Quadratwurzel der Varianz
Online-Rechner und Tools
Um die gepoolte Standardabweichung schnell zu berechnen:
|
|