Gepoolte Standardabweichung

Formel, Herleitung und praktische Beispiele zur gepoolten Standardabweichung zweier Stichproben

Die gepoolte Standardabweichung ist ein gewichteter Durchschnitt der Standardabweichungen mehrerer Gruppen oder Stichproben. Sie wird verwendet, um eine gemeinsame Schätzung der Streuung bereitzustellen, wenn die zugrundeliegenden Populationen dieselbe Standardabweichung aufweisen.

Im Gegensatz zu einfacher Mittelwertbildung der Standardabweichungen werden größeren Stichprobenumfängen mehr „Gewicht" beigemessen, was zu einer robusteren und präziseren Schätzung führt. Sie ist eng mit der gepoolten Varianz verwandt — die gepoolte Standardabweichung ist einfach die Quadratwurzel der gepoolten Varianz.

Grundkonzept der gepoolten Standardabweichung

Die gepoolte Standardabweichung kombiniert Informationen aus zwei oder mehr Stichproben zu einer einzigen Schätzung der Populationsstandardabweichung. Dies ist besonders wertvoll bei:

  • t-Tests und ANOVA: Standardmethode zur Varianzschätzung
  • Varianzhomogenität: Die Populationsstandardabweichungen sind gleich
  • Kleine Stichprobengrößen: Die gepoolte Schätzung ist stabiler
  • Ungleiche Stichprobengrößen: Größere Stichproben erhalten höhere Gewichte
  • Konfidenzintervalle: Präzisere Intervalle durch bessere Schätzung
Zusammenhang zur Varianz:

Die gepoolte Standardabweichung ist die Quadratwurzel der gepoolten Varianz: \(\text{SD}_p = \sqrt{S_p^2}\)

Formeln der gepoolten Standardabweichung

Hauptformel für zwei Stichproben

\(\displaystyle SD_p = \sqrt{\frac{(n-1)SD_x^2 + (m-1)SD_y^2}{n+m-2}}\)

Bedeutung der Symbole:

  • \(SD_p\): Gepoolte Standardabweichung
  • \(SD_x^2\): Varianz der ersten Stichprobe (quadrierte Standardabweichung)
  • \(SD_y^2\): Varianz der zweiten Stichprobe (quadrierte Standardabweichung)
  • \(n\): Größe der ersten Stichprobe
  • \(m\): Größe der zweiten Stichprobe

Stichprobenstandardabweichung (Grundformel)

Für eine einzelne Stichprobe mit Größe \(n\):

\(\displaystyle SD = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} (x_i - \overline{x})^2}\)

Alternative Darstellung

Direkt über die Summe der Quadratischen Abweichungen:

\(\displaystyle SD_p = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\overline{x})^2 + \sum_{j=1}^{m}(y_j-\overline{y})^2}{n+m-2}}\)

Herleitung und Konzept

Die gepoolte Standardabweichung wird aus der gepoolten Varianz abgeleitet. Der Prozess besteht aus zwei Schritten:

  1. Gepoolte Varianz berechnen: Gewichteter Durchschnitt der beiden Varianzen
  2. Quadratwurzel ziehen: Die Standardabweichung ist die Quadratwurzel der Varianz
Warum Gewichte?

Die Freiheitsgrade \((n-1)\) und \((m-1)\) dienen als Gewichte und reflektieren die „Zuverlässigkeit" jeder Stichprobe. Eine größere Stichprobe mit mehr Freiheitsgraden trägt stärker zur Schätzung bei. Der Nenner \(n+m-2\) ist die Gesamtzahl der Freiheitsgrade.

Praktisches Beispiel: Schritt-für-Schritt

Zwei Gruppen von Schülern werden in einem Test bewertet. Berechnen Sie die gepoolte Standardabweichung.

Schritt 1: Datensätze vorbereiten

Daten erfassen
Gruppe X: 3, 5, 7, 8
Gruppe Y: 10, 16, 22, 27
Stichprobengrößen: \(n = 4\), \(m = 4\)

Schritt 2: Mittelwerte berechnen

Arithmetische Mittel
Mittelwert von X:
\(\displaystyle \overline{x} = \frac{3+5+7+8}{4} = 5.75\)
Mittelwert von Y:
\(\displaystyle \overline{y} = \frac{10+16+22+27}{4} = 18.75\)

Schritt 3: Stichprobenstandardabweichungen berechnen

Standardabweichungen \(SD_x\) und \(SD_y\)
Für Gruppe X — Summe der Quadrate:
\(\displaystyle \sum (x_i - \overline{x})^2 = (3-5.75)^2+(5-5.75)^2\) \(\displaystyle+(7-5.75)^2 +(8-5.75)^2 = 14.75\)
Für Gruppe X — Standardabweichung:
\(\displaystyle SD_x = \sqrt{\frac{14.75}{4-1}} = \sqrt{\frac{14.75}{3}}\) \(\displaystyle = \sqrt{4.9167} = \color{blue}{2.217}\)
Für Gruppe Y — Summe der Quadrate:
\(\displaystyle \sum (y_j - \overline{y})^2 = (10-18.75)^2+(16-18.75)^2\) \(\displaystyle +(22-18.75)^2+(27-18.75)^2 = 162.75\)
Für Gruppe Y — Standardabweichung:
\(\displaystyle SD_y = \sqrt{\frac{162.75}{4-1}} = \sqrt{\frac{162.75}{3}} \) \(\displaystyle = \sqrt{54.25} = \color{blue}{7.3655}\)

Schritt 4: Gepoolte Standardabweichung berechnen

Abschließende Berechnung
Varianzen der Stichproben:
\(\displaystyle SD_x^2 = (2.217)^2 = 4.9167 \quad ;\) \(\displaystyle \quad SD_y^2 = (7.3655)^2 = 54.25\)
Formel anwenden:
\(\displaystyle SD_p = \sqrt{\frac{(4-1) \cdot 4.9167 + (4-1) \cdot 54.25}{4+4-2}}\)
Zähler berechnen:
\(\displaystyle SD_p = \sqrt{\frac{3 \cdot 4.9167 + 3 \cdot 54.25}{6}} \) \(\displaystyle= \sqrt{\frac{14.75 + 162.75}{6}}\)
Endergebnis:
\(\displaystyle SD_p = \sqrt{\frac{177.5}{6}} = \sqrt{29.583} = \color{blue}{5.44}\)
Interpretation: Die gepoolte Standardabweichung für beide Gruppen beträgt etwa \(SD_p \approx 5.44\). Dies bedeutet, dass die durchschnittliche Abweichung der Messwerte von ihren jeweiligen Mittelwerten etwa 5.44 Punkte beträgt.

Beziehung zur gepoolten Varianz

Die gepoolte Standardabweichung ist mathematisch direkt mit der gepoolten Varianz verknüpft:

\(\displaystyle SD_p = \sqrt{S_p^2}\)

Dies bedeutet, dass Sie die gepoolte Varianz berechnen können und dann die Quadratwurzel ziehen, um die gepoolte Standardabweichung zu erhalten. In unserem Beispiel:

\(\displaystyle S_p^2 = 29.583 \quad \Rightarrow \quad SD_p = \sqrt{29.583} = 5.44\)

Anwendungen und Besonderheiten

  • t-Test (unabhängig): Wird zur Berechnung der Teststastistik benötigt
  • Welch-Test: Eine Variante für ungleiche Varianzen
  • Konfidenzintervalle: Für die Differenz zweier Mittelwerte
  • Effektstärke (Cohen's d): Verwendet die gepoolte Standardabweichung als Nenner
  • Power-Analysen: Bestimmung von Stichprobengrößen
Wichtige Warnung:

Die gepoolte Standardabweichung setzt voraus, dass die Populationsstandardabweichungen gleich sind (Varianzhomogenität). Überprüfen Sie dies immer mit dem Levene-Test oder einem anderen Test. Wenn diese Annahme verletzt ist, verwenden Sie stattdessen den Welch-Test.

Tipps und häufige Fehler

Hilfreiche Tipps:
  • Von Varianz zur Standardabweichung: Berechnen Sie erst die gepoolte Varianz, dann die Wurzel
  • Freiheitsgrade nicht vergessen: Der Nenner muss \(n+m-2\) sein
  • Varianzhomogenität prüfen: Wichtigste Voraussetzung vor Anwendung
  • Einheiten beachten: Die Standardabweichung hat die gleichen Einheiten wie die Daten
  • Interpretation: Größere Werte bedeuten größere Streuung
Häufige Fehler:
  • FALSCH: Nenner als \(n+m\) verwenden | RICHTIG: Nenner ist \(n+m-2\)
  • FALSCH: Quadratwurzel vergessen | RICHTIG: \(\sqrt{\text{Varianz}} = \text{Standardabweichung}\)
  • FALSCH: Varianzhomogenität nicht prüfen | RICHTIG: Levene-Test durchführen
  • FALSCH: Einfacher Durchschnitt der SDs | RICHTIG: Mit Freiheitsgraden gewichten
  • FALSCH: SD mit Varianz verwechseln | RICHTIG: SD = Quadratwurzel der Varianz

Online-Rechner und Tools

Um die gepoolte Standardabweichung schnell zu berechnen:

Verwandte Themen in der Statistik

Weitere wichtige statistische Konzepte:



Arithmetisches Mittel (Durchschnitt)Five NumberMedianEmpirische VerteilungsfunktionGeometrisches MittelGepoolte StandardabweichungGepoolte VarianzHarmonisches MittelKontraharmonisches MittelKovarianz

Ist diese Seite hilfreich?            
Vielen Dank für Ihr Feedback!

Das tut uns leid

Wie können wir die Seite verbessern?