Fünf-Punkte-Zusammenfassung

Berechnung und Analyse der Fünf-Punkte-Zusammenfassung (Box-Plot) von Daten

Die Fünf-Punkte-Zusammenfassung (Five-Number Summary) ist eine statistische Methode zur Zusammenfassung der Verteilung von Daten mit fünf Kennzahlen. Sie bietet einen schnellen Überblick über die Spannweite, Lage und Streuung eines Datensatzes.

Die fünf Punkte sind: Minimum, unteres Quartil (Q1), Median (Q2), oberes Quartil (Q3) und Maximum. Diese Zusammenfassung wird häufig in einem Box-Plot (Kastendiagramm) visualisiert und ist besonders nützlich zur Erkennung von Ausreißern und zur Vergleichbarkeit mehrerer Datensätze.

Grundkonzept der Fünf-Punkte-Zusammenfassung

Die Fünf-Punkte-Zusammenfassung besteht aus fünf wichtigen Werten, die die Verteilung eines Datensatzes charakterisieren:

  • Minimum: Der kleinste Wert im Datensatz
  • Unteres Quartil (Q1): Der Wert, unter dem 25% der Daten liegen
  • Median (Q2): Der mittlere Wert, unter dem 50% der Daten liegen
  • Oberes Quartil (Q3): Der Wert, unter dem 75% der Daten liegen
  • Maximum: Der größte Wert im Datensatz
Die fünf Komponenten:

Für einen sortierten Datensatz x₁ ≤ x₂ ≤ ... ≤ xₙ:

\(\displaystyle \text{Zusammenfassung} = \begin{cases} \text{Min} = x_1 \\ \text{Q1} = \text{Unteres Quartil} \\ \text{Q2} = \text{Median} \\ \text{Q3} = \text{Oberes Quartil} \\ \text{Max} = x_n \end{cases}\)

Quartil-Positionen

Berechnung der Quartil-Positionen:
\(\displaystyle \text{Position des Quartils} = \frac{k}{4} \cdot (n + 1)\)

k = 1: Unteres Quartil (Q1)
k = 2: Median (Q2)
k = 3: Oberes Quartil (Q3)
n: Anzahl der Datenpunkte

Praktisches Beispiel: Schritt-für-Schritt Berechnung

Berechne die Fünf-Punkte-Zusammenfassung für den Datensatz: 2, 5, 4, 8, 3, 7, 9, 3, 1, 6

Schritt 1: Anzahl der Datenpunkte bestimmen

Datenpunkte zählen
Datensatz: 2, 5, 4, 8, 3, 7, 9, 3, 1, 6
Anzahl der Werte:
\(\displaystyle n = 10\)

Schritt 2: Daten sortieren

Aufsteigende Sortierung
Sortierter Datensatz: 1, 2, 3, 3, 4, 5, 6, 7, 8, 9

Schritt 3: Minimum und Maximum bestimmen

Extremwerte
Minimum:
\(\displaystyle \text{Min} = 1\)
Maximum:
\(\displaystyle \text{Max} = 9\)

Schritt 4: Unteres Quartil (Q1) berechnen

Q1 Berechnung
Position von Q1:
\(\displaystyle \frac{1}{4} \cdot (10 + 1) = \frac{1}{4} \cdot 11 = 2,75\)
Interpretation: Q1 liegt zwischen der 2. und 3. Position
Werte an Position 2 und 3: 2 und 3
Q1 berechnen (Interpolation):
\(\displaystyle \text{Q1} = 2 + 0,75 \cdot (3 - 2)\) \(\displaystyle = 2 + 0,75 = 2,75\)

Schritt 5: Median (Q2) berechnen

Q2 (Median) Berechnung
Position des Medians:
\(\displaystyle \frac{2}{4} \cdot (10 + 1) = \frac{2}{4} \cdot 11 = 5,5\)
Interpretation: Median liegt zwischen der 5. und 6. Position
Werte an Position 5 und 6: 4 und 5
Q2 berechnen (Durchschnitt):
\(\displaystyle \text{Q2} = \frac{4 + 5}{2} = 4,5\)

Schritt 6: Oberes Quartil (Q3) berechnen

Q3 Berechnung
Position von Q3:
\(\displaystyle \frac{3}{4} \cdot (10 + 1) = \frac{3}{4} \cdot 11 = 8,25\)
Interpretation: Q3 liegt zwischen der 8. und 9. Position
Werte an Position 8 und 9: 7 und 8
Q3 berechnen (Interpolation):
\(\displaystyle \text{Q3} = 7 + 0,25 \cdot (8 - 7)\) \(\displaystyle = 7 + 0,25 = 7,25\)

Zusammenfassung der Ergebnisse

Minimum
1
Q1 (25%)
2,75
Q2 Median
4,5
Q3 (75%)
7,25
Maximum
9

Interquartilabstand (IQR)

Der Interquartilabstand (IQR - Interquartile Range) ist die Differenz zwischen dem oberen und unteren Quartil. Er beschreibt die Spannweite der mittleren 50% der Daten.

Definition des IQR:
\(\displaystyle \text{IQR} = \text{Q3} - \text{Q1}\)

Der IQR ist ein robustes Maß für die Streuung und wird oft zur Identifikation von Ausreißern verwendet.

Beispiel: IQR für unseren Datensatz

IQR Berechnung
Q3: 7,25
Q1: 2,75
Berechnung:
\(\displaystyle \text{IQR} = 7,25 - 2,75 = 4,5\)
Interpretation: Die mittleren 50% der Daten verteilen sich über eine Spanne von 4,5

Ausreißer-Erkennung mit der Fünf-Punkte-Zusammenfassung

Ein häufiger Anwendungsfall der Fünf-Punkte-Zusammenfassung ist die Identifikation von Ausreißern (extremen oder ungewöhnlichen Werten) in einem Datensatz.

Ausreißer-Definition (1.5 × IQR Regel):
\(\displaystyle \begin{cases} \text{Untere Grenze} = \text{Q1} - 1,5 \times \text{IQR} \\ \text{Obere Grenze} = \text{Q3} + 1,5 \times \text{IQR} \end{cases}\)

Werte außerhalb dieser Grenzen werden als Ausreißer betrachtet.

Beispiel: Ausreißer-Grenzen berechnen

Grenzen berechnen
IQR: 4,5
Untere Ausreißer-Grenze:
\(\displaystyle 2,75 - 1,5 \times 4,5 = 2,75 - 6,75 = -4\)
Obere Ausreißer-Grenze:
\(\displaystyle 7,25 + 1,5 \times 4,5 = 7,25 + 6,75 = 14\)
Resultat: Der Datensatz 1-9 hat keine Ausreißer, da alle Werte zwischen -4 und 14 liegen

Box-Plot (Kastendiagramm) Visualisierung

Die Fünf-Punkte-Zusammenfassung wird häufig als Box-Plot visualisiert:

Bestandteile eines Box-Plots:
  • Whisker unten: Linie vom Minimum bis Q1
  • Box: Rechteck von Q1 bis Q3 (zeigt mittlere 50% der Daten)
  • Linie in der Box: Der Median (Q2)
  • Whisker oben: Linie von Q3 bis zum Maximum
  • Punkte außerhalb: Ausreißer (wenn vorhanden)

Der Box-Plot bietet eine visuell schnelle Darstellung der Datenverteilung und macht Asymmetrien und Ausreißer sofort erkennbar.

Vergleich mehrerer Datensätze

Ein großer Vorteil der Fünf-Punkte-Zusammenfassung ist die Möglichkeit, mehrere Datensätze schnell zu vergleichen.

Beispiel: Vergleich von zwei Klassen

Testergebnisse zweier Klassen
Klasse A Zusammenfassung:
Min: 45, Q1: 65, Q2: 72, Q3: 82, Max: 95
Klasse B Zusammenfassung:
Min: 50, Q1: 70, Q2: 75, Q3: 85, Max: 100
Interpretation:

- Beide Klassen haben ähnliche Mediane (72 vs. 75)
- Klasse B hat eine leicht höhere obere Quartilgrenze
- Klasse A hat einen extremeren unteren Wert (45 vs. 50)
- Klasse B ist insgesamt etwas besser und konsistenter

Praktische Anwendungen der Fünf-Punkte-Zusammenfassung

  • Bildungsbereich: Analyse von Testergebnissen und Notenverteilungen
  • Qualitätskontrolle: Überprüfung von Produktmaßen und Toleranzen
  • Medizin: Analyse von Messdaten in klinischen Studien
  • Finanzwesen: Analyse von Aktienrenditen und Marktdaten
  • Umweltschutz: Überwachung von Schadstoffkonzentrationen
  • Biologie: Analyse von Messdaten bei Experimenten
  • Verkehrswesen: Analyse von Fahrtzeiten und Geschwindigkeiten
  • Sport: Analyse von Athletenleistungen und Trainingsmetriken

Tipps und häufige Fehler

Hilfreiche Tipps:
  • Immer sortieren: Sortiere die Daten IMMER zuerst in aufsteigender Reihenfolge
  • Formel merken: Position = k/4 × (n+1) für alle Quartile verwenden
  • Interpolation verstehen: Bei nicht-ganzzahligen Positionen linear interpolieren
  • IQR nutzen: Der Interquartilabstand ist robust und gut für Ausreißer-Erkennung
  • Mit anderen vergleichen: Box-Plots ermöglichen schnelle visuelle Vergleiche
Häufige Fehler:
  • FALSCH: Daten nicht sortieren | RICHTIG: Immer zuerst sortieren
  • FALSCH: Falsche Formel für Position verwenden | RICHTIG: k/4 × (n+1)
  • FALSCH: Nur ganzzahlige Positionen betrachten | RICHTIG: Auch dezimale Positionen interpolieren
  • FALSCH: Median mit anderem Quartil verwechseln | RICHTIG: Q2 = Median ist 50%
  • FALSCH: Ausreißer-Grenze ignorieren | RICHTIG: 1.5 × IQR Regel anwenden

Online-Rechner und Tools

Um die Fünf-Punkte-Zusammenfassung schnell zu berechnen:

Verwandte Themen in der Statistik

Weitere wichtige statistische Konzepte:



Arithmetisches Mittel (Durchschnitt)Five NumberMedianEmpirische VerteilungsfunktionGeometrisches MittelGepoolte StandardabweichungGepoolte VarianzHarmonisches MittelKontraharmonisches MittelKovarianz

Ist diese Seite hilfreich?            
Vielen Dank für Ihr Feedback!

Das tut uns leid

Wie können wir die Seite verbessern?