Schiefe (Skewness) berechnen
Online Rechner zur Berechnung der Asymmetrie (Schiefe) einer Datenverteilung
Schiefe Rechner
Die Schiefe (Skewness)
Die Schiefe ist ein Maß für die Asymmetrie einer Verteilung. Sie zeigt an, ob die Verteilung nach links oder rechts geneigt ist.
Schiefe Visualisierung
Die Schiefe beschreibt die Asymmetrie einer Verteilung.
Sie zeigt an, auf welcher Seite der "Schwanz" länger ist.
■ Linksschiefe (g < 0) ■ Symmetrisch (g = 0) ■ Rechtsschiefe (g > 0)
Was ist die Schiefe (Skewness)?
Die Schiefe ist ein wichtiges Maß der deskriptiven Statistik:
- Definition: Maß für die Asymmetrie einer Wahrscheinlichkeitsverteilung
- Bezeichnung: Auch Skewness oder Schiefemaß genannt
- Moment: Basiert auf dem dritten standardisierten Moment
- Eigenschaft: Zeigt Richtung und Stärke der Asymmetrie
- Anwendung: Verteilungsanalyse, Datenqualität, Modellwahl
- Interpretation: Negativ, null oder positiv
Arten der Schiefe
Je nach Vorzeichen unterscheidet man drei Arten von Schiefe:
Linksschiefe
g < 0: Der linke Schwanz der Verteilung ist länger als der rechte.
Der Modus liegt rechts vom Mittelwert.
Beispiel: Sterbealter in entwickelten Ländern
Symmetrisch
g ≈ 0: Die Verteilung ist symmetrisch. Mittelwert, Median und Modus fallen zusammen.
Beispiel: Normalverteilung, Körpergröße
Rechtsschiefe
g > 0: Der rechte Schwanz der Verteilung ist länger als der linke.
Der Modus liegt links vom Mittelwert.
Beispiel: Einkommen, Vermögen
Anwendungen der Schiefe
Die Schiefe wird in vielen Bereichen verwendet:
Datenanalyse und Statistik
- Verteilungsform bestimmen
- Normalitätsprüfung (Normalverteilung hat g = 0)
- Modellwahl (z.B. Log-Normalverteilung bei Rechtsschiefe)
- Ausreißererkennung (extreme Schiefe deutet auf Ausreißer)
Wirtschaft und Finanzen
- Einkommensverteilung (meist rechtsschief)
- Renditeverteilung von Aktien
- Risikoanalyse (asymmetrisches Risiko)
- Vermögensverteilung
Formeln zur Berechnung der Schiefe
Stichproben-Schiefe (g)
Biased estimator - für deskriptive Statistik
Populations-Schiefe (G) - korrigiert
Unbiased estimator - für inferentielle Statistik
Alternatives Formel mit Momenten
m₃ = drittes zentrales Moment
Beziehung zu Lagemaßen
Pearson-Schiefe (Approximation)
Symbolerklärungen
| \(g\) | Stichproben-Schiefe |
| \(G\) | Populations-Schiefe |
| \(x_i\) | Einzelner Datenwert |
| \(\overline{x}\) | Arithmetisches Mittel |
| \(s\) | Standardabweichung |
| \(n\) | Anzahl der Werte |
Beispielrechnungen für die Schiefe
Beispiel 1: Nahezu symmetrische Verteilung
Berechne: Schiefe der Daten
1. Mittelwert & Standardabweichung
Standardabweichung:
s ≈ 2.28
2. Z-Werte kubieren
| z₁³ = ((2-5.2)/2.28)³ ≈ -2.00 |
| z₂³ = ((5-5.2)/2.28)³ ≈ -0.01 |
| z₃³ = ((8-5.2)/2.28)³ ≈ 1.77 |
| z₄³ = ((7-5.2)/2.28)³ ≈ 0.99 |
| z₅³ = ((4-5.2)/2.28)³ ≈ -0.34 |
3. Schiefe berechnen
Summe: 0.41
\[g = \frac{0.41}{5} \approx \color{blue}{0.08}\]
Interpretation:
Nahezu symmetrisch
Beispiel 2: Rechtsschiefe Verteilung (Einkommen)
Typisch für Einkommensverteilungen
Kennzahlen
| Mittelwert: | 3.6 |
| Median: | 2 |
| Modus: | 2 |
| Standardabweichung: | 3.29 |
Modus < Median < Mittelwert → Rechtsschiefe
Schiefe-Berechnung
Nach Berechnung:
g ≈ 1.83
Stark rechtsschief!
Der Wert 10 (Ausreißer nach rechts) zieht den Mittelwert stark nach rechts und erzeugt eine starke Rechtsschiefe.
Beispiel 3: Linksschiefe Verteilung (Prüfungsergebnisse)
Typisch für leichte Prüfungen
Kennzahlen
| Mittelwert: | 87.14 |
| Median: | 92 |
| Modus: | - |
| Standardabweichung: | 17.77 |
Mittelwert < Median → Linksschiefe
Schiefe-Berechnung
Nach Berechnung:
g ≈ -1.45
Stark linksschief!
Die meisten Schüler haben gute Noten (85-100), aber ein Ausreißer mit 50 Punkten zieht die Verteilung nach links. Dies ist typisch für leichte Prüfungen, bei denen die meisten gut abschneiden.
Mathematische Grundlagen der Schiefe
Die Schiefe ist ein fundamentales Maß zur Beschreibung der Form einer Verteilung und basiert auf dem dritten standardisierten Moment.
Eigenschaften der Schiefe
Die Schiefe besitzt charakteristische mathematische Eigenschaften:
- Dimensionslos: Durch Standardisierung ist die Schiefe eine reine Zahl ohne Einheit
- Drittes Moment: Basiert auf den kubischen Abweichungen vom Mittelwert
- Symmetrie: Symmetrische Verteilungen haben Schiefe = 0
- Empfindlichkeit: Sehr empfindlich gegenüber Ausreißern (kubische Gewichtung)
- Wertebereich: Theoretisch von -∞ bis +∞, praktisch meist zwischen -3 und +3
Interpretation verschiedener Werte
g < -1 oder g > 1
Stark schiefe Verteilung
Deutliche Asymmetrie
Normalverteilung unwahrscheinlich
-1 ≤ g ≤ -0.5 oder 0.5 ≤ g ≤ 1
Mäßig schiefe Verteilung
Deutlich erkennbare Asymmetrie
Abweichung von Normalverteilung
-0.5 < g < 0.5
Nahezu symmetrisch
Geringe Asymmetrie
Normalverteilung möglich
Beziehung zu Lagemaßen
Pearson-Regel (Faustregel)
Bei schiefen Verteilungen gibt es eine Beziehung zwischen Mittelwert, Median und Modus:
- Rechtsschiefe: Modus < Median < Mittelwert
- Symmetrisch: Modus = Median = Mittelwert
- Linksschiefe: Mittelwert < Median < Modus
Approximation nach Karl Pearson:
Schiefe ≈ 3 · (Mittelwert - Median) / Standardabweichung
Praktische Überlegungen
Wann Schiefe analysieren?
- Normalitätsprüfung: Voraussetzung für viele Tests
- Modellwahl: Auswahl geeigneter Verteilungen
- Datentransformation: Log-Transformation bei Rechtsschiefe
- Ausreißererkennung: Extreme Schiefe als Hinweis
- Datenqualität: Überprüfung der Datenstruktur
Vorsicht bei
- Kleine Stichproben: Schiefe instabil bei n < 30
- Ausreißern: Kubische Gewichtung verstärkt Einfluss
- Multimodale Verteilungen: Interpretation schwierig
- Gruppierte Daten: Informationsverlust
- Kategoriale Daten: Schiefe nicht sinnvoll
Stichproben- vs. Populations-Schiefe
Stichproben-Schiefe (g): Biased estimator, systematisch zu niedrig bei kleinen Stichproben. Verwendet für deskriptive Statistik zur Beschreibung der vorliegenden Daten.
Populations-Schiefe (G): Korrigierter (unbiased) Schätzer mit Faktor n/((n-1)(n-2)). Verwendet für inferentielle Statistik zur Schätzung der Populationsparameter. Bei großen Stichproben (n > 100) sind beide Werte nahezu identisch.
Zusammenfassung
Die Schiefe ist ein unverzichtbares Werkzeug zur Beschreibung der Asymmetrie von Verteilungen. Sie hilft bei der Identifikation von nicht-normalen Verteilungen, bei der Modellwahl und bei der Datenqualitätsprüfung. Eine Schiefe nahe null deutet auf eine symmetrische Verteilung hin, während stark positive oder negative Werte eine deutliche Asymmetrie anzeigen. Bei rechtsschiefen Verteilungen (häufig bei Einkommens- oder Vermögensdaten) kann eine Log-Transformation die Verteilung symmetrischer machen. Die Interpretation sollte immer im Kontext der Daten und in Verbindung mit anderen Kennzahlen (Mittelwert, Median, Standardabweichung) sowie visuellen Darstellungen (Histogramm, Boxplot) erfolgen.
|
|