Pearson Korrelationskoeffizient
Rechner zur Berechnung des linearen Zusammenhangs mit ausführlichen Formeln und Beispielen
Korrelationskoeffizient Rechner
Was wird berechnet?
Der Pearson Korrelationskoeffizient misst die Stärke des linearen Zusammenhangs zwischen zwei Variablen. Werte zwischen -1 und +1 zeigen negative bis positive Korrelation an.
Korrelation Info
Eigenschaften
Pearson Korrelation:
- Wertebereich: [-1, +1]
- +1 = perfekte positive Korrelation
- 0 = keine lineare Korrelation
- -1 = perfekte negative Korrelation
Linear: Misst nur lineare Zusammenhänge, nicht gekrümmte oder andere nichtlineare Beziehungen.
Interpretation
Verwandte Maße
→ Kosinus Ähnlichkeit
Spearman Rank: Für nichtlineare Zusammenhänge
Kendall Tau: Robust gegen Ausreißer
Formeln des Pearson Korrelationskoeffizienten
Grundformel
Kovarianz-Form
Computational Formula
Z-Score Form
Bestimmtheitsmaß
Fishers Z-Transformation
Detailliertes Rechenbeispiel
Beispiel: Korrelation([1,2,3,4,5], [2,4,6,8,10]) berechnen
Gegeben:
- X = [1, 2, 3, 4, 5]
- Y = [2, 4, 6, 8, 10]
- n = 5
Schritt 1 - Mittelwerte:
Schritt 2 - Abweichungen:
Schritt 3 - Korrelation:
Interpretation: Perfekte positive Korrelation (r = 1.0), da Y = 2X für alle Datenpunkte.
Realistisches Beispiel
Beispiel: Temperatur vs. Eisverkauf
Daten:
Temperatur (°C): [20, 22, 25, 28, 30]
Eisverkauf (€): [150, 180, 220, 280, 320]
Berechnung:
Interpretation:
R² = 0.96 → 96% der Varianz im Eisverkauf wird durch die Temperatur erklärt
Korrelation ≠ Kausalität
Wichtiger Hinweis: Correlation is not Causation
Beispiel - Scheinkorrelation:
Variable A: Anzahl Störche
Variable B: Geburtenrate
Korrelation: r = 0.62 (moderat positiv)
Erklärung:
Drittvariable: Ländliche vs. städtische Gebiete
Störche und höhere Geburtenraten kommen beide häufiger in ländlichen Gebieten vor.
Fazit: Eine hohe Korrelation bedeutet nicht automatisch, dass eine Variable die andere verursacht. Immer nach möglichen Drittvariablen oder alternativen Erklärungen suchen!
Praktische Anwendungen
Statistik & Forschung
- Validierung von Hypothesen
- Explorative Datenanalyse
- Variablenselektion
- Multikollinearität prüfen
Finanzwesen
- Portfolio-Diversifikation
- Asset-Korrelationen
- Risikomanagement
- Hedging-Strategien
Machine Learning
- Feature Selection
- Dimensionsreduktion
- Preprocessing-Schritt
- Modell-Evaluation
Mathematische Eigenschaften
Grundeigenschaften
- Wertebereich: -1 ≤ r ≤ +1
- Symmetrie: r(X,Y) = r(Y,X)
- Lineare Transformation: Invariant unter affinen Transformationen
- Dimensionslos: Unabhängig von Einheiten
Statistische Eigenschaften
- Linearität: Nur lineare Zusammenhänge
- Ausreißerempfindlich: Empfindlich gegenüber Extremwerten
- Normalverteilung: Teststatistiken bei Normalverteilung
- Effektgröße: Maß für praktische Bedeutsamkeit
Voraussetzungen
Datentyp: Mindestens intervallskalierte Daten
Verteilung: Für Tests: bivariate Normalverteilung
Interpretationsleitfaden
Korrelationsstärke nach Cohen (1988)
Positive Korrelationen:
Negative Korrelationen:
Hinweis: Diese Einteilung ist kontextabhängig. In manchen Bereichen (z.B. Psychologie) gelten andere Standards.