Kosinus Ähnlichkeit
Rechner zur Berechnung der Kosinus Ähnlichkeit mit ausführlichen Formeln und Beispielen
Kosinus Ähnlichkeit Rechner
Was wird berechnet?
Die Kosinus Ähnlichkeit misst die Ähnlichkeit zwischen zwei Vektoren über den Kosinus des Winkels zwischen ihnen. Werte nahe 1 bedeuten hohe Ähnlichkeit, nahe 0 Orthogonalität.
Kosinus Info
Eigenschaften
Kosinus Ähnlichkeit:
- Wertebereich: [-1, 1]
- 1 = identische Richtung
- 0 = orthogonale Vektoren
- -1 = entgegengesetzte Richtung
Richtungsbasiert: Die Magnitude (Länge) der Vektoren wird ignoriert - nur die Richtung zählt.
Spezielle Fälle
cos(0°) = 1 (maximale Ähnlichkeit)
cos(90°) = 0 (keine Ähnlichkeit)
cos(180°) = -1 (gegensätzlich)
Verwandte Maße
→ Euklidische Distanz
→ Korrelationskoeffizient
→ Manhattan Distanz
|
|
Formeln der Kosinus Ähnlichkeit
Ähnlichkeitsformel
Distanzformel
Skalarprodukt
Euklidische Norm
Winkelbeziehung
Normierte Vektoren
Detailliertes Rechenbeispiel
Beispiel: Kosinus([3,5], [0,3]) berechnen
Gegeben:
- x = [3, 5]
- y = [0, 3]
Schritt 1 - Skalarprodukt:
Schritt 2 - Normen:
Schritt 3 - Ähnlichkeit:
Schritt 4 - Kosinus Distanz:
Interpretation: Die Vektoren haben einen Winkel von ca. 31° und sind relativ ähnlich (geringe Distanz).
Textanalyse-Beispiel
Beispiel: Dokumentenähnlichkeit mit TF-IDF
Dokument A:
"Katze sitzt auf Matte"
TF-IDF: [0.5, 0.3, 0.2, 0.0, 0.0]
Dokument B:
"Hund liegt auf Sofa"
TF-IDF: [0.0, 0.0, 0.3, 0.4, 0.3]
Berechnung:
Ergebnis: Niedrige Ähnlichkeit wegen wenig gemeinsamer Begriffe (nur "auf").
Geometrische Interpretation
Winkel und Ähnlichkeit
0° (parallel)
Identische Richtung
45°
Hohe Ähnlichkeit
90° (orthogonal)
Keine Ähnlichkeit
180° (antiparallel)
Entgegengesetzt
Wichtig: Die Kosinus Ähnlichkeit ignoriert die Länge der Vektoren und konzentriert sich nur auf die Richtung.
Praktische Anwendungen
Information Retrieval
- Dokumentenähnlichkeit
- Suchmaschinen-Ranking
- TF-IDF Vergleiche
- Semantische Suche
Empfehlungssysteme
- User-Item Matrizen
- Kollaborative Filterung
- Produktempfehlungen
- Netflix-Algorithmus
Machine Learning
- Feature-Vergleiche
- Clustering-Algorithmen
- Neuronale Netze
- Similarity Learning
Mathematische Eigenschaften
Ähnlichkeitseigenschaften
- Wertebereich: [-1, 1]
- Symmetrie: sim(x,y) = sim(y,x)
- Selbstähnlichkeit: sim(x,x) = 1
- Richtungsbasiert: Ignoriert Magnitude
Geometrische Eigenschaften
- Winkelmaß: Kosinus des eingeschlossenen Winkels
- Projektionsbasiert: Verwendung des Skalarprodukts
- Normierungsinvariant: Unabhängig von Vektorlängen
- Linearität: Bezüglich Skalarprodukt
Wichtige Hinweise
Null-Vektoren: Kosinus ist undefiniert, wenn einer der Vektoren der Nullvektor ist
Skalierung: Multiplizieren mit positiven Skalaren ändert die Ähnlichkeit nicht
Vergleich: Kosinus vs. Pearson Korrelation
Für die Vektoren [1,2,3] und [2,4,6]
Kosinus Ähnlichkeit:
Identische Richtung (perfekte Ähnlichkeit)
Pearson Korrelation:
Perfekte lineare Korrelation
Unterschied: Kosinus ignoriert den Mittelwert, während Pearson die Abweichung vom Mittelwert berücksichtigt.