Bray-Curtis Distanz

Rechner zur Berechnung der Bray-Curtis Distanz mit ausführlichen Formeln und Beispielen

Bray-Curtis Distanz Rechner

Was wird berechnet?

Die Bray-Curtis Distanz ist ein Maß für die Ähnlichkeit zwischen zwei Vektoren. Sie normalisiert die Manhattan-Distanz durch die Summe beider Vektoren und wird häufig in der Ökologie und Bioinformatik verwendet.

Eingabevektoren

Werte durch Leerzeichen getrennt

Gleiche Anzahl Werte wie Vektor X

Ergebnis
Bray-Curtis Distanz:
Werte zwischen 0 (identisch) und 1 (völlig verschieden)

Bray-Curtis Info

Eigenschaften

Bray-Curtis Distanz:

  • Wertebereich: [0, 1]
  • 0 = identische Vektoren
  • 1 = völlig verschiedene Vektoren
  • Normalisierte Manhattan-Distanz

Anwendung: Häufig verwendet in der Ökologie zur Analyse von Artengemeinschaften und in der Bioinformatik für Genexpressionsvergleiche.

Spezielle Fälle
Identische Vektoren:
BC([1,2,3], [1,2,3]) = 0
Null-Vektor:
BC([0,0,0], [1,2,3]) = 1
Proportionale Vektoren:
BC([1,2], [2,4]) = 0

Formeln der Bray-Curtis Distanz

Grundformel
\[BC(x,y) = \frac{\sum_{i=1}^n |x_i - y_i|}{\sum_{i=1}^n (x_i + y_i)}\] Standard Bray-Curtis Distanz
Alternative Schreibweise
\[BC(x,y) = \frac{d_{Manhattan}(x,y)}{||x||_1 + ||y||_1}\] Normalisierte Manhattan-Distanz
Ähnlichkeitsindex
\[S_{BC}(x,y) = 1 - BC(x,y)\] Bray-Curtis Ähnlichkeit
Sørensen-Dice Bezug
\[BC = 1 - \frac{2\sum \min(x_i, y_i)}{\sum (x_i + y_i)}\] Verwandt mit Sørensen-Dice
Wertebereich
\[0 \leq BC(x,y) \leq 1\] Normalisierte Distanz
Symmetrie
\[BC(x,y) = BC(y,x)\] Symmetrische Eigenschaft

Detailliertes Rechenbeispiel

Beispiel: BC([0,3,4,5], [7,6,3,-1]) berechnen

Gegeben:

  • x = [0, 3, 4, 5]
  • y = [7, 6, 3, -1]

Schritt 1 - Differenzen:

\[|0-7| + |3-6| + |4-3| + |5-(-1)|\] \[= 7 + 3 + 1 + 6 = 17\]

Schritt 2 - Summen:

\[\sum x_i = 0+3+4+5 = 12\] \[\sum y_i = 7+6+3+(-1) = 15\] \[\sum(x_i + y_i) = 27\]

Schritt 3 - Endergebnis:

\[BC = \frac{17}{27} = 0.6296\]

Interpretation: Die Vektoren sind zu 63% verschieden (relativ hohe Distanz).

Ökologisches Anwendungsbeispiel

Beispiel: Vergleich von Artengemeinschaften

Standort A:

Eiche: 20 Individuen
Buche: 15 Individuen
Fichte: 5 Individuen
Kiefer: 10 Individuen

Standort B:

Eiche: 10 Individuen
Buche: 25 Individuen
Fichte: 8 Individuen
Kiefer: 7 Individuen

Berechnung:

\[BC = \frac{|20-10|+|15-25|+|5-8|+|10-7|}{(20+10)+(15+25)+(5+8)+(10+7)} = \frac{26}{100} = 0.26\]

Ergebnis: Die Standorte haben eine relativ ähnliche Artenzusammensetzung (BC = 0.26).

Vergleich mit anderen Distanzmaßen

Für die Vektoren [1,2,3] und [2,4,6]
Bray-Curtis
0.000

Proportionale Vektoren = identisch

Euklidisch
3.742

Berücksichtigt Größenunterschiede

Manhattan
9.000

Absolute Differenzen

Kosinus
0.000

Richtungsbasiert

Besonderheit: Bray-Curtis und Kosinus-Distanz erkennen proportionale Vektoren als identisch, während euklidische und Manhattan-Distanz die Größenunterschiede berücksichtigen.

Mathematische Eigenschaften

Metrische Eigenschaften
  • Nicht-Negativität: BC(x,y) ≥ 0
  • Symmetrie: BC(x,y) = BC(y,x)
  • Identität: BC(x,x) = 0
  • Dreiecksungleichung: Erfüllt nicht immer
Spezielle Eigenschaften
  • Normalisierung: Wertebereich [0,1]
  • Skalierungsinvariant: Für proportionale Vektoren
  • Robust: Gegen Ausreißer in der Summe
  • Interpretierbar: Als Anteil der Verschiedenheit
Wichtige Hinweise

Empfindlichkeit: Bei vielen Nullwerten kann die Distanz instabil werden

Alternative: Für sparse Daten die Canberra-Distanz verwenden

Praktische Anwendungen

Ökologie
  • Vergleich von Artengemeinschaften
  • Biodiversitätsanalysen
  • Habitatähnlichkeit
  • Vegetationsvergleiche
Bioinformatik
  • Genexpressionsvergleiche
  • Mikrobiom-Analysen
  • Phylogenetische Distanzen
  • Proteinsequenzvergleiche
Data Science
  • Dokumentenähnlichkeit
  • Empfehlungssysteme
  • Clustering-Algorithmen
  • Anomalieerkennung