Korrelationskoeffizient berechnen: Formel & Anleitung

- Der Korrelationskoeffizient misst die Stärke und Richtung linearer Zusammenhänge zwischen zwei metrischen Variablen, wobei Werte zwischen -1 und +1 möglich sind.
- Die Berechnung des Pearson-Korrelationskoeffizienten erfolgt durch eine Formel, die Abweichungen vom Mittelwert berücksichtigt, während alternative Koeffizienten wie Spearman und Kendall für nicht-lineare oder ordinale Daten geeignet sind.
- Korrelation impliziert nicht Kausalität, da ein statistischer Zusammenhang durch Scheinkorrelationen oder Drittvariablen beeinflusst sein kann und für aussagekräftige Analysen ausreichende Stichprobengrößen notwendig sind.
Ob beim Analysieren von Aktienkursen, beim Untersuchen von Verkaufszahlen oder beim Verstehen wirtschaftlicher Zusammenhänge – der Korrelationskoeffizient ist ein unverzichtbares Werkzeug für angehende Wirtschaftswissenschaftler. Dieses statistische Maß zeigt dir auf einen Blick, wie stark zwei Variablen miteinander zusammenhängen und in welche Richtung sich dieser Zusammenhang bewegt. Doch wie berechnest du die Korrelation richtig? Welche Fallstricke lauern bei der Interpretation? Und wann ist eine Korrelationsanalyse überhaupt sinnvoll?
Mehr Übungen und Lernkarten findest du hier: https://www.wiwi-lernkarten.de/kurse
Was ist ein Korrelationskoeffizient und warum ist er wichtig?
Der Korrelationskoeffizient ist ein dimensionsloses Maß, das die Stärke und Richtung eines linearen Zusammenhangs zwischen zwei metrischen Variablen angibt. Der am häufigsten verwendete Korrelationskoeffizient ist der Pearson-Korrelationskoeffizient (r), der Werte zwischen -1 und +1 annehmen kann.
Merke: Ein Korrelationskoeffizient von +1 bedeutet perfekte positive Korrelation, -1 perfekte negative Korrelation und 0 keinen linearen Zusammenhang.
Bedeutung der Korrelationswerte
| Korrelationswert | Interpretation | Beispiel | 
|---|---|---|
| r = 1,0 | Perfekte positive Korrelation | Umsatz steigt exakt proportional zu Werbeausgaben | 
| 0,7 ≤ r < 1,0 | Starke positive Korrelation | Bildungsniveau und Einkommen | 
| 0,3 ≤ r < 0,7 | Mittlere positive Korrelation | Temperatur und Eisverkauf | 
| 0,1 ≤ r < 0,3 | Schwache positive Korrelation | Körpergröße und Schuhgröße | 
| r = 0 | Keine lineare Korrelation | Zufällige Variablen | 
| -0,3 < r ≤ -0,1 | Schwache negative Korrelation | Preis und Nachfrage | 
| -0,7 < r ≤ -0,3 | Mittlere negative Korrelation | Arbeitslosigkeit und Konsumausgaben | 
| r = -1,0 | Perfekte negative Korrelation | Angebot steigt, Preis fällt exakt proportional | 
Wie berechnet man den Pearson-Korrelationskoeffizienten?
Die Formel für den Pearson-Korrelationskoeffizienten lautet:
r = Σ[(xi - x̄)(yi - ȳ)] / √[Σ(xi - x̄)² × Σ(yi - ȳ)²]
Wobei:
- xi, yi = einzelne Datenpunkte
- x̄, ȳ = Mittelwerte der Variablen
- Σ = Summe aller Werte
Schritt-für-Schritt Berechnung
Praxisbeispiel: Zusammenhang zwischen Werbeausgaben (in 1000€) und Umsatz (in 10000€)
Ein Unternehmen möchte wissen, ob höhere Werbeausgaben zu mehr Umsatz führen. Daten aus 5 Quartalen:
Quartal 1: Werbung 10, Umsatz 25 Quartal 2: Werbung 15, Umsatz 30 Quartal 3: Werbung 20, Umsatz 35 Quartal 4: Werbung 25, Umsatz 40 Quartal 5: Werbung 30, Umsatz 45
Schritt 1: Mittelwerte berechnen
- x̄ (Werbung) = (10+15+20+25+30)/5 = 20
- ȳ (Umsatz) = (25+30+35+40+45)/5 = 35
Schritt 2: Abweichungen vom Mittelwert
- (xi - x̄): -10, -5, 0, 5, 10
- (yi - ȳ): -10, -5, 0, 5, 10
Schritt 3: Produkte und Quadrate berechnen
- Σ[(xi - x̄)(yi - ȳ)] = 100 + 25 + 0 + 25 + 100 = 250
- Σ(xi - x̄)² = 100 + 25 + 0 + 25 + 100 = 250
- Σ(yi - ȳ)² = 100 + 25 + 0 + 25 + 100 = 250
Schritt 4: Korrelationskoeffizient berechnen r = 250 / √(250 × 250) = 250 / 250 = 1,0
Prüfungstipp: Überprüfe immer, ob dein Ergebnis zwischen -1 und +1 liegt. Werte außerhalb dieses Bereichs deuten auf Rechenfehler hin.
Welche Arten von Korrelationskoeffizienten gibt es?
Pearson-Korrelationskoeffizient
- Anwendung: Metrische Variablen mit linearem Zusammenhang
- Voraussetzungen: Normalverteilung, lineare Beziehung, keine Ausreißer
- Beispiel: Zusammenhang zwischen BIP und Staatsausgaben
Spearman-Rangkorrelationskoeffizient
- Anwendung: Ordinale Daten oder nicht-lineare monotone Zusammenhänge
- Vorteil: Robust gegen Ausreißer
- Beispiel: Zusammenhang zwischen Schulnoten und Studienplatzrang
Kendall-Tau
- Anwendung: Kleine Stichproben, viele gleiche Ränge
- Besonderheit: Konservativere Schätzung als Spearman
- Beispiel: Bewertung von Produktqualität durch Experten
Merke: Bei ordinal skalierten Daten oder nicht-normalverteilten Variablen solltest du Rangkorrelationen verwenden.
Wie interpretiert man Korrelationsergebnisse richtig?
Häufige Interpretationsfehler
Die richtige Interpretation von Korrelationen erfordert Vorsicht. Statistische Analysen zeigen, dass falsche Kausalitätsschlüsse zu den häufigsten Fehlern in empirischen Untersuchungen gehören.
Prüfungstipp: "Korrelation impliziert nicht Kausalität" ist ein Klassiker in Statistik-Klausuren. Merke dir: Ein hoher Korrelationskoeffizient beweist noch keinen ursächlichen Zusammenhang!
Scheinkorrelationen erkennen
Beispiel für Scheinkorrelation: Die Anzahl der Störche und die Geburtenrate in europäischen Ländern korrelieren positiv. Ursache ist jedoch die Bevölkerungsdichte – mehr Menschen bedeuten mehr Geburten UND mehr bebaute Flächen, die Störche anziehen.
Einfluss von Ausreißern
Ausreißer können den Pearson-Korrelationskoeffizienten stark verzerren. Bei der OECD-Analyse von Wirtschaftsdaten werden daher systematisch Robustheitstests durchgeführt.
Praxistipp: Erstelle immer ein Streudiagramm, um Ausreißer und nicht-lineare Zusammenhänge zu identifizieren.
Wann ist eine Korrelationsanalyse sinnvoll?
Voraussetzungen für aussagekräftige Korrelationen
- Ausreichende Stichprobengröße: Mindestens 30 Beobachtungen für stabile Ergebnisse
- Metrische Skalierung: Beide Variablen sollten mindestens intervallskaliert sein
- Linearität: Der Zusammenhang sollte linear sein (für Pearson-Korrelation)
- Keine extremen Ausreißer: Diese können das Ergebnis stark verfälschen
Anwendungsbereiche in der Wirtschaft
- Finanzanalyse: Korrelation zwischen Aktienrenditen für Portfoliodiversifikation
- Marketing: Zusammenhang zwischen Werbeausgaben und Absatz
- Personalwesen: Beziehung zwischen Mitarbeiterzufriedenheit und Produktivität
- Marktforschung: Korrelation zwischen Preis und Nachfrage
Du möchtest dein Verständnis vertiefen? Weitere Übungsaufgaben und detaillierte Lernkarten zu statistischen Verfahren findest du hier: https://www.wiwi-lernkarten.de/kurse
Welche Software-Tools helfen bei der Berechnung?
Excel und Google Sheets
- Funktion: =KORREL(Array1;Array2)
- Vorteil: Einfache Handhabung, weit verbreitet
- Nachteil: Begrenzte statistische Funktionen
SPSS
- Befehl: Analyze → Correlate → Bivariate
- Vorteil: Umfassende Statistikfunktionen, Signifikanztests
- Verwendung: Professionelle Datenanalyse in Unternehmen
R und Python
- R: cor(x, y)
- Python: scipy.stats.pearsonr(x, y)
- Vorteil: Kostenlos, sehr mächtig, reproduzierbare Analysen
Prüfungstipp: In Klausuren wird oft die manuelle Berechnung verlangt. Übe daher die Formel auswendig zu können und schnell anzuwenden.
Wie testet man die Signifikanz einer Korrelation?
T-Test für Korrelationskoeffizienten
Die Nullhypothese lautet: H₀: ρ = 0 (keine Korrelation in der Grundgesamtheit)
Teststatistik: t = r × √[(n-2)/(1-r²)]
Mit df = n-2 Freiheitsgraden
Interpretation der p-Werte
- p < 0,05: Signifikante Korrelation (95% Konfidenz)
- p < 0,01: Hochsignifikante Korrelation (99% Konfidenz)
- p ≥ 0,05: Keine signifikante Korrelation nachweisbar
Merke: Eine statistisch signifikante Korrelation muss nicht praktisch relevant sein. Bei sehr großen Stichproben werden auch schwache Korrelationen signifikant.
FAQ - Häufig gestellte Fragen
Was bedeutet ein Korrelationskoeffizient von 0,5?
Ein Korrelationskoeffizient von 0,5 zeigt eine mittlere positive Korrelation an. Die Variablen bewegen sich tendenziell in die gleiche Richtung, aber der Zusammenhang ist nicht perfekt. Etwa 25% der Varianz einer Variable kann durch die andere erklärt werden (r² = 0,25).
Kann eine Korrelation von 0 trotzdem einen Zusammenhang bedeuten?
Ja, eine Korrelation von 0 bedeutet nur, dass kein linearer Zusammenhang besteht. Es können durchaus nicht-lineare Beziehungen existieren, wie bei U-förmigen oder S-förmigen Kurven. Daher ist die grafische Darstellung der Daten essentiell.
Warum ist Korrelation nicht gleich Kausalität?
Korrelation misst nur das gemeinsame Auftreten von Veränderungen, nicht deren Ursache. Drei Erklärungen sind möglich: X verursacht Y, Y verursacht X, oder eine dritte Variable Z beeinflusst beide. Für Kausalität braucht es zusätzliche Evidenz.
Welcher Korrelationskoeffizient ist besser: Pearson oder Spearman?
Das hängt von deinen Daten ab. Pearson eignet sich für normalverteilte, metrische Daten mit linearen Zusammenhängen. Spearman ist robuster bei Ausreißern und funktioniert auch bei ordinalen Daten oder monotonen, nicht-linearen Beziehungen.
Wie groß sollte die Stichprobe für eine Korrelationsanalyse sein?
Für stabile Ergebnisse werden mindestens 30 Beobachtungen empfohlen, besser sind 50 oder mehr. Bei kleineren Stichproben sind die Ergebnisse weniger zuverlässig und können stark durch einzelne Datenpunkte beeinflusst werden.
Die Korrelationsanalyse ist ein mächtiges Werkzeug im Statistik-Toolkit jedes Wirtschaftswissenschaftlers. Mit dem richtigen Verständnis für Berechnung, Interpretation und Grenzen dieser Methode bist du bestens gerüstet für Studium und Berufspraxis. Denke immer daran: Korrelationen zeigen Muster auf, aber die Suche nach Ursachen erfordert tiefergehende Analysen und theoretisches Verständnis der zugrundeliegenden Zusammenhänge.