Immer mal wieder taucht die Frage auf, ob zwischen zwei Größen ein Zusammenhang besteht. Das ist ein statistisches Problem, Statistik beschäftigt sich auch mit der Analyse von Zusammenhängen.
Eine Aussage über einen Zusammenhang zwischen zwei Größen erhältst Du, indem Du eine Korrelation berechnest. Dazu gehört einerseits der Korrelationskoeffizient und andererseits der p-Wert.
In diesem Beitrag geht es jedoch nur um die Berechnung des Korrelationskoeffizienten.
Excel bietet Dir dazu 4 Möglichkeiten an.
1. Die Datenbasis
In meinem Beitrag zur Excel-Funktion Standardabweichung habe ich Datenmaterial aus einer Studie zur Größe von Menschen aus 135 Nationen verwendet. [1]
Neben der Größe wurde in der Studie auch das Gewicht der Menschen dargestellt.
Für diesen Beitrag wird nun ebenfalls angenommen, dass Größe und Gewicht von jeweils zufällig ausgewählten 135 Männern und Frauen als Messwerte vorliegen.
Es soll die Frage beantwortet werden, ob zwischen der Größe und dem Gewicht ein Zusammenhang besteht.
Hier ein Auszug aus der Tabelle, die Du vollständig hier findest: KORREL
2. Die Funktion KORREL
Laut Excel-Hilfe gibt die Funktion KORREL den Korrelationskoefizienten einer zweidimensionalen Zufallsgröße zurück, deren Werte in den Zellbereichen Matrix1 und Matrix2 stehen.
Die Syntax lautet:
KORREL(Matrix1;Matrix2)
Matrix1 und Matrix2 sind erforderlich und stellen jeweils einen Zellbereich mit Werten dar.
Mit der Funktion berechnest Du jetzt den Korrelationskoeffizienten für die beiden Wertereihen Größe und Gewicht bei Männern und bei Frauen.
Männer
=KORREL(Tabelle2!C8:C142;Tabelle2!D8:D142)
=0,806264477
Frauen
=KORREL(Tabelle2!E8:E142;Tabelle2!F8:F142)
=0,625397738
Ein Korrelationskieffizient bewegt sich zwischen -1 und +1, das ist bei beiden Berechnungen der Fall.
Deine berechneten Werte zeigen mit rund 0,8 bzw. 0,6 jeweils einen positiven Zusammenhang, der bei Männern etwas stärker ist als bei Frauen.
Die folgenden Diagramme zeigen die Konzentration der Werte und jeweils eine lineare Trendlinie.
Zu erkennen ist, dass bei einigen Größen eine recht große Streuung vorliegt.
Dennoch ist allgemein ein Zusammenhang zwischen Größe und Gewicht erkennbar.
3. Die Funktion PEARSON
Excel bietet mit PEARSON eine zweite Funktion zur Berechnung eines Korrelationskoeffizienten an.
Laut Excel-Hilfe gibt die Funktion den Pearsonschen Korrelationskoeffizienten r zurück. Dieser Koeffizient ist ein Maß dafür, inwieweit zwischen zwei Datensätzen eine lineare Abhängigkeit besteht. Nichts anderes macht auch KORREL.
Die Syntax ist ähnlich der von KORREL.
PEARSON(Matrix1;Matrix2)
Dabei ist Matrix1 eine Reihe unabhängiger Werte und Matrix2 eine Reihe abhängiger Werte.
Verwende die Funktion so:
Männer
=PEARSON(Tabelle2!C8:C142;Tabelle2!D8:D142)
=0,806264477
Frauen
=PEARSON(Tabelle2!E8:E142;Tabelle2!F8:F142)
=0,625397738
Die Ergebnisse sind mit denen aus der Berechnung mit KORREL erzielten identisch.
Warum gibt es aber diese zweite Funktion, die ein gleiches Ergebnis errechnet?
Dazu ist im Support von Microsoft zu erfahren, dass bei Verwendung von PEARSON in Excel-Versionen vor 2003 Rundungsfehler auftreten können. Deshalb wird generell die Nutzung von KORREL empfohlen.
4. Die Funktion BESTIMMTHEITSMASS
Wenn Du Dich erinnerst, vor längerer Zeit konntest Du hier im Blog einen Beitrag über diese Funktion lesen.
Das Bestimmtheitsmass ist das Quadrat des Korrelationskoeffizienten.
Folglich ist der Korrelationskoeffizient die Wurzel aus dem Bestimmtheitsmass.
Schreibe die Formel so:
Männer
=WURZEL(BESTIMMTHEITSMASS(Tabelle2!D8:D142;Tabelle2!C8:C142))
=0,806264477
Frauen
=WURZEL(BESTIMMTHEITSMASS(Tabelle2!F8:F142;Tabelle2!E8:E142))
=0,625397738
Die Ergebnisse entsprechen wiederum denen aus den Abschnitten 2 und 3.
5. Die Analysefunktion KORRELATION
Im Menü Daten/Analyse/Datenanalyse findest Du die Funktion KORRELATION.
Rufe sie auf und fülle die Abfrage so aus:
Männer
Ergebnis: 0,806264477
Was kannst Du nun daraus entnehmen?
Der Korrelationskoeffizient zwischen Spalte 2 und Spalte 1 beträgt 0,788477642.
Frauen
Ergebnis: 0,625397738
Die Ergebnisse aus der Analysefunktion entsprechen ebenfalls denen aus den Abschnitten 2 und 3.
6. Zusammenfassung
Du hast jetzt 4 Möglichkeiten in Excel kennengelernt, einen Korrelationskoeffizienten zu berechnen.
Eingangs habe ich erwähnt, dass zur Korrelation auch noch der p-Wert gehört.
Vielleicht hast Du Lust, diesen zu berechnen? Excel bietet Dir dafür die Funktion TVERT an.
Zum Thema empfehle ich unbedingt die professionellen Seiten von Statistikexpertin Daniela Keller [2].
Ein sehr schönes Beispiel zur Funktion KORREL ist bei Pia Bork zu finden [3].
Und merke: Korrelation bedeutet nicht Kausalität.
Quellen:
[1] https://www.laenderdaten.info/durchschnittliche-koerpergroessen.php
[2] http://www.statistik-und-beratung.de/2013/05/Analyse-von-zusammenhangen-korrelation/
[3] http://bork-blog.de/archive/6478
Entdecke mehr von Clevercalcul
Melde dich für ein Abonnement an, um die neuesten Beiträge per E-Mail zu erhalten.
Danke für deinen Tipp ! Ich mag deine Beiträge sehr !! 🙂
Danke, Silvie, das freut mich sehr.