In diesem Artikel zeigen wir, wie sich eine Korrelationsanalyse in R berechnen lässt.

Die Daten

Die Analysen erfolgen an dem systeminternen Datensatz iris aus dem Paket datasets. Dieses wird mit library(datasets) geladen.

Korrelationsanalyse in R

Den Datensatz laden wir dann in R durch data(iris).

Korrelationsanalyse in R

Der Datensatz umfasst Daten zu jeweils 50 Blumen aus drei verschiedenen Spezien der Iris. Er beinhaltet dabei die Variablen Kelchblattlänge, Kelchblattbreite, Blütenblattlänge, Blütenblattbreite und Spezies. Wir möchten den Zusammenhang zwischen Blüten- und Kelchblattlänge einer Pflanze untersuchen.

Die Analyse

Die beiden Merkmale Blüten- und Kelchblattlänge sind metrischskaliert. Somit kann die Pearson Korrelation geeignet sein. Da eine Korrelation nach Pearson anfällig auf Ausreißer ist, lohnt es sich den Zusammenhang grafisch zu untersuchen. Ein Streudiagramm erhalten wir in R über die Funktion plot().

Korrelationsanalyse in R

Obiger Befehl ergibt dann das folgende Streudiagramm.

Korrelationsanalyse in R

Es zeigt sich, dass mit steigender Kelchblattlänge auch die Blütenlänge anzusteigen scheint. Eess sind dabei keine extremen Beobaxhtungen erkennbar. Somit sollten keine Ausreißer vorliegen. Die Pearson Korrelation kann genutzt werden. Wir erhalten in R mit der Funktion cor.test aus dem Paket stats die Pearson-Korrelation samt Signifikanztest.

Korrelationsanalyse in R

Wir sehen die Korrelation zwischen Kelchblattlänge und Blütenlänge betrug r = 0,87. Sie ist nach Cohen stark positiv. Weiterhin ist die Korrelation signifikant von Null verschieden, p = 0,000.

Sie haben noch Fragen zur Statistik-Beratung oder anderen Leistungen?

Sie erreichen die Mehr als Durchschnitt Statistikberatung über das Kontaktformular, telefonisch unter +49 152 2269 1443 oder per Mail . Mehr als Durchschnitt freut sich auf Ihre Anfrage.