Korelacje

Korelacja oznacza związek pomiędzy, najczęściej, dwoma zmiennymi.

Analiza korelacji to jedne z najprostszych i najłatwiejszych do zobrazowania, zrozumienia i przygotowania porównań. Niestety dla niedoświadczonych osób może dojść do wielu błędnych interpretacji lub do przewartościowania niesionej przez porównania informacji.

Korelacje służą do sprawdzenia czy zachodzi związek (zależność) pomiędzy dwiema zmiennymi (parametrami, wynikami, właściwościami, cechami).
Co oznacza związek (zależność)? Należy to rozumieć jako podobieństwa w zmianach np. dwóch analizowanych cech. Gdy jedna cecha, właściwość wzrasta to druga jest od niej również zależna? Związki te mogą być proporcjonalne (dodatnie) - gdy obie zmienne rosną oraz odwrotnie proporcjonalne (ujemne) - gdy jedna cecha rośnie a druga maleje. Graficzną interpretacją współczynnika korelacji jest wykres rozrzutu.

Analiza korelacji dostarcza nam głównie trzech informacji:

  • czy wynik jest istotny statystycznie?
  • jaka jest siła związku?
  • jaki jest kierunek związku?

Odpowiedź dla pierwszego pytania: Jeżeli związek jest istotny statystycznie to należy stwierdzić, że między zmiennymi zachodzi związek (zależność).

Siła związku to wartość współczynnika korelacji: Jest ona określana jako wartość w przedziale od -1 do 1. Im współczynnik jest "dalej" od 0 (zarówno na plus jak i na minus) tym siła związku jest większa.

Kierunek związku (tego czy jest on proporcjonalny czy odwrotnie proporcjonalny) zależy od znaku przy współczynniku korelacji. Jeżeli współczynnik korelacji jest dodatni to wzrostowi jednej zmiennej towarzyszy wzrost drugiej zmienne, gdy jest ujemny, jedna zmienna rośnie a druga maleje.

Przykłady:

  • Wraz ze wzrostem ludzi ich masa ciała rośnie, świadczy to o dodatnim związku między analizowanymi cechami.
  • Wraz z wzrostem ilości dni treningu osoba odchudzająca zmniejsza swoją masę ciała świadczy to o ujemnym związku między analizowanymi cechami

Teraz trochę kuchni 🙂

Problem badawczy: Czy spożyciu słodyczy towarzyszy wzrost stężenia glukozy w krwi na przestrzeni czasu?
Przeprowadzono próbę na pacjentach podając im różną ilość czekolady do spożycia w gramach [g] (w przedziale od 13 do 20 gram), a następnie wykonano pomiary stężenie glukozy w krwi w miligramach na decylitr krwi [mg/dl], po około 5 minutach, 15 minutach oraz 60 minutach.

Wyniki poddano analizie korelacji (o sposobach doboru testu i typach testów przeczytaj tu). Analiza stężenia glukozy we krwi w stosunku do ilości spożytej czekolady nie daje nam istotnego statystycznie związku (?), za to występuje istotna statystycznie korelacja na wysokim poziomie stężenia glukozy do czasu (R=0,0927 oraz p<0,05). Wyniki rozrzutu przedstawiono na poniższych wykresach.

Wykres rozrzutu Ilość czekolady względem Stężenie glukozy Wykres rozrzutu Czas względem Stężenie glukozy

 

Wykres powierzchniowy 3W Stężenie glukozy względem Czas i Ilość czekoladyDociekliwy badacz zacznie się zastanawiać nad tym dlaczego ilość spożytej czekolady nie ma wpływu na stężenie glukozy, i dlaczego wyniki nie są istotne statystyczne?

W poniższym przypadku stężenie glukozy we krwi nie zależy jedynie od czasu który minął od spożycia czekolady ale również od jej ilości. Zatem pełna analiza powinna uwzględnia wszystkie 3 zmienne. Przeprowadzona w ten sposób analiza korelacji wielowymiarowej pokazuje że w istotny statystycznie sposób stężenie glukozy zależy od ilości czekolady oraz czasu, który minął od badania.

 

Wśród korelacji wyróżniamy dwie najważniejsze grupy:

  1. Korelacje Pearsona dla parametrów w skali ciągłej
  2. Korelację rang Spermana dla zmiennych o rozkładzie nieparametryczym