background image

BADANIE KORELACJI MIĘDZY CECHAMI
Zależność korelacyjna między cechami mierzalnymi charakteryzuje się tym, że ściśle 
określonym wartościom jednej zmiennej przyporządkowane są ściśle określone wartości 
drugiej zmiennej.
Stopień zależności liniowej pomiędzy badanymi cechami mierzalnymi określa współczynnik 
korelacji PEARSONA r

xy

.

KORELACYJNY WYKRES ROZRZUTU (wykres punktowy)

a) korelacja liniowa dodatnia b) korelacja liniowa ujemna c) brak korelacji

d) korelacja 

krzywoliniowa

Korelacja dodatnia występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada wzrost 
średnich wartości drugiej cechy.
Korelacja ujemna występuje wtedy, gdy wzrostowi wartości jednej cechy odpowiada spadek 
średnich wartości drugiej cechy.
Współczynnik korelacji PEARSONA r

xy

.

 [-1 ; 1]  jest miarą siły liniowego związku między 

cechami.
Dla szeregów szczegółowych:

Dla szeregów rozdzielczych z przedziałami klasowymi występują przeważnie różne 
liczebności klas dla cechy X i dla cechy Y. Stąd w liczniku powyższego wzoru wystąpią 
iloczyny przyrostów wartości cech w różnych kombinacjach przynależności do klas ze 
względu na cechę X i cechę Y. Czyli wzór (1) przyjmuje poniższą postać:

r

x x y y

x x

y y

Cov X Y

s s

xy

i

i

n

i

i

i

n

i

i

n

x y

=

=

=

=

=

(

)(

)

(

)

(

)

( ; )

( )

1

2

1

2

1

1

)2(

);(

)

(

)(

)

)(

(

1

2

1

2

1 1

yx

s

j

j

j

r

i

i

i

r

i

ij

s

j

j

i

xy

ss

YX

Cov

ny

y

nx

x

ny

yx

x

r

=





 −

−−

=

∑∑

=

=

= =

background image

Sens sumowania obrazuje poniższa tablica dwudzielna (tablica korelacyjna):

TABLICA DWUDZIELNA

       Y
X

y

1

y

2

•••

y

j

•••

y

s

n

i

x

1

n

11

n

12

•••

n

1j

•••

n

1s

n

1

x

2

n

21

n

22

•••

n

2j

•••

n

2s

n

2

•••

•••

•••

•••

•••

•••

•••

•••

x

i

n

i1

n

i2

•••

n

ij

•••

n

is

n

i

•••

•••

•••

•••

•••

•••

•••

•••

x

r

n

r1

n

r2

•••

n

rj

•••

n

rs

n

r

n

j

n

1

n

2

•••

n

j

•••

n

s

n

Kowariancję   między   cechami   X   i   Y   czyli   Cov   (X;Y)   wyznaczają   dla   szeregów
szczegółowych i rozdzielczych odpowiednio liczniki wzorów (1) i (2) podzielone przez n .

Odchylenia standardowe cech są zaznaczone odpowiednio przez s

x

 i s

y

 .

Znak współczynnika korelacji świadczy o kierunku korelacji, a jego wartość bezwzględna o
sile korelacji.

Gdy r

xy

 = 

±

 1 to występuje zależność liniowa, gdy zaś  r

xy

 =  0  to cechy są nieskorelowane.

Klasyfikacja siły związku liniowego między cechami na podstawie wartości bezwzględnej
współczynnika korelacji (r

xy

 

 [ -1 ; 1 ] )

Zmienność wartości
bezwzględnej
 

|

r

xy

|

Siła związku liniowego między
cechami X ,Y

            

|

r

xy

|

  <  0.2

Brak związku liniowego 

  0.2  

 

|

r

xy

|

  <  0.4

Niska zależność liniowa

  0.4  

 

|

r

xy

|

  <  0.7

Umiarkowana zależność liniowa

  0.7  

 

|

r

xy

|

  <  0.9

Znacząca zależność liniowa

  0.9  

 

|

r

xy

|

  

Bardzo silna zależność liniowa

UWAGA 1. 

Gdy r

xy

 

 0  to oznacza to tylko brak zależności liniowej między badanymi cechami.

background image

UWAGA 2.

Wielkość współczynnika korelacji zależy od zakresu zmienności badanych cech.

Przykład 1.

Określić siłę i kierunek zależności liniowej między zużyciem złota (surowca) a wielkością
produkcji   elementu   elektronicznego   w   pewnym   zakładzie   produkcyjnym.   Dane   są
zamieszczone w poniższej tabeli

Nr. miesiąca

Produkcjawyrobu 
(w tonach)

Zużycie surowca
(w kilogramach)

1

90

40

2

85

35

3

110

50

4

125

45

5

120

40

6

150

63

7

140

45

8

160

61

9

200

70

10

190

61

11

220

85

12

210

65

Wykres punktowy i obliczenia pomocnicze obrazuje poniższy arkusz:

http://notatek.pl/badanie-korelacji-miedzy-cechami?notatka