background image

Dobór   zmiennych   objaśniających   do   modelu
ekonometrycznego

Oznaczenia:

Y

 -  zmienna objaśniana, 

k

X

X

X

,...,

,

2

1

 - potencjalne zmienne objaśniające. 

Postać macierzowa:

=

n

y

y

y

Y

:

2

1

=

kn

n

n

k

k

x

x

x

x

x

x

x

x

x

X

..

:

:

:

:

..

..

2

1

2

22

12

1

21

11

.

Współczynniki korelacji: 

=

k

r

r

r

r

R

:

3

2

1

0

=

1

..

:

..

:

:

:

..

1

..

1

..

1

3

2

1

3

32

31

2

23

21

1

13

12

k

k

k

k

k

k

r

r

r

r

r

r

r

r

r

r

r

r

R

gdzie 

;

)

(

)

(

)

(

)

(

1

2

1

2

1

=

=

=

=

n

i

m

mi

n

i

i

n

i

m

mi

i

m

x

x

y

y

x

x

y

y

r

k

m

,...,

2

,

1

=

;

)

(

)

(

)

(

)

(

1

2

1

2

1

=

=

=

=

n

i

m

mi

n

i

l

li

n

i

m

mi

l

li

lm

x

x

x

x

x

x

x

x

r

;

1

1

=

=

n

i

li

l

x

n

x

k

m

l

,...,

2

,

1

,

=

background image

Postulaty dotyczące zmiennych objaśniających:

Wysoki poziom zmienności zmiennych objaśniających.

Zmienne 

k

X

X

X

,...,

,

2

1

 powinny być słabo skorelowane między sobą

a jednocześnie silnie skorelowane ze zmienną Y.

Poziom zmienności
Zmienne   objaśniające  

k

X

X

X

,...,

,

2

1

  powinny   charakteryzować   się

odpowiednio   wysokim   poziomem   zmienności   mierzonym
współczynnikiem zmienności:  

l

X

l

X

S

v

l

=

gdzie 

=

=

n

i

l

li

X

x

x

n

S

l

1

2

)

(

1

 , 

=

=

n

i

li

l

x

n

x

1

1

 dla 

k

l

,...,

2

,

1

=

.

Krytyczny poziom zmienności 

*

v

 jest liczbą z zakresu  

20

,

0

;

05

,

0

.

Ze zbioru  potencjalnych  zmiennych  objaśniających  eliminujemy  te,
dla   których   współczynnik   zmienności   nie   przekracza   wybranej
wartości krytycznej 

*

v

.

 

Brak współliniowości
Metody doboru zmiennych objaśniających:

metoda pojemności informacyjnej,

metoda grafowa,

metoda analizy współczynników korelacji.

background image

Metoda pojemności informacyjnej.
k – liczba potencjalnych zmiennych objaśniających (pozostałych po
usunięciu zmiennych o zbyt niskim poziomie zmienności).
Zbiór   potencjalnych   zmiennych   objaśniających  

}

,...,

,

{

2

1

k

X

X

X

zawiera 

1

2

k

 niepustych podzbiorów. Każdy podzbiór z tej rodziny

numerujemy   w   pewnym   porządku.   Niech   m   oznacza   numer
wybranego podzbioru 

m

Indywidualna   pojemność   informacyjna  zmiennej  

l

  będącej

elementem podzbioru 

m

:

=

m

i

li

l

ml

r

r

h

|

|

2

Integralna pojemność informacyjna podzbioru 

m

=

m

i

mi

m

h

H

 

Integralną   pojemność   informacyjną   wyznacza   się   dla   wszystkich
podzbiorów zbioru  

}

,...,

,

{

2

1

k

X

X

X

. Podzbiór o największej wartości

integralnego wskaźnika pojemności informacyjnej wyznacza zmienne
objaśniające najlepsze w sensie pojemności informacyjnej.

background image

Przykład:

W   pewnej   firmie   przeprowadzono   badania   dotyczące   wydajności   pracy   mające   na   celu
zbudowanie   modelu   ekonometrycznego   opisującego   wydajność   pracy.   W   grupie
potencjalnych zmiennych objaśniających znalazły się zmienne:

1

X

  - techniczne uzbrojenie pracy;

2

X

 - średnie roczne płace pracowników;

3

X

 - straty czasu  pracy z przyczyn organizacyjno – technicznych.

Macierz i wektor korelacji:

=

1

079

,

0

181

,

0

079

,

0

1

824

,

0

181

,

0

824

,

0

1

R

     

=

210

,

0

640

,

0

520

,

0

0

R

W tym przykładzie występują 3 potencjalne zmienne objaśniające, stąd należy wyznaczyć
integralne pojemności  informacyjne dla  

7

1

2

3

=

podzbiorów   potencjalnych zmiennych

objaśniających.

Lista podzbiorów:

}

{

1

1

X

=

}

{

2

2

X

=

}

{

3

3

X

=

}

;

{

2

1

4

X

X

=

}

;

{

3

1

5

X

X

=

}

;

{

3

2

6

X

X

=

}

;

;

{

3

2

1

7

X

X

X

=

Podzbiór 

}

{

1

1

X

=

Indywidualny wskaźnik pojemności informacyjnej:

27

,

0

1

)

520

,

0

(

2

11

=

=

h

Integralny wskaźnik pojemności informacyjnej:

27

,

0

11

1

=

=

h

H

Podzbiór 

}

{

2

2

X

=

41

,

0

22

2

=

=

h

H

Podzbiór 

}

{

3

3

X

=

04

,

0

33

3

=

=

h

H

background image

Podzbiór 

}

;

{

2

1

4

X

X

=

Indywidualne wskaźniki pojemności informacyjnej:

15

,

0

|

824

,

0

|

1

)

520

,

0

(

2

41

=

+

=

h

      

22

,

0

|

824

,

0

|

1

)

640

,

0

(

2

42

=

+

=

h

Integralny wskaźnik pojemności informacyjnej:

37

,

0

42

41

4

=

+

=

h

h

H

Podzbiór 

}

;

{

3

1

5

X

X

=

Indywidualne wskaźniki pojemności informacyjnej:

23

,

0

|

181

,

0

|

1

)

520

,

0

(

2

51

=

+

=

h

      

04

,

0

|

181

,

0

|

1

)

210

,

0

(

2

53

=

+

=

h

Integralny wskaźnik pojemności informacyjnej:

27

,

0

53

51

5

=

+

=

h

h

H

Podzbiór 

}

;

{

3

2

6

X

X

=

Indywidualne wskaźniki pojemności informacyjnej

:

48

,

0

|

079

,

0

|

1

)

640

,

0

(

2

62

=

+

=

h

      

04

,

0

|

079

,

0

|

1

)

210

,

0

(

2

63

=

+

=

h

Integralny wskaźnik pojemności informacyjnej:

52

,

0

63

62

6

=

+

=

h

h

H

Podzbiór 

}

;

;

{

3

2

1

7

X

X

X

=

Indywidualne wskaźniki pojemności informacyjnej:

13

,

0

|

181

,

0

|

|

824

,

0

|

1

)

520

,

0

(

2

71

=

+

+

=

h

     

21

,

0

|

079

,

0

|

|

824

,

0

|

1

)

640

,

0

(

2

72

=

+

+

=

h

03

,

0

|

181

,

0

|

|

079

,

0

|

1

)

210

,

0

(

2

73

=

+

+

=

h

Integralny wskaźnik pojemności informacyjnej:

37

,

0

73

72

71

7

=

+

+

=

h

h

h

H

Integralna   pojemność   informacyjna   jest   największa   dla
podzbioru   numer   6   co   oznacza,   że   najlepszymi   w   sensie
pojemności informacyjnej zmiennymi objaśniającymi są zmienne

3

2

X

X

.

background image

Metoda grafowa.

1.

Wyznaczamy   wartość   krytyczną   współczynnika   korelacji

*

r

.

2.

W macierzy korelacji pomiędzy potencjalnymi zmiennymi
objaśniającymi  

R

  zastępujemy zerami wszystkie elementy

spełniające warunek: 

*

|

|

r

r

ij

tworząc macierz 

'

R

3.

Na bazie macierzy 

'

R

 buduje się graf. Wierzchołkami grafu

są potencjalne zmienne objaśniające, natomiast krawędzie
odpowiadają   niezerowym   elementom   macierzy  

'

R

.

Możliwe do otrzymania grafy to: 

a) jeden graf spójny,  w którym każdy  wierzchołek  jest

połączony krawędziami z innym wierzchołkiem;

b) więcej   niż   jeden   podgrafów   spójnych,   które   nie

posiadają wspólnych krawędzi;

c) graf lub grafy spójne oraz graf lub grafy zerowe (bez

krawędzi);

d) grafy zerowe.

4. Do zmiennych objaśniających zalicza się:

a) zmienne, które tworzą grafy zerowe,
b) zmienne o maksymalnej liczbie krawędzi wybrane z

każdego podgrafu spójnego; jeżeli w danym podgrafie
jest   więcej   niż   jedna   zmienna   o   takiej   samej
maksymalnej liczbie krawędzi, to wybiera się spośród
tych   zmiennych   najsilniej   skorelowaną   ze   zmienną
objaśnianą.

background image

Przykład:
Wektor i macierz korelacji:

=

1

21

,

0

1

92

,

0

11

,

0

1

07

,

0

87

,

0

28

,

0

1

18

,

0

93

,

0

03

,

0

45

,

0

1

02

,

0

21

,

0

17

,

0

21

,

0

23

,

0

1

33

,

0

12

,

0

03

,

0

52

,

0

72

,

0

13

,

0

1

R

   

=

78

,

0

01

,

0

82

,

0

73

,

0

91

,

0

54

,

0

21

,

0

0

R

Wartość krytyczna współczynnika korelacji (

05

,

0

,

25

=

=

α

n

):

39

,

0

07

,

2

2

25

07

,

2

2

2

*

=

+

=

r

Macierz 

'

R

:

=

1

0

1

92

,

0

0

1

0

87

,

0

0

1

0

93

,

0

0

45

,

0

1

0

0

0

0

0

1

0

0

0

52

,

0

72

,

0

0

1

'

R

Graf:

2

3

4

5

6

7

1

background image

Metoda analizy współczynników korelacji

Etapy prac:

1. Wyznaczenie wartości krytycznej współczynnika korelacji,

2. Wybór   z   grupy   potencjalnych   zmiennych   objaśniających

zmiennej najsilniej skorelowanej ze zmienną objaśnianą,

3. Eliminacja   ze   zbioru   potencjalnych   zmiennych  objaśniających

wszystkich   zmiennych  skorelowanych ze   zmienną  wybraną  w
punkcie 2,

4.

Powtarzanie kroków 2, 3 do wyczerpania zbioru potencjalnych
zmiennych objaśniających.

Przykład (macierz korelacji i wektor korelacja – metoda grafowa):

1.

Wybieramy zmienną X

3

,

2.

Eliminujemy zmienne: X

1

X

4

X

6

,

3.

Z   pozostałych   zmiennych   (X

2

,  X

5

,  X

7

)   wybieramy   najsilniej

skorelowaną ze zmienną objaśnianą (R

0

) czyli zmienną X

5

,

4.

Eliminujemy   zmienną  X

7

,   ponieważ   jest   skorelowana   z  X

5

(współczynnik korelacji z macierzy R wynosi –0,92),

5.

Pozostała   tylko   zmienna  X

2

  i   ją   jako   najsilniej   skorelowaną

wybieramy do grupy zmiennych objaśniających,

6. Zbiór   potencjalnych   zmiennych   objaśniających   został

wyczerpany – koniec metody.

7.

Rezultat:   zmienne   objaśniające   wybrane   metodą   analizy
współczynników korelacji to zmienne: X

3

X

5

X

2