Dobor zmiennnych objasniajacych

Dobór zmiennych objaśniających do modelu
ekonometrycznego

Oznaczenia:

- zmienna objaśniana,

,...,

- potencjalne zmienne objaśniające.

Postać macierzowa:

























Współczynniki korelacji:

























gdzie

;

)

(

)

(

)

(

)

(

∑

−

⋅

−

⋅

−

,...,

;

)

(

)

(

)

(

)

(

∑

−

⋅

−

⋅

−

;

∑

,...,

Postulaty dotyczące zmiennych objaśniających:

•

Wysoki poziom zmienności zmiennych objaśniających.

•

Zmienne

,...,

powinny być słabo skorelowane między sobą

a jednocześnie silnie skorelowane ze zmienną Y.

Poziom zmienności
Zmienne objaśniające

,...,

powinny charakteryzować się

odpowiednio wysokim poziomem zmienności mierzonym
współczynnikiem zmienności:

gdzie

∑

−

)

(

∑

dla

,...,

Krytyczny poziom zmienności

jest liczbą z zakresu

;

Ze zbioru potencjalnych zmiennych objaśniających eliminujemy te,
dla których współczynnik zmienności nie przekracza wybranej
wartości krytycznej

Brak współliniowości
Metody doboru zmiennych objaśniających:

•

metoda pojemności informacyjnej,

•

metoda grafowa,

•

metoda analizy współczynników korelacji.

Metoda pojemności informacyjnej.
k – liczba potencjalnych zmiennych objaśniających (pozostałych po
usunięciu zmiennych o zbyt niskim poziomie zmienności).
Zbiór potencjalnych zmiennych objaśniających

}

,...,

{

zawiera

−

niepustych podzbiorów. Każdy podzbiór z tej rodziny

numerujemy w pewnym porządku. Niech m oznacza numer
wybranego podzbioru

ℵ

Indywidualna pojemność informacyjna zmiennej

X będącej

elementem podzbioru

ℵ

∑

ℵ

∈

Integralna pojemność informacyjna podzbioru

ℵ

∑

ℵ

∈

Integralną pojemność informacyjną wyznacza się dla wszystkich
podzbiorów zbioru

}

,...,

{

. Podzbiór o największej wartości

integralnego wskaźnika pojemności informacyjnej wyznacza zmienne
objaśniające najlepsze w sensie pojemności informacyjnej.

Przykład:

W pewnej firmie przeprowadzono badania dotyczące wydajności pracy mające na celu
zbudowanie modelu ekonometrycznego opisującego wydajność pracy. W grupie
potencjalnych zmiennych objaśniających znalazły się zmienne:

- techniczne uzbrojenie pracy;

- średnie roczne płace pracowników;

- straty czasu pracy z przyczyn organizacyjno – technicznych.

Macierz i wektor korelacji:













−

079

181

079

824

181

824













−

210

640

520

W tym przykładzie występują 3 potencjalne zmienne objaśniające, stąd należy wyznaczyć
integralne pojemności informacyjne dla

−

podzbiorów potencjalnych zmiennych

objaśniających.

Lista podzbiorów:

}

{

ℵ

}

{

ℵ

}

{

ℵ

}

;

{

ℵ

}

;

{

ℵ

}

;

{

ℵ

}

;

{

ℵ

Podzbiór

}

{

ℵ

Indywidualny wskaźnik pojemności informacyjnej:

)

520

(

Integralny wskaźnik pojemności informacyjnej:

Podzbiór

}

{

ℵ

Podzbiór

}

{

ℵ

Podzbiór

}

;

{

ℵ

Indywidualne wskaźniki pojemności informacyjnej:

824

)

520

(

824

)

640

(

Integralny wskaźnik pojemności informacyjnej:

Podzbiór

}

;

{

ℵ

Indywidualne wskaźniki pojemności informacyjnej:

181

)

520

(

−

181

)

210

(

−

Integralny wskaźnik pojemności informacyjnej:

Podzbiór

}

;

{

ℵ

Indywidualne wskaźniki pojemności informacyjnej

079

)

640

(

−

079

)

210

(

−

Integralny wskaźnik pojemności informacyjnej:

Podzbiór

}

;

{

ℵ

Indywidualne wskaźniki pojemności informacyjnej:

181

824

)

520

(

−

079

824

)

640

(

−

181

079

)

210

(

−

Integralny wskaźnik pojemności informacyjnej:

Integralna pojemność informacyjna jest największa dla
podzbioru numer 6 co oznacza, że najlepszymi w sensie
pojemności informacyjnej zmiennymi objaśniającymi są zmienne

, X

Metoda grafowa.

Wyznaczamy wartość krytyczną współczynnika korelacji

W macierzy korelacji pomiędzy potencjalnymi zmiennymi
objaśniającymi

zastępujemy zerami wszystkie elementy

spełniające warunek:

≤

tworząc macierz

Na bazie macierzy

buduje się graf. Wierzchołkami grafu

są potencjalne zmienne objaśniające, natomiast krawędzie
odpowiadają niezerowym elementom macierzy

Możliwe do otrzymania grafy to:

a) jeden graf spójny, w którym każdy wierzchołek jest

połączony krawędziami z innym wierzchołkiem;

b) więcej niż jeden podgrafów spójnych, które nie

posiadają wspólnych krawędzi;

c) graf lub grafy spójne oraz graf lub grafy zerowe (bez

krawędzi);

d) grafy zerowe.

4. Do zmiennych objaśniających zalicza się:

a) zmienne, które tworzą grafy zerowe,
b) zmienne o maksymalnej liczbie krawędzi wybrane z

każdego podgrafu spójnego; jeżeli w danym podgrafie
jest więcej niż jedna zmienna o takiej samej
maksymalnej liczbie krawędzi, to wybiera się spośród
tych zmiennych najsilniej skorelowaną ze zmienną
objaśnianą.

Przykład:
Wektor i macierz korelacji:













−













−

Wartość krytyczna współczynnika korelacji (

−

Macierz













−

Graf:

Metoda analizy współczynników korelacji

Etapy prac:

1. Wyznaczenie wartości krytycznej współczynnika korelacji,

2. Wybór z grupy potencjalnych zmiennych objaśniających

zmiennej najsilniej skorelowanej ze zmienną objaśnianą,

3. Eliminacja ze zbioru potencjalnych zmiennych objaśniających

wszystkich zmiennych skorelowanych ze zmienną wybraną w
punkcie 2,

Powtarzanie kroków 2, 3 do wyczerpania zbioru potencjalnych
zmiennych objaśniających.

Przykład (macierz korelacji i wektor korelacja – metoda grafowa):

Wybieramy zmienną X

Eliminujemy zmienne: X

, X

Z pozostałych zmiennych (X

, X

) wybieramy najsilniej

skorelowaną ze zmienną objaśnianą (R

) czyli zmienną X

Eliminujemy zmienną X

, ponieważ jest skorelowana z X

(współczynnik korelacji z macierzy R wynosi –0,92),

Pozostała tylko zmienna X

i ją jako najsilniej skorelowaną

wybieramy do grupy zmiennych objaśniających,

6. Zbiór potencjalnych zmiennych objaśniających został

wyczerpany – koniec metody.

Rezultat: zmienne objaśniające wybrane metodą analizy
współczynników korelacji to zmienne: X

, X

Wyszukiwarka

Podobne podstrony:
W2 Dobór zmiennych objaśniających do modelu
W2 Dobór zmiennych objaśniających do modelu 2
Dobor zmiennnych objasniajacych
3 dobór zmiennych do liniowego modelu ekonometrycznego
dobór zmiennych rozw ćwiczenia2
dobór zmiennych rozw ćwiczenia2
Wyklad 5b Dobor zmiennych
MNK liniowy 2 zmienne objasniajace(1)
Wykład5, Dobór zmiennych do modelu - Hellwig, Dobór zmiennych do modelu
Model z wieloma zmiennymi objasniajacymi
W6 dobor zmiennych, Ekonometria
Model z jedną zmienną objaśniającą (liniowy i nieliniowy)
Model liniowy z dwiema zmiennymi objaśniającymi
dobor zmiennych gorski m
dobór zmiennych rozw ćwiczenia2
dobór zmiennych rozwiazania01
dobór zmiennych

więcej podobnych podstron