Laboratoryjne zajęcie N2

Specyfikacja zmiennych, występujących w modelu ekonometrycznym

Zmienne objaśniające w modelu ekonometrycznym z formalnego punktu widzenia powinny się odznaczać następującymi własnościami:

  1. Eliminowania zmiennych quasi-stałych

Niech [x1k, x2k, … xnk] będą realizacjami zmiennej Xk, k = 1, 2, …, K. Miarą poziomu zmienności zmiennej Xk jest współczynnik zmienności Vk, określony jako stosunek odchylenia standardowego Sk zmiennej Xk do jej średniej arytmetycznej mk, czyli:

0x01 graphic
, (1)

gdzie

0x01 graphic
(2)

jest średnią arytmetyczną zmiennej Xk;

0x01 graphic
(3)

jest odchyleniem standardowym zmiennej Xk.

Eliminowanie zmiennych quasi-stałych na podstawie wartości współczynnika zmienności Vk odbywa się w sposób następujący.

  1. Oblicza się współczynniki zmienności Vk dla poszczególnych badanych zmiennych Xk, k=1,2,…,K według wzorów (1), (2), (3).

  2. Obiera się krytyczna wartość Vk* współczynnika zmienności (np. Vk* = 0,05).

  3. Zmienna o numerze k, dla której jest spełniona nierówność

Vk Vk* (4)

uznaje się za quasi-stałą i eliminuje się ze zbioru zmiennych kandydujących do roli objaśniających (k = 1, 2, …, K). Uważamy że zmienna te nie wnosi istotnych informacji o zmiennej objaśnianej.

Aby ocenić siłę liniowej zależności zmiennej objaśnianej Y i potencjalnych zmiennych objaśniających X1, X2, ..., XK, oraz siłę liniowej zależności między potencjalnymi zmiennymi objaśniającymi X1, X2, ..., XK, pomiędzy sobą, oblicza się współczynniki korelacji:

0x01 graphic
;0x01 graphic
,

oraz

0x01 graphic
.

Współczynniki te są przedstawione w postaci wektora korelacji R0, oraz macierzy R.

  1. Prosta metoda grafowa

  1. Wyznaczyć krytyczną wartość r* współczynnika korelacji według wzoru:

0x01 graphic
. (5)

  1. Przeprowadzić eliminowanie związków nieistotnych: Współczynniki korelacji rks macierzy R, dla których zachodzi relacja |rks| r*, uznajemy za nieistotne i zastępujemy ich w macierzy R zerami. Zmodyfikowaną w ten sposób macierz R oznaczamy jako R', a ją elementy jako r'ks.

  2. Na podstawie macierzy R' budujemy graf, w którym wierzchołkami są potencjalne zmienne objaśniające X1, X2, … XK , a wiązadłami występują współczynniki korelacji r'ks 0.

  3. Zmienne należące do różnych spójnych podgrafów traktujemy jako niezależne. Zostawiamy zmienne, reprezentowane przez punkty odosobnione.

  4. Dla nie odosobnionych spójnych podgrafów określamy stopień g każdego węzła grafu, tj. liczbę wiązadeł, którymi jest on związany z innymi węzłami.

  5. W każdym grafie spójnym wyróżniamy węzeł o maksymalnym stopniu g. Węzeł ten reprezentuje zmienną, która jest bezpośrednio związana z największą liczbą pozostałych zmiennych, będących węzłami tego samego spójnego podgrafu i w tym sensie gromadzi w sobie najwięcej informacji z pozostałych zmiennych.

  6. Jeżeli w danym grafie spójnym jest kilka węzłów o takim samym maksymalnym stopniu g, to wybieramy spośród nich węzeł, charakteryzujący tą zmienną Xk, dla której współczynnik korelacji rk ze zmiennej objaśnianej Y jest maksymalny.

Ostatecznie jako zmienne objaśniające pozostawiamy zmienne, reprezentujące punkty izolowane oraz wyróżnione z grafów spójnych według kryterium maksymalnej wartości g, oraz kryterium maksymalnej wartości rk.