plik

Kierunek: Informatyka
Przedmiot: Ekonometria

Opole 2015

1. Cel projektu

Celem projektu jest stworzenie programu, który z podanych danych statycznych

wspomoże budowę jednorównaniowego modelu ekonometrycznego. Program ten ma w łatwy

i przystępny, z punku widzenia użytkownika, realizować obliczenia z danych zawartych w

pliku tekstowym.

2. Dane statystyczne

Dane statyczne umieszczone w pliku tekstowym:

Tabela 1 Dane statystyczne wykorzystane w modelu

Lp.

Rok

Liczba

emigracji

(w tys.)

Bezrobocie

(w tys.)

Zarobki

(w PLN)

Populacji

(w tys.)

PKB

(w mln.)

2003

786

3176

800

38191

103,4

2004

1000

3000

824

38174

105,1

2005

1450

2773

849

38157

103,5

2006

1950

2309

899

38125

106,2

2007

2270

1747

934

38116

107,2

2008

2210

1474

1126

38136

103,9

2009

2100

1893

1276

38167

102,6

2010

2000

1955

1317

38530

103,7

2011

2060

1983

1386

38538

104,8

2012

2130

2137

1500

38533

101,8

2013

2196

2158

1600

38496

101,7

Gdzie:

Y – Ilość ludzi na emigracji w tysiącach,

X1 - Ilość zarejestrowanych bezrobotnych w tysiącach,

X2 – Średnie wynagrodzenie brutto w złotówkach,

X3 – Ilość mieszkańców w kraju,

X4 - PKB (Przychód Krajowy Brutto) w milionach.

Kierunek: Informatyka
Przedmiot: Ekonometria

Opole 2015

3. Współczynniki korelacji

Liczba określająca w jakim stopniu zmienne są współzależne. Jest to miara korelacji

Między zmienną objaśnianą Y i zmiennymi objaśniającymi X

. Ocena ta została wykonan

przy pomocy wzoru na r

Do obliczenia wykorzystano wzór:



































)

(

)

(

)

)(

(

Po obliczeniu poszczególnych współczynników korelacji otrzymano R

-0,9502

0,6572

0,2549

0,0913

W następnej kolejności obliczone zostały współczynniki korelacji między

potencjalnymi zmiennymi objaśniającymi. Aby tego dokonać wykorzystano wzór:



































)

(

)

(

)

)(

(

Po podstawieniu odpowiednich elementów do wzoru otrzymano macierz

współczynników korelacji R:

-0,6135

-0,1838

-0,0919

-0,6135

0,7995

-0,4987

-0,1838

0,7995

-0,4003

-0,0919

-0,4987

-0,4003

Kierunek: Informatyka
Przedmiot: Ekonometria

Opole 2015

4. Wybór zmiennych objaśniających

Do wyboru zmiennych wyjaśniających posłuży metoda współczynników korelacji

wielorakiej dla poziomu istotności α=0,1.

Metoda Z. Pawłowskiego jest to metoda doboru zmiennych objaśniających do modelu

statystycznego w szczególności modelu ekonometrycznego.

Aby dokonać wyboru zmiennych w pierwszej kolejności budujemy tzw. macierz

rozszerzoną W:

𝑾 = [

𝟏

𝑹

𝟎

𝑻

𝑹

𝟎

𝑹 ]

gdzie:

W – pełną macierzą korelacji

Macierze R oraz W wykorzystujemy do budowy współczynnika korelacji wielorakiej C

który jest miarą liniowej zależności między zmienną objaśnianą a liniową kombinacją
zmiennych objaśniających.

Obliczony jest ze wzoru:

𝑪

𝒊

= √𝟏 −

𝐝𝐞𝐭⁡(𝑾

𝒊

)

𝐝𝐞𝐭⁡(𝑹

𝒊

)

5. Oszacowanie parametrów strukturalnych modelu

Stosując Metodę Najmniejszych Kwadratów oszacowano parametry strukturalne modelu,

oszacowanie to odbyło się po wybraniu zmiennych objaśniających.

Wzór ogólny tego modelu to:

𝒚 = 𝒂

𝟏

𝒙

𝟏

+ 𝒂

𝟐

𝒙

𝟐

+ 𝒂

𝟑

Wyznaczenie parametrów

, było możliwe dzięki wzorowi:

𝒂 = (𝑿

𝑻

𝑿)

−𝟏

𝑿

𝑻

𝒀

Kierunek: Informatyka
Przedmiot: Ekonometria

Opole 2015

Aby skorzystać z wzoru potrzebne było wyznaczenie macierzy X oraz Y. Macierz X

sprowadza się do wybrania kolumn reprezentujących wartości zmiennych X

, X

z tabeli z

danymi oraz dopisanie do niej kolumny jednostkowej, czyli kolumny samych jedynek.

Macierz Y to tak naprawdę wartości zmiennej Y z tabeli danych statystycznych:

Y =

786

1000
1450
1950
2270
2210
2100
2000
2060
2130

X =

3176

800

3000

824

2773

849

2309

899

1747

934

1474

1126

1893

1276

1955

1317

1983

1386

2137

1500

Kierunek: Informatyka
Przedmiot: Ekonometria

Opole 2015

Posiadając już macierz Y i X wyznaczono współczynniki

Następnym

etapem jest wyznaczenie macierzy transponowanej X

786

1000 1450 1950 2270 2210 2100 2000 2060 2130

3176 3000 2773 2309 1747 1474 1893 1955 1983 2137

Otrzymaną macierz X

pomnożono przez macierz X w wyniku czego otrzymano

macierz X

X =

53237203 23678431 22447
23678431 12521871 10911

22447

10911

Otrzymaną macierz odwrócono i pomnożono przez iloczyn macierzy X

i Y :

-1

-0,002

-0,005

-0,002 -0,005

9,663

-0,0021

-0,0045

-0,0021 -0,0045

9,6627

Po wykonaniu wszystkich tych operacji otrzymujemy macierz

-0.0193254

-0.0483135

-0.0202923 0.0434835 93.3706968

Kierunek: Informatyka
Przedmiot: Ekonometria

Opole 2015

Gdy otrzymaną macierz

podstawimy do ogólnego wzoru opisującego model otrzymujemy:

𝒚 = ⁡ −𝟎, 𝟖𝟐𝟐𝟖𝑿

𝟏

+ 𝟎, 𝟐𝟒𝟎𝟏𝑿

𝟐

+ 𝟑𝟑𝟖𝟎, 𝟓𝟖𝟕

6. Weryfikacja modelu

Aby dokonać weryfikację modelu wybrane zostały współczynniki i hipotezy.

Na początku została wyznaczona wariancja składnika resztowego

⁡

𝑺

𝒖

, wyznaczony został

przy pomocy wzoru:

𝑺

𝒖

𝟐

𝟏

𝒏 − 𝒌

[𝒀

𝑻

𝒀 − 𝒀

𝑻

𝑿𝒂]

𝑺

𝒖

= √𝒔

𝒖

𝟐

𝑺

𝒖

= 𝟐𝟏𝟎, 𝟒𝟗𝟕𝟔

Kolejnym krokiem było określenie błędów średnich szacunku parametrów:

𝑫

𝟐

(𝒂) = 𝑺

𝒖

𝟐

(𝑿

𝑻

𝑿)

−𝟏

D(a

) = 0,0249,

D(a

) = 0,1152,

D(a

) = 428148,1011

Do wyznaczenia współczynnika zbieżności wykorzystany został wzór:

𝝋

𝟐

𝒀

𝑻

𝒀−𝒀

𝑻

𝑿𝒂

(𝒀−𝒀̅)

𝑻

(𝒀−𝒀̅)

= 𝟎, 𝟓𝟎𝟎

Współczynnik determinacji określony wzorem:

𝑹

𝟐

= 𝟏 −⁡ 𝝋

𝟐

= 𝟎, 𝟓𝟎𝟎

Kierunek: Informatyka
Przedmiot: Ekonometria

Opole 2015

Ostatnim wyznaczonym współczynnikiem jest współczynnik zmienności losowej

𝑽 =

𝑺

𝒖

𝒀

̅ ∗ 𝟏𝟎𝟎%

𝑽 = 𝟏𝟏, 𝟕𝟐⁡%

Zweryfikowany wzór modelu:

𝒚 = −𝟎, 𝟖𝟐𝟐𝟖𝒙

𝟏

+ 𝟎, 𝟐𝟒𝟎𝟏𝒙

𝟐

+ 𝟑𝟑𝟖𝟎, 𝟓𝟖𝟔𝟔

(0,0249)

(0,1152) (428148,1011)

7. Statystyka t-Studenta

Statystyka t-Studenta została wykorzystana w celu sprawdzenia.

Hipoteza zerowa w postaci:

𝑯

𝟎

: 𝜶

𝒊

= 𝟎

oraz hipotezę alternatywną w postaci:

𝑯

𝟏

:⁡𝜶

𝒊

≠ 𝟎

Dla statystyki testowej danej wzorem:

𝒕

𝒊

= ⁡

𝒂

𝒊

𝑫(𝒂

𝒊

)

otrzymano następujące wartości:

t1 = -33,044

t2 = 2,08442

Dla poziomu istotności



=0,1 oraz n=7 (liczba stopni swobody) z tablic testu t-

Studenta została odczytana wartość





1,8946.

Dla poziomu istotności



=0,1 dokonano następujących porównań:

|𝐭

𝟏

| > 𝐭

𝛂

, bo 33,044 > 1,8946

|𝐭

𝟐

| > 𝐭

𝛂

,, bo 2,08442 > 1,8946.

Kierunek: Informatyka
Przedmiot: Ekonometria

Opole 2015

Z wykonanych porównań wynika, że należy odrzucić hipotezę H

i za słuszną uznać hipotezę

alternatywną.

5. Statystyka F rozkładu Fischera Snedecora

Po wykonaniu sprawdzenia przy pomocy statystki t-Studenta wykonano sprawdzenia,

czy dopasowanie oszacowanego modelu do danych empirycznych jest wystarczające.

Wykorzystano w tym celu statystykę F rozkładu Fischera Snedecora. Na początku zostały

określone hipotezy:

𝑯

𝟎

: 𝜶

𝟏

= 𝟎 ʌ 𝜶

𝟐

= 𝟎 ʌ 𝜶

𝟑

= 𝟎

𝑯

𝟏

: 𝜶

𝟏

≠ 𝟎 v 𝜶

𝟐

≠ 𝟎 v 𝜶

𝟑

≠ 𝟎

Korzystając ze statystyki określonej wzorem:

𝑭 =

𝑹

𝟐

𝟏 − 𝑹

𝟐

∗

𝒏 − 𝒌

𝒌 − 𝟏

gdzie

=1-

𝝋

𝟐

= 1-0,500 = 0,500

otrzymano

F = 8

Następnie z tablic Fischera Snedecora odczytano wartość krytyczną statystyki dla poziomu

istotności α = 0,1 oraz stopni swobody m

=1 i m

=8 równą F

= 3,46. Kolejnym krokiem było

wykonanie porównania:

F>F

, bo 8>3,46

Z wykonanego porównania wynika, że należy przyjąć hipotezę H

Kierunek: Informatyka
Przedmiot: Ekonometria

Opole 2015

6. Graficzna prezentacja wyników

Dla otrzymanego wzoru określającego model ekonometryczny wykonano porównanie

rzeczywistego przebiegu zmiennej objaśnianej z symulacyjnym przebiegiem tej zmiennej.

Otrzymane wyniki przedstawiono w poniższej tabeli. Dodatkowo zaprezentowano wartość

otrzymaną w kolejnym kroku (okresie) funkcji predykcyjnej dla danych z 2000 roku.

Rok

Rzeczywisty Y

Symulacyjny Y

2003

786

959,4538

2004

1000

1110,029

2005

1450

1302,807

2006

1950

1696,591

2007

2270

2167,408

2008

2210

2438,132

2009

2100

2129,394

2010

2000

2088,224

2011

2060

2081,753

2012

2130

1982,413

2003

786

959,4538

Graficzne porównanie rzeczywistego Y z symulacyjnym:

Wykres przedstawia średnią liczbę emigracji z Polski w latach 2003 – 2012. Wykres został

sporządzony dokładnie z instrukcjami, które zostały podane na zajęciach.

500

1000

1500

2000

2500

3000

2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

Śred

emi

Rok

Rzeczywisty Y

Symulacyjny Y