background image

Opole 2015 

Politechnika Opolska 

Wydział Elektrotechniki, Automatyki i 

Informatyki 

 

 

 

 

 

 

Ekonometria 

 

 

 

 

Kierunek studiów: Informatyka

                                                    Prowadzący:

 

Rok akademicki: 2014/2015

                                                           dr inż. Arkadiusz Gardecki

 

Rok studiów: I                                                                                 

Wykonał:

 

Semestr: I

                                                                                        Adam Czech 

 

 

 

background image

Kierunek: Informatyka 
Przedmiot: Ekonometria 

Opole 2015 

1.  Cel projektu 

Celem  projektu  jest  stworzenie  programu,  który  z  podanych  danych  statycznych 

wspomoże budowę jednorównaniowego modelu ekonometrycznego. Program ten ma w łatwy 

i  przystępny,  z  punku  widzenia  użytkownika,  realizować  obliczenia  z  danych  zawartych  w 

pliku tekstowym. 

 

2.  Dane statystyczne 

Dane statyczne umieszczone w pliku tekstowym: 

Tabela 1 Dane statystyczne wykorzystane w modelu 

Lp. 

Rok 

Liczba 

emigracji 

(w tys.) 

Bezrobocie 

(w tys.) 

Zarobki 

(w PLN) 

Populacji 

(w tys.) 

PKB 

(w mln.) 

X

1

 

X

2

 

X

3

 

X

4

 

2003 

786 

3176 

800 

38191 

103,4 

2004 

1000 

3000 

824 

38174 

105,1 

2005 

1450 

2773 

849 

38157 

103,5 

2006 

1950 

2309 

899 

38125 

106,2 

2007 

2270 

1747 

934 

38116 

107,2 

2008 

2210 

1474 

1126 

38136 

103,9 

2009 

2100 

1893 

1276 

38167 

102,6 

2010 

2000 

1955 

1317 

38530 

103,7 

2011 

2060 

1983 

1386 

38538 

104,8 

10 

2012 

2130 

2137 

1500 

38533 

101,8 

 

11 

2013 

2196 

2158 

1600 

38496 

101,7 

 

 

Gdzie: 

Y – Ilość ludzi na emigracji w tysiącach,  

X1 - Ilość zarejestrowanych bezrobotnych w tysiącach,  

X2 – Średnie wynagrodzenie brutto w złotówkach, 

X3 – Ilość mieszkańców w kraju,  

X4 - PKB (Przychód Krajowy Brutto) w milionach. 

 

 

 

background image

Kierunek: Informatyka 
Przedmiot: Ekonometria 

Opole 2015 

3.  Współczynniki korelacji 

Liczba określająca w jakim stopniu zmienne  współzależne. Jest to miara korelacji  

Między  zmienną  objaśnianą  Y  i  zmiennymi  objaśniającymi  X

i

.    Ocena  ta  została  wykonan 

przy pomocy wzoru na r

i. 

Do obliczenia wykorzystano wzór: 

n

t

i

ti

n

t

t

n

t

i

ti

t

i

x

x

y

y

x

x

y

y

r

1

2

1

2

1

)

(

)

(

)

)(

(

 

 

Po obliczeniu poszczególnych współczynników korelacji otrzymano R

0

 

R

0

 

-0,9502 

0,6572 

0,2549 

0,0913 

  

W  następnej  kolejności  obliczone  zostały  współczynniki  korelacji  między 

potencjalnymi zmiennymi objaśniającymi. Aby tego dokonać wykorzystano wzór: 

n

t

j

jt

n

t

i

it

n

t

j

jt

i

it

ij

x

x

x

x

x

x

x

x

r

1

2

1

2

1

)

(

)

(

)

)(

(

 

 

Po  podstawieniu  odpowiednich  elementów  do  wzoru  otrzymano    macierz 

współczynników korelacji R: 

 

-0,6135 

-0,1838 

-0,0919 

-0,6135 

0,7995 

-0,4987 

-0,1838 

0,7995 

-0,4003 

-0,0919 

-0,4987 

-0,4003 

 

background image

Kierunek: Informatyka 
Przedmiot: Ekonometria 

Opole 2015 

 

4.  Wybór zmiennych objaśniających 

Do  wyboru  zmiennych  wyjaśniających  posłuży  metoda    współczynników  korelacji 

wielorakiej dla poziomu istotności α=0,1. 

Metoda  Z.  Pawłowskiego  jest  to  metoda  doboru zmiennych  objaśniających do modelu 

statystycznego w szczególności modelu ekonometrycznego. 

Aby  dokonać  wyboru  zmiennych  w  pierwszej  kolejności  budujemy  tzw. macierz 

rozszerzoną W

 

𝑾 = [

𝟏

𝑹

𝟎

𝑻

𝑹

𝟎

𝑹 ] 

gdzie: 

W – pełną macierzą korelacji 

Macierze R oraz W wykorzystujemy do budowy współczynnika korelacji wielorakiej C

i

który jest miarą liniowej zależności między zmienną objaśnianą a liniową kombinacją 
zmiennych objaśniających.  

Obliczony jest ze wzoru: 

 

𝑪

𝒊

= √𝟏 −

𝐝𝐞𝐭⁡(𝑾

𝒊

)

𝐝𝐞𝐭⁡(𝑹

𝒊

)

 

 

5.  Oszacowanie parametrów strukturalnych modelu 

Stosując Metodę Najmniejszych Kwadratów oszacowano parametry strukturalne modelu, 

oszacowanie to odbyło się po wybraniu zmiennych objaśniających. 

Wzór ogólny tego modelu to: 

𝒚 = 𝒂

𝟏

𝒙

𝟏

+ 𝒂

𝟐

𝒙

𝟐

+ 𝒂

𝟑

 

Wyznaczenie parametrów 

a

i

, było możliwe dzięki wzorowi: 

𝒂 = (𝑿

𝑻

𝑿)

−𝟏

𝑿

𝑻

𝒀 

 

 

background image

Kierunek: Informatyka 
Przedmiot: Ekonometria 

Opole 2015 

Aby skorzystać z wzoru potrzebne było wyznaczenie macierzy X oraz Y. Macierz X 

sprowadza  się  do  wybrania  kolumn  reprezentujących  wartości  zmiennych  X

1

,  X

2

  z  tabeli  z 

danymi  oraz  dopisanie  do  niej  kolumny  jednostkowej,  czyli  kolumny  samych  jedynek. 

Macierz Y to tak naprawdę wartości zmiennej Y z tabeli danych statystycznych:  

 

Y =      

 

786 

1000 
1450 
1950 
2270 
2210 
2100 
2000 
2060 
2130 

 
 
 

 

X = 

3176 

800 

3000 

824 

2773 

849 

2309 

899 

1747 

934 

1474 

1126 

1893 

1276 

1955 

1317 

1983 

1386 

2137 

1500 

 

 

 

 

background image

Kierunek: Informatyka 
Przedmiot: Ekonometria 

Opole 2015 

Posiadając  już  macierz  Y  i  X  wyznaczono  współczynniki 

a

1

,

  a

2

  i 

a

3. 

Następnym 

etapem jest wyznaczenie macierzy transponowanej X

T

X

T

= 

786 

1000  1450  1950  2270  2210  2100  2000  2060  2130 

3176  3000  2773  2309  1747  1474  1893  1955  1983  2137 

 

Otrzymaną  macierz  X

T

  pomnożono  przez  macierz  X  w  wyniku  czego  otrzymano 

macierz X

T

X: 

 

X

T

X = 

53237203  23678431  22447 
23678431  12521871  10911 

22447 

10911 

10 

 

 

Otrzymaną macierz odwrócono i pomnożono przez iloczyn macierzy X

T

 i Y : 

 

(X

T

X)

-1

-0,002 

-0,005 

-0,002  -0,005 

9,663 

 

 

X

T

Y= 

-0,0021 

-0,0045 

-0,0021  -0,0045 

9,6627 

 

 

 

 

 

 

Po wykonaniu wszystkich tych operacji otrzymujemy macierz 

a

a= 

-0.0193254 

-0.0483135 

-0.0202923  0.0434835  93.3706968 

 

 

background image

Kierunek: Informatyka 
Przedmiot: Ekonometria 

Opole 2015 

Gdy otrzymaną macierz 

podstawimy do ogólnego wzoru opisującego model otrzymujemy: 

𝒚 = ⁡ −𝟎, 𝟖𝟐𝟐𝟖𝑿

𝟏

+ 𝟎, 𝟐𝟒𝟎𝟏𝑿

𝟐

+ 𝟑𝟑𝟖𝟎, 𝟓𝟖𝟕 

 

 

6.   Weryfikacja modelu 

Aby dokonać weryfikację modelu wybrane zostały współczynniki i hipotezy. 

Na  początku  została  wyznaczona  wariancja  składnika  resztowego 

𝑺

𝒖

,  wyznaczony  został 

przy pomocy wzoru: 

𝑺

𝒖

𝟐

=

𝟏

𝒏 − 𝒌

[𝒀

𝑻

𝒀 − 𝒀

𝑻

𝑿𝒂] 

𝑺

𝒖

= √𝒔

𝒖

𝟐

 

𝑺

𝒖

= 𝟐𝟏𝟎, 𝟒𝟗𝟕𝟔 

Kolejnym krokiem było określenie błędów średnich szacunku parametrów: 

 

𝑫

𝟐

(𝒂) = 𝑺

𝒖

𝟐

(𝑿

𝑻

𝑿)

−𝟏

 

 

D(a

1

) = 0,0249,  

D(a

2

) = 0,1152,  

D(a

3

) = 428148,1011  

 

Do wyznaczenia współczynnika zbieżności wykorzystany został wzór: 

 

𝝋

𝟐

=

𝒀

𝑻

𝒀−𝒀

𝑻

𝑿𝒂

(𝒀−𝒀̅)

𝑻

(𝒀−𝒀̅)

= 𝟎, 𝟓𝟎𝟎  

Współczynnik determinacji określony wzorem: 

𝑹

𝟐

= 𝟏 −⁡ 𝝋

𝟐

= 𝟎, 𝟓𝟎𝟎 

background image

Kierunek: Informatyka 
Przedmiot: Ekonometria 

Opole 2015 

Ostatnim wyznaczonym współczynnikiem jest współczynnik zmienności losowej 

V:

 

𝑽 =

𝑺

𝒖

𝒀

̅ ∗ 𝟏𝟎𝟎% 

 

𝑽 = 𝟏𝟏, 𝟕𝟐⁡% 

 

Zweryfikowany wzór modelu: 

𝒚 = −𝟎, 𝟖𝟐𝟐𝟖𝒙

𝟏

+ 𝟎, 𝟐𝟒𝟎𝟏𝒙

𝟐

+ 𝟑𝟑𝟖𝟎, 𝟓𝟖𝟔𝟔 

 

 

    (0,0249)   

(0,1152)     (428148,1011) 

 

7.   Statystyka t-Studenta 

Statystyka t-Studenta została wykorzystana w celu sprawdzenia. 

Hipoteza zerowa w postaci: 

𝑯

𝟎

: 𝜶

𝒊

= 𝟎 

oraz hipotezę alternatywną w postaci: 

𝑯

𝟏

:⁡𝜶

𝒊

≠ 𝟎 

Dla statystyki testowej danej wzorem: 

𝒕

𝒊

= ⁡

𝒂

𝒊

𝑫(𝒂

𝒊

)

 

otrzymano następujące wartości: 

t1 = -33,044 

t2 = 2,08442 

 

Dla  poziomu  istotności 

=0,1  oraz  n=7  (liczba  stopni  swobody)  z  tablic  testu  t-

Studenta została odczytana wartość 

t

1,8946. 

Dla poziomu istotności 

=0,1 dokonano następujących porównań: 

|𝐭

𝟏

| > 𝐭

𝛂

, bo 33,044 > 1,8946 

|𝐭

𝟐

| > 𝐭

𝛂

,, bo 2,08442 > 1,8946. 

background image

Kierunek: Informatyka 
Przedmiot: Ekonometria 

Opole 2015 

Z wykonanych porównań wynika, że należy odrzucić hipotezę H

0

 i za słuszną uznać hipotezę 

alternatywną. 

 

 

 

5. Statystyka F rozkładu Fischera Snedecora 

 

Po wykonaniu sprawdzenia przy pomocy statystki t-Studenta wykonano sprawdzenia, 

czy  dopasowanie  oszacowanego  modelu  do  danych  empirycznych  jest  wystarczające. 

Wykorzystano  w  tym  celu  statystykę  F  rozkładu  Fischera  Snedecora.  Na  początku  zostały 

określone hipotezy: 

𝑯

𝟎

: 𝜶

𝟏

= 𝟎 ʌ 𝜶

𝟐

= 𝟎 ʌ 𝜶

𝟑

= 𝟎 

𝑯

𝟏

: 𝜶

𝟏

≠ 𝟎 v 𝜶

𝟐

≠ 𝟎 v 𝜶

𝟑

≠ 𝟎 

Korzystając ze statystyki określonej wzorem: 

𝑭 =

𝑹

𝟐

𝟏 − 𝑹

𝟐

𝒏 − 𝒌

𝒌 − 𝟏

 

gdzie  

R

2

=1-

𝝋

𝟐

 = 1-0,500 = 0,500 

otrzymano  

= 8 

Następnie  z  tablic  Fischera  Snedecora  odczytano  wartość  krytyczną  statystyki  dla  poziomu 

istotności α = 0,1 oraz stopni swobody m

1

=1 i m

2

=8 równą F

α

 = 3,46. Kolejnym krokiem było 

wykonanie porównania: 

F>F

α

 , bo 8>3,46 

Z wykonanego porównania wynika, że należy przyjąć hipotezę H

1

 

 

background image

Kierunek: Informatyka 
Przedmiot: Ekonometria 

10 

Opole 2015 

 

6. Graficzna prezentacja wyników 

 

Dla otrzymanego wzoru określającego model ekonometryczny wykonano porównanie 

rzeczywistego  przebiegu  zmiennej  objaśnianej  z  symulacyjnym  przebiegiem  tej  zmiennej. 

Otrzymane  wyniki  przedstawiono  w  poniższej  tabeli.  Dodatkowo  zaprezentowano  wartość 

otrzymaną w kolejnym kroku (okresie) funkcji predykcyjnej dla danych z 2000 roku. 

 

Rok 

Rzeczywisty Y 

Symulacyjny Y 

2003 

786 

959,4538 

2004 

1000 

1110,029 

2005 

1450 

1302,807 

2006 

1950 

1696,591 

2007 

2270 

2167,408 

2008 

2210 

2438,132 

2009 

2100 

2129,394 

2010 

2000 

2088,224 

2011 

2060 

2081,753 

2012 

2130 

1982,413 

2003 

786 

959,4538 

 

Graficzne porównanie rzeczywistego Y z symulacyjnym: 

 

 

Wykres  przedstawia  średnią  liczbę  emigracji  z  Polski  w  latach  2003  –  2012.  Wykres  został 

sporządzony dokładnie z instrukcjami, które zostały podane na zajęciach. 

0

500

1000

1500

2000

2500

3000

2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

Śred

n

ia

 li

cz

b

emi

gr

ac

ji

 

Rok 

Rzeczywisty Y

Symulacyjny Y

background image

Kierunek: Informatyka 
Przedmiot: Ekonometria 

11 

Opole 2015 

7. Wnioski 

Dzięki  przeprowadzonym  statystyką  t-studenta  i  F  rozkładu  Fischera  Snedecora, 

można  stwierdzić,  że  zmienne  objaśniające  wpływają  na  zmienną  endogeniczną.  W  oby 

przypadkach prawidłowe okazały się hipotezy H

1

 . 

Dzięki graficznemu przedstawieniu modelu, również  można potwierdzić poprawność 

sporządzonego  modelu.  Jak  można  zaobserwować  przebiegi  zmiennej  objaśniającej  i 

symulacyjnej  są  podobne.  Oczywiście  występują  w  nich  drobne  różnice,  jednak  wartości 

predykcyjne są bardzo bliskie realnym.