Ekonometria

Metody ilościowe w ekonomii

statystyka opisowa i matematyczna

programowanie matematyczne

analiza przepływów międzygałęziowych

ek

e o

k no

n me

m t

e ria

analiza szeregów czasowych

teoria gier

ekonomia matematyczna

2

Definicje ekonometrii

…jest nauką i sztuką stosowania metod

statystycznych do mierzenia relacji

ekonomicznych (G. C. Chow)

…to n

a

n u

a k

u a

k

a za

z j

a mu

m j

u ąc

ą a

c

a s

i

s ę

ę u

s

u t

s al

a an

a i

n em

e

,

m z

a

z

a

pomocą metod statystycznych, konkretnych ilościowych prawidłowości zachodzących w Ŝyciu gospodarczym (O. Lange)

…to to, czym zajmują się ekonometrycy

(A. S. Goldberger)

3

Model ekonometryczny

Jest to formalny opis stochastycznej

zaleŜności wyróŜnionej wielkości,

zj

z aw

a isk

s a

a l

ub

u prze

z biegu

u proce

c su

s

u

ekonomicznego od czynników, które

je kształtują, wyraŜony w formie

pojedynczego równania lub układu

równań.

4

Klasyfikacja modeli

jedno- i wielorównaniowe,

liniowe i nieliniowe,

statyczne i dynamiczne,

pr

p zy

z c

y z

c y

z n

y o

n wo-o

- p

o i

p so

s w

o e

w

e i

s

y

s m

y

p

m t

p oma

m t

a yc

y z

c n

z e

n ,

e

proste, rekurencyjne i o równaniach łącznie współzaleŜnych.

5

Klasyfikacja danych

szeregi czasowe: przedstawiają stan

badanego zjawiska w kolejnych

jednostkach czasu

da

d n

a e

n

e p

r

p ze

z k

e r

k ojowe:

e o

pi

p su

s j

u ą

ą s

t

s an

a

n z

j

z aw

a isk

s a

k

a w

us

u t

s al

a ony

n m

y

m c

z

c a

z s

a i

s e,

e a

l

a e

e w

o

dn

d i

n es

e i

s en

e i

n u

u d

o

d

róŜnych obiektów

dane panelowe (przekrojowo-czasowe),

obejmujące obie te płaszczyzny

równocześnie

Ekonometria 110010-0609

6

Model regresji prostej

y = α0 + α1 ⋅ x + ε

i

i

i

y – zmienna objaśniana

i

x – zm

z

i

m en

e n

n a

n

a o

bj

b aś

a n

ś i

n aj

a ąc

ą a

c

i

α – wyraz wolny (stała)

0

α – współczynnik regresji

1

ε – składnik losowy

i

7

Model regresji wielorakiej

y = α0 + α1 ⋅ x 1 + α2 ⋅ x + ...

2

+α ⋅ x + ε

i

i

i

k

ki

i

zmiennych objaśniających moŜe być wiele, ale ich

c l

icz

c b

z a

a nie

e moŜ

o e

Ŝ

e prz

r e

z k

e r

k a

r c

a z

c a

z ć

a

ć licz

c b

z y

y

obserwacji

waŜne pojęcie: liczba stopni swobody

df = n – (k + 1)

stała i współczynniki regresji określane są łącznie mianem parametrów strukturalnych Ekonometria 110010-0609

8

Metoda najmniejszych kwadratów

MNK polega na wyznaczeniu takich oszacowań a wektora parametrów α, dla którego suma kwadratów reszt modelu jest najmniejsza.

Wektor reszt e to wektor róŜnic między

wartościami empirycznymi a teoretycznymi zmiennej objaśnianej:

e = y − yˆ = y − Xa 9

Oszacowania MNK

−1

a

(XT )X XT

=

y

y – wektor wartości zmiennej objaśnianej X – macierz wartości zmiennych

objaśniających

10

Przykład: spoŜycie alkoholu

spoŜycie wódki i innych napojów alkoholowych (oprócz wina i piwa) w przeliczeniu na alkohol 100% w litrach na osobę (dane: GUS):

2001: 1,7

20

2 0

0 2

0 :

2 1

,

1 7

2003: 2,4

2004: 2,5

2005: 2,5

pytanie: o ile średnio rośnie spoŜycie napojów alkoholowych z roku na rok?

11

Przykład: wyniki estymacji

wsp

błąd

t

p

stand

α

1,44

0,22

6,55

0,008

0

α

0,24

0,07

3,43

0,038

1

12

Reszty MNK

MNK polega na wyznaczeniu takich oszacowań a wektora parametrów α, dla którego suma kwadratów reszt modelu jest najmniejsza.

Wektor reszt e to wektor róŜnic między

wartościami empirycznymi a teoretycznymi zmiennej objaśnianej:

e = y − yˆ = y − Xa 13

Przykład: reszty

obs

y

y teoret

reszty

1

1,7

1,68

0,02

2

1,7

1,92

-0,22

3

2,4

2,16

0,24

4

2,5

2,40

0,10

5

2,5

2,64

-0,14

Średnia reszt:

-5,6E-18

14

ZałoŜenia klasycznej MNK

zmienne objaśniające są nielosowe i

nieskorelowane ze składnikiem losowym

macierz zmiennych objaśniających ma

pe

p ł

e ny

n

y r

zą

z d

ą

d k

o

k lum

u

n

m o

n wy:

y r

z(

z X)=

= k

+

k 1 ≤

n

wartość oczekiwania składnika losowego jest równa zero

macierz wariancji i kowariancji wektora składników losowych jest ilorazem

macierzy jednostkowej i stałej

15

ZałoŜenia MNK

z innego punktu widzenia

Sztuka ekonometrii to umiejętność określenia zbioru załoŜeń zarazem dostatecznie

konkretnego i dostatecznie realistycznego, ab

a y

b

y j

ak

a

k n

a

n j

a lep

e i

p ej

e w

yk

y o

k rzy

z s

y t

s ać

a

ć d

o

d st

s ęp

ę n

p e

n

e

dane (E. Malinvaud)

[czyli, w wolnym tłumaczeniu P. Kennedy’ego,

“sztuka wykreślania krzywej linii od

nieuzasadnionych załoŜeń do oczywistych

wniosków”]

16

Własności estymatorów MNK

Na mocy twierdzenia Gaussa – Markowa

estymator KMNK jest estymatorem:

liniowym,

zg

z o

g dn

d y

n m

y

m (

zb

z i

b eŜ

e n

Ŝ y

n m

y

m s

t

s och

c a

h s

a t

s yc

y z

c n

z i

n e

e d

o

d α

),

nieobciąŜonym: E(a) = α,

najefektywniejszym (o najmniejszej

wariancji) w klasie liniowych i

nieobciąŜonych estymatorów

17

Dodatkowe załoŜenie

W celu weryfikacji hipotez statystycznych formułuje się często dodatkowe załoŜenie:

sk

s ł

k ad

a n

d i

n k

k l

oso

s wy

y m

o

m de

d l

e u

u m

a

m

a r

ozk

z ł

k ad

a

d

normalny o wartości oczekiwanej 0 i

skończonej stałej wariancji.

18

Interpretacja współczynników

regresji

Ocena (oszacowanie) a parametru

i

strukturalnego α występującego przy

i

zm

z

i

m en

e n

n e

n j

e X

ozn

z a

n c

a z

c a

z ,

a o

i

le

e p

r

p ze

z c

e i

c ęt

ę ni

n e

e

i

zmieniła się wartość zmiennej objaśnianej, gdy przy nie zmienionych wartościach

innych zmiennych objaśniających (ceteris paribus) wartość zmiennej X wzrosła o

i

jednostkę.

19

Przykład: interpretacja

z kaŜdym kolejnym rokiem spoŜycie wódki i innych napojów alkoholowych (oprócz wina i piwa) w litrach na osobę rośnie średnio o 0,24

litra na osobę w przeliczeniu na alkohol 100% [w model

e u r

eg

e res

e ji

s wi

w el

e orak

a iej

e n

j al

a eŜ

e ał

a o

ł by dodać

a

ć

„ceteris paribus”]

w roku „zerowym” (poprzedzającym zakres próby zastosowanej do estymacji, czyli 2000) spoŜycie wódki i innych napojów alkoholowych wynosiło ok. 1,44 litra na osobę w przeliczeniu na alkohol 100% [w rzeczywistości 2,0 – zmiana trendu!

Por. dane_1_11.xls]

20

Inne metody estymacji

MNW (metoda największej wiarygodności): modele nieliniowe, wielorównaniowe, o

heteroskedastycznym składniku losowym

UMM (

uo

u gó

g lni

n ona

n

a m

e

m t

e oda

d

a m

o

m me

m n

e t

n ów):

:

dane panelowe

MZI (metoda zmiennych

instrumentalnych): zmienne objaśniające

skorelowane ze składnikiem losowym,

modele wielorównaniowe

21

Weryfikacja statystyczna

interpretacja współczynnika determinacji i/lub kryteriów informacyjnych

test stopnia współliniowości zmiennych objaśniających

tes

e t

s y

y ist

s ot

o noś

o c

ś i

c :

podzbioru zmiennych objaśniających

poszczególnych zmiennych objaśniających

testy własności składnika losowego modelu:

autokorelacji

heteroskedastyczności

normalności rozkładu

22

Klasyczny R2

kryterium wewnątrzpróbowe: mierzy

dopasowanie tych obserwacji, które naleŜą do próby, ale nie daje informacji o wartości prognostycznej modelu

niem

e

al

a ej

e ąc

ą a

c

a f

u

f nkc

k j

c a

a licz

c b

z y

y zm

z

ien

e nyc

y h

c

objaśniających → pokusa maksymalizacji R2

przez dodanie kolejnych zmiennych do modelu

interpretowalny jedynie, gdy zaleŜność pomiędzy zmienną objaśnianą a zmiennymi

objaśniającymi jest liniowa, parametry modelu oszacowano MNK, a model zawiera wyraz

wolny

23

Inne współczynniki determinacji

Skorygowany:

uwzględnia liczbę zmiennych i karze za dodawanie zbędnych zmiennych

bar

a d

r zi

z ej

e w

iar

a y

r g

y od

o ny

y niŜ

Ŝ kl

k as

a y

s c

y z

c n

z y

y R2

R

Niescentrowany:

stosowany w modelach szacowanych bez

wyrazu wolnego

Ekonometria 110010-0609

24

Kryteria informacyjne

ilość informacji zawarta w modelu definiowana jest jako odległość danego modelu od

“prawdziwego” i mierzona za pomocą

logarytmu funkcji wiarygodności

idea

e

a k

r

k y

r t

y er

e i

r um info

f r

o m

r

ac

a y

c j

y neg

e o:

o miar

a a

r

a

stanowiąca równowagę między tą odległością a oszczędną specyfikacją modelu

definiowane jako przeciętna wartość logarytmu funkcji wiarygodności skorygowana o róŜnie zdefiniowaną funkcję straty

podstawowe: Akaike (AIC), Schwarza (SIC) 25

Kryteria informacyjne, c.d.

kryterium zarówno wewnątrz-, jak i

pozapróbowe (prognostyczne)

stosowane najczęściej w sytuacji, gdy badane mod

o el

e e

e n

ie

e są

s

ą za

z g

a nieŜ

e d

Ŝ Ŝo

Ŝ n

o e,

e a

a t

eo

e r

o i

r a

a ek

e o

k n

o om

o

ii

nie daje wskazówek co do wyboru

AIC karze za niepotrzebne zmienne w modelu silniej niŜ SIC i skorygowany R2

26

Współczynnik korelacji liniowej

mierzy kierunek i siłę zaleŜności między dwiema zmiennymi X i Y

cov( X Y

,

r

=

XY

)

XY

DX

D

⋅ DY

D

bezwzględna wartość r

świadczy o sile

XY

współzaleŜności zmiennych (stopniu

determinacji wartości jednej zmiennej przez wartości drugiej zmiennej)

27

Współczynnik korelacji, c.d.

jest wielkością niemianowaną

r

= r

XY

YX

jeśli r

= 0, zmienne X i Y są nieskorelowane

XY

jeś

e l

ś i r

< 0,

0 z

m

z

ien

e ne

e X i Y są

s

ą sk

s o

k r

o e

r l

e ow

o an

a e

e

XY

ujemnie

jeśli r

> 0, zmienne X i Y są skorelowane

XY

dodatnio

28

Zapis współczynników korelacji

 r 

 1

L

r

r 

1

12

1 k

 





L

 2 

2

r 1

2

r k

R





R =

1

o = r

 M 

 M

M

O

M 

 







L

r

r

k

r 



1

k 1

k 2



r - współczynnik korelacji między X i X

ij

i

j

r - współczynnik korelacji między Y i X

i

i

29

Zastosowania

współczynników korelacji

model jest koincydentny, jeśli dla kaŜdej zmiennej objaśniającej modelu spełniony jest warunek sgn(r ) = sgn(a ), gdzie a jest

i

i

i

oszacowaniem parametru strukturalnego przy zm

z

ien

e nej

e o

b

o jaś

a n

ś iaj

a ąc

ą e

c j

e Xi

pomiar efektu katalizy, czyli zakłócenia wyników estymacji modelu wskutek

występowania w modelu zmiennych –

katalizatorów

dobór zmiennych objaśniających do modelu metodą Hellwiga

30

Weryfikacja hipotez

hipoteza statystyczna: przypuszczenie co do rozkładu populacji generalnej, którego

prawdziwość oceniana jest na podstawie wyników próby losowej

tes

e t

s s

t

s at

a yst

s ycz

c ny:

: r

eg

e uła

ł

a rozst

s rzygają

a c

ją a

c ,

a jak

ja ie

e

wy

w niki

i p

róby p

ozwa

w l

a ają

a

ją uznać

a

ć s

p

s raw

a d

w zan

a ą

ą

hipotezę za prawdziwą, a jakie – za fałszywą

hipoteza podlegająca weryfikacji nazywana jest hipotezą zerową (H ); jej zaprzeczenie – hipotezą 0

alternatywną (H )

1

hipotezę H uznaje się za prawdziwą w przypadku 1

odrzucenia H0

31

Weryfikacja hipotez, c.d.

obszar krytyczny: jeśli wynik próby naleŜy do tego obszaru, to H jest odrzucana

0

błąd I rodzaju: odrzucenie hipotezy H , która w 0

istocie jest prawdziwa (prawdopodobieństwo α)

błą

ł d

ą II

I

I ro

r d

o za

z j

a u: prz

r y

z j

y ęc

ę i

c e

e hipot

o ez

e y

z

y H , k

t

k ór

ó a

r

a w

0

istocie jest fałszywa (prawdopodobieństwo 1 –

α)

przed przystąpieniem do weryfikacji hipotezy ustala się dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju (najczęściej 1, 5

lub 10%)

32

Parametryczne testy istotności

słuŜą do weryfikacji hipotez o tym, Ŝe parametry rozkładu populacji generalnej

przyjmują ustalone wartości

hi

h po

p tez

e y

z

y m

a

m j

a ą

ą p

o

p st

s ać

a

ć H

: β = β , H : β ≠ β ,

0

β = β , H :

0

1

β ≠ β ,

0

0

1

0

gdzie β jest dowolnym parametrem

rozkładu

najczęściej jesteśmy zainteresowani tylko jednym parametrem rozkładu (średnią) i

konkretną wartością β = 0

0

33

Test istotności zmiennej

H : β = 0

H : β ≠ 0

0

1

Hipoteza zerowa mówi, Ŝe badany parametr, średnio rzecz biorąc, przyjmuje w populacji wartość zero (czyli Ŝe zmienna nie ma

statystycznie istotnego wpływu na zmienną objaśnianą).

34

Test istotności zmiennej, c.d.

do testowania H słuŜy statystyka t-

0

Studenta

jeśli spełnione jest załoŜenie o normalności rozk

z ł

k ad

a u

d

u s

k

s ł

k ad

a n

d i

n ka

k

a l

oso

s weg

e o

g m

o

m de

d l

e u,

u

zmienna losowa t ma rozkład t-Studenta z n-(k+1) stopniami swobody

wartości krytyczne statystyki t-Studenta są stablicowane dla danego poziomu istotności α oraz liczby stopni swobody

Ekonometria 110010-0609

35

Empiryczny poziom istotności

najniŜszy poziom istotności, przy którym naleŜy odrzucić hipotezę zerową

nazywany teŜ krańcowym lub dokładnym poziomem istotności, gdyŜ wyraŜa prawdopodobieństwo popełnienia błędu I rodzaju

w w

ię

i k

ę s

k z

s o

z ś

o c

ś i

c

i pa

p ki

k e

i t

e ó

t w

ó ek

e o

k n

o om

o

et

e r

t y

r c

y z

c n

z yc

y h

c

oznaczany najczęściej jako „wartość p” lub „p-value”

pozwala weryfikować hipotezy o istotności zmiennych modelu bez konieczności wyznaczania statystyk testowych i sięgania do tablic

nie wymaga arbitralnego ustalenia poziomu istotności α

Ekonometria 110010-0609

36

Test istotności modelu

Hipotezę o jednoczesnej istotności wybranego podzbioru zmiennych objaśniających

testuje się przy pomocy dwóch testów dla du

d Ŝ

u y

Ŝ c

y h

c

h p

r

p ób:

b

uogólnionego testu Walda

testu LM (mnoŜnika Lagrange’a)

Ekonometria 110010-0609

37

Test Walda

oprócz modelu podstawowego szacujemy

model rozszerzony, z dodatkowymi

zmiennymi objaśniającymi x

, ...., x

i

k+1

k+m

sprawdzamy, czy są one statystycznie

ist

s otne

n

jeśli składnik losowy ma rozkład normalny, statystyka testu Walda ma rozkład F-Snedecora z r = m oraz r = n-(k+1)-m

1

2

stopniami swobody (gdzie m jest liczbą

dodatkowych zmiennych)

38

Względne błędy szacunku

Opisują precyzję oszacowania konkretnego parametru:

a

S

w

S

j

S

=

a j

a j

Dopuszczalne są błędy względne nie

przekraczające 50%.

39

Test RESET

Regression Specification Error Test;

B.Ramsey [1969]

bardzo ogólny test, wykrywający wiele

bł

b ę

ł dó

d w

ó sp

s e

p cy

c fikacj

c i

j mod

o e

d lu:

u

pominięte zmienne objaśniające

korelację między zmienną objaśniającą a składnikiem losowym

błędną postać funkcyjną

40

Test RESET, c.d.

idea: wiele nieliniowych funkcji moŜna przybliŜyć za pomocą wielomianów; zatem

jeŜeli dodanie do zbioru regresorów ich

wyŜszych potęg znacząco poprawi dopasowanie mod

o el

e u, w

sk

s a

k z

a u

z je

e to

o na

a zł

z e

ł

e dob

o ra

r n

a ie

e jeg

e o

o

postaci funkcyjnej

pozwala wykryć błąd specyfikacji nawet w modelach, w których tradycyjne miary jakości (R2, statystyki istotności, test autokorelacji) dają dobre rezultaty

Ekonometria 110010-0609

41

Test RESET, c.d.

wymaga oszacowania rozszerzonego modelu, zawierającego potęgi wartości teoretycznych wyznaczonych na podstawie wyjściowego

modelu (uwaga: moŜna spodziewać się

współliniowości tych zmiennych, nie naleŜy więc

ę

c p

rz

r e

z s

e a

s d

a za

z ć

a

ć z

z ich

c licz

c b

z ą!

ą )

H : współczynniki przy dodatkowych

0

zmiennych są łącznie równe 0

na podstawie R2 modelu rozszerzonego oblicza się statystykę mnoŜnika Lagrange’a (LM =

n⋅R2) o asymptotycznym rozkładzie χ2 o liczbie stopni swobody równej liczbie dodanych

zmiennych do równania modelu

42

Test Davidsona - McKinnona

sposób sprawdzenia poprawności specyfikacji modelu, zwłaszcza wobec kilku alternatywnych moŜliwości modelowania wybranego zjawiska

model traktowany jest jako kompletny, jeśli ró

r w

ó nan

a ie

e ko

k n

o ku

k re

r n

e cy

c j

y ne

e nie

e tłu

ł mac

a z

c y

z

y

badanego zjawiska lepiej

szacowane są dwa modele o identycznej

postaci funkcyjnej i tej samej liczbie zmiennych objaśniających, ale o rozłącznych zbiorach zmiennych

43

Test Davidsona - McKinnona

(1)

= α0 +α1 ⋅

+...

1

+α ⋅

+ ε

i

Y

X i

k

X ki

i

(2)

= β0 + β1 ⋅

+...

1

+ β ⋅

+ξ

i

Y

Z i

k Z ki

i

Po

o os

o z

s a

z c

a o

c w

o an

a iu mod

o el

e u (1)

1 t

eo

e r

o e

r t

e yc

y z

c n

z e

e

wartości zmiennej Y dodawane są jako zmienna objaśniająca do modelu (2); jeśli zmienna ta okazuje się statystycznie nieistotna, model (2) jest traktowany jako kompletny. Procedura ta jest następnie powtarzana po odwróceniu

kolejności modeli (1) i (2).

Ekonometria 110010-0609

44

Zasada Goodharta

Wszystkie modele ekonometryczne

prze

z st

s aj

a ą

ą d

zi

z ał

a a

ł ć

a

ć w m

o

m me

m nc

n i

c e, g

dy

zaczynają być stosowane dla potrzeb

polityki gospodarczej

45