background image

str. 23

 

 

MODELE ZMIENNEJ JAKOŚCIOWEJ 

 

Zmienne  jakościowe  –  zmienne,  których  wartości  mają  postać  niemierzalnych  „kategorii”, 

np. zmienna płeć przyjmuje wartości „mężczyzna” lub „kobieta”.  

 

W  modelach  ekonometrycznych  zmienne  te  jakościowe  najczęściej  zamieniane  są  na 

zmienne zero-jedynkowe, np. 





 0 dla mężczyzn oraz 



 1 dla kobiet. 

 

Model  zmiennej  jakościowej  –  model  ekonometryczny,  w  którym  zmienną  objaśnianą  jest 

zmienna jakościowa (zer-jedynkowa) 

 

 

LINIOWY MODEL PRAWDOPODOBIEŃSTWA (LMP) 

 

W LMP szacowane są parametry modelu liniowego: 

 





 



 



     



 



 

 

gdzie 





 jest zmienną zero-jedynkową.  

 

Powstają dwa pytania: 

1/ Jak interpretujemy wartość teoretyczną modelu LMP?  

     Przykładowo, co oznacza że 





 0,7 dla zmiennej płeć? 

2/ Jak interpretujemy parametry modelu LMP? 

 

Aby odpowiedzieć na te pytania zauważmy, że: 

 





 



  



 1  1   



 0  0  



 1  



 

 

Oznacza to, że wartość teoretyczna modelu LMP określa prawdopodobieństwo, że zmienna 

objaśniana 





 przyjmie wartość 1.  

 

Tym samym parametr 



 interpretujemy jako wzrost prawdopodobieństwa zdarzenia 





 1 

w wyniku wzrostu 



 o jednostkę. 

 

 

 

background image

str. 24

 

 

LINIOWY MODEL PRAWDOPODOBIEŃSTWA, CD. 

 
PRZYKŁAD 

Oszacowano model LMP dla wiarygodności klientów banku następującej postaci: 

 





 0.66   0.005



 

gdzie: 




 - wiarygodność kredytobiorców  

   (





 1 dla osób regularnie płacących raty oraz 



 0 dla pozostałych kredytoborców) 



 - wysokość zarobków (w tys PLN rocznie).  

 

Zinterpretuj wartość teoretyczną dla klienta, dla którego 

 40 oraz 



 100.  

Jaka jest interpretacja parametru 0.005? 

 


 0.66   0.005  40  0.86 - prawdopodobieństwo regularnej spłaty rat wynosi 86% 





 0.66   0.005  100  1.16 - prawdopodobieństwo regularnej spłaty rat wynosi 116% 

 

Parametr  0.005  interpretujemy  jako  wzrost  prawdopodobieństwa,  że  klient  będzie 

regularnie spłacał raty w wyniku wzrostu rocznych zarobków o 1 tys PLN. 

 

WADY LMP 

 

1/  Wartości  teoretyczne  modelu,  interpretowane  jako  prawdopodobieństwo,  mogą  być 

większe od 1 lub mniejsze od 0. 

2/ Problemy z heteroskedastycznością składnika losowego:  

można wykazać, że 

!







  



1 " 



, czyli zależy od wartości zmiennych objaśniających. 

 

Wykres: Wartości teoretyczne i rzeczywiste w modelu LMP 

 

 

background image

str. 25

 

 

MODEL LOGITOWY 

 

W modelu logitowym prawdopodobieństwo jest dane funkcją logistyczną: 

 







#

$%

&#

$%

gdzie

 

'



 



 



     

(

 

 

A zatem wartości teoretyczne należą do przedziału [0,1] dla wszystkich wartości 

'



Warto zauważyć, że 

1 " 





&#

$%

, co implikuje, że ILORAZ SZANS wynosi: 

 





1 " 



 )

*

%

 

zaś wartość tzw LOGITU jest równa: 

 

ln -





1 " 



.  '



 



 



     



 

Interpretacja parametrów 



/

 jest stosunkowo trudna.  

Interpretujemy natomiast EFEKT KRAŃCOWY, dany wzorem: 

 

0



0

/

 

/

 



 1 " 



określający jak jednostkowa zmiana 

/

 wpływa na prawdopodobieństwo 





.  

Uwaga: w wydrukach komputerowych podawane są efekty krańcowe dla średniej wartości 





 

w próbie, liczone wg wzoru: 



/

 1



 1 " 1



 

MODEL PROBITOWY 

 

W modelu probitowym prawdopodobieństwo jest dane zależnością: 





 Φ'



,  

gdzie 

'



 



 



     

(

 zaś

 Φ jest dystrybuantą rozkładu normalnego.  

Tak jak w modelu logitowym wartości teoretyczne należą do przedziału [0,1] dla wszystkich 

wartości 

'



.  

Model probitowy jest stosowany substytucyjnie z modelem logitowym, gdyż teoretyczne 

wartości prawdopodobieństwa oraz dopasowanie modelu do danych jest zbliżone. W 

przypadku oszacowań parametrów, zachodzi zależność: 





456(

7 1,7  



895:(

 

background image

str. 26

 

 

MIARY DOPASOWANIA W MODELU LOGITOWYM/PROBITOWYM 

 

;<=>?@ " A

B

 

 

W  modelu  logitowym  nie  moŜna  stosować  zwykłego  współczynnika  determinacji 

C



  ze 

względu na nieliniowość.  
Stosuje się tzw. 

DEFGHI " A

B

 określany takŜe jako 

JKLMHHFN A

B

  

O)PQR " C



 1 "

ln S

TU

ln S

TV

 

 
gdzie 

S

TU

 

 

jest  wartością  funkcji  wiarygodności  dla  modelu  pełnego,  natomiast 

S

TV

  dla 

modelu zredukowanego do wyrazu wolnego.  

 

TABLICA TRAFNOŚCI 

Drugą miarą dopasowania jest tzw. tablica trafności. W celu skonstuowania tablicy trafności 
liczymy teoretyczne wartości dla 





, czyli prawdopodobieństwa 





 oraz wypełniamy tabelę: 

 

 

Model 

Dane 





 1 





 0 





 1 

W

 

W



 





 0 

W



 

W



 

 
Powstaje  jednak  pytanie,  kiedy  przyjąć,  Ŝe  model  wskazuje  na 





 1?  Istnieją  dwie 

dominujące metody. 
1/ zasada standardowa:  





 1 gdy 



X 0,5 

2/ metoda optymalnej wartości granicznej (metoda Cramera): 





 1 gdy 



X Y. 

 

 

 

background image

str. 28

 

 

EKONOMETRIA SZEREGÓW CZASOWYCH

 

 

Proces  stochastyczny – zbiór zmiennych losowych {



(

 uporządkowany zgodnie z indeksem 

czasu 

Z. 

Szereg czasowy – pojedyncza realizacja procesu stochastycznego w próbie, dla  

Z  1,2, … , ] 

 

Przykład: 

Temperatura notowana 22 listopada o godzinie 10:00 przed wejściem do SGH 

Proces stochastyczny: 



(

^ _5,4



 dla każdego Z 

Szereg czasowy: 



`

 6,7; 

b

 1,2; 

c

 "3,7; 

e

 12,3 

 

Przykłady procesów stochastycznych 

(Gaussowski) proces białego szumu 



(

 

(

,  

gdzie 



(

^ _0, f



 oraz gRh

(

, 

(i

  0 dla j k 0 

 

Proces błądzenia losowego 



(

 

(i

 

(

 

 

Proces autoregresyjny rzędu 

; - AR(;) 



(

 



 



(i

     

U



(iU

 

(

 

Proces średniej ruchomej rzędu 

l – MA(l) 



(

 

(

 m



(i

     m

n



(i

 

 

Autoregresyjny proces średniej ruchomej – ARMA(

;, l) 



(

 



 



(i

     

U



(iU

 

(

m



(i

     m

n



(i

background image

str. 29

 

 

STACJONARNOŚĆ 

Proces ściśle stacjonarny:  

proces stochastyczny, którego wszystkie własności statystyczne nie zmieniają się w czasie  

 

Proces słabo stacjonarny: 

proces  stochastyczny,  dla  którego  wartość  oczekiwana,  wariancja  oraz  autokowariancja  nie 

zmieniają się w czasie, tj.: 



(

  o dla Z  1,2, … , ] 

!





(

  f



 dla 

Z  1,2, … , ] 

pRh

(

, 

(i

  q

 dla 

Z  1,2, … , ] 

 

Stacjonarność procesu AR(1) 

Proces  



(

 



 



(i

 

(

 jest stacjonarny wtedy i tylko wtedy gdy 

|

| s 1.  

W pozostałych przypadkach proces jest niestacjonarny. 

 

Wynika to z faktu, że proces stacjonarny 



(

 musi powracać do swojej średniej wartości 

o.  

Oznacza to, że wpływ szoku 



(

 powinien wygasać w czasie, tj. 

lim

vw

xy

z{|

x}

z

 0.  

W przypadku procesu AR(1) zachodzi natomiast zależność 

xy

z{|

x}

z

 



  

  

 

 

background image

str. 30

 

 

Test Dickeya-Fullera (DF) 

Aby  zweryfikować  hipotezę,  że  proces 



(

  jest  niestacjonarny,  można  zastosować  m.in.  test  DF.  W 

wersji podstawowej, proces AR(1)  



(

 



 



(i

 

(

 jest przekształcany do postaci: 

Δ

(

 o   

(i

 

(

 

[Warto zauważyć, że 

o  



 zaś 

  

]. Następnie weryfikowany jest zespół hipotez: 

€



:   0 " W‚)OZƒp„RWƒ…WRść 

(

€

:  s 0 " OZƒp„RWƒ…WRść 

(

       

 

Do weryfikacji powyższych hipotez wykorzystywana jest statystyka Dickeya-Fullera postaci: 

5:4



‰Š

‹

Œ

która  ma  rozkład  Dickeya  Fullera,  który  został  stablicowany  w  tzw.  tablicach  McKinnona. 

Wnioskowanie jest następujące:  

5:4

 !ˆ

Ž



 

odrzucamy 

€



,  czyli 



(

 jest stacjonarny (zapisujemy to jako 



(

^ 0)  

5:4

X !ˆ

Ž



 

nie ma podstaw do odrzucenia 

€



,  czyli 



(

 jest niestacjonarny  

 

Wersje testu Dickeya-Fullera 

wersja bez stałej i bez trendu 

Równanie testowe: 

Δ

(

 

(i

 

(

 

wersja ze stałej i bez trendu 

Równanie testowe: 

Δ

(

 o



 

(i

 

(

 

wersja ze stałej i trendem 

Równanie testowe: 

Δ

(

 o



 o

Z   

(i

 

(

 

 

Stopień zintegrowania szeregu czasowego 

Jeżeli w teście DF nie odrzuciliśmy 

€



, to należy znaczy, że proces 



(

 jest niestacjonarny. W 

takim  przypadku  możemy  testować  stopień  zintegrowania  szeregu 



(

.  W  tym  celu  liczymy 

przyrost 

Δ

(

 i za pomocą testu DF sprawdzamy, czy ten szereg jest stacjonarny. Jeżeli tak, to 

mówimy, że 



(

 jest niestacjonarny, zintegrowany w stopniu 1 i zapisujemy jako 



(

^ 1. W 

przeciwnym przypadku liczymy kolejny przyrost 

Δ





(

 i stosujemy test DF, itd.