Mamy 9 lat i 11 parametrów ( 10 czynników odziaływujących na produkcję + parametr wolny)
ODP: nie można oszacować parametrów ponieważ nie może być więcej obserwacji niż parametrów do oszacowania
ZADANIE 1
Posługując się modelem: Zi = α0 + α1 Pi + Ui
zysk przedsiębiorstwa w mln złotych produkcja w tys. sztuk
oraz wiedząc, że:
W przypadku zaprzestania produkcji firma poniosła by stratę w wysokości pół miliona złotych
Wzrost produkcji o 2000 sztuk powoduje zysk o 200 tys. Złotych przy ceteris paribus
Posługując się modelem należy odpowiedzieć na pytania:
Przy jakiej wielkości produkcji przedsiębiorstwo nie przynosi strat
Jaki zysk uzyska przedsiębiorstwo jeżeli produkcji wyniesie 10 tys. Sztuk
Z podpowiedzi:
α0 = -0,5 mln
z interpretacji: 1000 szt. wzrośnie o α1
ANALOGICZNIE:
Z podpowiedzi: 2000 szt. wzrost o 200 tys.
α1 = 0,1
otrzymujemy model: Zi = -0,5 + 0,1Pi + Ui
Odpowiedzi na pytania:
0 = -0,5 + 0,1Pi
0,5 = 0,1Pi
Pi = 5 Pi = 5 tysięcy sztuk
Pół miliona
ZADANIE 2
Y | 30 | 20 | 36 | 24 | 40 |
---|---|---|---|---|---|
X1 | 4 | 3 | 6 | 4 | 8 |
X2 | 10 | 8 | 11 | 9 | 12 |
Y – roczne zarobki w tysiącach dolarów
X1 – liczba lat nauki po ukończeniu szkoły średniej
X2 – liczba lat przepracowanych w firmie
Oszacować parametry strukturalne zmiennej Y względem zmiennych X1 i X2
*** aby można było używać modelu wszystkie zmienne muszą być koincydentne. Jeżeli choćby jedna zmienna nie jest koincydentna to trzeba wyrzucić ten model, nie można z nim pracować.
*** jeżeli bardzo byśmy chcieli to oszacować to trzeba by usunąć X1 ze wzoru i oszacować model jeszcze raz tylko dla X2
ZADANIE 3
Wydajność pracy robotników Y mierzona liczba sztuk wyprodukowanych wyrobów w ciągu dnia roboczego.
X1 – staż pracy w latach
X2 - liczba osób na utrzymaniu
Zinterpretuj parametry
a1 = 3,78 wzrost stażu pracy o rok powoduje przeciętny wzrost wydajności pracy o 3,78 sztuki pod warunkiem, że liczba osób na utrzymaniu nie zmieni się (ceteris paribus)
*** gdy mamy dużo zmiennych i aby nie wymieniać wszystkich, że pozostają bez zmian wystarczy dodać na koniec założenie „ceteris paribus”
a2 = 1,97 wzrost liczby osób na utrzymaniu o 1 osobę spowoduje przeciętny wzrost wydajności pracy
o 1,97 przy założeniu, że staż pracy nie ulegnie zmianom
a0 = 15,44 jest to średnia wydajności pracy nowozatrudnionego robotnika bez stażu pracy i nie mający nikogo na utrzymaniu
y* = - 5 + 5X1 - 12X2 + 2,5X3
y – wartość mieszkania w tysiącach złotych
X1 – powierzchnia mieszkania w m2
X2 – numer piętra
X3 – liczba okien
a1 = 5 wzrost powierzchni mieszkania o 1m2 spowoduje przeciętny wzrost wartości mieszkania o 5 tys. Złotych przy założeniu ceteris paribus
wynika z tego, że 5 tys. To średnia cena za m2 mieszkania
a2 = -12 z każdym kolejnym piętrem średnia cena mieszkania maleje przeciętnie o 12 tysięcy złotych (ceteris paribus)
a3 = 2,5 wraz z każdym kolejnym oknem cena mieszkania rośnie przeciętnie o 2,5 tys. Zł. (ceteris paribus)
a0 = -5 średnia cena mieszkania znajdującego się na parterze o zerowej powierzchni i bez okien
Należy oszacować parametry strukturalne modelu liniowego
ĆWICZENIA 5
ZADANIE 1
Na podstawie danych w tabeli oszacować model:
Y | 1 | 3 | 0 | 3 | 5 | 6 |
---|---|---|---|---|---|---|
X1 | 0 | 2 | 0 | 0 | 0 | 2 |
X2 | 0 | 2 | 2 | 2 | 2 | 0 |
Wiadomo również, że:
Yi* = 1,1X1 – 0,1X2 + 2,4 $\left( X^{T}X \right)^{- 1} = \begin{bmatrix} 0,2 & 0,5 & - 0,2 \\ & 0,2 & \\ & - 0,3 & 0,7 \\ \end{bmatrix}\ $
Należy znaleźć macierz wariancji i kowariancji ocen parametrów strukturalnych oraz obliczyć średnie błędy szacunku
MACIERZ WARIANCJI I KOWARIANCJI OCEN PARAMETRÓW STRUKTURALNYCH
D2(a) = Su2 * (X’ X) -1
Uzupełniamy macierz odwrotna korzystamy z założenia, że musi być symetryczna
$$\left( X^{T}X \right)^{- 1} = \begin{bmatrix}
0,2 & 0,5 & - 0,2 \\
0,5 & 0,2 & - 0,3 \\
- 0,2 & - 0,3 & 0,7 \\
\end{bmatrix}$$
Musimy obliczyć reszty modelu, ale do tego potrzebne są wartości teoretyczne
Y1* = 1,1 * 0 – 0,1 * 0 + 2,4 = 2,4 wyliczamy każdą wartość i wstawiamy do tabeli
Y | 1 | 3 | 0 | 3 | 5 | 6 |
---|---|---|---|---|---|---|
X1 | 0 | 2 | 0 | 0 | 0 | 2 |
X2 | 0 | 2 | 2 | 2 | 2 | 0 |
Yi* | 2,4 | 2,4 | 2,2 | 2,2 | 2,2 | 4,6 |
Obliczamy reszty i ich kwadraty
Ui = yi – yi*
U1 = 1 – 2,2 = - 1,4
Y | 1 | 3 | 0 | 3 | 5 | 6 | |
---|---|---|---|---|---|---|---|
X1 | 0 | 2 | 0 | 0 | 0 | 2 | |
X2 | 0 | 2 | 2 | 2 | 2 | 0 | |
Yi* | 2,4 | 2,4 | 2,2 | 2,2 | 2,2 | 4,6 | |
Ui | -1,4 | -1,4 | -2,2 | 0,8 | 2,8 | 1,4 | RAZEM |
Ui2 | 1,96 | 1,96 | 4,84 | 0,64 | 7,84 | 1,96 | 19,2 |
Obliczamy WARIANCJE RESZTOWĄ
Su2 = $\frac{\mathbf{1}}{\mathbf{n - k}}$ $\sum_{\mathbf{i = 1}}^{\mathbf{n}}\mathbf{u}$02
n – ilość obserwacji
k – liczna szacowanych parametrów
n = 6 k = 3 (1,1 ; -0,1 ; 2,4 ze modelu na wartości teoretyczne)
$$S^{2}u = \ \frac{19,2}{6 - 3} = 6,4$$
$$\text{Su} = \ \sqrt{6,4} = 2,53$$
*** S2u ≠Su2 wariancja z u ≠ odchylenie u-kwadrat
Interpretacja odchylenia:
2,53 jednostki – o tyle przeciętnie odchylają się in plus lub in minus rzeczywiste wartości realizacji zmiennej endogenicznej od wartości teoretycznej w szacowanym modelu
!!! gdy mamy określone jednostki w zadaniach trzeba je napisać w interpretacji !!!
$$D^{2}u = \ \begin{bmatrix}
1,28 & 3,2 & - 1,28 \\
3,2 & 1,28 & - \ 1,92 \\
- 1,28 & - 1,92 & 4,48 \\
\end{bmatrix}$$
1,28 = 6,4 * 0,2
Su2 D11 z (XTX)−1
ŚREDNIE BŁEDY SZACUNKU PARAMETRÓW
Mówią nam o precyzji oszacowania parametrów
Bierzemy wartości z głównej przekątnej macierzy wariancji i kowariancji
D2(a1) = 1,28 D(a1) = $\sqrt{1,28} = 1,13$
*** skąd wiemy, że akurat ten błąd szacunku (na pierwszym miejscu) jest do a1 ???
Ponieważ w podstawowym modelu najpierw mamy parametr 1, potem 2 itd. i na końcu wyraz wolny
Interpretacja błędów:
Szacując parametr α1 na poziomie 1,1 (a1) mylimy się średnio o 1,13
Y* = 1,1 X1 – 0,1 X2 + 2,4 jest zła precyzja ponieważ błędy są większe niż parametry
(1,13) (1,13) (2,12)
ZADANIE 2
Oszacowano model y* = - 0,13 + 0,51X1 + 0,29 X2. Ocena wariancji składnika losowego wynosi 0,45. Wiadomo, że $\sum_{i = 1}^{20}{{(yi - ysr)}^{2} = 102,3}$. Obliczyć i zinterpretować współczynnik determinacji.
WSPÓŁCZYNNIK DETERMINACJI
R2 = 1 - δ2
WSPÓŁCZYNNIK ZBIEŻNOŚCI
φ2 = $\frac{\sum_{\mathbf{i = 1}}^{\mathbf{n}}\mathbf{\text{ui}}^{\mathbf{2}}}{\sum_{\mathbf{i = 1}}^{\mathbf{n}}{\mathbf{(\ }\mathbf{Y}_{\mathbf{i}}\mathbf{-}\overline{\mathbf{Y}}\mathbf{\ )}}^{\mathbf{2}}}$
*** Część modelu ekonometrycznego a jego ocena (część – ocena)
parametr – ocena
α - a1
składnik losowy – reszta modelu
ξt - Ut
wariancja składnika losowego – wariancja resztowa
S2(ξt ) - S2u
Wiemy, że ocena wariancji składnika losowego równa się: Su2 = 0,45 = $\frac{1}{n - k}$ $\sum_{i = 1}^{n}u$02
Oraz wiemy, że n=20 , k = 3
$\sum_{}^{}{\text{ui}^{2} = 0,45*\left( 20 - 3 \right) = 7,65}$
Możemy obliczyć współczynnik zbieżności
$\varphi^{2} = \ \frac{7,65}{102,3} = 0,074$ = 7%
Interpretacja:
7% wariancji/zmienności zmiennej endogenicznej/objaśnianej nie zostało wyjaśnione przez szacowany model ekonometryczny
lub
7% wariancji zmiennej endogenicznej zależy od innych czynników nie uwzględnionych w modelu
Wyliczamy współczynnik determinacji
R2 = 1 – 7 = 93%
Interpretacja:
93% wariancji jest wyjaśniona przez oszacowany model ekonometryczny
SKORYGOWANY WSPÓŁCZYNNIK DETERMINACJI
Oblicza się go gdy:
chcemy porównać modele o różnej ilości zmiennych objaśniających
liczna obserwacji jest niewiele większa od liczby szacowanych parametrów
Obliczamy skorygowany współczynnik determinacji
= $1 - \ \frac{20 - 1}{20 - 2 - 1}*\left( 1 - 0,93 \right) = 92\%$
Interpretacja
Jest taka sama jak dla R2
92% wariancji jest wyjaśniona przez oszacowany model ekonometryczny
ZADANIE 2.13
$X^{T}X = \ \left\lbrack \begin{matrix} 0 & 1 & 0 \\ 0 & 0 & 0 \\ 1 & 1 & 1 \\ \end{matrix}\text{\ \ \ }\begin{matrix} 0 & 0 & 1 \\ 1 & 1 & 0 \\ 1 & 1 & 1 \\ \end{matrix}\text{\ \ \ }\begin{matrix} 1 & 1 \\ 2 & 2 \\ 1 & 1 \\ \end{matrix} \right\rbrack$ * $\begin{bmatrix} \begin{matrix} 0 & 0 & 1 \\ 1 & 0 & 1 \\ 0 & 0 & 1 \\ \end{matrix} \\ \begin{matrix} 0 & 1 & 1 \\ 0 & 1 & 1 \\ 1 & 0 & 1 \\ \end{matrix} \\ \begin{matrix} 1 & 2 & 1 \\ 1 & 2 & 1 \\ \end{matrix} \\ \end{bmatrix}$ = $\begin{bmatrix} 4 & 4 & 4 \\ 4 & 10 & 6 \\ 4 & 6 & 8 \\ \end{bmatrix}$
$$\det{A = \ }\left| \begin{matrix}
\begin{matrix}
4 & 4 & 4 \\
4 & 10 & 6 \\
4 & 6 & 8 \\
\end{matrix} \\
\begin{matrix}
4 & 4 & 4 \\
4 & 10 & 6 \\
\end{matrix} \\
\end{matrix} \right| = 320 + 96 + 96 - 160 - 144 - 128 = 80$$
$D_{11} = \ \left| \begin{matrix} 10 & 6 \\ 6 & 8 \\ \end{matrix} \right| = 44$ $D_{12} = \ - \ \left| \begin{matrix} 4 & 6 \\ 4 & 8 \\ \end{matrix} \right| = \ - 8$ $\ D_{13} = \ \left| \begin{matrix} 4 & 10 \\ 4 & 6 \\ \end{matrix} \right| = - 16$
$D_{21} = \ - \left| \begin{matrix} 4 & 4 \\ 6 & 8 \\ \end{matrix} \right| = \ - 8$ $D_{22} = \ \left| \begin{matrix} 4 & 4 \\ 4 & 8 \\ \end{matrix} \right| = 16$ $D_{23} = \ - \left| \begin{matrix} 4 & 4 \\ 4 & 6 \\ \end{matrix} \right| = \ - 8$
$D_{31} = \ \left| \begin{matrix} 4 & 4 \\ 10 & 6 \\ \end{matrix} \right| = \ - 16$ $D_{32} = \ - \left| \begin{matrix} 4 & 4 \\ 4 & 6 \\ \end{matrix} \right| = \ - 8$ $D_{33} = \ \left| \begin{matrix} 4 & 4 \\ 4 & 10 \\ \end{matrix} \right| = \ 24$
$A_{D} = \ \begin{bmatrix} 44 & - 8 & - 16 \\ - 8 & 16 & - 8 \\ - 16 & - 8 & 24 \\ \end{bmatrix}$ $A_{D}^{T} = \begin{bmatrix} 44 & - 8 & - 16 \\ - 8 & 16 & - 8 \\ - 16 & - 8 & 24 \\ \end{bmatrix}\ $
$${(X^{T}X)}^{- 1} = \ \begin{bmatrix}
0,55 & - 0,1 & - 0,2 \\
- 0,1 & 0,2 & - 0,1 \\
- 0,2 & - 0,1 & 0,3 \\
\end{bmatrix}$$
$$X^{T}Y = \ \left\lbrack \begin{matrix}
0 & 1 & 0 \\
0 & 0 & 0 \\
1 & 1 & 1 \\
\end{matrix}\text{\ \ \ }\begin{matrix}
0 & 0 & 1 \\
1 & 1 & 0 \\
1 & 1 & 1 \\
\end{matrix}\text{\ \ \ }\begin{matrix}
1 & 1 \\
2 & 2 \\
1 & 1 \\
\end{matrix} \right\rbrack*\begin{bmatrix}
2 \\
3 \\
2 \\
4 \\
4 \\
3 \\
5 \\
5 \\
\end{bmatrix} = \ \begin{bmatrix}
16 \\
28 \\
28 \\
\end{bmatrix}$$
$${(X^{T}X)}^{- 1}*\ \ X^{T}Y = \ \begin{bmatrix}
0,55 & - 0,1 & - 0,2 \\
- 0,1 & 0,2 & - 0,1 \\
- 0,2 & - 0,1 & 0,3 \\
\end{bmatrix}*\ \begin{bmatrix}
16 \\
28 \\
28 \\
\end{bmatrix} = \ \begin{bmatrix}
0,4 \\
1,2 \\
2,4 \\
\end{bmatrix}$$
yi = 0,4X1 + 1,2X2 + 2,4 + Ui
yi* = 0,4X1 + 1,2X2 + 2,4
Interpretacje:
yi | Yi* | ui | Ui2 |
---|---|---|---|
2 | 2,4 | -0,4 | 0,16 |
3 | 2,8 | 0,2 | 0,04 |
2 | 2,4 | -0,4 | 0,16 |
4 | 3,6 | 0,4 | 0,16 |
4 | 3,6 | 0,4 | 0,16 |
3 | 2,8 | 0,2 | 0,04 |
5 | 5,2 | -0,2 | 0,04 |
5 | 5,2 | -0,2 | 0,04 |
RAZEM | 0 | 0,8 |
ĆWICZENIA 6 6.05
!!! na ostatnich ćw kolokwium 3.06 !!!
Z wykresu da się odczytać jaka występuje autokorelacja:
+ + + + +
- - - - -
Autokorelacja ujemna Autokorelacja dodatnia
(znaki zmiennych są na przemian) (znaki zmiennych występują w ciągach)
Można również odczytać czy wariancja jest stała
STAŁA: gdy zmienne odchylają się mniej więcej o ta samą wartość
ZMIENNA: gdy wartość odchyleń zmienia się w czasie
Im więcej mamy reszt tym więcej informacji możemy odczytać z wykresu
Na podstawie ZAD. 2.13 (obliczenia bierzemy z poprzednich ćw)
TEST F na istotność parametrów strukturalnych
Badamy wszystkie parametry ale bez wyrazu wolnego
Testując parametry testujemy jednocześnie czy zmienne są dobrze dobrane do modelu
Możliwe decyzje:
ODRZUCAMY: co najmniej jedna zmienna wpływa istotnie na zmienną objaśnianą (nie wiemy która zmienna)
BRAK PODSTAW DO ODRZUCENIA: zmienne nie wpływają istotnie na zmienna objaśnianą
Yt = 0,4X1t + 1,2X2t + 2,4 + Ut
H0 : α1 = α2 = 0
H1 : α1 ≠ 0 v α2 ≠ 0
$F = \ \frac{R^{2}}{1 - \ R^{2}}*\ \frac{N - K - 1}{K}$ K – liczba zmiennych objaśniających
N – liczba obserwacji
Potrzebne obliczenia:
R2 = 1 - δ2 = 1 - $\frac{\sum_{i = 1}^{n}{(\ Y_{t} - Y_{t}^{*}\ )}^{2}}{\sum_{i = 1}^{n}{(\ Y_{t} - \overline{Y}\ )}^{2}}$ = $1 - \ \frac{0,8}{10} = 92\%$
Ӯ = 3,5
Yt - Ӯ | -1,5 | -0,5 | -1,5 | 0,5 | 0,5 | -0,5 | 1,5 | 1,5 | RAZEM |
---|---|---|---|---|---|---|---|---|---|
(yt – Ӯ)2 | 2,25 | 0,25 | 2,25 | 0,25 | 0,25 | 0,25 | 2,25 | 2,25 | 10 |
N=8 K=2 R2 = 0,92
$$F = \ \frac{0,92}{1 - 092}*\ \frac{8 - 2 - 1}{2} = \mathbf{28,75}$$
DECYJZA
Trzeba mieć:
Poziom istostności
Stopnie swobody
m1 = k =2
m2 = n-k-1 = 5
F 0,05; 2,5 = 5,79 odczytane z tablic rozkładu F-Snedecora
Na wykresie: INTERPRETACJA:
Odrzucamy hipotezę zerową na korzyść alternatywnej więc
przynajmniej jeden parametr jest istotnie statystycznie
więc jedna zmienna istotnie wpływa na zmienną objaśnianą
5,79 28,75
TEST T-STUDENTA na istotność parametrów strukturalnych modelu
Testujemy istotność poszczególnych parametrów
Możliwe decyzje
ODRZUACAMY: parametr jest istotny statystycznie
BRAK PODSTAW DO ODRZUCENIA: parametr nie wpływa istotnie na zmienne
H0 : α1 = 0
H1 : α1 ≠ 0
$t = \ \frac{a_{1}}{D\left( a_{1} \right)}$
Średni błąd szacunku
Żeby obliczyć D(a1) trzeba najpierw wyliczyć wariancję:
$$S^{2}u = \ \frac{0,8}{5} = 016$$
$D^{2}\left( a \right) = 0,16*\left( X^{T}X \right)^{- 1} = 0,16*\ \begin{bmatrix} 0,55 & - 0,1 & - 0,2 \\ - 0,1 & 0,2 & - 0,1 \\ - 0,2 & - 0,1 & 0,3 \\ \end{bmatrix} = \ \begin{bmatrix} 0,088 & & \\ & 0,032 & \\ & & 0,048 \\ \end{bmatrix}$
Z poprzednich ćw reszty nie musimy liczyć bo nie jest potrzebna
$$D\left( a \right) = \ \sqrt{0,088} = 0,3$$
$$t = \ \frac{0,4}{0,3} = \mathbf{1,33}$$
t 0,05; 5 = 2,571 odczytane z tablic t-Studenta
N=8 k=3
DECYZJA: brak podstaw do odrzucenia hipotezy zerowej więc zmienna X1 nie
wpływa istotnie na zmienną objaśnianą
-2, 571 1,33 2,571
ZAD. 5.23
Jak widać z zadania reszty muszą być uporządkowane w czasie
!!! my nie liczymy autokorelacji rzędu pierwszego !!!
TEST DURBINA - WATSONA na istotność autokorelacji rzędu pierwszego
H0 : ρ1 = 0
H1 : ??? musimy to określić
*** ρ (ro) – współczynnik autokorelacji odchyleń losowych (1 – rzędu pierwszego)
Skąd można wiedzieć jaka będzie hipoteza alternatywna:
Wykres
Wyliczenie współczynnika autokorelacji a1 (my tego nie umiemy)
obliczenie statystyki d
Mamy ujemna autokorelacje więc musimy obliczyć d
$d = \ \frac{\sum_{t = 2}^{n}{(u_{t} - \ u_{t - 1})^{2}}}{\sum_{t = 1}^{n}u_{t}^{2}}$ v d = 2 (1 – r1)
Ut | U(t-1) | Ut – U(t-1) | ( Ut – U(t-1) )2 | U t^2 |
---|---|---|---|---|
-2 |
|
- | 4 | |
3 | -2 | 5 | 25 | 9 |
-1 | 3 | -4 | 16 | 1 |
2 | -1 | 3 | 9 | 4 |
-4 | 2 | -6 | 36 | 16 |
2 | -4 | 6 | 36 | 4 |
0 | 2 | -2 | 4 | 0 |
1 | 0 | 1 | 1 | 1 |
-1 | 1 | -2 | 4 | 1 |
0 | -1 | 1 | 1 | 0 |
-4 | 0 | -4 | 16 | 16 |
3 | -4 | 7 | 49 | 9 |
-2 | 3 | -5 | 25 | 4 |
3 | -2 | 5 | 25 | 9 |
0 | 3 | 3 | 9 | 0 |
RAZEM | 256 | 78 |
$$d = \ \frac{256}{78} = \mathbf{3,28}$$
Z wykresu ujemny
Z wyliczeń ujemny
d | m |
---|---|
0 | 1 |
2 | 0 |
4 | -1 |
d
<0;4> (0;2) – dodatni (2;4) – ujemny
wracamy do hipotezy
H0 : ρ1 = 0
H1 : ρ1 < 0 występuje istotna ujemna autokorelacja składnika losowego rzędu pierwszego
Hipoteza alternatywna jest „ujemna” więc liczymy d’
d’ = 4 – d = 0,72 wynik porównujemy z tablicami Durbina-Watsona
α = 0,05 n=15 (liczba obserwacji) k=2 (liczba zmiennych)
dolna wartość krytyczna: dL = 0,95 górna wartośćkrytyczna: dU = 1,54
d’ = 0,72 d’<dL
Możliwe rozwiązania:
D ≤ d’l hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej
d’l < d < d’u obszar niekonkluzywności testu = test nie daje odpowiedzi
d ≥ d’u brak podstaw do odrzucenia hipotezy zerowej
DECYZJA:
Odrzucamy hipotezę zerową na korzyść alternatywnej więc występuje istotna ujemna autokorelacja rzędu pierwszego
ZAD. 5.5
TEST SERII na losowość reszt
DANE: reszty | -5 | 4 | 2 | -1 | 4 | -6 | 2 | -3 | 8 | -5 | 7 | -5 | 1 | -3 | -4 | 4 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Znak reszt | b | a | a | b | a | b | a | b | a | b | a | b | a | b | b | a |
Seria | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
H0 : ξt jest losowy (= postać analityczna modelu jest dobrze dobrana)
H1 : ξt nie jest losowy
Reszta „+” a n1 = liczna reszt „+” = liczba symboli a = 8
Reszta „-„ b n2 = liczba reszt „-„ = liczna symboli b = 8
S = liczba serii = 14
S1* α/2 , n1, n2
S2* 1 – (α/2) , n1, n2
S1* = 5 S2* = 12
Możliwe rozwiązania:
S1* < S < S2* brak podstaw do odrzucenia
S ≥ S2* v S ≤ S1* odrzucamy hipotezę zerową
DECYZJA:
Odrzucamy hipotezę zerową na korzyść alternatywnej więc składnik nie jest losowy, a postać analityczna modelu została źle dobrana
ZAD. 5.6
Na podstawie danych w ciągu reszt:
Domyślamy się, że występuje autokorelacja i jest ona dodatnia
Ciąg nie jest losowy bo występuje pewien porządek (najpierw same ujemne potem same dodatnie)
ZAD. 5.7
Na podstawie danych w ciągu reszt:
Domyślamy się, że występuje autokorelacja i jest ona dodatnia (ujemna, dodatnia itd.)
Ciąg nie jest losowy bo występuje pewien porządek (plus, minus, plus, minus itd)
W obu przypadkach znaki/liczby są wymieszane ale są uporządkowane, więc nie może występować losowości
TEST JARQUE_BERA na sprawdzenie czy reszty mają rozkład normalny
ĆWICZENIA 7
5. TEST JB na normalność rozkładu
H0 : F(ui) = FN(ui)
H1: F(ui) ≠ FN(ui)
Sprawdzamy czy dystrybuanta reszt jest zgodna z dystrybuanta rozkładu normalnego czy też nie
$$JB = \ \ N(\ \frac{1}{6}\beta_{1} + \ \frac{1}{24}(\beta_{2} - \ 3)^{2})$$
$\sqrt{\beta_{1}} = \ \frac{\sum_{}^{}{U_{t}}^{3}}{N*\ S^{2}U_{t}}$ $\beta_{2} = \ \frac{\sum_{}^{}{U_{t}}^{4}}{N*\ S^{4}U_{t}}$
Ut | -1,3 | 0,9 | -0,4 | 0,8 | 1,1 | -0,2 | -0,9 | 2,3 | -1 | -1,2 | -0,1 | SUMA |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Ut^2 | 1,69 | 0,81 | 0,16 | 0,64 | 1,21 | 0,04 | 0,81 | 5,29 | 1 | 1,21 | 0,01 | 13,1 |
Ut^3 | -2,197 | 0,729 | -0,064 | 0,512 | 1,331 | -0,008 | -0,729 | 12,167 | -1 | -1,728 | -0,001 | 9,012 |
Ut^4 | 2,8561 | 0,6561 | 0,0256 | 0,4096 | 1,4641 | 0,0016 | 0,6561 | 27,9841 | 1 | 2,0736 | 0,0001 | 37,1279 |
$$Su_{t} = \ \sqrt{\frac{13,1}{11}} = 1,1909$$
$$\sqrt{\beta_{1}} = \ \frac{9,012}{11*\ \left( 1,09 \right)^{3}} = 0,63$$
β1 = (0, 63)2 = 0, 3969 = 0, 4
$$\beta_{2} = \ \frac{37,127}{11*\ {(1,09)}^{4}}$$
$$JB = \ \ 11(\ \frac{1}{6}*0,4 + \ \frac{1}{24}\left( 2,39 - \ 3)^{2} \right) = 0,9038$$
χ0, 12(2) = 4, 6 Porównujemy z rozkładem χ2 o poziomie istotności 0,1 i stopniach swobody 2
DECYZJA:
Brak podstaw do odrzucenia hipotezy zerowej więc rozkład odchyleń losowych jest normalny/losowy
PROGNOZOWANIE
METODY BUDOWY PROGNOZ:
Punktowa
yTP = XTT * a
XT – kolumnowy wektor przyszłych realizacji zmiennych objaśniających
T – numer okresu
Przedziałowa
P { yTP − tα |Uα * VT ≤ yTP ≤ yTP + tα |Uα* VT } = β
tα |Uα – wybieramy to lub to gdy rozkład odchyleń jest normalny tα dla n<30; Uα dla n ≥ 30
Jeżeli rozkład nie jest normalny to wstawiamy wzór: $U_{\alpha} = \ \sqrt{\frac{\beta}{1 - \beta}}$
β – wiarygodność prognozy
VT – średni błąd prognozy/predykcji
VT2 = XTT * D2(a)XT + S2U
ŚREDNI BŁĄD PREDYKCJI
mówi o ile średnio w długim ciągu prognoz (okresie czasu) rzeczywiste realizacje zmiennej prognozowanej będą odchylać się od ustalonych prognoz
jest to błąd ex-ante
Model oszacowany jest na 17 lat
Y z daszkiem (^) to to samo co Y z gwiazdką (*)
t = 20 badamy prognozę na rok 2004 a to jest 20 obserwacja
METODA PUNKTOWA
y = 200 + 18 (6 + 0,2 *20) + 10 (20 + 0,5 *20) = 680
$a = \ \begin{bmatrix} 200 \\ 18 \\ 10 \\ \end{bmatrix}$ $X_{T} = \ \left\lbrack \ \begin{matrix} 1 \\ 10 \\ 30 \\ \end{matrix}\ \right\rbrack$ na pierwszym miejscu jest to co stoi przy parametrze wolnym czyli 1
Wektor ocen strukturalnych modelu taka kolejność liczb ponieważ tak są ustawione przy Y: pierwszy jest parametr wolny
$$y_{T}^{P} = \ \begin{bmatrix}
1 & 10 & 30 \\
\end{bmatrix}*\ \begin{bmatrix}
200 \\
18 \\
10 \\
\end{bmatrix} = \mathbf{680}$$
METODA PRZEDZIAŁOWA
$$V_{T}^{} = \sqrt{\begin{bmatrix}
1 & 10 & 30 \\
\end{bmatrix}*\ \begin{bmatrix}
2 & 0 & - 1 \\
0 & 4 & 1 \\
- 1 & 1 & 5 \\
\end{bmatrix}*\ \begin{bmatrix}
1 \\
10 \\
30 \\
\end{bmatrix} + 331} = \ \sqrt{\begin{bmatrix}
- 28 & 70 & 159 \\
\end{bmatrix}*\ \ \begin{bmatrix}
1 \\
10 \\
30 \\
\end{bmatrix} + 331} = \ \sqrt{5498 + 331} = 76,35 = 76$$
$\sqrt{2}$ jest to średni błąd szacunku dla parametru wolnego : bierzemy to z głównej przekątnej macierzy wariancji i kowariancji
Średni względny błąd prognozy
mówi czy odchylenie jest duże
podany jest procentach
$${V_{T}}^{*} = \ \frac{V_{T}}{y_{T}^{P}}*100\%$$
$${V_{T}}^{*} = \ \frac{76}{680}*100 = 11\%$$
t0, 1; 14 = 1, 762 bierzemy to ponieważ mamy małą próbę
n - k = liczba obserwacji – liczba szacowanych parametrów
680 – 1,762 * 75,98 = 546,12
680 + 1,762 * 75,98 = 813,88
P { 546 ≤ yTP ≤ 813 = β
ODPOWIEDZ:
Przedział o końcach 546 i 813 jednostek takich jak przy X z prawdopodobieństwem 0,9 pokryje nieznaną wartość przyszłej realizacji zmiennej na rok 2004