Zadanie 14
Liczba telegramów nadanych na 100 osób yt oraz liczba abonentów telefonii przewodowej na 1000 osób xt w Polsce w latach 1992 - 2000 kształtowała się następująco:
Rok | 1992 | 1993 | 1994 | 1995 | 1996 | 1997 | 1998 | 1999 | 2000 |
---|---|---|---|---|---|---|---|---|---|
yt | 20 | 17 | 15 | 13 | 11 | 10 | 9 | 8 | 7 |
xt | 102,5 | 124,7 | 150,8 | 175,4 | 196,1 | 219,1 | 240,8 | 266,7 | 297,9 |
xt - abonentów telefonii przewodowej na 1000 osób
yt - liczba telegramów nadanych na 100 osób
1. Na podstawie danych oszacuj parametry liniowego modelu przyczynowo - skutkowego.
yt = α0 + α1∙ xt1 + α2∙ xt2 + ... + αk ∙ xtk + ξt
yt = α0 + α1∙ xt + ξt
1992; | t = 1 | 20 = α0 + α1∙ 102,5 + ξ1 | |
---|---|---|---|
1993 | t = 2 | 17 = α0 + α1∙ 124,7 + ξ2 | |
1994; | t = 3 | 15 = α0 + α1∙ 150,8 + ξ3 | |
1995 | t = 4 | 13 = α0 + α1∙ 175,4 + ξ4 | |
1996; | t = 5 | 11 = α0 + α1∙ 196,1+ ξ5 | |
1997; | t = 6 | 10 = α0 + α1∙ 219,1 + ξ6 | |
1998 | t = 7 | 9 = α0 + α1∙ 240,8 + ξ7 | |
1999; | t = 8 | 8 = α0 + α1∙ 266,7 + ξ8 | |
2000; | t = 9 | 7 = α0 + α1∙ 297,9 + ξ9 |
y = x α + ξ
20 | |
---|---|
17 | |
15 | |
13 | |
y = | 11 |
10 | |
9 | |
8 | |
7 |
1 1 1 1 1 1 1 1 1 |
102,5 124,7 150,8 175,4 196,1 219,1 240,8 266,7 297,9 |
|
---|---|---|
x = | ||
ξ1 | |
---|---|
ξ2 | |
ξ3 | |
ξ4 | |
ξ = | ξ5 |
ξ6 | |
ξ7 | |
ξ8 | |
ξ9 |
α = | α0 |
---|---|
α1 |
Zakładając, że spełnione są klasyczne założenia modelu regresji liniowej wyznaczamy estymator nieznanych parametrów wykorzystując klasyczną metodę najmniejszych kwadratów.
a = (xT ∙ x)-1 ∙ (xT ∙ y)
t | yt | xt | xt2 |
yt ∙ xt | ŷt | (yt – ŷt )2 | (yt – ўt )2 |
---|---|---|---|---|---|---|---|
1 | 20 | 102,5 | 10506,25 | 2050 | 17,926426 | 4,299709 | 60,493831 |
2 | 17 | 124,7 | 15550,09 | 2119,9 | 16,372714 | 0,393488 | 22,827163 |
3 | 15 | 150,8 | 22740,64 | 2262 | 14,546053 | 0,206068 | 7,716051 |
4 | 13 | 175,4 | 30765,16 | 2280,2 | 12,824373 | 0,030845 | 0,604939 |
5 | 11 | 196,1 | 38455,21 | 2157,1 | 11,375642 | 0,141107 | 1,493827 |
6 | 10 | 219,1 | 48004,81 | 2191 | 9,765941 | 0,054784 | 4,938271 |
7 | 9 | 240,8 | 57984,64 | 2167,2 | 8,247223 | 0,566673 | 10,382715 |
8 | 8 | 266,7 | 71128,89 | 2133,6 | 6,43456 | 2,450602 | 17,827159 |
9 | 7 | 297,9 | 88744,41 | 2085,3 | 4,250966 | 7,557188 | 27,271603 |
110 | 1774 | 383880,1 | 19446,3 | 101,743899 | 15,700464 | 153,555559 |
xT = $\left\lbrack \begin{matrix} 1 & 1 \\ 102,5 & 124,7 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 150,8 & 175,4 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 196,1 & 219,1 \\ \end{matrix}\begin{matrix} \ & 1 & 1\ \ \ \\ \ & 240,8 & 266,7\ \ \ \ \\ \end{matrix}\begin{matrix} 1 \\ 297,9 \\ \end{matrix} \right\rbrack$
xT ∙ x = $\left\lbrack \begin{matrix} 1 & 1 \\ 102,5 & 124,7 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 150,8 & 175,4 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 196,1 & 219,1 \\ \end{matrix}\begin{matrix} \ & 1 & 1\ \ \ \\ \ & 240,8 & 266,7\ \ \ \ \\ \end{matrix}\begin{matrix} 1 \\ 297,9 \\ \end{matrix} \right\rbrack$ ∙$\begin{bmatrix} \begin{matrix} \begin{matrix} 1 \\ \begin{matrix} \begin{matrix} 1 \\ 1 \\ \end{matrix} \\ 1 \\ 1 \\ \end{matrix} \\ 1 \\ \end{matrix} \\ \begin{matrix} 1 \\ 1 \\ \end{matrix} \\ 1 \\ \end{matrix} & \begin{matrix} \begin{matrix} 102,5 \\ \begin{matrix} \begin{matrix} 124,7 \\ 150,8 \\ \end{matrix} \\ 175,4 \\ 196,1 \\ \end{matrix} \\ 219,1 \\ \end{matrix} \\ \begin{matrix} 240,8 \\ 266,7 \\ \end{matrix} \\ 297,9 \\ \end{matrix} \\ \end{bmatrix}$ =
= $\begin{bmatrix} 9 & 1774 \\ 1774 & 383880,1 \\ \end{bmatrix}$
Wyznacznik:
$\begin{bmatrix} 9 & 1774 \\ 1774 & 383880,1 \\ \end{bmatrix}$= 9 ∙ 383880,1 – 1774 ∙ 1774 = 3454920,9 – 3147076 = 307844,9
A-1 = $\frac{1}{|A|}$ ∙ |Aij|T =$\ \frac{1}{307844,9}\begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \\ \end{bmatrix}\ $=$\ \frac{1}{307844,9}$ ∙$\begin{bmatrix} 383880,1 & - 1774 \\ - 1774 & 9 \\ \end{bmatrix}$=$\begin{bmatrix} 1,246992 & - 0,005763 \\ - 0,005763 & 0,000029 \\ \end{bmatrix}$
A11 = (-1)(1+ 1) ∙ 383880,1= 383880,1
A12 = (-1)(1+ 2) ∙ 1774 = - 1774
A21 = (-1)(2+ 1) ∙ 1774 = -1774
A11 = (-1)(2 + 2) ∙ 9 = 9
xT ∙y=$\left\lbrack \begin{matrix} 1 & 1 \\ 102,5 & 124,7 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 150,8 & 175,4 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 196,1 & 219,1 \\ \end{matrix}\begin{matrix} \ & 1 & 1\ \ \ \\ \ & 240,8 & 266,7\ \ \ \ \\ \end{matrix}\begin{matrix} 1 \\ 297,9 \\ \end{matrix} \right\rbrack$∙ $\begin{bmatrix} 20 \\ \begin{matrix} \begin{matrix} 17 \\ \begin{matrix} 15 \\ 13 \\ 11 \\ \end{matrix} \\ 10 \\ \end{matrix} \\ 9 \\ \begin{matrix} 8 \\ 7 \\ \end{matrix} \\ \end{matrix} \\ \end{bmatrix} = \begin{bmatrix} 110 \\ 19446,3 \\ \end{bmatrix}$
a = (xT ∙ x)-1 ∙ (xT ∙ y)= $\begin{bmatrix}
1,246992 & - 0,005763 \\
- 0,005763 & 0,000029 \\
\end{bmatrix}\ $∙$\ \begin{bmatrix}
110 \\
19446,3 \\
\end{bmatrix}$ = =$\begin{bmatrix}
1,246992 \bullet 110 + ( - 0,005763) \bullet 19446,3 \\
- 0,005763\ \bullet 110 + \ 0,000029 \bullet \ 19446,3 \\
\end{bmatrix} = \begin{bmatrix}
137,16912 - 112,069027 \\
- 0,63393 + \ 0,563943 \\
\end{bmatrix}$=$\ \begin{bmatrix}
25,100093 \\
- 0,069987 \\
\end{bmatrix}$
Model przyjmuje postać:
yt = a0 + a1 ∙ xt
yt = 25, 100093 − 0, 069987 ∙ xt
y1 = 25, 100093 − 0, 069987∙ 102,5 = 25, 100093 – 7,1736675 = 17,926426
y2 = 25, 100093 − 0, 069987∙ 124,7 = 25, 100093 - 8,7273789 = 16,372714
y3 = 25, 100093 − 0, 069987∙ 150,8 = 25, 100093 - 10,5540396 = 14,546053
y4 = 25, 100093 − 0, 069987∙ 174,5 = 25, 100093 - 12,2757198 = 12,824373
y5 = 25, 100093 − 0, 069987∙ 196,1 = 25, 100093 - 13,7244507 = 11,375642
y6 = 25, 100093 − 0, 069987 ∙ 219,1 = 25, 100093- 15,3341517 = 9,765941
y7 = 25, 100093 − 0, 069987 ∙ 240,8 = 25, 100093- 16,8528696 = 8,247223
y8 = 25, 100093 − 0, 069987 ∙ 266,7 = 25, 100093- 18,6655329 = 6,43456
y9 = 25, 100093 − 0, 069987 ∙ 297,9 = 25, 100093- 20,8491273 = 4,250966
2. Oceń dopasowanie modelu do danych rzeczywistych:
a) wariancja składnika resztowego (losowego)
S2 = $\frac{\mathbf{1}}{\mathbf{N}\mathbf{-}\mathbf{K}\mathbf{-}\mathbf{1}}\sum_{\mathbf{t = 1}}^{\mathbf{N}}\mathbf{\ }$(yt – ŷt)2 gdzie: N – liczba obserwacji na podstawie których budujemy model
K - liczba zmiennych objaśniających
yT – wartość rzeczywista zmiennej
ŷT – wartość wyliczona z modelu
S2 = $\frac{1}{N - K - 1}\sum_{t = 1}^{N}\ $(yt – ŷt)2 = $\frac{1}{9 - 1 - 1}\ $∙ 15,700464 = $\frac{15,700464\ }{7}$ = 2,242923
b) odchylenie standardowe składnika resztowego (losowego)
Informuje o ile średnio wartość rzeczywista zmiennej objaśnianej różni się od wyliczonej z modelu.
S = $\sqrt{\mathbf{S}^{\mathbf{2}}}$
S = $\sqrt{\mathbf{S}^{\mathbf{2}}}$ = $\sqrt{2,242923}$ = 1,497639
c) ocena macierzy wariancji i kowariancji estymatorów parametrów modelu
Wariancję estymatorów parametrów znajdują się na głównej przekątnej. Pierwiastki z nich o ocena średnich błędów szacunków parametrów modelu.
D2(a) = S2 ∙ (xT ∙ x)-1
D2(a) = S2 ∙ (xT ∙ x)-1 = 2,242923 ∙ $\begin{bmatrix} 1,246992 & - 0,005763 \\ - 0,005763 & 0,000029 \\ \end{bmatrix}$ = $\begin{bmatrix} 2,796907 & - 0,012926 \\ - 0,012926 & 0,000065 \\ \end{bmatrix}$
D(a0) = $\sqrt{2,796907}$ = 1,6729396
D(a1) = $\sqrt{0,000065}$ = 0,008062
d) współczynnik wyrazistości(zmienności)
Informuje, jaki procent średniej stanowi jej odchylenie. Model jest tym lepszy im niższa wartość współczynnika
W = $\frac{\mathbf{S}}{\mathbf{U}}$ ∙ 100 [%]
Ў = $\frac{y_{t}}{N}$ $= \ \frac{110}{9}$ = 12,222222
W = $\frac{S}{U}$ ∙ 100 [%] = $\frac{1,497639}{12,222222}$ ∙ 100 [%] = $\frac{149,7639}{12,222222}$ [%] = 12,253410 [%]
e) współczynnik zbieżności
Informuje, jaka część całkowitej zmienności zmiennej objaśnianej nie jest wyjaśniona przez model. Bliższa zera wartość informuje o lepszym dopasowaniu modelu.
φ2 = $\frac{\sum_{\mathbf{t = 1}}^{\mathbf{N}}\mathbf{\ }\mathbf{(}\mathbf{y}_{\mathbf{t}}\mathbf{\ }\mathbf{}\mathbf{\ }\mathbf{y}_{\mathbf{t}}\mathbf{)}\mathbf{\ }^{\mathbf{2}}\mathbf{\ }}{\sum_{\mathbf{t = 1}}^{\mathbf{N}}\mathbf{\ }\mathbf{(}\mathbf{y}_{\mathbf{t}}\mathbf{\ }\mathbf{}\mathbf{\ }\mathbf{U}_{\mathbf{t}}\mathbf{)}\mathbf{\ }^{\mathbf{2}}}$
φ2 = $\frac{\sum_{\mathbf{t = 1}}^{\mathbf{N}}\mathbf{\ }\mathbf{(}\mathbf{y}_{\mathbf{t}}\mathbf{\ }\mathbf{}\mathbf{\ }\mathbf{y}_{\mathbf{t}}\mathbf{)}\mathbf{\ }^{\mathbf{2}}\mathbf{\ }}{\sum_{\mathbf{t = 1}}^{\mathbf{N}}\mathbf{\ }\mathbf{(}\mathbf{y}_{\mathbf{t}}\mathbf{\ }\mathbf{}\mathbf{\ }\mathbf{U}_{\mathbf{t}}\mathbf{)}\mathbf{\ }^{\mathbf{2}}}$ = $\frac{15,700464\ }{153,555559}$ = 0,102246
f) współczynnik determinacji
Wartość współczynnika determinacji powinna być bliska jedynki.
R2 = 1 - φ2
R2 = 1 - φ2 = 1 - 0,102246 = 0,897754
g) weryfikacji istotności parametrów modelu
Przy założeniu, że składnik losowy modelu ma rozkład N (0; δ2) weryfikuje się hipotezę o istności każdego parametru.
H0 [αi = 0]
H1 [αi ≠ 0]
Wykorzystujemy w tym celu statystykę:
ti = $\frac{\mathbf{a}\mathbf{i}}{\mathbf{D}\mathbf{(}\mathbf{\text{ai}}\mathbf{)}}$ gdzie: ai – ocena parametru stojącego przy i- tej zmiennej
D(ai) – ocena średniego błędu szacunku parametru αi
ti = $\frac{ai}{D(\text{ai})}$ = $\frac{- 0,069987\ }{0,008062}\ $= - 8,681097
Z tablicy t – studenta dla (N – K – 1) stopni swobody oraz dla zadanego poziomu istotności α = 0,05 odczytuje się wartość krytyczną tα
N – K – 1 = 9 – 1 – 1 = 7
tα = 2,36462
|−8,681097| ≤ |2,36462| zatem nie ma podstaw do odrzucenia hipotezy zerowej. Oznacza to, że i- ta zmienna objaśniająca nieistotnie wpływa na zmienną objaśnianą i powinna być usunięta z modelu.
3. Wyznacz prognozę liczby nadanych telegramów na 100 osób na następny rok. Wartość zmiennej objaśniającej ustal na poziomie rzeczywistym 320,4 abonentów na 1000 osób.
yt = 25, 100093 − 0, 069987 ∙ xt
x10 = 320,4
y10* = 25, 100093 − 0, 069987 ∙ 320,4 = 25, 100093 - 22,4238348 = 2,6762582
4. Oceń dopuszczalność prognozy wyznaczając bezwzględną i względną błąd prognozy ex ante.
a) wariancja prognozy
VT2= S2 [x* ∙ (xT ∙ x)-1 ∙x*T + 1]
x* = $\begin{bmatrix} 1 & 320,4 \\ \end{bmatrix}$
V102 = 2, 242923∙ ($\begin{bmatrix} 1 & 320,4 \\ \end{bmatrix}$ ∙ $\begin{bmatrix} 1,246992 & - 0,005763 \\ - 0,005763 & 0,000029 \\ \end{bmatrix}$ ∙ $\begin{bmatrix} 1 \\ 320,4 \\ \end{bmatrix}$ + 1) =
= 2, 242923 ∙ ($\begin{bmatrix} 1,246992 - 1,846465 & - 0,005763\ + \ 0,009292 \\ \end{bmatrix}$ ∙ $\begin{bmatrix} 1 \\ 320,4 \\ \end{bmatrix}$ + 1) =
= 2, 242923 ∙ ($\begin{bmatrix} - 0,58789 & 0,003529 \\ \end{bmatrix}$ $\begin{bmatrix} 1 \\ 320,4 \\ \end{bmatrix}\ $+ 1) = 2, 242923 ∙ ($\begin{bmatrix} - 0,58789 + \ 1,130692 \\ \end{bmatrix}\ $+1) = = 2, 242923 ∙ (0,542802 + 1) = 2, 242923 ∙ 1,542802 = 3,460386
b) bezwzględny błąd prognozy ex ante
VT = $\sqrt{{\mathbf{V}_{\mathbf{T}}^{\mathbf{2}}}^{\mathbf{\ }}}$
V10 = $\sqrt{{3,460386}^{\ }}$ = 1,860211
Prognoza jest tym lepsza i bardziej dokładna im niższy bezwzględny błąd prognozy ex ante. Błąd ten jest wystarczający do wyboru spośród kilku prognoz otrzymanych z różnych modeli tej samej zmiennej prognozy najlepszej.
c) względny błąd prognozy ex ante
Służy do porównania dokładności prognoz różnych zmiennych.
ηT = $\frac{\mathbf{V}_{\mathbf{T}}}{\mathbf{y}_{\mathbf{T}}^{\mathbf{*}}}$ ∙ 100 %
η10 = $\frac{V_{10}}{y_{10}^{*}}$ ∙ 100 % = $\frac{{1,860211}_{\ }}{{2,6762582}_{\ }^{\ }}$ ∙ 100 % = $\frac{{1,860211}_{\ }}{{2,6762582}_{\ }^{\ }}$ = 69,50790 %
η12 = 69,50790 %, czyli prognoza jest niedopuszczalna, gdyż mieści się w przedziale ηT > 10%
5. Wyznacz prognozę przedziałową na poziomie istotności α = 0,05
yT* - u ∙ VT < yT < yT* + u ∙ VT gdzie: yT – prognoza zmiennej y na okres T
P (yT* - u ∙ VT < yT < yT* + u ∙ VT) = 1 – α VT – bezwzględny błąd prognozy ex ante
u = tα – gdy rozkład reszt jest normalny lub
u = $\sqrt{\frac{1}{\alpha}}$ - gdy rozkład reszt jest nieznany
2, 6762582 - 2,36462 ∙ 1, 860211 < y12 < 2, 6762582 + 2,36462 ∙ 1, 860211
2, 6762582– 4,398692 < y12 < 2, 6762582+ 4,398692
-1,722434 < y12 < 7,074950
6. Oceń trafność prognozy wiedząc, że liczba nadanych telegramów w roku 2001 wyniosła 6 na 100 osób. Oceń przydatność modelu w dalszym prognozowaniu.
a) bezwzględny błąd prognozy ex post
Informuje o ile wartość rzeczywista różni się od wyliczonej z modelu.
qT = yT - yT*
q10 = y10 - y10* = 6 - 2, 6762582 = 3,323742
b) względny błąd prognozy ex post
Informuje, jaki procent wartości rzeczywistej stanowi różnica pomiędzy wartością rzeczywistą a wyznaczoną z modelu.
ψT = $\frac{\mathbf{y}_{\mathbf{T}}\mathbf{-}\mathbf{\ }\mathbf{y}_{\mathbf{T}}^{\mathbf{*}}}{\mathbf{y}_{\mathbf{T}}}$ ∙ 100 %
ψ10 = $\frac{y_{10} - \ y_{10}^{*}}{y_{10}}$ ∙ 100% = $\frac{{6\ - \ \ 2,6762582\ \ }_{\ }}{7}$ ∙ 100% = $\frac{{3,323742}_{\ }}{7}$ ∙ 100% = $\frac{{332,3742}_{\ }}{7}$ % = 47,482029 %
c) współczynnik Janusowy
Określa stopień dopasowania prognozy i modelu do danych rzeczywistych.
J2 = $\frac{\frac{\mathbf{1}}{\mathbf{T}\mathbf{-}\mathbf{N}}\mathbf{\ }\mathbf{\Sigma}_{\mathbf{t = \ \ N + 1}}^{\mathbf{T}}\mathbf{\ (}\mathbf{y}_{\mathbf{t}}\mathbf{-}\mathbf{\ }\mathbf{y}_{\mathbf{t}}^{\mathbf{*}}\mathbf{)}\mathbf{\ }^{\mathbf{2}}}{\frac{\mathbf{1}}{\mathbf{N}}\mathbf{\ }\mathbf{\Sigma}_{\mathbf{t = \ \ 1}}^{\mathbf{N}}\mathbf{\ (}\mathbf{y}_{\mathbf{t}}\mathbf{-}\mathbf{\ }\mathbf{y}_{\mathbf{t}}^{\mathbf{\ }}\mathbf{)}\mathbf{\ }^{\mathbf{2}}}$
J2 = $\frac{\frac{1}{10 - 9}\ \Sigma_{t = \ \ 10}^{10}\ (y_{t} - \ y_{t}^{*})\ ^{2}}{\frac{1}{9}\ \bullet \ 21,152791}$ = $\frac{\ (y_{t} - \ y_{t}^{*})\ ^{2}}{2,350310}$ = $\frac{\ (6\ - \ \ 2,6762582\ )\ ^{2}}{2,350310}$ = $\frac{(3,323742)\ ^{2}}{2,350310}$ = $\frac{11,047261}{2,350310}$ = 4,700342
J2 > 1 zatem dotychczasowe prognozy nie są trafne i model nie może być wykorzystywany w dalszym ciągu do prognozowania.