Zadanie

Zadanie 14

Liczba telegramów nadanych na 100 osób yt oraz liczba abonentów telefonii przewodowej na 1000 osób xt w Polsce w latach 1992 - 2000 kształtowała się następująco:

Rok 1992 1993 1994 1995 1996 1997 1998 1999 2000
yt 20 17 15 13 11 10 9 8 7
xt 102,5 124,7 150,8 175,4 196,1 219,1 240,8 266,7 297,9

xt - abonentów telefonii przewodowej na 1000 osób

yt - liczba telegramów nadanych na 100 osób

1. Na podstawie danych oszacuj parametry liniowego modelu przyczynowo - skutkowego.

yt = α0 + α1∙ xt1 + α2∙ xt2 + ... + αk ∙ xtk + ξt

yt = α0 + α1∙ xt + ξt

1992; t = 1 20 = α0 + α1∙ 102,5 + ξ1
1993 t = 2 17 = α0 + α1∙ 124,7 + ξ2
1994; t = 3 15 = α0 + α1∙ 150,8 + ξ3
1995 t = 4 13 = α0 + α1∙ 175,4 + ξ4
1996; t = 5 11 = α0 + α1∙ 196,1+ ξ5
1997; t = 6 10 = α0 + α1∙ 219,1 + ξ6
1998 t = 7 9 = α0 + α1∙ 240,8 + ξ7
1999; t = 8 8 = α0 + α1∙ 266,7 + ξ8
2000; t = 9 7 = α0 + α1∙ 297,9 + ξ9

y = x α + ξ

20
17
15
13
y = 11
10
9
8
7

1

1

1

1

1

1

1

1

1

102,5

124,7

150,8

175,4

196,1

219,1

240,8

266,7

297,9

x =
ξ1
ξ2
ξ3
ξ4
ξ = ξ5
ξ6
ξ7
ξ8
ξ9
α = α0
α1

Zakładając, że spełnione są klasyczne założenia modelu regresji liniowej wyznaczamy estymator nieznanych parametrów wykorzystując klasyczną metodę najmniejszych kwadratów.

a = (xT ∙ x)-1 ∙ (xT ∙ y)


t yt xt
xt2
yt ∙ xt ŷt (yt – ŷt )2 (yt – ўt )2
1 20 102,5 10506,25 2050 17,926426 4,299709 60,493831
2 17 124,7 15550,09 2119,9 16,372714 0,393488 22,827163
3 15 150,8 22740,64 2262 14,546053 0,206068 7,716051
4 13 175,4 30765,16 2280,2 12,824373 0,030845 0,604939
5 11 196,1 38455,21 2157,1 11,375642 0,141107 1,493827
6 10 219,1 48004,81 2191 9,765941 0,054784 4,938271
7 9 240,8 57984,64 2167,2 8,247223 0,566673 10,382715
8 8 266,7 71128,89 2133,6 6,43456 2,450602 17,827159
9 7 297,9 88744,41 2085,3 4,250966 7,557188 27,271603
110 1774 383880,1 19446,3 101,743899 15,700464 153,555559

xT = $\left\lbrack \begin{matrix} 1 & 1 \\ 102,5 & 124,7 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 150,8 & 175,4 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 196,1 & 219,1 \\ \end{matrix}\begin{matrix} \ & 1 & 1\ \ \ \\ \ & 240,8 & 266,7\ \ \ \ \\ \end{matrix}\begin{matrix} 1 \\ 297,9 \\ \end{matrix} \right\rbrack$

xT ∙ x = $\left\lbrack \begin{matrix} 1 & 1 \\ 102,5 & 124,7 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 150,8 & 175,4 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 196,1 & 219,1 \\ \end{matrix}\begin{matrix} \ & 1 & 1\ \ \ \\ \ & 240,8 & 266,7\ \ \ \ \\ \end{matrix}\begin{matrix} 1 \\ 297,9 \\ \end{matrix} \right\rbrack$$\begin{bmatrix} \begin{matrix} \begin{matrix} 1 \\ \begin{matrix} \begin{matrix} 1 \\ 1 \\ \end{matrix} \\ 1 \\ 1 \\ \end{matrix} \\ 1 \\ \end{matrix} \\ \begin{matrix} 1 \\ 1 \\ \end{matrix} \\ 1 \\ \end{matrix} & \begin{matrix} \begin{matrix} 102,5 \\ \begin{matrix} \begin{matrix} 124,7 \\ 150,8 \\ \end{matrix} \\ 175,4 \\ 196,1 \\ \end{matrix} \\ 219,1 \\ \end{matrix} \\ \begin{matrix} 240,8 \\ 266,7 \\ \end{matrix} \\ 297,9 \\ \end{matrix} \\ \end{bmatrix}$ =

= $\begin{bmatrix} 9 & 1774 \\ 1774 & 383880,1 \\ \end{bmatrix}$

Wyznacznik:

$\begin{bmatrix} 9 & 1774 \\ 1774 & 383880,1 \\ \end{bmatrix}$= 9 ∙ 383880,1 – 1774 ∙ 1774 = 3454920,9 – 3147076 = 307844,9

A-1 = $\frac{1}{|A|}$|Aij|T =$\ \frac{1}{307844,9}\begin{bmatrix} A_{11} & A_{12} \\ A_{21} & A_{22} \\ \end{bmatrix}\ $=$\ \frac{1}{307844,9}$$\begin{bmatrix} 383880,1 & - 1774 \\ - 1774 & 9 \\ \end{bmatrix}$=$\begin{bmatrix} 1,246992 & - 0,005763 \\ - 0,005763 & 0,000029 \\ \end{bmatrix}$

A11 = (-1)(1+ 1) ∙ 383880,1= 383880,1

A12 = (-1)(1+ 2) ∙ 1774 = - 1774

A21 = (-1)(2+ 1) ∙ 1774 = -1774

A11 = (-1)(2 + 2) ∙ 9 = 9

xT ∙y=$\left\lbrack \begin{matrix} 1 & 1 \\ 102,5 & 124,7 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 150,8 & 175,4 \\ \end{matrix}\begin{matrix} \ & 1 & 1 \\ \ & 196,1 & 219,1 \\ \end{matrix}\begin{matrix} \ & 1 & 1\ \ \ \\ \ & 240,8 & 266,7\ \ \ \ \\ \end{matrix}\begin{matrix} 1 \\ 297,9 \\ \end{matrix} \right\rbrack$ $\begin{bmatrix} 20 \\ \begin{matrix} \begin{matrix} 17 \\ \begin{matrix} 15 \\ 13 \\ 11 \\ \end{matrix} \\ 10 \\ \end{matrix} \\ 9 \\ \begin{matrix} 8 \\ 7 \\ \end{matrix} \\ \end{matrix} \\ \end{bmatrix} = \begin{bmatrix} 110 \\ 19446,3 \\ \end{bmatrix}$

a = (xT ∙ x)-1 ∙ (xT ∙ y)= $\begin{bmatrix} 1,246992 & - 0,005763 \\ - 0,005763 & 0,000029 \\ \end{bmatrix}\ $$\ \begin{bmatrix} 110 \\ 19446,3 \\ \end{bmatrix}$ = =$\begin{bmatrix} 1,246992 \bullet 110 + ( - 0,005763) \bullet 19446,3 \\ - 0,005763\ \bullet 110 + \ 0,000029 \bullet \ 19446,3 \\ \end{bmatrix} = \begin{bmatrix} 137,16912 - 112,069027 \\ - 0,63393 + \ 0,563943 \\ \end{bmatrix}$=$\ \begin{bmatrix} 25,100093 \\ - 0,069987 \\ \end{bmatrix}$

Model przyjmuje postać:

yt = a0 + a1 ∙ xt

yt = 25, 100093  0, 069987 ∙ xt

y1 = 25, 100093 −  0, 069987∙ 102,5 = 25, 100093 – 7,1736675 = 17,926426

y2 = 25, 100093 −  0, 069987∙ 124,7 = 25, 100093 - 8,7273789 = 16,372714

y3 = 25, 100093 −  0, 069987∙ 150,8 = 25, 100093 - 10,5540396 = 14,546053

y4 = 25, 100093 − 0, 069987∙ 174,5 = 25, 100093 - 12,2757198 = 12,824373

y5 = 25, 100093 −  0, 069987∙ 196,1 = 25, 100093 - 13,7244507 = 11,375642

y6 = 25, 100093 −  0, 069987 ∙ 219,1 = 25, 100093- 15,3341517 = 9,765941

y7 = 25, 100093 −  0, 069987 ∙ 240,8 = 25, 100093- 16,8528696 = 8,247223

y8 = 25, 100093 −  0, 069987 ∙ 266,7 = 25, 100093- 18,6655329 = 6,43456

y9 = 25, 100093 −  0, 069987 ∙ 297,9 = 25, 100093- 20,8491273 = 4,250966

2. Oceń dopasowanie modelu do danych rzeczywistych:

a) wariancja składnika resztowego (losowego)

S2 = $\frac{\mathbf{1}}{\mathbf{N}\mathbf{-}\mathbf{K}\mathbf{-}\mathbf{1}}\sum_{\mathbf{t = 1}}^{\mathbf{N}}\mathbf{\ }$(yt – ŷt)2 gdzie: N – liczba obserwacji na podstawie których budujemy model

K - liczba zmiennych objaśniających

yT – wartość rzeczywista zmiennej

ŷT – wartość wyliczona z modelu

S2 = $\frac{1}{N - K - 1}\sum_{t = 1}^{N}\ $(yt – ŷt)2 = $\frac{1}{9 - 1 - 1}\ $∙ 15,700464 = $\frac{15,700464\ }{7}$ = 2,242923

b) odchylenie standardowe składnika resztowego (losowego)

Informuje o ile średnio wartość rzeczywista zmiennej objaśnianej różni się od wyliczonej z modelu.

S = $\sqrt{\mathbf{S}^{\mathbf{2}}}$

S = $\sqrt{\mathbf{S}^{\mathbf{2}}}$ = $\sqrt{2,242923}$ = 1,497639

c) ocena macierzy wariancji i kowariancji estymatorów parametrów modelu

Wariancję estymatorów parametrów znajdują się na głównej przekątnej. Pierwiastki z nich o ocena średnich błędów szacunków parametrów modelu.

D2(a) = S2 ∙ (xT ∙ x)-1

D2(a) = S2 ∙ (xT ∙ x)-1 = 2,242923 ∙ $\begin{bmatrix} 1,246992 & - 0,005763 \\ - 0,005763 & 0,000029 \\ \end{bmatrix}$ = $\begin{bmatrix} 2,796907 & - 0,012926 \\ - 0,012926 & 0,000065 \\ \end{bmatrix}$

D(a0) = $\sqrt{2,796907}$ = 1,6729396

D(a1) = $\sqrt{0,000065}$ = 0,008062

d) współczynnik wyrazistości(zmienności)

Informuje, jaki procent średniej stanowi jej odchylenie. Model jest tym lepszy im niższa wartość współczynnika

W = $\frac{\mathbf{S}}{\mathbf{U}}$ ∙ 100 [%]

Ў = $\frac{y_{t}}{N}$ $= \ \frac{110}{9}$ = 12,222222

W = $\frac{S}{U}$ ∙ 100 [%] = $\frac{1,497639}{12,222222}$ ∙ 100 [%] = $\frac{149,7639}{12,222222}$ [%] = 12,253410 [%]

e) współczynnik zbieżności

Informuje, jaka część całkowitej zmienności zmiennej objaśnianej nie jest wyjaśniona przez model. Bliższa zera wartość informuje o lepszym dopasowaniu modelu.

φ2 = $\frac{\sum_{\mathbf{t = 1}}^{\mathbf{N}}\mathbf{\ }\mathbf{(}\mathbf{y}_{\mathbf{t}}\mathbf{\ }\mathbf{}\mathbf{\ }\mathbf{y}_{\mathbf{t}}\mathbf{)}\mathbf{\ }^{\mathbf{2}}\mathbf{\ }}{\sum_{\mathbf{t = 1}}^{\mathbf{N}}\mathbf{\ }\mathbf{(}\mathbf{y}_{\mathbf{t}}\mathbf{\ }\mathbf{}\mathbf{\ }\mathbf{U}_{\mathbf{t}}\mathbf{)}\mathbf{\ }^{\mathbf{2}}}$

φ2 = $\frac{\sum_{\mathbf{t = 1}}^{\mathbf{N}}\mathbf{\ }\mathbf{(}\mathbf{y}_{\mathbf{t}}\mathbf{\ }\mathbf{}\mathbf{\ }\mathbf{y}_{\mathbf{t}}\mathbf{)}\mathbf{\ }^{\mathbf{2}}\mathbf{\ }}{\sum_{\mathbf{t = 1}}^{\mathbf{N}}\mathbf{\ }\mathbf{(}\mathbf{y}_{\mathbf{t}}\mathbf{\ }\mathbf{}\mathbf{\ }\mathbf{U}_{\mathbf{t}}\mathbf{)}\mathbf{\ }^{\mathbf{2}}}$ = $\frac{15,700464\ }{153,555559}$ = 0,102246

f) współczynnik determinacji

Wartość współczynnika determinacji powinna być bliska jedynki.

R2 = 1 - φ2

R2 = 1 - φ2 = 1 - 0,102246 = 0,897754

g) weryfikacji istotności parametrów modelu

Przy założeniu, że składnik losowy modelu ma rozkład N (0; δ2) weryfikuje się hipotezę o istności każdego parametru.

H0 [αi = 0]

H1i 0]

Wykorzystujemy w tym celu statystykę:

ti = $\frac{\mathbf{a}\mathbf{i}}{\mathbf{D}\mathbf{(}\mathbf{\text{ai}}\mathbf{)}}$ gdzie: ai – ocena parametru stojącego przy i- tej zmiennej

D(ai) – ocena średniego błędu szacunku parametru αi

ti = $\frac{ai}{D(\text{ai})}$ = $\frac{- 0,069987\ }{0,008062}\ $= - 8,681097

Z tablicy t – studenta dla (N – K – 1) stopni swobody oraz dla zadanego poziomu istotności α = 0,05 odczytuje się wartość krytyczną tα

N – K – 1 = 9 – 1 – 1 = 7

tα = 2,36462

|−8,681097| |2,36462| zatem nie ma podstaw do odrzucenia hipotezy zerowej. Oznacza to, że i- ta zmienna objaśniająca nieistotnie wpływa na zmienną objaśnianą i powinna być usunięta z modelu.

3. Wyznacz prognozę liczby nadanych telegramów na 100 osób na następny rok. Wartość zmiennej objaśniającej ustal na poziomie rzeczywistym 320,4 abonentów na 1000 osób.

yt = 25, 100093  0, 069987 ∙ xt

x10 = 320,4

y10* = 25, 100093  0, 069987 ∙ 320,4 = 25, 100093 - 22,4238348 = 2,6762582

4. Oceń dopuszczalność prognozy wyznaczając bezwzględną i względną błąd prognozy ex ante.

a) wariancja prognozy

VT2= S2 [x* ∙ (xT ∙ x)-1 ∙x*T + 1]

x* = $\begin{bmatrix} 1 & 320,4 \\ \end{bmatrix}$

V102 = 2, 242923∙ ($\begin{bmatrix} 1 & 320,4 \\ \end{bmatrix}$$\begin{bmatrix} 1,246992 & - 0,005763 \\ - 0,005763 & 0,000029 \\ \end{bmatrix}$$\begin{bmatrix} 1 \\ 320,4 \\ \end{bmatrix}$ + 1) =

= 2, 242923 ∙ ($\begin{bmatrix} 1,246992 - 1,846465 & - 0,005763\ + \ 0,009292 \\ \end{bmatrix}$$\begin{bmatrix} 1 \\ 320,4 \\ \end{bmatrix}$ + 1) =

= 2, 242923 ∙ ($\begin{bmatrix} - 0,58789 & 0,003529 \\ \end{bmatrix}$ $\begin{bmatrix} 1 \\ 320,4 \\ \end{bmatrix}\ $+ 1) = 2, 242923 ∙ ($\begin{bmatrix} - 0,58789 + \ 1,130692 \\ \end{bmatrix}\ $+1) = = 2, 242923 ∙ (0,542802 + 1) = 2, 242923 ∙ 1,542802 = 3,460386

b) bezwzględny błąd prognozy ex ante

VT = $\sqrt{{\mathbf{V}_{\mathbf{T}}^{\mathbf{2}}}^{\mathbf{\ }}}$

V10 = $\sqrt{{3,460386}^{\ }}$ = 1,860211

Prognoza jest tym lepsza i bardziej dokładna im niższy bezwzględny błąd prognozy ex ante. Błąd ten jest wystarczający do wyboru spośród kilku prognoz otrzymanych z różnych modeli tej samej zmiennej prognozy najlepszej.

c) względny błąd prognozy ex ante

Służy do porównania dokładności prognoz różnych zmiennych.

ηT = $\frac{\mathbf{V}_{\mathbf{T}}}{\mathbf{y}_{\mathbf{T}}^{\mathbf{*}}}$ ∙ 100 %

η10 = $\frac{V_{10}}{y_{10}^{*}}$ ∙ 100 % = $\frac{{1,860211}_{\ }}{{2,6762582}_{\ }^{\ }}$ ∙ 100 % = $\frac{{1,860211}_{\ }}{{2,6762582}_{\ }^{\ }}$ = 69,50790 %

η12 = 69,50790 %, czyli prognoza jest niedopuszczalna, gdyż mieści się w przedziale ηT > 10%

5. Wyznacz prognozę przedziałową na poziomie istotności α = 0,05

yT* - u ∙ VT < yT < yT* + u ∙ VT gdzie: yT – prognoza zmiennej y na okres T

P (yT* - u ∙ VT < yT < yT* + u ∙ VT) = 1 – α VT – bezwzględny błąd prognozy ex ante

u = tα – gdy rozkład reszt jest normalny lub

u = $\sqrt{\frac{1}{\alpha}}$ - gdy rozkład reszt jest nieznany

2, 6762582 - 2,36462 ∙ 1, 860211 < y12 < 2, 6762582 + 2,36462 ∙ 1, 860211

2, 6762582– 4,398692 < y12 < 2, 6762582+ 4,398692

-1,722434 < y12 < 7,074950

6. Oceń trafność prognozy wiedząc, że liczba nadanych telegramów w roku 2001 wyniosła 6 na 100 osób. Oceń przydatność modelu w dalszym prognozowaniu.

a) bezwzględny błąd prognozy ex post

Informuje o ile wartość rzeczywista różni się od wyliczonej z modelu.

qT = yT - yT*

q10 = y10 - y10* = 6 - 2, 6762582 = 3,323742

b) względny błąd prognozy ex post

Informuje, jaki procent wartości rzeczywistej stanowi różnica pomiędzy wartością rzeczywistą a wyznaczoną z modelu.

ψT = $\frac{\mathbf{y}_{\mathbf{T}}\mathbf{-}\mathbf{\ }\mathbf{y}_{\mathbf{T}}^{\mathbf{*}}}{\mathbf{y}_{\mathbf{T}}}$ ∙ 100 %

ψ10 = $\frac{y_{10} - \ y_{10}^{*}}{y_{10}}$ ∙ 100% = $\frac{{6\ - \ \ 2,6762582\ \ }_{\ }}{7}$ ∙ 100% = $\frac{{3,323742}_{\ }}{7}$ ∙ 100% = $\frac{{332,3742}_{\ }}{7}$ % = 47,482029 %

c) współczynnik Janusowy

Określa stopień dopasowania prognozy i modelu do danych rzeczywistych.

J2 = $\frac{\frac{\mathbf{1}}{\mathbf{T}\mathbf{-}\mathbf{N}}\mathbf{\ }\mathbf{\Sigma}_{\mathbf{t = \ \ N + 1}}^{\mathbf{T}}\mathbf{\ (}\mathbf{y}_{\mathbf{t}}\mathbf{-}\mathbf{\ }\mathbf{y}_{\mathbf{t}}^{\mathbf{*}}\mathbf{)}\mathbf{\ }^{\mathbf{2}}}{\frac{\mathbf{1}}{\mathbf{N}}\mathbf{\ }\mathbf{\Sigma}_{\mathbf{t = \ \ 1}}^{\mathbf{N}}\mathbf{\ (}\mathbf{y}_{\mathbf{t}}\mathbf{-}\mathbf{\ }\mathbf{y}_{\mathbf{t}}^{\mathbf{\ }}\mathbf{)}\mathbf{\ }^{\mathbf{2}}}$

J2 = $\frac{\frac{1}{10 - 9}\ \Sigma_{t = \ \ 10}^{10}\ (y_{t} - \ y_{t}^{*})\ ^{2}}{\frac{1}{9}\ \bullet \ 21,152791}$ = $\frac{\ (y_{t} - \ y_{t}^{*})\ ^{2}}{2,350310}$ = $\frac{\ (6\ - \ \ 2,6762582\ )\ ^{2}}{2,350310}$ = $\frac{(3,323742)\ ^{2}}{2,350310}$ = $\frac{11,047261}{2,350310}$ = 4,700342

J2 > 1 zatem dotychczasowe prognozy nie są trafne i model nie może być wykorzystywany w dalszym ciągu do prognozowania.


Wyszukiwarka

Podobne podstrony:
Zadania z treścia
Prezentacja 2 analiza akcji zadania dla studentow
Przedmiot i zadania dydaktyki 4
zadanie 1 v 002
Przedmiot dzialy i zadania kryminologii oraz metody badan kr
KOLOKWIUM 2 zadanie wg Adamczewskiego na porownawczą 97
CELE I ZADANIA EDUKACJI MEDIALNEJ(1)
ochrona atmosfery zadania
zadania
Przedmiot i zadania dydaktyki 2
Wymogi, cechy i zadania sprawozdawczośći finansowej
ZADANIA PiP Prezentacja Microsoft PowerPoint
1F CWICZENIE zadanie wg Adamczewskiego na porownawczą 97id 18959 ppt
zadania i rozwiazania z przekrojów 2
zadania egzaminacyjne
ZADANIA WÓJTA I STAROSTY W ZARZĄDZANIU KRYZYSOWYM
Motywacja zadaniowa[1]

więcej podobnych podstron