Literatura:
„Prognozowanie gospodarcze” M Cieślak, PWN III wydanie
„Prognozowanie gospodarcze” Dittman AE Wrocław
„Predykcja ekonometryczna” A. Zewiasz
Wykład 1 - 13.10.2001
Wyznaczanie prognoz
Prognozowanie ilościowe czyli predykcja pozwala wyznaczać prognozy za pomocą przesłanek z modeli ekonometrycznych. Nie dotyczy ono tylko przyszłości ale może także dotyczyć przeszłości lub teraźniejszości. Prognozowanie ma ścisłe powiązania z demografią.
Prognozowanie wykorzystywane jest między innymi w Głównym Urzędzie Statystycznym oraz w dużych przedsiębiorstwach czy centralach gdzie za pomocą prognozowania ocenia się perspektywy planowanej produkcji.
Podstawowe pojęcia:
model ekonometryczny
(wg Z. Czerwińskiego) - może być rozumiany ogólnie, intuicyjnie jako obraz, odbicie, odwzorowanie określonego obiektu w określonym języku.
Model ekonometryczny - również będzie układem równań odwzorowującym wyróżnione zależności między zjawiskami ekonomiczno - społecznymi.
Część związków można mierzyć a niektóre nie.
Związki mierzalne nazywane są korelacyjnymi.
Y = f (x1, x2 ......xkၖ)
y - zjawisko badane
x1,x2-zjawiska, czynniki
ၖ- składnik losowy (psi,) - jest to łączny efekt oddziaływania na zmienną y, oddziałuje na te i inne czynniki, które nie zostały uwzględnione bezpośrednio w zbiorze x.
Jest to zmienna losowa o określonym rozkładzie.
E(ၖ) = 0; D2(ၖ) = ၤ2 = const. (ၤ2 - wariancja)
liniowy model ekonometryczny
Yt = ၡ0 + ၡ1xt + ၸt t = 1,2,………….,n
gdzie:
ၸt - składnik losowy
ၡ0 - współczynnik kierunkowy funkcji regresji
Aby przedłużyć prognozę od 1,2,.............,n należy wykonać estymację parametrów ၡ0 i ၡ1.
Do estymacji parametrów wykorzystuje się metodę najmniejszych kwadratów.
MNK polega na znajdowaniu takich wartości ocen parametrów strukturalnych modelu, by suma kwadratów odchyleń zaobserwowanych (empirycznych) wartości i zmiennej y, od jej wartości teoretycznych wyznaczonych przez model była najmniejsza w przypadku jednej zmiennej objaśniającej.
MNK polega na znajdowaniu takiej prostej , która jest najlepiej dopasowana, do wszystkich punktów empirycznych, czyli minimalizowana jest sumą kwadratów reszt (ut).
Klasyczne założenia MNK
Zmienne objaśniające x są nielosowe i niewspółliniowe k<n;
Istnieje n populacji składników losowych, o nadziejach matematycznych E(ၖt)=0 i stałych wariancjach o skończonych wartościach ၤ2 =D2(ၖt) = const, t= 1, 2, 3, ...... n.
Realizacje zmiennych tworzą proces czysto losowy tzn., że następuje po sobie realizacja składnika losowego , są nieskorelowane, czyli ρ(ၖt; ၖts)= 0 dla t ≠ s
składniki losowe są nieskorelowane ze zmiennymi objaśniajacymi.
Jeżeli ww. założenia są spełnione to estymator ma dobre własności tzn.
jest nieobciążony;
zgodny;
najbardziej efektywny;
f (0, 1) = ![]()
(Yt - 0 - 1xt)2 = ![]()
et2 ![]()
et2 = Yt - (0 - 1xt)
^ ^
f (0, 1) = minimum

gdy wartość zmiennej objaśniającej zależy od więcej niż jednej zmiennej objaśnianej
Yt = ၡ0 + ၡ1xt1 + ၡ2xt2 + …………. + ၡkxtk + ၸt
t = 1,2,……………,n
parametr „ၡ1” wskazuje o ile przeciętnie zmieni się wartość „y” jeśli „x1” zmieni się o jedną jednostkę w pewnym okresie czasu.
szeregi czasowe - są realizacją procesu stochastycznego który możemy zapisać ciągiem zmiennych losowych.
ၻytၽ= ၻy1, y2, ................., ynၽ szeregi czasowe
gdy „t” jest okresem miesiąca to:
„y1” to np. styczeń
„y2” to luty itd.
gdy zaobserwujemy już jakiś proces wówczas oznaczamy dane małymi literami.
momenty czasu
ၻYtၽ= ၻY1, Y2, ................., Ynၽ
zmienna “Y” jest pewną funkcją która może
przybierać różne wartości „y”
0,3 dla y = 0
PၻY=yၽ = 0,5 dla y = 1
0,2 dla y = 2
PၻY=yၽ = 0 < p < 1
realizacja procesu to ciąg: ၻ0,0,1,1,0,0,0,1ၽ
^
oceniając p wyznaczamy prognozę
![]()
„p” zmienia się jednak z czasem
P ၻYt=yၽ = 0 < p < 1
Rachunek macierzowy
Y = ![]()
x = 
n x 1 n x (k+1)
Składnik losowy - ၸ (ksi)
ၸ = 
ၡ = ![]()
n x 1 (k + 1) x 1
f (α0, α1, ................... αk) = ![]()
lub w formie macierzowej:
Y = Xα + ξ Y* = Xα ; Y* - wartość teoretyczna funkcji regresji
f(α) = (Y - Yt)T(Y - Y*) = (Y - Xd)T(Y - Xα)
![]()
![]()
gdy, chcemy obliczyć średni błąd szacunku stawiamy hipotezę, że α0 = 0 i próbujemy ją zweryfikować.
Główne klasyczne założenia regresji liniowej.
zakładamy, że dla każdego „t” nadzieja matematyczna równa się 0.
![]()
2. zakładamy, że dla każdego „t” wariancja składnika losowego jest równa δ2 - jest stała
![]()
składnik losowy ma rozkład homostechastyczny
![]()
3. gdy w czasie są nieskorelowane macierze składników losowych

4. zakładamy, że wartości zmiennych objaśniających są nie losowe to znaczy są
ustalone z góry.
R(X) = k+1 ⇒ det (XTX) > 0 R(X) - rząd macierzy
5. czasami wprowadzamy założenie, że wektor składników losowych ma
n-wymiarowy rozkład normalny z nadzieją matematyczną równą 0.
ξ ∼ N(0, In δ2) ⇒ Y ∼ N(Xαi, In δ2)
wektor wartości funkcji regresji (wartości teoretyczne funkcji regresji)
![]()
![]()
![]()
wariancja resztowa
![]()
współczynnik zbieżności

![]()
![]()
Macierz wariancji i dewariancji estymatorów.
D2(α) = (XTX)-1δ2 Se2 ⇒ δ2
![]()
![]()
![]()
![]()
![]()
; ![]()
Hipotezy:
a) H0 αj = 0
b) H1 αj ≠ 0
j-oty parametr funkcji jest równy 0, nie ma wpływu ma zmienną objaśniającą.
Sprawdzian testu Studenta

![]()
0
![]()
a → ta → K = (-∞; -ta > ∪ < ta; ∞)
za „a” przyjmujemy małą liczbę np. 0,01; 0,05
Poziom istotności:

prognoza czy wartość symulowana
![]()
XT - wartości hipotetyczne
![]()
Wykład 2 - 28.10.2001
Model potęgowy
![]()
t = 1,2, ........., n
najczęściej rozważany natomiast jest model:
![]()
gdzie:
Zt - poziom zatrudnienia,
Wt - poziom środków trwałych,
α1- elastyczność produkcji względem zatrudnienia.
model ten jest modelem nieliniowym
- estymacja modelu:
![]()
- logarytm modelu:
![]()
Ut, Rt, Vt - są nowymi zmiennymi
po obliczeniu otrzymujemy:
![]()
natomiast ![]()
]
Szczególne modele regresji (trendy).
a) model addytywny jest jednym z modeli szeregu czasowego
Yt,h = f(t) + a(h) + ξt
trend wahania wahania
sezonowe losowe
trend f(t) jest funkcją kolejnych numerów czasów (generalnie obrazuje przyrost).
b) model multiplikatywny.
![]()
rozwój zjawiska obrazuje trend ale wahania sezonowe są coraz większe (brak stabilności)
Najprostszą formą trendu jest funkcja liniowa:
f1(t) = β0 + tβ1 + ξt
Wyliczenie parametrów na podstawie wzorów analitycznych:
wzór 1:

wzór 2:

wzór 3:

wzór na β0:
![]()

Zadanie:
W miesiącach od stycznia do kwietnia zaobserwowano następujące wydatki: 4, 6, 10, 8.



![]()


![]()
Interpretacja wyniku: Średnio z miesiąca na miesiąc wartość wydatków rosła o 1,6 jednostki.
t |
|
Yt |
Yt- |
|
1 |
4,6 |
4 |
-0,6 |
0,36 |
2 |
6,2 |
6 |
-0,2 |
0,04 |
3 |
7,8 |
10 |
2,2 |
4,84 |
4 |
9,4 |
8 |
-1,4 |
1,96 |
Σ |
|
|
0,0 |
7,2 |
suma reszt
jest to pośredni test sprawdzający poprawność wykonania zadania, gdy otrzymamy 0 zadanie uważa się za wykonane poprawnie.
obliczamy odchylenia wydatków od trendu:

Interpretacja wyniku: Wydatki rzeczywiste odchylają się od trendu o 1,9 jednostki.
oceniamy błąd obliczeń:



Interpretacja wyniku: Średni błąd szacunku czyli odchylenie standardowe estymatora pierwszego β1 jest równe 0,85 jednostki (wskazuje to rząd błędu jakim szacowany jest parametr)
oceniamy względny błąd szacunku (błąd średni)

Interpretacja wyniku: Względny błąd szacunku stanowi 53,1% oceny całego szacunku.
Wyznaczamy prognozę na podstawie trendu:
![]()
![]()
Interpretacja wyniku: Prognoza równa jest 11 jednostek.
Obliczamy możliwy błąd prognozy:
![]()
czyli: ![]()
- średni błąd prognozowania czyli predykcji.
Interpretacja wyniku: Rzeczywiste prognozowania które występują w przyszłości mogą się odchylać o 5,2 jednostki.
Obliczamy odchylenie średniego błędu predykcji:

Rodzaje trendów liniowych.
a) ![]()
![]()
przyrost trendu liniowego
b) aby opisać krzywą z wykresu należy:
![]()
funkcja trendu zapisana jest w postaci funkcji regresji, do obliczenia jej używamy wzorów macierzowych.

c) krzywą tą możemy również modelować za pomocą funkcji wykładniczej:
![]()
![]()
i wyznaczamy logarytm:
![]()
![]()
; ![]()
d) inna postać trendu to:
![]()
model szeregu czasowego wygląda wtedy następująco:
![]()
i wyznaczamy logarytm:
![]()

![]()
e) funkcja logarytmiczna:
![]()
![]()
f) funkcja logistyczna:
![]()
f(t) punkt nasycenia rynku
t
Zadanie:
Rozważamy wahania sezonowe o cyklu rocznym, obserwowane będą wartości cechy w poszczególnych miesiącach:
gdzie: t = 1,2 - bieżący numer miesiąca
h = 1,2,3,.......,12- miesiąc w cyklu wahań
k = 1,2,.... - numer roku .
np. obserwacja z piątego roku z marca
to: k=5; h=3
t = (5-1) x 12 + 3 = 48+3 = 51
z obliczenia wynika, że jest to 51 miesiąc z kolei w cyklu który obserwujemy.
cykl dwuokresowy:
![]()
![]()
określa amplitudę
wahania sezonowego
gdzie:
„t” - przyjmujemy jako bieżące półrocze
„h” - numer półrocza (0 - pierwsze półrocze, 1 - drugie półrocze)
„k” - numer roku
macierz danych przyjmuje następującą postać:

cykl kwartalny - wprowadzamy dwie zmienne zero - jedynkowe.
![]()
suma dwóch zmiennych
zero jedynkowych

aby obliczyć cykl miesięczny musimy wprowadzić cztery zmienne zero jedynkowe
numer bieżący miesiąca:
t = (k-1)c+h
wahania sezonowe wprowadzają składnik losowy ηt (eta).
![]()
![]()
![]()
![]()
m - liczba wszystkich lat
![]()
np.
![]()
gdzie: t - numer bieżący kwartału

prognozy kwartalne
wyznacz prognozę na trzeci kwartał piątego roku:
k=5, H=3
T = (k-1)c+H
T = (5-1) 4+3 = 19
badany kwartał jest 19 z kolei badanym kwartałem
obliczamy prognozę:
![]()
Wykład 3 - 10.11.2001
Wyznaczanie tendencji rozwojowych zwanych trendami.
Metody adaptacyjne:
a) metoda średnich ruchomych - metoda wygładzania średnich czasowych.
t |
Yt |
|
|
|
1 |
2 |
- |
- |
- |
2 |
4 |
3,3 |
- |
3,5 |
3 |
4 |
5,3 |
4,0 |
5,0 |
4 |
8 |
4,7 |
4,8 |
5,5 |
5 |
2 |
5,3 |
4,4 |
4,5 |
6 |
6 |
3,3 |
4,4 |
4,0 |
7 |
2 |
4 |
- |
3,5 |
8 |
4 |
- |
- |
- |
obliczeń w tabeli dla średniej ruchomej scentrowanej trzyokresowej dokonano z wzoru:
![]()
a dla średniej ruchomej scentrowanej pięciookresowej z wzoru:
![]()
wykres szeregu ![]()
(3) oraz ![]()
(5) przedstawia się w sposób następujący:

Im więcej składowych tym przebieg jest bardziej łagodny. Zazwyczaj rozważamy średnie 5, 10, 30 i 100 okresowe.
Uogólnienie wzoru na dowolną liczbę składników:
gdy k jest liczbą nieparzystą:

gdy k jest liczbą parzystą:
dla k = 2
![]()
dla k = 4
![]()
dla dowolnej liczby parzystej:

b) średnie ruchome uprzednie:
wzór ogólny:
![]()
w szczególności:
![]()
![]()
Im większe „k” tym prognoza wyznaczona na podstawie tendencji długookresowej a im mniejsze „k” prognoza zależna od czynników bieżących.
przykład:
t |
Yt |
|
|
Ut(2) |
Ut(4) |
Ut2(2) |
Ut2(4) |
1 |
2 |
- |
- |
- |
- |
- |
- |
2 |
4 |
- |
- |
- |
- |
- |
- |
3 |
4 |
3 |
- |
1 |
- |
1 |
- |
4 |
8 |
4 |
- |
4 |
- |
16 |
- |
5 |
2 |
6 |
4,5 |
- 4 |
-2,5 |
16 |
6,25 |
6 |
6 |
5 |
4,5 |
1 |
-1,5 |
1 |
2,25 |
7 |
2 |
4 |
5,0 |
- 2 |
-3,0 |
4 |
9 |
8 |
4 |
4 |
4,5 |
0 |
-0,5 |
0 |
0,25 |
Σ |
|
|
|
0 |
-4,5 |
38 |
17,75 |
wyznaczanie prognozy na okres 9:
wyliczamy błędy prognoz ex - post na podstawie wzoru:
![]()
średnie wartości błędów prognoz obliczamy z wzoru:
![]()
dla badanego przykładu:
![]()
![]()
prognoza przeszacowana
wyznaczenie wariancji predykcji ex - post obliczamy z wzoru:
![]()
dla badanego przykładu:
![]()
⇒ Sp(2) = 2,52
![]()
⇒ Sp(4) = 2,11
wyniki obrazują odchylenia prognoz, ze względu na mniejszy błąd należy wybrać prognozę o parametrze 2,11.
uprzednia mediana ruchoma.
![]()
k = 1,2 ⇒ Met(k) = ![]()
przykład:
t |
Yt |
Met+1(3) |
Met+1(4) |
1 |
2 |
- |
- |
2 |
4 |
4 |
- |
3 |
4 |
4 |
- |
4 |
8 |
4 |
4 |
5 |
2 |
6 |
4 |
6 |
6 |
2 |
5 |
7 |
2 |
4 |
4 |
8 |
4 |
- |
3 |
obliczenie do tabeli:
Met+1(3) - kolejność składników do obliczeń wpisywać rosnąco (od najmniejszej do największej).
mediana dla nieparzystej liczby składników jest składnikiem środkowym.
2,4,4 środkowa 4 czyli mediana
4,4,8 środkowa 4 czyli mediana
2,4,8 środkowa 4 czyli mediana
2,6,8 środkowa 6 czyli mediana
2,2,6 środkowa 2 czyli mediana
2,4,6 środkowa 4 czyli mediana
Met+1(4) - kolejność składników do obliczeń wpisywać rosnąco (od najmniejszej do największej).
mediana dla parzystej liczby składników jest średnią arytmetyczną środkowych dwóch operacji.
2,4,4,8 suma dwóch środkowych cyfr dzielona przez dwa 8:2 = 4
2,4,4,8 suma dwóch środkowych cyfr dzielona przez dwa 8:2 = 4
2,4,6,8 suma dwóch środkowych cyfr dzielona przez dwa 10:2 = 5
2,2,6,8 suma dwóch środkowych cyfr dzielona przez dwa 8:2 = 4
2,2,4,6 suma dwóch środkowych cyfr dzielona przez dwa 6:2 = 3
![]()
![]()

wyznaczanie kwantyli - gdy „k” jest duże:
![]()
![]()
Wykład 4 - 12.01.2002
Metody adaptacyjne cd.
wyrównywanie wykładnicze ma postać:
![]()
![]()
ocena trendów w okresie ![]()
jest równa:
![]()
![]()
ocena ta równa jest średniej wartości dwóch ważonych
prognoza na okres t+1 ma postać:
![]()
prognozę tę możemy również zapisać jako:

Ut - błąd prognozy
![]()
![]()
błąd prognozy okresu t+1
Sposoby wyznaczania parametru α.
W praktyce wykonujemy to w sposób arbitralny - jeśli szereg który mamy analizować przebiega w sposób stacjonarny.
Aby wyznaczyć α przyjmuje się, że:
α = 0; 0,1; 0,2; 0,3; 0,4; ........................1,0
i dla każdego α wylicza się wartości trendu np.

k = 1,2 ............n
następnie obliczamy błędy prognozowania Ut,p(α)
następnie wyliczamy sumy kwadratów błędów prognozowania
![]()
![]()
przykład:
Cena akcji w poszczególnych pięciu notowaniach tworzy następujący szereg.
Wyznaczyć prognozę na okres szósty.
t |
Yt |
|
|
|
|
1 |
2 |
2,0 |
- |
- |
- |
2 |
4 |
3,6 |
2,0 |
2 |
4,0 |
3 |
1 |
1,52 |
3,6 |
-2,6 |
6,76 |
4 |
5 |
4,3 |
1,52 |
3,5 |
12,25 |
5 |
5 |
4,86 |
4,3 |
0,7 |
0,49 |
6 |
- |
- |
4,86 |
- |
|
Σ |
|
|
|
|
23,50 |
dla obliczeń założono, że
Y0 = Y1 a α = 0,8
sposób obliczania ![]()

suma kwadratów Q(α) wynosi Q(0,8) = 23,5
możemy teraz obliczyć wariancję predykcji ex - post
![]()
![]()
metoda autoregresyjna
rozważamy ciąg obserwacji od Y1 do Yn
współczynnik autokorelacji rzędu „k”
(ro) ![]()
i należy do przedziału <-1,1>
![]()
![]()
estymator współczynnika:
![]()
![]()
![]()
modele autoregresyjne:
funkcja autoregresyjna rzędu „g”
![]()
![]()
model autoregresyjny rzędu pierwszego zachodzi gdy:
Rk > Rk+1 k = 1,2 ................. n
i ma postać:
![]()
Współczynnik autokorelacji rzędu pierwszego mierzy następujące współzależności:
B(Yt,Yt-1) > 0
B(Yt, Yk) = 0
dla k = 2,3 .................n
Wyznaczanie prognoz jest pewna symulacja.
Podstawą jest model ekonometryczny, szczególnym jego przypadkiem jest funkcja trendu.
Wyliczenie wartości zmiennej prognozowanej i wyznaczenie błędu prognozowania.
Błąd jest nieodzowny w wyznaczaniu prognozy.
Klasyczne metody prognozowania wykorzystują wygładzanie szeregów czasowych.
Oprócz prognozy trzeba wyznaczyć błąd prognozy w 2 sposoby:
istnieje możliwość wyliczania błędu ex ande - podejście modelowe
stosuje się wyliczenie błędu ex post - podejście adaptacyjne
ex ande wykorzystywane w momencie wyznaczania samej prognozy
ex post możliwe do zastosowania kiedy wyznaczamy ciąg prognoz dotyczących kilku okresów.
KLASYCZNY LINIOWY MODEL EKONOMETRYCZNY
k
Yt = ∑ αi Xi + ξt
t=0
αo, 1Xoi = 1 wyraz wolny, stały
k
Yt = α0 + ∑αi * Xit + ξt
t=1
Dodatkowe warunki
Yt i ξt - zmienne losowe
α0 + ∑αi* Xit- zmienne losowe
Zakłada się, że nadzieja matematyczna zmiennej objaśniającej będzie równa zmiennej nielosowej, ponadto dla każdego t wariancja jest równa sigma kwadrat.
Dal każdego t = h kowariancja pomiędzy składnikami są nie korelowane ze sobą.
KLASYCZNY MODEL REGRESJI
k
1E(ξt) = 0 → E(Yt) = ∑ αi Xit
t t=0
1D2(ξt) = 02 1 Cov(ξt ξh) = 0
t t+h=1...n
Dla każdego t rozkład normalny
1 ξt ≈ η (0,02)
t
t = 1,2,...,n n+1, n+2,n+h h = 1,2,...
h - wyprzedzenie czasowe prognozowania
Y1, Y2, ..., Yn Yn+1, Yn+2, Yn+h
obserwowane prognozowane
Błąd prognozy
Ut+h = Yt+h - Ypt+h
Yp1t+h = f (Y1,Y2,...,Yn)
y1,y2,...,yn Ut+h = yt+h - ypt+h
Najprostszy sposób wyznaczania prognozy jest związany z modelem liniowym
Y = Xα + ξ
ξ1 Y1 1 X11 X12 . X1n
ξ2 Y2 1 X21 X22 . X2n
ξ = . Y = . X.= . . . .
. . . . . . .
. . . . . . .
ξ Yn 1 Xn1 Xn2 . Xnn
t
Metoda najmniejszych kwadratów
ϕ(α) = ( Y - Xα)T ( Y - Xα)
a : ϕ (a) = min
a = (XTX)-1 XTY
^
e = Y - Y = Y - X*a
Stopień dopasowania ocenia się za pomocą wariancji resztowej
et = y = ∑ α1 * Xit
t=0
V(a) = I - (α - a) ( α - a)T = (XTX)-1 δ2
V^(a) = (XTX)-1 S2e
V11 V12 V1n
V(a) = . . . = [Vij] (k+1)*(k+1)
. . .
D2(ai) i=j =δ2 2ij
Vij= Cov (aiaj) i≠j =δ2 2ij
y - wynagrodzenie bieżące
y= 1970,8 -749,3x1 + 1,6x2 + 388,2x3-697,9x4 +e
stałe płeć wyagr. wykszt. rasa
pracownika przeciętne
y^
y= -3123,5+1,7x2+408,2x3+e
(701,5) (0,059) (64,220)
D^(y^i)- przeciętny zarobek
a= [∑(yt-y) t] / [∑ (t-t)2], y = 1/n ∑yt, t= 1/n ∑t
t=1 t=1 t=1
b= y - at, S2e = [∑(yt - y^t)2]/ n-2
Metoda adaptacyjna - wykładnicza
D2(a) cov(a,b) 0,0751
V = = S2e (XTX)-1 =
cov(a,b) D2(b) 0,0751 (2,6
1 1
1
. .
X = t 1
. .
. .
n 1
MODEL TRENDU
D2(Yt^) = D^(a)t2 + 2cov^(a,b)t + D2^(b) + S2e
It = , yt - Zt
MEDIANA
szereg jednostopniowy
X n+1/2 n- nieparzyste
Me =
Xn/2 +Xn/2+1 n - parzyste
2
szereg wielostopniowy
Me = X0 + C0/n0 ( n/2 - cum-1)
KLASYCZNY MODEL EKONOMETRYCZNY
k
Yt = ∑ αiXi + ξt
t=0
k
Yt = ∑αiXit + α0 + ξt
t=1
Błąd prognozy
Ut+h = Yt+h - Ypt+h
Ypt+h = f(Y1,Y2,...,Yn) Yt,p+h = ∑ ai * Xin+h
Warunek kryterium najmniejszych kwadratów
ϕ(a) = uTu = (y - xa)T(y-xa) = min
a= (XTX)-1 XTy Y^ = Xa - model oszacowany
A-1 = (1/detA) * DT
Reszta
e = Y - Y^ = Y - Xa - wektor reszt
Wariancja resztowa
Kowariancja
V(a) = E (α-a)(α-a)T = (XTX)-1 * δ2
V^(a) = (XTX)-1 * S2e
Prognoza na okresy n+1, n+h
k
Yp,t+h = ∑ ai * Xin+h
i=0
Ocena błędu prognozy
k
Yt = ∑αiXit + ξt
i=0
Liniowa funkcja trendów
Yt = at + b + ξt
Błąd prognozowania ex ante
Un+h = Yn+h - Yp,n+h
k k
E(Un+h) = E(Yn+h) - E(Yp,n+h) = ∑αiXi,n+h - ∑E(ai) * Xi,n+h = 0
i=0 i=0
Nadzieja matematyczna predykatora = 0 - predykator jest nieobciążony
Błąd losowy prognozowania - wyrażony wariancją (nie jest mniejszy od wariancji składnika losowego)
D2(Un+h) = D2(Yn+h - Yp,n+h) = D2(Yn+h) + D2(Yp,n+h)
Względny ład prognozy
γ(Un+h) = * 100%
γ (un+h) ≤ γ %
Horyzont predykcji
H:max γ(Un+h) ≤ γ0
H:max D2(Un+h) ≤ d0
Metody wyrównywania wykładniczego
Yt = αy-1 + α(1-α)yt-2 + α(1-α)2 yt-3
Y^t+1 = αyt + (1-α)yt^
Ut(α) = yt - yt^(α)
U =1/m ∑ut
Wariancja ex post prognozowania
S2u = 1/m ∑ u2t
t
Su = √S2u
Np. γ9 = Sk/y9^ (względny błąd prognozy / ostatnie nasze prognozy y9^)
Ocena parametrów trendu liniowego wyznacza metody NMK.
yt = eα+βt lub yt = αβt β>0
β>1 rosnąca
β<1 malejąca
Wielomian drugiego stopnia (parabole)
yt = αt + α1t α2t2 α2>0
Funkcja potęgowa
yt = αtβ 0<β<1
Funkcja liniowo - odwrotnościowa
yt = α + β/t β<0
Funkcja ilorazowa
yt = αt/ β+t
Funkcja logistyczna
yt = α / 1+ βe - δt α δ>0, β>1
Model potęgowy
yt = αtβ
Średnie ruchome nieparzyste liczby składników
Średnie ruchome parzysta liczba składników
Ruchome średnie
Yt+1(k) = 1/k ∑Yi
Yt+1(1) = 1*Yt = Yt
Yt+1(2) = ½ (Yt-1 + Yt)
Metody wyznaczania prognoza pomocą średnich ruchomych.
Wskaźnik średniego indeksu wyznaczonych cech
Indeks zmiennej o podstawie stałej
It/c = yt/yc It/c = dt/c + 1 dk/c = (yt - yc)/yc
Indeks o podstawie łańcuchowej stosunek do okresu poprzedniego
It = yt/ (yt - 1) It = dt + 1 dt = (yt - yt-1) / yt-1
d = I + 1 I = √ I1 * I2 * I3 * ... * In+1 * In
I1 * I2 * I3 = y1/y0 * y2/y1 * y3/y2 = y3/y0 = I3/0
It = yt / yt -1
yt = I1 * yt-1
Ik-1 = yt-1/yt-2
yt-1 = Ik-1 * yt-2
yt = ItIk-1yt-2
yt = ItIx-1 It-2 yt-3
yt= I * yt-1
Prognoza yt = I2yt-2
yt-1 = Iyt-2
yk = I3yt-3
Ogólny wzór na metodę prognozowania - wskaźnik indeksu średniego
yt = Ik * yt-k
t |
yt |
|
|
|
|
1 |
6 |
-1,66 |
- |
- |
|
2 |
10 |
1,30 |
- |
- |
|
3 |
13 |
1,00 |
- |
- |
|
4 |
13 |
1,07 |
- |
-- |
|
5 |
14 |
|
- |
0,64 |
0,40 |
6 |
18 |
|
17,36 |
-1,5 |
2,25 |
7 |
20 |
|
21,50 |
-4,6 |
21,16 |
8 |
22 |
|
26,60 |
-8,98 |
80,64 |
9 |
24 |
|
32,98 |
15,08 |
104,45 |
10 |
24 |
|
|
14,44 |
|
Stopień pierwiastka jest równy liczbie wymnażanych indeksów
I = 4√ 2,33 = 1,24
y6 = I * y5 = 1,24 * 14 = 17,36
yt = Ik * yt-k
yt+k = Ik * yt
y7= I2 * y5 = (1,24)2 * 14 = 1,24*17,36=21,50
y8 = I3 * y5 = I * y7 = 1,24*21,50=26,60
y9 = I4 * y5 = I * y8 = 1,24*26,60=32,98
Ex post
et = yt - yt
e = 1/m ∑ et
e = -1/4 * 14,44 = -3,61
Wartości zmiennej prognozowanej są przeszacowywane o 3,61.
Dostajemy tą prognozę obciążona błędem systematycznym.
Błąd przeciętny prognozowania wyliczmy na podstawie ex post
S2k = 1/m ∑ e2t = ¼ * 104,45 = 26,11
Se = √ 26,11 = 5,11
Średni błąd prognozowania Vk
Vt = Se / yt
V8 = 5,11/26,60 = 0,19
V6 = 5,11/17,36 = 0,29
|
yt |
yt |
ξt = yt-yt |
h |
yt,h |
gt,h |
yt |
1 |
1 |
7 |
-6 |
1 |
1,67 |
0,14 (1/7) |
3,64 (7*0,52) |
2 |
8 |
9 |
-1 |
2 |
7,34 |
0,88 (8/9) |
8,10 (9*0,9) |
3 |
12 |
11 |
1 |
3 |
13,66 |
1,09 (12/11) |
12,32 |
4 |
17 |
13 |
4 |
4 |
17 |
1,3 |
15,86 |
5 |
9 |
15 |
-6 |
1 |
33 |
0,6 |
|
6 |
16 |
17 |
-1 |
2 |
|
0,94 |
|
7 |
22 |
19 |
3 |
3 |
|
1,15 |
|
8 |
26 |
21 |
5 |
4 |
|
1,23 |
|
9 |
19 |
23 |
-4 |
1 |
|
0,82 |
|
10 |
22 |
25 |
-3 |
2 |
|
0,88 |
|
11 |
31 |
27 |
4 |
3 |
|
1,14 |
|
12 |
33 |
29 |
4 |
4 |
|
1,13 |
|
13 |
|
31 |
|
|
25,67 |
|
|
14 |
|
33 |
|
|
31,34 |
|
|
15 |
|
35 |
|
|
27,66 |
|
|
16 |
|
37 |
|
|
41,33 |
|
|
prognozy
yt = 2t + 5 + ξt
MODEL SZEREGU KLASOWEGO
Szereg czasowy
yt = f(t) + a(t) + ξt
funkcja odzwierciedlająca
wahania sezonowe
ξt - losowe wahania w tym zadaniu - addytyczne
yt = f(k) b(t) - ξt
Ocena wskaźnika sezonowości ah
T - bieżący identyfikator danych
yt,h = f(t) + ah + ξt
ah = 1/m∑ξ t,h
a1 = 1/3 (ξ1 + ξ5 + ξ9) = 1/3 ( -6-6-4) = -16/3 = -5,33
a2 = 1/3 (ξ2 + ξ6 + ξ10) = 1/3 (-1-1-3) = -5/3 = -1,66
a3 = 1/3 (ξ3 + ξ7 + ξ11) = 1/3 (1+3+4) = 8/3 = 2,66
Model
yt,h = yt+ ah
Średni wskaźnik sezonowości dla kwartału będziemy dodawać do funkcji trendu
y1,1 = 7-5,33 = 1,67
Błąd prognozy - nie obliczmy bo za dużo zmiennych
MODEL MULTIPLIKATYCZNY
yt = f(t)b(t)ξt
yt,h - f(k) bh ξt,h
Oceny wskaźników sezonowości
bn = 1/m ∑ yt,h/yt
gt,h = yt,h / yt
b1 = 1/3 (0,14+0,6+0,82) = 0,52
b2 = 1/3 (0,88+0,04+0,88) =0,9
b3 = 1/3 (1,09+1,15+1,14) = 1,12
b4 = 1/3 (1,3+1,23+1,13) = 1,22
Ocena funkcji
yt = yt - bh
Struktura czasowa wykazuje wahania sezonowe. Trend rosnący z wahaniami sezonowymi.
Czy do tego by pasował model multipliatyczny?
W tym przypadku by pasowała funkcja trendu wyznaczona na podstawie średnich.
Podstawowe własności modeli ekonometrycznych (estymacja modelu, parametry określające zgodność modelu z danymi i wariancja resztowa), współrzędne zbieżności, determinacji, współrzędne funkcji regresji ≠0.
Model ekonometryczny z 1 zmienną lun 2 lub 3 wymaga prognozy na podstawie podanego modelu. Wartości zmiennej objaśnianej.
Metoda najmniejszych kwadratów - estymacja trendu liniowego kwadratów nieliniowych.
Trend z jedna zmienną objaśniającą - czas.
!!! Oszacować parametry trendu
Wariancja rusztowa - błąd prognozy (współrzędne zbieżności, determinacja)
Metody klasyczne - najstarsze
Wyznaczanie trendu metodą najmniejszych kwadratów, metody adaptacyjne - średnie scentrowane (mediany)
Średnie ruchome scentrowane
Wahania sezonowe
Ocena dokładności składników losowych za pomocą wariancji ex post, wskaźniki prognozowania
MODELOWANIA SZEREGÓW CZASOWYCH
Metoda autoregesyjna
Y1,Y2,...,Yt, ..Yn - zależności liniowe autokorelacji
Autokorelacja do badania stopnia zależności.
|
Yt-1 |
Yt-2 |
Yt-Y |
Yt-1-Y |
(Yt-Y)2 |
(Yt-Y)(Yt-1Y) |
2 |
4 |
0 |
0,9 |
2,9 |
0,81 |
2,61 |
4 |
0 |
0 |
2,9 |
-1,1 |
8,41 |
-3,19 |
0 |
0 |
1 |
-1,1 |
-1,1 |
1,21 |
1,21 |
0 |
1 |
0 |
-1,1 |
-0,1 |
1,21 |
0,11 |
1 |
0 |
- |
-0,1 |
-1,1 |
0,01 |
0,11 |
0 |
- |
- |
-1,1 |
|
1,21 |
∑0,85 |
|
|
|
|
|
∑12,86 |
|
Model autoregresji
t
Yt = α0 + ∑ αdYt-1 + ξ t
d-1
t h
Yt = α0 + ∑ α1γt-1 + ∑βxt + ξt
t-1
PROGNOZY I SYMULACJE TESTY Z NASZEGO EGZAMINU
TEST 1
Zapisać i wyjaśnić własności funkcji opisującej trend paraboliczny
Trend wzrostu sprzedaży wody mineralnej ma postać Yt= 2t+180, gdzie t= 1,2,3... Kwartalne addytywne wskaźniki sezonowości sprzedaży wody wynoszą -50, -10, 40, 20 odpowiednio dla kwartałów I, II, III, IV. Prognozy na kolejne kwartały roku 10 wynoszą odpowiednio:
Notowania kursów akcji w kolejnych okresach wynoszą: 20, 30, 40, 50, 60. Zcentrowane średnie ruchome dwu-okresowe określa ciąg:
Współczynnik determinacji trendu liniowego wyznaczonego na podstawie 12 obserwacji wynosi 0,95, a suma kwadratów odchyleń zmiennej objaśnianej od jej średniej wynosi 20. Wartość wariancji resztowej jest równa:
W latach od 1 do 10 trend wzrostu sprzedaży pewnego towaru ma postać Yt= t2-2t+80 Średni względny błąd predykcji ex-ante poziomu sprzedaży na rok 12 jest równy 4%. Jaka jest wartość wariancji predykcji ex-ante na rok 12.
W miesiącach od stycznia do kwietnia zaobserwowano następujące indeksy łańcuchowe tygodniowych dochodów sklepu (w%): 114,116,116,118. Jakie było średnie tempo zmian. Wyznaczyć prognozę na podstawie indeksu średniego na miesiąc lipiec, gdy wiadomo, ze dochód sklepu w kwietniu wynosił 10 tyś. Zł.
W miesiącach od stycznia do lipca zaobserwowano nast. Miesięczne wydatki (w zł): 4,5,8,10,12,14,15. Oszacować trend metodą najmniejszych kwadratów na podstawie danych od stycznia do kwietnia i wyznaczyć na jego podstawie prognozy wydatków do lipca. Wyliczyć i zinterpretować średnią i wariancje ex-post błędów prognoz.
TEST 2
Trend wzrostu sprzedaży wody mineralnej ma postać Yt = 2t+180, gdzie t= 1,2,3.... Kwartalne multiplikatywne wskaźniki sezonowości sprzedaży wody wynoszą 120%, 50%, 140% i 90% odpowiednio dla kwartałów I, II, III, IV. Prognozy na kolejne kwartały roku 10 wynoszą odpowiednio:
Zapisać i wyjaśnić funkcje opisującą trend wykładniczy (*potęgowy)
Notowania kursów akcji w kolejnych okresach wynoszą 2,3,4,5,3. Średnie ruchome trój-okresowe określa ciąg:
Współczynnik zbieżności trendu liniowego wyznaczonego na podstawie 12 obserwacji wynosi 0,1, a wariancja resztowa 2. Wówczas suma kwadratów odchyleń zmiennej objaśnianej od jej średniej wynosi:
W latach od 1 do 10 trend wzrostu sprzedaży pewnego towaru ma postać Yt=t2-2t+80. Wariancja predykcji ex-ante wynosi 16 na rok 12. Średni względny błąd predykcji ex-ante poziomu sprzedaży na rok 12 jest równy:
W miesiacach od stycznia do kwietnia zaobserwowano następujące tygodniowe zyski sklepu (w tyś zł) 4,5,6,6,8,. Jakie było średnie tempo zmian . Wyznaczyć prognozę na podstawie indeksu średniego na miesiąc czerwiec
W miesiącach od stycznia do kwietnia zaobserwowano następujące miesięczne wydatki (w zł) 4,6,10,8. na podstawie trendu :y=3t+1 wyznaczyć drugi ciąg prognoz na miesiące od stycznia (t=1) do kwietnia. Wyliczyć średnią oraz wariancje ex-post błędów. Wyliczyć współczynniki Theila dla obu metod prognozowania.
TEST 3
W latach od 1 do 10 trend wzrostu sprzedaży pewnego towaru ma postać Yt=t2-2t+80. Wariancja predykcji ex-ante wynosi 16 na rok 12. Średni względny błąd predykcji ex-ante poziomu sprzedaży na rok 12 jest równy:
Trend wzrostu sprzedaży wody mineralnej ma postać Yt=2t+180 gdzie t=1,2,3,....Kwartalne multiplikatywne wskaźniki sezonowości sprzedaży wody wynoszą 50%, 100%, 200% i 80% Odpowiednio dla kwartałów I, II, III i IV. Prognozy na kolejne kwartały roku 10 wynoszą odpowiednio.
Zapisać i wyjaśnić funkcję opisującą trend potęgowy.
Notowania kursów akcji w kolejnych okresach wynoszą 2,3,4,5,3. Zcentrowane średnie ruchome trój-okresowe określa ciąg.
Współczynnik zbieżności trendu liniowego wyznaczonego na podstawie 12 obserwacji wynosi 0,2 a wariancja resztowa 2. Wówczas suma kwadratów odchyleń zmiennej objaśnianej od jej średniej wynosi:
W miesiącach od stycznia do kwietnia zaobserwowano następujące tygodniowe zyski sklepu (w tyś zł): 4,5,6,6,8. Jakie było średnie tempo zmian. Wyznaczyć prognozę na podstawie indeksu średniego na miesiąc czerwiec.
W kolejnych miesiącach zaobserwowano następujące tygodniowe wydatki (w zł) 4,6,4,8,5,6 Wyznaczyć ciąg prognoz metodą średnich ruchomych 3-składnikowych. Wyliczyć średnią oraz wariancje ex-post błędów. Wyliczyć współczynniki Theila dla obu metod prognozowania.
TEST 4
Zapisać i wyjaśnić własności funkcji opisującej trend logarytmiczny .
Trend wzrostu sprzedaży piwa ma postać : Yt=2t+10, gdzie t=1,2,3,.... Kwartalne addytywne wskaźniki sezonowości sprzedaży wody wynoszą -5,-1,4,2 odpowiednio dla kwartałów I, II, III, IV. Prognozy na kolejne kwartały roku 10 wynoszą odpowiednio:
Notowania kursów dolara względem złotego w kolejnych dniach wynoszą 4,3,4,5,60. Uprzednie średnie ruchome dwu-okresowe określa ciąg:
Współczynnik determinacji trendu logistycznego wyznaczonego na podstawie 12 obserwacji wynosi 0,95 a suma kwadratów odchyleń zmiennej objaśnianej od jej średniej wynosi 20. Wartość wariancji resztowej jest równa.
W latach od 1 do 10 trend wzrostu sprzedaży pewnego towaru ma postać: Yt=t2-2t+80 Średni względny błąd predykcji ex-ante poziomu sprzedaży na rok 12 jest równy 4%. Jaka jest wartość wariancji predykcji ex-ante na rok 12.
W miesiącach od stycznia do kwietnia zaobserwowano nast. Indeksy łańcuchowe tygodniowych dochodów hurtowni, (w%): 110,110,120,120 Jakie było średnie tempo zmian. Wyznaczyć prognozę na podstawie indeksu średniego na miesiąc lipiec , gdy wiadomo, że dochód sklepu w kwietniu wynosił 100 tyś zł.
W miesiącach od stycznia do lipca zaobserwowano nast. miesięczne wydatki (w zł) 4,5,8,10,12,14,15 . Oszacować metodą najmniejszych kwadratów trend na podstawie danych od stycznia do kwietnia i wyznaczyć na jego podstawie prognozy wydatków do lipca. Wyliczyć i zinterpretować średnią i wariancję ex-post błędów prognoz.
PROGNOZOWANIE I SYULACJA
-STRONA 43 -
Parametry
Obserwacje zmiennych objaśniających (egzogeniczne)
Składnik losowy = objaśnia wpływ czynników niewyjaśnionych
0
ξ
S2e = eTe *
1
n-k-1
1
n-1
n
S2e = ∑ e2k
t=1
1
n-k-1
X0 - początek przedziału mediany
C0 - długość przedziału mediany
n0- liczba przedziału mediany
cum-1 - liczba kumulacji przedziału poprzedzającego przedział mediany
S2e = eTe
1
n-k-1
1
n-1
n
S2e = ∑ e2t
t=1
1
n-k-1
et = yi - ∑αiXit
D(Un+h)
Yp,n+h
h- wyprzedzenie czasowe
a=
∑yt -y)t
∑(t-t)2
b = y - at
n
y = ∑yt
t=1
1
n
n
t = 1/n ∑t
t=1
S2e =
∑(yt-yt)2
n-2
t+(k-1/2)
Yt(k) = ∑Yi
i=t-(k-1/2)
1
k
t-(k/2-1)
Yt(k) = (1/2Yt-k/2 + ∑Yi + 1/2Yt +k/2)
i=t-(k/2+1)
1
k
I = √ I2 I3 I4 I5
4
I = √ = √
4
y2 y3 y 4 y5
y1 y2 y3 y4
4
y5
y1
4
0
-2
-4
-6
1 2 3 4 5 6 7 8 9 10 11 12
Średni wskaźnik sezonowości modelu multiplikatycznego
Żeby policzyć tak jak myśmy to zrobili to tak powinno to wyglądać
NASZ PRZYPADEK
stałe
λ =
Cov (Yt, Yt-1)
D(Yt) D(Yt-1)
D2(Yt) = δ2
t
λt = const
t-1
γd =
Ct,t-d = ∑(Yt-Y)(Yt-1-Y)
t
S2t-d = ∑(Yt-1-Y)2
t
Y= ∑Yt
t
γd =
Ct,t-1 = ∑(Yt - Y)(Yt-1 - Y)
Ct,t-d
St, St-d
1
n-d
1
n-d
1
n
Ct,t-d
S2t
1
n-1
P, gdy y = 1
1 - p, gdy y = 0
Pt, gdy y = 1
1 - pt, gdy y = 0
rozkład normalny
rozkład Studenta