Literatura:
„Prognozowanie gospodarcze” M Cieślak, PWN III wydanie
„Prognozowanie gospodarcze” Dittman AE Wrocław
„Predykcja ekonometryczna” A. Zewiasz
Wykład 1 - 13.10.2001
Wyznaczanie prognoz
Prognozowanie ilościowe czyli predykcja pozwala wyznaczać prognozy za pomocą przesłanek z modeli ekonometrycznych. Nie dotyczy ono tylko przyszłości ale może także dotyczyć przeszłości lub teraźniejszości. Prognozowanie ma ścisłe powiązania z demografią.
Prognozowanie wykorzystywane jest między innymi w Głównym Urzędzie Statystycznym oraz w dużych przedsiębiorstwach czy centralach gdzie za pomocą prognozowania ocenia się perspektywy planowanej produkcji.
Podstawowe pojęcia:
model ekonometryczny
(wg Z. Czerwińskiego) - może być rozumiany ogólnie, intuicyjnie jako obraz, odbicie, odwzorowanie określonego obiektu w określonym języku.
Model ekonometryczny - również będzie układem równań odwzorowującym wyróżnione zależności między zjawiskami ekonomiczno - społecznymi.
Część związków można mierzyć a niektóre nie.
Związki mierzalne nazywane są korelacyjnymi.
Y = f (x1, x2 ......xkၖ)
y - zjawisko badane
x1,x2-zjawiska, czynniki
ၖ- składnik losowy (psi,) - jest to łączny efekt oddziaływania na zmienną y, oddziałuje na te i inne czynniki, które nie zostały uwzględnione bezpośrednio w zbiorze x.
Jest to zmienna losowa o określonym rozkładzie.
E(ၖ) = 0; D2(ၖ) = ၤ2 = const. (ၤ2 - wariancja)
liniowy model ekonometryczny
Yt = ၡ0 + ၡ1xt + ၸt t = 1,2,………….,n
gdzie:
ၸt - składnik losowy
ၡ0 - współczynnik kierunkowy funkcji regresji
Aby przedłużyć prognozę od 1,2,.............,n należy wykonać estymację parametrów ၡ0 i ၡ1.
Do estymacji parametrów wykorzystuje się metodę najmniejszych kwadratów.
MNK polega na znajdowaniu takich wartości ocen parametrów strukturalnych modelu, by suma kwadratów odchyleń zaobserwowanych (empirycznych) wartości i zmiennej y, od jej wartości teoretycznych wyznaczonych przez model była najmniejsza w przypadku jednej zmiennej objaśniającej.
MNK polega na znajdowaniu takiej prostej , która jest najlepiej dopasowana, do wszystkich punktów empirycznych, czyli minimalizowana jest sumą kwadratów reszt (ut).
Klasyczne założenia MNK
Zmienne objaśniające x są nielosowe i niewspółliniowe k<n;
Istnieje n populacji składników losowych, o nadziejach matematycznych E(ၖt)=0 i stałych wariancjach o skończonych wartościach ၤ2 =D2(ၖt) = const, t= 1, 2, 3, ...... n.
Realizacje zmiennych tworzą proces czysto losowy tzn., że następuje po sobie realizacja składnika losowego , są nieskorelowane, czyli ρ(ၖt; ၖts)= 0 dla t ≠ s
składniki losowe są nieskorelowane ze zmiennymi objaśniajacymi.
Jeżeli ww. założenia są spełnione to estymator ma dobre własności tzn.
jest nieobciążony;
zgodny;
najbardziej efektywny;
f (0, 1) = ![]()
(Yt - 0 - 1xt)2 = ![]()
et2 ![]()
et2 = Yt - (0 - 1xt)
^ ^
f (0, 1) = minimum

gdy wartość zmiennej objaśniającej zależy od więcej niż jednej zmiennej objaśnianej
Yt = ၡ0 + ၡ1xt1 + ၡ2xt2 + …………. + ၡkxtk + ၸt
t = 1,2,……………,n
parametr „ၡ1” wskazuje o ile przeciętnie zmieni się wartość „y” jeśli „x1” zmieni się o jedną jednostkę w pewnym okresie czasu.
szeregi czasowe - są realizacją procesu stochastycznego który możemy zapisać ciągiem zmiennych losowych.
ၻytၽ= ၻy1, y2, ................., ynၽ szeregi czasowe
gdy „t” jest okresem miesiąca to:
„y1” to np. styczeń
„y2” to luty itd.
gdy zaobserwujemy już jakiś proces wówczas oznaczamy dane małymi literami.
momenty czasu
ၻYtၽ= ၻY1, Y2, ................., Ynၽ
zmienna “Y” jest pewną funkcją która może
przybierać różne wartości „y”
0,3 dla y = 0
PၻY=yၽ = 0,5 dla y = 1
0,2 dla y = 2
PၻY=yၽ = 0 < p < 1
realizacja procesu to ciąg: ၻ0,0,1,1,0,0,0,1ၽ
^
oceniając p wyznaczamy prognozę
![]()
„p” zmienia się jednak z czasem
P ၻYt=yၽ = 0 < p < 1
Rachunek macierzowy
Y = ![]()
x = 
n x 1 n x (k+1)
Składnik losowy - ၸ (ksi)
ၸ = 
ၡ = ![]()
n x 1 (k + 1) x 1
f (α0, α1, ................... αk) = ![]()
lub w formie macierzowej:
Y = Xα + ξ Y* = Xα ; Y* - wartość teoretyczna funkcji regresji
f(α) = (Y - Yt)T(Y - Y*) = (Y - Xd)T(Y - Xα)
![]()
![]()
gdy, chcemy obliczyć średni błąd szacunku stawiamy hipotezę, że α0 = 0 i próbujemy ją zweryfikować.
Główne klasyczne założenia regresji liniowej.
zakładamy, że dla każdego „t” nadzieja matematyczna równa się 0.
![]()
2. zakładamy, że dla każdego „t” wariancja składnika losowego jest równa δ2 - jest stała
![]()
składnik losowy ma rozkład homostechastyczny
![]()
3. gdy w czasie są nieskorelowane macierze składników losowych

4. zakładamy, że wartości zmiennych objaśniających są nie losowe to znaczy są
ustalone z góry.
R(X) = k+1 ⇒ det (XTX) > 0 R(X) - rząd macierzy
5. czasami wprowadzamy założenie, że wektor składników losowych ma
n-wymiarowy rozkład normalny z nadzieją matematyczną równą 0.
ξ ∼ N(0, In δ2) ⇒ Y ∼ N(Xαi, In δ2)
wektor wartości funkcji regresji (wartości teoretyczne funkcji regresji)
![]()
![]()
![]()
wariancja resztowa
![]()
współczynnik zbieżności

![]()
![]()
Macierz wariancji i dewariancji estymatorów.
D2(α) = (XTX)-1δ2 Se2 ⇒ δ2
![]()
![]()
![]()
![]()
![]()
; ![]()
Hipotezy:
a) H0 αj = 0
b) H1 αj ≠ 0
j-oty parametr funkcji jest równy 0, nie ma wpływu ma zmienną objaśniającą.
Sprawdzian testu Studenta

![]()
0
![]()
a → ta → K = (-∞; -ta > ∪ < ta; ∞)
za „a” przyjmujemy małą liczbę np. 0,01; 0,05
Poziom istotności:

prognoza czy wartość symulowana
![]()
XT - wartości hipotetyczne
![]()
Wykład 2 - 28.10.2001
Model potęgowy
![]()
t = 1,2, ........., n
najczęściej rozważany natomiast jest model:
![]()
gdzie:
Zt - poziom zatrudnienia,
Wt - poziom środków trwałych,
α1- elastyczność produkcji względem zatrudnienia.
model ten jest modelem nieliniowym
- estymacja modelu:
![]()
- logarytm modelu:
![]()
Ut, Rt, Vt - są nowymi zmiennymi
po obliczeniu otrzymujemy:
![]()
natomiast ![]()
]
Szczególne modele regresji (trendy).
a) model addytywny jest jednym z modeli szeregu czasowego
Yt,h = f(t) + a(h) + ξt
trend wahania wahania
sezonowe losowe
trend f(t) jest funkcją kolejnych numerów czasów (generalnie obrazuje przyrost).
b) model multiplikatywny.
![]()
rozwój zjawiska obrazuje trend ale wahania sezonowe są coraz większe (brak stabilności)
Najprostszą formą trendu jest funkcja liniowa:
f1(t) = β0 + tβ1 + ξt
Wyliczenie parametrów na podstawie wzorów analitycznych:
wzór 1:

wzór 2:

wzór 3:

wzór na β0:
![]()

Zadanie:
W miesiącach od stycznia do kwietnia zaobserwowano następujące wydatki: 4, 6, 10, 8.



![]()


![]()
Interpretacja wyniku: Średnio z miesiąca na miesiąc wartość wydatków rosła o 1,6 jednostki.
t |
|
Yt |
Yt- |
|
1 |
4,6 |
4 |
-0,6 |
0,36 |
2 |
6,2 |
6 |
-0,2 |
0,04 |
3 |
7,8 |
10 |
2,2 |
4,84 |
4 |
9,4 |
8 |
-1,4 |
1,96 |
Σ |
|
|
0,0 |
7,2 |
suma reszt
jest to pośredni test sprawdzający poprawność wykonania zadania, gdy otrzymamy 0 zadanie uważa się za wykonane poprawnie.
obliczamy odchylenia wydatków od trendu:

Interpretacja wyniku: Wydatki rzeczywiste odchylają się od trendu o 1,9 jednostki.
oceniamy błąd obliczeń:



Interpretacja wyniku: Średni błąd szacunku czyli odchylenie standardowe estymatora pierwszego β1 jest równe 0,85 jednostki (wskazuje to rząd błędu jakim szacowany jest parametr)
oceniamy względny błąd szacunku (błąd średni)

Interpretacja wyniku: Względny błąd szacunku stanowi 53,1% oceny całego szacunku.
Wyznaczamy prognozę na podstawie trendu:
![]()
![]()
Interpretacja wyniku: Prognoza równa jest 11 jednostek.
Obliczamy możliwy błąd prognozy:
![]()
czyli: ![]()
- średni błąd prognozowania czyli predykcji.
Interpretacja wyniku: Rzeczywiste prognozowania które występują w przyszłości mogą się odchylać o 5,2 jednostki.
Obliczamy odchylenie średniego błędu predykcji:

Rodzaje trendów liniowych.
a) ![]()
![]()
przyrost trendu liniowego
b) aby opisać krzywą z wykresu należy:
![]()
funkcja trendu zapisana jest w postaci funkcji regresji, do obliczenia jej używamy wzorów macierzowych.

c) krzywą tą możemy również modelować za pomocą funkcji wykładniczej:
![]()
![]()
i wyznaczamy logarytm:
![]()
![]()
; ![]()
d) inna postać trendu to:
![]()
model szeregu czasowego wygląda wtedy następująco:
![]()
i wyznaczamy logarytm:
![]()

![]()
e) funkcja logarytmiczna:
![]()
![]()
f) funkcja logistyczna:
![]()
f(t) punkt nasycenia rynku
t
Zadanie:
Rozważamy wahania sezonowe o cyklu rocznym, obserwowane będą wartości cechy w poszczególnych miesiącach:
gdzie: t = 1,2 - bieżący numer miesiąca
h = 1,2,3,.......,12- miesiąc w cyklu wahań
k = 1,2,.... - numer roku .
np. obserwacja z piątego roku z marca
to: k=5; h=3
t = (5-1) x 12 + 3 = 48+3 = 51
z obliczenia wynika, że jest to 51 miesiąc z kolei w cyklu który obserwujemy.
cykl dwuokresowy:
![]()
![]()
określa amplitudę
wahania sezonowego
gdzie:
„t” - przyjmujemy jako bieżące półrocze
„h” - numer półrocza (0 - pierwsze półrocze, 1 - drugie półrocze)
„k” - numer roku
macierz danych przyjmuje następującą postać:

cykl kwartalny - wprowadzamy dwie zmienne zero - jedynkowe.
![]()
suma dwóch zmiennych
zero jedynkowych

aby obliczyć cykl miesięczny musimy wprowadzić cztery zmienne zero jedynkowe
numer bieżący miesiąca:
t = (k-1)c+h
wahania sezonowe wprowadzają składnik losowy ηt (eta).
![]()
![]()
![]()
![]()
m - liczba wszystkich lat
![]()
np.
![]()
gdzie: t - numer bieżący kwartału

prognozy kwartalne
wyznacz prognozę na trzeci kwartał piątego roku:
k=5, H=3
T = (k-1)c+H
T = (5-1) 4+3 = 19
badany kwartał jest 19 z kolei badanym kwartałem
obliczamy prognozę:
![]()
Wykład 3 - 10.11.2001
Wyznaczanie tendencji rozwojowych zwanych trendami.
Metody adaptacyjne:
a) metoda średnich ruchomych - metoda wygładzania średnich czasowych.
t |
Yt |
|
|
|
1 |
2 |
- |
- |
- |
2 |
4 |
3,3 |
- |
3,5 |
3 |
4 |
5,3 |
4,0 |
5,0 |
4 |
8 |
4,7 |
4,8 |
5,5 |
5 |
2 |
5,3 |
4,4 |
4,5 |
6 |
6 |
3,3 |
4,4 |
4,0 |
7 |
2 |
4 |
- |
3,5 |
8 |
4 |
- |
- |
- |
obliczeń w tabeli dla średniej ruchomej scentrowanej trzyokresowej dokonano z wzoru:
![]()
a dla średniej ruchomej scentrowanej pięciookresowej z wzoru:
![]()
wykres szeregu ![]()
(3) oraz ![]()
(5) przedstawia się w sposób następujący:

Im więcej składowych tym przebieg jest bardziej łagodny. Zazwyczaj rozważamy średnie 5, 10, 30 i 100 okresowe.
Uogólnienie wzoru na dowolną liczbę składników:
gdy k jest liczbą nieparzystą:

gdy k jest liczbą parzystą:
dla k = 2
![]()
dla k = 4
![]()
dla dowolnej liczby parzystej:

b) średnie ruchome uprzednie:
wzór ogólny:
![]()
w szczególności:
![]()
![]()
Im większe „k” tym prognoza wyznaczona na podstawie tendencji długookresowej a im mniejsze „k” prognoza zależna od czynników bieżących.
przykład:
t |
Yt |
|
|
Ut(2) |
Ut(4) |
Ut2(2) |
Ut2(4) |
1 |
2 |
- |
- |
- |
- |
- |
- |
2 |
4 |
- |
- |
- |
- |
- |
- |
3 |
4 |
3 |
- |
1 |
- |
1 |
- |
4 |
8 |
4 |
- |
4 |
- |
16 |
- |
5 |
2 |
6 |
4,5 |
- 4 |
-2,5 |
16 |
6,25 |
6 |
6 |
5 |
4,5 |
1 |
-1,5 |
1 |
2,25 |
7 |
2 |
4 |
5,0 |
- 2 |
-3,0 |
4 |
9 |
8 |
4 |
4 |
4,5 |
0 |
-0,5 |
0 |
0,25 |
Σ |
|
|
|
0 |
-4,5 |
38 |
17,75 |
wyznaczanie prognozy na okres 9:
wyliczamy błędy prognoz ex - post na podstawie wzoru:
![]()
średnie wartości błędów prognoz obliczamy z wzoru:
![]()
dla badanego przykładu:
![]()
![]()
prognoza przeszacowana
wyznaczenie wariancji predykcji ex - post obliczamy z wzoru:
![]()
dla badanego przykładu:
![]()
⇒ Sp(2) = 2,52
![]()
⇒ Sp(4) = 2,11
wyniki obrazują odchylenia prognoz, ze względu na mniejszy błąd należy wybrać prognozę o parametrze 2,11.
uprzednia mediana ruchoma.
![]()
k = 1,2 ⇒ Met(k) = ![]()
przykład:
t |
Yt |
Met+1(3) |
Met+1(4) |
1 |
2 |
- |
- |
2 |
4 |
4 |
- |
3 |
4 |
4 |
- |
4 |
8 |
4 |
4 |
5 |
2 |
6 |
4 |
6 |
6 |
2 |
5 |
7 |
2 |
4 |
4 |
8 |
4 |
- |
3 |
obliczenie do tabeli:
Met+1(3) - kolejność składników do obliczeń wpisywać rosnąco (od najmniejszej do największej).
mediana dla nieparzystej liczby składników jest składnikiem środkowym.
2,4,4 środkowa 4 czyli mediana
4,4,8 środkowa 4 czyli mediana
2,4,8 środkowa 4 czyli mediana
2,6,8 środkowa 6 czyli mediana
2,2,6 środkowa 2 czyli mediana
2,4,6 środkowa 4 czyli mediana
Met+1(4) - kolejność składników do obliczeń wpisywać rosnąco (od najmniejszej do największej).
mediana dla parzystej liczby składników jest średnią arytmetyczną środkowych dwóch operacji.
2,4,4,8 suma dwóch środkowych cyfr dzielona przez dwa 8:2 = 4
2,4,4,8 suma dwóch środkowych cyfr dzielona przez dwa 8:2 = 4
2,4,6,8 suma dwóch środkowych cyfr dzielona przez dwa 10:2 = 5
2,2,6,8 suma dwóch środkowych cyfr dzielona przez dwa 8:2 = 4
2,2,4,6 suma dwóch środkowych cyfr dzielona przez dwa 6:2 = 3
![]()
![]()

wyznaczanie kwantyli - gdy „k” jest duże:
![]()
![]()
Wykład 4 - 12.01.2002
Metody adaptacyjne cd.
wyrównywanie wykładnicze ma postać:
![]()
![]()
ocena trendów w okresie ![]()
jest równa:
![]()
![]()
ocena ta równa jest średniej wartości dwóch ważonych
prognoza na okres t+1 ma postać:
![]()
prognozę tę możemy również zapisać jako:

Ut - błąd prognozy
![]()
![]()
błąd prognozy okresu t+1
Sposoby wyznaczania parametru α.
W praktyce wykonujemy to w sposób arbitralny - jeśli szereg który mamy analizować przebiega w sposób stacjonarny.
Aby wyznaczyć α przyjmuje się, że:
α = 0; 0,1; 0,2; 0,3; 0,4; ........................1,0
i dla każdego α wylicza się wartości trendu np.

k = 1,2 ............n
następnie obliczamy błędy prognozowania Ut,p(α)
następnie wyliczamy sumy kwadratów błędów prognozowania
![]()
![]()
przykład:
Cena akcji w poszczególnych pięciu notowaniach tworzy następujący szereg.
Wyznaczyć prognozę na okres szósty.
t |
Yt |
|
|
|
|
1 |
2 |
2,0 |
- |
- |
- |
2 |
4 |
3,6 |
2,0 |
2 |
4,0 |
3 |
1 |
1,52 |
3,6 |
-2,6 |
6,76 |
4 |
5 |
4,3 |
1,52 |
3,5 |
12,25 |
5 |
5 |
4,86 |
4,3 |
0,7 |
0,49 |
6 |
- |
- |
4,86 |
- |
|
Σ |
|
|
|
|
23,50 |
dla obliczeń założono, że
Y0 = Y1 a α = 0,8
sposób obliczania ![]()

suma kwadratów Q(α) wynosi Q(0,8) = 23,5
możemy teraz obliczyć wariancję predykcji ex - post
![]()
![]()
metoda autoregresyjna
rozważamy ciąg obserwacji od Y1 do Yn
współczynnik autokorelacji rzędu „k”
(ro) ![]()
i należy do przedziału <-1,1>
![]()
![]()
estymator współczynnika:
![]()
![]()
![]()
modele autoregresyjne:
funkcja autoregresyjna rzędu „g”
![]()
![]()
model autoregresyjny rzędu pierwszego zachodzi gdy:
Rk > Rk+1 k = 1,2 ................. n
i ma postać:
![]()
Współczynnik autokorelacji rzędu pierwszego mierzy następujące współzależności:
B(Yt,Yt-1) > 0
B(Yt, Yk) = 0
dla k = 2,3 .................n
http://otior.w.interia.pl Prognozowanie i symulacje
______________________________________________________________________________
1
Pt, gdy y = 1
1 - pt, gdy y = 0
rozkład Studenta
P, gdy y = 1
1 - p, gdy y = 0
rozkład normalny