background image

 

 

6. Dopasowywanie modeli do danych 

W  procesie  dopasowywania  modelu  matematycznego  y

m

 = g

m

(u,θ)  do  dodanych 

eksperymentalnych wyodrębnić można dwa podstawowe etapy: 

•  identyfikację  strukturalną,  czyli  dobór  g

m

  –  odpowiedniego  do  problemu  typu  równań 

matematycznych  i  powiązań  między  nimi  (może  się  ona  odbywać  na  drodze  analizy 
struktury fizycznej obiektu lub empirycznie); 

•  estymację parametrów, polegająca na doborze takich wartości parametrów modelu θ , aby 

jak  najdokładniej  opisywał  on  posiadane  dane  (poza  przypadkiem  stosowania  praw  lub 
teorii  fizycznych,  w  których  wartości  parametrów  są  określone,  ma  ona  charakter 
empiryczny). 

 

6.1. Estymacja parametrów jako zadanie odwrotne 

Estymacja  parametrów  modelu  jest  zadaniem  odwrotnym  drugiego  rodzaju.  Na  podstawie 
skutku,  jakim  są  dane  wyjściowe  y  (uzyskane  dla  pewnego  pobudzenia  u)  wyznaczana  jest 
przyczyna takiej, a nie innej ich postaci, a są nią wartości parametrów modelu θ. Rozwiązanie 
tego  zadania  wymaga  formalnego  odwrócenia  związku  przyczynowo-skutkowego 
wyrażonego przez model g

m

, jego struktura mus być zatem znana. 

 
Estymacja  parametrów  modeli  fizykomatematycznych,  gdzie  odzwierciedlają  one 
właściwości  fizyczne  modelowanego  obiektu,  jest  równoważna  z  pośrednim  pomiarem 
złożonym tych właściwości. 
 

Można  się  zastanawiać,  czy  estymacja  parametrów  danego  modelu  (o  znanej  strukturze  g

m

)  jest  jednakowo 

efektywna  dla  dowolnego  pobudzenia  u,  czy  też  istnieje  pewne  u  optymalne,  dające  najdokładniejsze 
oszacowanie θ. Na pytanie to odpowiada teoria planowania eksperymentów (rozdz. 8). 

 
 

6.2. Estymacja parametrów modeli liniowych 

Model może być liniowy np. względem wejść, parametrów, zmiennych stanu itd. W rozdziale 
tym  pod  pojęciem  „model  liniowy”  rozumiane  będą  modele  liniowe  względem  parametrów 
(LP), gdyż właśnie ta cecha determinuje postać algorytmów estymacji. 
 
Przypomnijmy, że model liniowy musi spełniać zasadę superpozycji: 
 
 

2

1

2

1

,

,

,

θ

u

θ

u

θ

θ

u

y

m

m

m

m

bg

ag

b

a

g

 

gdzie  a  i  b  są  skalarami,  a  całkowity  wektor  parametrów  to  θ

T

T
2

T

1

θ

θ

.  Model  taki, 

uwzględniając przekształcenie pobudzenia u przez funkcję (liniową lub nieliniową) f

i

, można 

ogólnie zapisać jako: 
 
 

 

 

θ

u

θ

u

y

i

m

m

f

g

,

 

background image

Techniki eksperymentu 

(© A.G. Polak 2014)

 

 

lub posługując się macierzą eksperymentu (tożsamą z macierzą wrażliwości): 
 
 

y

m

 
gdzie dla N próbek i p parametrów: 
 

 

 

 

 

 

N

p

N

p

m

u

f

u

f

u

f

u

f

1

1

1

1

θ

y

X

 
Zwykle liczba obserwacji (danych w spróbkowanych sygnałach u i y) jest większa od liczby 
parametrów θ, tj. N > p. 
 
Przykładem może być model w postaci szeregu potęgowego 3-go rzędu: 
 

 

 

 

 

 

.

3

4

2

3

2

1

4

4

3

3

2

2

1

1

u

u

u

1

u

u

u

u

y

f

f

f

f

m

 

 
Wtedy macierz eksperymentu przyjmie postać: 
 

 

3

3

1

1

1

1

N

N

u

u

u

u

X

 
Ostatecznie  zarejestrowane  dane  wyjściowe  y  to  (w  uproszczeniu)  wyjście  modelu  y

m

 

zakłócone addytywnym szumem v
 
 

v

y

y

m

 
 

6.2.1. Podstawowe założenia 

Podczas estymacji parametrów modelu w oparciu o dane eksperymentalne najczęściej zakłada 
się,  że  można  je  traktować  jako  realizację  zmiennej  losowej  y  opisanej  funkcją  gęstości 
prawdopodobieństwa p(y,θ), co wypływa ze stochastycznego charakteru wektora parametrów 

θ 

 
 

 

θ

u

y

,

0

g

 

 
lub szumu v
 
 

ν

θ

u

y

0

0

,

g

 

background image

 

4. Wsadowe metody estymacji parametrów modeli liniowych 

 

Prawdziwy  (hipotetyczny)  model  związku  przyczynowo-skutkowego  o  charakterze 
deterministycznym  oznaczony  jest  tu  jako  g

0

,  a  θ

0

  to  prawdziwe  wartości  parametrów  tego 

modelu. 
 
Wektor v traktowany jest jako realizacja zmiennej losowej v. Jeżeli szum jest skorelowany, to 
macierz jego kowariancji wynosi 
 

 

 

 

R

νν

ν

T

cov

E

 
W szczególności, gdy szum jest nieskorelowany, macierz kowariancji ma postać: 
 
 

2

2

2

2

1

diag

N

R

 
lub dodatkowo dla szumu stacjonarnego: 
 
 

I

R

2

v

 
Często  zakłada  się  też,  że  addytywne  zakłócenia  losowe  mają  charakter  szumu  białego 
(gaussowskiego):

e

ν

, gdzie e to realizacja szumu białego o wariancji 

2

e

 
Koncepcja wyjaśniająca losowy charakter danych wynikający z ich zakłócenia addytywnym 
szumem pozwala następująco scharakteryzować właściwości statystyczne y
 
 

 

 

R

y

θ

u

y

cov

   

   

,

0

0

g

E

 
Natomiast  w  przypadku  losowego  charakteru  wektora  parametrów,  θ

0

  należy  interpretować 

jako 

 

θ

E

 
 

6.2.2. Metody wsadowe 

Metody wsadowe pozwalają na obliczenie estymatorów parametrów modelu matematycznego 
na  podstawie  wcześniej  zarejestrowanych  danych  pomiarowych  (off-line).  W przypadku 
modeli liniowych realizujące je algorytmy są jednokrokowe i stosunkowo nieskomplikowane. 
Wadą  ich  jednak  jest  to,  że  estymacja  może  być  przeprowadzona  dopiero  po  zakończeniu 
eksperymentu, a nie w czasie jego trwania. 
 

6.2.2.1. Metody bayesowskie 

Metody  bayesowskie  wykorzystują  prawdopodobieństwa  warunkowe.  Do  ich  grona  należy 
metoda  maksymalnego  prawdopodobieństwa  a  posteriori  (MAP).  Dane  eksperymentalne  y 
traktowane są w niej jako znane, natomiast  θ jako wektor losowy. Estymator 

MAP

θˆ

uzyskuje 

się maksymalizując prawdopodobieństwo tego, że pochodzi on z systemu o zarejestrowanym 
(ustalonym) y
 

 

y

θ

θ

θ

|

max

arg

ˆ

f

MAP

 

background image

Techniki eksperymentu 

(© A.G. Polak 2014)

 

 

gdzie funkcja gęstości prawdopodobieństwa a posteriori 

 

y

θ |

f

 na podstawie wzoru Bayesa 

wynosi: 
 

 

  

 

y

θ

θ

y

y

θ

f

f

f

f

|

|

 
Funkcja  gęstości  prawdopodobieństwa 

 

θ

|

f

  znajdująca  się  w  liczniuku  nazywana  jest 

funkcją 

wiarygodności 

L(y,θ). 

Ponieważ 

y 

jest 

ustalone, 

maksymalizacja 

prawdopodobieństwa a posteriori sprowadza się do maksymalizacji licznika: 
 

 

   

θ

θ

y

θ

θ

f

L

MAP

,

max

arg

ˆ

 
W celu wyznaczenia wartości estymatora 

MAP

θˆ

 konieczna jest zatem aprioryczna znajomość 

funkcji gęstości prawdopodobieństwa wektora parametrów f(

), co jednak rzadko ma miejsce. 

W  sprzyjających  okolicznościach  dostępne  są  typy  poszczególnych  rozkładów  (rys.)  oraz 
estymaty ich dwóch pierwszych momentów, tj. wartości oczekiwanej i wariancji [Nied’09]. 
 

 

 

Rys. Przykładowe rozkłady gęstości prawdopodobieństwa parametru: normalny (lewy panel) i jednostajny 

(prawy panel) 

6.2.2.2. Metoda największej wiarygodności 

W  metodzie  największej  wiarygodności  (ML)  dane  eksperymentalne  y  traktowane  są  jako 
zmienna  losowa,  a 

  jako  nieznany,  lecz  ustalony  wektor  parametrów.  Estymację  można 

interpretować  jako  wybór  takiego  wektora  parametrów,  dla  którego  zarejestrowane  dane  są 
najbardziej prawdopodobne (wg funkcji wiarygodności L).  
 
Przy maksymalizacji prawdopodobieństwa wystąpienia zaobserwowanych wartości y (tzn. ich 
wiarygodności)  postępuje  się  analogicznie  jak  przy  dopasowaniu  odpowiedzi  modelu  do 
pomiarów tyle, że tym razem model odpowiedzi ma charakter statystyczny, podany w postaci 
funkcji gęstości prawdopodobieństwa wystąpienia ich określonych wartości. 
 
Funkcja gęstości prawdopodobieństwa ciągu próbek 

N

y

,...,

1

  sygnału  odpowiedzi  na znane 

pobudzenie  ma  postać  wielowymiarową,  a  wartości  próbek  zależą  od  poszukiwanych 
parametrów modelu θ. Każda z próbek jest realizacją pewnej zmiennej losowej y

i

, a funkcja 

gęstości opisuje cały wektor zmiennych 

N

y

,...,

1

y

 w sposób łączny. 

 

background image

 

4. Wsadowe metody estymacji parametrów modeli liniowych 

 

Estymator 

ML

θˆ

 maksymalizuje funkcję wiarygodności L(y,θ) ≡ f(y|θ): 

 

 

 

θ

y

θ

θ

,

max

arg

ˆ

L

ML

 
Maksymalizacja  może  być  przeprowadzona  tylko  przy  znajomości  postaci  funkcji 
wiarygodności.  Zatem,  aby obliczyć 

ML

θˆ

, należy znać lub  założyć na podstawie posiadanej 

wiedzy jej jawną postać zależną od θ
 
W  ogólności  poszukiwanie  ekstremum  nieliniowej  funkcji  L  sprowadza  się  do  problemu 
optymalizacyjnego  (patrz  rozdz.  3.4).  W  przypadku  pewnych  rozkładów  gęstości 
prawdopodobieństwa  zadanie  upraszcza  się  jednak  do  estymacji  liniowej.  Takim 
przypadkiem,  najczęściej  też  stosowanym  w  praktyce,  jest  opis  addytywnych  zakłóceń 
pomiaru  poprzez  rozkład  normalny,  a  w  szczególności  przez  ich  macierz  kowariancji  R
Wtedy  wielowymiarowy  rozkład  łączny  ma  funkcję  gęstości  prawdopodobieństwa  (funkcję 
wiarygodności) postaci: 
 

 

 

  

 

 

 

θ

ε

R

θ

ε

R

R

θ

y

θ

y

1

T

2

1

2

1

2

exp

det

2

,

,

|

N

L

f

π

 
gdzie wektor rezyduów (reszt): 
 
 

ε(θ) = y – y

m

(θ). 

 
Korzystając z faktu, iż logarytm jest funkcją monotoniczną, poszukiwanie maksimum funkcji 
wiarygodności sprowadza się do poszukiwaniu maksimum jej logarytmu naturalnego postaci: 
 

 

 

 

 

 

θ

ε

R

θ

ε

R

1

T

2

1

2

1

2

1

det

ln

π

2

ln

ln

N

L

 
co  upraszcza  obliczenia.  Ponieważ  pierwsze  dwa  składniki  maksymalizowanego  wyrażenia 
nie  zależą  od  estymowanych  parametrów,  to  ostatecznie  maksymalizacja  funkcji 
wiarygodności prowadzi do minimalizacji (znak minus przy ostatnim czynniku) funkcjonału 

 

θ

ML

V

 

 

 

 

 

 

 

 

 

.

,

min

arg

ln

max

arg

ˆ

1

T

2

1

1

T

2

1

θ

y

y

R

θ

y

y

θ

ε

R

θ

ε

θ

θ

θ

θ

θ

m

m

ML

ML

ML

V

V

L

 

 
Różniczkując macierzowo funkcję kryterialną V

ML

(θ) względem θ 

 

 

 

 

y

R

X

y

R

y

θ

θ

y

y

R

θ

y

y

θ

θ

1

T

1

T

2

1

1

T

2

1

m

m

ML

V

 

 
 i przyrównując pochodną do zera: 
 

 

y

R

X

θ

X

R

X

θ

X

R

X

y

R

X

θ

X

y

R

X

1

T

1

T

1

T

1

T

1

T

ˆ

,

0

ˆ

,

0

ˆ

ML

ML

ML

 

background image

Techniki eksperymentu 

(© A.G. Polak 2014)

 

 

 
 Znajduje się minimum V

ML

 dla estymatora postaci: 

 

 

y

R

X

X

R

X

θ

1

T

1

1

T

ˆ

ML

 

 
o macierzy kowariancji S

ML

 

 

 

1

1

T

ˆ

cov

X

R

X

θ

S

ML

ML

 
Warto  zauważyć,  że  estymator  ML  jest  szczególnym  przypadkiem  estymatora  MAP  wtedy, 
gdy rozkłady gęstości prawdopodobieństwa parametrów modelu są jednostajne: 
 

 

 

t

f

MAP

ML

cons

θ

θ

θ

ˆ

ˆ

 
gdyż wtedy: 
 

 

   

 

ML

MAP

L

f

L

θ

θ

y

θ

θ

y

θ

θ

θ

ˆ

,

max

arg

,

max

arg

ˆ

 

6.2.2.3. Metoda najmniejszych kwadratów 

W  metodzie  najmniejszych  kwadratów  (LS),  wprowadzonej  przez  Legendre’a  i  Gaussa, 
zakłada  się  addytywny  charakter  szumu  będącego  realizacją  nieskorelowanych  zmiennych 
losowych o rozkładzie normalnym, zerowej wartości oczekiwanej i jednakowej wariancji (co 
w wielu wypadkach jest uzasadnione dzięki centralnemu twierdzeniu granicznemu). Podejście 
to wymaga zatem niewielkiej wiedzy apriorycznej. 
 

Estymator 

LS

θˆ   uzyskuje  się  minimalizując  odległość  modelu  y

m

(θ)  od  danych 

eksperymentalnych y w przestrzeni l

2

 (odległość euklidesowa): 

 

 

 

θ

θ

θ

LS

LS

V

min

arg

ˆ

 
gdzie funkcjonał V

LS

 ma postać: 

 

 

 

 

 

.

,

T

2

2

1

2

2

2

y

y

y

θ

θ

y

y

θ

N

i

i

m

i

m

LS

u

y

y

V

 

 
Zauważmy, że podejście to stosowane jest przy założeniu, że addytywne błędy pomiarowe e 
występują  tylko  w  zmiennej  zależnej  (zarejestrowany  sygnał  wyjściowy  y),  natomiast 
zmienna niezależna (pobudzenie u) znana jest bezbłędnie (rys). 
 
 

background image

 

4. Wsadowe metody estymacji parametrów modeli liniowych 

 

 

Rys. Ilustracja błędów zmiennej zależnej y w metodzie najmniejszych kwadratów 

 
W  celu  znalezienia  wektora  parametrów  dającego  minimum  funkcjonału  należy 
zróżniczkować V

LS

 względem θ

 

 

X

y

X

y

X

θ

θ

T

T

T

2

2

2

)

(

LS

V

 

 
i uzyskane wyrażenie na pochodną przyrównać do zera: 
 

 

.

ˆ

,

0

ˆ

2

2

T

T

T

T

y

X

θ

X

X

θ

X

X

y

X

LS

LS

 

 
Macierz  X

T

X  o  wymiarze  p

p  (gdzie  p  to  liczba  parametrów)  jest  kwadratowa  i  jeżeli  jest 

nieosobliwa, to można ją odwrócić uzyskując wyrażenie na estymator: 
 

 

 

y

X

X

X

θ

T

1

T

ˆ

LS

 
Warunkiem na to, że wyznaczone ekstremum to  minimum, jest dodatnio określony hessian, 
czyli macierz drugich pochodnych: 
  

 

 

X

X

X

y

X

θ

θ

θ

T

T

T

2

2

2

2

2

LS

V

 
Macierz X

T

X jest dodatnio określona, zatem znalezione ekstremum to minimum. 

 
Macierz kowariancji estymatora LS dana jest przez: 
 

 

 

 

1

T

2

ˆ

cov

X

X

θ

S

e

LS

LS

 
gdzie 

2

e

, dla przypomnienia, jest wariancją addytywnego szumu białego. Ponieważ metodę 

LS  stosuje  się  w  sytuacjach,  w  których  nieznane  są  właściwości  statystyczne  zakłóceń,  nie 
można wyznaczyć odchyleń standardowych estymatorów bezpośrednio z powyższego wzoru 
(wartość 

2

e

  nie  jest  znana).  Wariancję  szumu  można  jednak  oszacować  na  podstawie 

background image

Techniki eksperymentu 

(© A.G. Polak 2014)

 

 

rezyduów,  zakładając  bezbłędność  modelu.  Wtedy  błąd  średniokwadratowy  V

MSE

 

dopasowania modelu do danych wynosi [Sjöberg’95]: 
 

 

 

 

2

2

2

ˆ

1

ˆ

e

e

e

LS

LS

LS

LS

MSE

σ

N

p

N

N

p

σ

σ

V

E

N

V

  

   

θ

θ

 
Pamiętając, że jednocześnie 
 

 

 

 

 

θ

y

y

θ

y

y

ε

ε

θ

m

m

LS

LS

N

N

V

N

T

T

1

1

ˆ

1

 
otrzymuje  się  znane  wyrażenie  pozwalające  oszacować  wariancję  szumu  na  podstawie 
wyznaczonych rezyduów: 
 

 

ε

ε

T

2

1

N

N

p

N

e

 

 
i ostatecznie [Hocking’76]: 
 

 

   

 

p

N

p

N

LS

LS

e

y

X

X

X

X

I

y

θ

ε

θ

ε

T

1

T

T

T

2

ˆ

ˆ

ˆ

 
Estymator LS jest szczególnym przypadkiem estymatora ML (a tym samym MAP) w sytuacji, 
gdy  addytywne  zakłócenia  mają  charakter  stacjonarny  (tj. 

2

2

2

2

2

1

e

N

)  i  są 

realizacją niezależnych zmiennych losowych (tzn. macierz kowariancji jest diagonalna): 
 

 

 

I

R

θ

θ

2

ˆ

ˆ

e

ML

LS

gdyż wtedy: 
 

 

 

 

LS

e

e

e

e

ML

θ

y

X

X

X

y

X

X

X

y

X

X

X

y

R

X

X

R

X

θ

ˆ

ˆ

T

1

T

2

T

1

T

2

2

T

1

2

T

1

T

1

1

T

 

Przykład: Estymacja parametrów układu oddechowego podczas sztucznej wentylacji 

W uproszczeniu układ oddechowy można zamodelować jako szeregowe połączenie dwóch parametrów: oporu 
R

rs

 i podatności C

rs

 (rezystor i kondensator w elektrycznym modelu zastępczym – rys.). 

 

 

 

Rys. Elektryczny model zastępczy procesu sztucznej wentylacji płuc 

Z  II  prawa  Kirchhoffa  otrzymuje  się  związek  (model  MISO)  między  wyjściem  (ciśnienie  P

rs

  mierzone  w 

respiratorze) i wejściem modelu (przepływ Q mierzony w respiratorze oraz obliczana na jego podstawie objętość 
powietrza wprowadzonego do płuc V = ∫Qdt ): 
 

 

 

 

 

0

P

t

V

E

t

Q

R

t

P

rs

rs

rs

 

background image

 

4. Wsadowe metody estymacji parametrów modeli liniowych 

 

który w zapisie macierzowym przyjmuje postać (przez P

0

 oznaczając ciśnienie na początku pomiarów): 

 

 

0

P

E

R

rs

rs

rs

v

q

p

 
Wektor parametrów modelu to θ = [R

rs

E

rs

P

0

]

T

 . Macierz eksperymentu wynosi: 

 

 

1

v

q

θ

p

X

,

,

rs

 
zatem estymaty parametrów (w tym mechanicznych właściwości układu oddechowego) oblicza się następująco: 
 

 

rs

rs

rs

P

E

R

p

X

X

X

T

1

T

T

0

ˆ

,

ˆ

,

ˆ

 
Przykładowy przepływ wentylacyjny  Q oraz wynik dopasowania  modelu do danych ciśnienia  P

rs

  pokazano  na 

rys. 
 

 

Rys. Przykładowe dopasowanie modelu sztucznej wentylacji płuc do danych 

 

6.2.2.3. Metoda ważonych najmniejszych kwadratów 

Często  stosowanym,  uogólnionym  podejściem  do  estymacji,  jest  metoda  ważonych 
najmniejszych  kwadratów
  (WLS),  w  której  estymatory 

WLS

θˆ

  wyznacza  się  minimalizując 

funkcjonał V

WLS

 

 

 

θ

θ

θ

WLS

WLS

V

min

arg

ˆ

 

 
w postaci ważonego błędu średniokwadratowego (odległości modelu od danych w l

2

): 

 

 

 

 

 

 

 

y

W

y

θ

y

y

W

θ

y

y

θ

T

T

m

m

WLS

V

 
gdzie W jest różnie w poszczególnych metodach dobieraną, dodatnio określoną, symetryczną 
macierzą  wag  (najczęściej  diagonalną).  Wyrażają  one  posiadaną  wiedzę  aprioryczną  o 
poszczególnych danych pomiarowych, np. ich dokładność czy szczególne znaczenie. 
 
Wektor estymatorów i macierz kowariancji dane są w tym przypadku wzorami [VBos’88]: 
 

0

0.5

1

1.5

2

2.5

3

3.5

4

-1

-0.5

0

0.5

Model 1

Fl

o

w

 Q

 (

L

/s

)

0

0.5

1

1.5

2

2.5

3

3.5

4

-0.1

0

0.1

0.2

0.3

0.4

Time (s)

P

re

s

s

u

re

 P

rs

 (

k

P

a

)

Data
Model

background image

10 

Techniki eksperymentu 

(© A.G. Polak 2014)

 

 

 

Wy

X

WX

X

θ

T

1

T

ˆ

WLS

 

 

 

 

 

1

T

T

1

T

ˆ

cov

WX

X

WRWX

X

WX

X

θ

S

WLS

WLS

 
gdzie R, przypomnijmy, jest dodatnio określoną macierzą kowariancji zakłóceń addytywnych 
o zerowej wartości oczekiwanej. 
 
Nietrudno  zauważyć,  że  zarówno  ML  jak  i  LS  są  szczególnymi  przypadkami  metody 
ważonych najmniejszych kwadratów
. Można to sprawdzić podstawiając W = R

–1

 w przypadku 

metody największej wiarygodności (wagi są wtedy odwrotnie proporcjonalne do niepewności 
poszczególnych  danych)  lub  W = I  w  przypadku  metody  najmniejszych  kwadratów 
(wszystkie wagi są jednakowe i wynoszą 1). 
 
Zależność estymatora od wyjścia modelu i szumu pomiarowego 
Na  przykładzie  metody  WLS  warto  przyjrzeć  się,  w  jaki  sposób  estymator  parametrów 
budowany  jest  przez  wyjście  modelu  y

m

  (tożsame  z  niezakłóconym  wyjściem  obiektu  w 

przypadku  bezbłędnego  modelu),  a  w  jakim  stopniu  przez  konkretną  realizację  szumu 
pomiarowego  e  (pamiętając,  że  w  przypadku  szumu  addytywnego  obowiązuje  relacja 
y = y

m

 + e): 

 

 

,

ˆ

T

1

T

0

T

1

T

0

T

1

T

T

1

T

0

T

1

T

0

T

1

T

T

1

T

We

X

WX

X

θ

We

X

WX

X

WXθ

X

WX

X

We

X

WX

X

Wy

X

WX

X

e

y

W

X

WX

X

Wy

X

WX

X

θ

WLS

 

 
gdzie θ

0

 oznacza wektor parametrów o prawdziwych wartościach (tj. takich, które miał model 

generujący wyjście y

m

 = 

0

). Widać stąd, że wpływ obu czynników (y

m

 i e) jest analogiczny 

– są one tak samo przetworzone przez operator 

W

X

WX

X

T

1

T

. W efekcie estymator 

WLS

θˆ

 

ma  charakter  zmiennej  losowej  (także  w  innych  metodach),  a  obliczane  jego  wartości  tym 
bardziej  są  zbliżone  do  wartości  oczekiwanej,  im  mniejsza  jest  energia  zakłóceń  losowych 
zawartych w danych empirycznych (im większy stosunek sygnału do szumu – SNR). 
 
 

6.2.3. Estymacja z ograniczeniami 

6.2.3.1. Estymacja z ograniczeniami liniowymi 

W  rzeczywistych  sytuacjach  parametry  odpowiadające  fizycznym  właściwościom  obiektu 
mogą  przyjmować  tylko  pewne  wartości,  zazwyczaj  należące  do  znanego  przedziału  [ab], 
lub  np.  nie  mogą  być  ujemne.  W  procesie  wyznaczania  ich  wartości  należy  wykorzystać  tę 
informację aprioryczną, a stosowane metody noszą nazwę estymacji z ograniczeniami
 

background image

 

4. Wsadowe metody estymacji parametrów modeli liniowych 

11 

 

Zdanie  estymacji  z  ograniczeniami  jest  złożone  i  zaproponowano  wiele  metod  jego 
rozwiązania. Do najpopularniejszych należą metody liniowe (opierające się o LS), w których 
ograniczenia nałożone na θ przyjmują postać układu równań liniowych: 
 
 

g

 
gdzie G

(q×p)

 (q < p) jest znaną macierzą więzów, a g jest znanym wektorem współczynników 

liniowych. Należy zatem rozwiązać typowe zadanie LS ale  tak, aby estymatory parametrów 
spełniały powyższe równanie: 
 

 

 



.

ˆ

,

min

arg

ˆ

T

 

g

θ

G

y

y

θ

θ

 

 
W  tym  celu  stosuje  się  jedną  z  dwóch  metod:  metodę  mnożników  Lagrange’a  (typowo  gdy 
q < p/2) lub metodę elementów (q > p/2). 
 
Metoda elementów 
Metoda  elementów  wykorzystuje  fakt,  że  skoro  p  parametrów  jest  skojarzonych  ze  sobą  za 
pośrednictwem q równań liniowych, to niezależnych jest tylko q z nich, a inne można wyrazić 
jako  kombinacje  liniowe  pozostałych.  Ostatecznie  wystarczy  wyestymować  wartości  p – q 
parametrów,  a  q  następnych  obliczyć  na  ich  podstawie.  Prowadzi  to  do  redukcji  liczby 
estymowanych parametrów i stąd metoda ta zwana jest również metodą redukcji zmiennych
 
Pierwszym krokiem jest przedstawienie macierzy G jako macierzy blokowej, podzielonej na 
macierz  prostokątną  G

1

((pqq)

  oraz  macierz  kwadratową  G

2

(q×q)

:  G [G

1

|G

2

],  a  wektora 

parametrów odpowiednio jako [θ

1

 θ

2

]

T

. Wtedy układ równań więzów przyjmuje postać: 

 

 

g

θ

θ

G

G

2

1

2

1

 

|

Stąd: 
 

g

θ

G

θ

G

2

2

1

1

 
a rozwiązanie względem θ

2

 
 

1

1

1

2

2

θ

G

g

G

θ

 
Pozwala  to  na  wyeliminowanie  q  parametrów  z  równania  modelowego,  przy  czym  macierz 
eksperymentu również dzieli się na odpowiednie bloki: 
 

 

2

2

1

1

2

1

2

1

|

θ

X

θ

X

θ

θ

X

X

y

 

m

 
Podstawiając  teraz  wyprowadzoną  zależność  na  θ

2

,  otrzymuje  się  następujące  równanie  z 

niewiadomym wektorem p – q parametrów: 
 
 

1

1

1

2

2

1

1

θ

G

g

G

X

θ

X

y

m

background image

12 

Techniki eksperymentu 

(© A.G. Polak 2014)

 

 

 
Można  je  uporządkować  do  podstawowej  postaci  liniowej  (przenosząc  na  lewo  znane 
wartości) i pamiętając, że posiadane dane y = y

m

 + e, zapisać: 

 
 

e

θ

X

G

G

X

X

y

g

G

X

y

1

1

1

2

2

1

1

2

2

 

 





r

r

 
a następnie znaleźć estymator θ

1

 metodą najmniejszych kwadratów. Ostatecznie uzyskuje się: 

 

 



ˆ

ˆ

,

 

ˆ

1

1

1

2

2

T

1

T

1

θ

G

g

G

θ

y

X

X

X

θ

r

r

r

r

 

 
 

6.2.4. Estymacja parametrów modeli fourierowskich 

Analiza  właściwości  danych  powiązanych  z  ich  widmem  nie  musi  być  przeprowadzana  w 
dziedzinie  częstotliwości.  W  wielu  sytuacjach  znane  są  częstotliwości  składowe 
analizowanych  sygnałów,  a  poszukiwane  jedynie  ich  amplitudy  i  przesunięcia  fazowe. 
Przydatne  okazuje  się  wtedy  wykorzystanie  modelu  matematycznego  badanego  sygnału 
analogicznego do szeregu Fouriera (częstotliwości nie muszą być harmoniczne): 
 

 

 

p

k

i

k

k

p

k

i

k

k

p

k

k

i

k

k

i

m

t

f

b

t

f

a

t

f

t

y

1

1

0

1

0

π

2

sin

π

2

cos

π

2

sin

gdzie: 

 

2

2

k

k

k

b

a

 i 

2

2

sin

k

k

k

k

b

a

a

 
Ponieważ  w  tym  przypadku  nieznanymi  parametrami  są  α

0

,  a  i  b,  dopasowywanie  tego 

modelu  do  danych  sprowadza  się  do  estymacji  modelu  LP  w  dziedzinie  czasu  (rys.),  a 
macierz eksperymentu przyjmuje postać: 
 

 

N

p

N

p

N

N

p

p

p

p

t

f

t

f

t

f

t

f

t

f

t

f

t

f

t

f

t

f

t

f

t

f

t

f

π

2

sin

π

2

cos

π

2

sin

π

2

cos

1

π

2

sin

π

2

cos

π

2

sin

π

2

cos

1

π

2

sin

π

2

cos

π

2

sin

π

2

cos

1

1

1

2

2

2

1

2

1

1

1

1

1

1

1

X

 

 

background image

 

4. Wsadowe metody estymacji parametrów modeli liniowych 

13 

 

Rys. Dopasowanie modelu Fouriera do danych składających się z 7 sinusoid przesuniętych w fazie [Polak’06]. 

Potencjalnie  analogicznie  można  próbować  rozwiązać  problem  dodatkowej  estymacji 
częstotliwości powyższego szeregu, jednakże wtedy model staje się NLP i, co gorsze, posiada 
dużą liczbę minimów lokalnych.