Microsoft Word - SZAU

132

4.3.

Modele rozmyte Takagi–Sugeno

Jedną z odmian modeli rozmytych, które okazały się bardzo skuteczne w modelowaniu

obiektów regulacji są modele typu Takagi–Sugeno [37] (czasami nazywane także modelami
Takagi–Sugeno–Kanga). Modele te są złożone z reguł, w następnikach których używa się
funkcji. Ich zaletą jest możliwość opisania zachowania obiektu za pomocą stosunkowo
niewielkiej liczby reguł. Ogólna postać modeli Takagi–Sugeno jest więc następująca:

Reguła i: jeśli

poprzednik

jest

, to

następnik

)

(

( 4.34)

gdzie y

są wyjściami następników. Najczęściej w następnikach używa się funkcji liniowych.

Mają więc one postać:

⋅

∑

( 4.35)

gdzie

(j = 0,…,n, i = 1,…,l) są parametrami modelu, l jest liczbą reguł z których złożony

jest model rozmyty. Zastosowanie następników liniowych upraszcza model. Co więcej, łatwo
jest dokonać identyfikacji ich parametrów korzystając z dobrze znanych metod. Następniki
reguł, ponieważ mogą być interpretowane jako modele opisujące zachowanie obiektu wokół
pewnych punktów pracy, są nazywane modelami lokalnymi.

W celu obliczenia wartości wyjściowej modelu rozmytego Takagi–Sugeno, należy

skorzystać z następującego wzoru:

∑

⋅

( 4.36)

gdzie w

(i = 1,…,l) są siłami odpalenia poszczególnych reguł. Wyjście modelu jest więc

sumą ważoną wyjść poszczególnych modeli lokalnych. Obliczenie wartości wyjścia modelu
typu Takagi–Sugeno jest więc prostsze niż w przypadku modelu z rozmytymi następnikami.

Przykład 4.5

Rozpatrzmy

przykład

rozmytego

modelu

charakterystyki

statycznej

zaworu

przeznaczonego do regulacji przepływu cieczy. Charakterystyka ta jest opisana następującym
wzorem [1]:

3163

⋅

( 4.37)

gdzie  wyjście  y  jest  przepływem  przez  zawór,  a  wejście  u  jest  pozycją  trzpienia  zaworu.
Charakterystyka  ta  jest  przedstawiona  na  rys.   4.14  linią  różową.  Zauważmy,  że  kształt  tej
charakterystyki  przypomina  funkcję  sigmoidalną.  Spróbujmy  użyć  modelu  rozmytego  do
zamodelowania  tej  charakterystyki.  Można  przy  tym  posłużyć  się  doborem  parametrów
modelu  wspomaganym  komputerowo.  Po  takim  zabiegu,  otrzymano  funkcje  przynależności
pokazane na rys.  4.15. Model rozmyty jest złożony z następujących dwóch reguł [22]:

134

Przykład 4.6

Rozpatrzmy teraz przypadek dynamicznego modelu typu Takagi–Sugeno. Załóżmy, że jest

to model dyskretny o jednym wejściu i jednym wyjściu, wykorzystujący wartości sygnałów
wejściowego i wyjściowego procesu w przeszłości oraz równania różnicowe w następnikach.
W takim razie model ten jest złożony z następujących reguł:

Reguła i: jeśli

jest

−

⋅

( 4.38)

gdzie

(i = 1,…,l) są współczynnikami modeli lokalnych, y

jest wartością

wyjścia obiektu regulacji w chwili k, u

jest wartością wejścia w chwili k,

,…,

są zbiorami rozmytymi. Zauważmy, że modele lokalne są liniowe

(najczęściej takie są używane w praktyce) i mogą być zidentyfikowane na podstawie próbek
zarejestrowanych w okolicach kilku punktów pracy podczas eksperymentów prowadzonych
na realnym obiekcie (często stosowane podejście).

Powróćmy teraz do ogólnej postaci modeli typu Takagi–Sugeno. Zwróćmy uwagę na to, że

zastosowanie wzoru ( 4.36) jest równoważne obliczaniu następującej sumy:

⋅

∑

( 4.39)

∑

⋅

gdzie

~ jest sumą ważoną odpowiednich parametrów modeli lokalnych. W celu

uproszczenia zapisu zwykle wprowadza się wagi znormalizowane, tzn.:

∑

( 4.40)

Przykład 4.7

Wróćmy do poprzedniego przykładu. Wyjście rozmytego modelu dynamicznego będzie w

takim razie opisane następującą zależnością:

−

⋅

( 4.41)

gdzie

∑

⋅

∑

⋅

Tego typu model można więc traktować jako model liniowy z parametrami zmiennymi w
czasie. Dlatego też modele Takagi–Sugeno nazywa się czasem modelami quasi–liniowymi.

135

4.3.1.

Przedstawienie modelu Takagi–Sugeno w postaci sieci neuronowej

Modele rozmyte można przedstawić w postaci rozmytych sieci neuronowych (ang. Fuzzy

Neural Networks – FNN), zob. np. [29, 31, 38]. Można z nich skorzystać w celu identyfikacji
modeli rozmytych. Przypomnijmy, ogólną postać modeli rozmytych typu Takagi–Sugeno.
Model takiego typu jest złożony z zestawu następujących reguł (przy założeniu następników
opisanych funkcją liniową):

Reguła i: jeśli

jest

, to

⋅

∑

( 4.42)

Wyjście modelu rozmytego typu Takagi–Sugeno jest z kolei dane wzorem:

∑

⋅

( 4.43)

gdzie

~ są znormalizowanymi wagami. W takim razie, ogólną strukturę rozmytej sieci

neuronowej odzwierciedlającej model rozmyty z wyjściem opisanym równaniem ( 4.43)
można przedstawić, jak na rys. 4.16.

Neuronowy

model

poprzedników

::::

Neuronowy

model

następników

::::

Rys. 4.16. Ogólna struktura rozmytej sieci neuronowej

Neuronowy model poprzedników

Przypomnijmy, że znormalizowane wagi są opisane wzorem:

∑

( 4.44)

gdzie poszczególne wagi w

, przy założeniu, że jako operatora koniunkcji użyto mnożenia, są

iloczynem wartości funkcji przynależności:

∏

)

(

( 4.45)

W takim razie struktura neuronowego modelu poprzedników będzie miała postać taką, jak na
rys. 4.17.

136

::::

)

1
1

)

i
1

)

l
1

::::

)

1
n

)

i
n

)

l
n

::::

∑

::::

– mnożenie

– dzielenie

Rys. 4.17. Neuronowy model poprzedników rozmytego modelu Takagi–Sugeno

Zauważmy, że w powyższym modelu neuronowym poprzedników, uczeniu podlegają

parametry funkcji przynależności

)

(

. Funkcje te zostały oznaczone elementami

prostokątnymi, ponieważ są to elementy bardziej złożone, które można byłoby przedstawić za
pomocą prostszych neuronów. Nie jest to jednak konieczne do przeprowadzenia dalszych
rozważań.

Neuronowy model następników

Przypomnijmy postać następników poszczególnych reguł w rozważanym modelu

rozmytym:

⋅

∑

; i = 1,…, l.

Zauważmy, że jest to zależność liniowa. W takim razie struktura następników reguł
rozważanego modelu Takagi–Sugeno może być przedstawiona jako sztuczna sieć neuronowa
z rys. 4.18. W tym modelu neuronowym, uczeniu podlegają parametry

funkcji liniowych

występujących w następnikach reguł, z których jest złożony model rozmyty.

137

::::

2
0

l
0

::::

1
1

l
1

::::

1
n

2
n

l
n

::::

– neuron liniowy

Rys. 4.18. Neuronowy model następników rozmytego modelu Takagi–Sugeno

Przykład 4.8 (rozmyta sieć neuronowa Wanga–Mendela)

W przypadku, gdy następniki w modelu Takagi–Sugeno są stałe, tzn.

( 4.46)

model ulega znacznemu uproszczeniu. W takim przypadku, wyjście modelu jest bowiem dane
wzorem:

138

∑

⋅

( 4.47)

Także  struktura  sztucznej  sieci  neuronowej  opisującej  taki  model  znaczenie  się  upraszcza.
Tego typu model neuronowy jest nazywany modelem Wanga–Mendela a jego postać została
pokazana  na  rys.   4.19.  Parametry  modelu,  które  mogą  zostać  dobrane  dzięki  zastosowaniu
mechanizmu  uczenia  sieci  to  parametry  funkcji  przynależności

)

(

oraz stałe

występujące w następnikach reguł modelu rozmytego.

::::

)

1
1

)

i
1

)

l
1

::::

)

1
n

)

i
n

)

l
n

::::

∑

::::

– mnożenie

– dzielenie

i
0

l
0

::::

Rys. 4.19. Neuronowy model Wanga–Mendela

Przykład 4.9

Rozpatrzmy rozmyty model statyki zaworu z przykładu 4.5. Przypomnijmy, że model ten

jest złożony z następujących dwóch reguł:

Reguła 1: jeśli u jest R

, to

3289

1
0

−

= a

Reguła 2: jeśli u jest R

, to

3289

= a

139

W takim razie sztuczna sieć neuronowa opisująca ten model będzie miała postać Wanga–
Mendela. Zauważmy, że założono sigmoidalne funkcje przynależności

)

(

oraz

)

(

Ponieważ w modelu użyte zostały poprzedniki proste, struktura sieci również jest szczególnie
prosta (nie jest potrzebne użycie mnożenia).

(u)

2
0

Rys. 4.20. Neuronowy model statyki zaworu z przykładu 4.5

4.3.2.

Hybrydowy algorytm uczenia rozmytych sieci neuronowych

Zauważmy, że szczegółowa zależność opisująca wyjście modelu Takagi–Sugeno (a tym

samym wyjście rozmytej sieci neuronowej, za pomocą której można taki model przedstawić)
jest dana następującym wzorem:

∑∏

∑

∏















⋅

)

(

)

(

)

(

( 4.48)

Parametry modelu rozmytego można więc dostroić metodą uczenia rozmytej sieci

neuronowej. W tym celu można wykorzystać dobrze znany mechanizm wstecznej propagacji
błędu.  Ze  względu  na  strukturę  rozmytej  sieci  neuronowej  (wynikającą  ze  struktury  reguł
modelu  rozmytego)  możliwe  jest  zastosowanie  dwóch  zasadniczych  podejść.  Pierwsze
podejście  polega  na  dostrajaniu  zarówno  parametrów  poprzedników  jak  i  następników  reguł
(wszystkich  parametrów  podlegających  procesowi  identyfikacji)  analogicznie,  jak  w
przypadku  perceptronu  wielowarstwowego.  Drugie  podejście  to  algorytm  hybrydowy,  w
którym  parametry  poprzedników  są  dostrajane  z  wykorzystaniem  mechanizmu  uczenia  zaś
parametry  następników  –  z  wykorzystaniem  metody  najmniejszych  kwadratów.  Druga  z
wymienionych  metod  daje  lepsze  rezultaty  [29,  38]  i  na  tej  właśnie  metodzie  się  teraz
skoncentrujemy.

Podczas uczenia sieci będziemy dążyć do minimalizowania następującej funkcji błędu:

(

)

∑

−

( 4.49)

gdzie p jest liczbą próbek uczących,

)

(

jest wartością wyjścia uczonej sieci,

jest wartością wyjścia (zmierzoną) obiektu otrzymaną dla zestawu sygnałów wejściowych

140

)

(

. Jak już wspomniano na wstępie, w podejściu hybrydowym, dostrajanie

parametrów poprzedników i następników odbywa się osobno. Dlatego też w algorytmie
można wyróżnić dwa etapy, powtarzane na zmianę podczas procesu uczenia [29].

Etap I

Dla ustalonych (bieżących) wartości parametrów funkcji przynależności, dostrajane są

wartości parametrów następników reguł rozmytych. Zauważmy, że w przypadku przyjęcia
stałych parametrów funkcji przynależności, wyjście modelu rozmytego jest dane wzorem:

∑















⋅

)

(

( 4.50)

Powyższy wzór można zapisać w postaci wektorowej:

[

]













⋅

( 4.51)

Naszym zadaniem jest określenie na podstawie p próbek uczących, którymi dysponujemy,
wartości parametrów

(i = 1,…, l; j = 1,…, n). W idealnym przypadku chcemy otrzymać

następującą równość:

⋅

( 4.52)

gdzie













⋅













141













d
p

Zwykle  zbiór  próbek  uczących  jest  liczny  i  liczba  tych  próbek  znacznie  przekracza  liczbę
parametrów  zgrupowanych  w  wektorze  a.  W  związku  z  tym  wartości  parametrów
następników reguł rozmytych wyznacza się korzystając z metody najmniejszych kwadratów,
co  w  programie  Matlab  sprowadza  się  do  użycia  operatora  tzw.  lewego  dzielenia
macierzowego (ang. left matrix divide).

Etap II

Dla bieżących wartości parametrów następników reguł modelu rozmytego oraz funkcji

przynależności, dla poszczególnych próbek uczących wyznacza się wartości wyjściowe
uczonej sieci

)

(

. Na podstawie tych wartości oraz wartości pożądanych

otrzymuje się wektor błędu:













−

d
p

Następnie korzysta się z mechanizmu wstecznej propagacji błędu. Dostrajanie wartości
parametrów funkcji przynależności wykonuje się, korzystając z wybranej metody
optymalizacji.

Przykład 4.10

Oznaczmy przez c

parametry danej funkcji przynależności. Załóżmy także, że funkcja ta

jest różniczkowalna. Wówczas, w przypadku użycia metody najszybszego spadku, otrzymuje
się następujący wzór opisujący iteracyjne dostrajanie tych parametrów:

∂

⋅

−

)

(

)

(

( 4.53)

gdzie n jest numerem kolejnej iteracji uczenia,

jest współczynnikiem uczenia oraz

(

)

∂

⋅















⋅

−

∂

∑ ∑

( 4.54)

gdzie

∂

∂~

zależy od postaci przyjętej funkcji przynależności.

Uwaga: Gradientowe metody optymalizacji można zastosować w przypadku

różniczkowalnych funkcji przynależności (np. sigmoidalna, dzwonowa, Gaussa). W
przypadku funkcji nieróżniczkowalnych można jednak użyć metod bezgradientowych.