Minimalizacja jednej lub wielu zmiennych

Minimalizacja funkcji jednej lub wielu zmiennych

Wykład 13

Optymalizacja

= wyznaczenie minimum funkcji rzeczywistej wielu zmiennych

w danym obszarze (wraz z punktem w którym to minimum występuje).

Jeśli funkcja jest nieliniowa i zawiera wiele minimów lokalnych zadanie jest
trudne do rozwiązania.

Wynik lokalnych procedur iteracyjnych (które opierają się na linearyzacji
minimalizowanej funkcji w otoczeniu wybranego punktu w przestrzeni n-
wymiarowej) jest silnie uzależniony od wyboru modelu startowego.

Rozpoczniemy od metod minimalizacji ciągłej funkcji unimodelnej tj takiej
która w przedziale [a,b] ma tylko jedno minimum lokalne.

Jeżeli zadana funkcja nie posiada tej własności, należy znaleźć jej przedziały
unimodalności i zastosować opisywaną metodę do każdego z nich.

Jeśli dla a < x* < b zachodzą warunki f(a) > f(x*) i f(x*) < f(b) to:

- funkcja ma w przedziale [a,b] minimum w punkcie x*

- potrzeba trzech punktów do zlokalizowania minimum

Metody eliminacji (złotego podziału,

Funkcja ciągła f w przedziale [a,b] posiada dokładnie
jedno minimum x*. Minimum to można znaleźć
poprzez kolejne podziały zadanego przedziału. W
tym celu należy obliczyć wartości funkcji w dwóch
punktach x

i x

takich, że a < x

< x

< b, a

następnie zbadać ich wielkości:
- Jeżeli f(x

) > f(x

), to szukane minimum

znajduje się w przedziale [x

,b].

- Jeżeli f(x

) < f(x

), to szukane minimum

znajduje się w przedziale [a,x

Przedziały [a,x

].i

,b] zachodzą na

siebie. Przedział jest
zawężany w stosunku
k= [a,x

]./ [a,b]

Wielkość otrzymanego w wyniku powyższego postępowania przedziału po n
krokach wynosi: (b

(n)

− a

(n)

gdzie k jest stałym współczynnikiem o który

zmniejszana jest wielkość przedziałów w kolejnych krokach algorytmu.
Wartość współczynnika k jest dobrana w taki sposób, aby przy kolejnych
iteracjach wykorzystywać obliczoną w poprzednim kroku wartość funkcji
jednej z dwóch próbek (f(x

) lub f(x

)). Obliczmy tę wartość:

−

czyli

ponieważ f(x ) > f(x ) zawężamy przedział do [x ,b].

Metoda złotego podziału

ponieważ f(x

) > f(x

) zawężamy przedział do [x

,b].

a → x

b → b
x

→

−

)

(

−

618

−

Strategię obliczania minimum funkcji można zapisać:
Jeśli:

Jeśli

to STOP, w przeciwnym wypadku powtórz

punkt 2.

Funkcja wystarczająco gładka:
•w pobliżu minimum funkcja
kwadratowa jest dobrym
przybliżeniem
•parabola dopasowana do dowolnych

Metoda interpolacji parabolicznej

( )

−

( )

⇒

−

•parabola dopasowana do dowolnych
trzech punktów powinna wskazać
w jednym kroku minimum albo
przynajmniej w jego bliskie otoczenie.

( )

Jeśli

( )

(

)

−

Rozwijając dowolną funkcję f(x) w szereg Taylora otrzymujemy

( )

( )(

)

( )(

)

−

′′

−

′

widać, że dla x

=x*

mamy p’(x

)=0 i parabola lokalnie przybliża f(x)

( )

Dla trzech punktów (x

), (x

) i (x

) parabola

Przechodząca przez te punkty będzie miała postać:

(

)

(

)

−

gdzie

c =

Ponieważ dla pozostałych dwóch punktów mamy:

(

)

(

)

−

(

)

(

)

−

możemy wyznaczyć wartości parametrów c

i c

(

) (

)

[

]

−

(

)(

) (

)(

)

[

]

−

(

)(

)

(

)(

)

−

gdzie

−

oraz wartość paraboli w maksimum

Metoda Brandta (wykorzystująca metodę złotego podziału i interpolacji
parabolicznej

1. Wyznaczamy przedział [x

2. Wyznaczamy metodą złotego podziału punkt x

leżący w jego

wnętrzu będący pierwszym przybliżeniem minimum

3. Ponownie stosujemy „złoty podział” by znaleźć x

i+1

i zdefiniować

nowy, zawężony przedział

4. Wyznaczamy parabolę i wyznaczamy jej minimum x*
5. Jeśli x* leży w ostatnio zdefiniowanym przedziale

oraz gdy zmiana

położenia minimum jaka miała miejsce przy wykonaniu ostatniej

położenia minimum jaka miała miejsce przy wykonaniu ostatniej
iteracji była mniejsza od połowy zmiany położenia minimum w
przedostatniej iteracji kończymy procedurę, jeśli któryś z warunków
nie jest spełniony – powrót do punktu

Metody minimalizacji funkcji n zmiennych (minimalizacja w
przestrzeni n-wymiarowej)

Numeryczne metody poszukiwania minimum funkcji wielu zmiennych można
podzielić na następujące klasy:

•metody poszukiwań prostych, takie jak metoda

Hooka-Jevesa

i metoda

Rosenbrocka
•metody poprawy kierunków, wśród których możemy wyróżnić następujące
grupy:

grupy:

•

metody bezgradientowe

, w przypadku których do znalezienia minimum

potrzebne jest wyznaczanie jedynie

wartości funkcji f(x), np. metoda

Gaussa-Seidela

i metoda Powella

•

metody gradientowe

, dla których w procesie poszukiwania minimum

korzystamy z wyznaczanych

wartości minimalizowanej funkcji f(x) oraz

jej

gradientu, np. metoda

najszybszego spadku

i metoda

gradientu

sprzężonego

;

•metody newtonowskie i quasi-newtonowskie, gdzie poszukiwanie
minimum przeprowadzamy z wyznaczaniem w kolejnych punktach
wartości funkcji, jej gradientu oraz hesjanu

Dla wszystkich typów metod należących do klasy metod poprawy

kierunków wykorzystujemy wspólny schemat prowadzenia obliczeń
iteracyjnych. Polega on na tym, że do punktu odpowiadającego minimum
funkcji f(x), dochodzimy w kolejnych krokach poszukiwania minimum wzdłuż
odpowiednio wyznaczonych kierunków d w przestrzeni n-wymiarowej,
zwanych kierunkami poszukiwań.

Jeżeli po k-1 krokach optymalizacji osiągnięto punkt poszukiwań x

k-1

to w

kolejnym k-tym kroku przeprowadza się minimalizację wzdłuż prostej
wyznaczonej przez punkt x

k-1

i wektor kierunku

d, tj. znajdujemy taką

optymalna wartość α

, że

optymalna wartość α

, że

(

)

min

−

a więc rozwiązujemy zagadnienie minimalizacji funkcji jednej zmiennej -

tą

zmienną jest α

Kierunki te mogą być stałe w trakcie całego iteracyjnego procesu

poszukiwań minimum bądź też mogą ulegać zmianie na kolejnych etapach
w zależności od wartości minimalizowanej funkcji, jej gradientu lub również
hesjanu.

Iteracyjne algorytmy optymalizacji mają następujące fazy:

• wybór punktu początkowego poszukiwań x

•

wyznaczenie kolejnego punktu x

, stanowiącego przybliżenie minimum x*;

punkt ten wyznaczamy przez poszukiwania wzdłuż kierunku d

, którego

określenie, jak i również odległość przesunięcia w tym kierunku są zależne
od wybranej metody optymalizacji; kolejny punkt, będący nowym (lepszym)
przybliżeniem punktu minimalizującego funkcję f(x) , jest wyznaczany z
zależności:

• sprawdzenie warunków zbieżności (kryterium osiągnięcia punktu

−

• sprawdzenie warunków zbieżności (kryterium osiągnięcia punktu
minimalnego wskaźnika jakości) i – w zależności od wyniku – kontynuowanie
poszukiwań iteracyjnych albo ich zakończenie.

Ważna uwaga

: Punkt początkowy wybierany jest na podstawie posiadanych

informacji dotyczących położenia minimum (często po prostu losowany).
W przypadku minimalizacji funkcji wielu zmiennych dobór punktu
początkowego poszukiwań może w znaczący sposób przyspieszyć lub
opóźnić znalezienie minimum wskaźnika jakości albo wręcz zdecydować o
możliwości znalezienia minimum globalnego funkcji.

Minimalizacja wzdłuż kierunków współrzędnych

Wektorom bazy

, i=1,N przypisujemy kierunki w

których odbywać się będzie minimalizacja (tak jak
dla przypadku 1 zmiennej).

Algorytm:
1. Z punktu startowego x

minimalizujemy

funkcję wzdłuż prostej wyznaczonej przez

wyznaczamy minimum w punkcie x

2. Z punktu x

minimalizujemy funkcję w kierunku

i wyznaczamy kolejny punkt x

3. Kontynuujemy wzdłuż kolejnych osi i

ostateczne znajdujemy punkt x

4. Powracamy do minimalizacji wzdłuż kierunku

i powtarzamy procedurę kolejny raz

5. Minimalizacja kończy się gdy spełniony jest

warunek:

gdzie ε jest dokładnością reprezentacji
maszynowej liczb użytą w obliczeniach a t
parametrem dobieranym indywidualnie.

(

)

( )

−

Metoda kierunków sprzężonych (Powell'a)

Metoda kierunków sprzężonych jest bezgradientową, iteracyjną metodą
optymalizacji bez ograniczeń. Dla form kwadratowych jest ona zbieżna w N
krokach. W metodzie Powell'a baza zmienia się w trakcie wykonywania algorytmu.
Modyfikacja bazy polega na stworzeniu i dodaniu do niej nowego sprzężonego
kierunku i równoczesnym usunięciu z niej takiego kierunku, wzdłuż którego
nastąpiło największe przesunięcie.

Metoda kierunków sprzężonych (Powell'a)

Algorytm:

1. x

:= x

2. Dla każdego z kierunków k=1, 2, ..., N wybieramy optymalny krok m

dokonując minimalizacji jednowymiarowej wzdłuż kierunku e

3. x := x + m

+ m

+ ... + m

4. Wyznacz kierunek sprzężony i podstawiamy

x := x + m

N+1

, gdzie m

N+1

jest optymalnym krokiem uzyskanym w

wyniku minimalizacji funkcji g(m

N+1

)=f(x+m

N+1

)

5. Jeżeli (zachodzi warunek stopu) to koniec obliczeń
6. x

:= x

−

6. x

:= x

7. wyznaczamy numer kierunku k (1≤k≤N), w którym nastąpiło największe

przesunięcie (kierunek dla którego m

było największe)

8. Jeżeli

(wyznacznik dla nowej bazy - stopień liniowej

niezależności - jest bezpiecznie duży), to zmień bazę:

:= e

N+1

9. przejdź do pkt. 2

≥

−