Programowanie

matematyczne

• Programowanie Liniowe

funkcja celu i funkcje ograniczeń
są liniowe

• Programowanie Nieliniowe

funkcja celu i/lub funkcje
ograniczeń są nieliniowe

Każde zadanie minimalizacji funkcji celu

można zapisać w równoważnej formie

Ograniczenie nierównościowe typu

można wyrazić w postaci

Ograniczenie nierównościowe można zamienić na ograniczenie

równościowe poprzez dodanie tzw. zmiennej osłabiającej

)

(

min x





)

(

max

)

(

min





dla

,...,

)

(



0





dla

,...,

)

(







dla

,...,

)

(





s

Zadanie optymalizacji

• zbiór zmiennych decyzyjnych zadania

optymalizacji

• n=1,...,N

ilość zmiennych zadania

•

funkcja celu

•

ograniczenia równościowe

• ograniczenia

nierównościowe

}

,...,

{



)

dla

,...,

)

(



0

dla

,...,

)

(



0

Sformułowanie zadania

optymalizacji

Znajdź x takie, że

przy ograniczeniach

)

(

min x

dla

,...,

)

(



0

dla

,...,

)

(



0



Podstawy matematyczne

macierz jest tablicą prostokątną o wymiarze nxm

 

...









Macierz diagonalna





...



Macierz jednostkowa





...



Macierz trójkątna górna





...







...



•Macierz A jest symetryczna gdy

A=A

tzn.

•Macierz A jest skośnosymetryczna gdy

=-a

Działania na macierzach

 

...



























...













* A

Iloczyn macierzy

Dodawanie macierzy

Mnożenie macierzy przez skalar

Dodawanie macierzy - własności

)

(

)

(







Prawo łączności







Prawo przemienności





















)

(

)

(

Prawo rozdzielności





Mnożenie macierzy - własności

)

(

)

(





Prawo łączności

AB











)

(

)

(

Prawa rozdzielności



 





)

(

Uwaga !

 

AB 

wyznacznik macierzy











1. Jeśli macierz posiada kolumnę lub wiersz złożony z samych

zer to

2. Wartość wyznacznika nie zmienia się jeśli zmienimy ze sobą

kolumny lub wiersze

3. Jeśli B powstaje przez zamianę dwóch kolumn lub wierszy to

4. Jeśli dwie kolumny lub wiersze macierzy B są równe to

5. Pomnożenie elementów wiersza lub kolumny przez k jest

równoznaczne z pomnożeniem wyznacznika przez k

6. Wartość wyznacznika nie podlega zmianie gdy do elementów

wiersza dodamy lub odejmiemy elementy innego wiersza
pomnożone przez k



B 



Rzędem

macierzy A nazywamy stopień największej podmacierzy

kwadratowej której wyznacznik jest różny od zera

Gdy

macierz jest

osobliwa

Gdy

macierz jest

nieosobliwa

Minor

elementu a

jest wyznacznikiem otrzymanym z macierzy

kwadratowej przez wykreślenie i-tego wiersza i j-tej kolumny

Dopełnienie algebraiczne

elementu a

jest równe (-1)

i+j

Macierzą dołączoną

macierzy A o wymiarach nxn jest macierz

J=[A

] o wymiarach nxn, w której element i-tego wiersza i j-tej

kolumny jest dopełnieniem algebraicznym elementu w i-tym
wierszu i j-tej kolumnie macierzy A























)

(





Macierz B nazywamy

macierzą odwrotną

macierzy kwadratowej

A jeśli AB=I. Macierz odwrotną oznaczamy A

-1

Dla każdej nieosobliwej macierzy A istnieje jedna i tylko jedna
macierz odwrotna A

-1

taka, że

Gdy

Tylko nieosobliwe macierze kwadratowe mają macierze odwrotne









 1

 





(0,0)

)





Własności wektorów w dwuwymiarowej przestrzeni euklidesowej E

 









)

(

Prawo łączności





















)

(

)

(

Prawo rozdzielności

 



Mnożenie wektorów przez skalar - własności

 









)

(



u

u







Prawo przemienności

Dodawanie wektorów-własności

Prawo łączności

























u-v

-v

u+v















W przestrzeni E

istnieje tylko jeden wektor

zerowy

0 zwany

punktem odniesienia

taki, że





dla każdego u w E

Dla każdego u w E

istnieje tylko jeden wektor

przeciwny

-u taki, że

 







dla każdego u w E

uv

Prawo przemienności

Iloczyn skalarny

wektorów-własności

Wtedy i tylko wtedy gdy u=0



















Każdej parze wektorów u i v w E

odpowiada liczba rzeczywista uv=u

zwana iloczynem skalarnym u i v.





wtedy i tylko wtedy gdy u=0

Każdemu wektorowi u w E

odpowiada liczba rzeczywista

zwana długością wektora u

Nierówność trójkąta





Dla dowolnych skalarów ,  i wektorów u, v i w w E

Długość wektora

u 













dla każdego u, v w E

u 



Zbiór wektorów U

, U

,...,U

nazywamy

liniowo niezależnym

gdy dla wszystkich liczb



, 

,...,

równość

pociąga

np.

W przeciwnym razie zbiór jest

liniowo zależny





...



=[1 0]

=[0 1]





...































 















































=[



=[0 

]



=[



]

n – wymiarowa przestrzeń euklidesowa

, jest zbiorem obiektów zwanych

wektorami, które posiadają własności opisane poprzednio; w przestrzeni E

istnieje

układ n niezależnych wektorów, ale każde n+1 wektorów
w jest układem liniowo zależnym.

Bazą

w E

jest zbiór liniowo niezależnych wektorów. Każdy wektor może być

jednoznacznie wyznaczony jako kombinacja liniowa wektorów danej bazy.

Zbiory wypukłe

Wypukłą kombinacją punktów U

, U

,...,U

nazywamy punkt

U=

+

+... 

gdzie 

są skalarami spełniającymi warunki i . Podzbiór C

w E

jest wypukły wtedy i tylko wtedy, gdy dla każdej pary U

w C każda

kombinacja wypukła

U=

+

lub

gdy



=1- 

U= (1- 

+

również należy do C.











Twierdzenie 1

Dowolny punkt leżący na odcinku łączącym dwa punkty w E

może

być wyrażony jako kombinacja wypukła tych dwóch punktów.

Dowód

Oznaczmy dwa punkty przez U i V oraz punkt W leżący na odcinku
łączącym U i V.

Ponieważ kombinacja liniowa jest wypukła gdy spełnia warunek

W= (1- 

)V+

dla każdego

przy

Więc dla

mamy W =V+



(U-V)

Zatem wektor W jest kombinacją wypukłą V i U.





U-V)

-V

U-V

0,1]

[





0,1]

[





W-V)

-V

U-V







Twierdzenie 2 (odwrotne)

Dowolny punkt, który może być wyrażony jako
kombinacja wypukła dwóch punktów w E

, leżący na

odcinku łączącym te dwa punkty.

Zbiory wypukłe

Zbiory nie wypukłe

Punkt U zbioru wypukłego C nazywamy

wierzchołkiem

, jeśli

nie może być on wyrażony jako kombinacja wypukła dwóch różnych
punktów należących do C.

Punkt U nie leży na prostej łączącej punkty W i V.

Zbiór wektorów S nazywamy

stożkiem

, jeśli dla każdego wektora U

Należącego do S,



U także należy do S, gdzie



jest liczbą

nieujemną.

Przykładem stożków są całe przestrzenie, początek układu oraz zbiór

Uwaga!

Stożek zawiera początek układu ponieważ



może być równe

zeru.

Sympleks

jest n-wymiarowym wielościanem wypukłym mającym

dokładnie n+1 wierzchołków. W przestrzeni E

sympleksem jest punkt,

w E

prosta, zaś w E

trójkąt.

Nierówności liniowe

















(0,1)

(1,0)

(2,1)

































lub

gdzie

Obszar dopuszczalnych

rozwiązań

Układ nierówności

można zamienić na układ równości poprzez odjęcie
(dodanie)

zmiennej osłabiającej

takiej, że

wówczas











































0,...,s



-s

Obszar dopuszczalnych

rozwiązań

Twierdzenie Kroneckera-Capelli

mxn







mxn

A 

)

(

)

(

mxn

A 

Jeśli dla układu (*) równań liniowych spełniony jest warunek

to mogą zaistnieć trzy następujące przypadki:

•

rz(A)=n=m, istnieje tylko jedno rozwiązanie (*)

•

rz(A)=n<m, istnieje jedno rozwiązanie (*), lecz (m-n) równań jest zbędnych
(redukcja)

•

rz(A)=m<n, istnieje nieskończenie wiele rozwiązań układu (*), układ jest
nieoznaczony

Układ równań liniowych

(*)

ma rozwiązanie

wtedy i tylko wtedy, gdy rząd macierzy rozszerzonej

jest równy macierzy A, tj.



)

(

)

(

mxn

A 

Przykład. Obliczyć rząd macierzy

































)

(

Metody rozwiązywania układów równań

Ax























































ponieważ

Powyższy układ (*) można zapisać w postaci kombinacji liniowej
wektorów





(*)

(**)

Definiujemy n-1 czynników

Mnożymy pierwsze równanie przez m

a następnie odejmujemy je od

równania drugiego. Następnie mnożymy pierwsze równanie przez m

następnie odejmujemy je od równania trzeciego. Postępowanie to
kontynuujemy aż do ostatniego równania. W ten sposób otrzymujemy

Opisaną procedurę można zastosować do końcowych n-1 równań. W tym
celu definiujemy

Metoda Eliminacji Gaussa



















,...,



)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

gdzie

























,...,

3,4

)

(

)

(



(*)

(**)

Mnożymy drugie równanie układu (**) przez m

a następnie wynik odejmujemy od trzeciego

równania, czwartego równania,....., n-1 równania. W k-tym kroku procedury posługujemy się
Czynnikami

i obliczamy nowe współczynniki

Po wykonaniu n-1 kroków otrzymujemy trójkątny układ równań

Ostatnie równanie zawiera jedynie zmienną x

. Podstawienie jej do równania otrzymanego

wcześniej prowadzi do wyrażenia na zmienną x

n-1

, tzn. w ogólnym przypadku

,...,

)

(

)

(





)

(

)

(

)

(

)

(

)

(

)

(











)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(













,...,

)

(

)

(

)

(

















Definiujemy n-1 czynników

Mnożymy pierwsze równanie przez m

a następnie odejmujemy je od

równania drugiego. Następnie mnożymy pierwsze równanie przez m

następnie odejmujemy je od równania trzeciego. W ten sposób otrzymujemy

Metoda Eliminacji Gaussa - przykład







(*)

1 ,

















)

2(*m

































)

(

)

(





















Metoda Eliminacji Gaussa - przykład

)

2(*m

































)

(

)

(

















Ostatnie równanie zawiera jedynie zmienną x

. Podstawienie jej do równania

otrzymanego

wcześniej prowadzi do wyrażenia na zmienną x

n-1

, tzn. w ogólnym przypadku













)

(

)

(

)

(

)

(

,...,

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(











































































































Określenie macierzy

odwrotnej









Krok 1:

Krok 2:















1/2

3/2

1/2

Krok 3:



1/2

1/6

1/3

1/2

1/3

Ponieważ macierz A jest

nieosobliwa

, układ wektorów P

, P

i P

jest

linowo niezależny

i wobec tego tworzy

bazę

w przestrzeni E

)

(

(-2)

(-1)

(-2)

(-1)































Policzmy wyznacznik macierzy A

6





...







...

Dowód nie wprost

Dla dowodu, że wektory P

, P

... P

macierzy nieosobliwej A tworzą układ liniowo

niezależny załóżmy najpierw, że układ ten jest liniowo zależny, wówczas dla pewnej 

musi być spełniona równość

Przy czym przynajmniej jedno 

musi być różne od zera.





...



. Przeczy to założeniu, że macierz A jest macierzą
nieosobliwą. W ten sposób założenie liniowej zależności prowadzi do
sprzeczności, więc wektory P

, P

i P

są

linowo niezależne

Podstawmy wartości wektora P

do macierzy A



































Możemy wówczas jeden z wektorów przedstawić jako kombinację liniową pozostałych.

W rozważanym przykładzie mamy

Dodając do pierwszej kolumny







 





 





 

















otrzymujemy







...



















Kombinacja liniowa (**) wektorów P

, P

i P

równa P

przyjmuje postać





Ponieważ wektory P

, P

i P

tworzą bazę każdy inny wektor może być

wyznaczony jako kombinacja liniowa tych wektorów

Dla

otrzymujemy

Zatem P

został wyrażony jako kombinacja liniowa P

, P

i P

Wektor P

jest wektorem

osobliwym

gdyż jest wyznaczony przez mniej

niż n wektorów bazy



































Postać standardowa Zadania Programowania liniowego

Alternatywne zapisy

Znajdź wektor (x

,...,x

) który minimalizuje kombinację liniową

(funkcję celu)
(1.1)
Przy ograniczeniach

...

























,...,













,...,





przy
ograniczeniach

Zminimalizować

funkcję

(1.2)

(1.3)



AX 

X 

przy
ograniczeniach

Zminimalizować

funkcję



X 

przy
ograniczeniach

Zminimalizować

funkcję

...





gdzie P

dla j=1,...,n jest j-tą kolumną macierzy A, P

Sprowadzenie ogólnych zadań programowania liniowego

do postaci standardowej

1. Pełne ograniczenie nierównościowe typu

ograniczenie sprowadzamy do postaci równościowej przez dodanie zmiennej
dopełniającej s>0

2. Pełne ograniczenie nierównościowe typu

ograniczenie sprowadzamy do postaci równościowej przez odjęcie zmiennej
dopełniającej s>0

Każde zadanie minimalizacji funkcji celu

można zapisać w równoważnej formie

AX 











AX 







)

(

min x





)

(

max

)

(

min













(0,1)

(1,0)

(2,1)

Obszar dopuszczalnych

rozwiązań

Podstawowe definicje

Def.1.

Rozwiązaniem dopuszczalnym zagadnienia PL jest wektor X=

,...,x

) spełniający warunki (1.2) i (1.3).

Def.2a.

Macierzą bazową B układu równań AX=b , rz(A)=m, n>m, nazywamy

nieosobliwą macierz kwadratową o wymiarach mxm utworzoną z liniowo niezależnych
kolumn a

macierzy A.

Def.2a.

Rozwiązaniem bazowym układu równań AX=b , rz(A)=m,

n>m, nazywamy
wektor X

-1

b utworzony ze zmiennych odpowiadających

kolumnom a

macierzy

bazowej B. Składowe wektora X

noszą nazwę zmiennych bazowych.

Uwaga!

Maksymalna ilość rozwiązań bazowych wynosi

(



Def.2b.

Rozwiązaniem bazowym dopuszczalnym nazywamy

rozwiązanie bazowe, które spełnia warunek (1.2), czyli wszystkie
zmienne bazowe są nieujemne.

Def.3.

Niezdegenerowanym rozwiązaniem bazowym dopuszczalnym

nazywamy bazowe rozwiązanie dopuszczalne, w którym wszystkie
zmienne bazowe są dodatnie.

Def.4.

Minimalnym rozwiązaniem dopuszczalnym nazywamy

rozwiązanie dopuszczalne, które minimalizuje funkcję (1.1)

X 

X 





Przykład.

Znaleźć rozwiązanie bazowe układu równań























;

Maksymalna liczba rozwiązań bazowych



 )!

(

Rząd macierzy A jest równy 2, zatem macierze B

, i=1,2,3,

odpowiadające kolejnym rozwiązaniom złożone będą z dwóch
kolumn macierzy A . Jeśli

























stąd



Jeśl
i

























stąd



Jeśl
i

























2/3

5/3

stąd



Przykład

















Wykażemy, że rozwiązania bazowe odpowiadają wierzchołkom wielościanu.
Sprowadzamy układ nierówności do postaci kanonicznej dodając zmienne dopełniające.

(0,6)

(0,4)

(6,0)

=10

-
x

+2x

Zbiór rozwiązań
dopuszczalnych

1,..,6





































Rząd macierzy A jest równy 4, zatem macierze bazowe B

utworzone będą z 4 kolumn

macierzy A, a każde niezdegenerowane dopuszczalne rozwiązanie bazowe

powinno zawierać 4 zmienne bazowe niezerowe.
1) Rozwiązanie bazowe związane z przecięciem się ograniczeń

Punkt wierzchołkowy B wynosi

2) Rozwiązanie bazowe związane z przecięciem się ograniczeń

Punkt wierzchołkowy D wynosi

X 





















lub













 







 



























 







 





3) Rozwiązanie bazowe związane z przecięciem się ograniczeń

Punkt wierzchołkowy C wynosi

































 







 





Rozwiązanie i ma cztery zmienne niezerowe jest więc rozwiązaniem

niezdegenerowanym. Rozwiązanie ma tylko trzy zmienne dodatnie jest więc

rozwiązaniem zdegenerowanym.

Właściwości rozwiązań zadania PL

Twierdzenie.1.

Zbiór wszystkich rozwiązań dopuszczalnych

zagadnienia PL jest zbiorem wypukłym.

Dowód. Należy wykazać, że każda wypukła kombinacja dwóch
rozwiązań dopuszczalnych jest również rozwiązaniem
dopuszczalnym. Załóżmy, że istnieją dwa rozwiązania X

i X

. Mamy

zatem A X

=b dla

i A X

=b dla

Dla

niech

będzie wypukłą kombinacja

liniową wektorów X

i X

. Zauważmy, że wszystkie elementy wektora

X są nieujemne, tj. . Zatem X jest rozwiązaniem dopuszczalnym
ponieważ

X 























)

(

)

(





)

(









X 

Jeśli zbiór jest wypukły to prosta łącząca dwa dowolne punkty zbioru należy także
do zbioru.

Twierdzenie.2.

Funkcja celu przyjmuje wartość minimalną w punkcie wierzchołkowym

zbioru wypukłego K, utworzonego na zbiorze rozwiązań dopuszczalnych zagadnienia
PL. Jeśli przyjmuje wartość minimalną w więcej niż jednym punkcie wierzchołkowym to
tę samą wartość przyjmuje dla każdej kombinacji liniowej tych punktów.
Dowód. Ponieważ K, jest zbiorem wypukłym ma skończoną ilość punktów
wierzchołkowych np.

minimalne rozwiązanie dopuszczalne

punkty wierzchołkowe, p=1,..,6

f(X)

funkcja celu

warunek minimalizacji

dla każdego K

Załóżmy, że X

nie jest punktem wierzchołkowym (patrz rys.) wtedy X

możemy

zapisać jako kombinację wypukłą wierzchołków zbioru K











dla



)

(

)

(





Ponieważ funkcja celu f(X) jest funkcjonałem liniowym, mamy

Zauważmy, że nie zwiększamy minimum jeśli za każde podstawimy najmniejszą
spośród wszystkich wartości . W związku z tym niech
Podstawiając do powyższej równości otrzymujemy

Z założenia mamy

dla wszystkich X należących do K, zatem musi być

spełniona równość

Istnieje zatem punkt wierzchołkowy w którym funkcja celu przyjmuje wartość
Minimalną.

min

)

(

...

)

(

)

(

)

...

(

)

(



























 

min

)

(



 

f X

 

f X











(

)

(

...

)

(

)

(

)

(

)

(

)

(



min

)

(

)

(



 X

 

f X

Twierdzenie.3.

Jeśli można znaleźć

wektorów P

, P

,..., P

liniowo niezależnych takich, że

oraz wszystkie

, to punkt

jest

punktem wierzchołkowym zbioru wypukłego rozwiązań
dopuszczalnych. X jest wektorem n-wymiarowym, którego n-k
ostatnich elementów jest równych zeru.

Dowód Załóżmy, że X nie jest punktem wierzchołkowym. Ponieważ

jest rozwiązaniem dopuszczalnym może być wyrażony jako
kombinacja wypukła dwóch dowolnych punktów X

i X

ze zbioru

K co zapisujemy

Ponieważ wszystkie elementy wektora X są nieujemne i

wektory X

i X

przyjmują postać

Ponieważ X

i X

są rozwiązaniami dopuszczalnymi zatem A X

=b i

A X

=b. W postaci wektorowej równania te przyjmują postać

Aby oba równania były zgodne musi być spełniony warunek

Wobec tego punkt X nie może być wyrażony jako kombinacja

wypukła X

i X

i musi być punktem wierzchołkowym

k 

...







)

,...,

(



)

(



















)

,...,

(

,...,

(

)

(

)

(

)

(

)

(

)

(

)

(



)

(

)

(

)

(

)

(

)

(

)

(

...









)

(

)

(



Twierdzenie.4.

Jeśli

jest punktem wierzchołkowym

zbioru K, to wektory odpowiadające dodatnim x

tworzą zbiór

liniowo niezależny. Dodatnich x

jest co najwyżej m.

Wniosek 1.

Każdemu punktowi wierzchołkowemu zbioru K

odpowiada zbiór m wektorów liniowo niezależnych z danego
zbioru P

, P

,..., P

Twierdzenie.5.

Punkt

jest punktem

wierzchołkowym zbioru K, wtedy i tylko wtedy, gdy w kombinacji
linowej wektorów niezależnych P

Współczynniki x

są dodatnie

Wnioski

1. Istnieje punkt wierzchołkowy zbioru K, w którym funkcja celu

przyjmuje minimum

2. Każde bazowe rozwiązanie dopuszczalne jest punktem

wierzchołkowym zbioru K

3. Każdemu punktowi wierzchołkowemu zbioru K odpowiada m

wektorów liniowo niezależnych z danego zbioru n wektorów
związanych z tym punktem.

)

,...,

(



)

,...,

(







Interpretacja geometryczna zadania PL

Zagadnienie PL można przedstawić w postaci kanonicznej gdzie
przestrzeń rozwiązań

jest przestrzenia działania

Znaleźć

takie, że

gdzie

lub w przestrzeni wektorów

, zwanej przestrzenią wymagań

(ograniczeń) w
postaci

Znaleźć

takie, że

gdzie

Hiperpłaszczyzną nazywamy obiekt określony jednym warunkiem
liniowym w E

min









czym

przy













min









czym

przy







Interpretacja geometryczna zadania PL

W przestrzeni działań jeśli zbiór rozwiązań dopuszczalnych

jest

ograniczony,

to tworzy on wielościan wypukły S. Wyrażenie z=cX określa w
przestrzeni R

rodzinę równoległych hiperpłaszczyzn, prz czym

wektor –c prostopadły do tych hiperpłaszczyzn wskazuje kierunek
malenia funkcji z. Wychodząc z pewnej hiperpłaszczyzny należącej
do tej rodziny i mającej wspólne punkty z wieloscianem S, przy
przesuwaniu jej rónolegle w kierunku malenia z, można dojść do
takiego jej położenia, że staje się ona hiperpłaszczyzną podpierającą.
Jeśli ta hiperpłaszczyzna ma tylko jeden punkt wspólny ze zbiorem
X

to punkt ten będzie punktem wierzchołkowym i zadanie PL ma

jedyne rozwiązanie optymalne.





czym

przy











minimum

Zbiór
rozwiązań
dopuszczalnyc
h

-c

minimum

Zbiór
rozwiązań
dopuszczalnyc
h

-c

Interpretacja geometryczna zadania PL

W przestrzeni wymagań R

zbiór wektorach P

, i=1,...,n generuje

wypukły stożek wielościenny C. Jeśli wektor b (P

) zawarty jest w

tym stożku, to istnieje rozwiązanie dopuszczalne zadania PL. Przy
założeniu, że rząd macierzy A jest równy m więc liniowo
niezależnych wektorów P

jest tylko m, przy czym wektory te tworzą

bazę w R

. Jeśli wektor b (P

) należy do stożka rozpiętego na

wektorach P

, i=1,...,m to rozwiązanie dopuszczalne jest

rozwiązaniem bazowym jest ograniczony,

Metoda sympleksów

Rozwiązanie zadania PL metodą sympleksów polega na tym, że

poczynając od określonego wierzchołka wielościanu wypukłego,
będącego zbiorem rozwiązań dopuszczalnych, w kolejnych
krokach wybieramy wierzchołki położone coraz bliżej
wierzchołka optymalnego, tzn. odpowiadającemu optymalnemu
bazowemu rozwiązaniu dopuszczalnemu.

W metodzie sympleksów należy określić

1. Sposób przechodzenia z bazy do bazy

2. Kryterium zbieżności, kryterium zatrzymania procedury

3. Metodę wyznaczania początkowego bazowego rozwiązania

dopuszczalnego

4. Sposób postępowania przy pojawieniu się zdegenerowanych

rozwiązań bazowych

Metoda sympleks do rozwiązywania zadania PL

W programowaniu liniowym szukamy optimum poruszając się po punktach
ekstremalnych zbioru punktów dopuszczalnych Xo. W każdym punkcie ekstremalnym
przynajmniej n-m zmiennych przyjmuje wartość zero. Reszta jest określona równaniem
AX=b. Za pomocą metody sympleks przeszukujemy wierzchołki zbioru punktów
dopuszczalnych w uporządkowany sposób, generując kolejne punkty x

, x

, ... ,x

W każdym punkcie x

n-m zmiennych, które w punkcie x

mają wartości zerowe nazy-

wamy zmiennymi niebazowymi (zbiór indeksów tych zmiennych oznaczymy N

). Na-

tomiast pozostałe m zmiennych nazywamy zmiennymi bazowym (zbór indeksów B

Wektor zmiennych oznaczamy

X=[X

]

Odpowiednio macierz ograniczeń przyjmuje postać

A=[A

]

Macierz A

o wymiarze mxm nazywamy macierzą bazową, A

o wymiarze mx(n-m)

macierzą niebazową. Macierz A

nie może być osobliwa. Dla zmiennych niebazowych

Przyjmujemy wartość zero, a wartości zmiennych bazowych wybieramy tak, aby był
spełniony układ pełnych ograniczeń liniowych. Wówczas równanie AX=b można
zapisać

Jeśli zmienne bazowe także przyjmują wartość zero wówczas mówimy o rozwiązaniu
Zdegenerowanym. Punkt wierzchołkowy odpowiadający wybranej bazie ma następują-
ce wartości współczynników













 













gdzie ˆ

Kryterium optymalności bazowego rozwiązania dopuszczalnego

Wartość funkcji celu w bazowym rozwiązaniu dopuszczalnym wyraża się wzorem

Funkcję bazową wyrażoną za pomocą zmiennych niebazowych f(X

) nazywamy

funkcją zredukowaną. Jeśli wszystkie współczynniki w zredukowanej funkcji celu są
większe lub równe zeru to rozwiązanie jest rozwiązaniem X

optymalnym.

jest oznacza ceny zredukowane w bazowym rozwiązaniu dopuszczalny. Kryterium
optymalności brzmi

punkt X

jest optymalny, jeśli

  



 









 





 





)

(





























cˆ

c 

Wektor zmiennych bazowych dla nowej zmiennej x

jest wyrażony wzorem

Wektor a

oznacza kolumnę macierzy pełnych ograniczeń równościowych,

odpowiadającą zmiennej x

, którą wprowadzamy do bazy. Jeśli d

<0 to zwiększenie x

zmniejsza wartość zmiennej bazowej x

Zmienna x

osiąga wartość 0 gdy

Zatem indeks p zmiennej wyprowadzanej z bazy określa się jako

Wybór zmiennej wprowadzanej do bazy

min





Jeśli warunek

nie jest spełniony to wybieramy nową zmienną x

, która

wchodzi do bazy, przy czym ta zmienna jest wybierana na podstawie kryterium

c 

Wybór zmiennej wyprowadzanej z bazy

 

gdzie

















min











Tablicowa postać metody sympleks

Wykorzystywane równania

Organizacja danych





 







f )

(





)

(













min



0.5

1.5





































Dane:

k=1





)

(

 





 





 





c ˆ

f 

gdzie

Wektor cen
zredukowanych

Sprawdzamy kryterium optymalności. Ponieważ jedna z cen nie jest dodatnia
wyznaczony punkt nie jest optymalnym. Zmienna dla której wchodzi do
nowej bazy. Jest to zmienna x

min





































max

lub

min

W celu określenia zmiennej opuszczającej bazę sprawdzamy kryterium

W naszym przypadku otrzymujemy min(0.5/3; -0.5/4) jest (-0.5/4) stąd zmienna x

opuszcza bazę

k=2

0.5

1.5

1/4

7/8

3/4

3/8

1/4

Ponieważ wszystkie ceny zredukowane są dodatnie więc
wyznaczony punkt jest punktem optymalnym.

podsumowanie

- z

- wskaźniki optymalności. Dla zmiennych bazowych wskaźniki

optymalności są zawsze równe zero

Kryterium optymalności

Rozwiązanie jest optymalne, jeżeli wartości wszystkich wskaźników

optymalności są niedodatnie

Kryterium wejścia do bazy
Do bazy wchodzi zmienna, która ma największą wartość wskaźnika

optymalności. Jeżeli największa wartość wskaźnika optymalności
odpowiada więcej niż jednej zmiennej, wybieramy zmienną o
najniższym indeksie.

Kryterium wyjścia z bazy

Obliczamy ilorazy wyrazów wolnych (kolumna b

) przez elementy

(tylko dodatnie) kolumny zmiennej wchodzącej do bazy. Bazę
opuszcza ta zmienna, dla której obliczony iloraz jest najmniejszy.
Jeżeli najmniejsza wartość ilorazu występuje dla więcej niż jednej
zmiennej, to jako zmienną opuszczającą bazę można wybrać
dowolną zmienną.

Metoda sympleksów - Przykład

Standardowa postać zadania

Znajdź wektor (x

,...,x

) który maksymalizuje kombinację liniową

(funkcję celu)

Przy ograniczeniach

2x 





























2,...,5





przy
ograniczeniach

n=5, m=3

Zminimalizować

funkcję















Cj-

















Cj-



































Cj-



































0*+0

*1+0*

4=0

cj-zj

-0=

3-
0=3















































Kryterium wejścia do bazy: max (c

); max(2,3,0,0,0)=3

zatem zmienna x

wchodzi do bazy

wskaźnik
optymalności















































Kryterium wyjścia z bazy: min (b

/x2); min(7,4,-,)=4

zatem zmienna x

opuszcza bazę

wskaźnik
optymalności



bi/x



14/



8/

0*+0

*1+0*

4=0

Cj-

-0=

3-
0=3

Zatem zmienna

wchodzi do bazy na miejsce zmiennej

. Teraz

wektorami bazy są x

, x

. Dla nowych wektorów bazowych należy

utworzyć macierz bazową

Def.2a.

Macierzą bazową B układu równań AX=b , rz(A)=m, n>m,

nazywamy

nieosobliwą macierz kwadratową o wymiarach mxm utworzoną z
liniowo niezależnych

kolumn a

macierzy A.

W tym celu odejmujemy od pierwszego wiersza drugi i dzieląc drugi
przez dwa otrzymujemy

Kryterium wejścia do bazy: max (c

); max(0.5,0,0,-1.5,0)=0.5

zatem zmienna x

wchodzi do bazy



bi/x



-1

1/2

Cj-

1.5

0.5

-1.5



bi/x



-1

1/2

Cj-

1.5

0.5

-1.5

6/1=6

Kryterium wyjścia z bazy: min (b

/x2); min(6,8,4,)=4

zatem zmienna x

opuszcza bazę



bi/x



-1

1/4

1/2

1/8

1/4

Cj-

Zatem zmienna

wchodzi do bazy na miejsce zmiennej

. Teraz wektorami bazy są x

, x

. Przeprowadzamy obliczenia (2w)*2, (1w)-(2w), (3w)/4 i (2w)-(3w), (1w)+(2w)

i (2w)/2

1.5 1/8

-1.5 -1/8

Ponieważ wszystkie wskaźniki optymalności są mniejsze bądź równe
zero uzyskane rozwiązanie jest rozwiązaniem optymalnym,

, f(

, x

)=2*

+3*

=14

Programowanie nieliniowe bez ograniczeń

Minimum globalne

Funkcja f(X) osiąga minimum globalne w punkcie jeśli

dla każdego X należącego do zbioru rozwiązań dopuszczalnych S.

Minimum lokalne

Funkcja f(X) osiąga minimum lokalne w punkcie jeśli istnieje
otwarte otoczenie U

punktu , że

)

(

)

(



f(x)

x=b

x=a









(

)

(

Gradient funkcji

Definicja

Jeżeli funkcja f(X) i jej wszystkie pierwsze pochodne są ciągłe na pewnym

podzbiorze E

to dla każdego punktu w tym podzbiorze określamy n-elementowy

wektor kolumnowy zwany gradientem f(X) w punkcie , jako

jest wektorem prostopadłym do warstwicy f(X) przechodzącej wrzez X















)

(

)

(

)

(

)

(

)

(

)

(

)

(





)



)



f(x

)=const

)



)



f(x

)=const

f(x)

)

(





)

(





Macierz Hessianu

Definicja

Jeżeli funkcja f(X) i jej wszystkie pierwsze i drugie pochodne są ciągłe

na pewnym podzbiorze E

to dla każdego punktu w tym podzbiorze określamy

nxn-elementową macierz zwaną macierzą Hessianu funkcji f(X)
w punkcie , jako













)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(







)



)

(

)

(





Konieczne i wystarczające warunki optymalności

Warunki jakie musi spełniać punkt optymalny nazywane są

warunkami koniecznymi.

Jeśli punkt nie spełnia tych warunków to nie jest punktem

optymalnym. Spełnienie

jednak tych warunków nie wystarcza do tego aby określić czy punkt

jest optymalny.

Punkt spełniający warunki konieczne jest punktem podejrzanym o to,

że może być

optymalny .
Jeśli punkt spełniający warunki konieczne spełnia także warunki

wystarczające wówczas

Jest to punkt optymalny.

Podsumowanie

1. Punkt optymalny musi spełniać warunki konieczne optymalności.

Punkt, który nie s
pełnia tych warunków nie może być punktem optymalnym.

2. Punkt spełniający warunki konieczne nie musi być optymalny np.

punkty
nieoptymalne mogą spełniać warunki konieczne

3. Punkt podejrzany o optimum i spełniający warunki wystarczające

jest punktem
optymalnym.

4. Jeżeli warunki wystarczające nie mogą być użyte lub nie są one

spełnione to
wówczas nie jesteśmy w stanie nic powiedzieć o optymalności
punktu.

Warunki optymalności są wykorzystywane w dwóch przypadkach:

•

chcemy sprawdzić czy dany punkt projektowy może być punktem
optymalnym

•

warunków optymalności mogą być rozwiązane dla punktu, który
może być

optymalnym

Procedura określania warunków optymalności punktu spełniającego
minimum lokalne funkcji f jednej zmiennej

Warunki optymalności

są używane do określania

punktu minimum

funkcji f(x)

Warunki konieczne

optymalności muszą być spełnione w

punkcie

minimum

funkcji,

w przeciwnym wypadku punkt ten nie może być punktem minimum.

Niech        będzie punktem lokalnego minimum funkcji f(x). Niech X
będzie bliskim sąsiadem punku       . Zdefiniujmy przyrost d zmiennej
i wartości funkcji         , oraz jej wartość               w punkcie

xˆ



)

(

)

(













)

(

)

(









warunek optymalności

Jeżeli jest punktem minimum to zaburzając położenie
nie zwiększamy wartości funkcji

xˆ

)

xˆ

Warunek konieczny optymalności pierwszego rzędu

Rozwińmy w szereg Taylora funkcję f(x) w punkcie

Pomijając wyrazy wyższego rzędu otrzymujemy

Z warunku

otrzymujemy

Ponieważ d morze być zarówno dodatnie jak i ujemne więc aby był zawsze spełniony
powyższy warunek pochodna funkcji musi być równa zero, co zapisujemy

wówczas jest punktem minimum funkcji f.





















)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(





)

(

)

(









)

(







)

(



xˆ

Warunek wystarczający optymalności

Punkt podejrzany o ekstremum musi spełniać konieczne warunki optymalności
Podstawiając do szeregu Taylora otrzymujemy

Z warunku

otrzymujemy

Warunek konieczny optymalności drugiego rzędu

Jeśli

wówczas nie możemy założyć, że punkt nie jest punktem minimum.

Należy sprawdzić warunek

jest to warunek konieczny drugiego rzędu.

Jeśli

punkt nie może być lokalnym minimum.

W przypadku gdy

należy sprawdzić jak zachowują się pochodne wyższych

rzędów. Wartość nieparzystej pochodnej mówi nam czy są spełnione warunki konieczne
optymalności, znak parzystej pochodnej mówi nam czy są spełnione warunki
wystarczające i czy punkt wyznacza minimum funkcji.



f

)

(



















)

(

)

(

)

(

)

(

)

(

)

(



)

(



xˆ

)

(



)

(



xˆ

)

(



Przykład 1. Określenie punktu minimum przy użyciu warunków
koniecznych







f )

(

)

(



 x

)

(





warunek
konieczny

)

(









warunek
wystarczający

Zatem x=2 jest minimum lokalnym funkcji f a jej wartość w tym
punkcie wynosi 0.

Przykład 2. Określenie punktu minimum przy użyciu warunków
koniecznych

)

(







)

(





warunek
konieczny

8685

535,

)

(











)

1 2

-2

warunek
wystarczający

211

)

(

)

(











211

Punkt B jest lokalnym maksimum, zaś punkt A lokalnym minimum

Przykład 3. Określenie punktu minimum przy użyciu warunków
koniecznych

)

(



)

(

)

(



)

(

)

(



warunek
konieczny







)

(

warunek
wystarczający

Ponieważ druga pochodna funkcji f w punkcie x=0 jest równa zero
należy zbadać znak trzeciej pochodnej

Należy zatem policzyć kolejną pochodną

)

Zatem punkt x=0 jest punktem lokalnego a także
globalnego minimum.

)

(

)

(



)

(





Warunki optymalności dla funkcji wielu zmiennych f(X)

Rozwińmy w szereg Taylora funkcję f(X) w punkcie

(*)

Załóżmy, że funkcja osiąga minimum w punkcie wtedy przyrost funkcji musi
zatem spełniać warunek
(**)
Pomijając wyrażenia wyższego rzędu zauważamy, że warunek (**) dla dowolnego d
jest spełniony gdy
(***)

(warunek konieczny I rzędu)

Punkt spełniający warunek (***) jest nazywany punktem stacjonarności. Podstawiając
(***) do wzoru (*) i uwzględniają (**) otrzymujemy dla dowolnego
(****)

(warunek konieczny II rzędu)

Warunek (****) jest spełniony jeżeli macierz H jest dodatnio określona

















)

(

)

(

)

(

)

(

)

(

)

(



f

X 



)

(

)

(



d 

Określanie formy macierzy

Forma kwadratowa macierzy A wyrażona wzorem

może być

dodatnio określona, gdy

•dodatnio półokreślona, gdy

•niedodatnio określona, gdy

dla każdego

•niedodatnio półokreślona, gdy

•nieokreślona , gdy



)

(











X 

Forma kwadratowa

)

(







)

(





np.

Przykład 1. Określenie punktu minimum przy użyciu warunków
koniecznych

)

(









warunek
konieczny

)

(





















Dla wszystkich X z wyjątkiem X=0 wyrażenie X

HX jest dodatnio

określone

warunek wystarczający











)

(

)

(

)

(

)

(

)

(























10.0

8.0

6.0

5.0

X(2.5,-1.5)
F(2.5,-1.5)=4.75



Metody numeryczne rozwiązywania zadań minimalizacji bez ograniczeń

Powody dla których korzysta się z metod numerycznych przy rozwiązywaniu zadania
optymalizacji:

•Zadanie optymalizacji posiada wiele zmiennych decyzyjnych

•Funkcja celu może cechować się nieliniowością wysokiego rzędu

•Funkcja celu może nie zależeć w sposób jawny od zmiennych decyzyjnych

Optymalizacja bez ograniczeń

Problem jednowymiarowy
Znaleźć skalar * , które minimalizuje

funkcję f()

Problem wielowymiarowy
Znaleźć punkt x* , który minimalizuje
funkcję f(x)

Główne zasady działania algorytmu numerycznego

Ogólny algorytm działania metod

k numer iteracji

(k)

dopuszczalny kierunek poszukiwań

 długość kroku

Rozwiązywanie zadania optymalizacji przy użyciu metod numerycznych
polega na

przemierzaniu obszaru rozwiązań dopuszczalnych w poszukiwaniu
ekstremum funkcji

celu według iteracyjnego schematu

wektor

(k+1)=

(k)

+x

(k)

k=0,1,2,...

składowe

(k+1)=

(k)

+x

(k)

k=0,1,2,...

i=1 do n

gdzie

x

(k)

= 

(k)

(k-1)

(k)

(k+1)

d

(k)

Procedury algorytmu numerycznego

Krok 1. Wybór punktu startowego x

(0)

. Iteracja początkowa k=0.

Krok 2. Obliczenie kierunku poszukiwań d

(k)

w przestrzeni

projektowej. Ten krok wymaga znajomości wartości funkcji celu i jej
gradientów, oraz ewentualnie gradientów funkcji ograniczeń przy
optymalizacji z ograniczeniami.

Krok 3. Sprawdzenie zbieżności algorytmu. Jeśli kryterium
zbieżności jest spełnione kończymy proces, w przeciwnym wypadku
przechodzimy do dalszych kroków.

Krok 4. Wyznaczenie długości kroku 

Krok 5. Obliczenie nowego punktu projektowego jako

(k+1)=

(k)

+ 

(k)

teraz k=k+1 i powracamy do kroku 2.

Idea Procedury Iteracyjnej

Załóżmy, że minimalizujemy funkcję f(x). Załóżmy, że w k-tej iteracji
punkt x

(k)

nie jest punktem minimalnym. Nie są bowiem spełnione

kryteria optymalności dla tego punktu. Jeśli x

(k)

nie jest punktem

optymalnym należy znaleźć inny punkt x

(k+1)

dla którego wartość

funkcji będzie malała, co można zapisać

f(x

(k+1)

)<f(x

(k)

)

Jeśli do powyższego wyrażenia wprowadzimy zależność określającą
x

(k+1)

otrzymujemy

f(x

(k)



(k)

)<f(x

(k)

)

(*)

Rozwijając w szereg Taylora funkcję f(x

(k)



(k)

) względem punktu

(k)

otrzymujemy

pomijając człony wyższego rzędu i podstawiając do powyższej
nierówności (*) otrzymujemy

dla 

(**)

Ponieważ możemy określić gradient funkcji celu zatem kierunek
poszukiwań d

(k)

musi być dobrany tak aby spełniony był warunek (**)

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(





















)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(



 





)

(

)

(

)

(







Kierunek d

(k)

jest dopuszczalnym kierunkiem poprawy gdy iloczyn

skalarny wektora d

(k)

i wektora gradientów funkcji celu

jest mniejszy od zera. Tzn. wektor d

(k)

należy do stożka

dopuszczalnych kierunków . Kąt pomiędzy d

(k)

musi

Się zawierać pomiędzy 90 a 270 stopni.

 





)

f x



10.0

8.0

6.0

5.0

)

(

)

f x



)

stożek dopuszczalnych
kierunków poprawy

 





)

f x



Problem określania długości kroku

Załóżmy, że funkcja f(x

(k)



(k)

) jest funkcją zmiennej  tj. f=f().

Gdy =0, f(0)= f(x

(k)

). Gdy x

(k)

nie jest punktem minimum, wówczas

można znaleźć dopuszczalny kierunek poprawy d

(k)

. Małe zmiany

funkcji wzdłuż tego kierunku zmniejszają wartości funkcji.
Wykorzystując zależność (*) otrzymujemy

f()<f(0)

Aby spełnić powyższy warunek f() musi mieć ujemne nachylenie w

punkcie =0. Malejąco rosnący charakter funkcji f() wynika z

faktu, że  musi być dodatnie.



f()



Analityczne metody określania długości kroku

Jeśli d

(k)

jest kierunkiem dopuszczalnym, wówczas  musi być

zawsze dodatnie aby był spełniony warunek

Dla problemu jednowymiarowego należy określić = 

takie aby

f() osiągała minimum. Jeżeli f() jest funkcją prostą można

wykorzystać warunki konieczne i dostateczne optymalności do
wyznaczenia . Przy czym warunek konieczny jest zdefiniowany w

postaci

(*)

zaś warunek wystarczający przyjmuje postać

Licząc

i podstawiając do

otrzymujemy

 





)

(

)

(

)

(











)

(

)

(





)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(















)

(







)

(

)

(

)

(

Przykład

)

(





w punkcie (1,2) i kierunku (-1,-1) określić długość kroku  minimalizującą funkcję f(x)

na danym kierunku.

Dla punktu x

(k)

=(1,2), f(x

(k)

)=f(1,2)=3+4+8+7=22, oraz d

(k)

=(-1,-1). Najpierw

sprawdzamy, czy kierunek d

(k)

jest kierunkiem dopuszczalnym. W tym celu liczymy

Gradient

Z zależności

zatem d

(k)

jest kierunkiem

dopuszczalnym. Obliczamy następnie nową wartość zmiennej x

(k+1)=

(k)

+ 

(k)

Stąd x

(k+1)=

+ 

(-1),

oraz x

(k+1)=

+ 

(-1). Podstawiając otrzymujemy





)

(

)

(

)

(

)

(





























)

(

)

(

)

(

)

(

)

(



















)

(

)

(

)

(



)

(

)

)(

(

)

(

)

(

)

(























f x

)

(







f()



f(0)=22

)

(

)

(

)

(









)

(

)

(











Warunek konieczny

Warunek dostateczny

Zatem nowy punkt projektowy























)

(

)

(

)

(



Numeryczne metody określania długości kroku

Metoda równego połowienia

f()









 



q

(q-1) (q+1)

Jeśli wartość funkcji w punkcie q jest większa niż w punkcie (q+1)

)

((

)

(







)

((

)

(







punkt optymalny jeszcze nie został osiągnięty

Jeśli wartość funkcji w punkcie q jest mniejsza niż w punkcie (q+1)

punkt optymalny został przekroczony. Aby wyznaczyć punkt optymalny można
wykorzystać metodę złotego podziału rozważając przedział od q do (q+1) 

Metoda złotego podziału dla zadania jednowymiarowego

Niech punkt znajduje się w odległości od punktu













 )

( 1







)

(





)

(











)

(





)

(





 1







Po podstawieniu otrzymujemy równanie











którego rozwiązaniem są pierwiastki

1.927

0.618













Kolejne rozważane punktu określane są ze wzoru









0.618





Algorytm metody złotego podziału dla zadania
jednowymiarowego

Obliczamy f(

) i f(

)

Krok 1

Dla wybranego małego kroku  spełniającego

warunki





(





(











)

(





)

(

)

(

)

(

)

(







1

f()





(q-1) q

(q-2)

określamy





















1.618









Krok 2

Krok 3

Jeśli

f(

) < f(

) wtedy punkt optymalny jest

pomiędzy









przyjmujemy

obliczamy

 

)

(

gdzie









0.382

Sprawdzamy kryteria zbieżności. Jeśli nie są spełnione powracamy do punktu 3.

Interpolacja kwadratowa
funkcji

lub

Jeśli mamy zadane trzy punkty 

, 

i pośrednią zawartą pomiędzy nimi 

oraz znamy

wartości funkcji w tych punktach f(

), f(

), to rozważaną krzywą możemy

aproksymować parabolą o równaniu

)

(







f()





(q-1) q

(q-2)





dq )

(





)

(

)

(

)

(

)

(

)

(

)

(

)

(

















Położenie ekstremum paraboli q określamy z warunku







)

(

)

(

)

(















Po rozwiązaniu układu równań otrzymujemy

2 





)

(

minimum gdy

Określanie minimum za pomocą Interpolacji
kwadratowej-przykład

Dane

 

5.236610

0.466464

1.648721

2.618034

1.309017,

0.5





Współczynniki paraboli wynoszą kolejno









3.957

0.5

2.410

0.5

5.821

1.648721

5.821

1.309017

0.5

2.410

0.5

1.309017

1.648721

0.466464

2.410

0.5

1.309017

1.648721

0.466464

0.5

2.618034

1.648721

5.236610

1.309017

2.618034















































)

(

)

(

)

(

)

(

)

(

)

(

)

(



Określanie minimum za pomocą Interpolacji
kwadratowej-przykład

Następnie określamy ekstremum paraboli

Wartość funkcji w punkcie jest równa

1.2077

2.410

5.821















 

0.5149





Zauważamy, że

2.618034

1.2077

1.309017

1.2077

0.5

1.2077

















 

5.236610

0.5149

0.466464

0.5149

1.648721

0.5149

















)

(

)

(

)

(

Ponieważ należy przyjąć inny przedział poszukiwania ekstremum
jako równy

 





)

(

0.5





2.618034





1.309017





1.2077







Określanie minimum za pomocą Interpolacji
kwadratowej-przykład

Przechodzimy do drugiej iteracji

1.3464









2.618034

1.309017

1.2077





 

5.236610

0.466464

0.5149





Aktualizujemy współczynniki paraboli oraz punkt ekstremum i wartość funkcji
w tym punkcie

0.4579



)

(



0.5

2.618034





1.309017





1.2077







2.713

7.30547

5.3807







Metody gradientowe-optymalizacja w kierunku
największego spadku

Niech f(x) będzie różniczkowalne względem x. Kierunek spadku wartości funkcji dla
Dowolnego punktu jest okreslony













Algorytm optymalizacji w kierunku realizowany jest w następujących krokach

•

Określenie punktu startowego x

(o)

, ustalenie parametrów zbieżności >0.

•

Obliczenie gradientu funkcji f(x) w punkcie x

(k)

jako

Obliczenie . Jeśli przerwij proces iteracyjny i przyjmij, że x*=x

(k)

jest punktem optymalnym. W przeciwnym wypadku przejdź do punktu 3.
3. Określ kierunek poszukiwań w punkcie x

(k)

optimum jako

4. Oblicz długość kroku 

poprzez minimalizację wyrażenia

5. Uaktualnij wartości zmiennych decyzyjnych wg. Wzoru
Przyjmij k=k+1 i powróć do punktu 2.















lub

)

(

)

(

)

(

f x





)





)

(

)

(





)

(

)

(

)

(





)

(

)

(

)

(







1

Metody gradientowe-optymalizacja w kierunku
największego spadku

Kierunek największego spadku jest prostopadły do gradientu funkcji

Długość kroku określamy z warunku

Otrzymujemy zatem

gdzie









)

(

)

(

)

(

)

(

)

(

)

(





























)

(

)

(

)

(

)

(

)

(





 )

(

)

(





)

(

)

(

)

(

)

(

lub

Optymalizacja w kierunku największego spadku-przykład

znajdź

Przyjmując, że punkt startowy ma współrzędne (1,0)

 

min







1. Określenie punktu startowego x

(o)

=(1,0) ustalenie parametrów zbieżności >0.

2. Obliczenie gradientu funkcji f(x) w punkcie x

(k)

jako

Obliczamy

3. Określamy kierunek poszukiwań w punkcie x

(k)

optimum jako

4. Obliczamy długość kroku 

poprzez minimalizację wyrażenia

5. Uaktualnij wartości zmiennych decyzyjnych wg. Wzoru
Przyjmij k=k+1 i powróć do punktu 2.















)

(

)

(

)

(

)

(

 











)

(





)











)

(

)

(









)

(

)

(

)

(

)

(



)

(

)

(

)

(







1

Document Outline

Slide 1
Slide 2
Slide 3
Slide 4
Slide 6
Slide 7
Slide 8
Slide 9
Slide 10
Slide 11
Slide 12
Slide 13
Slide 14
Slide 15
Slide 16
Slide 17
Slide 18
Slide 19
Slide 20
Slide 21
Slide 22
Slide 23
Slide 24
Slide 25
Slide 26
Slide 27
Slide 28
Slide 29
Slide 30
Slide 31
Slide 32
Slide 33
Slide 34
Slide 35
Slide 36
Slide 37
Slide 38
Slide 39
Slide 40
Slide 41
Slide 42
Slide 43
Slide 44
Slide 45
Slide 46
Slide 47
Slide 48
Slide 49
Slide 50
Slide 51
Slide 52
Slide 53
Slide 54
Slide 55
Slide 56
Slide 57
Slide 58
Slide 59
Slide 60
Slide 61
Slide 62
Slide 63
Slide 64
Slide 65
Slide 66
Slide 67
Slide 68
Slide 69
Slide 70
Slide 71
Slide 72
Slide 73
Slide 74
Slide 75
Slide 76
Slide 77
Slide 78
Slide 79
Slide 80
Slide 81
Slide 82
Slide 83
Slide 84
Slide 85
Slide 86
Slide 87
Slide 88
Slide 89
Slide 90
Slide 91
Slide 92
Slide 93
Slide 94
Slide 95
Slide 96
Slide 97
Slide 98
Slide 99