Algorytmy wyklad 1 id 57804 Nieznany

Wprowadzenie do Teorii Algorytmów

(Introduction to Algorithms Theory)

Prof. Dr.habil. Alexander Prokopenya

Szkoła Główna Gospodarstwa Wiejskiego w Warszawie

Katedra Zastosowań Informatyki

Cele kursu:
zapoznanie studentów

z metodami konstrukcji, analizy kosztów oraz poprawności algorytmów,
z efektywnymi algorytmami rozwiązywania popularnych zagadnień;

nabycie przez studentów umiejętności konstruowania i analizy prostych algorytmów.

Metody dydaktyczne:
Wykłady (30 h) – przekazywanie wiedzy teoretycznej z przedmiotu z wykorzystaniem pomocy
dydaktycznych: komputer, rzutnik multimedialny.
Ćwiczenia (15 h) – rozwiązywanie problemów związanych z projektowaniem algorytmów oraz
analizą ich kosztów i poprawności.

Forma i warunki zaliczenia przedmiotu:

Wykłady

ZALICZENIE KOLOKWIUMU

pisemnego.

Ćwiczenia: zaliczenie na ocenę, na podstawie sumy punktów uzyskanych podczas 2 prac
kontrolnych; warunkiem do zaliczenia jest zdobycie co najmniej 50% od maksymalnej liczby
pkt.

Literatura podstawowa.
1. (CLR) Cormen Th.H., Leiserson Ch.E., Rivest R.L. Wprowadzenie do algorytmów.
Warszawa: Wydawnictwa Naukowo-Techniczne, 2004.
2. (DPV) Dasgupta S., Papadimitriu C., Vazirani U. Algorytmy. Warszawa, Wydawnictwo
Naukowe PWN, 2010.
3. (BDR) Banachowski L., Diks K., Rytter W. Algorytmy i struktury danych. Warszawa:
Wydawnictwa Naukowo-Techniczne, 2003.
4. (DLMRSS) Dańko A., Lan Le T., Mirkowska G., Rembelski P., Smyk A., Sydow M.
Algorytmy i struktury danych - zadania. Warszawa: Wydawnictwo PJWSTK, 2006.
5. (AHU) Aho A.V., Hopcroft J.E., Ullman J.D. Algorytmy i struktury danych. Gliwice: Hekion,
2003.

Literatura uzupełniająca
6. Knuth D. Sztuka programowania. Tom 1: Algorytmy podstawowe. Tom 2: Algorytmy semi-
numeryczne, Tom 3: Sortowanie i wyszukiwanie. Warszawa: WNT, 2002.
7. Lipski W. Kombinatoryka dla programistów. Warszawa: WNT, 2004.
8. Wirth N. Algorytmy+struktury danych=programy. Warszawa: WNT, 2004.

9. Materiały publikowane w sieci Internet:

http://wazniak.mimuw.edu.pl/ ; http://edu.pjwstk.edu.pl/wyklady/

Wykład 1.

Wprowadzenie. Podstawowe zasady analizy algorytmów

Projektowanie i analiza algorytmów są podstawa informatyki. Niniejszy wykład

stanowi przegląd najważniejszych problemów teoryi algorytmów: pojęcie specyfikacji a l-
gorytmu, poprawności i kosztu algorytmu. Na konkretnych przykładach będziemy śledzili
proces przejścia od problemu i jego specyfikacji do gotowego rozwiązania w postaci po-
prawnego programu.

1. Czym jest algorytm?

Algorytm – w matematyce oraz informatyce to skończony, uporządkowany ciąg jasno zdefinio-
wanych czynności, koniecznych do wykonania pewnego zadania.
[http://pl.wikipedia.org/wiki/Algorytm]

Nieformalnie, algorytm jest pewną ściśle określoną procedura obliczeniową, która dla

właściwych danych wejściowych „produkuje” żądane dane wyjściowe zwane wynikiem dziłania
algorytmu. Algorytm jest więc ciągiem kroków obliczeniowych prowadzących do przekształca-
nia danych wejściowych w wyjściowe.

Słowo algorytm często łączone z imieniem greckiego matematyka Euklidesa (365-300

p.n.e.) i jego słynnym przepisem na obliczanie największego wspólnego dzielnika dwóch liczb a
i b:

)

( b

NWD

Specjaliści zajmujący się historią matematyki odnaleźli najbardziej prawdopodobne źró-

dło słowa „algorytm”: termin ten pochodzi od nazwiska perskiego pisarza-matematyka Abu
Ja’far Mohammed ibn Musa al-Khowarizmi (IX wieku n.e.). Jego zasługą jest dostarczenie kla-
rownych reguł wyjaśniających krok po kroku zasady operacji arytmetycznych wykonywanych
na liczbach dziesiętnych: metody dodawania, odejmowania, mnożenia, dzielenia liczb, oblicza-
nia pierwiastków kwadratowych, oblicznia kolejnych cyfr rozwinięcia dziesiętnego liczby



Przykład 1. (Dodawanie liczb)

Weiście: dwie liczby całkowite x i y,



Wyjście: liczba całkowita



a) System dziesiętny :

albo

;

b) System binarny:

albo

c) Liczby rzymskie:

XXXXII

XXVII





- w jaki sposób dodawać?

Przykład 2. (algorytm Euklidesa – obliczanie największego wspólnego dzielnika)
Weiście: dwie liczby całkowite x i y,



Wyjście: liczba całkowita

)

(

nwd

While





then





else





Wynik: y;



)

(

)

(

)

(

)

(

)

(

)

(





Przykład 3. (problem sortowania, Rys. 1)
Weiście: ciąg n liczb

,...,

Wyjście: permutacja

,...,

ciągu wejściowego taka, że

...



Rys. 1. Sortowanie talii kart za pomocą sortowania przez wstawianie

(Source: CLR)

Każdy algorytm:



posiada dane wejściowe (w ilości większej lub równej zero) pochadzące z dobrze zde-

finiowanego zbioru (np. algorytm Euklidesa operuje na dwóch liczbach całkowitych);



produkuje pewien wynik (niekoniecznie numeryczny);



jest precyzyjnie zdefiniowany (każdy krok algorytmu musi być jednoznacznie określo-

ny);



jest skończony (wynik algorytmu musi zostać „kiedyś” dostarczony – mając algorytm A

i dane wejściowe D powinno być możliwe precyzyjne określenie czasu wykonania

)

( A

Algorytm można przedstawić w postaci programu komputerowego albo zrealizować

sprzętowo. Jedynym wymaganiem jest precyzja opisu wynikającej z niego procedury oblicze-
niowej.

2. Język algorytmów

Jaki jest najlepszy język do opisu algorytmu?

Jest to przykład problemu nierozstrzygalnego. Niewątpliwie język ojczysty jest najlepszym języ-
kiem potocznym, a ulubiony język programowania jest najlepszym językiem do implementacji
algorytmu.

Język, którym będziemy opisywać algorytmy, jest gdzieś pomiędzy tymi językami – ję-

zyk potoczny nie wystarcza, a konkretny język programowania może spowodować, że "prosty"
algorytm się zrobi nieczytelny. Będziemy używać, o ile się da, nieformalnych konstrukcji pro-
gramistycznych, a w przypadkach bardzo prostych będziemy się starali pisać algorytm w pseu-
dojęzyku Pascalopodobnym, który zawiera instrukcję przypisania oraz instrukcję złożenia, wa-
runkową i pętli.

1. Przypisanie wartości zmiennej:

zmienna := wartość

2. Operatory zapisywane są za pomocą powszechnie używanych w matematyce symboli
(





mod

: n



div



3. Instrukcja warunkowa:

if warunek then
ciąg instrukcji-1
else
ciąg instrukcji-2
fi

Blok else może zostać pominięty:

if warunek then
ciąg instrukcji
fi

4. Pętla while:

while warunek do
ciąg instrukcji
od

5. Pętla for:

for zmienna = wart_pocz to wart_konc step krok do
ciąg instrukcji
od

Opuszczenie fragmentu step oznacza przyjęcie kroku równego 1.
6. W pętlach lub procedurach będziemy używać instrukcji exit, która przerywa działanie pętli,
lub instrukcji return pozwalającej przerywać wykonanie funkcji lub procedury i wrócić do in-
strukcji następującej po jej wywołaniu.
7. Dostęp do tablic uzyskuje się przez podanie nazwy i indeksu (np. A[i] jest i-tym elementem
tablicy A). A[1..j] oznacza podtablicę zawierającą elementy A[1], A[2], …, A[j]. Aby określić
liczbę elementów w tablicy A piszemy length(A).
8. Dopuszczalne jest zapisanie niektórych operacji za pomocą opisu słownego.

9. Symbol // oznacza, że reszta wiersza jest komentarzem. Komentarze, specyfikujące zachowa-
nie fragmentów programu, są bardzo pomocne przy uzasadnianiu semantycznej poprawności
programu.

Z dokładnością do ortografii, są to znane instrukcje z popularnych języków pr o-

gramowania (Pascal, C, C++, Java). Symbole „do – od”, „if – then else - fi” pełnią jedynie
rolę nawiasów, podobnie jak klamry „{ }” albo „begin - end”. Na ogół, nie będziemy się
zajmować deklaracjami zmiennych, chyba że przy omawianiu konkretnych implementacji,
lub, gdy deklaracje typu zmiennych są konieczne do zrozumienia działania algorytmu.
Będziemy natomiast zakładali, że każdy algorytm ma predefiniowaną zmienną result, któ-
ra służy do zapamiętania wyników algorytmu. Jej typ będzie zależyć od konkretnej sytu a-
cji i od konkretnego algorytmu.

Instrukcje składania, warunkowa i instrukcja pętli są podstawowymi metodami

konstruowania algorytmów. Dodatkowo, dopuszczać będziemy instrukcję wywołania
wcześniej zdefiniowanej procedury lub funkcji. Takie wywołanie zapiszemy w postaci:

nazwa_algorytmu(parametry_aktualne).

Przykład 4. (sortowanie przez wstawianie)

INSERTION-SORT(A)
1

for j := 2 to length(A) do

key := A[j]

// Wstaw A[j] w posortowany ciąg A[1..j-1]

i := j-1

While i > 0 and A[i] > key

do A[i+1] := A[i]

i := i-1 od

A[i+1] := key od

3. Analiza algorytmów

Analiza algorytmów polega na określeniu zasobów, jakie są potrzebne do jego wykonania. Za-
sobem zasadniczym jest dla nas czas obliczeń, jednakże innymi zasobami mogą być: pamięć,
szerokość kanalu komunikacyjnego lub układy logiczne. Zwykle analizowanie kilku algorytmów
dla tego samego problemu prowadzi do wyboru najoptymalniejszego z nich. Będziemy przyj-
mować dalej, że naszym podstawowym modelem obliczeń jest jednoprocesorowa maszyna o do-
stępie swobodnym do pamięci (RAM od ang. Random Access Machine), a naszy algorytmy są
realizowane jako programy komputerowe. W modelu RAM instrukcje są wykonywane jedna po
drugiej (sekwencyjnie).

3.1. Poprawność algorytmu

Przez poprawność algorytmu rozumiemy to, że dla dowolnych danych wejściowych daje on ta-
kie odpowiedzi, jakich oczekujemy. Żeby ustalić poprawność algorytmu, musimy jasno sformu-
łować intencje, podać tzw. jego specyfikację.

Specyfikacją algorytmu nazywać będziemy parę własności:





wp,

, gdzie wp jest

warunkiem początkowym, a wk warunkiem końcowym. Intuicyjnie, warunek początkowy to ten,
który mają spełniać dane początkowe, a warunek końcowy to ten, który ma być spełniony po
wykonaniu algorytmu. Ogólnie, oba warunki powinny opisywać zależności między zmiennymi
przed i po wykonaniu algorytmu.

W przykładzie 4 dla sortowania przez wstawianie mamy na wejściu ciąg n liczb

,...,

. Naturalnym warunkiem początkowym będzie założenie niepustości ciągu: nie

można sortować pusty ciąg. Możemy go zapisać w postaci:

}

{





. Warunek końcowy,

natomiast, powinien charakteryzować oczekiwany wynik i może mieć postać:

}

(

,...,

{









. Algorytm rozwiązujący ten problem możemy zapisać w posta-

ci:
INSERTION-SORT(A)
1

if length(A) = 0 then exit // sprawdzenie waruneku n>0

for j := 2 to length(A) do

key := A[j]

i := j-1

while i > 0 and A[i] > key

do A[i+1] := A[i]

i := i-1 od

A[i+1] := key od

Warto zauważyć, że dla każdego niepustego ciągu liczb

,...,



algorytm zatrzy-

muje się i wydaje posortowany ciąg liczb, czyli po wykonaniu algorytmu warunek końcowy

}

(

,...,

{









jest spełniony. Ten warunek wk wydaje się być rozsądnym z

punktu widzenie badanego problemu. Jest jednak jasne, że dla jednego algorytmu można zapro-
ponować wiele różnych par postaci





wp,

, nie każda jest jednak dla nas interesująca, np.:

specyfikacja postaci

}

{





}

{



Chociaż opisuje własności zmiennych występujących w algorytmie INSERTION-SORT, nie da-
je nam dostatecznej informacji o tym, czego mamy się spodziewać po wynikach i co właściwie
robi ten algorytm. Specyfikacja ma precyzować problem, ma umożliwić odpowiedź na pytanie,
czy algorytm rozwiązuje postawiony problem, czy nie. Specyfikacja ma opisać co ma robić al-
gorytm, jednak bez wskazywania, jak ma to robić.

Definicja. Całkowita poprawność algorytmu.
Powiemy, że algorytm Alg działający w pewnej strukturze danych Str jest całkowicie poprawny
ze względu na warunek początkowy wp i warunek końcowy wk wtedy i tylko wtedy, gdy dla
wszystkich danych spełniających warunek początkowy wp w strukturze Str, algorytm kończy
obliczenie i jego wyniki spełniają warunek końcowy wk.

Podkreślmy jeszcze raz, że jeśli algorytm Alg jest całkowicie poprawny ze względu na

specyfikację





wp,

, to warunek początkowy daje gwarancję, że algorytm zakończy obli-

czenie. Tak właśnie jest w poprzednim przykładzie: algorytm INSETION-SORT zatrzymuje się
dla dowolnych danych. Rzeczywiście, zmienna j, kontrolująca pętlę for, przyjmuje jako swoje
wartości kolejne liczby naturalne, a parametr n też jest liczbą naturalną. Zatem po skończonej
liczbie kroków zmienna j przyjmie wartość n. Dla każdej wartości j ilość kroków w wewnętrznej
pętli „while” nie przekracza



)

(



Łatwo zauważyć, że nie są tu istotne wartości elementów ciągu, ani ich typy. To samo

rozumowanie możemy powtórzyć dla ciągów o elementach z dowolnej liniowo uporządkowanej
przestrzeni, byle tylko n było liczba naturalną. Z tego powodu możemy stwierdzać, że algorytm
INSERTION-SORT

jest

całkowicie

poprawny

względu

specyfikację

(

,...,

;









w każdej strukturze danych, w której relacja porównywania

elementów „



” jest relacją liniowego porządku.

Dowodzenie poprawności dla wielu algorytmów jest bardzo skomplikowane. Będziemy

postępowali zgodnie z ideą Floyda opisów programów. Skorzystamy przy tym ze strukturalnej
budowy algorytmu. Aby udowodnić poprawność algorytmu postaci {P1;P2;} ze względu na spe-
cyfikację





wp,

, będziemy się starali znaleźć taką własność pośrednią



, że algorytm {P1}

jest poprawny ze względu na specyfikację







, a algorytm {P2} jest poprawny ze względu

na specyfikację







Dla analizy algorytmów zawierających pętli może być stosowana metoda niezmienników

Hoare.

Definicja. Niezmiennik

Powiemy że formuła lub warunek



jest niezmiennikiem pętli {while



do P od} w strukturze

Str, jeżeli z tego że formuła

)

(







jest spełniona przed wukonaniem programu P (tzn. treści

pętli) wynika, że formuła



jest spełniona po wykonaniu programu P w strukturze Str.

Przykład 5.
Problem: Znaleźć największy wspólny dzielnik dwóch danych liczb naturalnych x, y. Niech spe-
cyfikacja poszukiwanego algorytmu ma postać:

}

{







)}

)(

(

{

result

























Warunek początkowy gwarantuje, że x i y nie są równocześnie równe 0, a warunek końcowy, że
uzyskany wynik (wartość zmiennej result) jest dzielnikiem zarówno x jak i y, oraz każdy inny
wspólny dzielnik x i y ma mniejszą od niego wartość. Znany wszystkim algorytm Euklidesa
rozwiązuje postawiony w tym przykładzie problem.

NWD(x,y)

if x*y = 0 then result := x + y else // jeżeli jedna z liczb x, y jest równa 0, to NWD

// tych dwóch liczb jest równy drugiej z nich

while x



y do

// NWD(x,y) = k

if x > y then

x := x – y

// NWD(x,y) = k

else

y := y – x fi

// NWD(x,y) = k

result := y

// jeżeli x = y, to NWD(x,y) = k = x = y

Niezmiennikiem pętli w tym algorytmie jest formuła

NWD



)

(

. Uzasadnienie:

)

(

)

(

NWD





, gdy



oraz

)

(

)

(

NWD





, gdy



. Zatem

niezależnie od tego, którą część instrukcji warunkowej wykonamy, największy wspólny dzielnik
nowych wartości zmiennych x i y jest taki sam, jak liczb przypisanych tym zmiennym przed wy-
konaniem programu.

Nie na wiele przyda nam się niezmiennik, jeżeli nie jest on prawdziwy przed wykona-

niem programu. Jeżeli jednak jest prawdziwy przed wejściem do pętli i pozostaje prawdziwy po
każdej iteracji, to, o ile algorytm się zatrzyma, uzyskane wartości zmiennych również go spełnia-
ją. Pozwala nam to często zrozumieć co robi program i uzasadnić jego częściową poprawność.

Wróćmy na chwilę do przykładu poprzedniego. Niech k będzie największym wspólnym

dzielnikiem danych liczb naturalnych x i y. Jeżeli x*y = 0, to jedna z liczb x lub y musi być ze-
rem, ale wtedy k jest równe sumie tych liczb. Jeżeli obie liczby x i y są różne od zera i przed
wykonaniem pętli mamy

NWD



)

(

, to własność ta nie zmienia się w kolejnych iteracjach

pętli. W momencie wyjścia z pętli mamy

)

(

NWD







, z czego wynika, że zmienna

result ma wartość k, a więc wartość największego wspólnego dzielnika danych liczb. Pozostaje
jeszcze pytanie, czy ten algorytm zatrzymuje się dla wszystkich danych spełniających warunek
początkowy. Zauważmy, że suma (x + y) jest w tym algorytmie zawsze liczbą naturalną różną
od zera. Co więcej, wartość tej sumy jest w każdym następnym kroku równa większej z wartości
x i y w kroku poprzednim. Zatem ciąg wartości sum (x + y) jest ściśle malejący, a więc nie może
być nieskończony. To dowodzi, że po skończonej liczbie kroków algorytm Euklidesa zatrzyma
się.

3.2. Koszt algorytmu

Podstawowymi miarami kosztu algorytmu są czas i pamięć.
Jak mierzyć czas? Oczywiście chcemy by miara była niezależna od komputera, na którym reali-
zowany będzie algorytm. Jest oczywiste, że realizacja tego samego algorytmu na różnych kom-
puterach dla tych samych danych, nie musi zająć tyle samo czasu. Zatem informacja, ile jedno-
stek czasu wymaga wykonanie algorytmu dla konkretnych danych, na konkretnym komputerze,
niewiele mówili o samym algorytmie. Miara kosztu algorytmu powinna zależeć od typu proble-
mu i rodzaju rozwiązania, a nie od komputera, na którym realizujemy obliczenia. Czas działania
algorytmu dla konkretnych danych wejściowych jest wyrażony liczbą wykonanych prostych
operacji lub „kroków”, np.

a) Liczbą instrukcji;

b) Liczbą operacji arytmetycznych;
c) Liczbą porównań wykonanych w trakcie realizacji algorytmu
d) Liczbą wywołań rekurencyjnych procedur, itd.

Jest dogonne zrobienie założenia, że operacja elementarna jest maszynowo niezależna. Na razie
przyjmujemy, że do wykonania jednego wiersza naszego programu wymagamy stalego czasu.
Wykonanie jednego wiersza programu nie musi trwać tyle co wykonanie innego wiersza. My
zakładamy, że każde wykonanie i-tego wiersza wymaga czasu

c , przy czym

c jest stała. Taki

punkt widzenia jest zgodny z przyjętym modelem RAM i odzwierciedla sposób implementacji
naszego programu na nowoczesnych komputerach.

W prowadzonych poniżej rozważaniach wyrażenie opisujące czas działania algorytmu

INSERTION-SORT otrzymamy z wyniku uproszczenia skomplikowanej formuly, w której wy-
korzystuje się koszty

c , czyniąc go bardziej zwięzlym i łatwiejszym do przekształceń. Ta

uproszczająca notacja pozwala łatwo rozpatrzywać, które z algorytmów są bardziej efektywne.

Rozpoczynamy od prezentacji procedury INSERTION-SORT z podanym „kosztem”

każdej instrukcji i liczbą jej wykonań. Dla każdego

,...,



, gdzie

)

length



, niech

będzie liczbą sprawdzeń warunku wejścia do pętli while w wierszu 5 dla danej wartości j.

INSERTION-SORT(A)

koszt

Liczba wykonań

for j := 2 to n do

key := A[j]



i := j – 1



while i > 0 and A[i] > key





do A[i+1] := A[i]







)

(

i := i – 1 od







)

(

A[i+1] := key od



Czas działania algorytmu jest sumą czasów wykonania poszczególnych instrukcji; jeśli instruk-
cja wykonuje się w czasie

c i jest powtarzana n razy, to mamy w sumie czas



. Aby obli-

czyć czas działania

)

procedury INSERTION-SORT, sumujemy iloczyny kosztów i liczby

wykonań, otrzymując

)

(

)

(

)

(

)

(

)

(

)

(



























Czas działania algorytmu może się jednak różnić nawet dla danych o tym samym rozmiarze. W
procedurze INSERTION-SORT na przykład najlepszy przypadek (optymistyczny) występuje
wówczas, gdy wejściowa tablica jest już posortowana. Dla każdego

,...,



stwierdzamy, że

key



]

[

w wierszu 5, gdy i ma początkową wartość



. Zatem



dla

,...,



, a

minimalny czas działania wynosi

)

)(

(

)

(

)

(

)

(

)

(

)

(



























Ten czas działania można wyrazić jako



dla stalych a, b zależnych od kosztów

c poje-

dynczych instrukcji; jest to zatem funkcja liniowa względem n.

Jeśli tablica jest posortowana w porządku odwrótnym – to znaczy w porządku malejącym

– mamy do czynienia z przypadkiem najgorszym (pesymistycznum). Musimy porównać każdy

element

]

[ j

z każdym elementem podtablicy

]

[



, a więc



dla

,...,



. Zau-

ważmy, że

)

(











)

(

)

(











Wnioskujemy zatem, że czas działania procedury INSERTION-SORT wynosi

































































)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(





















Ten pesumistyczny czas działania można przedstawić jako



dla stałych a, b, c, które

znowu zależą od kosztów

c ; jest to zatem funkcja kwadratowa względem n.

W typowych sytuacjach, takich jak sortowanie przez wstawianie, czas działania algoryt-

mu jest ustalony dla określonych danych wejściowych, natomiast w dalszych rozdzialach poka-
żemy algorytmy probabilistyczne, których czasy działania mogą być różne dla tych samych da-
nych wejściowych.

3.3. Złożoność pesymistyczna i średnia

Czas działania algorytmu zależy od danych wejściowych. Złożoność algorytmu może być rozu-
miana w sensie złożoności najgorszego przypadku lub złożoności średniej. Złożoność najgorsze-
go przypadku nazywamy złożonością pesymistyczną – jest to maksymalna złożoność dla danych
tego samego rozmiaru n albo górna granica możliwego czasu działania algorytmu dla każdych
danych wejściowych. Dla niektórych algorytmów pesymistyczny czas działania występuje dosyć
często. Zdarza sie tak na przykład przy wyszukiwaniu w bazie danych informacji której w tej
bazie nie ma. W praktyce ważniejsza może się okazać złożoność średnia lub oczekiwana. W tym
przypadku

)

jest średnią (oczekiwaną) wartością złożoności dla wszystkich problemów roz-

miaru n. Tego typu złożoność zależy istotnie od tego, jaka się pod tym kryje przestrzeń probabi-
listyczna danych wejściowych. Z reguły zakładamy, że wszystkie dane wejściowe tego samego
rozmiaru mogą się pojawić z tym samym prawdopodobieństwem. Jednakże jest to często mało
realistyczne założenie. Przestrzeń probabilistyczna danych wejściowych może być bardzo skom-
plikowana. Prowadzić to może do bardzo trudnych analiz.

Definicja.
Niech D(n) będzie zbiorem danych rozmiaru n dla pewnego problemu P oraz Alg niech będzie
algorytmem rozwiązującym ten problem. Pesymistyczną złożoność czasową oznaczamy przez
W(Alg,n), a średnią (oczekiwaną) złożoność czasową przez A(Alg,n). Wielkości te są zdefinio-
wane następująco:

W(Alg,n) = max{T(Alg,d): d



D(n)} A(Alg,n) =



{p(d)



T(Alg,d): d



D(n)}

gdzie d jest egzemplarz danych ze zbioru D(n), p(d) jest prawdopodobieństwem wystąpienia da-
nych d, T(Alg,d) liczbą operacji dominujących, wykonanych przez algorytm Alg dla danych d.

Jeżeli wartość T(Alg,d) jest taka sama dla wszystkich danych d z klasy D(n), to złożoność

pesumistyczna jest równa złożoności średniej i mówimy po prostu o złożoności czasowej algo-
rytmu o wielkości T(Alg, n).

5. Notacje asymptotyczne

Kiedy rozmiar danych weiściowych n staje się bardzo duży, powstaje problem porównywania
efektywności i złożoności różnych algorytmów. Ten problem można rozwiązać na podstawie
rzędu wielkości funkcji czyli ich zachowaniu asymptotycznym. Dla dostatecznie dużych danych
weiściowych stałe współczynniki i mniej znaczące składniki we wzorze na czas działania są
zdominowane przez rozmiar samych tych danych. Na przykład, złożoność optymistyczna algo-
rytma sotrowania przez wstawianie





)

(

będzie mniejsza niż złożoność pesymistyczna





)

(

dla dowolnych stalych a, b, c, d, e, jesli rozmiar danych weiściowych n staje

się duży (Rys. 1).

Rys. 1. Funkcji

5000

10000

)

(





100

)

(





Kiedy dla dostatecznie dużych danych wejściowych liczymy jedynie rząd wielkości czasu dzia-
łania algorytmu, wtedy zajmujemy się asymptotyczną złożonościa algorytmów. Oznacza to, że
interesuje nas, jak szybko wzrasta czas dzialania algorytmu, gdy rozmiar danych wejściowych
dąży do nieskończoności. Zazwyczaj dla dostatecznie dużych danych najlepszy jest algorytm
asymptotycznie bardziej efektywny. Zwykle staramy sie podać jak najprostszą funkcję charakte-
ryzującą rząd wielkości W(Alg,n) i A(Alg,n), na przykład n,

n log

n ,

n .

Będziemy używać następujących oznaczeń dla rzędów wielkości funkcji.

Definicja.
Dla danej funkcji

)

oznaczamy przez

))

(



zbior funkcji





)

(

)

(

)

(

)

(

))

(















Funkcja

)

należy do zbioru

))

(



, jeśli istnieją dodatnie stałe

c oraz

c takie, że funkcja

może być „wstawiona między”

)

(

)

(

dla dostatecznie dużych n. (Rys. 2). Chociaż

))

(



jest zbiorem, piszemy

))

(

)

(





, żeby wyrazić, że

)

jest elementem

))

(



. Dla wszystkich wartości n większych od

n wartość

)

znajduje się między

)

(

)

(

. Inaczej mówiąc, dla wszystkich



funkcja

)

jest równa

)

z dokładnością

do stalego współczynnika. Mówimy, że

)

jest asymptotycznie dokładnym oszacowaniem dla

)

. Na przykład,

)

(







, co oznacza że można pominąć składniki niższych rzę-

dów. To można latwo udowodnić, używając formalnych definicji. W tym celu musimy znalezć
dodatnie stałe

c ,

c oraz

n takie, że







dla każdego



. Dzieląc powyższą zależność przez

n , otrzymujemy







Prawa strona jest prawdziwa dla każdej wartości



, gdy wybierzemy



. Podobnie,

lewa strona jest prawdziwa dla każdej wartości



, gdy wybierzemy



. Wybierając



oraz



, możemy sprawdzić, że

)

(







Rys. 2. Za pomocą notacji



szacuje się funkcję z dokładnością do stalego współczynnika. Pi-

szemy

))

(

)

(





, jeśli istnieją dodatnie stałe

n ,

c ,

c takie, że na prawo od

n wartość

)

leży zawsze między

)

(

)

(

Definicja.
Dla danej funkcji

)

oznaczamy przez

))

(

zbior funkcji





)

(

)

(

)

(

))

(













Notacja



asymptotycznie ogranicza funkcję od góry oraz od dołu. Kiedy mamy tylko asympto-

tyczną granicę górną, używamy notacji O (Rys. 3).

Rys. 3. Notacja O daje górne organiczenie funkcji z dokladnością do stalego współczynnika.

Definicja.
Dla danej funkcji

)

oznaczamy przez

))

(



zbior funkcji





)

(

)

(

)

(

))

(















Notacja



asymptotycznie ogranicza funkcję od dołu (Rys. 4).

Rys. 4. Notacja



daje dolne organiczenie funkcji z dokladnością do stalego współczynnika.

Rzędy wielkości dwóch funkcji

)

mogą być porównane przez obliczenie gra-

nicy

)

(

)

(

lim







Jeśli





, to

))

(

)

(



, ale nie

))

(

)

(



Jeśli





, to

))

(

)

(





Jeśli



, to

))

(

)

(



, ale nie

))

(

)

(



Na przykład stosując regułę de L’Hospitala, otrzymujemy

lim

log

lim















czyli

)

(

log



, ale nie

)

log

(



Większość rozważanych algorytmów ma złożoność czasową proporcjonalną do jednej z

podanych tu funkcji:

log

– złożoność logarytmiczna

n – złożoność liniowa
n

log

– złożoność liniowo-logarytmiczna

n – złożoność kwadratowa

n ,

n ,... – złożoności wielomianowe

log



– złożoność podwykładnicza

– złożoność wykładnicza

Wyszukiwarka

Podobne podstrony:
Algorytmy wyklad 6 7 id 57806 Nieznany
Algorytmy wyklad 4 5 id 57805 Nieznany
LOGIKA wyklad 5 id 272234 Nieznany
ciagi liczbowe, wyklad id 11661 Nieznany
algorytmy sortujace id 57762 Nieznany
AF wyklad1 id 52504 Nieznany (2)
Neurologia wyklady id 317505 Nieznany
Algorytmy obliczen id 57749 Nieznany
ZP wyklad1 id 592604 Nieznany
CHEMIA SA,,DOWA WYKLAD 7 id 11 Nieznany
or wyklad 1 id 339025 Nieznany
II Wyklad id 210139 Nieznany
cwiczenia wyklad 1 id 124781 Nieznany
BP SSEP wyklad6 id 92513 Nieznany (2)
MiBM semestr 3 wyklad 2 id 2985 Nieznany
algebra 2006 wyklad id 57189 Nieznany (2)
olczyk wyklad 9 id 335029 Nieznany
Kinezyterapia Wyklad 2 id 23528 Nieznany

więcej podobnych podstron