Modern computers represent the culmination of longstanding technological advancements beginning with the early idea

Wprowadzenie do Teorii Algorytmów

(Introduction to Algorithms Theory)

Prof. Dr hab. Alexander Prokopenya

Szkoła Główna Gospodarstwa Wiejskiego w Warszawie

Katedra Zastosowań Informatyki

Wykład 4-5.

Algorytmy „dziel i zwyciężaj”

Pry użyciu strategii „dziel i zwyciężaj” (angl. Divide and conquer) problem roz-

wiązuje się, postępując zgodnie z następującym schematem:

1. Dzielimy problem na podproblemy, z których każdy jest mniejszym egzempla-

rzem problemu tego samego typu.

2. Kolejno rozwiązujemy te podproblemy.
3. Lączymy odpowiednio uzyskane rozwiązania.
Zadanie jest realizowane stopniowo, na trzech różnych etapach: pierwszy polega na

dzieleniu problemów na podproblemy; drugi ma miejsce, gdy podproblemy są już tak m a-
łe, że ich rozwiązania są natychmiastowe i nie wymagają stosowania rekursji; natomiast
na samym końcu rozwiązania częściowe skleja się w calość. Wszystko to jest skoordyn o-
wane dzięki rekurencyjnej strukturze algorytmu.

Jako przykład wprowadzający zobaczymy, w jaki sposób, stosując tę technikę, uz y-

skamy nowy algorytm mnożenia liczb, który jest znacznie bardziej efektywny niż metoda
mnożenia, z jaką spotkaliśmy w skole.

1. Mnożenie

Pewnego razu matematyk Carl Friedrich Gauss (1777 – 1855) zauważył, że choć wydaje się, że
iloczyn dwóch liczb zespolonych

















)

(

)

)(

(

wymaga czterych mnożeń liczb rzeczywistaych, w istocie można go otrzymać, wykonyjąc zale-
dwie trzy mnożenia: ac ,

oraz

)

)(

(



, gdyż









)

)(

(

Rozpatrując to punktu widzenia notacji O, zdawać by się mogło, że zredukowanie liczby

mnożeń z czterech do trzech jest grą niewartą świeczki. Jednak to niewielkie ulepszenie staje się
znaczące, gdy jest stosowane rekurencyjnie.

Porzućmy liczby zespolone i zobaczmy, jak to może pomoc w zwykłym mnożeniu. Niech

x i y będą n-bitowami liczbami natutalnymi. Założmy też dla wygody, że n jest potęga dwójki
(ogólny przypadek jest bardzo podobny). Pierwszym krokiem w stronę wymnożenia x oraz y bę-
dzie rozbicie obu liczb na ich lewe i prawe połowy, z których każda ma

bitów:









Na przykład, jeśli

10110110



(indeks dolny 2 oznacza zapis dwójkowy), to

1011



0110



oraz

0110

1011







. Iloczyn x i y może być zatem zapisany jako









)

(

)

)(

(

Obliczymy

, korzystając z wyrażenia po prawej stronie. Czas wykonania dodawania

jest liniowy, podobnie jak mnożenie przez potęgi 2 (które jest po prostu przesunięciem w lewo).
Znaczącymi operacjami są cztery

-bitowe mnożenia:

oraz

, z któ-

rymi można sobie poradzić za pomocą czterych wywołań rekurencyjnych. Zatem nasza metoda
mnożenia n-bitowych liczb zaczyna się od wykonania wywołań rekurencyjnych w celu wymno-
żenia tych czterych par

-bitowych liczb (cztery podproblemy dla danych o połowę mniej-

szych), po czym następuje obliczenie wartości wyrażenia po prawej stronie równania w czasie

)

. Oznaczając przez

)

całkowity czas działania algorytmu na n-bitowych danych wej-

ściowych, dostajemy zależność rekurencyjną

)

(

)

(

)

(





Wkrótce zobaczymy, jak wyglądają ogólne metody rozwiązywania takich równań. Tym-

czasem rozwiązanie tego konkretnego równania okazuje się być rzędu

)

(

, czyli czas działa-

nia jest taki sam jak dla tradycyjnej , szkolnej techniki mnożenia. Mamy zatem zupełnie nowy
algorytm, ale nie osiągneliśmy żadnego postępu w efektywności. W jaki sposób możemy jeszcze
usprawnić tę metodę?

W tym momencie przychodzi nam na myśl sztuczka Gaussa. Chociaż obliczenie iloczynu

zdaje się wymagać czterech

-bitowych mnożeń, tak jak już było pokazane wcześniej,

wystarczą zaledwie trzy:

oraz

)

)(

(



, gdyż









)

)(

(

Czas działania wynikającego stąd algorytmu, przedstawionego na rysunku poniżej, jest krótszy:

)

(

)

(

)

(





Rzecz w tym, że poprawę stałego czynnika z 4 na 3 wykożystuje się na każdym poziomie rekur-
sji, a zwielokrotnienie tego wynika prowadzi do znacznego zmniejszenia ograniczenia czasu
działania – aż do

)

(

)

(

log



funkcja multiply(x, y)
// wejście: dwie n-bitowe liczby naturalne x i y
// wyjście: ich iloczyn
if



then return

x ,



lewe





, prawe





bitów x

y ,



lewe





, prawe





bitów y

= multiply(

x ,

y )

= multiply(

x ,

y )

= multiply(



)

return

)

(











Czas działania algorytmu można uzyskać po analize równania rekurencyjnego





)

(

)

(

Przy podstawianiu



otrzymamy





















)

(

)

(

)

(





























)

(

)

(





















)

(























)

(























)

(

)

(

...

)

(

log





















































Dla szkolnej techniki mnożenia mamy



i wtedy

)

(

)

(

)

(

)

(













Zatem dla



)

(

)

(

)

(

)

(

log













w przybliżeniu jest równy

)

(

W algorytmach „dziel i zwyciężaj” liczba podproblemów odpowiada współczynnikowi

rozgałęzenia dzewa rekursji, niewielkie zmiany tego wspólczynnika mogą mieć wielki wpływ na
czas działania.

Uwaga praktyczna: w ogólnym przypadku nie ma potrzeby stosować rekursji aż do mo-

mentu osiągnięcia 1 bitu. Dla większości procesorów mnożenie 16- lub 32-bitowe jest pojedyn-
czą operacją, więc dopóki liczby nie wychodzą poza ten zakres, należy korzystać z wbudowa-
nych procedur.

Na koniec odwieczne pytanie: Czy możemy znaleźć lepsze zorwiązanie? Okazuje się, że

istnieje szybszy algorytm mnożenia liczb oparty na innym ważnym algorytmie typu „dziel i
zwyciężaj”: szybkiej transformacie Fouriera, o której pomówimy pózniej.

2. Zależności rekurencyjne

Algorytmy „dziel i zwyciężaj” często działają według ogólnego schematu: radzą sobie z proble-
mem o rozmiarze n poprzez rekurencyjne rozwiązywanie a podproblemów o rozmiarze

n /

każdy, a następnie łączenie tych rozwiązań w czasie

)

(

, dla pewnych



(w algo-

rytmie mnożenia



). Ich czas działania może być zatem wyrażony równaniem





)

(

)

(

)

(





. Wyprowadzimy teraz zwarte rozwiązanie tej rekurencji, aby w przy-

szłości nie musieć rozwiązywać jej dla nowych danych.

Twerdzenie o rekurencji universalnej. Jeśli





)

(

)

(

)

(





dla pewnych stałych



oraz



, to



















gdy

log

)

(

log

)

log

(

log

(

)

(

log

To jedno twierdzenie mówi nam o czasach działania większości programów typu „dziel i

zwyciężaj”, z którymi się spotkamy.
Dowód. Aby udowodnić tezę, dla wygody zacznijmy od założenia, że n jest potęga b:



Nie wpłynie to w istotny sposób na ostateczny wynik – w końcu n różni się od pewnej potęgi b
co najwyżej o stały czynnik – pomoże nam to natomiast zignorować zaokrąglanie





n /





















)

(

)

(

)

(

)

(





























)

(

)

(

)

(

)

(

)

(





















)

(

)

(

)

(























)

(

)

(

























)

(

)

(

)

(



Gdy

log



, otrzymujemy



log

, zatem

)

(

)

(

)

(

log













)

log

(

)

log

)

(

)

(

log









Gdy

log



i k zmierza się od 0 do

log

, wartoście w nawiasie tworzą ciąg geometryczny

o ilorazie

/ . Znaczenie sumy k wyrazów tego ciągu może być zapisane jako



Zatem otrzymujemy







































)

(

)

(

)

(









































gdy

log

(

log

(

)

(

)

(

log

3. Mnożenie macierzy

Iloczynem dwóch macierzy



, X oraz Y, jest trzecia macierz





, której element o

współrzędnych

)

( j

jest dany wzorem





Powyższy wzór implikuje algorytm mnożenia macierzy działający w czasie

)

(

; należy obli-

czyć wrtości

n elementów, a każde obliczenie zajmuje czas

)

W 1969 roku niemieecki matematyk Volker Strassen ogłosił znacznie bardziej efektywny

algorytm, oparty na strategii „dziel i zwyciężaj”. Mnożenie macierzy bardzo łatwo można po-
dzielić na podproblemy, ponieważ może być wykonywane blokowo. Aby zobaczyć, co to ozna-
cza, podzielmy X na cztery bloki o rozmiarach



, to samo zróbmy dla Y:





























Wtedy ich iloczyn może być wyrażony za pomocą tych bloków, dokładnie tak, jakby te bloki
bały pojedynczymi elementami:











































Stosujemy teraz strategię „dziel i zwyciężaj”: aby obliczyć iloczyn macierzy XY o roz-

miarze n, rekurencyjnie obliczamy osiem iloczynów AE, BG, CE, DG, AF, H, CF, DH macierzy

o rozmiarze

każda, a następnie wykonujemy kilka dodawań w czasie

)

(

. Całkowity

czas działania jest opisany zależnością rekurencyjną:

)

(

)

(

)

(





To prowadzi do mało imponującego rozwiązania

)

(

, takiego samego wynik jak przy

zwykłym algorytmie. Jednak efektywność może zostać ulepszona i podobnie jak przy mnożeniu
liczb całkowitych, kluczowe będzie sprytne wykorzystanie algebry. Okazuje się, że iloczyn XY
można obliczyć przy użyciu zaledwie siedmiu podproblemów o rozmiarach

























gdzie

)

(





)

)(

(





)

(





)

)(

(







)

(





)

)(

(







)

(





Nowy czas działania wynosi

)

(

)

(

)

(





który na podstawie twierdzenia o rekurencji uniwersalnej okazuje się być równy

)

(

)

(

log



4. Sortowanie przez scalanie (merge sort)

Sortowanie  to  problem  bardzo  często  rozwiązywany  na  komputerach.  Jego  popularność  wiąże
się  z  faktem,  że  łatwiej  jest  korzystać  ze  zbiorów  uporządkowanych  niż  nieuporządkowanych.
Sortowanie  jest  dobrym  przykładem  tego,  że  określone  zadanie  może  być  wykonane  według
wielu różnych algorytmów. Każdy z algorytmów ma pewne zalety i wady, które trzeba przeana-
lizować dla konkretnego zastosowania.

Sortowaniem (ang. sorting) nazywamy proces ustawiania zbioru obiektów w określo-

nym porządku. Sortowanie stosuje się w celu ułatwienia późniejszego wyszukiwania elementów
sortowanego zbioru.

Niech U będzie zbiorem obiektów

,...,

Sortowanie polega na permutowaniu tych obiektów aż do chwili osiągnięcia uporządkowania

,...,

takiego, że dla zadanej funkcji porządkującej f zachodzi

)

(

...

)

(

)

(



Wartość funkcji f nazywa się kluczem obiektu i służy do identyfikacji obiektów.

Zauważmy, że w sformułowanym powyżej problemie sortowania nic nie wiemy o natu-

rze elementów z U. Na U mogą składać się zarówno liczby całkowite lub rzeczywiste, jak i U
może być zbiorem rekordów, które należy posortować według ich kluczy. Przyjmujemy, że ele-
menty ciągu

,...,

znajdują się w tablicy

]

[ n

. Jedynym sposobem ustalenia porządku w

tablicy a jest porównywanie jej elementów parami. Operacja porównania będzie operacją do-
minującą. Ponieważ będziemy chcieli ustalić wynik także w tablicy a, potrzebna nam jest jesz-
cze operacja zamiany dwóch elementów w tablicy. Operacją tą będzie operacja

)

( j

Swap

pole-

gająca na zamianie elementów w tablicy a z pozycji i oraz j,



4.1. Poprawność algorytmu
Zauważmy, że elementy dodatkowe, dopisane do ciągów a i b, nie mogą się znaleźć w ciągu
wynikowym, gdyż pętla jest wykonywana tylko (n+m) razy. Gdyby, w którymś momencie





, tzn. a[i] =





, to przy porównywaniu tego elementu z b[j] dla





, wygra b[j] i

to b[j] zostanie zapisane w ciągu wynikowym. Analogicznie w przypadku, gdy





. Jeśli

zaś oba wskaźniki i, j wskazują element specjalny, to znaczy, że wszystkie poprzednie elementy
już zostały wpisane do tablicy wynikowej, a więc k musi być w tym momencie równe



Warunek pętli "while" nie będzie spełniony i zakończymy wykonywanie algorytmu.

Jest oczywiste, że algorytm zatrzymuje się dla dowolnych danych, gdyż zmienna kontro-

lująca pętlę zmienia się od 1 do n+m. Trzeba jeszcze pokazać, że otrzymany wynik jest ciągiem
uporządkowanym złożonym z elementów danych ciągów.

Przed pierwszym wejściem do pętli "while" jest trywialnie spełniony warunek e[1]



e[2]



...



e[k-1]. Załóżmy, że rozpoczynamy pewną iterację pętli "while" i spełnione są własno-

ści:

e[1]



e[2]



...



e[k-1], i



n+1, j



m+1, k = (i + j -1), k



(n+m+1), (*)

(ciąg e[1],...,e[k-1] jest permutacją ciągu a[1],...,a[i-1],b[1],...,b[j-1] ).

Formuły te mówią, że k-1 elementów w ciągu e tworzy ciąg uporządkowany, a ponadto i-1 ele-
mentów ciągu a oraz j-1 elementów ciągu b zostało już zapisanych na pozycjach od 1 do k-1
ciągu e.

Po wykonaniu instrukcji warunkowej "if (a[i]



b[j])..." , na miejscu k-tym w ciągu e po-

jawi się  mniejszy z elementów a[i], b[j] oraz, albo i, albo j wzrośnie o jeden.  Ponieważ ciągi a i
b są uporządkowane niemalejąco zatem wstawiony element e[k] jest niemniejszy od wszystkich
elementów, które znajdują się na wcześniejszych pozycjach w ciągu e. Mamy więc w tablicy  e
aż k elementów uporządkowanych, oraz   i+j-1 = k+1.

e[1]



...



e[k-1]



e[k], i



n+1, j



m+1, (k+1) = (i + j -1), k



(n+m+1),

(ciąg e[1],...,e[k] jest permutacją elementów ciągu a[1],...,a[i-1],b[1],...,b[j-1] ).

Po wykonaniu instrukcji przypisania "k:=k+1;" ponownie spełnione są własności (*). Wykazali-
śmy tym samym, że jest to niezmiennik pętli. Z twierdzenia o niezmienniku, ta sama formuła jest
spełniona w chwili wyjścia z pętli. Wtedy jednak k = n+m+1 i wszystkie elementy, zarówno cią-
gu a, jak i b, znalazły się już w ciągu e oraz e[1]



...



e[n+m]. Spełniony jest zatem warunek

końcowy specyfikacji.

Twierdzenie. Algorytm Merge jest całkowicie poprawnym rozwiązaniem problemu scalania za
względu na specyfikację,

wp = {a[1]



...



a[n], b[1]



...



b[m], n>0, m>0}

wk = {ciąg e[1],...,e[n+m] jest uporządkowaną niemalejąco permutacją elementów a[1],..., a[n],

b[1],...,b[m] }

w każdej strukturze danych z liniowym porządkiem



4.2. Koszt algorytmu

Ponieważ w pętli "while" wykonujemy w każdej iteracji tylko jedno porównanie, a liczba iteracji
wynosi dokładnie n+m, zatem koszt algorytmu jest liniowy w stosunku do długości ciągów sca-
lanych i wynosi

T(n) = O(n+m).

funkcja mergesort(a[1..n])
// wejście: tablica liczb a[1..n]

// wyjście: tablica wejściwa po posortowaniu
if



then

return merge(mergesort(





[

),mergesort(





[



))

else return a

Poprawność tego algorytmu jest oczywista, o ile tylko określona jest poprawna procedura

merge. Funkcja merge wykonuje taką samą pracę przy każdym wywolaniu rekurencyjnym, a
jej całkowity czas działania to

)

. Zatem procedura scalania jest liniowa, a całkowity czas

potrzebny na wykonanie mergesort to

)

log

(

)

(

)

(

)

(







Spoglądając raz jeszcze na mergesort, możemy zauważyć, że cała właściwa praca po-

lega na scalaniu, które jednak nie może się zacząć, dopoki rekurcja nie zejdzie do tablic jednoe-
lementowych. Takie tablice jednoelementowe są scalane parami, co prowadzi do powstania ta-
blic dwuelementowych. Następnie pary takich tablic dwuelementowych są scalane, tworząc czte-
roelementowe itd.

Takie podejście wskazuje również, w jaki sposób mergesort może być wykonywany

iteracyjne. W każdym momencie dany jest zbiór „aktywnych” tablic – początkowo są to tablice
jednoelementowe – które scalane parami tworzą nowy zestaw aktywnych tablic. Tablice te mogą
być zorganizowane w kolejkę i przetwarzane przez sukcesywne usuwanie dwóch pierwszych
tablic, scalanie ich i umieszczenie otrzymanej tablicy na końcy kolejki.

5. Mediany

Medianą listy liczb nazywamy pięćdziesiąty percentyl listy: połowa liczb jest od niej większa, a
połowa mniejsza. Na przykład medianą

]

[

jest 25, poniewaz jest to środkowy ele-

ment uporządkowanej listy zlożonej z tych samych liczb. Jeśli lista ma parzystą długość, istnieją
dwie możliwe wartości dla elementu środkowego, wtedy, powiedzmy, wybieramy mniejszą z
nich.

Obliczenie mediany z n liczb jest proste: wystarczy je posortować. Wadą jest czas trwa-

nia algorytmu –

)

log

(

, podczas gdy zdecydowanie wolelibyśmy czas liniowy. Nie powinni-

śmy jednak tracić nadziei, ponieważ podczas sortowania wykonujemy znacznie więcej pracy niż
w rzeczywistości potrzebujemy – chcemy tylko znaleźć środkowy element i nie interesuje nas
właściwe uporządkowanie pozostalych.

Szukając rozwiązania rekurencyjnego, często paradoksalnie łatwiej jet pracować z ogól-

niejszą wersją problemu – z tego prostego powodu, że możemy się oprzeć na silniejszej rekursji.
W naszym przypadku rozważanym uogólnieniem będzie selekcja.

Selekcja.
Wejście: lista liczb S; liczba naturalna k,
Wyjście: k-ty najmniejszy element S.

Na przykład, jeśli



, szukane jest minimum S, natomiast jeśli





| S



, to szu-

kamy mediany.

5.1. Randomizowany algorytm „dziel i zwyciężaj” dla selekcji
Oto podejście „dziel i zwyciężaj” do problemu selekcji. Dla dowolnej liczby v wyobraźmy sobie
podzielenie listy S na trzy kategorie elementów: elementy mniejsze od v, równe v (elementy mo-
gą się powtarać) oraz większe od v. Nazwijmy je odpowiednio

S ,

S . Na przykład, jeśli

tablica

S :

21 8 13

jest podzielona dla



, trzy wygenerowane podtablice wyglądają następująco:

5 S

Przeszukiwanie może być natychmiast zawężone do jednej z tych podlist. Jeśli chcemy

znaleźć, powiedzmy, ósmy najmniejszy element S, wiemy, że będzie to trzeci najmniejszy ele-
ment

S , ponieważ





. Czyli selection(S,8) = selection(

S ,3). Ogólnie rzecz bio-

rąc, porównując k z rozmiarem podtablic, możemy szybko stwierdzić, która z nich zawiera po-
szukiwany element:



























(

)

(

)

(

gdy

selection

gdy

selection

Trzy podlisty

S ,

S można uzyskać z S w czasie liniowym; w rzeczywistości takie

obliczenie może być nawet wykonane bez przydzielania dodatkowej pamięci. Następnie wyko-
nuje się obliczania rekurencyjnie na właściwej liście. Wynikiem podziału tablicy jest zatem
zmniejszenie liczby elementów z

| S do co najwyżej

max{|

Nasz algorytm „dziel i zwyciężaj” dla selekcji jest teraz w pełni opisany, z wyjątkiem

kluczowego szczegółu, jakim jest wybór v. Wartość v musi być wybrana szybko i powinna być

taka, by tablica została istotnie zmniejszona, sytuacja jest idealna dla



. Gdyby-

śmy potrafili zawsze zagwarantować taką sytuację, dostalibyśmy czas działania

)

(

)

(

)

(





który zgodnie z naszym życzeniem jest liniowy. To jednak wymaga wybrania na v mediany, co
przecież jest naszym ostatecznym celem. Zamiast tego posłużymy się znacznie prostszym roz-
wiązaniem: wybieramy v z S losowo.

5.2. Analiza efektywności

Oczywiście czas działania naszego algorytmu zależy od losowych wyborów v. Może się zdarzyć,
że każdy wybór będzie pechowy i wartością v będzie największy (lub najmniejszy) element ta-
blicy, a zatem tableca będzie się zmniejszać w każdym kroku tylko o jeden element. We wcze-
śniejszym przykładzie mogliśmy najpierw wybrać



, następnie



itd. Ten czarny sce-

nariusz zmusiłby nasz algorytm selekcji do wykonania

)

(

...

)

(

)

(















operacji (podczas obliczania mediany), niemniej takie zdarzenie jest wyjątkowo mało prawdo-
podobne. Równie mało prawdopodobny jest najlepszy przypadek przedyskutowany wcześniej, w
którym każde losowo wybrane v okazuje się rozdzielać tablicę idealnie na pół, skutkując czasem
działania

)

. Gdzie, w przedziale od

)

(



, znajduje się średni czas działania? Na

szczęście znajduje się on bardzo blisko czasu działania w najlepszym przypadku.

Aby rozróżnic szczęsliwe wybory v od nieszczęśliwych, powiemy, że v jest dobre, jeśli

znajduje się pomiędzy 25 a 75 percentylem tablicy, z której jest wybierany. Takie wybory v się
nam podobają, ponieważ gwarantują, że podlisty

S oraz

S mają rozmiar równy co najwyżej

trzy czwarte S, a zatem tablica znacznie się zmniejsza. Na szczęście dobre wartości v są liczne:
połowa elementów dowolnej listy musi leżeć między 25 a 75 percentylem.

Zatem średnio po dwóch operacjach podziału tablica zmniejszy się do co najwyżej trzech

czwartych swego wyjściowego rozmiaru. Oznaczając przez

)

oczekiwany czas działania dla

tablicy o rozmiarze n, dostajemy

)

(

)

(

)

(





Na podstawie tej rekurencji wnioskujemy, że

)

(

)

(



: dla dowolnych danych wejściowych

nasz algorytm zwraca poprawną odpowiedź po – średnio – liniowej liczbie kroków.

6. Szybka transformata Fouriera

Widzieliśmy do tej pory, w jaki sposób stosując strategię „dziel i zwyciężaj”, można uzyskać
szybkie algorytmy mnożenia liczb całkowitych i macierzy. Naszym kolejnym celem są wielo-
miany. Iloczynem dwóch wielomianów stopnia n jest wielomian stopnia 2n, na przykład

)

(

)

(











Ogólniej, jeśli





...

)

(

oraz





...

)

(

, to ich iloczyn

...

)

(

)

(

)

(









ma współczynniki













...

(dla



bierzemy

a oraz

b równe zero). Obliczenie

c na podstawie tego wzoru wymaga

)

kroków, a znalezenie wszystkich



współczynników wydaje się wymagać czasu

)

(



. Czy możemy szybciej mnożyć wielomiany?

Rozwiązanie, którym będziemy się teraz zajmować, szybka transformata Fouriera, zre-

wolucjonizowalo – a właściwe stworzyło – dziedzinę przetwarzania sygnalów. Z uwagi na
ogromne znaczenie i bogactwo zastosowań w różnych dziedzinach badawczych, podejdziemy do
tego zagadnienia nieco dokładniejniż zazwyczaj.

6.1. Alternatywne reprezentacje wielomianów

Reprezentacja przez współczynniki wielomianu





)

(

stopnia n to wektor współczyn-

ników

)

,...,

(



. Reprezentacja za pomocą współczynników jest dogodna przy niektó-

rych operacjach na wielomianach. Na przykład operacja ewaluacji wielomianu

)

w danym

punkcie

x polega na obliczeniu wartości

)

(

. Ewaluacje można wykonać w czasie

)



korzystając t tzw. schematu Hornera:

))...))

(

...

(

)

(







Podobnie, dodawanie dwóch wielomianów reprezentowanych przez wektory współczynników

)

,...,

(



)

,...,

(



zajmuje czas

)



: wynik stanowi wektor

)

,...,

(



gdzie





dla

,...,



Reprezentacja przez wartości w punktach wielomianu

)

stopnia n to zbiór par

punkt-wartość

)}

(

...,

(

{(

taki, że wszystkie

x są parami różne oraz

)

(



dla

,...,



. Wielomian może mieć

wiele różnych reprezentacji przez wartości w punktach, ponieważ jako podstawy tej reprezenta-
cji można użyć dowolnego zbioru



różnych punktów

x ,

x , ...,

x .

Obliczanie omawianej reprezentacji dla wielomianu danego w reprezentacji przez współ-

czynniki jest proste, poniaważ wystarczy w tym celu wybrać



różnych punktów

x ,

x , ...,

, a następnie obliczyć

)

(

dla

,...,



. Korzystając z metody Hornera, można zrobić

to w czasie

)

(



. Jak się później przekonamy, odpowiednio dobierając

, możemy zreduko-

wać czas obliczeń do

)

log

(



Zadanie odwrotne do ewaluacji – wyznaczanie współczynników wielomianu na podsta-

wie reprezentacji przez wartości w punktach – nosi nazwę interpolacji.

Twierdzenie. Dla dowolnego zbioru

)}

(

...,

(

{(

złożonego z



par punkt-

wartość istnieje dokładnie jeden wielomian

)

stopnia n taki, że

)

(



dla

,...,



Dowód. Dowód opiera się na istnieniu odwrotności pewnej macierzy. Równanie

)

(



jest

równoważnie z równaniem macierzowym





























































(1)

Macierz po lewej stronie oznaczamy jako

)

,...,

(

i nazywamy macierzą Vandermonde’a.

Wyznacznikiem tej macierzy jest











)

(

Zatem jeśli

x są różne, to jest ona odwracalna (to znaczy nieosobliwa). Współczynniki

można więc wyznaczyć jednoznacznie na podstawie reprezentacji przez wartości w punktach:

)

,...,

(





Dowód twierdzenia opisuje algorytm interpolacji polegający na rozwiązaniu układu (1)

równań liniowych. Korzystając z metody eleminacji Gaussa, ten układ możemy rozwiązać w
czasie

)

(

. Szybszy algorytm interpolacji w punktach opiera się na wzorze Lagrange’a:













)

(

)

(

)

(

(2)

Oczywiście prawa strona równania (2) jest wielomianem stopnia n, spełniającym równanie



)

(

dla każdego k.

Reprezentacje wielomianów za pomocą współczynników i wartości w punktach są w

pewnym sensie równoważne; to znaczy, wielomian representowany przez wartości w punktach
ma swój wyznaczony jednoznacznie odpowiednik w reprezentacji przez współczynniki. Tak
więc ewaluacja i interpolacja w



punktach są dobrze zdefiniowanymi, wzajemnie odwrot-

nymi operacjami, realizującymi przejście między reprezentacją wielomianu przez współczynniki
a reprezentacją przez wartości w punktach. Opisane powyżej algorytmy dla tych problemów
działają w czasie

)

(



Reprezentacja przez wartości w punktach jest dość wygodna do użycia przy wielu opera-

cjach na wielomianach. W dodawaniu, jeśli

)

(

)

(

)

(





, to

)

(

)

(

)

(





każdym punkcie

. Czas dodawania dwóch wielomianów stopnia n, zadanych przez wartości w

punktach, wynośi zatem

)



Reprezentacja przez wartości w punktach jest równie dogodna do mnożenia wielomia-

nów. Jeśli

)

(

)

(

)

(





, to

)

(

)

(

)

(



w każdym punkcie

, więc w celu

otrzymania reprezentacji przez wartości w punktach wielomianu C możemy w każdym punkcie z
osobna przemnożyć wartość wielomianu A przez wartość wielomianu B. Ponieważ jednak sto-
pień wielomianu C jest równy 2n, do reprezentowania C potrzebujemy 2n par punkt-wartość.

Musimy zatem wyjść od „rozszerzonych” reprezentacji przez wartości w punktach dla  A i B, z
których każda będzie się składać z 2n par punkt-wartość. Widać stąd, że dla dwóch wejściowych
wielomianów  w  rozszerzonej  reprezentacji  przez  wartości  w  punktach  czas  potrzebny  na  obli-
czanie  reprezentacji  przez  wartości  w  punktach  ich  iloczynu  wynosi

)



, a więc znacznie

mniej niż w przypadku reprezentacji przez wspołczynniki.

Rozważmy na koniec problem ewaluacji w nowym punkcie wielomianu zadanego przez

wartości w punktach. Nie widać tu żadnego prostszego sposobu niż przekształcenie wielomianu
do reprezentacji przez współczynniki, a następnie obliczenie jego wartości w nowym punkcie.

6.2. Szybkie mnożenie wielomianów reprezentowanych przez współczynniki

Czy możemy skorzystać a działającej w czasie liniowym metody mnożenia wielomianów repre-
zentowanych przez wartości w punktach, żeby przyspieszyć mnożenie wielomianów w reprezen-
tacji przez współczynniki? Odpowiedź na to pytanie zależy od tego, czy umiemy szybko wyko-
nywać przekształcenie wielomianu z reprezentacji przez współczynniki do reprezentacji przez
wartości w punktach (ewaluacja) i na odwrót (interpolacja).

Do obliczania wartości możemy użyć zupełnie dowolnych punktów, ale jeśli wybierzemy

je odpowiednio, będziemy mogli dokonywać konwersji między obiema reprezentacjami w czasie

)

log

(



. Strategię tę ilustruje rysunek poniżej.

Należy jeszcze poruszyć drobną kwestię związaną z ograniczeniami stopni wielomianów.

Iloczyn dwóch wielomianów stopnia



jest wielomianem stopnia

)

(



. Przed zmianą re-

prezentacji wejściowych wielomianów A i B podwajamy zatem najpierw ich stopni do wartości

)

(



, dodając n zerowych współczynników przy najwyższych potęgach. Ponieważ wektory

mają po 2n elementów, korzystamy z „zespolonych pierwiastków stopnia 2n z jedności”, ozna-
czonych na rysunku symbolami



Poniższa, korzystająca z FFT procedura mnoży dwa wielomiany

)

stopnia n

w czasie

)

log

(



, przy czym wielomiany wejściowe i wyjściowy są reprezentowane przez

współczynniki. Zakładamy, że n jest potęga dwójki; warunku tego można zawsze dotrzymać,
dostawiając zerowe współczynniki przy najwyższych potęgach x.

1. Podwojenie stopnia wielomianów: Rozszerz reprezentacje przez współczynniki wielo-

mianów

)

do wartości stopnia 2n, dodając do każdej po n zerowych współczynników

przy najwyższych potęgach.

2. Ewaluacja: Oblicz reprezentacje przez wartości w punktach dla wielomianów

)

, stosując dwukrotnie FFT rzędu 2n. Reprezentacje te składają się z wartości wielomianów

dla pierwiastków stopnia 2n z jedności.

3. Mnożenie po współrzędnych: Oblicz reprezentację przez wartości w punktach wielo-

mianu

)

(

)

(

)

(



, wymnażając odpowiadające sobie wartości. Reprezentacja ta składa się

z wartości C(x) we wszystkich pierwiastkach stopnia 2n z jedności.

4. Interpolacja: Utwórz reprezentację przez współczynniki wielomianu C(x), stosując

jednokrotnie FFT do wektora 2n wartości w celu oblicznia odwrotnej DFT.

Kroki 1 i 3 realizuje się w czasie

)



, a 2 i 4 w czasie

)

log

(



. Jeśli więc pokażemy,

jak wykonywać FFT, udowodnimy następujące twierdzenie.

Twierdzenie. Iloczyn dwóch wielomianów stopnia n można obliczyć w czasie

)

log

(



, przy

czym wielomiany wejściowe i wyjściowy są reprezentowane przez współczynniki.

6.3. Zespolone pierwiastki z jedności

Zespolony pierwiastek n-tego stopnia z jedności to liczba zespolona



taka, że





. Istnieje

dokladnie n zespolonych pierwiastków n-tego stopnia z jedności; są to liczby



dla

,...,





. Na rysunku poniżej widać, że n zespolonych pierwiastków z jedności jest roz-

mieszczonych w równych odstępach na okręgu o promieniu jednostkowym i środku w początku
układu współrzędnych na plaszczyznie zespolonej. Wartość









Nazywamy glównym pierwiastkiem n-tego stopnia z jedności; wszystkie pozostałe zespolone
pierwiastki n-tego stopnia z jedności są potęgami



Podstawowe własności zespolonych pierwiastków n-tego stopnia z jedności opisują po-

niższe lematy.

Lemat 1. (Lemat o skracaniu) Dla dowolnych liczb całkowitych





zachodzi





Lemat 2. (Lemat o redukcji) Jeśli



jest parzyste, to zbiór kwadratów n zespolonych pier-

wiastków n-tego stopnia z jedności to zarazem

zespolonych pierwiastków stopnia

jedności.

Lemat 3. (Lemat o sumowaniu) Dla dowolnej liczby całkowitej



i dowolnej nieujemnej

liczby całkowitej k niepodzielnej przez n zachodzi

)

(











6.4. Dyskretna transformata Fouriera (DFT)

Przypominamy, że chcemy dokonać ewaluacji wielomianu







)

(

stopnia n w punktach



1
n



, ...,





(to znaczy w n zespolonych pierwiastkach n-tego

stopnia  z  jedności).  Bez  straty  ogólności  możemy  zalożyć,  że  n  jest  potęga  2,  ponieważ  dane
ograniczenie  stopnia  można  zawsze  powiększyć  –  zawsze  możemy  w  miarę  potrzeb  dodawać
zerowe  współczynniki  przy  najwyższych  potęgach.  Zakładamy,  że  wielomian  A  jest  zadany
przez współczynniki:

)

,...,

(





. Zdefiniujmy wartości

y dla

,...,





wzorem







)

(



Wektor

)

,...,

(





jest dyskretną transformatą Fouriera (DFT) wektora współczyn-

ników

)

,...,

(





. Piszemy także

)

DFT



6.5. Szybkie przekształcenie Fouriera (FFT)

Stosując metodę znaną jako szybkie przekształcenie Fouriera, korzystającą ze szczególnych wła-
sności zespolonych pierwiastków z jedności, możemy obliczyć

)

DFT

w czasie

)

log

(



chociaż zwykła metoda wymaga czasu

)

(



Metoda FFT opiera się na strategii „dziel i zwyciężaj”, wyodrębniając współczynniki o

parzystych i nieparzystych indeksach i definiując dwa nowe wielomiany stopnia

, oznaczane

jako

)

...

)

(







...

)

(







Wielomian

)

zawiera wszystkie współczynniki o parzystych indeksach w A (binarna repre-

zentacja indeksu kończy się zerem), a wielomian

)

zawiera wszystkie współczynniki o nie-

parzystych indeksach (binarna reprezentacja indeksu kończy się jedynką). Wynika stąd, że

)

(

)

(

)

(





zatem problem ewaluacji A(x) w punktach



1
n



, ...,





sprowadza się do:

i) ewaluacji wielomianów

)

stopnia

w punktach

 



 

1
n



 



, ...,

 





a następnie
ii) połączenia wyników zgodnie ze wzorem

)

(

)

(

)

(





Na mocy lematu o redukcji, lista

 



 

1
n



 



, ...,

 





sklada się nie z n róż-

nych wartości, ale tylko z

zespolonych pierwiastków stopnia

z jedności, z których

każdy występuje dokładnie dwa razy. Dokonujemy zatem rekurencyjnie ewaluacji wielomianów

)

stopnia

we wszystkich

zespolonych pierwiastkach stopnia

z jed-

ności. Obudwa podproblemy są dokładnie tej samej postaci co problem pierwotny, ale dwukrot-

nie mniejszego rozmiaru. Udało nam się podzielić obliczenie n-elementowego

DFT na dwa ob-

liczenia

-elementowego

DFT

. Podział ten jest podstawą poniższego rekurencyjnego al-

gorytmu FFT, obliczającego DFT dla n-elementowego wektora

)

,...,

(





, gdzie n jest

potęga dwójki.

RECURSIVE-FFT(a)

n := length(a) // n jest potęga 2

if n = 1

then return a

)

exp(









)

,...,

(





)

,...,

(





y0 := RECURSIVE-FFT(a0)

y1 := RECURSIVE-FFT(a1)

for k := 0 to











)

(















return y od // y jest wektorem kolumnowym

Procedura RECURSIVE-FFT działa następująco. Wiersze 2-3 odpowiadają największemu za-
głębieniu rekursji; wartość DFT pojedynczego elementu jest równa jemu samemu, bo wówczas









W wierszach 6-7 są definiowane wektory współczynników wielomianów

)

. Wier-

sze 4, 5 i 13 zapewniają poprawną aktualizację wartości



, dzięki czemu przy każdym wyko-

nywaniu instrukcji w wierszach 11-12 mamy





. (Aktualizacja wartości



zamiast obli-

czania



od początku w każdym przebiegu pętli for pozwala zaoszczędzić na czasie). W wier-

szach 8-9 obliczamy rekurencyjnie

DFT

, kładąc dla

,...,





)

(





)

(





lub

)

(





)

(





(ponieważ





na mocy lematu o skracaniu).

W wierszach 11-12 są lączone wyniki rekurencyjnych obliczeń

DFT

. Dla

y ,

y , ...,



w wierszu 11 obliczamy

)

(

)

(

)

(















gdzie ostatnia równość wynika ze wzoru

)

(

)

(

)

(





. Dla



, ...,



przyjmując

,...,





, w wierszu 12 obliczmy





















)

(

)

(

)

(

)

(

)

(



)

(

)

(

)

(

)

(

)

(











Druga równość wynika z pierwszej, ponieważ









)

(

. Czwarta równość wynika z trze-

ciej, bo z tego, że





, wynika, że







. Ostatnia równość wynika ze wzoru

)

(

)

(

)

(





. Wektor y obliczany przez procedurę RECURSIVE-FFT jest zatem

rzeczywiście dyskretną transformatą Fouriera (DFR) wejściowego wektora a.

W celu oszacowania czasu działania procedury RECURSIVE-FFT zauważmy, że poza

wywołaniami rekurencyjnymi wykonanie procedury zajmuje czas

)



, gdzie n jest długościa

wejściowego wektora. Równanie rekurencyjne na złożoność czasową wygląda następująco:

)

log

(

)

(

)

(

)

(











Korzystając z szybkiego przekształcenia Fouriera, możemy zatem dokonywać ewaluacji wielo-
mianu stopnia n w zespolonych pierwiastkach n-tego stopnia z jedności w czasie

)

log

(



6.6. Interpolacja w zespolonych pierwiastkach z jedności

Dla przejścia od reprezentacji wielomianu przez wartości w punktach z powrotem do reprezenta-
cji przez współczynniki musimy obliczyć interpolację w zespolonych pierwiastkach z jedności.
Wzór na interpolację wyprowadzamy zapisując DFT jako równanie macierzowe, a następnie
analizyjąc postać macierzy odwrotnej.

Obliczenie DFT możemy przedstawić jako mnożenie macierzy





, gdzie

V jest

macierzą Vandermonde’a zawierającą odpowiednie potęgi



;











































)

)(

(

)

(

)

(

)

(

)

(

















Element na pozycji

)

(

w macierzy

V to



dla

,...,





, ich wykładniki tworzą

więc tabliczkę mnożenia.

Operację odwrotną, którą zapisujemy jako

)

(

DFT





, wykonujemy, mnożąć y przez



(macierz odwrotną do

V ).

Twierdzenie. Dla

,...,





elementem na pozycji

)

( k

w macierzy



jest





Znając postać macierzy odwrotnej



, wiemy, że

)

(

DFT



zadane jest wzorem



























exp





dla

,...,





. Widzimy, że transformatę odwrotną do DFT można obliczyć za pomocą

modyfikacji algorytmu FFT, polegającej na zamianie rolami wektorów a i y, zastępieniu



przez





i podzieleniu wartości każdej współrzędnej wyniku przez n. A więc

)

(

DFT



można

obliczyć również w czasie

)

log

(



Korzystając z FFT i odwrotnego przekształcenia FFT, możemy zatem dla danego wielo-

mianu stopnia n przechodzić od reprezentacji przez współczynniki do reprezentacji przez warto-

ści w punktach i z powrotem w czasie

)

log

(



. W kontekście mnożenia wielomianów udo-

wodniliśmy następujące twierdzenie:

Twierdzenie o splocie. Dla dowolnej pary wektorów a i b długości n, gdzie n jest potęgą

dwójki, mamy





)

(

)

(

DFT









gdzie wektory a i b są uzupełnone zerami do długości 2n, a „



” oznacza mnożenie po współrzęd-

nych dwóch 2n-elementowych wektorów.

6.7. Iteracyjna wersja algorytmu FFT

Przedstawimy teraz wersję iteracyjną algorytmu FFT, korzystającą z pomocniczej procedury
BIT-REVERSE-COPY(a, A) w celu skopiowania elementów wektora a do tablicy A w odpo-
wiednim porządku.

ITERATIVE-FFT(a)

BIT-REVERSE-COPY(a, A)

n := length(a) // n jest potęga 2

for s := 1 to log n do



)

exp(









for j := 0 to m/2-1 do

for k := j to n-1 step m do

]

[









]

[







]

[







]

[







od od

return A

BIT-REVERSE-COPY(a, A)

n := length(a)

for k := 0 to n - 1 do

rev



)]

(

[

W jaki sposób procedura BIT-REVERSE-COPY(a, A) wstawia elementy wejściowego wektora
a na właściwe miejsca w tablicy A? Funkcja

)

rev

: dla binarnej reprezentacji liczby k oblicza

się odwrotna kolejność bitów i znajduje odpowiedną liczbę w systemu dziesiątnym.