Microsoft Word - 10-06-Szybkie sumatory.doc

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–1

Szybko dodawania (odejmowania)

−2

1–m

2–m

1–m

−1

FA/FS

–m

1–m

–m

−2

FA/FS

Schemat dodawania / odejmowania wielopozycyjnego

Propagacja przeniesienia

•

wykonanie działania na pozycji i wymaga przeniesienia z pozycji i

−

•

czas wytworzenia sumy (ró nicy) – stały od chwili ustalenia przeniesienia

•

gwarantowany czas wykonania dodawania lub odejmowania zale y od

najdłu szego czasu przesłania zmiany przeniesienia z pozycji najni szej

Czas dodawania n-pozycyjnego (czas dodawania jednopozycyjnego T = 2)

2 log

n

≤

2 n

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–3

Sumator z antycypacj przeniesie (carry look-ahead adder, CLA)

Funkcja przeniesienia

)

(

)

(

⊕

•

w obliczaniu przeniesienia funkcje OR (x

+ y

) i XOR (x

⊕

) s zamienne

•

funkcja wytwarzania (generowania) przeniesienia

⇒ przeniesienie wyj ciowe

•

funkcja półsumy

⊕

precyzyjnie okre la warunek przekazywania (propagacji) przeniesienia:

≠

⇒

, ale funkcja OR jest prostsza, wi c przyjmuje si

•

funkcja przekazywania (propagacji) przeniesienia (

p – f. wygaszania)

•

w wyra eniach na przeniesienie funkcje p

mo na zast pi funkcjami h

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–4

Funkcje przeniesie w sumatorach CLA

Funkcje c

mo na rozwija wzgl dem kilku kolejnych pozycji

•

zło ono funkcji c

ro nie z kwadratem zasi gu s

•

bariera technologiczna – ograniczona liczba wej bramki

)

(

...

)

(

−

)

,...,

(

)

,...,

(

)

,...,

(

)

,...,

(

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–5

Moduł sumatora z antycypacj przeniesie (CLA)

i+4

i+3

i+2

i+1

i+3

i+2

i+1

i+3

i+2

i+1

CLA

i+4

i+3

i+2

i+1

Czterobitowy sumator CLA

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–6

Ła cuch sumatorów z antycypacj przeniesie (CLA)

15:12

11:8

7:4

3:0

CLA

Sumator zbudowany z kaskady bloków CLA

G,P

15:12

11:8

7:4

3:0

CLA

CLG

Sumator CLA z blokiem wytwarzania przeniesie CLG

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–7

Propagacja i generowanie przeniesie – intuicje (1)

out

=1 je li:

•

=1 jest przesyłane przez blok AB do wyj cia c

out

•

wewn trz bloku AB jest wytwarzane c

out

=1, za c

jest dowolne

out

=1 je li:

•

=1 jest przesyłane przez blok B do c

a nast pnie przez blok A do c

out

•

wewn trz bloku A jest wytwarzane c

out

=1, za c

jest dowolne

•

wewn trz bloku B jest wytwarzane c

=1,

a nast pnie przez blok A jest przekazywane do c

out

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–8

Propagacja i generowanie przeniesie – intuicje (2)

out

DCBA

out

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–9

Funkcje grupowej antycypacji przeniesie

Wyznaczanie funkcji

przekazywania (propagacji) przeniesienia P

przez bloki sumatora (iloczyn) jest działaniem ł cznym (asocjacyjnym)

)

(

)

(

CBA

Wyznaczanie funkcji wytwarzania (generowania) przeniesienia G

w bloku sumatora jest tak e działaniem ł cznym (asocjacyjnym)

CBA

)

(

)

(

Funkcje rekursywnie skojarzone – takie, które opisuje operator asocjacyjny

•

= x

•

i–1

, y

= x

Wyznaczanie funkcji rekursywnie skojarzonej – problem prefiksowania

Funkcje G,P s rekursywnie skojarzone przez wektorowy operator asocjacyjny

)

(

)

(

)

(

)

(

•

)

(

)

(

)

(

)

(

CBA

•

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–10

Funkcje wytwarzania przeniesie i sum

Dla dowolnego bloku sumatora pomi dzy pozycjami i oraz k (k

≥

i ):

przy tym

Poniewa

(lub

⊕

), wi c

∏

−

...

∏

Je li c

= 0, to warto sumy s

zale y tylko od warto ci funkcji G

0,i

−

oraz h

−

⊕

– schemat wyznaczania funkcji G

0,i

i P

0,i

mo na optymalizowa

– wszystkie funkcje G

0,i

i P

0,i

mo na wyznaczy w sekwencji log

n działa

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–12

Sumator uniwersalny (1)

Je li c

nie jest ustalone to

)

(

−

⊕

Aby unikn

wielokrotnego rozgał zienia sygnału c

w strukturze prefiksowej

mo na uzupełni sumator o blok wej ciowy CSA, redukuj c w ten sposób jeden
sygnał na pozycji najmniej znacz cej.

–

sumator PPA

Wnoszone opó nienie w kategoriach AT jest takie samo jak w realizacji funkcji
G

0,i–1

, ale nie wyst puje problem rozgał zienia sygnału c

(faktycznie

XOR

< T

AND-OR

Podobne rozwi zanie mo na zastosowa w uniwersalnym sumatorze U2.

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–13

Sumator uniwersalny (2)

Je li c

nie jest ustalone to

)

(

−

⊕

Aby unikn

konieczno ci korekcji c

w sytuacji gdy c

nie jest znane z góry,

mo na potraktowa c

jako funkcj generowania przeniesienia z pozycji „–1”,

–1

= c

, gdy jednocze nie p

–1

= 0, i wtedy wszystkie funkcje P

–1,i

= 0 oraz:

)

(

[

−

⊕

]

wi c sumy trzeba oblicza jako:

)

(

−

⊕

To oznacza, e graf prefiksowy musi obejmowa n+1 pozycji. W szczególno ci:

−

To rozwi zanie jest szybsze ni poprzednie, a problemem jest szybka realizacja
(3 poziomy logiczne) funkcji:

−

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–15

Przekształcenie prefiksowe Ladnera-Fischera (Sklansky) dla funkcji G,P

Poziom 0 (i = 0, 1, … , n

−

0,0

i,i

= x

⊕

, G

i,i

= x

Poziom 1 (i = 0, 1, … , 2

−

0,1

2i,2i+1

, P

2i,2i+1

) = ( G

2i+1,2i+1

, P

2i+1,2i+1

)

2i,2i

, P

2i,2i

)

Poziom 2 (i = 0, 1, … , 2

−

1; s = 2, 3)

0,3

, G

0,2

4i,4i+s

, P

4i,4i+s

) = ( G

4i+2,4i+s

, P

4i+2,4i+s

)

( G

4i,4i+1

, P

4i,4i+1

)

Poziom 3 (i = 0, 1, … , 2

−

1; s = 4, 5, 6, 7)

0,7

, …, G

0,4

8i,8i+s

, P

8i,8i+s

) = ( G

8i+4,8i+s

, P

8i+4,8i+s

)

( G

8i,8i+3

, P

8i,8i+3

)

Poziom 4 (i = 0, 1, … , 2

−

1; s = 8, 9, …, 15)

0,15

, …, G

0,8

16i,16i+s

, P

16i,16i+s

) = ( G

16i+8,16i+s

, P

16i+8,16i+s

)

( G

16i,16i+7

)

…

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–16

Przekształcenie prefiksowe Kogge-Stone’a dla funkcji G,P

Poziom 0 (i = 0, 1, … , n

−

0,0

i,i

= x

⊕

, G

i,i

= x

Poziom 1 (i = 0, 1, … , 2

−

0,1

i,i+1

, P

i,i+1

) = ( G

i+1,i+1

, P

i+1,i+1

)

i,i

, P

i,i

)

Poziom 2 (s = 0, 1; i = 0, 1, … , n

−

)

0,s+2

= G

s+1,s+2

+ P

s+1,s+2

0,s

( G

0,3

) , G

0,2

i,i+3

, P

i,i+3

) = ( G

i+2,i+3

, P

i+2,i+3

)

i,i+1

, P

i,i+1

)

0,3

Poziom 3 (s = 0, 1, …, 2

−

1; i = 0, 1, … , n

−

)

0,s+4

= G

s+1,s+4

+ P

s+1,s+4

0,s

0,7

) , G

0,6

, G

0,5

, G

0,4

i,i+7

, P

i,i+7

) = ( G

i+4,i+7

, P

i+4,i+7

)

i,i+3

, P

i,i+3

)

0,7

Poziom 4 (s = 0, 1, …, 2

−

1; i = 0, 1, … , n

−

)

0,s+8

= G

s+1,s+8

+ P

s+1,s+8

0,s

0,15

) , … …, G

0,8

i,i+15

, P

i,i+15

) = ( G

i+8,i+15

, P

i+8,i+15

)

i,i+7

, P

i,i+7

)

0,15

…

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–17

Przekształcenie prefiksowe Brenta-Kunga dla funkcji G,P

Poziom 0 (i = 0, 1, … , n

−

0,0

i,i

= x

⊕

, G

i,i

= x

Poziom 1 (i = 0, 1, … , 2

−

0,1

2i,2i+1

, P

2i,2i+1

) = ( G

2i+1,2i+1

, P

2i+1,2i+1

)

2i,2i

, P

2i,2i

)

Poziom 2 (i = 0, 1, … , 2

−

0,3

4i,4i+3

, P

4i,4i+3

) = ( G

4i+2,4i+3

, P

4i+2,4i+3

)

4i,4i+1

, P

4i,4i+1

)

Poziom 3 (i = 0, 1, … , 2

−

0,7

8i,8i+7

, P

8i,8i+7

) = ( G

8i+4,8i+7

, P

8i+4,8i+7

)

8i,8i+3

, P

8i,8i+3

)

…

Poziom m = log

n (T = 2

−

)

0,3T

−

, P

0,3T

−

) = ( G

2T,3T

−

, P

2T,3T

−

)

0,2T

−

, P

0,2T

−

)

0,3T

0,n

−

, P

0,n

−

) = ( G

2T,n

−

, P

2T,n

−

)

0,2T

−

, P

0,2T

−

)

0,n

−

…
Poziom m+r (i = (0), 1, … , 2

−

1, R = 2

−

), r = 1, … , m

−

0,iR

−

, P

0,iR

−

) = ( G

2R,iR

−

, P

2R,iR

−

)

0,2R

−

, P

0,2R

−

)

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–18

Przekształcenie prefiksowe Han’a-Carlson’a dla funkcji G,P

Poziom 0 (i = 0, 1, … , n

−

0,0

i,i

= x

⊕

, G

i,i

= x

Poziom 1 (i = 0, 1, … , 2

−

0,1

2i,2i+1

, P

2i,2i+1

) = ( G

2i+1,2i+1

, P

2i+1,2i+1

)

2i,2i

, P

2i,2i

)

Poziom 2 (i = 0, 1, … , 2

−

−1

)

0,3

2i,2i+3

, P

2i,2i+3

) = ( G

2i+2,2i+3

, P

2i+2,2i+3

)

2i,2i+1

, P

2i,2i+1

)

Poziom 3 (s = 0, 1; i = 0, 1, … , 2

−

2i,2i+7

, P

2i,2i+7

) = ( G

2i+4,2i+7

, P

2i+4,2i+7

)

2i,2i+3

, P

2i,2i+3

)

0,2s+5

= G

2s+1,2s+5

+ P

2s+1,2s+5

0,2s

0,7

, G

0,5

Poziom 4 (s = 0, 1, …, 2

−

1; i = 0, 1, … , 2

−

2i,2i+15

, P

2i,2i+15

) = ( G

2i+8,2i+15

, P

2i+8,2i+15

)

2i,2i+7

, P

2i,2i+7

)

0,2s+9

= G

2s+1,2s+9

+ P

2s+1,2s+8

0,2s

0,15

, G

0,13

, G

0,11

, G

0,9

...
Poziom log

n+1 (i = 0, 1, … , 2

−

0,2i

= G

2i,2i

+ P

2i,2i

0,2i

−

0,2i

, … , G

0,4

, G

0,2

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–19

Prefiksowe schematy generowania i propagacji przeniesienia (PPA)

15 14 13 12 11 10

Graf prefixowy (Sklansky / Ladner-Fischer)

15 14 13 12 11 10

Graf prefixowy (Kogge & Stone)

15 14 13 12 11 10

Graf prefixowy (Brent–Kung)

15 14 13 12 11 10

Graf prefixowy – (Han & Carlson)

– wytwarzanie funkcji G

i,i

= g

oraz P

i,i

= p

– przekazywanie G oraz P

– operator prefiksowy (G

) = (G

)

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–20

Charakterystyki grafów prefiksowych

Ladner-Fischer – log

n poziomów logicznych, minimum elementów GP

nierównomierne obci

enia (Sklansky)

Kogge & Stone – log

n poziomów logicznych, wi cej elementów GP,

rozło ona obci

alno wyj

Brent-Kung

– >log

n poziomów logicznych, mniej elementów GP,

stała obci

alno wyj

Han & Carlson – >log

n poziomów logicznych, najmniej elementów GP,

najmniejsza obci

alno wyj

Parametry sieci GP jako elementy PPA

Typ struktury

liczba ogniw GP liczba poziomów obci

enie

przeł czenia

RCA

n – 1

n /2

Ladner-Fischer

½ n log

log

n /2

¼ n log

Brent-Kung

2n – n log

n –2

2 log

n – 2

log

n + 1 ~

n log

Kogge & Stone

n log

n – n + 1

log

½ n log

Han & Carlson

½ n log

log

n + 1

¼ n log

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–21

Sumy warunkowe – koncepcja

1+0 0+0 1+1 1+0 0+1 1+1 1+0 0+1

—

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–22

Sumator sum warunkowych (conditional sum adder, COSA)

Tworzenie alternatywnych sum jedno-, dwu-, cztero-, o mio-, ...-bitowych

Poziom 0 – sumy i przeniesienia warunkowe dla osobnych bitów (

i = 0,1,...)

oraz

}

{

}

{

≡

⊕

}

{

}

{

Poziom p (|| – zło enie wektorów)

– warunkowe sumy

−

i przeniesienia

)

(

grup r = 2

bitów,

– dla i = 0,1,...,n·2

–p



−

]

)

(

[

−

)

(

)

(

−

Ko cowy wynik sumowania powstaje na poziomie k = log

n (r = 2

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–23

Schemat sumatora sum warunkowych

L 0

ΣΣΣΣ

0/1

1 0

ΣΣΣΣ

0/1

ΣΣΣΣ

0/1

ΣΣΣΣ

0/1

1 0

ΣΣΣΣ

0/1

ΣΣΣΣ

0/1

1 0

ΣΣΣΣ

0/1

ΣΣΣΣ

0/1

1 0

L 1

L 2

L 3

ΣΣΣΣ

0/1

O miobitowy sumator sum warunkowych

T = 2 log

2 n , A = ½ (n log

n + 2n log

n)= 3n log

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–24

Sumator sterowany przeniesieniem (CSLA)

Sumator multipleksowany sterowany przeniesieniem (carry-select adder)

wybór

k -pozycyjnych sum warunkowych zale nie od przeniesienia

m,l

l,k

k,i

m,l

l,k

k,i

m,l

l,k

k,i

i, 0

CPA

MPX

CPA

MPX

CPA

MPX

m,l

l,k

k,i

m,l

l,k

k,i

m +1

Schemat logiczny sumatora multipleksowanego sterowanego przeniesieniem

Sumy blokowe obliczane jednocze nie ⇒ wy sze bity

→

wi ksze bloki

Opó nienie – > 2

2 (optymalna liczba bloków – około

2 )

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–25

Sumator z przeskokiem przeniesie (CSKA)

Suma w bloku s-bitowym zale y od przeniesienia wej ciowego (carry-in).

propagacja przeniesienia przez cały blok

→

„przeskok” przeniesienia

n,m

CPA

m,l

CPA

l,k

CPA

j,i

CPA

...

k+1

i, 0

Schemat sumatora z przeskokiem przeniesie CSKA (carry-skip adder)

Opó nienie wnoszone przez sumator CSKA zale y od
– czasu wytworzenia przeniesienia w bloku, w którym zaczyna si  propagacja,
– czasu wytworzenia sumy w bloku ,w którym ko czy si  propagacja,
– czasu przeskoku przeniesienia przez bloki wewn trzne.
l jednakowych bloków k-bitowych (n = kl) opó nienie wyniesie

]

[

]

[

)]

(

)

[(

−

≥

−

∆

−

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–26

Analiza szybko ci sumatora z przeskokiem przeniesie

Czas dodawania:

•

czas wytworzenia przeniesienia na wyj ciu u–go bloku wej ciowego

•

czas przeskoku przeniesienia przez [v

−

(u+1)] bloków

•

czas wytworzenia sumy od ustalenia przeniesienia na wej ciu bloku v

)]

(

)

(

)

[(

)

(

−

∆

struktura

cie ka

opó nienie

max

6 bloków

4-4-4-4-4-4

−

1)+4+(4

−

1) = 10

3-4-5-5-4-3

5-5

−

1)+0+(5

−

1) = 8

2-5-6-5-4-2

5-6-5-4

−

1)+2+(4

−

1) = 9

6-5-4

−

1)+1+(4

−

1) = 9

8 bloków

1-2-3-6-6-3-2-1

3-6-6-3

−

1)+2+(3

−

1) = 6

6-6

−

1)+0+(6

−

1) = 10

1-2-4-5-5-4-2-1

4-5-5-4

−

1)+2+(4

−

1) = 8

1-2-3-4-5-4-3-2

4-5-4

−

1)+1+(4

−

1) = 7

9 bloków

1-2-3-4-4-4-3-2-1

2-3-4-4-4-3-2

−

1)+5+(2

−

1) = 7

3-4-4-4-3

−

1)+3+(3

−

1) = 7

3-4-4-4

−

1)+2+(4

−

1) = 7

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–27

Optymalizacja sumatora z przeskokiem przeniesie

Zało enie: standardowe opó nienia prostych funkcji

Heureza

•

ła cuchy optymalne:

je li rozmiar k bloków wytwarzaj cych mniej znacz ce pozycje sumy
jest typu

,...,k

−

, to maksymalne opó nienie

u+k

= (g

+ i

−

+(k

−

= (g

+ k

−

;

je li rozmiar s bloków wytwarzaj cych bardziej znacz ce pozycje sumy
jest typu

,...,s-

−

, to maksymalne opó nienie

v+s

= (g

+ i

−

+(s

−

= (g

+ s

−

;

•

ła cuchy nieoptymalne:

je li skrajne bloki ła cucha nie s skrajnymi blokami ła cuchów
optymalnych, to tworz cie k krytyczn propagacji przeniesienia.

Wnioski

•

optymalna struktura sumatora powinna by typu 1-2-3-...-3-2-1.

•

optymaln struktur sumatora jest tak e „1-2-3-...-3-2-1”\”1-2-…-s”.

Szybkie sumatory

© Janusz Biernat, 10-06-Szybkie sumatory.doc, 2 pa

dziernika 2006

FAST–28

Optymalizacja sumatora z przeskokiem przeniesie - przykład

•

n-bitowy ła cuch optymalny 1-2-3-...-3-2-1 zawiera

−

bloków

•

sumator n-bitowy powinien mie najwy ej 

−

 bloków

•

(p–1)

≤

–s

⇒ sumator n-bitowy powinien mie

≤

2(p–s) bloków

Przykład

. Sumator 32-bitowy powinien mie

≤

8 bloków (32=6

–2

)

liczba grup struktura sumatora

maksymalne opó nienie

2-3-4-5-4-5-4-3-2

−

1)+1+(5

−

1) = 9

3-4-5-4-4-5-4-3

−

1)+2+(5

−

1) = 10

2-3-4-6-6-5-4-2

−

1)+2+(4

−

1) = 10

2-3-4-5-6-5-4-3

−

1)+0+(5

−

1) = 9

Przykład

. Sumator 24-bitowy powinien mie

≤

8 bloków (24=5

–1

)

liczba grup struktura sumatora

maksymalne opó nienie

2-3-4-5-4-3-2-1

−

1)+0+(4

−

1) = 7

1-2-3-4-5-4-3-2

−

1)+0+(4

−

1) = 7

2-3-4-6-4-3-2

−

1)+0+(4

−

1) = 8

Szybkie sumatory

dziernika 2006

FAST–29

Inkrementer i dekrementer

wykonuje działanie X

→

wystarczy ła cuch półsumatorów (HA) lub półsubtraktorów (HS)

półsumator (half adder, HA) – realizuje funkcje

⊕

półsubtraktor (half subtracter, HS) – realizuje funkcje

⊕

−2

−1

HA/HS

−2

HA/HS

sumator z inkrementacj wskutek przeniesienia (carry-increment adder, CIA

układ zliczaj cy – inkrementer/dekrementer ze sprz eniem

)

(

)

(

i zapami tywaniem stanu

)

(

)

(

)

(

)

(

,...,

{

)

(

−

Szybkie sumatory

dziernika 2006

FAST–30

Szybko działania i zło ono sumatorów

Charakterystyki AT

•

sumator pełny FA – A = 7, T = 2 + 2

→

A T = 28

– 2

XOR, 1

OR, 2

AND

→

opó nienie przeniesienia 2 , sumy 2 + 2

•

sumator RCA – A = 7n, T = 2n

→

A T = 14n

– n

→

opó nienie przeniesienia n

⋅

•

sumator CLA – A

≈

7n, T

≈

4 log n

→

A T

≈

56 n log n

– n

→

log n bloków, opó nienie przeniesienia 2

⋅

2 log n

•

sumator CSKA – A

≈

8n, T

≈

⋅

→

A T

≈

32 n n

– n

FA+2 n

MPX, 2 n bloków

→

opó nienie przeniesienia 2

⋅

•

sumator CSLA – A

≈

⋅

7n, T

≈

→

A T

≈

39 n n

– 2

RCA,

2 bloków, opó nienie przeniesienia 2

⋅

•

sumator COSA – A = 3n log n, T = 2 log n

→

A T = 6 n log

– 2

RCA, log n poziomów MPX, opó nienie przeniesienia 2

⋅

log n

Szybkie sumatory

dziernika 2006

FAST–13a

Przekształcenie prefiksowe Ladnera-Fischera (Sklansky) dla funkcji G,P

i,i

= x

⊕

, G

i,i

= x

(i = 0, 1, … , n

−

0,0

Poziom 1 (i = 0, 1, … , 2

−

2i,2i+1

= P

2i+1,2i+1

2i,2i

2i,2i+1

= G

2i+1,2i+1

+ P

2i+1,2i+1

2i,2i

0,1

Poziom 2 (i = 0, 1, … , 2

−

1; s = 2, 3)

4i,4i+s

= P

4i+2,4i+s

4i,4i+1

4i,4i+s

= G

4i+2,4i+s

+ P

4i+2,4i+s

4i,4i+1

0,3

, G

0,2

Poziom 3 (i = 0, 1, … , 2

−

1; s = 4, 5, 6, 7)

8i,8i+s

= P

8i+4,8i+s

8i,8i+3

8i,8i+s

= G

8i+4,8i+s

+ P

8i+4,8i+s

8i,8i+3

0,7

, …, G

0,4

Poziom 4 (i = 0, 1, … , 2

−

1; s = 8, 9, …, 15)

16i,16i+s

= P

16i+8,16i+s

16i,16i+7

16i,16i+s

= G

16i+8,16i+s

+ P

16i+8,16i+s

16i,16i+7

0,15

, …, G

0,8

…

Szybkie sumatory

dziernika 2006

FAST–14a

Przekształcenie prefiksowe Kogge-Stone’a dla funkcji G,P

i,i

= x

⊕

, G

i,i

= x

(i = 0, 1, … , n

−

0,0

Poziom 1 (i = 0, 1, … , n

−

i,i+1

= P

i+1,i+1

i,i

, G

i,i+1

= G

i+1,i+1

+ P

i+1,i+1

i,i

0,1

Poziom 2 (s = 0, 1; i = 0, 1, … , n

−

)

i,i+3

= P

i+2,i+3

i,i+1

0,s+2

= G

s+1,s+2

+ P

s+1,s+2

0,s

0,3

, G

0,2

i,i+3

= G

i+2,i+3

+ P

i+2,i+3

i,i+1

0,3

)

Poziom 3 (s = 0, 1, …, 2

−

1; i = 0, 1, … , n

−

)

i,i+7

= P

i+4,i+7

i,i+3

0,s+4

= G

s+1,s+4

+ P

s+1,s+4

0,s

0,7

, G

0,6

, G

0,5

, G

0,4

i,i+7

= G

i+4,i+7

+ P

i+4,i+7

i,i+3

0,7

)

Poziom 4 (s = 0, 1, …, 2

−

1; i = 0, 1, … , n

−

)

0,s+8

= G

s+1,s+8

+ P

s+1,s+8

0,s

0,15

, … …, G

0,8

…

Szybkie sumatory

dziernika 2006

FAST–15a

Przekształcenie prefiksowe Brenta-Kunga dla funkcji G,P

i,i

= x

⊕

, G

i,i

= x

(i = 0, 1, … , n

−

0,0

Poziom 1 (i = 0, 1, … , 2

−

2i,2i+1

= G

2i+1,2i+1

+ P

2i+1,2i+1

2i,2i

, P

2i,2i+1

= P

2i+1,2i+1

2i,2i

0,1

Poziom 2 (i = 0, 1, … , 2

−

4i,4i+3

= P

4i+2,4i+3

4i,4i+1

4i,4i+3

= G

4i+2,4i+3

+ P

4i+2,4i+3

4i,4i+1

0,3

Poziom 3 (i = 0, 1, … , 2

−

8i,8i+7

= P

8i+4,8i+7

8i,8i+3

8i,8i+7

= G

8i+4,8i+7

+ P

8i+4,8i+7

8i,8i+3

0,7

…

Poziom m = log

n (T = 2

−

)

0,3T

−

= G

2T,3T

−

+ P

2T,3T

−

0,2T

−

, P

0,3T

−

= P

2T,3T

−

0,2T

−

0,3T

0,n

−

= G

2T,n

−

+ P

2T,n

−

0,2T

−

, P

0,n

−

= P

2T,n

−

0,2T

−

0,n

Poziom m+1 (i = (0), 1, … , 2

−

1, R = 2

−

)

0,iR

−

= G

2R,iR

−

+ P

2R,iR

−

0,2R

−

0,13

0,9

0,5

0,iR

−

= P

2R,iR

−

0,2R

−

Szybkie sumatory

dziernika 2006

FAST–16a

Przekształcenie prefiksowe Han’a-Carlson’a dla funkcji G,P

i,i

= x

⊕

, G

i,i

= x

(i = 0, 1, … , n

−

0,0

Poziom 1 (i = 0, 1, … , 2

−

2i,2i+1

= P

2i+1,2i+1

2i,2i

2i,2i+1

= G

2i+1,2i+1

+ P

2i+1,2i+1

2i,2i

0,1

Poziom 2 (i = 0, 1, … , 2

−

−1

)

2i,2i+3

= P

2i+2,2i+3

2i,2i+1

2i,2i+3

= G

2i+2,2i+3

+ P

2i+2,2i+3

2i,2i+1

0,3

Poziom 3 (s = 0, 1; i = 0, 1, … , 2

−

2i,2i+7

= P

2i+4,2i+7

2i,2i+3

0,2s+5

= G

2s+1,2s+5

+ P

2s+1,2s+5

0,2s

0,7

, G

0,5

2i,2i+7

= G

2i+4,2i+7

+ P

2i+4,2i+7

2i,2i+3

Poziom 4 (i = 0, 1, … , 2

−

2i,2i+15

= P

2i+8,2i+15

2i,2i+7

2i,2i+15

= G

2i+8,2i+15

+ P

2i+8,2i+15

2i,2i+7

0,15

, G

0,13

, G

0,11

, G

0,9

...

Poziom log

n+1 (i = 0, 1, … , 2

−

0,2i

= G

2i,2i

+ P

2i,2i

0,2i

−

0,2i

, … , G

0,4

, G

0,2