ARCHITEKTURA KOMPUTERA

Przypomnijmy:

•

pamięci statyczne są szybsze, droższe, pobierają więcej energii i

są trudniejsze do scalania

•

pamięci dynamiczne są wolniejsze, tańsze, pobierają mniej

energii i są łatwiejsze do scalania

Wniosek 1

: nie jest możliwe zbudowanie całej pamięci operacyjnej z

pamięci statycznych, a pamięci dynamiczne są za wolne dla

współczesnych procesorów i częstotliwości zegara

Wniosek 2

: wprowadza się dużą pamięć operacyjną (rzędu kilka GB)

zbudowaną z pamięci dynamicznych i małą (kilka kilkaset kB)

pamięć podręczną - statyczną - znacznie szybszą (wraz ze

sterownikiem)

Wniosek 3

: dwa rodzaje architektury:

•

Look-trough („dostęp przez”)

•

Look-aside

(„dostęp bezpośredni”)

•

Back-side („dostęp od tyłu”)

KONCEPCJA PAMIĘCI PODRĘCZNEJ

(CACHE)

W przypadku „chybienia”

wykorzystywana

jest

wykorzystywana

jest

magistrala

główna

magistrala

główna

koniecznymi

stanami

koniecznymi

stanami

oczekiwania

CACHE

PAMIĘĆ

OPERACYJNA

ZARZĄDCA

MAGISTRAL

ZARZĄDCA

MAGISTRAL

MIKROPROCESO

W przypadku „trafienia”

główna

magistrala

główna

magistrala

danych

nie

jest

danych

nie

jest

wykorzystywana

dodatkowo

przyspiesza

dodatkowo

przyspiesza

pracę

systemu

pracę

systemu

magistrali głównej mogą

w tym czasie korzystać

inni zarządcy).

Magistrala

lokalna

łó

ARCHITEKTURA LOOK-THROUGH

(„dostęp przez”)

Wykorzystana w procesorach

Intel Pentium II

Zalety:

•

prostsza

konstrukcja

•

szybsza realizacja w

przypadku

chybienia

Wady:

•

nawet przy trafieniu

magistrala nie jest

dostępna dla innych

zarządców

CACHE

PAMIĘĆ

OPERACYJNA

ZARZĄDCA

MAGISTRAL

ZARZĄDCA

MAGISTRAL

MIKROPROCESO

W przypadku „trafienia”

„chybienia”

główna

magistrala danych jest

stale wykorzystywana.

łó

ARCHITEKTURA LOOK-ASIDE

(„dostęp bezpośredni”)

Wykorzystana w procesorach

x86 i Pentium

W czasie, kiedy procesor

łączy się pamięcią cache,

możliwe jest wykorzystanie

magistrali głównej przez

inne urządzenia

zapisujące/odczytujące do

pamięci RAM. prostsza

konstrukcja

CACHE

PAMIĘĆ

OPERACYJNA

ZARZĄDCA

MAGISTRAL

ZARZĄDCA

MAGISTRAL

MIKROPROCESO

łó

ARCHITEKTURA BACK-SIDE

(„dostęp od tyłu”)

Magistra

lokalna

Wykorzystana w procesorach

Intel Pentium Pro

•

Bank danych pamięci cache

(pamięć danych)

przechowuje, umożliwia zapisywanie i odczytywanie

informacji

•

Katalog pamięci cache

(zwany TAG-RAMem)

umożliwia szybkie sprawdzanie czy poszukiwana

informacja znajduje się w pamięci danych cache

(konkretnie: czy dany adres jest odwzorowany w pamięci

cache)

•

Sterownik pamięci cache

realizuje sprawdzenie adresu w katalogu pamięci cache,

organizuje współpracę pamięci cache z systemem i

zapewnia zgodność zawartości pamięci cache z pamięcią

główną

ELEMENTY SYSTEMU PAMIĘCI CACHE

Zestaw 1

Strona 1

Strona 0

Zestaw 2

Zestaw 3

Zestaw 4

Zestaw 5

Zestaw 1

Zestaw 2

Zestaw 3

Zestaw 4

Zestaw 5

Zestaw 1

Zestaw 2

Zestaw 3

Zestaw 4

Zestaw 5

Zestaw 1

Zestaw 2

Zestaw 3

Zestaw 4

Zestaw 5

Strona 1

Strona 0

Strona 2

Dane 1

Dane 2

Dane 3

Dane 2

Dane 4

Dane 1

Katalog cache

(TAG-RAM)

Bank cache

Dane 4

Strona

•

Bank danych i katalog pamięci cache (TAG-

RAM) tworzą tzw. jednoblokową pamięć

asocjacyjną

•

Pamięć

cache

stanowi

jeden

blok

Pamięć

cache

stanowi

jeden

blok

podzielony na zestawy

•

Pamięć główna dzielona jest na strony o

rozmiarze

równym

rozmiarowi

bloku

rozmiarze

równym

rozmiarowi

bloku

pamięci cache. Strony podobnie jak blok

pamięci cache dzielone są na zestawy

•

Każdy zestaw w pamięci cache ma swoją

pozycję w katalogu (TAG-RAM) - zawiera

adres skąd pochodzi dany zestaw

•

Każdy zestaw jest wpisywany na miejsce w

pamięci cache do zestawu o numerze

zgodnym z numerem zestawu w stronie

Pamięć

główna

ORGANIZACJA PAMIĘCI CACHE

•

Bank danych i katalog pamięci cache (TAG-RAM) tworzą tzw.

jednoblokową pamięć asocjacyjną

•

Pamięć cache stanowi jeden blok podzielony na zestawy

•

Pamięć główna dzielona jest na strony o rozmiarze równym

rozmiarowi bloku pamięci cache. Strony podobnie jak blok

pamięci cache dzielone są na zestawy

•

Każdy zestaw w pamięci cache ma swoją pozycję w katalogu

(TAG-RAM) - zawiera adres skąd pochodzi dany zestaw

•

Każdy zestaw jest wpisywany na miejsce w pamięci cache do

zestawu o numerze zgodnym z numerem zestawu w stronie

ORGANIZACJA PAMIĘCI CACHE

Podsumowanie

Przyczyny niezgodności:

•

nastąpił zapis do pamięci cache bez zapisu do pamięci głównej (w

przypadku trafienia przy zapisie do pamięci)

•

nastąpił zapis do pamięci głównej bez zapisu do pamięci cache (gdy z

magistrali głównej korzystał inny zarządca magistrali niż procesor

np. transmisja DMA do pamięci głównej)

Strategie utrzymania zgodności:

•

Write-through (zapis do pamięci cache powoduje jednoczesny zapis

do pamięci głównej - proste ale zmniejsza szybkość, bo zpisuje się

informacje do wolnej pamięci głównej)

•

Buforowane (opóźnione) write-through (jak wyżej ale zapis do bufora

i dopiero później z bufora do pamięci głównej aby nie spowalniać

pracy)

•

Write-back (zawartości obu pamięci są uzgadniane gdy zajdzie taka

potrzeba - operacje bardzo skomplikowane)

Pewne obszary w pamięci głównej nie mogą być odzwierciedlone w

pamięci cache, gdyż nie jest możliwe zapewnienie zgodności, np. obszar

pamięci RAM karty sieciowej, gdzie zapis może realizować procesor przez

magistralę systemową jak i sterownik sieci (nie ma możliwości śledzenia

magistrali sieci). W systemie muszą więc istnieć układy NCA (

non-cachable

access

) uniemożliwiające niektóre zapisy do pamięci cache.

ZAPEWNIENIE ZGODNOŚCI PAMIĘCI

CACHE

Pamięć cache (zwłaszcza typu Look-through) możer występować:

•

wewnątrz procesora - pamięć cache pierwszego poziomu (L1- lovel 1),

•

pamięć zewnętrzna - pamięć drugiego poziomu (L2).

Pamięć tego typu pojawiła się po raz pierwszy w procesorach 80486.

Pamięć L2 jest znacznie większa od L1, dzięki czemu jeśli nie nastąpiło

„trafienie” w pamięci L1 to istnieje duża szansa trafienia do L2 (oczywiście

informacja z pamięci L1 znajduje się w pamięci L2) - przyspiesza to pracę

systemu.

PAMIĘĆ

OPERACYJNA

ZARZĄDCA

MAGISTRAL

ZARZĄDCA

MAGISTRAL

8048

łó

CACHE 1-go poziomu

Blok sterowania

magistralą

ły

ją

ły

ją

CACHE 2-go poziomu

Magistrala lokalna

Układy

logiczne

NCA

Sygnały sterujące

PAMIĘĆ CACHE DRUGIEGO POZIOMU

Pamięć L1 jest podzielona na dwa bloki:

Pamięć L1 jest podzielona na dwa bloki:


danych



rozkazów,

działa z częstotliwością pracy CPU, pojemności rzędu kilkudziesięciu

KB;

Pamięć trzeciego poziomu L3

jest oddzielnym układem na płycie

głównej.

Stosowana jest zazwyczaj w serwerach i wydajnych stacjach roboczych.

Jest wolniejsza od CPU, pojemność około kilku MB.

Zjawisko lokalności

- procesor odwołuje się najczęściej do pamięci (

trafienie

)

w pewnym niewielkim obszarze (w okolicach danego programu) - bardzo

rzadko do obszarów odległych. Stąd stosowanie szybkich pamięci

kieszeniowych (cache) zawierających właśnie taki lokalny obszar pamięci.

q-1

1 blok

2 blok

k-1 blok

k-2 blok

...

m-1

m-2

q słów

log

pamięć operacyjna

pamięć kieszeniowa

zawiera tylko

spośród

bloków

(k>>m)

Gdy procesor zażąda dostępu do bloku, którego nie ma w pamięci cache

(

chybienie

) to następuje wymiana zawartości jednej komórki pamięci

kieszeniowej.

bloku

PAMIĘĆ KIESZENIOWA

(przypomnienie)

Document Outline