Krupa doc


Technika mikroprocesorowa

0x01 graphic

Referat: Pentium 4 Prescott

Autor:

Gierałtowski Tomasz
II EiT

Akademia Morska

Katedra Radioelektroniki Morskiej

Gdynia 2004

0x08 graphic
W lutym został wprowadzony nowy procesor Intela, następca Pentium 4 o nazwie Prescott. Układ ten korzysta z rozbudowanej architektury NetBurst, jednak jedną z najistotniejszych jego cech jest to, że przełamał kolejną barierę technologiczną - jest wykonywany w procesie 0,09 mikrona. To pozwala nie tylko na tańszą produkcję, lecz również na osiągnięcie duży wyższych częstotliwości taktowania niż dotychczas. Prescott nie jest lekko podretuszowanym procesorem Northwood. Rdzeń dokładnie przekonstruowano dokonując szeregu bardzo istotnych zmian w jego budowie.

Prescott to nazwa nowego rdzenia procesora P4. Ma być on rywalem najszybszych układów AMD - Athlona 64 i FX. 0,09 mikrona niesie ze sobą wymierne korzyści finansowe. Intel może na waflach krzemowych tej samej wielkości (300 mm) wytwarzać kilkadziesiąt procent procesorów więcej, co pomimo poniesienia ogromnych nakładów finansowych na powstanie nowych linii produkcyjnych, jest dla firmy opłacalne. Athlony AMD powstają na razie w procesie 0,13 mikrona. Są droższe w produkcji, AMD mniej na nich zarabia, a przede wszystkim napotyka ograniczenia związane z częstotliwością taktowania układów. Athlony wykonywane w technologii 0,09 mikrona mają pojawić się na rynku w drugiej połowie br. Czy tak się stanie czas pokaże.

Architektura rdzenia została opracowana tak aby był on podatny na istotne zwiększanie taktowania, a po drugie dobrze radził sobie z odprowadzaniem ciepła. Rdzeń Prescotta składa się ze 125 mln tranzystorów. Dla porównania Northwood ma ich 55 mln, a np. Athlon 64 i FX 105,9 mln. Ciekawie wygląda też porównanie samych wielkości rdzeni: 112 mm2 Prescott 131 mm2 Northwood i aż 193 mm2 Athlon 64. Zredukowanie wymiaru technologicznego a co za tym idzie zmniejszenie wielkości tranzystorów sprawiło że nowe procesory Intela potrafią wydzielać na "maskymalnych obrotach" ponad 100 wat ciepła. Wysoka temperatura rdzenia Prescotta praktycznie uniemożliwia jego podkręcanie o więcej niż 200 - 300MHz. Aby uzyskać większe wyniki, trzeba by z pewnością użyć jednego z zaawansowanych systemów chłodzenia wodą lub freonem.

Prescott posiada więcej pamięci podręcznej i to nie tylko drugiego ale i pierwszego poziomu. Pojemność cache zwiększono z 8 do 16 KB dla pierwszego poziomu i z 512 KB do 1 MB dla drugiego poziomu. Nowa pamięć podręczna jest ośmiodrożna (a więc podzielna na osiem bloków), w przeciwieństwie do czterodrożnej L2 w Northwoodzie. W Prescott'cie zastosowano po raz pierwszy na masową skalę materiał izolacyjny o niskiej stałej dielektrycznej (low-k, k<3). Dzięki temu elektrony mogą płynąć szybciej, a komunikacja między poszczególnymi blokami procesora jest usprawniona. Architektura Pentium 4 nosi nazwę NetBurst i charakteryzuje się jednostkami arytmetyczno-logicznymi (odpowiedzialnymi za dodawanie, odejmowanie, mnożenie i dzielenie oraz operacje logiczne) pracującymi z dwukrotną prędkością zegara. Duży wzrost ilości tranzystorów wynika z zastosowania większej ilości pamięci podręcznej oraz dodania 13 nowych instrukcji multimedialnych SSE3. Ponieważ Prescott jest jednocześnie kompatybilny z dotychczasowym gniazdem 478, wystarczy odpowiednio uaktualnić BIOS, by mógł pracować z wieloma z dotychczasowych płyt głównych do Pentium 4.

W połowie 2004 Intel wprowadzi równolegle gniazdo LGA775. Początkowo będzie ono przystosowane również do magistrali FSB 800 MHz, jednak w niedługim czasie powinno osiągnąć 1200 MHz. Ponadto, 297 dodatkowych styków umożliwi zasilanie procesora większym prądem, a więc moc strat przekroczy 100 W. Już to wystarczy, by Prescott (a może jego następcy) mógł dojść do bariery 5 GHz. Aby to było możliwe potrzebna była także zmiana w długości potoku wykonawczego. W Northwoodzie ma od 20 etapów długości. W Prescottcie 31. Wydłużenie potoków ma także swoje wady. Intel wprowadził więc kilka udoskonaleń do mikroarchitektury NetBurst, które mają zapobiec tym problemom. Intel po raz kolejny wyraźnie rozbudował mechanizmy przewidywania skoku i wstępnego pobierania rozkazów.

Wiele kontrowersji budzi rozszerzenie "La Grande Support". Ma ono umożliwiać bezpieczne wykonywanie programów (secure computing), chroniąc nawzajem przed sobą programy i wątki. La Grande ma sprawić, że żaden, nawet wysoko uprzywilejowany program, nie będzie mógł odwoływać się do danych lub kodu innej aplikacji. La Grande daje możliwość wykonywania chronionego kodu w izolowanym otoczeniu w procesorze i w pamięci. W ten sposób wyklucza się późniejsze debugowanie, reverse engineering oraz zakładanie łat przez złośliwe oprogramowanie w trakcie wykonywania programu. Nawet komunikacja z urządzeniami wprowadzania danych, jak klawiatura czy mysz, odbywa się kanałami chronionymi kryptograficznie. Wszystko to wymaga jednak wielkich zmian w chipsecie i systemie operacyjnym.
Rozszerzenie La Grande mogłoby po raz pierwszy znaleźć zastosowanie w następcy Windows XP, systemie operacyjnym o kodowej nazwie Longhorn. Longhorn podzieli wirtualnie komputer na dwie części: jedną normalną, z jak zwykle niebezpiecznym systemem Windows, i drugą z bezpiecznym jądrem o nazwie Nexus. Nexus odgrodzi się od reszty komputera tym łatwiej, że będzie dysponował nawet własną warstwą abstrakcji sprzętu (Hardware Abstraction Layer, HAL), w tym przypadku o nazwie NAL. W twierdzy Nexusa mają bezpiecznie pracować wybrane programy, na przykład do obsługi bankowości internetowej. W początkowym okresie Prescott z rozszerzeniem La Grande będzie z pewnością dostępny tylko dla konstruktorów - procesory dostępne w handlu nie będą go zawierały.

W procesorze Prescott Intel rozszerzył zestaw rozkazów IA32 o dodatkowe 13 rozkazów. Nowe rozkazy SSE3 (Streaming SIMD Extensions) dotyczą głównie jednostki zmiennopozycyjnej z nowymi rozkazami SIMD, ponadto obejmują rozszerzenia dla obliczeń na liczbach zespolonych. Większość nowych rozkazów jest raczej egzotyczna i ma zastosowanie w bardzo szczególnych przypadkach. SSE3 dysponuje pewnym potencjałem optymalizacji w przypadku bibliotek matematycznych, które wykonują wiele operacji na liczbach zespolonych, lub wykorzystują algorytm motylkowy do szybkich transformacji Fouriera. Prawdopodobną korzyść mogą odnieść aplikacje naukowe i kodeki audio/wideo.

Odpowiadają one za:

Prawdziwa nowość techniczna w zestawie instrukcji procesora Prescott to sprzętowa synchronizacja wątków za pomocą rozkazów MONITOR i MWAIT. Dzięki nim można zatrzymać jeden potok procesora z technologią Hyper Threading do czasu, gdy inny potok wykona operację zapisu we wcześniej zdefiniowanej komórce pamięci. W ten sposób dwa wątki mogą się synchronizować z bardzo dużą szybkością, nie zużywając na to wydajności procesora.

Dotychczas, bezpośrednia i szybka synchronizacja - gdy na przykład jeden wątek musi zaczekać, aż drugi zakończy zadanie o krytycznym znaczeniu - wymaga zastosowania mechanizmów, które opisujemy poniżej. Oba wątki otrzymują dostęp do tej wspólnej zmiennej. Wątek oczekujący w pętli nieustannie sprawdza stan tej zmiennej. Gdy wątek pracujący efektywnie ukończy swoje zadanie, zmienia jej wartość. Wówczas wątek oczekujący w pętli wychodzi z niej i podejmuje na nowo efektywną pracę. Jednak w czasie oczekiwania pierwszy wątek zużył masę mocy obliczeniowej procesora li tylko na kręcenie z gigahercową prędkością pętli oczekiwania - hamując w ten sposób wykonanie efektywnie pracującego wątku. W jądrze Northwood Intel zastosował wprawdzie rozkaz PAUSE, który zmniejszał zużycie zasobów procesora na podtrzymywanie pętli, jednak z pewnością nie było to rozwiązanie doskonałe.
Prescott idzie w tym względzie o krok dalej. Nowy rozkaz MONITOR to pierwszy tego rodzaju sprzętowy synchronizator. Za pomocą tego rozkazu wątek określa adres w pamięci, którego stan ma nadzorować procesor - nie zużywając na ten cel mocy obliczeniowej. Kolejny rozkaż, MWAIT, wprowadza wątek w stan uśpienia, zwalniając w ten sposób zasoby procesora dla innych wątków. Gdy jednak aktywny wątek dokona operacji zapisu w określonej wcześniej komórce pamięci, procesor przełącza się z powrotem w tryb Hyper Threading, a uśpiony wątek powraca do życia, nie zużywszy w okresie uśpienia zasobów procesora.

Testy wydajności procesora dają wyniki dość zaskakujące. W zdecydowanej większości benchmarków, takich jak gry 3D (m.in. Aquamark 3, aplikacje do profesjonalnej grafiki 3D - 3D Max, Lightwave) wykazują, że Prescott jest mniej wydajny niż odpowiadający mu częstotliwością taktowania Northwood. Z drugiej strony aplikacje multimedialne (kodowanie DivX, authoring DVD) i większość biurowych (SySMark 2004, kompresja WinRar) dają lepsze rezultaty. Widać tu zasługę nowych instrukcji multimedialnych.

Choć Prescott, tak samo jak serwerowa Nocona, ma 64-bitowe rozszerzenia, to w tym domowym układzie są one zablokowane. Intel nie widzi na razie potrzeby ich odblokowania, gdyż nie istnieją jeszcze 64-bitowy Windows XP, sterowniki i 64-bitowe programy, które naprawdę przyśpieszyłyby przetwarzanie danych.
W chwili obecnej zakup Prescotta byłby nieudaną inwestycją. Procesor ten jest owszem próbką możliwości technologicznych Intela i z pewnością wskazuje co czeka nas w świecie procesorów w najbliższej przyszłości. Zmiany architektury procesora nie mogą być jednak w pełni uwidocznione, co wynika z niskich częstotliwości taktowania układu. Głównym założeniem Intela przy jego opracowywaniu była jego wysoka skalowalność i zmniejszenie kosztów produkcji. Oba cele zostały osiągnięte. Pełnię swoich możliwości Prescott pokaże dopiero po zmianie podstawki na LGA775 i związanym z tym posunięciem zwiększeniem taktowania układu do nieosiągalnych obecnie częstotliwości.

Aktualnie w ofercie Intela znajdują sie 4 procesory Prescotta o częstotliwościach taktowania 2,8; 3,0; 3,2 i 3,4 GHz. Wśród nowych procesorów Pentium 4 pojawiły się dwa nieco odmienne modele. Układy noszące oznaczenia 2,4A i 2,8A, podobnie jak pozostałe układy z rdzeniem Prescott, wykonane są w wymiarze technologicznym 0,09 mikrometra i wyposażone w 1024 KB pamięci podręcznej cache L2. Tak samo jak modele 2,8E i 3,0E dysponują wydłużonymi potokami i rozszerzoną listą rozkazów SSE3. W przeciwieństwie jednak do procesorów z rdzeniem Northwood HT i pełnych Prescottów nie zostały wyposażone w technologię współbieżnej wielowątkowości (Hyper-Threading). Pracują także z wolniejszą magistralą FSB o częstotliwości 533 MHz (800 MHz w pełnych Prescottach). W związku z tym doskonale nadają się do podkręcania.



Wyszukiwarka

Podobne podstrony:
¦cieki OOS Krupa doc
Lista pomocnicza do okre¶lania wariantów przedsięwzięcia krupa doc
krupa OO¦ 5 i 6 doc
europejski system energetyczny doc
KLASA 1 POZIOM ROZSZERZONY doc Nieznany
5 M1 OsowskiM BalaR ZAD5 doc
Opis zawodu Hostessa, Opis-stanowiska-pracy-DOC
Messerschmitt Me-262, DOC
Opis zawodu Robotnik gospodarczy, Opis-stanowiska-pracy-DOC
Opis zawodu Położna, Opis-stanowiska-pracy-DOC
Opis zawodu Przetwórca ryb, Opis-stanowiska-pracy-DOC
Blessing in disguise(1), Fanfiction, Blessing in disguise zawieszony na czas nie określony, Doc
Opis zawodu Politolog, Opis-stanowiska-pracy-DOC
Protokół wprowadzenia na roboty, Pliki DOC PPT
Połączenie komputerów w sieć, DOC
Opis zawodu Technik informatyk, Opis-stanowiska-pracy-DOC

więcej podobnych podstron