Nehalem
Nehalem je kódové označenie pre mikroarchitektúru procesorov, ktorú vyvinul Intel. Procesory postavené na architektúre Nehalem boli vydané vo štvrtom štvrťroku (2008) v high-end verziách, bežné verzie až v treťom štvrťroku roku nasledujúceho. Nehalem je nástupca staršej mikroarchitektúry Core.
Nehalem používa 45nm výrobný proces z predchádzajúcej generácie a uplatňuje ho pre novú architektúru. Neskôr v roku 2010 sa začali vyrábať slabšie modely aj 32nm technologickým procesom. Pracovný systém s dvoma procesormi Nehalem bol uvedený na Intel Developer Fóre na jeseň 2007.
Táto architektúra je pomenovaná po rieke Nehalem v severozápadnom Oregone, ktorá je zase pomenovaná po pokolení rodených Američanov v Oregone. Kódové meno bolo zobrazené na konci niekoľkých vývojových máp spoločnosti už v roku 2000. V tej dobe to mal byť posledný vývoj architektúry NetBurst. Vzhľadom na to, že architektúra NetBurst bola opustená, kódové meno bolo použité znovu pre úplne iný projekt.
Technológia
[upraviť | upraviť zdroj]Išlo o jednu z najväčších revolúcií x86 architektúry od doby vydania Pentia Pro v roku 1995. Nehalem je vysoko škálovateľný s rôznymi komponentmi pre rôzne úlohy. Nehalem má nasledujúcu špecifikáciu:
- Dvoj, štvor a osem jadrové varianty
- Integrovaný pamäťový radič podporujúci DDR3 SDRAM a 1 až 6 pamäťových kanálov
- 45nm a 32nm výrobný proces
- Low-end varianty budú mať integrovaný grafický procesor (IGP) umiestnený mimo čip, ale v rovnakom puzdre
- Používa nové point-to-point prepojenie procesorov nazývané Intel QuickPath Interconnect, ktoré nahradí zastaralú front-side bus
- Hyper-threading, ktorý nebol prítomný na bežných procesoroch od Intelu od roku 2006
- Natívne (monolitické, t.j. všetky procesorové jadrá na jedinom čipe) štvor a osem jadrové procesory
- 731 miliónov tranzistorov pri štvorjadrovom variante
- 32 KB L1 inštrukčnú a 32 KB L1 dátovú cache na jedno jadro
- 256 KB L2 cache na jadro
- 8 MB L3 cache zdieľanej medzi všetkými jadrami
- O 33% efektívnejšie v mikro-ops operáciách ako Core
- 2. úroveň radu prediktora a 2. úroveň Translation Lookaside Buffer
- Modulárne bloky komponentov, ako sú jadrá, môžu byť pridané alebo odstránené pre rôzne segmenty trhu
Cache pamäť
[upraviť | upraviť zdroj]Hlavnou novinkou bola ďalšia úroveň cache pamäte. Oproti mikroarchitektúre Core bola pridaná ďalšia úroveň pamäte a to L3. L1 cache má veľkosť 64 KB a je rozdelená na dátovú (32KB) a inštrukčnú (32KB). Pamäť L1 je samostatná pre každé jadro a jej rýchlosť sú 4 cykly. Nad ňou sa nachádza L2 pamäť, ktorá je opäť samostatná pre každé jadro. Jej veľkosť je 256 KB a rýchlosť je 10 cyklov. Pamäť L3 je už však zdieľaná medzi všetkými jadrami a má veľkosť 8 MB (Lynnfield, Bloomfield). Rýchlosť je 40 cyklov. Z toho dôvodu sa stáva synchronizácia medzi jadrami pomerne pomalá, ak porovnáme rýchlosť L1 a L2 pamäte s L3.
Integrovaný pamäťový radič
[upraviť | upraviť zdroj]Ďalšia zmena oproti predchádzajúcim architektúram Intelu bol pamäťový radič, ktorý je už umiestnený v procesore. Predtým bol umiestnený v severnom mostíku, takže keď procesor potreboval pristupovať k RAM pamäti, tak musel ísť cez severný mostík.
To, že sa radič pamätí premiestnil do procesora, má za následok značné zrýchlenie prístupu k RAM pamäti (zníženie latencie). Integrovaný pamäťový radič je najviac trojkanálový (3×64bit) a na každý kanál je možné pripojiť dva DIMM moduly, to znamená, že je možnosť celkovo pripojiť až 6 pamäťových modulov. Tieto pamäťové moduly sú typu DDR3 na frekvenciách 800 MHz, 1066 MHz a 1333 MHz. Sloty s pamäťou môžeme osadiť rôzne veľkými modulmi. Radič vie niekoľko módov, ako s nimi pracovať a to asymetrický dual-channel či asymetrický triple-channel. Najlepší výkon ale dosiahneme, ak osadíme pamäťové moduly rovnakej kapacity.
QuickPath Interconnect (QPI)
[upraviť | upraviť zdroj]Novinkou bola tiež QPI zbernica nahrádzajúca starú FSB zbernicu sa skladá z dvoch 20-pinových spojov (full duplex), to znamená 20 pre prichádzajúcu komunikáciu a 20 pre odchádzajúcu. Z týchto 20 spojov je ich 16 určených pre komunikáciu a 4 zostávajúce pre riadenie prevádzky a detekciu chýb.
QPI zbernica pracuje na frekvenciách 2,4 GHz, 2,93 GHz alebo 3,2 GHz. Jej celková maximálna priepustnosť je 12,8 GB/s jednom smere, takže v oboch smeroch môže prepúšťať až 25,6 GB/s. Hlavné použitie je predovšetkým v prepojení procesora a čipsetu, alebo pre prepojenie procesorov medzi sebou, čo je uplatňované pri serveroch.
Turbo Boost
[upraviť | upraviť zdroj]Hlavné použitie má v prípade, keď procesor má vyťažené jedno jadro, niektorou aplikáciou používajúcou jedno jadro. V takom prípade je možné automaticky zdvihnúť frekvenciu využívaného jadra a to tak, že zdvihneme násobič až o 5, avšak za podmienky, že ostatné jadrá majú minimálne vyťaženie. Hlavným dôvodom tohto pravidla je to, že nesmieme prekročiť odporúčanú pracovnú teplotu procesora a maximálnu spotrebu, oboje by mohlo spôsobiť nestabilitu z dôvodu prehriatia CPU alebo napájacích obvodov.
Ak sú 2 jadrá plne vyťažené a zvyšné dve sú v minimálnom zaťažení, potom je možné zdvihnúť násobič o 2-3. Ak sú všetky jadrá maximálne zaťažené, potom možno zdvihnúť násobič o 1-2.
Referencie
[upraviť | upraviť zdroj]- Core i7 800 a Core i5 700 - Nehalem už tiež v strednej triede
- Nehalem - nové revolučné platformy
- Architektúra procesorov Nehalem
- Rodina procesorov Intel Nehalem - Petr Havíček Archivované 2014-12-29 na Wayback Machine
- Tento článok je čiastočný alebo úplný preklad článku Nehalem na českej Wikipédii.