SUPER
PROCESSORI
Se credete che un Pentium 4 a 2.2 GHz o l'Athlon XP 2000+
siano il "non plus ultra" delle tecnologie hardware
applicate ai processori vi sbagliate di grosso. E' vero che
negli ultimi anni i processori x86 hanno assunto un ruolo sempre
più dominante, prima solo dal punto di vista "sociale"
diffondendosi a macchia d'olio, poi anche dal punto di vista
tecnologico raggiungendo livelli notevoli di potenza e velocità
e riuscendo anche ad oscurare vecchie glorie del mondo RISC.
Ma non è sempre stato così ed adesso, alcune di
queste vecchie glorie stanno riemergendo dal limbo insieme ad
alcuni promettenti newcomers e questa volta sono veramente grossi
e cattivi!
Ricordo
ancora molto bene gli anni ruggenti dei processori RISC, quando
noi miseri utenti PC con i nostri poveri 486dx66 o al massimo
Pentium a 100 sbavavamo dietro workstation da favola che montavano
a bordo processori "esotici" come i MIPS R10000 a
200MHz, gli HP PA-8000 con cache L1 esterne da 8MB, gli Alpha
21164 con clock di 500MHz e L2 cache da 96K integrate sul chip.
Allora i costosissimi processori RISC per workstation e server
di alto livello dominavano la scena tecnologica grazie all'utilizzo
delle più avanzate tecniche di integrazione, di architetture
complesse e ben studiate, di progettisti di primissimo piano.
Con
la diffusione del Pentium tutto cominciò a mutare. Un
PC con WindowsNT e un processore di punta poteva arrivare ad
offrire prestazioni comparabili a quelle di una workstation
o di un server blasonati ad una frazione del prezzo. Molto del
mercato si è quindi progressivamente spostato su questi
sistemi relegando piano piano le tecnologie non x86 ai mercati
di nicchia come i sistemi legacy, i supercomputer, i server
ad elevatissime prestazioni, etc...
Le vecchie glorie del RISC si sono quindi piano piano
fossilizzate fino a scomparire quasi del tutto (vedi l'esempio
di Alpha che ha cancellato vari progetti interessanti ed infine
è stata acquisita da HP, oppure di MIPS che ha di fatti
abbandonato la famiglia Rxx000 dedicandosi ai sistemi embedded)
a tutto vantaggio dei vari PII, PIII, K7 e PIV che si sono,
negli ultimi tempi, quasi del tutto impadroniti della scena.
Ma qualcosa sta cambiando...Di recente sono stati infatti
presentati (o annunciati) dei nuovi processori potentissimi,
appartenenti "genericamente" alla categoria RISC e
che portano lo stato dell'arte delle tecnologie hardware per
processori decisamente su un'altro piano. Stiamo parlando in
particolare del processore McKinley di Intel, del PA-8800
di HP e del Power4 di IBM.
>
McKinley
McKinley
è il nuovo processore con architettura IA-64 di Intel.
Non è questo il luogo per approfondire il paradigma EPIC
(parallelismo esplicito) che ne è alla base e che abbiamo
già trattato su Lithium in un apposito speciale, vi basti
quindi qui sapere una breve panoramica dei punti salienti dell'hardware:
Il processore è gigantesco: integrati in 0.18
micron i suoi 221 Milioni di transitor occupano qualcosa come
464 mmq.
Tutto questo silicio ospita un potente core di elaborazione
evoluzione del precedente Itanium ed un "sontuoso"
sotto-sistema di caching a 3 livelli costituito da:
- L1 cache: 16KB I-cache e 16KB D-cache con accesso a 4 porte
e singolo ciclo!
- L2 cache: 256KB unificata con latenza di 5 cicli
- L3 cache: ben 3MB integrata on-chip con latenza di 12 cicli.
Tutto questo ben di Dio serve a fornire il massimo flusso di
istruzioni verso le voraci unità di elaborazione con
una ridotta latenza di accesso per ridurre i tempi morti dovuti
allo stallo delle pipeline (peraltro abbastanza corte: solo
8 stadi).
Per alimentare adeguatamente queste cache, alla Intel hanno
pensato bene di introdurre un velocissimo FSB da 100MHz QuadPump
128bit (il doppio di quanto esibito da un P4).
Non è chiaro quanta potenza si potrà trarre
dal McKinley ma le premesse ci sono tutte. Ultima nota, la frequenza
di clock sarà di "soli" 1000MHz...non si può
avere tutto.
>
PA-8800
La
"Precision Architecture" di HP è sempre stata
una tecnologia elitaria, confinata in settori particolari ma
capace di una potenza spaventosa. I processori della serie PA-8000
sono sempre stati di fatto quelli con la maggiore "densità
di potenza" ossia la maggiore potenza di calcolo a parità
di frequenza di clock. E' per questo che i processori di questa
famiglia hanno spesso avuto frequenze relativamente basse a
dispetto di una elevata potenza di elaborazione. Con i nuovi
PA-8700 e PA-8800 non solo l'architettura è stata spinta
al massimo, ma anche la frequenza operativa è stata alzata
ai valori tipici per questo segmento di mercato (vale a dire
attualmente intorno ai 1000MHz).
Il PA-8800 è un processore spaventoso. E' costituito
da un chip principale e da una L2 cache esterna montati entrambi
in una speciale cartridge (sullo stile del PII). Il chip integra
DUE core PA-8700 ciascuno servito da una L1 cache da
750K per i dati e 750K per le istruzioni, per complessivi 3M
di L1 cache on-chip. La L2 cache su cartuccia utilizza 4 chip
da 72Mbit di speciale memoria "1 Transistor SRAM"
per complessivi 32MB di L2 cache ad alta velocità. Infine,
analogamente al McKinley, il processore dispone di un FSB di
128bit 200MHz Doppio fronte per complessivi 6.4GB/s di banda
verso la memoria esterna.
Nel
caso del PA-8800 si parla addirittura di 300 milioni di transistor
che integrati in tecnologia "130 nm - SOI - 8 copper metal
layers" occupano circa 360mmq. Non contenti di avere un
ottimo core capace di prestazioni relative altissime, alla HP
hanno pensato bene di inserirne due di core (SMT) di modo da
aggiudicarsi anche la palma di massime prestazioni assolute.
>
Power4
Power4 è più snello ma non meno eccezionale.
Nei suoi 170 milioni di transistor sono stipati due potenti
core di elaborazione (SMP) ciascuno dotato di L1 cache da 64KB
per i dati (2 vie) e 64KB per le istruzioni (Direct Mapped),
una L2 cache condivisa da ben 1.5MB (8 vie) mentre in una speciale
cartuccia che può ospitare ben 4 chip Power4 (per complessivi
8 processori) è disponibile una L3 cache da 32MB.
Il Power4 ha un core molto potente, capace di lanciare
fino a 8 istruzioni per ciclo e completarne una media di 5 per
ciclo (un valore molto alto). Sono presenti 8 unità di
elaborazione: 2 dedicate ai salti, 2 alle operazioni sugli interi,
2 load/store e 2 unità per i floating point. E' possibile
eseguire fino a 4 istruzioni FP per ciclo (MACC).
La grande versatilità del Power4 è però
legata alla specifica predisposizione alla creazione di sistemi
massicciamente paralleli. Con tecnologia MMC è possibile
"stipare" in una cartiuccia fino a 4 Power 4 che con
una serie di bus dedicati comunicano tra loro a velocità
elevatissime. 4 MMC possono essere ancora accorpati fino a costituire
un sistemino da 32 processori.
Ogni MMC ha 2 bus a 128 bit 200Mhz DDR verso la memoria.
Conclusioni
Io
non so voi ma dopo questa disamina non riesco più a vedere
il mio povero processore con gli stessi occhi di prima. Ma come?
qui si parla anche di 35MB di L1+L2 cache e il mio Celeron dispone
solo di 128K ? Neanche i 512K del P4 Northwood si avvicinano
molto a queste cifre, per non parlare della predisposizione
al multi-processing...mi consolo soltanto guardando il prezzo:
volete un bel Power4, o un HP-8800, o un McKinley ? Bè
preparatevi a sborsare cifre nell'ordine dei 5000-7000$... per
fortuna sognare non costa niente...
Alla prossima
puntata,
Stay on charge, Lithium.it !
ALTRE
LETTURE CONSIGLIATE:
Nanotecnologie
e Tecniche di Integrazione
Nel
1991 furono scoperti i Nanotubi di Carbonio, un singolare
fenomeno della natura che promette di portare una vera
rivoluzione nel mondo dei circuiti integrati...
|
 |
|
a
cura di F.Sonnati
|
CRAY
e i suoi Super Computer
Credete
che il vostro Pentium4 a 2GHz nuovo di zecca sia un
super-computer ? Bè quando avrete letto questo,
non lo guarderete più con gli stessi occhi...
|
 |
|
a
cura di F.Sonnati
|
| |
"La quinta generazione" 6° ed ultimo
numero online
|
|
|
|
|
| Vi
siete resi conto che con la GeForce3 e il Radeon2
siamo gia arrivati alla 5° generazione di schede
video 3D? In questo speciale Dossier di 5 articoli
effettueremo una analisi dettagliata delle feature
reali e presunte offerte da questa nuova generazione,
e sveleremo anche qualche segreto...AGGIORNATO |
|
|
|
 |
Le tecnologie dei processori: On-Chip Multi-Threading
|
13
Novembre 2001
|
|
|
|
| In
questo articolo della serie dedicata ai processori
moderni illustreremo una delle più recenti
ed interessanti tecnologie che permetterà
di ottenere più potenza e più efficienza
dai microprocessori del futuro. Stiamo parlando
dell' On-Chip Multi-Threading che Intel promette
di applicare presto alla famiglia Pentium4... |
|
|
|
| |
Introduzione
alla Tecnologia di integrazione SOI
|
|
|
|
|
| Di
recente AMD ha annunciato l'imminente adozione della
tecnologia S O I nell'integrazione dei suoi
futuri processori. Di cosa si tratta ? in che modo
si possono raggiungere le promesse di incremeento
delle prestazioni e riduzione dei consumi con l'adozione
di questa tecnologia? Con questo articolo Lithium
vi introduce al complesso e affascinanate mondo
dell'integrazione e vi spiega in cosa consiste il
nuovo asso nella manica di AMD... |
|
|
|