Una potente famiglia di processori a 64bit
Nel numero di TdS
pubblicato su Lithium nel Febbraio 2002 avevamo già fatto
la conoscenza della famiglia di processori Power di IBM dedicati
alla creazione di potenti sistemi multiprocessore e super-computer,
da non confondersi con la PowerPC dedicata invece ai sistemi consumer.
In particolare il progetto Power4 sorprese per
le elevate caratteristiche tecniche e la fortissima propensione
al multi-processing: Power4 ospita infatti 2 potenti core nei
suoi 170 milioni di transistor, ciascuno dotato di L1 cache da
64KB per i dati (2 vie) e 64KB per le istruzioni (Direct Mapped)
e una L2 cache condivisa di ben 1.5MB (8 vie).
Il Power4 ha due core di
eleborazione molto potenti, capaci di lanciare fino a 8 istruzioni
per ciclo e completarne 5 per ciclo (un valore molto alto). Sono
presenti 8 unità di elaborazione: 2 dedicate ai salti,
2 alle operazioni sugli interi, 2 load/store e 2 unità
per i floating point. E' possibile eseguire fino a 4 operazioni
FP per ciclo (2 MACC). Potenza da vendere quindi.
La grande versatilità
del Power4 è però legata alla specifica predisposizione
alla creazione di sistemi massicciamente paralleli. Con la tecnologia
MMC(Multi Module Chip) è possibile "stipare"
in una cartuccia fino a 4 Power4 (8core complessivi) che con una
serie di bus dedicati comunicano tra loro a velocità elevatissime.
Ogni cartuccia contiene inoltre una L3 cache condivisa da ben
32MB.
Se ciò non bastasse, i moduli MMC possono
essere ancora accorpati fino a costituire un sistema parallelo
da 32 processori. Ogni MMC ha 2 canali monodirezionali di comunicazione
a 128 bit 200Mhz DDR verso la memoria esterna.
Integrato in tecnologia 0.18 micron e funzionante
a circa 1.6 - 1.7GHz, Power4 ha permesso in questi anni ad IBM
di creare potenti sistemi multiprocessore e nodi per supercomputer
cluster.
Power5:
largo alle giovani leve
Il
nuovo esponente della famiglia Power non ha niente da invidiare
al suo predecessore, anzi. Power5 utilizza ben 276 milioni di
transistor, integrati in 389mmq in tecnologia IBM 0.13 micron
CopperSOI. Il package esibisce qualcosa come 5400 pin (2313 per
i segnali e 3057 per l'alimentazione e la massa).
Come nel Power4, il chip ospita due CPU indipendenti
ciascuna delle quali dotata, questa volta, di tecnologia multi-threading
a due vie (analoga all'HyperThreading del P4). Ogni chip include
quindi 2 processori fisici e ben 4 processori logici !
Le risorse interne dei due core sono una ottimizzazione
di quelle del Power4. Per ogni core abbiamo 120 renaming registers,
8 unità di esecuzione, potenziali 5 istruzioni per ciclo
di clock e 4 FLOPs/ciclo. Le cache L1 sono di 64KB per le istruzioni
(2 vie) e 32KB per i dati (4 vie). La L2 cache condivisa tra i
due core sale a 1.92MBytes ed è costituita da 3 banchi
da 640KBytes di cache a 10-vie ciascuno dotato di bus indipendente
(si parla di 200GB/s di banda interna).
Le maggiori migliorie si trovano nei dispositivi
di contorno, quelli che smistano le istruzioni alle varie unità
e permettono di mantenere elevata l'efficienza complessiva. IBM
si è sforzata molto per ottenere il più alto IPC
(Instruction per Cicle) possibile da questa architettura, sia
a livello di singolo thread, sia a livello di multi-threading.
Inoltre, vista la vocazione della famiglia Power
alla creazione di sistemi massicciamente paralleli, sono state
potenziate enormemente le interconnessioni verso l'esterno e le
capacità di multiprocessing. In figura potete infatti osservare
un eccezionale modulo MCM contenente 4 chip Power5 e altri 4 chip
di L3 cache per complessive 8 CPU fisiche, 16 CPU logiche e 144MB
di L3 cache (36MB x 4) !.

Nell'MCM sono presenti bus di collegamento tra
i vari processori a velocità inaudite. I processori adiacenti
sono serviti da una coppia di collegamenti unidirezionali a 128bit
e 2GHz di frequenza, mentre i processori opposti hanno i medesimi
bus ma a 1GHz. Sempre alla velocità di 1GHz è connessa
la cache L3 da 36MB ai relativi chip. Inoltre il controller verso
la memoria è integrato direttamente nell'MCM e garantisce
20GB/s di banda.
A sua volta i vari MCM possono essere accoppiati
per creare sistemi sempre più potenti. Si è infatti
stimata la possibilità di creare sistemi multi-processore
grandi quanto un comune armadio rack e capaci di erogare potenze
di 2TFLOPS...non sentite anche voi la parola "SuperComputer"
aleggiare nell'aria?
Performance
A 2GHz Power5 dovrebbe
esibire prestazioni superiori del +50% rispetto al Power4+ a 1.7GHz
con software ricompilato per le nuove features e per il multi-therading,
ciò renderebbe il singolo chip capace di circa 1600 SPECint2000base
e 2300 SPECfp2000base, valori molto elevati, soprattutto considerando
l'elevatissima scalabilità.
(un P4 EE a 3.4GHz sviluppa 1548 SPECfp, un Itanium 2 a 1.5GHz
2100 SPECfp).
Conclusioni
IBM ha di nuovo prodotto della tecnologia di
altissimo livello, contribuendo in un settore che ultimamente,
a parte per le tecnologie introdotte da Intel e AMD, ha visto
un rallentamento negli avanzamenti tecnologici.
Power5 è un processore eccezionale, non
lo vedremo certamente sulle Workstation ne tantomeno sui computer
Desktop e quindi sarà difficile entrare in contatto, anche
per gli addetti ai lavori, con questo mostro di potenza. A noi
basta però sapere che si è fatto un passo avanti
importante nel settore della computazione e che in futuro, buona
parte delle tecnologie che adesso possiamo solo sognare, saranno
presenti nei nostri case...
Anche per questa volta è tutto, arrivederci
alla prossima puntata di Tecnologie
da Sogno...
Per
discutere di questa e di altre tecnologie , iscrivetevi al FORUM
di Lithium.it.
Per essere avvertiti di nuovi articoli iscrivetevi alla
NEWSLETTER
di Lithium.it
Alla
prossima puntata,
Stay on charge, Lithium.it !