| MP3-PRO:
L'evoluzione della specie
|
L'MP3
è uno standard relativamente vecchio . È stato sviluppato
nei primissimi anni '90 (venne definito nel 1991 e standardizzato
dall'ISO e dalla IEC alla fine del 1992) e i suoi stessi sviluppatori
riconoscono che esso ha rappresentato un primo tentativo di
utilizzare efficacemente i modelli psico-acustici per limitare
la ridondanza dell'informazione presente in un file campionato
in modalità PCM.
Ne è passata di acqua sotto i ponti da quando il Prof.
Brandenburg, padre dell'MP3, utilizzava come personalissimo
"benchmark" per la valutazione della qualità di codifica il
brano "Tom's diner" di Suzanne Vega! A tutt'oggi, purtroppo,
non esiste uno standard "matematico", oggettivo, per stabilire
se un encoder è meglio di un altro e bisogna affidarsi ai
propri sensi, ma la tecnologia ha fatto passi da gigante e
una delle novità da essa introdotte in materia di codifica
audio è senza dubbio l'SBR.
SBR
sta per Spectral Band Replication, cioè eco della banda
spettrale, ed offre la possibilità di migliorare la resa dell'audio
a bassi bit-rate e della voce compressa sia incrementando
la banda per un fissato bit-rate, sia migliorando l'efficienza
di codifica per un fissato livello di qualità.
MP3
+ SBR = l'MP3-pro !
Cerchiamo
di capire come MP3 si fonde con SBR per dar vita all' MP3-Pro:
Allo stato attuale, la qualità CD viene ottenuta con un bit-rate
tipico di 128Kbit al secondo. Al di sotto di questo valore,
la qualità sonora degrada notevolmente, sia per il fatto che
la banda audio prelevata è scarsa, sia per il fatto che il
modello percettivo introduce degli artefatti fastidiosi nel
processo di codifica nel tentativo di rappresentare l'informazione
completa. Ad esempio, a 64Kbit/s, l'Mp3 offre una banda di
soli 10Khz su un range di 20Khz rilevabile dal nostro udito.
Nella figura seguente è illustrato il comportamento da filtro
passa basso attuato dall'encoding con un basso bit-rate. Le
medie- alte frequenze, sopra i 5KHz, vengono tagliate via
e non potranno più essere riprodotte con un decoder MP3.
La
soluzione tecnica a tale inconveniete è quella di cercare
di "ricostruire" l'informazione persa sulla base dell'analisi
delle basse frequenze trasmesse. È proprio questo il compito
dell'SBR : l'encoder MP3 trasmette le basse frequenze più
alcuni bit di informazione che saranno letti e interpretati
dal software SBR ai fini della ricostruzione spettrale .

La
potenza dell'SBR è che, in linea di principio, può lavorare
con qualsiasi encoder (MP3, AAC, TwinVQ), basta che sia ben
costruita l'interfaccia fra l'SBR e lo strato sottostante,
che è il "motore" di compressione vero e proprio.
I files compressi in MP3-pro sono leggibili dai normali
lettori MP3, ma le informazioni portate dalla side-band dell'SBR
(ad un data-rate molto basso, comunque, per la nostra gioia)
costituiranno un overhead, cioè un sovrappiù di dati inutilizzabile.
Essendo l'SBR una tecnica proprietaria sviluppata
congiuntamente dall' Fraunhofer Ins. e da Thomson Multimedia,
per adesso non ci è dato sapere altri dettagli implementativi.
Sembra comunque che l'approccio sia quello di "tentare"
una ricostruzione delle armoniche di ordine superiore (tagliate
via dai filtri) tramite l'analisi di quelle presenti a più
bassa frequenza. Si tratta quindi principalemnte di una tecnica
di post-processing dove, per ottenere una maggiore accuratezza,
una piccola quantità di informazioni "guida"
addizionali viene comunque trasmessa all'unità di ricostruzione
del segnale. Torneremo sull'argomento non appena saranno disponibili
nuovi elementi.
In ogni caso, l'introduzione dell'SBR conduce ad un
netto miglioramento della qualità audio a parità di bit-rate
rispetto all'MP3 standard: personalmente ritengo esagerate
le affermazioni secondo le quali la qualità di un brano codificato
in MP3-pro a 64Kbit/s sia analoga a quella di un brano MP3
a 128Kbit/s. È più veritiero riconoscere che i 64Kbit/s in
MP3-pro portano ad una qualità che è compresa fra quelle a
96 e 112Kbit/s in MP3 . Il che è comunque un OTTIMO risultato,
tenendo conto del fatto che l'MP3-pro è anche retrocompatibile.
La ricostruzione dell'informazione è efficiente sia
per il suono armonico che per le componenti noise-like (per
approfondire l'argomento si consulti questo
box) e permette una corretta "sagomatura" della forma
d'onda tenendo conto sia del mascheramento in frequenza che
di quello nel tempo (per capire i principi del mascheramento,
si consulti il passato articolo).
Considerazioni - MP3 senza limiti ?
Detto questo si potrebbe pensare che MP3Pro sia il
formato di compressione più efficiante disponibile
sulla piazza. In realtà, come abbiamo già detto,
la tecnologia SBR può essere affiancata a qualsiasi
tecnologia di compressione quindi se si riesce a trovare un
codec migliore dell' MP3 liscio, ci sono ampie possibilità
di ottenere, in congiunzione con SBR, uncodec ancora più
efficiente di MP3Pro. Come vedremo nelle prossime pagine,
oltre ad MP3 esistono altre tecnologie di compressione che
riescono ad offrire performance migliori come VQF e Real Audio
G2. L'accoppiata di queste tecniche con l'SBR potrebbe certamente
portare a risultati migliori ma perderemmo necessariamente
il vantaggio fondamentale di MP3Pro: la Backward Compatibility.
Una ulteriore limitazione del formato MP3 (e MP3Pro)
è data dal numero di canali gestibili simultaneamente. Una
configurazione 5+1, come quella del Dolby Digital per
intenderci, in cui ho 5 canali indipendenti che trasportano
informazione mentre le bassissime frequenze vengono pilotate
verso un sub-woofer prelevandole dai 5 canali suddetti, richiederebbe
un tasso nell'ordine dei 600-800Kbit/s per soddisfare le specifiche
di qualità imposte dalla Dolby. Un simile bit-rate è troppo
alto e per questo motivo la Dolby è stata uno dei principali
finanziatori nello sviluppo della codifica AAC (la
analizzeremo in dettaglio dopo), che raggiunge una elevatissima
qualità percettiva nonostante vengano utilizzati solo 64Kbit/s
per canale (solo 320Kbit/s per ben cinque canali!).