
La
povera persona di cui prima si trova sempre nella solita stanza
silenziosa. Stavolta viene diffuso un tono alla frequenza
di 1KHz, detto tono maschera, tenuto fisso a 60dB (leggi volume
alto). Ripetiamo il discorso di prima sulla soglia di udibilità
di un secondo tono, detto tono di test. Quello che emerge
è che avvicinandoci sia da sinistra che da destra al tono
maschera, dobbiamo alzare il volume del tono test per riuscire
a distinguerlo. Oltre i 4 Khz e al di sotto degli 0.5 le cose
tornano a posto, però notiamo che nell'intorno di 1KHz i due
toni sono praticamente indistinguibili a meno di non alzare
pesantemente il volume del tono test.
In sostanza, una frequenza "debole" può essere benissimo
mascherata, cioè risultare inudibile, da una frequenza anche
lontana qualche centinaio di Hz, se quest'ultima è bella forte,
cioè con una intensità alta. Se abbiamo più toni tenuti fissi
a volumi belli alti, per esempio a 60 dB e a frequenze fisse
di 0.25, 1 , 4 e 8 KHz, notiamo che la risoluzione del nostro
orecchio peggiora sempre più, perchè per avvisare il segnale
del tono test a ben 1KHz di lontananza dal segnale tenuto
fisso a 4 KHz, il segnale del tono test deve raggiungere i
40dB! Se non vi fosse stato il tono maschera a 4 KHz sarebbero
bastati un paio di dB.
Anche
il fenomeno appena descritto ci viene incontro ed è
possibile eliminare componenti spettrali che, essendo troppo
vicine a suoni forti, non risultano udibili all'orecchio umano.
Finora abbiamo parlato del mascheramento in frequenza
. Esiste però un altro tipo di mascheramento, ed è quello
temporale . Supponiamo di avere al solito due toni, uno forte
e l'altro, che gli è vicino in frequenza, piuttosto debole.
Dall'analisi vista prima sappiamo già che il nostro orecchio
sente solo il tono più forte che si comporta così da tono
maschera. Ora, se improvvisamente questo tono maschera cessa
di esistere, avvertiamo subito il tono più debole o impieghiamo
un pò di tempo per avvertirlo? Chiaramente la seconda, perchè
la membrana del nostro timpano deve assestarsi.....il problema
è : quanto tempo impieghiamo? Dipende dal volume del tono
maschera e da quello del tono test. Se il tono maschera ci
assorda, il nostro povero orecchio impiegherà un bel pò prima
di riuscire a sentire il tono più debole anche dopo che il
tono forte è morto. Al solito, c'è chi queste misurazioni
le ha già fatte:

Il
tono test, di 1KHz, viene disattivato all'istante zero: esso
manteneva un valore fisso di 60dB. Se il nostro test tone
ha un'ampiezza di una quarantina di dB, bastano 5 ms per avvertirlo;
se è di soli 20dB, ne occorrono quasi 20 di millisecondi perchè
risulti avvertibile. Cosa succede se abbiamo più toni a diverse
frequenze e alcuni di questi muoiono? in altri termini, come
si fondono le maschere temporali e quelle in frequenza? La
figura sottostante è molto chiarificatrice:

In conclusione l' effetto
complessivo del mascheramento è che molti toni non saranno
mai udibili perchè collocati nel dominio della frequenza e
del tempo troppo vicino a toni forti. Tenendo conto della
sensibilità dell'orecchio e del fenomeno del Masking
Audio è quindi possibile eliminare dallo spettro del
segnale una quantità molto alta di informazioni inutili,
perchè non udibili dall'orecchio umano.
Questi sono i fenomeni Psico-Acustici su cui si basana i moderni
algoritmi di compressione audio come MP3, MP3Pro, Atrac-3,
AAC, etc...
Chiarito cos'è il mascheramento
, passiamo finalmente alla codifica MPEG.