ATRAC
De Viquip??dia
ATRAC (Adaptive TRansform Acoustic Coding) ??s un algoritme de codificaci?? (c??dec d'??udio) desenvolupat per Sony basat en principis psicoac??stics que ofereix diferents nivells de compressi?? depenen de la qualitat de so desitjada. Actualment, s'usa per a guardar informaci?? de senyals d'??udio en MiniDisc i altres productes reproductors d'??udio de la mateixa marca Sony. Tanmateix, altres fabricants com Sharp i Panasonic tenen tamb?? les seves pr??pies versions del c??dec.
Taula de continguts |
[edita] Evoluci??
La primera versi?? d'aquest c??dec ATRAC-1 es va desenvolupar el 1992 i aconseguia comprimir la informaci?? d'??udio aproximadament 1/5 de la taxa de dades d'un CD. Tanmateix, aquesta tecnologia no ha deixat d'evolucionar i les seves versions m??s recents ATRAC3 i ATRAC3plus que van apar??ixer l'any 1999 i el 2002 ofereixen compressions majors, d'aproximadament 1/10 i 1/20 de la taxa de dades d'un CD, respectivament. El fet de poder reduir la mida de les dades d'??udio mantenint una qualitat prou bona ha perm??s enregistrar m??s temes en els diferents suports d'emmagatzematge i reproducci??, canviant la manera en qu?? escoltem la m??sica.
PCM | ATRAC1 | ATRAC3 | ATRAC3plus | ||
---|---|---|---|---|---|
Bitrate | 1411 kbps | 292 kbps | 132 kbps | 64 kbps | |
Mida Dades
(can???? de 4 minuts) |
42,33 MB | 8,77 MB | 3,97 MB | 1,94 MB | |
Nombre de can??ons grabades
en CD-R (700 MB) |
16 | 79 | 176 | 360 |
[edita] Tecnologia
El ATRAC utilitza el que s'anomena codificaci?? perceptual. La codificaci?? perceptual es basa en la psicoac??stica i aprofita les imperfeccions de l'o??da humana per evitar digitalitzar els sons que aquesta dif??cilment percebr??.
D'aquesta manera, i com molts altres c??decs com ara MP3 o ePAC (enhanced Perceptual Audio Coder) intenten codificar aquells sons que queden per sobre del llindar d'emmascarament (sons audibles). ??s per aix??, que ATRAC elimina las freq????ncies que l'o??da humana no es capa?? de recon??ixer, quedant-se nom??s amb les audiofreq??encies (20 a 20 000 Hz).
[edita] ATRAC1
ATRAC1 va ser el format utilitzat per Sony en el seu sistema SDDS als anys noranta. Aquest sistema multicanal utilitza 8 canals codificats mitjan??ant aquesta codificaci??, obtenint un bitrate global de tots els canals de 1168 kbit/s. ??s per aix??, que podr??em dir que ??s un dels principals competidors de Dolby Digital (AC-3) i altres sistemes com el DTS.
[edita] Diagrama de blocs
[edita] An??lisi temporal- freq??encial
ATRAC1 divideix el senyal en tres parts o bandes:
- 1. Inferior a 5,5 kHz
- 2. Entre 5,5 i 11 kHz
- 3. M??s de 11 kHz
Cada una d'aquestes tres parts s'obt?? a partir de Quadrature Mirror Filters (QMF). El senyal d'entrada queda dividit en altes i baixes freq????ncies pel primer d'aquests filtres i seguidament un altre QMF divideix les baixes freq????ncies per a obtenir les tres bandes anteriorment mencionades. La utilitzaci?? dels QMF assegura que el possible aliasing en domini temporal produ??t per la descomposici?? en bandes es cancel??li durant la reconstrucci??. Cada una d'aquestes bandes ??s analitzada i filtrada independentment, utilitzant la transformada directa del cosinus modificada (MDTC). La MDTC permet una superposici?? de les finestres en domini temporal de fins a un 50% permetent millorar la resoluci?? freq??encial tot mantenint el mostreig cr??tic (perqu?? no es produeixi aliasing). D'aquesta forma el senyal ??s analitzat d'acord amb els principis de la psicoac??stica. Aquest an??lisi indica quines parts del senyal o unitats s??n cr??tiques i han de ser codificades amb gran precisi?? per no perdre informaci?? del senyal rellevant i quines poden tolerar que es quantifiqui soroll sense degradar el senyal ni la percepci?? de la qualitat de so d'aquest (menys precisi??). Basant-se amb aquesta informaci?? els bits per a la quantificaci?? disponibles s??n assignats a les unitats o parts freq??encials i temporals. Els coeficients espectrals obtinguts en cada unitat s??n llavors quantificats d'acord amb els bits assignats. Posteriorment, al descodificador, l'espectre quantificat es reconstrueix d'acord amb l'assignaci?? de bits i despr??s se sintetitza en senyal d'??udio. A part d'aquest proc??s que solen realitzar la gran majoria de c??decs d'??udio ATRAC usa la psicoac??stica i conceptes com el llindar d'emmascarament no nom??s en l'algoritme d'assignaci?? de bits, sin?? que l'aplica en la separaci?? de les parts temporal-freq??encial en qu?? divideix el senyal. D'aquesta manera, el senyal d'entrada s'analitza en divisions freq??encials no uniformes que emfatitzen les regions freq??encials m??s sensibles de l'o??da humana(d'acord amb proves experimentals realitzades i les corbes isof??niques), al voltant dels 4 kHz. A m??s, ATRAC utilitza un bloc en la seva codificaci?? que permet adaptar la llargada de les finestres que utilitza, segons el senyal d'entrada. D'aquesta manera, s'assegura no malbaratar bits en codificar passatges de transici?? o silencis.
Aquest bloc de llargada adaptativa escull la llargada de les finestres d'acord amb les caracter??stiques del senyal. Hi han dos modes:
- 1. Mode curt (short mode) : Usa finestres 1.45 ms en la banda d'alta freq????ncia i 2.9 ms en les altres.
- 2. Mode llarg (long mode) : Usa finestres 11.6 ms. Aquest mode normalment s'usa per proporcionar bones resolucions freq??encials.
Tanmateix, el fet d'usar finestres de llargada adaptativa no fa immune el sistema del que s'anomena pre-eco i que resulta ser un dels principals problemes en la majoria dels c??decs d'??udio. El pre-eco ??s fruit de transicions abruptes d'??udio, com ara el soroll d'un vas trencant-se, aix?? crea un soroll que s'est??n per totes les mostres de la finestra. No obstant, si la llargada de la finestra ??s prou petita, l'emmascarament temporal pot enfosquir el soroll afegit abans i despr??s de la transici??. Els efectes de l'eco s??n m??s preocupants abans de la transici?? ja que els efectes de l'emmascarament temporal afecten molt m??s les zones posteriors al to que les anteriors.
[edita] Com soluciona ATRAC aquest problema?
Per prevenir el pre-eco ATRAC canvia a mode curt de finestra (short mode) quan detecta un senyal d'atac (transici?? abrupta). Aix??, nom??s hi ha un petit segment de soroll abans de l'atac i la resta s'emmascara gr??cies al post-emmascarament temporal. Tanmateix, si el canvi de finestra no es dugu??s a terme a causa d'un error del bloc adaptatiu i segu??ssim en mode llarg l'emmascarament temporal posterior (post-emmascarament) no tindria els efectes desitjats perqu?? el soroll quedaria emmascarat durant un per??ode de temps molt petit i for??a inferior a la llarg??ria de la finestra.
[edita] Quantificaci?? espectral
Per ??ltim ATRAC emmagatzema tota la informaci?? necess??ria per reconstruir el senyal d'??udio. Els valors espectrals s??n quantificats utilitzant dos par??metres : llargada de paraula i factor d'escalat. El factor d'escalat defineix el rang total d'escalat de la quantificaci??. Mentre que, la llargada de la paraula (wordlength) defineix la precisi?? dins de l'escala. Cada unitat t?? la mateixa llargada de paraula i factor d'escalat, reflectint una similaritat psicoac??stica de les freq????ncies agrupades. El factor d'escalat s'escull d'una llista fixa de possibilitats i reflecteix la magnitud dels coeficients espectrals de cada unitat. La llargada de paraula es determina amb l'algoritme d'assignaci?? de bits. Per cada quadre de so (corresponent a 512 mostres del senyal d'entrada), s'emmagatzema la seg??ent informaci??:
- 1. MDCT llargada de finestra (curta o llarga).
- 2. Llargada de paraula de cada unitat.
- 3. Factor d'escalat de cada unitat.
- 4. Coeficients espectrals quantificats.
Per garantir la correcta reconstrucci?? del senyal la informaci?? m??s rellevant es guarda de forma redundant. Com tamb?? s'emmagatzema la quantitat de dades redundants.
[edita] Assignaci?? de bits
L'algoritme d'assignaci?? de bits divideix els bits disponibles entre les diferents unitats. Les unitats amb un alt nombre de bits, tindran menys quantificaci?? de soroll. Per contra, aquelles amb pocs o cap bit en tindran prou.
Cal dir, que aquest algoritme ha d'assegurar que les unitats cr??tiques o rellevants tinguin prou bits i, alhora, que el soroll en les unitats no tant rellevants no sigui perceptualment significant. ??s important mencionar que ATRAC usa codificaci?? entr??pica atorgant menys bits als valors m??s redundants, de forma que reduirem considerablement la mida del fitxer.
Tal i com podem veure al diagrama de blocs d'aquest c??dec el descodificador ??s totalment independent de l'algoritme d'assignaci?? de bits, cosa que permet fer evolucionar el sistema sense haver de canviar els dispositius reproductors. D'aquesta forma, Sony presentava m??ltiples possibilitats per a aquesta assignaci?? que analitzarem en les noves versions que ha presentat.
[edita] ATRAC3
Aquesta nova versi?? segueix els mateixos principis de funcionament que l'anterior, tot introduint noves millores. D'aquesta forma, duplica la capacitat de compressi?? d'ATRAC sense gaireb?? produir p??rdues en la qualitat del so resultant (1/10 de la taxa de bits d'un CD).
Divideix el senyal en 4 parts:
- 1. Inferior a 2.75625 kHz
- 2. De 2.75625 a 5.5125 kHz
- 3. De 5.5125 a 11.025 kHz
- 4. Superior a 11.025 kHz dins de les audiofreq????ncies
Alhora, classifica el so de forma m??s eficient que l'anterior versi?? permetent diferenciar tons purs, com ara els violins i els sons d'alt nivell de pressi?? sonora, de la resta del senyal. Aquest fet, ??s similar al comentat anteriorment on es parlava d'unitats cr??tiques i no cr??tiques.
A m??s, utilitza un algoritme d'assignaci?? que permet reduir for??a el nombre de bits utilitzats en la codificaci?? reduint la mida del fitxer d'??udio (codificaci?? entr??pica). Tanmateix, cal tenir present que la informaci?? rellevant o de m??s intensitat s'haur?? de codificar amb m??s bits per tal que no es quantifiqui el soroll. ??s per aix?? que al 11, senyal de molta intensitat, li assigna 111 (m??s bits) i al 00 , senyal d'??udio de poc nivell o poc rellevant, se li assigna un ??nic bit.
Presenta dos modes: LP2 i LP4
- 1. LP2: Aquest mode utilitza un taxa de bits de 132 kbit/s obtenint una qualitat similar al MP3 codificat al mateix bitrate.
- 2. LP4 : Aquest mode redueix la taxa de bits a la meitat de LP2 (66 kbit/s), gr??cies al fet d'utilitzar principis similars a la codificaci?? joint stereo o un filtre pas baix al voltant dels 13,5 kHz.
Ambdues t??cniques permeten minimitzar l'efecte de pre-eco amb millors resultats que en l'anterior versi??.
[edita] Com soluciona ATRAC3 el problema del pre-eco?
El filtre pas baix eliminar?? les transicions abruptes a partir d'una certa freq????ncia. Alhora, el fet de utilitzar codificacions similars al joint stereo permet sumar el canal dret i esquerra per sobre d'una certa freq????ncia, guardar la difer??ncia entre els dos canals i durant la descodificaci?? reconstruir la informaci?? d'alta freq????ncia del canal dret i esquerra recombinant la informaci?? comuna de cada canal.
D'aquesta manera, evitem quantitzar soroll i que se'ns propagui al llarg d'una finestra sencera.
[edita] Aplicacions
RealAudio 8
[edita] ATRAC3plus
Millores que presenta:
- 1. Divideix el senyal d'??udio en 16 bandes obtenint una millor resoluci?? i m??s precisi??.
- 2. Presenta m??s opcions de llargada de finestra dins del bloc adaptatiu, permetent usar finestres m??s llargues de fins a 4096 mostres.
- 3. Presenta nous algoritmes d'assignaci?? de bits permeten millorar un dels d??ficits que presentaven les antigues versions per determinats passatges musicals o de veu on la qualitat final variava depenen del tipus de senyal d'??udio.
[edita] Assignaci?? de bits
Presenta dos regles apropiades per determinats tipus de senyals d'??udio.
Regla A:
00 ??? 0 | 01 ??? 10 | 10 ??? 110 | 11 ??? 111 |
Regla B:
00 ??? 0 | 01 ??? 110 | 10 ??? 111 | 11 ??? 10 |
Observem que la regla A ??s apropiada per senyals que aprofitin tot el rang din??mic i que tinguin una probabilitat d'ocurr??ncia alta de valors amb un alt nivell de pressi?? sonora elevada.
Per contra, la regla B ??s apropiada per senyals d'??udio amb relativament pocs valors o mostres amb un alt nivell de pressi?? sonora.
Amb la utilitzaci?? de tots aquests aspectes aconseguim reduir la taxa de dades, bitrate, de forma considerable aconseguint factors de compressi?? d'aproximadament 1/20 la taxa de dades d'un CD (PCM lineal).
[edita] Aplicacions
- 1. Reproductors Hi-MD ("Hi-LP i Hi-SP")
- 2. Mem??ries Flash d'emmagatzematge i reproducci??
- 3. Consola PSP
(Vegeu M??todes de compressi?? pels m??todes i formats i est??ndards de compressi?? - pels formats)
C??decs de v??deo |
|
||||
---|---|---|---|---|---|
C??decs d'??udio |
|
||||
Compressors d'arxius |
|