Pre-eco

De Viquip??dia

Taula de continguts

1 Definici??
- 1.1 Pre-eco
- 1.2 Pre-emmascarament
2 Possibles solucions
3 Solucions d???alguns codificadors rellevants
4 Vegeu tamb??

[edita] Definici??

[edita] Pre-eco

El pre-eco ??s un fenomen psicoac??stic que es d??na quan es produeix una transici?? d'??udio abrupta, com pot ser el so d'un vas trencant-se. Aquest eco es manifesta com un soroll coloritzat que precedeix i segueix la transici?? d'??udio.

Per exemple, si tenim un to fluix constant en el temps, i de cop apareix un to fort, aquest emmascara el to fluix. El to fort, tot i que pot ser molt sec, est?? format per diversos nivells, un nivell m??xim i un nivell m??nim; d???aquesta manera, conforma una corba de nivell en el temps. Aquesta corba ens serveix per veure de quin punt a quin punt, el to fort emmascara el to fluix. Llavors, tota la part de corba que va des de l???origen del so al pic m??s alt i pronunciat forma el pre-eco, i tot el que ve despr??s del to m??xim, ??s anomenat post-eco. Aquest emmascarament, es tradueix al to fluix com una distorsi??, ja que tota la part que ??s emmascarada deixa de percebre???s, de manera que es creen irregularitats que l???o??da no tolerar??. Aix??, aquesta distorsi?? es pot veure augmentada i es pot estendre en el temps degut a que el pre-emmascarament temporal ??s molt m??s "fort" que el post-emmascarament. Aix??, aquesta distorsi?? es pot veure augmentada i es pot estendre en el temps degut a que el pre-emmascarament temporal ??s molt m??s "fort" que el post-emmascarament.

Espectre freq??encial de la gravaci?? d'unes castanyoles

Aquest efecte es pot veure molt clar en el so d???unes castanyoles(casta??uelas), ja que tot i produir un so molt curt i sec, es pot sentir un petit so abans de l???esclat final. Si ho traslladem a un editor de so, com ara l???Adobe Audition o el Cool Edit, podem veure clarament un so abans del to m??xim.

??s un dels principals problemes que tenen els codificadors d'??udio amb p??rdues com ara MP3, AAC o Ogg Vorbis. La forma com es combat pot arribar a marcar la difer??ncia entre uns i altres.

Per poder escoltar el so del pre-eco, s'adjunten un parell d'enlla??os a p??guines web, on es pot escoltar o baixar-se un fragment d'unes castanyoles per tal veure un exemple clar. El pre-eco es pot escoltar com una mena de 'shhh', just abans de l'esclat principal:

[edita] Pre-emmascarament

Podem dir, per tant, que el pre-eco ser?? el causant del pre-emmascarament: produint-se primer un est??mul suau i posteriorment un to intens, aquest ??ltim emmascarar?? igualment al de menor amplitud, sempre i quan estiguin separats en el temps per una difer??ncia menor d'entre 5 i 10 ms. Donat que aquest fenomen es presenta encara abans que el to emmascarant aparegui, implica que sigui m??s problem??tic que el post-emmascarament.

L'explicaci?? d'aquesta ???anticipaci?????, rau en que la informaci?? que arriba al c??rtex auditiu del cervell hum?? es processa per r??fegues. Tanmateix, ??s sabut que els sons intensos s??n processats de forma m??s r??pida pel cervell que els sons suaus, facilitant d'aquesta manera el fenomen psicoac??stic del pre-emmascarament.

[edita] Possibles solucions

El problema que sorgeix en el camp de la codificaci?? d?????udio per culpa del pre-eco, ??s la quantificaci?? del senyal per tal d???eliminar informaci?? redundant. Al passar de la representaci?? temporal a la freq??encial, el que fem ??s transformar la senyal cont??nua en discreta, representant els principals harm??nics de la senyal. Al fer-ho tamb?? quantificarem l???error causat pel pre-eco, de manera que al final, tindrem informaci?? de distorsi?? afegida a la senyal original. Com que la majoria de Codecs de compressi?? d?????udio, nom??s codifiquen la informaci?? que queda emmascarada pels tons m??s forts, tot l???error del pre-eco quedaria codificat,en canvi, la informaci?? del to original que queda emmascarat no.

Per aix??, ??s molt important intentar reduir l???efecte del pre-eco, o eliminar-lo d???alguna manera. Existeisen diferents maneres de reduir o eliminar el fenomen del pre-eco, dues de les t??cniques m??s exteses s??n:

Usar filtres pas baix i eliminar les components d'alta freq????ncia, assegurant d'aquesta manera evitar el pre-eco. Eliminant pics d???alta freq????ncia, fem que la senyal original no tingui prou energia per poder provocar l'emmascarament de la resta de sons, per la qual cosa, l'efecte de pre-emmascarament no succeir?? i per tant, el pre-eco tampoc es produir??. Tot i aix??, al eliminar els pics d'alta freq????ncia, s'elimina tamb?? informaci?? ??til i important per poder aconseguir la qualitat final desitjada. ??s per aix?? que molts dels principals codificadors no utilitzen aquesta t??cnica.

Tot i aix??, es pot optar per una millora d'aquest proc??s, utilitzant un bancs de filtres per poder dividir la senyal en diferents bandes, de manera que es poden tractar per separat, podem seleccionar quina part de la senyal cont?? imperfeccions com el pre-eco i aix?? aplicar el filtre necessari per atenuar el seu efecte. Una cosa semblant ??s el que realitzen molts dels codificadors actuals, ??s l'anomenada la transformada directa del cosinus modificat(MDCT), la qual permet que, un cop dividida la senyal en bandes, es pot fer un mostreig d'aquestes mitjan??ant finestres de diferents longituds pel domini temporal i freq??encial. La MDC es caracteritza per la seva propietat de solapament de finestres, amb la qual cosa s'eviten els problemes originats a les fronteres de les finestres. Al solepar-se, no hi ha part de senyal sense codificar, per la qual cosa, en les parts on es detecten transicions abruptes, es pot escollir la longitud de finestra adequada amb la que mostrejar, de manera que es podr?? codificar el pre-eco correctament reduint exponencialment el seu efecte.

T??cniques tipus joint stereo, les quals es basen en combinar un rang de freq????ncies de m??ltiples canals de so junts, de manera que el resultat de la codificaci?? preservi la informaci?? d???aquest rang, no com un munt de canals separats, sin?? com un sol corrent de dades homogeni. Aquest proc??s disminueix enormement la quantitat d???espai d???emmagatzament necessari i, a m??s, ??s totalment irreversible. Alhora de realitzar la codificaci??, la t??cnica de joint stereo actua segons el principi de la localitzaci?? del so, ??s a dir, en com l???o??da humana capta el so. Explotant la limitaci?? de la o??da, pot reduir la taxa de bit de dades del corrent, sense provocar una p??rdua significativa en la qualitat del so aparent.

Tanmateix, aquestes solucions afegeixen distorsi??, per?? aquesta distorsi?? addicional ??s molt menys audible gr??cies al post-emmascarament temporal.

[edita] Solucions d???alguns codificadors rellevants

[edita] ATRAC (Adaptive TRansform Acoustic Coding)

Algorisme de codificaci?? d?????udio amb p??rdues desenvolupat per Sony, basat en principis psicoac??stics, que ofereix diferents tasses de compressi??, segons la qualitat del so. Actualment hi ha 3 versions al mercat: ATRAC1, ATRAC3 I ATRAC3plus. ATRAC1 utiliza codificaci?? perceptual, la qual es basa en la psicoac??stica i aprofita les imperfeccions de l???o??da humana per evitar digitalitzar els sons que una persona no percebr??. Per fer-ho, divideix la senyal d???entrada en 3 bandes freq??encials:

1. Inferior a 5,5 kHz

2. Entre 5,5 i 11 kHz

3. M??s de 11 kHz

Cada banda ??s analitzada i filtrada independentment, fent ??s de la transformada directa del cosinus modificat(MDCT), la qual ens permetr?? fer una superposici?? de finestres en domini temporal de fins un 50%. Aix??, millorarem la resoluci?? en freq????ncia i evitarem l???aliasing. Un modul o bloc en l???esquema de codificaci?? ens permetr?? escollir la longitud de les finestres per tal de poder comparar-les amb els par??metres psicoac??stics de l???o??da. Dos modes a seleccionar:

Mode curt (short mode) : Finestres de 1.45 ms en la banda d???alta alta freq????ncia i 2.9 ms en la resta.

Mode llarg (long mode) : Finestres de 11.6 ms.

Per prevenir el pre-eco ATRAC canvia a mode curt (short mode) quan detecta una senyal d???atac (transici?? abrupta). Aix??, nom??s hi ha un segment molt petit de soroll abans de l???atac i la resta queda dissimulat gr??cies al post-emmascarament temporal.Tot i aix??, si el canvi de finestra no es du a terme a causa d???un error del bloc i continu??ssim amb el mode llarg, l???emmascarament posterior no tindria els mateixos efectes, ja que el soroll quedaria emmascarat durant un temps molt petit i inferior a la longitud de la finestra.

ATRAC3, fa la mateixa codificaci??, per?? en comptes de dividir la senyal en 3 bandes, la divideix en 4, donant m??s ??mfasi a les freq????ncies mitjanes.

[edita] MPEG-1 Audio Layer 3

M??s conegut com a MP3, ??s una format d?????udio digital comprimit amb p??rdues desenvolupat per el Moving Picture Experts Group (MPEG) per formar part de la versi?? 1 (i posteriorment ampliada a la versi?? 2) del format de v??deo MPEG.

Codificaci?? mp3 de la gravaci?? d'unes castanyoles, realitzada amb l'ajuda d'un editor d'??udio

Aquesta capa, est?? implementat el banc de filtres h??brids, que fa que el seu disseny tingui una major complexitat en relaci?? amb els seus predecessors(MPEG1 i MPEG2). Tot i aix??, aquesta millora de la resoluci?? freq??encial, empitjora la resoluci?? temporal, de manera que s???introdueixen problemes de pre-eco, els quals s??n predits i corregits.

El banc de filtres ??s conegut com banc de filtres h??brids polifase/MDCT, de manera que utilitza un sistema semblant al de ATRAC per eliminat el pre-eco. El banc s???encarrega de fer el mapeig del domini temporal al domini freq??encial, tant en el codificador com en el de-codificador. Les mostres de sortida del banc s??n quantitzades i proporcionen una resoluci?? en freq????ncia variable, 6x32 o 18x32 subbandes, ajustant-se molt millor a les bandes cr??tiques de les diferents freq????ncies. Fent servir 18 punts, el nombre m??xim de components freq??encials ??s de: 32x18=576 de manera que la resoluci?? freq??encial ser?? de: 24000/576=41,67 Hz (si fs=48 kHz). Si s???usen 6 l??nies de freq????ncia la resoluci?? freq??encial ??s menor, per?? la temporal ??s major, i s???aplica en aquelles zones en les que s???espera efectes de pre-eco.

[edita] Ogg Vorbis

Vorbis ??s un c??dec d?????udio lliure de compressi?? amb p??rdues. Forma part del projecte Ogg i s???anomena Ogg Vorbis.

C??dec perceptiu general, amb l???objectiu de permetre la m??xima flexibilitat del codificador, de manera que aquest pugui generar una ??mplia gamma de bitrates(taxa de bits). En l???escala de nivell qualitat/bitrate, ??s igual que MPEG-2 i comparable amb AAC en la majoria de bitrates. Pot codificar nivells de qualitat des de CD ??udio(44.1 kbps) i DAT-rate est??reo, fins a 48 kbps sense baixar la freq????ncia de mostreig, tot i que Vorbis tamb?? pot treballar a baixes freq????ncies de mostreig des de la telef??nica(8kHz) fins a alta definici?? (192 kHz).

Codificaci?? Ogg Vorbis de la gravaci?? d'unes castanyoles, realitzada amb l'ajuda d'un editor d'??udio

Igualment que en els altres dos codificadors, Vorbis tamb?? es basa en la transformada directa del cosinus modificat(MDCT), d???aquesta manera pot passar les dades del domini temporal al freq??encial. Les dades resultants, s??n partides en soroll i residus de components i aquestes s??n quantitzades i codificades de manera entr??pica fent servir un algorisme basat en un vector de quantitzaci??. La codificaci?? per entropia ??s un esquema de compressi?? de dades sense p??rdues que ??s independent de les caracter??stiques espec??fiques dels mitjans de comunicaci??. L???algorisme de vector de quantitzaci?? ens servir?? per quantitzar les dades seguint un model de densitat de probabilitat. Al fer la descodificaci?? aquestes etapes s??n invertides.

D???aquesta manera, segons el bitrate que tingui, Vorbis codificar?? d???una manera o altre les dades d???entrada, ??s a dir, si el bitrate ??s massa baix no caldr?? codificar les dades, sin?? que es far?? la codificaci?? entr??pica i aix?? no hi haur?? p??rdues. Per tant, pel tractament donat a les dades, juntament amb la divisi?? del soroll, la codificaci?? Vorbis d??na un so molt caracter??stic, el qual molta gent prefereix abans que el so met??l.lic del format MP3.

El principal problema de Vorbis ??s doncs, el pre-eco, ja que en bitrates baixos no quedar?? eliminat. El que fan la majoria de versions de Ogg Vorbis ??s intentar que el problema quedi resolt augmentant la qualitat del so en les zones de configuraci?? de menys qualitat. D'aquesta manera, s'aconsegueix que la part on resideix el pre-eco quedi codificada de manera entr??pica i aix?? no es produir??n p??rdues.

[edita] MPEG-2 AAC

MPEG-2 AAC proporciona la qualitat m??s alta per els usos on MPEG-1 no pot donar total compatibilitat. Mentre que MPEG-2 BC proporciona una bona qualitat d?????udio per taxes de bit de 640-896 kbps per cinc canals de banda total, MPEG-2 AAC proporciona una qualitat molt bona en menys de la mitat de la taxa de bits. El diagrama de bloques d???un codificador AAC el podem veure en l'esquema que ve adjuntat. El primer que veiem ??s el control de guany, el qual divideix la senyal d???entrada en quatre bandes de freq????ncies igualment espaiades. Llavors es codifiquen flexiblement per tal de poder representar una gran varietat de taxes de mostreig. ??s en aquest pas on el codificador de tipus AAC actuar?? per poder eliminar o atenuar l???efecte del pre-eco.

Fent ??s del CMFB (Cosine Modulated Filter Bank), el codificador MPEG-2 AAC ??s capa?? de seleccionar diferents longitud de finestres per tal de que quan es faci el mostreig de la senyal d???entrada, es pugui seleccionar una finestra suficientment petita com per poder detectar el fenomen del pre-eco(entre 1 i 4ms), ja que d???aquesta manera, el pre-eco quedar?? emmascarat pel mateix efecte de pre-emmascarament que produeix l'o??da humana.

Aquest sistema tamb?? l???usen altres codificadors, com ara MPEG capa 3, la codificaci?? Dolby de AC-3 i de MPEG-4 T/F.

Esquema MPEG-2ACC

[edita] Vegeu tamb??

Categoria: Ac??stica