LSII - 05 Espacialización, Psicoacústica - Pablo Cetta

download LSII - 05 Espacialización, Psicoacústica - Pablo Cetta

of 15

Transcript of LSII - 05 Espacialización, Psicoacústica - Pablo Cetta

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    1/15

    ARTES MULTIMEDIALES - IUNALENGUAJE SONORO II

    LOCALIZACIN ESPACIAL DEL SONIDODr. Pablo Cetta

    Factores psicofsicos que determinan la localizacin de los eventos sonoros

    La psicofsica, al tratar el problema de la localizacin espacial del sonido, se ha concentradoprincipalmente en las modificaciones que ocurren en las seales que llegan a nuestros odos enrelacin a la direccin y a la distancia del evento sonoro. Los pabellones auditivos, la cabeza, el cuelloy el torso actan de forma combinada, recibiendo los estmulos del campo acstico y

    transformndolos en su recorrido al odo medio a travs de los tmpanos. Cualquier modificacin delas caractersticas de la seal acstica, relacionada con la posicin de la fuente, se convierte en unindicio potencial para la localizacin.

    Suele dividirse a los indicios en dos grupos: temporales (cuando su representacin en el dominio deltiempo resulta ms pertinente para su anlisis) y espectrales(su representacin es ms significativa enel dominio de la frecuencia). Tambin es posible clasificarlos como binaurales (basados en lacomparacin de las diferencias percibidas por cada odo) y monoaurales(aquellos que percibidos porun nico odo, resultan relevantes para la localizacin).

    A partir de los estudios de Lord Rayleigh (1907), se sostuvo por mucho tiempo que derivamos laspistas necesarias para la ubicacin de una fuente de las diferencias interaurales de presin sonora y de

    los tiempos de arribo de las seales acsticas. La diferencia interaural de tiempo pareca aplicable asonidos cuya frecuencia fuera menor a 1500 Hz, mientras que la diferencia interaural de intensidadresultaba til por encima de ese valor. Hoy sabemos que esto es cierto, pero slo si nos referimos asonidos puros.

    La diferencia interaural de nivel de presin sonora (ILD, por Interaural Level Difference) se debeprincipalmente a la accin separadora de la cabeza, que acta como una pantalla. Para frecuenciascuya longitud de onda es menor que el dimetro de la cabeza no se produce difraccin, sino sombraacstica, registrndose una diferencia de nivel que est en funcin del ngulo de incidencia de la onda.

    La diferencia interaural de tiempo (ITD, por Interaural Time Difference) tambin depende del ngulode posicionamiento de la fuente, y el pequeo retardo entre las seales que arriban a cada uno de los

    odos est asociado a la diferencia entre los caminos recorridos.

    Investigaciones posteriores aportaron un indicio monoaural de importancia, expresado a travs de lasmodificaciones espectrales de un evento sonoro en relacin a su posicin. Estas transformaciones sedeben principalmente a la accin del pabelln auditivo, que acta como un filtro.

    Durante el anlisis de las causas que determinan la formacin de una imagen espacial del sonidovamos a considerar, en primer trmino, los fenmenos relacionados con la audicin al aire libre. Enestas condiciones, las nicas seales que percibimos son las que parten directamente de la fuente y sepropagan a travs de ondas progresivas, sin encontrar obstculos a su paso. Es la audicin queexperimentamos en una cmara anecoica, y en ciertas situaciones naturales donde la reflexin sobre elsuelo se encuentra atenuada. Posteriormente, dedicaremos nuestra atencin a la percepcin espacial enrecintos, considerando sus aspectos particulares.

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    2/15

    Pablo Cetta 2

    As como la frecuencia encuentra su correlato sensitivo en la altura, y la intensidad en la sonoridad,denominaremos siguiendo a Blauert (1997)- evento sonoro a una manifestacin perteneciente alterreno de los estmulos fsicos, y evento auditivo a la sensacin vinculada a ese estmulo.

    Para ubicar a un evento sonoro en el espacio utilizaremos coordenadas esfricas. Definimos laposicin de la fuente a travs una distancia (r) y dos ngulos, uno medido sobre el plano horizontal -

    ngulo de azimut (), para el que consideramos 0 al frente- y otro que se eleva sobre este plano ymide la pendiente del vector con origen en el centro de la cabeza del oyente, y extremo en la fuente -ngulo de elevacin ().

    Figura 1 Planos relativos al oyente y ngulos de posicionamiento de la fuente

    Funciones de transferencia del odo externo

    Segn mencionamos antes, el odo externo acta como un filtro, y como tal puede ser definido a partirde su funcin de transferenciaH(z). Esta describe la relacin entre la entrada y la salida.

    X(z) H(z) Y(z) = H(z)X(z)

    Figura 2 Funcin de transferencia

    A fin de simplificar, podemos definir a la funcin de transferencia como la relacin entre el espectrode Fourier de la seal de salida y el de la seal de entrada. Ella nos informa en qu medida vara laamplitud y la fase de cada una de las componentes de la seal que ingresa al filtro.

    Dado que la multiplicacin en el dominio de la frecuencia equivale a la convolucin en el dominio deltiempo, podemos tambin averiguar la seal resultante de un filtro del siguiente modo:

    filtro

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    3/15

    Localizacin espacial del sonido 3

    x(n) h(n) y(n) = h(n) * x(n)

    Figura 3 Filtro caracterizado por su respuesta a impulso

    h(n) es la respuesta a impulso, o sea la seal que egresa del filtro al ingresar un impulso, y el smbolo* representa a la operacin de convolucin.

    En la figura 4 se observa un grfico de dos respuestas a impulso, una por cada odo, grabadas con unacabeza artificial, con la fuente ubicada a 30 de azimut y 0 de elevacin. El eje horizontal correspondeal tiempo y el vertical a la amplitud. Se aprecian claramente las diferencias entre ambas.

    Figura 4 Respuestas a impulso registradas con una cabeza artificial para = 30 y = 0.

    Para clarificar estos conceptos, podemos definir al impulso como una seal discreta cuya primeramuestra es unitaria y todo el resto nulo. El impulso posee una respuesta plana en frecuencia, y suutilizacin nos permite evaluar el comportamiento de un sistema, tanto en los aspectos temporalescomo espectrales por su brevedad, y porque posee energa en todas las frecuencias del rango audible.

    Si registramos un sonido impulsivo en un determinado ambiente producido por un disparo, porejemplo- el recinto responder a ese estmulo con mltiples reflexiones y una coloracin espectralparticular. Efectuando la convolucin entre la respuesta a impulso de la sala y otra seal, grabada de

    un instrumento musical al aire libre por ejemplo , obtendremos un resultado similar al del instrumentoejecutando en ese ambiente. En este caso, hemos evaluado a la sala como si se tratara de un filtro.

    Las funciones de transferencia del odo, reconocidas universalmente a travs de la sigla HRTF (porHead Related Transfer Functions), dependen de la frecuencia, de la distancia de la fuente, del ngulode azimut y delngulo de elevacin.

    Desde un punto de vista prctico, obtenemos las HRTF de un sujeto o una cabeza artificial ubicandomicrfonos en los conductos auditivos y midiendo las respuestas a impulso para diferentes direccionesde la fuente. Estas respuestas, conocidas como HRIR (por Head Related Impulse Response) sonposteriormente transformadas al dominio de la frecuencia con la Transformada Discreta de Fourier(DFT), y conforman las HRTF medidas para posiciones particulares de la fuente. La representacin

    grfica de la magnitud de una HRTF nos permite apreciar cmo vara la amplitud en funcin de lafrecuencia para una posicin dada de la fuente, una vez que la seal ingres en el conducto auditivo.

    filtro

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    4/15

    Pablo Cetta 4

    Por otra parte, la comparacin de varias HRTF nos da una idea de las transformaciones espectrales quetienen lugar al cambiar la posicin del estmulo.

    A pesar de la complejidad demostrada por la envolvente espectral de las HRTF, y por la profundadiversidad expuesta en las funciones medidas sobre diferentes sujetos, es posible distinguir ciertascaractersticas comunes a todas, segn se observa en la figura 5 (Kendall y Martens, 1984). Las curvascorresponden a las HRTF medidas sobre dos sujetos, variando el ngulo de elevacin entre 0 y 30 enpasos de 10, con la fuente ubicada a 10 metros.

    Figura 5 HRTF medidas sobre dos sujetos entre 0 y 30 de elevacin,en pasos de 10 (Kendall y Martens, 1984)

    La lnea slida corresponde a 0, los guiones largos a 10, los cortos a 20 y la lnea punteada a 30. Seobservan claramente dos importantes depresiones, que aportaran un indicio vlido en funcin delngulo de elevacin de la fuente.

    Indicios binaurales

    Los indicios binaurales no dependen de manera crtica de las caractersticas de la fuente, o delconocimiento previo que el oyente posea de ella. Resulta razonable creer que guardamos en nuestramemoria las caractersticas aprendidas de nuestras propias funciones de transferencia. En la audicinpracticada con un solo odo, en cambio, debemos conocer de antemano el sonido que esa fuenteprovoca.

    La distancia entre la fuente y el sujeto afecta a las diferencias interaurales. La diferencia interaural de

    nivel sonoro depende en gran medida de la distancia, mientras que la diferencia interaural de tiempose ve escasamente afectada.

    La diferencia interaural de tiempo es uno de los indicios ms importantes en la localizacin espacial.Experiencias realizadas por Wightman y Kistler (1992) revelaron que la ITD podra ser la pista delocalizacin ms slida. Al presentar seales donde la ITD guiaba a la percepcin hacia una posicindeterminada de la fuente, mientras que los otros indicios apuntaban a posiciones diferentes, los juiciosse orientaban hacia aquellas ubicaciones sealadas por la ITD, en tanto el estmulo conservara energaa bajas frecuencias. Sin embargo, cuando las frecuencias por debajo de 1500 Hz eran removidas conun filtro pasa altos, la ILD se tornaba dominante, junto con los indicios espectrales monoaurales.

    Si realizamos una experiencia de audicin de sonidos impulsivos con auriculares, en la cual aplicamos

    un mnimo retardo a la seal destinada a uno de los odos, percibimos un desplazamiento del eventoauditivo hacia el odo que recibe la seal sin retardar. Aplicando un tiempo de retardo creciente,

    dB

    kHz

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    5/15

    Localizacin espacial del sonido 5

    observamos un desplazamiento lineal cuyo valor mximo ocurre a los 630 s. La distancia que recorreel sonido en ese tiempo es de 21 cm, y a este valor se lo conoce histricamente como constante deHornbostel-Wertheimer. Hoy sabemos que no se trata de una constante, dado que depende dediversos parmetros. Desde el punto de vista fsico, estos 21 cm corresponden a la diferencia derecorrido entre ambos odos cuando la fuente est lateralizada 90.

    Estudios posteriores demostraron que el desplazamiento mximo se registra nicamente con sonidos

    cuyo perodo, dividido dos, est en el orden de los 630 s, o sea, para un sonido de unos 800 Hz. Porencima de este valor de frecuencia, el mximo desplazamiento obtenible se torna cada vez menor.Vale decir, que el mximo desplazamiento no ocurre para un retardo de 630 s, sino para T/2, dadoque el desplazamiento depende de la frecuencia. Siempre referidos a los sonidos puros, por encima de1.6 kHz ya no es posible distinguir ningn desplazamiento causado por la diferencia interaural detiempo.

    El sistema perceptual recurre no slo a las diferencias provenientes de la estructura interna de lossonidos (retardos de fase), sino tambin a cambios temporales relacionados con las envolventes de las

    seales (retardos de grupo). En experiencias comienza a observarse que los corrimientos temporales anivel de las envolventes, manteniendo en fase a los sonidos, son responsables de los desplazamientosdel evento auditivo an cuando no existen componentes por debajo de los 1600 Hz.

    Hemos visto, entonces, que existen dos clases de diferencias interaurales de tiempo. El sistemaauditivo puede interpretar diferencias temporales tanto a nivel de portadoras como de envolventes. Lasdiferencias evaluadas sobre las portadoras tienen efecto slo por debajo de los 1600 Hz, y las deenvolvente surten menos efecto a medida que la frecuencia decrece. Las diferencias interaurales denivel de presin sonora, en cambio, son efectivas en todo el registro audible, siempre dependiendo deltipo de seal.

    Tanto la ITD como la ILD contribuyen conjuntamente a la lateralizacin del evento auditivo. Las

    evaluaciones interaurales, no obstante, poseen en s mismas algunas limitaciones. Cuando la fuente seubica en el plano medio las diferencias son nulas, y en otros casos la diferencia interaural es la mismapara varias posiciones. La figura 6 muestra el denominado cono de confusin, en el cual la resta delas distancias entre cualquier punto ubicado en su superficie , y los puntos que representan a los odos,es constante.

    Figura 6 Cono de confusin

    Estas ambigedades generan divergencias en la localizacin, que es preciso resolver a partir de otrosmecanismos.

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    6/15

    Pablo Cetta 6

    Indicios espectrales monoaurales

    An las ms pequeas alteraciones de las seales que llegan a los canales auditivos pueden producirnotables alteraciones en la imagen espacial. Acsticamente hablando, el pabelln auditivo se comportacomo un filtro lineal que afecta fundamentalmente a las altas frecuencias. Produce una distorsin en laseal, en relacin al ngulo de incidencia y a la distancia, codificndola con atributos temporales yespectrales. El efecto acstico del pabelln se basa en los fenmenos fsicos de reflexin, difraccin,dispersin, sombra acstica, interferencia y resonancia , y contribuye tanto a la correcta discriminacinentre frente y atrs, como a la deteccin del grado de elevacin de la fuente.

    Por mucho tiempo se consider que los pabellones auditivos no tenan un rol importante en laaudicin, considerndolos meros protectores del sistema auditivo. En la actualidad sabemos quecumplen una funcin determinante en la audicin espacial, adems de servir a la eliminacin del ruidodel viento. El canal auditivo, ligeramente curvo y con una longitud promedio de 25 mm, parte de laconcavidad central del pabelln y se extiende ms all del tmpano, siempre con un dimetro variado

    cuyo promedio es de 7-8 mm. El odo externo finaliza en el tmpano, que es ligeramente elptico ydispuesto a 40-50 respecto al eje del canal. La mayor parte de la informacin que ingresa al odointerno pasa por el tmpano y el odo medio, mientras que otra se transmite a partir de la conduccindel hueso temporal, y se le atribuye una importancia secundaria en el estudio de la audicin espacial.

    Batteau (1967) propuso que las reflexiones producidas en las convoluciones del odo externo erancapaces de brindar indicios adicionales para la localizacin. Sugiri que los retardos temporales entreel sonido directo y esas reflexiones variaban en funcin del ngulo de incidencia, transformando as alas seales que tomaban contacto con el tmpano. El proceso era llevado a cabo mediante la evaluacinde la delicada estructura temporal resultante, que se observa al apreciar los picos de una respuesta aimpulso del odo externo (figura. 1.4). La figura 7 muestra un esquema del modelo de Batteau, y lasfunciones que atribuy a las componentes del pabelln auditivo.

    Figura 7 Funciones del pabelln auditivo, segn Batteau (1967)

    Estudios posteriores determinaron que las diferencias temporales percibidas monoauralmente no eranrelevantes para la deteccin de la posicin de la fuente. Las HRTF son sumamente breves, alrededorde 2 ms, y la resolucin temporal del sistema auditivo se halla en ese orden. La estructura temporal deuna respuesta a impulso resultara indetectable.

    Partiendo de las observaciones de Batteau, los investigadores se han concentrado ms en lasmodificaciones espectrales derivadas de este fenmeno, que en las transformaciones en el dominio deltiempo. Las convoluciones del odo externo funcionan como resonadores, transformando elespectrodel sonido de la fuente en funcin del ngulo de incidencia.

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    7/15

    Localizacin espacial del sonido 7

    Mientras ms ancha es la banda de frecuencias del espectro, mayor es la precisin en la localizacin.Pero los indicios espectrales percibidos monoauralmente son los menos confiables y parecen dependerdel conocimiento previo de las caractersticas de la fuente. Mediciones realizadas con espectrossistemticamente alterados han dado como resultado un alto grado de confusin en la localizacin,tanto en la deteccin frente-atrs como en el ngulo de elevacin, lo que los valida en tanto indicios. Silas diferencias interaurales fueran las nicas responsables de una correcta localizacin, la alteracindel espectro de la fuente no debera influir negativamente. Cuando el sistema perceptual reconocediferencias interaurales, determina la ubicacin de la emisin del estmulo dando un valor msimportante a estas diferencias que a los indicios espectrales.

    Correcciones asociadas a los movimientos de la cabeza

    Las teoras motoras han estudiado en detalle las relaciones entre la posicin del evento auditivo y loscambios de las seales de entrada a los odos durante los movimientos de la cabeza. Estos

    movimientos, producidos en el momento de la deteccin de la posicin de la fuente, constituyen unindicio adicional de importancia.

    Cuando un oyente mueve su cabeza en la direccin del evento auditivo, buscando la posicin probabledel evento sonoro, decrece el nivel de indeterminacin dado que el mayor grado de precisin seencuentra en la zona frontal. Van Soest (1929) fue el primero en sealar que la resolucin de lasimprecisiones por falta de indicios concretos, o conflicto entre ellos, se realiza a travs de losmovimientos de la cabeza.

    Vimos que cuando la fuente se ubica sobre el plano medio las diferencias interaurales sonprcticamente nulas. En este caso, el movimiento permite generar una diferencia que sirve, enprincipio, para definir si el movimiento proviene del frente o de atrs. La figura 8 puede aclarar este

    punto. Cuando giramos la cabeza hacia la derecha, si la seal arriba antes al odo derecho,determinamos que la fuente se encuentra atrs.

    Figura 8 Indicio aportado por la rotacin de la cabeza.

    Van Soest atribuye al sistema perceptual la capacidad de reconocer la polaridad de la ITD comoelemento aclaratorio de la posicin de la fuente. Para este tipo de evaluacin es necesario tenerpresente el sentido de la rotacin realizada, que podra estar indicado visualmente, a travs del rganovestibular del equilibrio, o por el estado de los msculos del cuello.

    Una anomala en la deteccin de la posicin de la fuente sonora, especialmente con bandas estrechas,

    se manifiesta en la percepcin del evento en una direccin simtrica respecto al eje que cruza a ambosodos. Una fuente ubicada en un ngulo de incidencia de 30 sobre el plano horizontal puede ser

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    8/15

    Pablo Cetta 8

    percibida a 150 (ver figura 9). Como vimos antes, el sistema auditivo recurre a las caractersticasespectrales para resolver conflictos entre ambas direcciones, pero cuando los sonidos son de bandaangosta, esta informacin es deficiente o nula, dando lugar a una falla en la localizacin. Una maneranatural de resolver esta ambigedad es mediante el movimiento de la cabeza durante la emisin delsonido. En los casos donde la localizacin es imprecisa el movimiento exploratorio de la cabezaayuda a resolver el problema.

    Figura 9 Percepcin simtrica respecto al eje interaural

    Divergencias en la posicin del evento sonoro y del evento auditivo

    No siempre la posicin del evento sonoro y la del evento auditivo coinciden. Bajo ciertas

    circunstancias la localizacin puede ser ambigua, dado que el espacio fsico y el auditivo no sonnecesariamente idnticos. La percepcin de la localizacin puede variar de acuerdo a diversosmotivos, entre ellos, por el tipo de seal, por la comparacin con eventos anteriores, por la experienciaadquirida en la escucha repetida, por la familiaridad con el sonido de la fuente, por las expectativas deloyente.

    Localizacin indefinida

    El concepto de localizacin indefinida surge de considerar que el espacio auditivo es menosdiferenciado que el espacio en el cual los eventos sonoros se manifiestan. El sistema auditivo posee

    menos resolucin espacial que cualquier medicin fsica.

    La zona de mayor precisin en la ubicacin de la fuente sonora ocurre en la regin cercana al puntoubicado justo enfrente del oyente. Es la zona donde un mnimo desplazamiento de la fuente produceuna modificacin en el evento auditivo. El lmite inferior corresponde aproximadamente a un ngulode 1, valor elevado si lo comparamos con la resolucin en la visin, que es capaz de distinguirvariaciones de 1 minuto de arco. Cuando nos desplazamos a derecha o a izquierda, aumenta. Hacia loslados, este valor se incrementa de tres a diez veces, y en la parte posterior decrece nuevamente hastaaproximadamente el doble del valor frontal.

    El trmino persistencia suele emplearse en relacin al tiempo necesario para determinar la ubicacin

    de la fuente. La posicin del evento auditivo slo puede cambiar con una rapidez limitada. Aschoff(1963) realiz un experimento utilizando 18 parlantes dispuestos en una circunferencia. A velocidades

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    9/15

    Localizacin espacial del sonido 9

    bajas de rotacin de la seal a travs de los parlantes, los oyentes perciban la trayectoriaadecuadamente. A mayor velocidad ya slo poda percibirse el sonido a la derecha y a la izquierda,cclicamente. Con un crecimiento an mayor de la velocidad de rotacin, el sonido pareca provenirdirectamente del centro de la cabeza. Como continuacin de este experimento, Plath (1970) demostrque la persistencia es menor cuando la fuente alterna entre derecha e izquierda que cuando lo haceentre frente y atrs.

    Los valores de precisin en la localizacin del ngulo de elevacin difieren sustancialmente respecto alo que sucede en el plano horizontal. Cuando la fuente se encuentra sobre el plano medio, lasdiferencias interaurales son prcticamente nulas, y rara vez ayudan a la interpretacin de la seal. Elrango de indeterminacin cuando la fuente est ubicada frontalmente es de aproximadamente 17, si lafuente es una voz hablada que no nos resulta familiar (Blauert, 1997). Si nos encontramosfamiliarizados con su timbre, el error disminuye a unos 9 al frente, pero es de unos 22 cuando seubica encima de la cabeza (Damaske y Wagener, 1969). El conocimiento previo del sonido propio dela fuente se convierte en un factor determinante de la correcta localizacin.

    Bandas direccionales

    Cuando una seal de banda estrecha proviene del plano medio, o es presentada monoauralmente, y lasdiferencias interaurales quedan anuladas, la ubicacin del evento auditivo depende ms de lafrecuencia central de la banda que de la ubicacin fsica del evento sonoro. La frecuencia se constituyecomo un referente espacial, y el primero en estudiar sistemticamente este fenmeno fue Pratt (1930).

    Blauert, observ que modificando de forma continua la frecuencia de un sonido puro entre 200 Hz y16 kHz se perciba un movimiento aparente que parta del frente y llegaba hasta atrs, pasando porarriba de la cabeza varias veces. Esto lo condujo a la realizacin de otras experiencias para determinarel porcentaje estadstico de localizacin de eventos auditivos al frente, arriba o atrs, con fuentes deruido de 1/3 de octava. El sonido era reproducido a travs de cinco parlantes dispuestos de modo talque ambos odos recibieran seales idnticas, ya sea a travs de uno o ms parlantes. Demostr que losjuicios sobre la posicin de la fuente dependan de la frecuencia central del sonido reproducido y no dela posicin del evento sonoro, ni de la configuracin de parlantes usada, ni de su intensidad.Denomin a este efecto bandas direccionales. Si las bandas se centraban en 4 y 6 kHz aparecan alfrente, las de 12 kHz por atrs, y aquellas que se centraban en 8 kHz parecan provenir de arriba de lacabeza, independientemente de la ubicacin real de la fuente. Se trata de una ilusin, donde el sonidoaparece en un lugar diferente al de la fuente.

    An se contina trabajando en esta rea, bajo la hiptesis que las bandas direccionales no son slo una

    mera curiosidad, sino un indicio probable de localizacin espacial.

    Influencia del grado de coherencia de las seales

    Definimos a dos seales como coherentes cuando son idnticas, o bien se diferencian en una o ms delas siguientes caractersticas:

    -

    Tienen amplitudes diferentes pero la misma forma de onda. Se produce una diferencia de nivelque es independiente de la frecuencia.

    -

    Poseen un retardo de fase que es independiente de la frecuencia-

    Se encuentran en oposicin de fase

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    10/15

    Pablo Cetta 10

    En una experiencia realizada por Chernyak y Dubrovsky (1968) se modific el grado de coherencia dedos fuentes, presentadas simultneamente con auriculares, con el propsito de medir la influencia deeste parmetro en la representacin de los eventos auditivos. Los sujetos fueron provistos con tarjetas,en las que constaba un esquema semicircular representativo del sector frontal superior de la cabeza.All deban marcar reas que describieran la ubicacin de los eventos auditivos percibidos. En la figura10 pueden verse los resultados.

    Figura 10 Influencia del nivel de coherencia en la ubicacin de loseventos auditivos (Chernyak y Dubrovsky, 1968)

    Cuando las seales de las fuentes son totalmente coherentes (k= 1) aparece un nico evento auditivo,en el plano medio, que ocupa una determinada extensin. A medida que el grado de incoherenciaaumenta, tambin crece el rea ocupada por el evento. A un mayor aumento, comienzan a percibirsedos eventos diferenciados, uno en cada odo.

    Percepcin de la distancia

    Con respecto a la determinacin de la distancia de una fuente, la familiaridad con el tipo de sonidojuega un importante rol en la eficacia de los resultados. La voz hablada a sonoridad normal permiteuna correspondencia bastante alta entre la posicin del evento sonoro y el auditivo. La figura 11muestra resultados sobre la medicin de la distancia subjetiva de una voz hablada -susurrando,hablando normalmente y gritando- reproducida por un parlante que se desplaza de 0,9 a 9 metros(Gardner, 1969).

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    11/15

    Localizacin espacial del sonido 11

    Figura 11 Evaluacin de la distancia subjetiva en funcin de la distanciadel evento sonoro, para la voz hablada (Gardner, 1969)

    Segn Blauert, a distancias intermedias (de 3 a 15 metros), el nivel de presin sonora es el atributo queayuda a determinar la distancia. Al aire libre, el nivel cae 6 dB cada vez que se duplica la distancia.

    Una curva tpica de la dependencia de la distancia evaluada respecto al nivel de presin sonora seobserva en la figura 12 (Gardner, 1969). Fue medida con un parlante ubicado a 3 metros y luego a 9metros. Se deduce claramente que la distancia atribuida al evento auditivo no depende de la distanciadel evento sonoro, sino nicamente del nivel de presin sonora que se registra en la posicin deloyente.

    Figura 12 Relacin entre la distancia estimada y el nivel de la seal,para dos posiciones fijas de 3 y 9 metros (Gardner, 1969)

    Para distancias mayores, el nivel de presin sonora contina ejerciendo su efecto, pero tambin laaccin del aire, que atena las altas frecuencias y modifica el espectro de las seales.

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    12/15

    Pablo Cetta 12

    Audicin en recintos cerrados

    La mayor parte de los estudios sobre los efectos ambientales en la localizacin se centran en la

    percepcin de las caractersticas del recinto, en la relacin entre los primeros ecos vinculada al efectode precedencia, y en la estimacin de la distancia cuando acta la reverberacin.

    Cuando experimentamos la sensacin sonora en un ambiente cerrado llega primero a nuestros odos elsonido directo, que es el que proviene directamente de la fuente. En segundo trmino las reflexionesde primer orden, que parten de la fuente sonora, chocan con un objeto (la pared, por ejemplo) yalcanzan nuestros odos, luego las de segundo orden (con dos reflexiones), y as hasta percibir unasensacin difusa denominada reverberacin. Las primeras reflexiones en general seis, siconsideramos un cuarto vaco con cuatro paredes, techo y piso- contribuyen con la determinacin de laposicin de la fuente, principalmente si el ataque del sonido es impulsivo. La reverberacin, por suparte, nos brinda informacin sobre las caractersticas materiales de la sala, y sobre sus dimensiones.

    Un ambiente acsticamente ideal es aquel donde la reverberacin manifiesta una cada lineal, productode una absorcin uniformemente distribuida en un volumen nico, y permanece esttica. Esto noocurre cuando existen reas adyacentes con volmenes diferenciados o niveles distintos de absorcin.

    El tiempo de reverberacin (t60) se calcula considerando el intervalo transcurrido entre el comienzo dela reverberacin y el momento en que su nivel cae 60 dB. El tiempo de reverberacin, cuando elvolumen es medido en m

    3es, segn Sabine:

    A

    Vt 16.060 =

    donde A representa a la sumatoria de los productos entre los coeficientes de absorcin y las superficiesreflectoras (el coeficiente de absorcin de un piso alfombrado, por ejemplo, es de 0.05 sabins).

    El grfico que sigue (figura 13), muestra la distribucin de las reflexiones en el tiempo producidas porun impulso dentro de una sala, la altura de las lneas representa su amplitud relativa.

    Figura 13 Respuesta tpica de una sala

    Si bien las reflexiones llegan desde diferentes direcciones, atribuimos una posicin correcta a lafuente, pues stas se funden con el sonido directo agregando una sensacin espacial ms completa yuna mayor sonoridad. Este fenmeno de supremaca de la direccin del directo frente a la de los ecoses conocido como efecto de precedencia y ha sido objeto de amplio estudio en psicoacstica. Suaccin es tan marcada que ocurre an cuando la intensidad de las reflexiones es hasta 10 dB mspronunciada.

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    13/15

    Localizacin espacial del sonido 13

    Cuando percibimos dos seales coherentes de forma sucesiva (producidas por dos parlantes, porejemplo), podemos distinguir alguno de estos tres fenmenos, de acuerdo al intervalo temporal entreambas:

    a-

    un nico evento auditivo que depende de la posicin de los dos eventos sonoros.b-

    un evento auditivo cuya posicin es la misma que la de una de las fuentes.c-

    dos eventos auditivos cuyas posiciones son las posiciones de las fuentes.

    El primer caso ocurre cuando los niveles y tiempos de arribo de las seales difieren ligeramente. Eneste caso hablamos de localizacin aditiva, dado que la posicin del evento auditivo resulta delpromedio de las posiciones de los eventos sonoros.

    Si las seales difieren en ms de 1 ms, aproximadamente, la posicin del evento auditivo esdeterminada por la seal que llega en primer trmino. Cremer (1948) denomin a este fenmeno leydel primer frente de onda, de gran importancia en la audicin en recintos cerrados. En algunos

    tratados la localizacin aditiva y la ley del primer frente de onda son consideradas parte del mismofenmeno, y se lo denomina efecto de precedencia.

    Si el retardo entre las seales excede cierto valor aparecen dos eventos auditivos sucesivos biendiferenciados, donde el segundo es considerado eco del primero. El lmite inferior umbral del eco- esdifcil de determinar pues depende de diversos factores, como el tipo de seal, la direccin deincidencia y la intensidad. Los umbrales de eco ms pequeos ocurren con los impulsos, y a medidaque la intensidad crece el umbral se torna menor. Los sonidos continuantes, en cambio, poseen unumbral considerablemente mayor.

    En el efecto de precedencia, las reflexiones cambian el color del sonido y refuerzan su sonoridad, y sibien no son percibidas como eventos separados del sonido directo, su anulacin puede ser reconocida

    con claridad.

    Otro tipo de vnculo se establece entre el efecto de precedencia y la percepcin de la voz hablada enambientes reverberantes, y es conocido como efecto Haas(Haas, 1951). Bsicamente, se observa quelas primeras reflexiones no alteran la comprensin de la comunicacin verbal, siempre que arriben enun tiempo no demasiado largo. Es ms, ayudan a la percepcin al crear un refuerzo de la sonoridad. Elinters puesto por Haas en la palabra hablada se debe a que la voz es muy sensible a la reverberacin,en contraste con la percepcin de la msica.

    Green (1976) describe efectivamente el efecto de integracin entre el sonido directo y las primerasreflexiones. Dice que si parados a 1 metro enfrente de una pared, producimos un sonido impulsivogolpeando dos rocas entre s, se crea una reflexin que arriba unos 6 ms ms tarde, pero que no somos

    capaces de escuchar. Pero por otra parte, si escuchamos con auriculares dos clicksseparados por 6 ms,ambos se perciben claramente. La supresin de la reflexin sucedida en el ambiente no ocurre en laaudicin con auriculares, y eso es debido al efecto de precedencia.

    Un tercer vnculo lo encontramos en lo que suele denominarse de-reverberacin. La demostracinms conocida de este efecto se produce cuando escuchamos una conversacin en un determinadoambiente, mientras la grabamos ubicando el micrfono cercano al punto de escucha. Al reproducirla,notamos que el sonido reverberado interfiere con el directo de la voz, dificultando la comprensin,hecho que en la audicin natural no ocurra .

    Las caractersticas temporales del efecto de precedencia en la localizacin fueron analizadasprincipalmente por Blauert (1997). Cuando escuchamos dos clicks provenientes de direccionesdistintas, separados por menos de 1 ms, el sistema auditivo percibe al segundo clic integrado con elprimero, y determina una localizacin que es el promedio entre ambas posiciones. Para retardos

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    14/15

    Pablo Cetta 14

    ubicados entre 1 y 4 ms el efecto de precedencia acta fuertemente, sin embargo, crea ciertaindefinicin en la localizacin, a la vez que aumenta la sensacin de espacio. Luego, entre 5 y 10 ms,el efecto comienza a debilitarse: comenzamos a escuchar dos eventos con posiciones diferenciadas.

    Las constantes de tiempo del efecto Haas son bastante distintas. Las reflexiones deterioran lacomprensin de la voz hablada cuando estn retardadas en ms de 50 ms. El mximo poder del efectoHaas se encuentra entre los 10 y 20 ms, es decir, cuando el efecto de precedencia desaparece.

    Para el efecto de de-reverberacin, en cambio, las constantes de tiempo se extienden a variossegundos.

    Si los tres vnculos vistos localizacin, efecto Haas y de-reverberacin- pertenecen al mismoprincipio de precedencia, sin duda se trata de un proceso sumamente complejo.

    Von Bksy (1971) describi un efecto contrario a la ley del primer frente de onda, que observ frentea un retardo de 70 ms. El evento auditivo evaluado para determinar la posicin de la fuente era el

    segundo y no el primero. Blauert (1997) llam a este efecto inhibicin del sonido directo. Puedesuceder que la reflexin inhiba al sonido directo parcial o totalmente. Para un retardo de 20 ms, elnivel de la reflexin debe ser unos 40 dB ms alto para que ocurra el enmascaramiento. Cuando ambosposeen igual nivel, la inhibicin nunca ocurre.

    Conclusiones

    Ha quedado establecido que los indicios primarios para la determinacin de la direccin de una fuentesonora estn dados por las diferencias interaurales de tiempo, y de nivel de presin sonora, mientrasque los indicios espectrales monoaurales tambin aportan informacin, pero fundamentalmente sobreel grado de elevacin.

    La diferencia interaural de tiempo es extrada por el sistema perceptual, no slo de las diferencias defase entre las ondas que llegan a cada odo, sino tambin de las envolventes dinmicas que las afectan.En el primer caso retardos de fase- este indicio es efectivo por debajo de 1.6 kHz, mientras que en elsegundo diferencias temporales en el ataque de las envolventes- resulta apropiado para frecuenciamayores, cuyo valor est en funcin del ancho de banda de las seales.

    La diferencia interaural de nivel de presin sonora es un indicio, en general, efectivo en todo elregistro, pero el lmite inferior de la zona til vara tambin con el tipo de seal. Los sonidos graves debanda angosta, por ejemplo, son difciles de localizar, debido a la difraccin. Este fenmeno se

    produce cuando la longitud de onda es mayor al dimetro de la cabeza, y afecta a las seales ocomponentes de una seal- cuyas frecuencias son inferiores a los 1800 Hz.

    Los efectos de los pabellones auditivos comienzan a hacerse notorios a partir de los 3 kHz, donde lalongitud de onda es comparable a su tamao. La principal depresin en la curva de respuesta enamplitud del sistema auditivo externo, se manifiesta en la octava entre 6 y 12 kHz.

    Los modelos fsicos anlogos contribuyen a la comprensin de los fenmenos auditivos, y facilitan laformalizacin de las HRTF. No obstante, es preciso considerar que las funciones de transferenciavaran considerablemente de un sujeto a otro, y que cualquier intento de simulacin de los indicios delocalizacin espacial del sonido debe tener en cuenta esta particularidad, derivada de las variantesanatmicas del odo externo.

  • 7/25/2019 LSII - 05 Espacializacin, Psicoacstica - Pablo Cetta

    15/15

    Localizacin espacial del sonido 15

    Las mayores dificultades en la localizacin surgen cuando la fuente se encuentra en el plano medio -donde las diferencias interaurales son prcticamente nulas- o en la superficie del denominado cono deconfusin -donde las diferencias son constantes. La falta de indicios concretos genera, adems,errores frecuentes en la determinacin de posiciones al frente y atrs. Por otra parte, el nivel dedefinicin depende de la posicin; las zonas ms indefinidas ocurren a los lados, y en la percepcin delgrado de elevacin. Un sistema de simulacin destinado a la ubicacin precisa de fuentes aparentes,debe proveer informacin adicional que permita resolver estas ambigedades.

    Tambin es importante contemplar las divergencias que ocurren entre la posicin de las imgenesespaciales, y la ubicacin real de los estmulos sonoros, pues inducen a errores en la localizacin queafectan el realismo de determinadas situaciones, propias de la simulacin.

    Bibliografa

    Batteau, D. W. (1967). The role of the pinna in human localization. Proc. Roy. Soc. London. B -168, 158-180.

    Blauert, J. (1997) Spatial Hearing. The psychophysics of human sound localization. The MIT Press. Cambridge,Massachussets.

    Cetta, P. (2003) Modelos de localizacin espacial del sonido y su implementacin en tiempo real. Altura-

    Timbre-Espacio . Instituto de Investigacin Musicolgica Carlos Vega. FACM -UCA..

    Chernyak, R. y Dubrovsky, N. (1968). Pattern of the noise images and the binaural summation of loudness for

    the different interaural correlation of noise. Proceedings, 6th

    International Congress on Acoustics, Tokyo, A 3-

    12.

    Gilkey y Anderson (eds.) (1997). Binaural and Spatial Hearing in Real and Virtual Environments. LawrenceErlbaum Associates. New Jersey.

    Green, D. M. (1976). An introduction to hearing. Lawrence Erlbaum Associates, Hilldale, NJ.

    Pratt, C. (1930). The spatial character of high and low tones. J. Exp- Psychol. 13, 278-285.

    Rayleigh, Lord (1907). On our perception of sound direction. Philos. Mag. 13, 214-232.

    van Soest, J. (1929). Directional hearing of sinusoidal sound waves. Physica 9, 271-282.

    von Bksy, G. (1971). Auditory backward inhibition in concert halls. Science 171, 529-536.

    Wightman, F., y Kistler, D. (1992). The dominant role of low-frequency interaural time difference in soundlocalization. J.A.S.A. 91, 1648-1661.