Laboratorio 1

3
 Procesamiento de Audio Hernán Javier Ardila Sánchez, Oscar Mauricio Calvache García Universidad Surcolombiana  Neiva, Col ombia [email protected] [email protected]  Abst rac t    Este documento trata sobre procesamiento de señales por medio del software Matlab, una herramienta indispensable para los estudiantes de ingeniería, donde en este caso se centra en el procesamiento de una señal de audio. I. INTRODUCCION Es común que la información de interés esté codificada en los componentes sinusoidales que forman la señal, debido a la naturaleza oscilatoria de muchos fenómenos físicos (ej. vibración de cuerdas vocales en la voz). Muchas veces la forma de la señal en el tiempo no es relevante, sino que la información clave está en la frecuencia, amplitud y fase de los componentes sinusoidales. Debido a las grandes ventajas de la digitalización para su facilidad de transmitir, almacenar o manipular las señales, como en este caso una señal de audio, la cual podemos atenuar o amplificar dependiendo de la amplitud de la señal, o acelerar el ritmo del audio o colocarlo lento por medio de la frecuencia de muestreo, invertir el audio entre varias manipulaciones que la señal de audio digital nos puede ofrecer en este caso. II. MARCO TEORICO  A.  Procesamiento D igital del Audio Una señal digital no es audible, ya que requiere ser decodificada antes de su reproducción. Sin embargo, la codificación y posterior descodificación de una señal digital  para su audición tiene varias ventajas, aunque también algunos inconvenientes. Fig. 1. Forma de onda vocal a  a. Ventajas 1. La señal discreta (digital) es más fácil de  transmitir,  almacenar o manipular (en el caso del sonido: editar, comprimir,  etc). 2. La señal digital es inmune al  ruido.  La señal digital es menos sensible que la analógica a las  interferencia s,  etc. 3. Se puede tomar una muestra de sonido y cambiar cualquiera de sus parámetros para generar un sonido diferente sin tener que recrearlo en la realidad. (Las aplicaciones de esta ventaja en la generación de  efectos especiales es infinita). 4. La señal digital permite la  multigeneración infinita sin  pérdidas de calida d. 5. Ante la pérdida de cierta cantidad de información , la señal digital puede ser reconstruida gracias a los  sistemas de regeneración de señales (usados también para amplificarla, sin introducir distorsión). También cuenta, con sistemas de detección y corrección de errores que, por ejemplo, permiten introducir el valor de una muestra dañada, obteniendo el valor medio de las muestras adyacentes (interpolación). 6. La señal digital puede ser enviada a casi cualquier punto del planeta en cualquier momento a un muy bajo costo a través de internet y a partir de aquí puede ser renviada a su remitente o a algún otro destino. Esto sin que la señal sufra variaciones o alteraciones de calidad severas. 7. Con el tiempo no se degrada b.  Inconvenientes 1. Se necesita una conversión analógica-digital previa y una descodificación posteri or, en el momento de la recepción. 2. Hay una pérdida inherente de información al convertir la información continua en discreta. Por mínimo e insignificante que resulte siempre hay un  error de cuantificación que impide que la señal digital sea exactamente equivalent e a la analógica que la originó. 3. La señal digital requiere mayor  ancho de banda para ser transmitida que la analógica. Además, requiere una sincronización precisa entre los tiempos del reloj de transmisor, con respecto a los del receptor. Un desfase,  por mínim o que sea, cambia por completo la señal.

Transcript of Laboratorio 1

Page 1: Laboratorio 1

5/17/2018 Laboratorio 1 - slidepdf.com

http://slidepdf.com/reader/full/laboratorio-1-55b07d53f2a89 1/3

 

Procesamiento de AudioHernán Javier Ardila Sánchez, Oscar Mauricio Calvache García

Universidad Surcolombiana

 Neiva, Colombia

[email protected]@usco.edu.co

 Abstract –  Este documento trata sobre procesamiento de señales

por medio del software Matlab, una herramienta indispensable

para los estudiantes de ingeniería, donde en este caso se centraen el procesamiento de una señal de audio.

I. INTRODUCCION

Es común que la información de interés esté codificada enlos componentes sinusoidales que forman la señal, debido a lanaturaleza oscilatoria de muchos fenómenos físicos (ej.

vibración de cuerdas vocales en la voz).Muchas veces la forma de la señal en el tiempo no es

relevante, sino que la información clave está en la frecuencia,amplitud y fase de los componentes sinusoidales. Debido alas grandes ventajas de la digitalización para su facilidad detransmitir, almacenar o manipular las señales, como en estecaso una señal de audio, la cual podemos atenuar o amplificardependiendo de la amplitud de la señal, o acelerar el ritmo delaudio o colocarlo lento por medio de la frecuencia demuestreo, invertir el audio entre varias manipulaciones que laseñal de audio digital nos puede ofrecer en este caso.

II. MARCO TEORICO A.  Procesamiento Digital del Audio

Una señal digital no es audible, ya que requiere serdecodificada antes de su reproducción. Sin embargo, lacodificación y posterior descodificación de una señal digitalpara su audición tiene varias ventajas, aunque tambiénalgunos inconvenientes.

Fig. 1. Forma de onda vocal a  

a.  Ventajas

1.  La señal discreta (digital) es más fácil de transmitir,almacenar o manipular (en el caso del sonido:editar, comprimir, etc).

2.  La señal digital es inmune al ruido. La señal digital esmenos sensible que la analógica a las interferencias, etc.

3.  Se puede tomar una muestra de sonido y cambiarcualquiera de sus parámetros para generar un sonido

diferente sin tener que recrearlo en la realidad. (Lasaplicaciones de esta ventaja en la generación de efectosespeciales es infinita).

4.  La señal digital permite la multigeneración infinita sinpérdidas de calidad.

5.  Ante la pérdida de cierta cantidad de información, la señaldigital puede ser reconstruida gracias a los sistemas deregeneración de señales (usados también paraamplificarla, sin introducir distorsión). También cuenta,con sistemas de detección y corrección de errores que, porejemplo, permiten introducir el valor de una muestradañada, obteniendo el valor medio de las muestrasadyacentes (interpolación).

6.  La señal digital puede ser enviada a casi cualquier puntodel planeta en cualquier momento a un muy bajo costo através de internet y a partir de aquí puede ser renviada a suremitente o a algún otro destino. Esto sin que la señalsufra variaciones o alteraciones de calidad severas.

7.  Con el tiempo no se degrada

b.   Inconvenientes

1.  Se necesita una conversión analógica-digital previa y unadescodificación posterior, en el momento de la recepción.

2.  Hay una pérdida inherente de información al convertir la

información continua en discreta. Por mínimo einsignificante que resulte siempre hay un error decuantificación que impide que la señal digital seaexactamente equivalente a la analógica que la originó.

3.  La señal digital requiere mayor ancho de banda para sertransmitida que la analógica. Además, requiereuna sincronización precisa entre los tiempos del reloj detransmisor, con respecto a los del receptor. Un desfase,por mínimo que sea, cambia por completo la señal.

Page 2: Laboratorio 1

5/17/2018 Laboratorio 1 - slidepdf.com

http://slidepdf.com/reader/full/laboratorio-1-55b07d53f2a89 2/3

 

4.  Si se utiliza compresión con pérdida, será imposiblereconstruir la señal original.

c.   Aplicaciones

Ejemplos de aplicaciones del procesamiento digital desonido se encuentran en aplicaciones musicalescomo ecualizadores digitales, efectos de sonido (distorsión,compresión, eco…), espacialización del sonido, códecs deaudio. 

III. DESARROLLO DE LA PRÁCTICA Y ANALISIS DERESULTADOS

En el laboratorio se utilizo las siguientes funciones deMatlab: wavread(), sound(), soundsc(), flipud(), wavwrite(),observando en los documentos de ayuda de Matlab se observacomo es su sintaxis para utilizar cada función y que labordesempeña cada una.

1.  Primero se escogió una archivo .wav de duración

alrededor de 12seg llamado “audio”. 2.  Se llama a la función wavread() que nos permite leer elarchivo .wav y guardar sus variables en el workspace, dela siguiente manera:

[Y, FS, NBITS] = WAVREAD ('audio.wav');

Guarda el vector muestras Y de la señal audible, FS eltiempo de muestreo y NBITS los bits utilizados. Al ejecutar lalínea de código se obtiene:Y= 98855x1; como es de un solo canal o sea monofónico esuna columna con 98855 filas o sea numero de muestras.Fs= 8000m/s

NBITS= 16bits3.  Para graficar la señal de audio respecto al tiempo se halla

el tiempo de la señal de audio dividiendo el número demuestras del vector Y de la señal audible con la frecuenciade muestreo.

tiempo=size(Y,1)/FS; 

Ejecutando la línea de código resulta: tiempo= 12.35seg.Para graficar entonces definimos a tiempo como la variableindependiente que empieza desde cero con un paso de0.125ms por muestra o sea el periodo de muestreo, hasta eltiempo de la señal de audio.

X=0:1/FS:tiempo;

Ejecutando la línea de código se obtiene: x=98856x1 o sea98856 muestras lo cual significa que hay una muestra demásrespecto al vector de la señal de audio Y, por lo cual se debehacer un pequeño arreglo para que comience desde la segundamuestra y así igualar los dos vectores para realizar la grafica.

plot(x(2:end),Y); xlabel('tiempo'),ylabel('Señal Audio');

xlim([0 tiempo]);

Ejecutando las líneas de código obtenemos la grafica de laseñal audible Y con respecto al tiempo.

Fig. 2. Forma de onda de la señal (amplitud vs tiempo) 

4.  Para reproducir la señal se hace el llamado de la funciónsound() que depende del vector muestras Y y de lafrecuencia de muestreo FS.

sound(Y,FS);

Ejecutando la línea de código se reproduce el sonido de la

pista de audio utilizada.

5.  Para realizar modificaciones a la pista de audio se utilizala función soundsc() esta función escala los valorescolocándolos en un rango desde -1 a 1 lo cual el audio sereproduce lo mas alto posible sin que se sature.

soundsc(Y,FS,NBITS);

Se puede variar el rango de Y de tal manera que podemoshacer que la pista de audio se reproduzca saturándose para esecaso es cuando el rango es menor a -1 a 1 y cuando se quiereque se atenué la señal de audio colocamos un rango mayor a-1 a 1 de la siguiente manera.

soundsc(Y,FS,NBITS,[-0.2 0.2]); %Saturadosoundsc(Y,FS,NBITS,[-5 5]); %Atenuado 

6.  Aplicando la misma funcion pero ahora se modifica lafrecuencia de muestreo Fs.

soundsc(Y,6000); % Acelera soundsc(Y,10000); %Relentiza 

Ejecutando las líneas de código se puede apreciar que cuandose coloca una frecuencia de muestreo mayor a la original queen este caso es FS=8000, al reproducir la pista de audio estase acelera. Al incrementar FS respecto al valor real, seralentiza la pista de audio.Aplicando la misma funcion pero ahora se modifica lacantidad de bits de la codificación.

soundsc(Y,FS,bits);

Ejecutando la línea de código y modificando la variable bitsde 2 a 16 se puede apreciar que al dar los valores de 2 y 3 alreproducir la pista de audio disminuye la calidad de sonido.Para el resto de valores no se puede apreciar claramente esecambio. 

Page 3: Laboratorio 1

5/17/2018 Laboratorio 1 - slidepdf.com

http://slidepdf.com/reader/full/laboratorio-1-55b07d53f2a89 3/3

 

7.  Utilizando la función FLIPUD(Y) , al reproducir lapista de audio, esta se escucha invertida.

r=flipud(Y); sound(r,FS);

8.  Aplicando la función wavwrite() se guarda la pistade audio modificada, en este caso, la pista de audioalmacenada en la variable r con el nombre

audio2.wav.

wavwrite(r, FS, NBITS, 'audio2');

IV. CONCLUSIONES

  Se aprendió el procesamiento de señales de audiomediante diversas funciones en Matlab aplicando lasventajas que tiene las señales digitales, como son elpoder guardar, modificar, comprimir y transmitir conmayor facilidad que las señales analógicas.

  Se pudo modificar de diversas maneras la pista deaudio por medio de las funciones descritasanteriormente, se pudo invertir la señal, amplificar,atenuar acelerar y ralentizar.

  Cuando se disminuyo la frecuencia de muestreoFS<8000 de la pista de audio, se aceleró, debido aque se leían y reproducían mas muestras en menostiempo. Mientras que al aumentar la frecuenciaFS>8000, se ralentiza la reproducción de la pistadebido a que se toma menos muestras por unidad detiempo.

  Al variar el valor de bits se pudo probar que lacalidad del sonido disminuía esto debido a que serealizo una codificación de 16 bits y al bajar esosbits se pierde la calidad del sonido ya que se pierdeinformación.

REFERENCIAS

[1]  http://www.eumus.edu.uy/eme/ense%C3%B1anza/electivas/dsp/presentaciones/clase06.pdf 

[2]  http://es.wikipedia.org/wiki/Procesamiento_digital_de_audio

[3] 

PROCESAMIENTO DIGITAL DE SEÑALES - Proakis