musica computCIONal

download musica computCIONal

of 264

Transcript of musica computCIONal

RODRIGO F. CADIZ

INTRODUCCION A LA MUSICA COMPUTACIONAL

2

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

Cap tulo 0

Prlogo o

La era computacional y la msica estuvieron por mucho tiempo distanu ciadas debido a la gran cantidad de espacio de memoria que la msica reu quiere para ser almacenada y procesada. Con el aumento de las capacidades de memoria de los computadores, la msica comenz rpidamente un desau o a rrollo vertiginoso transformndose, hoy en d junto al mundo audiovisual a a, en las actividades predilectas en el uso del computador. En efecto, en las ultimas dcadas son mltiples los softwares, las he e u rramientas y las investigaciones que giran en torno a la actividad musical tanto en los terrenos del registro sonoro, como en el mbito creativo y en a el rea de la reproduccin. Tanto profesionales como acionados recurren al a o computador para manipular informacin musical pero siempre con la seno sacin de que aprovechan slo un m o o nimo porcentaje de las capacidades de los softwares o herramientas disponibles. El libro que tiene en sus manos constituye el ms importante aporte en a lengua espaola para acercar a los interesados a la tecnolog digital disn a ponible. Desde la terminolog bsica, pasando por los principios acsticos a a u del sonido hasta la psicoacstica, desde la nocin de audio digital, su prou o cesamiento hasta su aplicacin en la msica electroacstica constituyen el o u u contenido de esta publicacin dirigida a msicos, ingenieros, f o u sicos y amantes de la tecnolog aplicada a la msica. a u El sonido es la materia prima, dispuesta en el tiempo, de la msica. Por u lo tanto, su estudio y conocimiento por parte todo aquel que se interesa en ella, es fundamental. La dicultad de conseguir literatura en torno al sonido y sobre todo en el mbito digital hac dif el acceso a la informacin a a cil o necesaria, general y preferentemente en ingls, para todos los usuarios de e tecnolog aplicada al mundo musical. a i

ii

CAP ITULO 0. PROLOGO

Con este libro, el mundo tcnico y conceptual del sonido digital queda al e alcance de todos de una manera ordenada y sistemtica cubriendo en detalle a cada uno de los diversos aspectos tratados sin perder de vista, en ningn u momento, las nociones bsicas que permiten la comprensin profunda de los a o fenmenos y posibilidades de la era digital. o Su autor, Rodrigo Cdiz, en su doble condicin de ingeniero y compoa o sitor ha puesto a nuestra disposicin una informacin amplia, de enfoques o o mltiples que recorren lo tcnico esencial hasta lo art u e stico creativo. De este modo, esta publicacin se transforma en lectura obligada para msicos o u profesionales o no, interesados en la vinculacin de la tecnolog actual y o a la ms antigua y misteriosa de las artes: la msica. Inefable, inescrutable, a u inenarrable, mgica y misteriosa arte que, nalmente ha sido atrapada, a registrada y reproducida con la mayor de las delidades por las ciencias y tecnolog del sonido digital. as Aceptemos esta invitacin a conocer este nuevo mundo de la mano de o un autor atento y multidisciplinario que nos permite, en nuestra propia lengua, acercarnos y resolver nuestras inquietudes en torno a la msica y la u computacin. o Alejandro Guarello Santiago de Chile, Junio de 2008

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

Cap tulo 0

Prefacio

Los computadores sin duda han cambiado nuestra forma de relacionarnos con el mundo externo. Espec camente en el mbito de la msica, los a u computadores permiten explorar nuevas posibilidades sonoras, crear nuevas formas de composicin y nuevas aproximaciones a la interpretacin musical. o o Las posibilidades musicales que nos ofrece la tecnolog computacional son a prcticamente innitas. a El propsito de este libro es introducir a estudiantes de msica, f o u sica o ingenier artistas, intrpretes y compositores al extenso mundo de la msia, e u ca computacional y electroacstica. Originalmente, este libro est pensado u a como un texto de apoyo para un curso bsico de msica computacional de a u uno o dos semestres de duracin, pero perfectamente puede utilizarse fuera o de un curso formal. El libro est divido en siete cap a tulos, cada uno de los cuales se enfoca a un tema espec co. El primer cap tulo expone los conceptos bsicos de a la teor de seales y sistemas, incluyendo conceptos claves como la reprea n sentacin en frecuencia y la transformada de Fourier, adems de introducir o a algunos conceptos matemticos imposibles de evitar al adentrarse en este a intenso mundo. Dado que un computador permite disear sonidos con un n mximo nivel de detalle y precisin, es muy relevante para esta disciplina a o el conocer en profundidad el fenmeno sonoro. No slo es importante estuo o diar como se comporta el sonido en el mundo f sico, sino tambin como es e percibido en la cabeza de cada auditor. Esto se divide en dos cap tulos: el segundo cap tulo estudia el fenmeno del sonido en su aspecto f o sico y el tercero desde el punto de vista perceptual. El computador es por naturaleza digital, lo que hace necesario conocer las propiedades de las seales de audio digitales que el computador es capaz de n iii

iv

CAP ITULO 0. PREFACIO

generar y manipular. Esto se aborda en el cap tulo cuarto, en conjunto con el estudio del computador y su uso en sistemas de audio. El quinto cap tulo se enfoca en la s ntesis digital de sonidos, exponiendo sus fundamentos, formas de clasicacin y los principales mtodos de s o e ntesis utilizados. En el sexto cap tulo se estudia el procesamiento digital de audio, con un especial nfasis e en la teor e implementacin de los ltros digitales. a o Para nalizar, se incluye un cap tulo, el sptimo y ultimo, en el cual se e presentan las principales bases perceptuales, composicionales y anal ticas de la llamada msica electroacstica, la cual en la actualidad se realiza en su u u gran mayor gracias a la tecnolog computacional. a a Se incluyen tambin varios anexos con ejemplos de cdigo realizados en e o SuperCollider, una de las aplicaciones para s ntesis y procesamiento digital de sonidos ms utilizadas, poderosas y verstiles disponibles en la actualia a dad. Estos ejemplos complementan las materias presentadas en los distintos cap tulos y permiten llevar a la prctica de forma inmediata mucho de los a conceptos presentados en el libro. Este libro tuvo sus or genes en una serie de apuntes parcialmente nanciados por la Fundacin Andes, a travs de su Beca de Creacin e Investio e o gacin Art o stica, en el ao 2000. La actual versin ha sido posible gracias al n o apoyo del Fondo de Desarrollo de la Docencia (FONDEDOC), de la Vicerrector Acadmica de la Ponticia Universidad Catlica de Chile. Quisiera a e o agraceder el aporte de mi ayudante Jorge Forero, quin realiz muchas de e o las tablas y guras presentes en el libro y del Dr. Gary Kendall, quien fuera mi profesor gu y mentor en muchas de las materias tratadas en este libro, a y en cuyos apuntes se basan muchos de las guras y ejemplos de cdigo Suo perCollider que se pueden encontrar en el libro. Tambin quisiera agradecer e a Alejandro Guarello, por su apoyo constante en este proyecto. Rodrigo F. Cdiz, Ph.D. a Santiago de Chile, Abril de 2008

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

Indice general

Prlogo o Prefacio 1. Se ales y sistemas n 1.1. Seales . . . . . . . . . . . . . . . . . . . . . . . . . . . n 1.1.1. Naturaleza de las seales . . . . . . . . . . . . n 1.1.2. Sinusoides . . . . . . . . . . . . . . . . . . . . . 1.1.3. Exponenciales . . . . . . . . . . . . . . . . . . . 1.1.4. Relacin entre sinusoides y exponenciales . . . o 1.2. Series y transformada de Fourier . . . . . . . . . . . . 1.2.1. Series de Fourier . . . . . . . . . . . . . . . . . 1.2.2. Transformada de Fourier . . . . . . . . . . . . . 1.2.3. DFT y FFT . . . . . . . . . . . . . . . . . . . . 1.2.4. Diagramas en la frecuencia . . . . . . . . . . . 1.3. Otras seales importantes . . . . . . . . . . . . . . . . n 1.4. Sistemas . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1. Clasicacin . . . . . . . . . . . . . . . . . . . o 1.4.2. Respuesta al impulso y respuesta de frecuencia 2. El sonido 2.1. Ondas de sonido . . . 2.2. Fuentes sonoras . . . . 2.3. Medicin del sonido . o 2.4. Amplitud e intensidad

I III

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

. . . . . . . . . . . . . .

1 1 2 5 7 9 11 11 13 14 14 15 17 18 19 21 21 23 23 24

. . . .

. . . .

. . . .

. . . . v

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

vi 2.5. 2.6. 2.7. 2.8. Frecuencia . . . . . . . Fase . . . . . . . . . . Forma de onda . . . . Representacin grca o a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

INDICE GENERAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 27 27 28 31 31 31 32 32 32 33 36 39 39 40 41 41 43 45 46 48 53 54 57 59 63 63 66 68 72 73 75 76 78 81 82

3. Psicoac stica u 3.1. Conceptos bsicos . . . . . . . . . . . . a 3.1.1. M nima diferencia notoria . . . . 3.1.2. Ley de Weber . . . . . . . . . . . 3.1.3. Modos de percepcin . . . . . . . o 3.2. El sistema auditivo humano . . . . . . . 3.2.1. El o do . . . . . . . . . . . . . . 3.2.2. Membrana basilar . . . . . . . . 3.2.3. Clulas auditivas . . . . . . . . . e 3.2.4. El cerebro auditivo . . . . . . . . 3.3. Bandas cr ticas y enmascaramiento . . . 3.3.1. Escala de Barks y ERB . . . . . 3.3.2. Enmascaramiento . . . . . . . . . 3.3.3. Midiendo la banda cr tica . . . . 3.4. Intensidad perceptual (loudness) . . . . 3.4.1. Escala de fonos y escala de sonos 3.5. Altura (pitch) . . . . . . . . . . . . . . . 3.5.1. Escala de mels . . . . . . . . . . 3.6. Timbre . . . . . . . . . . . . . . . . . . . 3.7. Consonancia y disonancia . . . . . . . . 3.8. Codicacin perceptual de audio . . . . o

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

4. Audio digital 4.1. Anlogo versus digital . . . . . . . . . . . a 4.1.1. Muestreo . . . . . . . . . . . . . . 4.1.2. Cuantizacin . . . . . . . . . . . . o 4.2. Sistema binario . . . . . . . . . . . . . . . 4.3. El computador . . . . . . . . . . . . . . . 4.4. Programacin de computadores . . . . . . o 4.5. Sistema operativo y sistema de archivos . 4.6. Uso del computador en sistemas de audio 4.7. Software para msica computacional . . . u 4.8. MIDI . . . . . . . . . . . . . . . . . . . . . CADIZ, R.

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

INTRODUCCION A LA MUSICA COMPUTACIONAL

INDICE GENERAL 5. S ntesis digital de sonidos 5.1. Clasicacin . . . . . . . . . . . . . . . o 5.2. Evaluacin . . . . . . . . . . . . . . . o 5.3. Fundamentos . . . . . . . . . . . . . . 5.3.1. Osciladores . . . . . . . . . . . 5.3.2. Tabla de ondas . . . . . . . . . 5.3.3. Envolventes . . . . . . . . . . . 5.4. S ntesis aditiva . . . . . . . . . . . . . 5.5. S ntesis substractiva . . . . . . . . . . 5.6. Modulacin . . . . . . . . . . . . . . . o 5.6.1. Modulacin Ring . . . . . . . . o 5.6.2. S ntesis AM . . . . . . . . . . . 5.6.3. S ntesis FM . . . . . . . . . . . 5.7. S ntesis granular . . . . . . . . . . . . 5.8. Modelos f sicos . . . . . . . . . . . . . 5.9. Modelos espectrales . . . . . . . . . . 5.9.1. Phase vocoder . . . . . . . . . 5.9.2. S ntesis de formantes . . . . . . 5.10. Modelos basados en part culas . . . . . 5.11. Modelos basados en dinmica no lineal a 5.12. S ntesis basada en complejidad . . . . 6. Procesamiento digital de audio 6.1. Filtros digitales . . . . . . . . . . . 6.1.1. Ecuacin de diferencias . . o 6.1.2. Funcin de transferencia . . o 6.1.3. Respuesta de frecuencia . . 6.1.4. Respuesta de fase . . . . . . 6.1.5. Diagramas de polos y ceros 6.1.6. Filtros de primer orden . . 6.1.7. Filtros de segundo orden . . 6.2. Filtros FIR . . . . . . . . . . . . . 6.2.1. Diseo de ltros FIR . . . . n 6.3. Filtros IIR . . . . . . . . . . . . . . 6.3.1. Diseo de ltros IIR . . . . n 6.3.2. Transformada Z bilinear . . 6.4. Filtros bi-cuadrticos . . . . . . . . a 6.5. Filtros comb . . . . . . . . . . . . . 6.5.1. Phasing y anging . . . . . 6.6. Ecualizador . . . . . . . . . . . . . CADIZ, R.

vii 85 85 89 91 91 92 93 95 96 98 99 99 101 102 103 104 104 105 106 106 107 109 109 110 111 112 113 116 118 118 120 121 121 122 123 124 124 126 126

. . . . . . . . . . . . . . . . . . y .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . caos . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . .

INTRODUCCION A LA MUSICA COMPUTACIONAL

viii 6.7. Compresin . . . . . . . . . . . o 6.8. Reverberacin . . . . . . . . . . o 6.8.1. Reverberacin articial o 6.9. Otros efectos . . . . . . . . . . 6.9.1. Chorus . . . . . . . . . 6.9.2. Wah wah . . . . . . . . 6.9.3. Delay . . . . . . . . . . 6.10. Procesador de efectos genrico e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

INDICE GENERAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 129 131 132 132 132 132 132

7. La m sica electroac stica u u 7.1. Caracter sticas de la msica electroacstica . . . . . . . u u 7.1.1. Material sonoro . . . . . . . . . . . . . . . . . . . 7.1.2. Ausencia de notacin y representacin abstracta o o 7.1.3. Composicin y anlisis . . . . . . . . . . . . . . . o a 7.1.4. Composicin e improvisacin . . . . . . . . . . . o o 7.1.5. Msica electroacstica y su signicado . . . . . . u u 7.2. Estrategias auditivas . . . . . . . . . . . . . . . . . . . . 7.2.1. Audicin musical . . . . . . . . . . . . . . . . . . o 7.2.2. Modos Schaeerianos de audicin . . . . . . . . . o 7.2.3. Audicin de fondo . . . . . . . . . . . . . . . . . o 7.2.4. Audicin reducida . . . . . . . . . . . . . . . . . o 7.2.5. Modos auditivos de Smalley . . . . . . . . . . . . 7.2.6. Conductas auditivas de Delalande . . . . . . . . 7.3. Percepcin de la msica electroacstica . . . . . . . . . o u u 7.3.1. Enfoque ecolgico . . . . . . . . . . . . . . . . . o 7.3.2. Paisajes sonoros . . . . . . . . . . . . . . . . . . 7.3.3. Autocentricidad y alocentricidad . . . . . . . . . 7.3.4. Sustitucin . . . . . . . . . . . . . . . . . . . . . o 7.4. Estrategias anal ticas . . . . . . . . . . . . . . . . . . . . 7.4.1. Objetos sonoros . . . . . . . . . . . . . . . . . . . 7.4.2. Espectromorfolog . . . . . . . . . . . . . . . . . a 7.4.3. Arquetipos morfolgicos, modelos y cadenas . . . o 7.4.4. Anlisis basado en conductas auditivas . . . . . . a 7.4.5. El sonograma . . . . . . . . . . . . . . . . . . . . 7.4.6. Anlisis narrativo . . . . . . . . . . . . . . . . . . a 7.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . CADIZ, R.

. . . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . .

135 . 136 . 136 . 138 . 139 . 140 . 140 . 141 . 142 . 142 . 143 . 143 . 143 . 144 . 145 . 145 . 146 . 147 . 148 . 148 . 150 . 150 . 151 . 152 . 153 . 153 . 154

INTRODUCCION A LA MUSICA COMPUTACIONAL

INDICE GENERAL A. Ejemplos en SuperCollider A.1. SuperCollider: introduccin . . . . . . . . . . o A.2. SuperCollider: el lenguaje . . . . . . . . . . . A.3. SuperCollider: Unidades generadoras . . . . . A.4. SuperCollider: Envolventes . . . . . . . . . . A.5. SuperCollider: SynthDefs . . . . . . . . . . . A.6. SuperCollider: Modulacin . . . . . . . . . . . o A.7. SuperCollider: S ntesis granular . . . . . . . . A.8. SuperCollider: Patrones . . . . . . . . . . . . A.9. SuperCollider: Filtros bi-cuadrticos . . . . . a A.10.SuperCollider: Compresin . . . . . . . . . . o A.11.SuperCollider: Reverberacin . . . . . . . . . o A.12.SuperCollider: Procesador de efectos genrico e

ix 157 157 160 167 175 180 185 200 201 207 216 225 238

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

x

INDICE GENERAL

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

Indice de guras

1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7. 1.8. 1.9.

Ejemplo grco de una seal . . . . . . . . . . a n Ejemplos de seales continuas y discretas . . . n Ejemplos de ondas peridica y aperidica . . . o o Funciones seno y coseno . . . . . . . . . . . . . Funcin exponencial . . . . . . . . . . . . . . . o El plano complejo . . . . . . . . . . . . . . . . Suma de seales armnicas . . . . . . . . . . . n o La serie armnica . . . . . . . . . . . . . . . . . o Representacin en el tiempo y en la frecuencia o seales . . . . . . . . . . . . . . . . . . . . . . . n 1.10. Otras seales importantes . . . . . . . . . . . . n 1.11. Diagrama de un sistema . . . . . . . . . . . . . 1.12. Respuesta al impulso . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . de . . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . distintas . . . . . . . . . . . . . . . . . . . . . . . .

2 3 5 6 8 10 12 13 16 17 18 19 22 25 34 35 36 37 37 38 39

2.1. Rarefaccin y compresin en una onda sonora . . . . . . . . . o o 2.2. Intensidad vs distancia . . . . . . . . . . . . . . . . . . . . . . 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. El o humano . . . . . . . . . . . . . . . . . . . . . do Respuesta de frecuencia del canal auditivo . . . . . . Seccin del o interno . . . . . . . . . . . . . . . . o do Seccin perpendicular de la cclea . . . . . . . . . . o o La membrana basilar desenrrollada . . . . . . . . . . Patrones de vibracin en la membrana basilar . . . . o Esquema del rgano de corti, que contiene las clulas o e vas o ciliares . . . . . . . . . . . . . . . . . . . . . . xi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . auditi. . . . .

xii

INDICE DE FIGURAS 3.8. Esquema de las bandas cr ticas del sistema auditivo humano . 3.9. Banco de ltros auditivos . . . . . . . . . . . . . . . . . . . . 3.10. Enmascaramiento . . . . . . . . . . . . . . . . . . . . . . . . . 3.11. Medicin de la banda cr o tica . . . . . . . . . . . . . . . . . . . 3.12. Enmascaramiento simultneo . . . . . . . . . . . . . . . . . . a 3.13. Enmascaramiento hacia atrs . . . . . . . . . . . . . . . . . . a 3.14. Enmascaramiento hacia adelante . . . . . . . . . . . . . . . . 3.15. Umbrales de audibilidad . . . . . . . . . . . . . . . . . . . . . 3.16. Contornos de intensidad perceptual, norma ISO 226 . . . . . 3.17. Pitch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.18. Espectro de un tono de Shepard . . . . . . . . . . . . . . . . 3.19. Demostracin de la existencia del tono virtual . . . . . . . . . o 3.20. Altura e intensidad . . . . . . . . . . . . . . . . . . . . . . . . 3.21. Altura y duracin . . . . . . . . . . . . . . . . . . . . . . . . . o 3.22. Altura y duracin . . . . . . . . . . . . . . . . . . . . . . . . . o 3.23. Trayectoria de armnicos en la trompeta . . . . . . . . . . . . o 3.24. Esquema de un codicador perceptual de audio . . . . . . . . 4.1. Seal anloga versus digital . . . . . . . . . . . . . . . . n a 4.2. Digitalizacin de una seal anloga . . . . . . . . . . . . o n a 4.3. Algunas funciones de ventanas . . . . . . . . . . . . . . 4.4. Muestreo de una seal digital . . . . . . . . . . . . . . . n 4.5. Aliasin en el dominio de la frecuencia . . . . . . . . . . o 4.6. Aliasin en el dominio del tiempo . . . . . . . . . . . . . o 4.7. Proceso de cuantizacin . . . . . . . . . . . . . . . . . . o 4.8. Cuantizacin de una seal analgica . . . . . . . . . . . o n o 4.9. Error de cuantizacin . . . . . . . . . . . . . . . . . . . o 4.10. Dithering . . . . . . . . . . . . . . . . . . . . . . . . . . 4.11. Estructura bsica de un computador . . . . . . . . . . . a 4.12. Sistemas Operativos ms utilizados . . . . . . . . . . . . a 4.13. Sistemas computacionales de audio . . . . . . . . . . . . 4.14. Uso del computador por parte de los compositores . . . 4.15. Familia de los programas de s ntesis de sonidos . . . . . 4.16. Softwares de msica ms utilizados en los aos noventa u a n 5.1. 5.2. 5.3. 5.4. 5.5. Oscilador . . . . . . . . . . . . . . . . . . . . . . . . Seales bsicas comnmente utilizadas en osciladores n a u Tabla de ondas . . . . . . . . . . . . . . . . . . . . . Algoritmo de un oscilador digital de sonidos . . . . . Envolvente de amplitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 43 43 44 44 45 45 46 47 50 51 52 53 53 54 57 60 64 65 66 67 69 69 70 70 71 71 73 77 79 80 81 82 91 92 92 93 94

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

INDICE DE FIGURAS 5.6. Envolventes para distintas dinmicas . . . . . . . . . a 5.7. Envolvente ADSR . . . . . . . . . . . . . . . . . . . 5.8. Proceso de generacin de envolventes . . . . . . . . . o 5.9. Suma de seales simples para generar una compleja . n 5.10. S ntesis aditiva . . . . . . . . . . . . . . . . . . . . . 5.11. S ntesis substractiva . . . . . . . . . . . . . . . . . . 5.12. Conguracin de ltros en la s o ntesis substractiva . . 5.13. Modulacin ring o anillo . . . . . . . . . . . . . . . . o 5.14. Espectro de la modulacin ring . . . . . . . . . . . . o 5.15. S ntesis AM . . . . . . . . . . . . . . . . . . . . . . . 5.16. Espectro de la modulacin AM . . . . . . . . . . . . o 5.17. S ntesis FM . . . . . . . . . . . . . . . . . . . . . . . 5.18. Espectro de la modulacin FM . . . . . . . . . . . . o 5.19. Grano sonoro sinusoidal . . . . . . . . . . . . . . . . 5.20. Grano sonoro de ruido blanco . . . . . . . . . . . . . 6.1. 6.2. 6.3. 6.4. 6.5. 6.6. 6.7. 6.8. 6.9. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

xiii 94 94 95 96 97 97 98 99 99 100 101 101 102 103 103 109 110 112 113 114 114 115 117 117 118 119 119 119 120 122 124 125 125 127 128 129

Un ltro como una caja negra . . . . . . . . . . . . . . . . . . Filtrado versus no ltrado . . . . . . . . . . . . . . . . . . . . Respuestas de frecuencia t picas . . . . . . . . . . . . . . . . . Respuesta de fase . . . . . . . . . . . . . . . . . . . . . . . . . Respuestas de fase lineales versus no lineales . . . . . . . . . Retraso de fase . . . . . . . . . . . . . . . . . . . . . . . . . . Fase desenrrollada . . . . . . . . . . . . . . . . . . . . . . . . El plano z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Estimacin de la respuesta de amplitud mediante un diagrao ma de polo y ceros . . . . . . . . . . . . . . . . . . . . . . . . 6.10. Estimacin de la respuesta de fase mediante un diagrama de o polo y ceros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.11. Filtro de primer orden de un cero . . . . . . . . . . . . . . . . 6.12. Filtro de primer orden de un polo . . . . . . . . . . . . . . . . 6.13. Filtro de segundo orden de dos polos y dos ceros . . . . . . . 6.14. Esquema de implementacin de un ltro FIR . . . . . . . . . o 6.15. Esquema de implementacin de un ltro IIR . . . . . . . . . . o 6.16. Filtro comb no recursivo . . . . . . . . . . . . . . . . . . . . . 6.17. Filtro comb recursivo . . . . . . . . . . . . . . . . . . . . . . . 6.18. Respuesta de amplitud de un ltro comb . . . . . . . . . . . . 6.19. Dos curvas de ecualizacin . . . . . . . . . . . . . . . . . . . . o 6.20. Funciones de compresin a distintas tasas . . . . . . . . . . . o 6.21. Correccin automtica de ganancia . . . . . . . . . . . . . . . o a

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

xiv

INDICE DE FIGURAS

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

Indice de cuadros

2.1. Tabla de intensidades sonoras . . . . . . . . . . . . . . . . . . 3.1. Escala de Barks, para estimacin de las bandas cr o ticas del sistema auditivo . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Razones entre intervalos musicales . . . . . . . . . . . . . . . 4.1. Representacin numrica en distintos sistemas . . . . . . . . . o e 5.1. Taxonom de las tcnicas de s a e ntesis digital de sonidos . . . .

26

42 58 72 88

xv

xvi

INDICE DE CUADROS

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

Cap tulo 1

Se ales y sistemas n

El sonido es fundamentalmente una seal, que conlleva informacin de n o tipo acstica. Todos los tipos de seales, sean stas naturales o articiales, u n e tienen caracter sticas comunes que hacen posible su estudio en forma independiente de su naturaleza. Por lo general, las seales son procesadas o n modicadas por sistemas. En el caso de la msica computacional, el compuu tador genera o modica una seal acstica digitalizada, por lo tanto se comn u porta como un sistema. En este cap tulo se presentan los conceptos bsicos a de la teor de seales y sistemas, los cuales resultan fundamentales para a n entender y estudiar como una seal de audio puede ser modicada o crean da en el computador de las ms diversas maneras, con el objetivo nal de a generar msica. u

1.1.

Se ales n

Una seal, en forma simplicada, se puede entender como cualquier men canismo que es empleado para transmitir informacin [15]. Algunos ejemo plos de seales son: un faro, ondas electromagnticas enviadas por un radar, n e seales de humo, una onda de sonido viajando por el aire o las ondas de la n actividad del cerebro captadas por un electrocardiograma. Desde un punto de vista matemtico, una seal es una variable de una a n o ms dimensiones que toma valores de acuerdo a otra variable, como por a ejemplo el tiempo en el caso del sonido o el espacio en el caso de imgenes. a Matemticamente, da exactamente lo mismo si la dependencia es temporal a o espacial, ya que en ambos casos las seales de tratan de igual manera y n slo importa la funcin que modela su comportamiento. o o 1

2

CAP ITULO 1. SENALES Y SISTEMASy=f(x) 3 2 1 Seal (y) 0 1 2 3 1

0.5 0 0.5 Variable independiente(x)

1

Figura 1.1: Ejemplo grco de una seal a n En el caso de las seales acsticas, es comn utilizar la letra t para den u u signar a la variable independiente, que corresponde al tiempo, y la letra y para designar a la seal, o variable dependiente. La relacin que dene el n o comportamiento de la seal con respecto a la variable independiente corresn ponde a una funcin que usualmente se denomina por la letra f. Por lo tanto o la ecuacin: o y = f (t) (1.1)

simplemente signica que y depende del tiempo de acuerdo a la funcin f. o La gura 1.1 muestra una representacin grca de una seal en funcin de o a n o dos variables, y y t. La forma o morfolog de la funcin f es lo que determina a o la informacin contenida en la seal. o n

1.1.1.

Naturaleza de las se ales n

Las seales son de distinta naturaleza. Una seal puede ser, por ejemplo, n n una onda de presin viajando por el aire producida por la voz de un cantante o en algn escenario cercano. En este caso claramente la seal es de tipo f u n sico, es decir involucra tomos, molculas y otras part a e culas f sicas. Sin embargo, CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

1.1. SENALES

3

una seal puede no tener relacin con algn fenmeno f n o u o sico. Un ejemplo de esto es el valor del ndice de acciones de la bolsa de comercio, que cambia todos los d pero slo corresponde a un valor numrico, sin relacin con as, o e o el mundo f sico. Si una seal toma valores en forma continua, es decir, si para todos los n valores de la variable independiente existe un valor para la variable independiente, se habla de que la seal es continua. Un ejemplo de esto es la seal n n de temperatura que entrega un termmetro en el tiempo. El termmetro o o siempre est marcando alguna temperatura y cualquier persona puede leer a la posicin de la barra de mercurio ahora, o en una milsima de segundo deso e pus o en un ao ms y el termmetro siempre entregar un valor a menos e n a o a que est roto. e Por el contrario, si una seal toma valores slo para algunos valores de n o la variable independiente, se habla de una seal discreta. Por ejemplo, la luz n roja de un semforo slo se enciende durante algunos instantes de tiempo a o en forma c clica.Seal Continua 4 3 2 Seal (y)Seal (y) 4 3 2 1 0 1 2 3 Seal Discreta

1 0 1 2 3 4 1 0.5 0 0.5 Variable independiente(x) 1

4 1

0.5 0 0.5 Variable independiente(x)

1

(a) Seal continua n

(b) Seal discreta n

Figura 1.2: Ejemplos de seales continuas y discretas n Un computador no funciona en forma continua sino en intervalos regulares de tiempo y por ende, slo maneja en forma interna seales digitales. o n Para digitalizar una seal es necesario discretizarla. Es decir, tomar muesn tras a intervalos regulares de la seal analgica original y guardar estas n o muestras. Este proceso se conoce como, digitalizacin, muestreo o sampleo y o ser abordado en profundidad en el cap a tulo 4. Se puede adelantar aqu que CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

4

CAP ITULO 1. SENALES Y SISTEMAS

la calidad de la seal discreta depende de la frecuencia a la cual se muestrea n la seal original. n La gura 1.2 muestra dos seales: una continua y otra discreta. Se puede n observar all que ambas tienen la misma forma, en el sentido que tienen la misma envolvente. En efecto, la seal de la derecha corresponde a la seal n n de la izquierda discretizada. La unica informacin que esta seal contiene es o n el valor de la amplitud para cada una de las muestrasen esos instantes de tiempo. En una primera observacin da la impresin que la seal muestreada o o n pierde informacin respecto de la seal original ya que no almacena ningn o n u tipo de informacin entre las muestras. Sin embargo, esto no ocurre si es que o la frecuencia de muestreo es lo sucientemente alta para asegurar la calidad del proceso de digitalizacin. Esto se explica en detalle en la seccin 4.1.1. o o Tambin las seales pueden variar de acuerdo a su periodicidad. En la e n gura 1.3 se aprecian dos formas de onda distintas. En la primera de ellas, se aprecia que la onda est compuesta de patrones repetitivos, mientras que a la segunda posee una forma que parece ser aleatoria, sin un comportamiento denido. En el caso de la primera forma de onda, se dice que corresponde a una onda peridica, es decir, que se repite cada cierto tiempo. En el caso de la o segunda, se habla de una forma de onda aperidica , pues no sigue un patrn o o determinado de repeticin. o Una seal peridica f (x) es una que cumple la siguiente relacin: n o o f (x) = f (x + T ) (1.2)

donde T se conoce como el per odo de la seal. n En cambio, para una seal aperidica, no existe ninguna variable T que n o cumpla la relacin anterior. o En el caso de un onda peridica, el patrn que se repite corresponde o o a un ciclo . La duracin de cada uno de los ciclos de una onda se conoce o como per odo y corresponde a la variable T de la ecuacin 1.2. La tasa a la o cual los ciclos de una onda peridica se repiten se conoce como frecuencia o y por lo general se mide en ciclos por segundo o Hertz (Hz) si la variable independiente corresponde al tiempo. Matemticamente, la frecuencia es el a inverso del per odo, por lo tanto un per odo de 1 ms (milisegundos) tiene una frecuencia de 1000 Hz. En las seales aperidicas no se presentan patrones de repeticin, dado n o o que nada se repite en forma peridica. La ausencia de una o ms frecuencias o a predominantes hace que este tipo de ondas sean muy complejas y dif ciles de modelar. Generalmente, este tipo de seales corresponden a patrones n CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

1.1. SENALES

5

Onda perodica 3 2 1 Seal (y) 0 1 2 3 1 0.2 Seal (y) 0.6 1

Onda aperodica

0.8

0.4

0.5 0 0.5 Variable independiente(x)

1

0 1

0.5 0 0.5 Variable independiente(x)

1

(a) Onda peridica o

(b) Onda aperidica o

Figura 1.3: Ejemplos de ondas peridica y aperidica o o aleatorios o simplemente a ruido.

1.1.2.

Sinusoides

La sinusoide es una de las seales ms simples e importantes que existen. n a Las dos funciones matemticas sinusoidales bsicas son las funciones seno y a a coseno, las cuales estn derivadas de las funciones trigonomtricas del mismo a e nombre. Matemticamente una funcin de este tipo se puede escribir como: a o f (x) = A sin(wx + ) o como f (x) = A cos(wx + ) (1.4) (1.3)

La amplitud A corresponde a la desviacin mxima de la seal respecto o a n del origen (posicin de equilibrio). La frecuencia w corresponde a la cantidad o de ciclos que existen en un determinado rango de la variable x. La fase, denotada por la letra , corresponde a la desviacin o corrimiento de la o seal respecto del eje Y. n Una seal simple, de tipo sinusoidal, est completamente determinada n a por estos tres parmetros: amplitud, frecuencia y fase. a CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

6

CAP ITULO 1. SENALES Y SISTEMAS

Ambas funciones, seno y coseno, son c clicas o peridicas, es decir, vuelo ven a tomar los mismos valores despus de un cierto rango de valores de la e variable independiente. Por ejemplo, la funcin seno es una funcin que vale 0 cuando la variable o o independiente vale 0, 1 cuando sta vale /2, 0 cuando pasa por , -1 cuando e cruza en 3/2 y nuevamente cero cuando la variable independiente vale 2.Funcin seno 1 0.8 Variable dependiente y Variable dependiente y 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 6 4 2 0 2 4 Variable independiente x 6 1 0.8 0.6 0.4 0.2 0 0.2 0.4 0.6 0.8 1 6 4 2 0 2 4 Variable independiente x 6 Funcin coseno

(a) Funcin seno o

(b) Funcin coseno o

Figura 1.4: Funciones seno y coseno La funcin coseno es muy similar a la funcin seno, slo que est desfasada.en o o o a relacin al eje Y. En relacin al desfase, Las siguientes relaciones matemtio o a cas se cumplen entre estas funciones: cos(x) = sin( sin(x) = cos( x) 2 x) 2 (1.5) (1.6)

La funcin seno es un funcin impar, es decir, no es simtrica respecto o o e al eje Y. Matemticamente esto es: a sin(x) = sin(x) (1.7)

En cambio el coseno es una funcin par, porque es simtrica respecto al o e eje Y. Matemticamente, esto equivale a: a cos(x) = cos(x) CADIZ, R. (1.8)

INTRODUCCION A LA MUSICA COMPUTACIONAL

1.1. SENALES

7

Las sinusoides son fundamentales para la f sica en general y la acstica u en particular. Cualquier cosa que resuene u oscile produce un movimiento de tipo sinusoidal. Un ejemplo de esto es la oscilacin de un pndulo, conocida o e como movimiento armnico simple. o Otra razn de la importancia de las sinusoides es que constituyen funo ciones bsicas de los sistemas lineales. Esto signica que cualquier sistema a lineal puede ser estudiado a travs de su respuesta a funciones sinusoidales. e En el campo del audio, las sinusoides son importantes para el anlisis de a ltros tales como reverberadores, equalizadores y otros tipos de efectos. Desde un punto de vista matemtico, las sinusoides constituyen bloques a fundamentales que al ser combinados de cierta forma permiten la creacin o o s ntesis de cualquier tipo de seal, por muy compleja que sea. n Pero quizs la razn ms importante es que el sistema auditivo humano a o a funciona como un analizador de espectro, tal como se detalla en el cap tulo 3. Esto es, el o humano f do sicamente separa un sonido en sus componentes de frecuencia sinusoidales. Por lo tanto, el o humano funciona en forma do muy similar a un analizador de Fourier (ver seccin 1.2) y la representacin o o de un sonido en el dominio de la frecuencia (ver seccin 1.2.4) es mucho ms o a cercana a lo que nuestro cerebro recibe que la representacin temporal. o

1.1.3.

Exponenciales

Existe otra funcin matemtica muy importante, conocida como expoo a nencial. La forma cannica de una funcin exponencial es la siguiente: o o f (t) = Aet/ , t 0 (1.9)

A corresponde a la amplitud mxima de la exponencial y se conoce a como la constante de tiempo de la exponencial. La constante de tiempo es el tiempo que demora la exponencial en decaer 1/e, es decir: f ( ) 1 = f (0) e (1.10)

La gura 1.5 muestra el grco de una funcin exponencial para A = a o 1 y = 1. En la ecuacin 1.9 e es el nmero de Euler, el cual tiene el o u valor irracional 2.718... y constituye la base de los logaritmos naturales. Este nmero es uno de los ms importantes y fascinantes de la matemtica u a a y puede calcularse como:

e=k=0

1 1 = l (1 + )n 2,718... m n0 k! n

(1.11)

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

8

CAP ITULO 1. SENALES Y SISTEMASFuncin exponencial, para A=1 y =1 1 0.9 0.8 0.7 Amplitud 0.6 0.5 0.4 0.3 0.2 0.1 0 0 2 4 6 Tiempo t t=t60 8 t=

10

Figura 1.5: Funcin exponencial o El decaimiento exponencial ocurre naturalmente cuando una cantidad est decayendo a una tasa proporcional a lo que an queda por caer. En a u la naturaleza, todos los resonadores lineales, tales como las cuerdas de los instrumentos musicales y los instrumentos de vientos exhiben un decaimiento exponencial en su respuesta a una excitacin momentnea. La energ o a a reverberante en una sala de conciertos decae exponencialmente una vez nalizada la emisin de sonido. Esencialmente todas las oscilaciones libres o (sin una fuente mantenida en el tiempo) caen exponencialmente siempre que sean lineales e invariantes en el tiempo. Ejemplos de este tipo de oscilaciones incluyen la vibracin de un diapasn, cuerdas pulsadas o pellizcadas o o y barras de marimba o xilfonos. o El crecimiento exponencial ocurre cuando una cantidad crece a una tasa proporcional al incremento actual. El crecimiento exponencial es inestable dado que nada puede crecer para siempre sin llegar a un cierto nivel l mite. Es necesario notar que en la ecuacin 1.9, una constante de tiempo poo sitiva implica a un decaimiento exponencial mientras que una constante de tiempo negativa corresponde a un crecimiento exponencial. En sistemas de audio, una decaimiento de 1/e se considera muy pequeo n para aplicaciones prcticas, como por ejemplo, para el diseo acstico de a n u salas de concierto. Por lo general, se utiliza una cantidad tal que asegure que la seal ha ca 60 decibelios (dB). Esta cantidad, denotada por t60 , se n do CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

1.1. SENALES encuentra resolviendo la ecuacin: o f (t60 ) = 1060/20 = 0,001 f (0)

9

(1.12)

Usando la denicin de exponencial de la ecuacin 1.9, se tiene entonces o o que: t60 = ln(1000) 6,91 (1.13)

Esta ecuacin nos dice que la constante t60 es aproximadamente 7 veces o la constante de tiempo . Esto puede vericarse en la gura 1.5, donde se aprecia la ubicacin de dicha cantidad en el eje del tiempo. o

1.1.4.

Relacin entre sinusoides y exponenciales o

Existen dos relaciones muy importantes para el anlisis de seales y para a n el Teorema de Fourier, llamadas ecuaciones de Euler . Estas son: eix = cos(x) + i sin(x) eix = cos(x) i sin(x) (1.14)

(1.15)

Esta ecuacin nos dice que las exponenciales y las sinusoides estn o a ntimamente relacionadas. En la ecuacin 1.14, el nmero i representa al nmero o u u imaginario y que est denido por la relacin: a o i= 1 (1.16)

El nmero imaginario i tiene una importancia fundamental en el anlisis u a de frecuencia de una seal, fundamentalmente porque, tal como se ver en n a forma siguiente, las sinusoides pueden representarse y manejarse en forma ms compacta si se utilizan nmeros complejos. Los nmeros complejos estn a u u a constituidos por un par ordenado de nmeros, uno real y otro imaginario, y u usualmente se gracan en lo que se denomina el plano complejo, mostrado en la gura 1.6, donde el eje de ordenadas representa los nmeros reales u y el eje de absisas los imaginarios. En este plano un nmero complejo es u un vector que se puede representar de dos formas: cartesiana y polar. En la forma cartesiana, un nmero complejo Z se representa como la suma de u su parte real con su parte imaginaria o bien Z = x + iy. Pero el mismo nmero se puede representar mediante el largo del vector y su ngulo, lo u a que se denomina forma polar. En este caso se tiene Z = r , donde r es el CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

10

CAP ITULO 1. SENALES Y SISTEMAS

imaginario x+iy y r x real

Figura 1.6: El plano complejo mdulo o magnitud del nmero complejo y que tambin suele representarse o u e como |Z|. Ambas representaciones estn relacionadas por las siguientes ecuaciones: a r= y y (1.18) x La ecuaciones 1.14 y 1.15 pueden utilizarse para demostrar que: = arctan cos(x) = y eix eix (1.20) 2i Multiplicando la ecuacin 1.14 por una amplitud A 0 y utilizando o x = wt + se tiene: sin(x) = Aei(wt+) = A cos(wt + ) + iB sin(wt + ) (1.21) eix + eix 2 (1.19) x2 + y 2 (1.17)

Esta ecuacin describe una sinusoide compleja. Por lo tanto, una sinuo soide compleja contiene una parte real coseno y una parte imaginaria seno. CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

1.2. SERIES Y TRANSFORMADA DE FOURIER

11

De acuerdo a las ecuaciones 1.19 y 1.20 y dado que eiwt corresponde a una sinusoide compleja (ecuacin 1.21), se tiene entonces que toda sinusoide o real est compuesta por una contribucin equitativa de frecuencias positivas a o y negativas. Dicho de otra forma, una sinusoide real consiste de una suma de dos sinusoides complejas, una de frecuencia positiva y la otra de frecuencia negativa. Esto signica que el espectro de frecuencias de una sinusoide o de una funcin peridica compuesta por sinusoides es simtrico o o e respecto del origen y contiene tanto frecuencias negativas como positivas. Este hecho es de suma importancia para el anlisis de seales y para a n lo que posteriormente se ver como teorema del muestreo, detallado en la a seccin 4.1.1. o

1.2.1.2.1.

Series y transformada de FourierSeries de Fourier

En 1811, el matemtico Jean Baptiste Fourier demostr que cualquier a o seal peridica razonable puede expresarse como la suma de una o ms n o a sinusoides de distinta frecuencia, fase y amplitud. Se entiende por una seal n razonable, una que posee valores mximos menores que innito y un nmero a u nito de saltos en un per odo. Estas sinusoides estn armnicamente relacionadas entre s es decir, sus a o , frecuencias son mltiplos enteros de una frecuencia fundamental. Esta suma u ponderada de seales sinusoidales se conoce como Serie de Fourier. La serie n de Fourier de una seal peridica f (x) de per n o odo T0 puede escribirse como:

f (x) = a0 +k=1

(ak cos(kw0 x) + bk sin(kw0 x))

(1.22)

donde w0 es la frecuencia fundamental (w0 = 2/T0 ) y los coecientes a0 ,ak y bk constituyen un conjunto de nmeros asociados un u vocamente con la funcin f(x). Esta forma de escribir la serie de Fourier se conoce como o forma trigonomtrica. e Utilizando las ecuaciones de Euler 1.14 y 1.15, se puede escribir la serie de Fourier en forma ms compacta como: a

f (x) =k=

Ck eikw0 x

(1.23)

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

12

CAP ITULO 1. SENALES Y SISTEMAS

Esta forma de escribir la ecuacin se conoce como forma compleja. o La ecuacin 1.22 nos dice que para cualquier seal peridica f (x) pueden o n o encontrarse coecientes a0 , a1 , b1 , a2 , b2 , ... tales que multiplicados por sinusoides de frecuencias w0 , 2w0 , 3w0 , ... den como resultado la funcin f (x) o cuando estas sinusoides se suman. En palabras ms simples, toda funcin peridica de frecuencia a o o w, cualquiera sea su naturaleza, est compuesta por la suma de a varias sinusoides de frecuencias mayores o iguales a w, cada una de las cuales tiene distinta amplitud, frecuencia y fase. Las frecuencias involucradas estn armnicamente relacionadas entre s a o . Lo anterior implica dos cosas: 1. Si se toman varias sinusoides de distintas frecuencias, fases y amplitudes y se suman, se obtendr una seal peridica. a n o 2. Dada una seal peridica f (x) cualquiera, sta siempre podr descomn o e a ponerse en sus componentes de frecuencia, mediante la determinacin o de las sinusoides que la conforman. Si se gracan las frecuencias de estas sinusoides versus la amplitud de cada una de ellas, dicho grco a se conoce como espectro de frecuencias (ver seccin 1.2.4). o La gura 1.7 muestra a varias sinusoides de frecuencias relacionadas y su suma. All puede observarse que al sumar estas sinusoides se obtiene una nueva forma de onda de frecuencia igual a la frecuencia de la onda fundamental. Esto nos permite comprobar de manera emp rica el descubrimiento de Fourier.

Figura 1.7: Suma de seales armnicas n o CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

1.2. SERIES Y TRANSFORMADA DE FOURIER

13

La serie de Fourier se presenta en forma natural en la mayor de los a instrumentos musicales. Esto se conoce como la serie armnica y constituye o el principio bsico de ejecucin de algunos instrumentos como la trompeta a o o tuba. En la gura 1.8 se muestra la serie armnica en notacin musical. o o Cuando uno toca, por ejemplo, la nota Do en el piano& ?(cent)

1200

w1

w2

701.96

w3

w498.04

w386.31

w315.74

bw266.87 231.17

w

w203.91 182.40

w

#165.00

w b

bw

nw

w

150.64 138.57 128.30 119.44 111.73

4

5

6

7

8

9

10

11

12

13

14

15

16

Figura 1.8: La serie armnica o

1.2.2.

Transformada de Fourier

Ahora cabe preguntarse qu pasa con las funciones que no son peridie o cas? Una forma de extender las series de Fourier a funciones no peridicas, o es truncar las seales en un cierto punto y suponer que la zona truncada n se repite hasta el innito desde ah hacia adelante. Otra forma es suponer que stas poseen un per e odo innito y expandir un tanto las ecuaciones para poder trabajar con este tipo de seales. Esto da pie a la transformada de n Fourier. La Transformada de Fourier es una generalizacin de las Series de Fouo rier. En rigor, esta transformada se aplica a funciones continuas y aperidio cas, pero tambin es posible aplicarla a funciones discretas mediante la utie lizacin de funciones impulso (ver seccin 1.2.3). o o Adems, la transformada de Fourier es un subconjunto de la transfora mada de Laplace, de la cual provee una interpretacin ms simple. Estas o a relaciones hacen de la transformada de Fourier una herramienta clave para traducir seales desde los dominios del tiempo a la frecuencia y viceversa. n Matemticamente, la transformada de Fourier se escribe: a

F (w) =

f (x)eiwx dx

(1.24)

donde w denota la frecuencia y F a la transformada. Esta ecuacin correso ponde a integrar la funcin f (x) multiplicada por una sinusoide compleja en o todo el intervalo de la variable x (desde hasta +). CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

14

CAP ITULO 1. SENALES Y SISTEMAS

La transformada inversa, la que permite encontrar f (x) cuando se conoce F (w) est dada por la ecuacin: a o

f (x) =

F (w)eiwx dw

(1.25)

Utilizando estas relaciones, siempre es posible encontrar una correspondencia entre una funcin y su espectro o viceversa. Es decir: o f (x) F (w) (1.26)

La transformada de Fourier nos permite conocer el espectro de frecuencias de cualquier se al f (x), sea sta peridica o apen e o ridica y cualquiera sea su naturaleza. Es decir, dada una funcin o o f (x) cualquiera, mediante esta transformada podemos saber que frecuencias estn presentes en ella. a

1.2.3.

DFT y FFT

La transformada de Fourier, tal como se present en las ecuaciones 1.24 y o 1.25 permite encontrar transformadas para seales continuas. Sin embargo, n esto no es aplicable directamente a seales discretas o digitales, que son las n que nos interesan en este libro. La Transformada de Fourier Discreta, o bien DFT (Discrete Fourier Transform), se emplea para encontrar el contenido de frecuencia de seales que n son discretas. Esto implica que en el dominio de la frecuencia estas seales n tambin sern peridicas y discretas. El desarrollo de la DFT histricamente e a o o se dio en forma paralela al de la transformada de Fourier continua. A pesar de su existencia, la DFT prcticamente no se utiliza dado que el clculo de la a a transformada discreta es un proceso complejo y lento computacionalmente. Lo que se utiliza en la mayor de los casos para calcular espectros de a seales discretas se llama Transformada Rpida de Fourier, o bien FFT (en n a ingls Fast Fourier Transform), la cual es un algoritmo desarrollado para e obtener la DFT de una forma ms rpida y eciente computacionalmente. a a El tiempo de procesamiento de la FFT es considerablemente ms rpido que a a calcular la DFT directamente.

1.2.4.

Diagramas en la frecuencia

Dado que una seal comnmente posee varias frecuencias aparte de la n u fundamental, tambin esta puede representarse completamente mediante un e diagrama de frecuencias, comnmente llamado espectro de frecuencias. En u CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

1.3. OTRAS SENALES IMPORTANTES

15

la gura 1.9 puede apreciarse tanto la representacin temporal como el eso pectro de las seales. Todos estos espectros fueron calculados utilizando la n transformada rpida de Fourier o FFT. a Como es de esperarse, el espectro de la sinusoide simple, posee un slo o componente de 50 Hz. Es necesario notar que el espectro es simtrico rese pecto al origen y que contiene frecuencias negativas y positivas. El espectro de la suma de tres sinusoides, est caracterizado solamente por tres frea cuencias distintas, que corresponden a las frecuencias de las tres sinusoides constituyentes de la seal. n En cambio, el espectro de la seal aleatoria es ms bien plano y tiene n a componentes en prcticamente todas las frecuencias. Esto nos indica que a mientras ms componentes de frecuencia estn presentes en una seal, su a a n representacin en el tiempo es ms compleja, no en el sentido de los nmeo a u ros complejos sino en su contenido de informacin. Dicho de otro modo, para o reproducir una seal de este tipo, de necesita sumar un nmero muy elevado n u de sinusoides.

1.3.

Otras se ales importantes n

Existen otras seales de importancia en la teor de sistemas, aparte de n a las sinusoides y exponenciales. Una funcin muy importante es el impulso, o denotado por (x), la cual es una funcin que se dene de la siguiente forma: o (x) = x=0 0 x=0 (1.27)

Es decir el impulso es una funcin que slo adquiere un valor para x = 0 y o o vale para todos los otros valores de x. La importancia de esta funcin radica o en que su transformada de Fourier es una funcin constante, es decir esta o seal posee todas las frecuencias posibles. De manera intuitiva, esto puede n entenderse si se piensa que el impulso representa el cambio ms abrupto a posible, y para generar una seal as se requieren de innitas sinusoides de n todas las frecuencias posibles. Otra funcin importante es la funcin rectangular o simplemente rect. o o Su importancia radica en que consituye un ltro pasa bajo ideal. Su transformada de Fourier es otra funcin importante y se denomina sinc. o La funcin rect se dene como: o rect(x) = CADIZ, R. 1 0 x 1 2 para todo otro x1 2

(1.28)

INTRODUCCION A LA MUSICA COMPUTACIONAL

16

CAP ITULO 1. SENALES Y SISTEMAS

y=sin(50t) 1.5 1

Espectro de frecuencias para y=sin(50t) 100 90 80 Frecuencia (en Hertz) 70 60 50 40 30 20 10

0.5 Amplitud 0 0.5 1 1.5 0.04

00.02 0 0.02 Tiempo (en segundos) 0.04

200

100 0 100 Magnitud del espectro

200

(a) Sinusoide simple en el (b) Espectro de una sinusoitiempo de simpley=sin(50t)+0.5*sin(100t)+0.3*sin(150t) 1.5 1

Espectro de y=sin(50t)+0.5*sin(100t)+0.3*sin(150t) 100 90 80 Frecuencia (en Hertz) 70 60 50 40 30 20 10

0.5 Amplitud 0 0.5 1 1.5 0.04

0.02 0 0.02 Tiempo (en segundos)

0.04

0

200

100 0 100 Magnitud del espectro

200

(c) Suma de tres sinusoides (d) Espectro de una suma de en el tiempo tres sinusoidesSeal aleatoria 3 2

Espectro de una seal aleatoria 7 6 Frecuencia (en Hertz) 5 4 3 2 1 0 500

1 Amplitud 0 1 2 3 0.1

0.05 0 0.05 Tiempo (en segundos)

0.1

0 Magnitud del espectro

500

(e) Seal aleatoria en el tiem- (f) Espectro de una seal n n po aleatoria

Figura 1.9: Representacin en el tiempo y en la frecuencia de distintas seales o n

y la funcin sinc como: o CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

1.4. SISTEMAS

17

sin(x) x Todas estas funciones se muestran en la gura 1.10. sinc(x) =Rect Sinc

(1.29)

Impulso

Constante

Figura 1.10: Otras seales importantes n La funcin Gaussiana tambin es de importancia, y es muy utilizada o e para construir ventanas. Su importancia radica en que es la funcin de diso tribucin de probabilidades normal. Se dene de la siguiente manera: o f (x) = Aex2 /(2 2 )

(1.30)

donde se conoce como la desviacin estndar de la distribucin. o a o

1.4.

Sistemas

Un sistema puede ser denido en forma general como una coleccin de o objetos u operaciones para los cuales existen relaciones denidas de causaefecto. Las causas o datos de entrada tambin son llamados excitaciones o e simplemente, entradas. Los efectos o salidas del sistema tambin se conocen e como respuestas o simplemente salidas. Si se conocen los datos de entrada y de salida, es posible desarrollar un modelo que describa a cabalidad el sistema. Este modelo consiste en un conjunto de reglas tales que si son conocidas las entradas, permitan encontrar CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

18

CAP ITULO 1. SENALES Y SISTEMAS

las salidas. Para efectos de un computador, un sistema es un algoritmo que transforma una secuencia de nmeros (entrada) en otra secuencia de u nmeros con propiedades distintas (salida). u

Figura 1.11: Diagrama de un sistema Tal como lo muestra la gura 1.11, un sistema puede representarse por una caja negra a la cual ingresan datos y de la cual salen datos. En audio, los sistemas son muy importantes. Un ltro, como por ejemplo los que posee un equalizador de audio, es un sistema. Un efecto digital, como por ejemplo un chorus, anger o reverb tambin son sistemas y se modelan como tales. e La teor e implementacin de estos y otros tipos de efectos, se aborda en a o el cap tulo 6.

1.4.1.

Clasicacin o

Existen sistemas dinmicos y estticos. Un sistema esttico es uno en el a a a cual los valores de las salidas dependen solamente de los valores actuales de las entradas. En cambio, en un sistema dinmico los valores de las salidas a dependen de los valores presentes y pasados de las entradas. Un sistema de este tipo posee memoria. Un sistema esttico, por ende, no posee memoria. a Tambin los sistemas pueden clasicarse en lineales y no lineales. Cuane do un sistema es lineal, se puede utilizar el principio de superposicin , es o decir, si un sistema posee varias entradas, pueden analizarse por separado las respuestas del sistema a cada una de las entradas y luego calcular la salida como la suma de las respuestas individuales. En cambio en un sistema no lineal, esto no ocurre y su anlisis es bastante ms complejo. a a Los sistemas tambin pueden ser variantes o invariantes en el tiempo. e Un sistema variante en el tiempo es uno en el cual las reglas del sistema dependen del tiempo. Es decir, stas van cambiando a medida que el tiempo e cambia. En cambio, los sistemas invariantes en el tiempo mantienen sus reglas indenidamente. Tambin los sistemas pueden ser continuos o discretos, dependiendo si e las variables de entrada y salida son continuas o discretas. CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

1.4. SISTEMAS

19

1.4.2.

Respuesta al impulso y respuesta de frecuencia

Para estudiar el comportamiento de un sistema sistema lineal e invariante se utilizan normalmente dos tipos de entradas, dado que cualquier tipo de entrada puede ser descompuesta en seales ms elementales y por lo tann a to la respuesta total del sistema puede calcularse mediante el principio de superposicin, si es que se conoce su respuesta a cada una de estas seales o n elementales.Entrada1., 0., 0., 0.,

ltro

Salida.1, .6, .7, .4, -.3, -.1,

a) Entrada: Impulso Dominio del tiempo c) Entrada: constante Dominio de la frecuencia

b) Salida: respuesta al impulso

t

td) Salida: respuesta de frecuencia

f

f

Figura 1.12: Respuesta al impulso La respuesta al impulso corresponde a la respuesta de un sistema a un impulso cuando el sistema se encuentra en estado de reposo. Un impulso, denido en la ecuacin 1.27 es una funcin matemtica abstracta que tiene o o a una amplitud innita y una duracin casi cero. Por una propiedad matemtio a ca llamada propiedad del cedazo, se puede demostrar que cualquier funcin o puede descomponerse en una suma de impulsos. Dado que la transformada de Fourier de un impulso de una funcin constante en la frecuencia, esta o seal es ideal para estudiar sistemas, ya que permite estimar la respuesta de n un sistema cualquiera a seales con un contenido de frecuencias previamente n determinado. Otra respuesta muy utilizada para disear sistemas es la respuesta de n frecuencia, que se dene como la respuesta del sistema en el dominio de la frecuencia. Esta respuesta puede calcularse como la transformada de Fourier de la respuesta al impulso, o bien puede medirse o estimarse directamente, si se utilizan como entrada seales de tipo sinusoidal. Dado que cualquier n seal puede descomponerse, de acuerdo a la serie o transformada de Foun rier, en muchas sinusoides individuales, la respuesta total del sistema puede CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

20

CAP ITULO 1. SENALES Y SISTEMAS

calcularse mediante el principio de superposicin. o En el mbito de los sistemas digitales, dado que un impulso es una absa traccin matemtica no posible de representar en un computador, un imo a pulso se implementa como una secuencia de nmeros con valor cero salvo u una sola muestra que toma el valor uno. Un tren de impulsos, en cambio, es una secuencia de muestras todas con valor unitario. La gura 1.12 muestra en forma grca la relacin entre la respuesta al impulso y la respuesta de a o frecuencia de un sistema digital o ltro. El estudio de la respuesta de frecuencia de un sistema, es clave en la teor y diseo de los ltros digitales, la cual se detalla en el cap a n tulo 6. Si se conoce la respuesta al impulso, basta realizar una operacin matemtica o a denominada convolucin (ver ecuacin 6.5) entre una seal de entrada cualo o n quiera y la respuesta al impulso para obtener la respuesta del sistema a esa entrada.

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

Cap tulo 2

El sonido

Si una piedra cae en la supercie de un desierto, donde no hay ser humano alguno ... suena?. Si uno hace esta pregunta las respuestas generalmente son divididas. Hay gente que dice que s suena y otra dice que no. Esto se debe mayormente a que el sonido existe en dos dimensiones paralelas: una f sica y otra perceptual. Por lo tanto existen dos deniciones posibles de sonido: una f sica, donde se considera al sonido como una perturbacin en o algn medio y otra psicoacstica, que se reere al sonido como la sensacin u u o que produce una onda sonora en nuestro sistema auditivo. El sonido en su dimensin perceptual se abordar en el cap o a tulo 3. A continuacin se describe el sonido en su dimensin f o o sica.

2.1.

Ondas de sonido

El sonido es una seal producida por una fuente en vibracin. Esta vin o bracin perturba las molculas de aire adyacentes a la fuente en sincronismo o e con la vibracin, creando zonas donde la presin del aire es menor a la preo o sin atmosfrica (rarefaccin o enrarecimiento) y zonas donde la presin del o e o o aire es mayor a la presin atmosfrica (compresin). o e o Estas zonas de rarefaccin y compresin, representadas en la gura 2.1 o o generan una onda de sonido la cual viaja a travs del aire. Las ondas en e general poseen ciertas propiedades comunes. Las ondas transportan informacin de un lugar a otro y tambin transportan energ Las ondas son o e a. parametrizables, lo que quiere decir que pueden describirse de acuerdo a algunos pocos parmetros. Los cuatro parmetros ms comunes son: amplia a a tud, per odo, fase y forma de onda. Existen algunos otros parmetros tales a como frecuencia, espectro o intensidad que pueden derivarse de los parmea 21

22

CAP ITULO 2. EL SONIDO

tros mencionados anteriormente. En la gura 2.1 se muestran algunos de ellos.

Figura 2.1: Rarefaccin y compresin en una onda sonora o o

Existen distintos tipos de ondas que dieren en su naturaleza, por ejemplo ondas de radio, ondas de luz, ondas de agua, ondas electromagnticas e ondas de sonido o rayos X. Tambin dieren en su forma de propagacin, e o la que puede ser longitudinal o transversal. En una onda longitudinal, el desplazamiento de las part culas es paralelo a la direccin de propagacin o o de la onda. En una onda transversal, el desplazamiento de las part culas es perpendicular a la direccin de propagacin de la onda. o o Las ondas de sonido son longitudinales. Cuando esta onda alcanza alguna supercie (como el t mpano del o humano o la membrana de un do micrfono), produce una vibracin en dicha supercie por simpat o resoo o a nancia. De esta forma, la energ acstica es transferida desde la fuente al a u receptor manteniendo las caracter sticas de la vibracin original. o El sonido necesita de un medio para propagarse. El sonido puede viajar a travs de objetos slidos, l e o quidos o gases. Su velocidad es proporcional a la densidad del medio por el cual viaja. A temperatura ambiente, la velocidad el sonido en el aire es de 343 [m/s] y en agua, es de 1500 [m/s]. La velocidad del sonido es independiente de su intensidad y su intensidad decae con la distancia en forma inversamente proporcional. CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

2.2. FUENTES SONORAS

23

2.2.

Fuentes sonoras

El sonido puede ser producido por distintos tipos de fuentes y procesos. Estos son: 1. Cuerpos en vibracin. Un ejemplo de este tipo de fuentes es un diao pasn, el cual al ponerse en vibracin genera un cierto tipo de onda o o sonora. Al estar la fuente vibrando, causa un desplazamiento en el aire cercano, lo que produce cambios locales en la presin de aire. Estas o uctuaciones de presin viajan en forma de una onda. Los cuerpos en o vibracin son las fuentes sonoras ms comunes. o a 2. Cambios en ujos de aire. Un ejemplo de este tipo de fuentes es lo que sucede cuando hablamos. Las cuerdas vocales se abren y cierran en forma alternada, produciendo cambios en la tasa del ujo de aire, lo que a su vez se traduce en una onda sonora. Este mismo principio se aplica a los instrumentos de viento como el clarinete u oboe. Otro ejemplo de este tipo de fuentes es una sirena, la cual produce sonido a travs de una placa rotatoria bloquea en forma alternada el ujo e proveniente de un compresor de aire. 3. Fuentes de calor. Una chispa elctrica produce un sonido, tal como lo e produce un trueno. En estos casos, el sonido se produce por un brusco cambio en la temperatura, el cual produce una veloz expansin del aire o circundante. 4. Flujo supersnico. En el caso de un avin supersnico se producen ono o o das de choque que fuerzan al aire a viajar ms rpido que la velocidad a a del sonido.

2.3.

Medicin del sonido o

El sonido en su dimensin f o sica es medible o cuanticable. Existen parmetros que pueden ser medidos en forma precisa como su intensidad a y otros pueden ser estimados con mayor o menor precisin como la frecueno cia o su forma de onda. El sonido fundamentalmente es una onda de presin, y la presin P o o puede medirse de la siguiente forma: P = F/a CADIZ, R. (2.1)

INTRODUCCION A LA MUSICA COMPUTACIONAL

24

CAP ITULO 2. EL SONIDO

lo que equivale a una fuerza F ejercida en una unidad de rea a determinada. a La presin corresponde a la fuerza ejercida en forma perpendicular a una o supercie dividida por el rea de sta supercie. a e Las ondas de sonido transportan energ La energ es una medida absa. a tracta de mucha utilidad en la f sica, dado que se dene de tal forma que en un sistema cerrado la energ siempre es constante, principio que se conoce a como la conservacin de la energ La energ se mide en unidades de masa o a. a por velocidad al cuadrado y usualmente se mide en [Joules]. Otras unidades de medida de la energ son [Btu], [Calor y el [kW/h]. Una importante a a] medida del sonido es su potencia , la cual corresponde a la energ total a por unidad de tiempo y se mide en [Joules/sec]. A continuacin se describen en detalle los parmetros f o a sicos del sonido.

2.4.

Amplitud e intensidad

La amplitud de un sonido corresponde a la magnitud del cambio, sea este positivo o negativo, de la presin atmosfrica causado por la compresin o e o y rarefaccin de las ondas acsticas. Esta cantidad es un indicador de la o u magnitud de energ acstica de un sonido y es el factor que determina a u que tan fuerte se percibe un sonido. Por lo general, la amplitud se mide en [N/m2 ]. El rango de amplitudes perceptible por el ser humano va desde los 0.00002 [N/m2 ] hasta los 200 [N/m2 ], donde el cuerpo entero siente las vibraciones. La intensidad del sonido caracteriza la razn a la cual la energ es eno a tregada en la sensacin audible asociada con la amplitud. Suponiendo una o fuente puntual que irradia energ uniforme en todas las direcciones, entona ces la presin sonora var en forma inversamente proporcional a la distancia o a medida desde la fuente y la intensidad cambia en forma inversamente proporcional al cuadrado de la distancia. Si esta distancia es r, entonces se tiene que: I = /4r2 (2.2) donde es la potencia sonora. La intensidad se mide en [W/m2 ]. Esto se observa claramente en la gura 2.2. La prdida de intensidad al incremene tarse la distancia es de dB = 20log10 (r1 /r2 ). Al doblarse la distancia, se experimenta una prdida en intensidad de 6 dB. e La presin e intensidad se relacionan a travs de la siguiente ecuacin: o e o P = CADIZ, R. Ic (2.3)

INTRODUCCION A LA MUSICA COMPUTACIONAL

2.4. AMPLITUD E INTENSIDAD

25

F

r

2r

3r

Figura 2.2: Intensidad vs distancia donde equivale a densidad del medio y c es la velocidad del sonido en el aire. El sistema auditivo humano puede detectar un inmenso rango de intensidades desde 1012 [W/m2 ] a 1 [W/m2 ]. En trminos de presin, el rango e o detectable va desde 2 105 [Pa] a 2 [Pa], lo que equivale a una razn o de 10.000.000:1. En trminos prcticos, medir la intensidad de sonido en e a [W/m2 ] resulta inmanejable debido a su enorme rango, por lo que una escala logar tmica de medicin de intensidad resulta mucho ms apropiada. o a La intensidad (sound level) del sonido se mide en decibeles. Un bel indica una razn de 10:1, por lo tanto o 1bel = log10 (I1 /I0 ) (2.4)

Pero los beles resultan muy grandes para efectos prcticos y por eso se a utiliza el decibel (dB), denido por: 1dB = 10log10 (I1 /I0 ) (2.5)

I0 se escoge t picamente como 1012 W/m2 . Un incremento de 10 dB equivale a un incremento de la intensidad del sonido de un orden de magnitud. Un incremento de 3dB equivale a doblar la intensidad y un incremento de 1dB representa un 25 % de incremento en la intensidad. La intensidad es proporcional al cuadrado de la presin o 1dB = 20log10 (P1 /P0 ) CADIZ, R. (2.6)

INTRODUCCION A LA MUSICA COMPUTACIONAL

26 0 10 20 50 70 90 110 120 140 160 dB dB dB dB dB dB dB dB dB dB

CAP ITULO 2. EL SONIDO Umbral de audicin o Respiracin normal o Susurro Conversacin suave o Trco a Disparo Exposicin prolongada (causa prdida auditiva) o e Avin a propulsin despegando o o Jet despegando Perforacin instantnea del t o a mpano (1016 veces 0 dB) Cuadro 2.1: Tabla de intensidades sonoras

donde P0 = 2x105 [P a]. Esta medida se conoce como dBSP L (sound pressure level). 0 dB se escoge para el umbral de audicin, el sonido ms tenue que puede ser detectado. o a En los equipos de audio suele usarse el dBV U (volume unit), donde 0 dB corresponde al mximo nivel de audio posible sin tener distorsin (clipping). a o El rea sobre los 0 dB en este caso se conoce como headroom. a

2.5.

Frecuencia

En el caso de un onda peridica, el patrn que se repite corresponde a o o un ciclo. La duracin de cada uno de los ciclos de una onda se conoce como o perodo. La tasa a la cual los ciclos de una onda peridica se repiten se conoce o como frecuencia y por lo general se mide en ciclos por segundo o Hertz (Hz). Matemticamente, la frecuencia es el inverso del per a odo, por lo tanto un per odo de 1 ms (milisegundos) tiene una frecuencia de 1000 Hz. El o do humano percibe frecuencias que van entre los 20 y los 20.000 Hz, aunque esto puede variar para distintas personas. En trminos de su contenido de frecuencia, un sonido puede poseer lo e que se denomina una frecuencia fundamental, comnmente denotada por u f 0, que usualmente corresponde a la frecuencia ms baja y de mayor ama plitud presente en el espectro. Es la frecuencia fundamental de una onda la que determina en gran medida su altura musical, la cual es una medida perceptual, explicada en detalle en la seccin 3.5. Las seales aperidicas no o n o poseen una frecuencia fundamental fcilmente determinable, dado que nada a se repite en forma peridica. La estimacin de f 0 para seales complejas es o o n CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

2.6. FASE

27

en s un problema bastante complicado, que escapa a este texto. La ausencia de una fundamental hace que este tipo de ondas se perciba musicalmente como ruido.

2.6.

Fase

La fase es simplemente el desfase o corrimiento de una seal respecto n a un punto de referencia, el que se determina en forma arbitraria. La fase se mide en radianes, en el rango [0, 2] o en grados, en el rango [0, 360]. Una fase mayor a 2 o 360 carece de sentido f sico, pues no es posible de distinguir de una que ocurre dentro del rango normal. La fase de un sonido aislado no altera en nada su percepcin. La fase o adquiere importancia cuando dos o ms sonidos se mezclan entre s Dos soa . nidos pueden ser idnticos, pero estar desfasados entre s lo que implica que e , un sonido comenz antes que el otro. Al interactuar, el resultado percibido o puede cambiar radicalmente dependiente del grado de desfase entre ellos. Si el desfase es 0, o bien 2, los sonidos al mezclarse se suman, y como las zonas de rarefaccin y compresin de ambos sonidos coinciden, como resultado se o o obtiene el mismo sonido pero amplicado. Si el desfase es de o 180 grados, signica que las zonas de rarefaccin de un sonido coinciden con las zonas de o compresin del otro, y al mezclarse, los sonidos se anulan completamente. o El resultado es que no se percibe nada. Esto no es un problema perceptual, es un fenmeno puramente f o sico. La fase es una variable comnmente ignorada y poco tomada en cuenta, u pero es sumamente importante en el anlisis de Fourier, abordado en el a cap tulo 4 y algunas tcnicas de s e ntesis, como las descritas en el cap tulo 5, entre otras cosas.

2.7.

Forma de onda

El patrn de variaciones de presin producido por una fuente de acuerdo o o al tiempo se conoce como la forma de onda. La forma de onda determina en gran medida la cualidad del sonido. Un factor importante de considerar en un sonido es su periodicidad. En el cap tulo 1 se estudiaron distintos tipos de ondas, entre ellas las ondas peridicas y aperidicas. Ellas se muestran o o en la gura 1.3. En la primera de ellas, se aprecia que est compuesta de a patrones repetitivos, mientras que la segunda posee una forma aleatoria, sin un comportamiento denido. CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

28

CAP ITULO 2. EL SONIDO

La forma de onda de un sonido determina y est determinada por su a contenido de frecuencias o espectro. La forma de onda se asocia comnmene u con lo que se denomina timbre, detallado en la seccin 3.6, cualidad percepo tual que le otorga identidad al sonido. Es la forma de onda la que permite diferenciar, por ejemplo, el sonido de una trompeta del de un viol n. El espectro contiene en el eje de las ordenadas el rango de frecuencias presente en el sonido y en las abscisas, la amplitud de cada componente. Tal como se detalla en el cap tulo 4, el espectro de una seal real, como n el sonido, no es real, si no complejo o imaginario. Esto signica que las amplitudes no son nmeros reales, sino nmeros complejos y en realidad u u consisten en un par de nmeros y no en uno slo. En la seccin 1.1.4 se u o o describen las dos formas bsicas de representar nmeros complejos: como a u un par ordenado, lo que se denomina forma cartesiana, o bien mediante una magnitud y un ngulo o fase, lo que se llama forma polar. Usualmente, en a el mundo del audio profesional se utiliza el espectro como sinnimo de la o magnitud solamente. Si bien la informacin que entrega la magnitud de un o espectro es util, no lo es todo. Por lo tanto, una representacin que slo o o contenga la magnitud es en realidad incompleta, ya que no muestra otro componente igual de importante que es la fase. El espectro puede estimarse en base a la transformada de Fourier, la cual se explica en mayor detalle en la seccin 1.2. Sin embargo, existen limitacioo nes en cuanto a la resolucin de sta estimacin tanto de tipo tericas como o e o o prcticas. a

2.8.

Representacin grca o a

Existen diversas formas de representar el sonido en forma grca. La a forma de representacin ms utilizada se basa en un diagrama de amplitud o a versus tiempo, tal como se observa en la gura 2.1, donde se pueden apreciar las zonas de compresin y rarefaccin, adems de indicaciones algunos o o a parmetros como amplitud y per a odo, que tienen que ver con la forma de onda. Un sonido tambin puede ser representado por su espectro, mediante un e grco amplitud versus frecuencia. Este grco muestra las amplitudes de a a cada componente de frecuencia contenido en el sonido. Por lo general, siempre es posible pasar de una representacin en el o tiempo a una representacin en la frecuencia y viceversa, mediante la transo formada de Fourier. No obstante, es importante destacar que el diagrama de tiempo no contiene informacin alguna sobre el contenido de frecuencias del o CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

2.8. REPRESENTACION GRAFICA

29

sonido y el espectro no contiene informacin de tipo temporal. Por lo tanto, o si bien cada una de estas representaciones basta por s sola para determinar un vocamente un sonido, son en cierto sentido complementarias. Una representacin intermedia es lo que se llama el sonograma. Un soo nograma consiste bsicamente en un eje tridimensional donde se graca la a magnitud del espectro de un sonido versus el tiempo. Esto se logra mediante la subdivisin de la seal de audio en varias pequeas ventanas de tiempo, o n n usualmente traslapadas entre s En cada una de stas ventanas tempora. e les, se estima el espectro mediante lo que se denomina la transformada de Fourier de tiempo corto (o short time Fourier transform en ingls). De esta e forma es posible determinar como va cambiando el contenido de frecuencia del sonido en el tiempo. Si bien el sonograma es muy util, la informacin que o entrega es altamente dependiente de los parmetros que se utilicen para su a clculo, como el tipo de ventana, el tamao de cada ventana y el porcentaje a n de traslape, entre otros.

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

30

CAP ITULO 2. EL SONIDO

CADIZ, R.

INTRODUCCION A LA MUSICA COMPUTACIONAL

Cap tulo 3

Psicoac stica u

La psicoacstica es la ciencia que estudia la percepcin de los sonidos. u o Tal como veremos en este cap tulo, la percepcin sonora est basada en o a fenmenos bastante complejos. Una vez que una onda sonora proveniente o del mundo f sico ingresa al sistema auditivo humano, se suceden una serie de reacciones en forma casi instantnea que producen como resultado una a representacin mental de lo escuchado, que no corresponde exactamente a o lo que sucede en el mundo f sico. Las variables f sicas del sonido estudiadas en el cap tulo anterior no constituyen una representacin dedigna de o lo que ocurre en el mundo perceptual. Por ejemplo, en ciertas situaciones hay sonidos que bloquean a otros sonidos, incluso si stos ocurren en fore ma asincrnica. Este fenmeno se conoce como enmascaramiento. En estos o o casos, si bien todas las ondas sonoras en juego existen en el mundo f sico, al presentarse todas juntas algunas de ellas simplemente no se perciben, a pesar de que si cada uno de estos sonidos se presentaran por separado, si se percibir an.

3.1.3.1.1.

Conceptos bsicos aM nima diferencia notoria

La psicoacstica intenta medir o cuanticar la percepcin de los sonidos. u o Una forma de estudiar la percepcin es medir el m o nimo cambio de alguna variable que produzca efectivamente un cambio notorio en la percepcin de o algn est u mulo. Esto se conoce como la m nima diferencia notoria y usualmente se abrevia como JND (del ingls just noticeable dierence). Tambin e e se conoce como umbral diferencial o limen diferencial. 31

32

CAP ITULO 3. PSICOACUSTICA

Usualmente, la m nima diferencia notoria var de persona a persona y a de acuerdo al mtodo de medicin. Incluso, puede cambiar para la misma e o persona, si las condiciones externas son modicadas.

3.1.2.

Ley de Weber

La Ley de Weber es una ley obtenida experimentalmente a travs de e experimentos perceptuales. Cuando se est midiendo la percepcin de algn a o u est mulo, esta ley arma que la m nima diferencia notoria es proporcional a la magnitud del est mulo original. Matemticamente, si tenemos un est a mulo I y nos interesa entonces medir la m nima diferencia I que producir un a cambio efectivo en la percepcin de I, entonces se cumple que: o I =k I (3.1)

donde k es una constante. Esto signica que a mayor intensidad de est mulo, mayor es la diferencia que se necesita para producir un cambio en la percepcin de ese est o mulo.

3.1.3.

Modos de percepcin o

Existen dos modos principales de percepcin: lineal y logar o tmico. En el primer caso, el cambio entre dos valores de una variable se percibe sobre la base de la diferencia entre ambos valores. En el segundo, el cambio entre dos valores de una variable se percibe de acuerdo a la razn entre ellos. o Tal como se ver a continuacin, la percepcin de sonidos por parte del a o o sistema auditivo humano es altamente logar tmica.

3.2.

El sistema auditivo humano

En su famoso libro Auditory Scene Analysis, Albert Bregman [5], describe la siguiente analog supongamos que estamos frente a un lago, del a: cual salen dos surcos largos y angostos hacia la orilla. En cada surco se coloca una hoja de rbol, la cual se mover a medida que el agua del lago uya a a hacia los surcos. Slo analizando el movimiento de ambas hojas, sin mirar o nada ms que las hojas, la idea es poder responder preguntas como: a 1. Cuntos barcos hay en el lago y donde estn? a a 2. Qu barco esta ms cerca? e a CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

3.2. EL SISTEMA AUDITIVO HUMANO 3. Cual es ms potente? a 4. Hay viento? 5. Ha caido algn objeto grande sobre el lago? u 6. Hay algn nadador y qu tan rapido nada? u e

33

Esto puede parecer una misin imposible. Pero la verdad es que el sistema o auditivo humano hace este tipo de anlisis todo el tiempo y a una velocidad a extremadamente alta. Nuestros t mpanos equivalen a las hojas depositadas en los surcos. Nuestro sistema auditivo, basndose unicamente en el anlisis a a del patrn de variaciones en ambos t o mpanos, es capaz de generar una idea muy precisa de nuestro entorno auditivo. Suponiendo que nos encontremos en una esta muy ruidosa, lo que t picamente de conoce en ingls como el e cocktail party problem, donde hay muchas fuentes sonoras de todo tipo interactuando al mismo tiempo, no necesitamos realizar ningn esfuerzo para u responder acertadamente preguntas cmo Cunta gente est hablando? o o a a Quin suena ms fuerte o est ms cerca? o Hay algn mquina haciene a a a u a do ruido de fondo?. El sistema auditivo humano se extiende desde el o do externo hasta la corteza cerebral y es capaz de realizar una cantidad impresionante de operaciones complejas en muy poco tiempo. A continuacin, se o detallan los principales componentes de nuestro sistema auditivo.

3.2.1.

El o do

Sin duda el uno de los componentes ms importantes del sistema audia tivo humano es el o do. El o se encarga de convertir las ondas de presin do o acstica en impulsos nerviosos que le permiten al cerebro crear una repreu sentacin mental de la sensacin auditiva. La gura 3.1 muestra las partes y o o componentes ms importantes del o humano. Tal como se puede observar a do en la gura, el o humano est dividido en tres partes principales: o do a do externo, o medio e o interno. Cada una de stas partes cumplen roles do do e espec cos en el proceso general de la audicin. o El funcionamiento general del o es el siguiente: cuando una onda sodo nora llega al o viaja desde el pabelln auricular o pinna hasta el t do o mpano, a travs del canal auditivo. El sonido es modicado en trminos de su contee e nido de frecuencias por el o externo. El t do mpano se encarga de traspasar el patrn de vibraciones de presin hacia el o medio al hacer contacto o o do con tres diminutos huesecillos, que a su vez traspasan la vibracin hacia la o ventana oval, lo que causa una onda de propagacin del l o quido contenido CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

34Oido medio

CAP ITULO 3. PSICOACUSTICA

Oido Externo Pabellon auricular

Oido interno

Conductos semicirculares Nervio auditivo

Timpano Canal auditivo

(Martillo, yunque, estribo)

Huesecillos

Coclea o caracol

Trompa de Ventana Oval Eustaquio

Figura 3.1: El o humano do al interior de la cclea, estimulando las clulas ciliares de la membrana bao e silar, la que est conectada a un gran nmero de terminales nerviosos que a u env a su vez seales elctricas al cerebro. De esta manera, el cerebro puean n e de recibir la informacin proveniente de la onda sonora para su posterior o procesamiento. A continuacin se detalla el funcionamiento de cada una de las partes o del o do. O externo do El o externo est constituido por el pabelln auricular o pinna , el do a o canal auditivo y el t mpano. El efecto de la pinna es atenuar y enfatizar cierto contenido de frecuencias y juega un rol fundamental en la localizacin de sonidos. El canal auditivo mide alrededor de 2,5 cm y acta como o u CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

3.2. EL SISTEMA AUDITIVO HUMANO

35

un resonador para el rango de frecuencias entre 1000 y 4000 Hz, siendo el mximo alrededor de 3000 Hz. El t a mpano vibra en respuesta al sonido y transmite esta vibracin de presin en forma de vibracin mecnica hacia el o o o a o medio. do

Figura 3.2: Respuesta de frecuencia del canal auditivo La gura 3.2 detalla la respuesta de frecuencia del canal auditivo. Claramente se puede observar que el canal auditivo enfatiza el rango desde 1 a 4 kHz. Esto corresponde al rango de la voz humana hablada. El rol que cumple el canal auditivo, por lo tanto, es el de optimizar la seal acstica n u del tal forma de resaltar la voz humana. O medio do El o medio acta como un transductor de vibracin. Su rol es amdo u o plicar la vibracin de presin mediante un sistema mecnico. Esto se hace o o a mediante tres huesitos llamados martillo, yunque y estribo. La vibracin o de estos huesitos puede ser amortiguada por un msculo anexado a ellos u llamado stapedius, lo cual otorga proteccin contra sonidos muy intensos, o los cuales hacen contraer este msculo, pero no protege contra sonidos muy u intensos y sbitos, como un disparo. u O interno do El o interno consiste bsicamente de la cclea, ya que los canales semido a o circulares, si bien se encuentran all no tienen rol alguno en la audicin. Pero , o CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

36

CAP ITULO 3. PSICOACUSTICA

si tienen un rol fundamental en el equilibrio, es por esto que una infeccin o en el o interno usualmente afecta la capacidad de mantener el equilibrio. do La gura 3.3 muestra un esquema que representa un corte del o interno, do con sus componentes principales. La cclea se muestra desenrollada en ste o e corte.

Figura 3.3: Seccin del o interno o do La cclea es un pasaje angosto, con forma de caracol, lleno de l o quido incompresible, largo y enrollado 3,5 veces sobre s mismo. El dimetro de este a pasaje es de 2 mm y su largo es 35 mm. La gura 3.4 muestra un corte perpendicular de la cclea, la cual est dividida en tres secciones: scala tympani, o a scala vestibula y scala media. Estas zonas estn unidas por el helicotrema a y contienen u dos de distintas densidades que vibran de acuerdo a la onda transmitida por el sistema mecnico del o medio. Estos u a do dos transmiten una onda de propagacin que estimula la membrana basilar, lugar donde o se codica la informacin sonora. o

3.2.2.

Membrana basilar

El rgano de corti es el lugar donde ocurre la produccin de impulsos o o nerviosos. En su fondo se encuentra la membrana basilar. La membrana basilar separa la scala media de la scala tympani. La membrana basilar responde a est mulos sonoros y causa vibracin en algunas de las 3500 clulas o e ciliares, conectadas a la membrana tectorial encima de ellas. Esta vibracin o es transmitida por el nervio auditivo al cerebro para su procesamiento. La membrana basilar comienza en la base, conectada a la ventana oval y termina en el apex, en el helicotrema. Al presionarse lentamente la ventana CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

3.2. EL SISTEMA AUDITIVO HUMANO

37

Figura 3.4: Seccin perpendicular de la cclea o o

Figura 3.5: La membrana basilar desenrrollada

oval, la ventana redonda tambin se ve presionada porque el volumen de e l quido al interior de la cclea es constante. Si la ventana oval se presiona en o forma rpida, se produce una onda en la membrana basilar que viaja desde a la ventana oval hacia el helicotrema. Esta onda no puede pasar ms all de a a un punto determinado, dependiendo de la frecuencia a la cual vibra la membrana basilar. La membrana basilar entonces responde en forma diferente CADIZ, R. INTRODUCCION A LA MUSICA COMPUTACIONAL

38

CAP ITULO 3. PSICOACUSTICA

dependiendo de la frecuencia presente en su base, que est conectada a la a ventana oval. Esto signica que sonidos graves pueden enmascarar a sonidos agudos, pero no al revs. e25 Hz

50 Hz

100 Hz

200 Hz

400 Hz

800 Hz

1600 Hz

0