Tratamiento de sonido y sincronizaciones

Autor: Speed2001 Formato: Danisaur

Autor: Speed2001 © Cifirip – Misteryrip – Terrorip - subXpacio

Página 2 de 20

Tratamiento de sonido y sincronizaciones

1.- Introducción Desde que Cifirip nació en abril del 2002, muchas son las series que hemos

ripeado y distribuido, y muchas de ellas las que hemos montado a partir de ripeos de DVD o capturas SATRip con audios en castellano. Todo ese trabajo nos ha permitido ir mejorando poco a poco nuestros métodos e ir aprendiendo mejores formas de hacer las cosas. Nuestra meta ha sido siempre lograr tener esos montajes a la mejor calidad posible, concediendo al audio la importancia que creemos se merece, ya que por desgracia suele ser éste poco considerado y sólo se dedican manuales detallados al manejo del video. Ha habido bastante interés en muchos compañeros en aprender estos métodos para poder colaborar en futuros montajes, así que con mucho gusto intentaremos dar unas nociones sobre audio, intentando explicar técnicas sobre el tratamiento de los mismos, su sincronización, mejora, mezclas, trucos, etc.

Que quede claro antes de nada que este manual no pretende sentar cátedra, sino ayudar a aquellos interesados en aprender a trabajar con audio a conocer y descubrir nuevas técnicas con las que mejorar resultados. Por eso animo a todo aquel que quiera añadir datos y comentarios a lo expuesto en este manual (o desee corregir o puntualizar algún tema) que lo haga sin cortarse, que toda aportación será siempre bienvenida. Constantemente estamos aprendiendo, y nunca caeremos en el error de creer que lo sabemos todo. Siempre agradeceré cada aportación que pueda hacer que aprenda algo nuevo o que mejore mis técnicas. En ShareRip hay unos cuantos artesanos a los que les gusta trabajar el audio (y lo hacen muy muy bien), y gracias a ese trabajo en común mejoramos todos y disfrutamos de montajes cada vez mejores. ;-)

2.- Calidad de la fuente de audio

Empecemos primeramente por lo más básico y lo que más cuesta entender a muchos: la calidad a la que vamos a trabajar depende en gran manera del material que tenemos para ello, pero también de los procesos que sigamos con ese material. Antes de ponernos a trabajar con una serie-película-documental-loquesea, debemos asegurarnos de que contamos con el mejor material que podemos conseguir. Para que me entendáis: nadie se va a currar unas imágenes VHSRip si existen unos DVDRip que poder utilizar, ¿verdad? Pues en audio lo mismo. Vamos a hacer un pequeño listado por orden de calidades:

1. Sonido DVD

2. Sonido estéreo captura (digital-TV-VHS)

3. Sonido mono captura (digital-TV-VHS)

¿Quiere decir esto que podemos clasificar el audio en tres niveles de calidad? Pues NO. Podemos obtener capturas estéreo VHS a una calidad superior a una mala captura de DVD, y también podemos obtener mezclas de distintas fuentes con una calidad resultante muy similar e incluso superior a la mejor calidad DVD (ya lo iremos viendo más adelante). Tampoco todas las capturas digitales tienen por qué ser de alta calidad (he escuchado algunas realmente penosas) ni todas los magnetoscopios VHS


Página 3 de 20

graban y reproducen con la misma calidad. También influye mucho cómo se realizan las capturas, ya nos dedicaremos a ese tema más adelante.

Es MUY importante tener en cuenta los bitrates y los samplerates (frecuencias de muestreo) a la hora de trabajar. No va a darnos la misma calidad 128 kbps (que ni siquiera es un estéreo real) y menos si encima es VBR (con bitrate variable) que 160 ó 192 kbps a bitrate constante (CBR). De igual forma no vamos a obtener la misma calidad con un sample rate de 44.100 Hz que con uno de 48.000 Hz.

Un error muy común en el que se cae hoy en día: el formato ogg NO ocupa menos que el mp3 con mejor calidad, simplemente ocupa menos, pero con menos calidad. Los ogg a 92 kbps que se están utilizando son una verdadera castaña en cuanto a sonido, y no están muy lejos de un vulgar mp3 a 92 kbps. ¿Suficiente para los nada exigentes oídos de algunos? De acuerdo, pero no estamos tratando de ese tipo de exigencias precisamente. ;-)

Tenemos que pensar que 10-15 Mb en un episodio de 45 minutos no afectan de forma visible al resultado del episodio en cuanto a imagen (son mucho más importantes algunos parámetros del ripeo o el número de pasadas optimizadas que el número de Mb), mientras que esos 10-15 Mb aplicados al sonido resultan en un tremendo incremento de la calidad del mismo. A ver si dejamos de una maldita vez de sacrificar calidad de los audios, sobre todo de manera tan inútil.

A la hora de empezar pues un trabajo tenemos que tener en cuenta lo siguiente:

1. ¿Tenemos la mejor fuente de audio doblado que podemos conseguir?

2. ¿Tenemos la mejor fuente de audio VO que podemos conseguir?

Si en verdad la respuesta a ambas preguntas es afirmativa entonces podemos ponernos manos a la obra, pero si obviamos cualquiera de ellas estamos caminando hacia un resultado mucho peor del que podríamos obtener si hiciéramos las cosas bien. Un doblaje de baja calidad lo podemos mejorar muchísimo utilizando el sonido VO, y un doblaje de buena calidad lo podemos resaltar sobremanera mezclándolo con el audio VO. Y si alguien duda esto, en Cifirip y Misteryrip hay sobradas pruebas de ello, no os fiéis de mi palabra, simplemente dejad que vuestros oídos lo comprueben.

Resumiendo, para terminar esta primera parte sobre calidades: la calidad es muy importante, y en audio unos pocos Mb son decisivos para obtenerla. Antes de ponernos a trabajar busquemos las mejores fuentes de audio, tanto doblado como original. Trabajar con lo primero que se pille es algo demasiado común por desgracia y sólo conduce a resultados mediocres claramente superables.

3.- Capturas de audio El tema de las capturas es algo sorprendentemente sencillo y sin embargo uno

de los procesos más desconocidos por la mayoría, en gran medida el desconocimiento viene por relacionar capturas de audio con capturas de video, cuando en realidad son dos procesos totalmente independientes. Para capturar video necesitamos una tarjeta capturadora específica, para capturar audio simplemente una tarjeta de sonido vulgar y corriente (¿quien no la tiene hoy en día?). ;-)

De la fuente de ese audio (magnetoscopio VHS, TV, radio a pilas, sintonizador de UHF, cámara digital, magnetófono con micrófono, etc..) sólo tenemos que llevar un cable a la entrada (Line IN) de la tarjeta de sonido. Para los que la tengáis con colorines suele ser la azul, no confundir con la rosa que es la del micrófono y tiene una


Página 4 de 20

impedancia muy diferente, por lo que no debéis usarla salvo que la única forma de grabar algo sea a golpe de micrófono X-D).

Evidentemente el tema del cable es importante por muchas razones:

Ø Si no está convenientemente apantallado tendréis ruidos y parásitos

Ø Para obtener una captura en estéreo debéis usar el cable adecuado, y por supuesto que la fuente del sonido sea estéreo.

Ø Si el cable es demasiado largo podéis tener pérdidas de señal y algún que otro ruido (normalmente por encima de 10 metros)

Ø Si las conexiones tienen holgura se os puede meter mucho ruido en la grabación

Una vez que tenemos el tema del cableado solucionado vamos con la siguiente parte importante, que es la del software. En vuestras propiedades de audio abrid los controles de grabación, seleccionad la entrada de línea (exclusivamente) y dejadlo a mano para poder controlar el nivel de entrada de la señal. A continuación necesitaréis un programa que os permita grabar en HD el sonido que vayáis a obtener. Mi recomendación particular es el Soundforge , aunque existen muchos programas válidos para grabar sonido.

Lo más importante a la hora de capturar es "preparar" adecuadamente lo que va a ser dicha captura en lo que respecta a dos parámetros: formato y niveles.

El formato lo seleccionamos inicialmente cuando vamos a abrir lo que va a ser la captura, en Soundforge se llaman recording attributes. Debemos fijar 16 bits estéreo y una frecuencia de muestreo (sample rate) de 48.000 Hz. Podemos seleccionar 24 o incluso 32 bits, pero no siempre obtendremos una mejora sustancial en la calidad y, además, si vamos justitos de espacio en HD y memoria RAM tenemos que pensar que una captura 32 bits de 45 minutos nos va a ocupar mas de 1 Gb. Mi consejo es que probéis a hacer capturas cortas de varios segundos a 16 y a 24 bits, que elijáis la que mejor resultado os proporcione, y que a igualdad de resultado os quedéis con la de 16 bits.

Los niveles es cuestión de controlar que los indicadores de nivel de grabación (se llaman VU-meters) no alcancen el rojo, lo que indicaría saturación de la señal. Tened cuidado de no grabar a demasiado volumen para evitar esos picos de saturación, pero también de no grabar demasiado bajo, porque entonces tendríais que amplificar posteriormente la señal, y eso haría que amplificarais también los ruidos de fondo. Como todo en la vida, el mejor nivel es aquel que está en su justa medida.

Una vez que hayáis terminado la grabación tendréis en pantalla la onda resultante de lo que habéis grabado. Si vamos a trabajar nosotros mismos con este audio entonces lo mejor es guardarlo en formato wav (PCM / 48KHz). Esto nos ocupará entre 400 y 500 Mb para un episodio de 45 minutos (algo más de 1 Gb para un largometraje) pero nos garantiza que estamos conservando el audio "tal cual", sin realizar ningún tipo de compresión que nos pueda hacer perder calidad.

Si necesitáis comprimir el audio para poder enviárselo a alguien para que trabaje con él os sugiero convertirlo a un bitrate alto, mínimo 192 kbps, con bitrate constante y asegurándoos de que conserváis el sample rate de 48 KHz. En el Soundforge tenéis que tener cuidado con esto porque a nada que os descuidéis os guarda el mp3 a 44,1 KHz. Para evitarlo no os fiéis nunca de los Templates (plantillas), seleccionad Custom (personalizar) en la pantalla de guardar y una vez hayáis seleccionado mp3, aseguraos de fijar la configuración deseada. Os pongo una tabla aproximada de tamaños para un episodio de 42’:


Página 5 de 20

Ø 128 Kbps ? 38,3 Mb

Ø 160 Kbps ? 47,8 Mb

Ø 192 Kbps ? 57,4 Mb

Ø 224 Kbps ? 66,9 Mb

Ø 256 Kbps ? 76,5 Mb

Ø 320 Kbps ? 95,6 Mb

Aprovechando esto, fijaos en la poca diferencia de tamaño que supone mejorar la calidad de un audio. Esos 9 ó 10 Mb no se notan en absoluto en la calidad de un video de 42’ y sin embargo aumentan dramáticamente la calidad del sonido. A ver si empezamos a darle al audio los Mb que se merece y desterramos los 128 Kbps y bitrates inferiores para siempre. ;-)

Resumiendo: capturar audio es sencillo (como todo) y cuestión de práctica (como todo). No os desmoralicéis si no obtenéis buenos resultados con las primeras grabaciones, seguid haciendo pruebas hasta que vayáis depurando el método. Para esto (como para todo lo relacionado con el audio :-D), vuestro oído es la mejor herramienta.

4.- Sincronización (1ª parte)

Empezaremos por aclarar unos cuantos puntos sobre los que hay bastante confusión:

Ø Sincronizar es una fase más del proceso de tratamiento del audio, hacer sólo la sincronización y nada más es dejar las cosas a medias.

Ø La sincronización se hace sobre la banda de audio, no debéis modificar la banda de video salvo, de ser necesario, para tema de frame rates (tema que ya veremos)

Ø Sincronizar bien lleva tiempo y por tanto requiere paciencia. Si eres de los que no piensa dedicar más de 15 o 30 minutos a ello mejor no sigas leyendo.

Ø No utilicéis programas de juguete. Al igual que no usaríais el Paintbrush para retoque fotográfico, no utilicéis el Synchronizer ni otras "pseudo-herramientas". Se trata de hacer las cosas bien, no de chapuzas.

Y ahora razonemos un poco el asunto: se trata de ajustar una banda de sonido a una imagen que ya cuenta con su banda de audio original. Lo lógico es que limpiemos esa banda de audio que queremos adaptar, eliminando todo aquello que sobre (anuncios, pausas, fundidos, etc.), completemos aquellas partes que faltan y la vayamos adaptando para que encaje de la mejor forma posible con ese video. Ir cortando el video en trozos para pegarle a su vez trozos de audio que vamos desplazando adelante y atrás (a ojo, por cierto) hasta que nos parezca que encajen y así y una y otra vez no deja de ser el equivalente a una masacre. Masacre cuyo resultado es una mala sincronización, una secuencia de video mutilada en trozos y una secuencia de audio en cachos que además están desplazados. Probad a reproducir el resultado en distintos reproductores de video y veréis que cada uno ofrece un resultado diferente, eso sin contar con que varias partes de la acción estarán bastante desincronizadas. Probad a separar el audio (si es que podéis extraerlo en un solo trozo) y a volverlo a unir al video y veréis cómo se ha desplazado todo de nuevo.


Página 6 de 20

La sincronización lógica ha de hacerse modificando la banda de audio, y con ello no solo lograremos ajustar la sincronía completa al milisegundo, sino que además nos permite hacer muchas más cosas y solucionar muchas mas carencias del audio, como iremos viendo poco a poco. El mejor programa que podemos usar para sincronizar es el Cooledit, gracias a su posibilidad de edición en multicanal. ¿Qué significa esto de multicanal? Pues que podemos cargar, mezclar y reproducir de forma simultánea varias ondas con el fin de compararlas, sumarlas, restarlas, o lo que necesitemos. Esto nos va a permitir muchísimas cosas que nos van a ayudar (y que iremos viendo cómo hacer): desde sincronizar a partir del audio VO hasta aprovechar ese audio VO para compensar, mejorar y/o completar el audio doblado.

El Cooledit permite trabajar sólo con el audio sin comprimir, es decir, en formato wav. Podéis utilizar el Soundforge para pasar de mp3 a wav, o el Ac3Tool para convertir un AC3, ya hablaremos en mas profundidad de formatos cuando lleguemos a la parte relativa a como aprovechar y mezclar la VO con el doblaje.

Un apunte más antes de seguir: en este manual no vamos a tratar del manejo de programas, sino de metodología a seguir. Se sobreentiende que si alguien quiere seguir esta metodología tendrá que aprender a manejar dichos programas, para los cuales ya existen instrucciones y/o manuales. Así pues, no pretendemos enseñar a manejar el Cooledit ni el Soundforge ni ningún otro programa de los que utilicemos, simplemente indicamos cuándo los usamos y cómo los usamos. Aprender a manejarlos correctamente para sacarles el partido adecuado ya es tarea exterior a este manual (que ya ocupa bastante de por sí X-DDD).

Sigamos con nuestro proceso lógico: ¿cual es la mejor referencia que podemos tener para poder sincronizar? La respuesta es obvia: la banda de audio original. Así pues, si con el Cooledit en modo Multitrack (pulsad F12 para conmutar el modo Multitrack con el modo Single Track) abrimos en la Pista 1 la banda de audio VO (la cual evidentemente está perfectamente sincronizada con el video) y en la Pista 2 la banda de audio doblada que queremos sincronizar, podemos ir ajustando la Pista 2 basándonos en la Pista 1 comparándolas segundo a segundo. Y si contamos con más bandas de audio que queremos o podemos utilizar, podemos irlas abriendo en las siguientes pistas y más adelante elegir cómo queremos mezclaralas entre sí para obtener un audio definitivo. Tranquilos que ya iremos viendo todo esto más en profundidad.

Antes de seguir, es muy importante ver la conveniencia de tener ambas bandas de audio homogéneas. Si necesitamos un trozo de audio que nos falte podemos cogerlo del audio VO, o incluso sustituir aquellas partes que sean solo música y efectos (como las entradillas y los títulos de crédito). Digamos para entendernos que es como tener dos puzzles, utilizamos uno para componer el otro y cuando nos falta una pieza del segundo (o está rota o defectuosa) la tomamos del primero y la duplicamos para poder completar el segundo. Para poder hacer todo eso, necesitamos que las bandas de audio sean compatibles entre si y que además los niveles de volumen sean lo mas similares posible. Para poder utilizar trozos de un audio sobre otro es necesario que ambos tengan el mismo sample rate, y aunque como comentamos en el apartado 2 es mejor trabajar a 48K que a 44,1K, en este caso tendremos que adaptarnos al sample rate de la VO. Podemos variar el sample rate con el Cooledit, pero según mi experiencia ha sido siempre más eficaz para estos menesteres el Soundforge , no os importe que sea un poco más lento si es más seguro. ;-)

Lo abrimos con el Soundforge, lo convertimos a wav si es que no lo estaba ya y utilizamos la función Resample (Process->Resample). Este proceso incrementa el nivel de muestreo interpolando datos extra y por tanto aumenta el tamaño del archivo (en el caso de pasar de 44,1K a 48K), pero no afecta para nada al pitch del audio


Página 7 de 20

original. Aseguraos de NO tener activa la casilla “set the sample rate only" porque eso sí que cambiaría el pitch timing de todo el fichero. Por esa razón adaptamos el sample rate del doblaje a aquel que tenga la banda de audio VO, porque no podríamos utilizar la VO como referencia para la sincronización si esta se hubiese desincronizado al resamplear.

Un consejo extra es que inmediatamente después de hacer un resampling guardéis el fichero en formato wav y lo volváis a abrir antes de hacer ninguna otra operación con él. Todo programa tiene sus tonterías y el Soundforge no va a ser menos. :-D

Ya tenemos nuestras dos bandas de audio (VO y doblaje) cargadas en las pistas 1 y 2 del Cooledit, a la misma frecuencia de muestreo y homogeneizadas en cuanto a niveles (utilizad la función Transform -> Amplitude -> Amplify) con valores positivos o negativos según queráis subir o atenuar el audio. Ahora comienza un proceso lento de ir verificando uno y otro audio e ir compensando los desajustes de la Pista 2 basándonos en la Pista 1. No os desaniméis si no sabéis inglés (o el idioma que sea la VO), que podéis (y de hecho debéis) utilizar las referencias de música y efectos para sincronizar, ya que observaréis que en los doblajes se relajan bastante en cuanto a sincronía en aquellas escenas en los que no se ven los labios del que habla. Si además no contáis con la VO sino con un doblaje en otro idioma, entonces no os fiéis en absoluto de la sincronía en cuanto a voces se refiere, ya que por experiencia os digo que en otros países se dobla bastante deficientemente (o mejor dicho, sin demasiado cuidado).

Utilizad golpes, pasos, puertas que se cierran, etc. para ir encajando ambos audios. Tened cuidado de no modificar el audio VO ya que es el de referencia, y si lo modificáis sin querer estáis invalidando esa referencia. Una vez cojáis experiencia y práctica con el método veréis que no necesitáis ver en ningún momento la imagen para lograr una sincronización perfecta. De todas formas y hasta que os vayáis acostumbrando al método, podéis ir visualizando los resultados conforme avanzáis. Salváis el wav y con el Virtualdub o el Nandub montáis el video incorporando ese wav (Audio -> Wav audio), así podéis seguir con la vista lo que habéis hecho antes con el oído. Yo, salvo casos muy específicos de audios con ciertas complicaciones o con grandes espacios de tiempo sin poder utilizar una sola referencia de encaje, prácticamente nunca veo la imagen hasta que he terminado por completo de sincronizar, ecualizar y mezclar un episodio.

Por norma general, un desfase de 100 milisegundos (ms) o más es claramente visible por cualquiera (aunque viendo algunas sincros por ahí sueltas, creo que hay algunos que consideran que todo lo que no pase de un par de segundos es aceptable), la cosa puede bajar hasta 50-60 ms para ojos más acostumbrados a fijarse en la calidad de la sincronización. Por debajo de ese tiempo, el ojo no distingue el desfase, pero el oído sí. Tomemos por ejemplo un golpe en una mesa, si ambas bandas de audio están perfectamente sincronizadas oiremos un sólo golpe al reproducirlas, pero si existe un desfase de 50 ms entre ellas, sonará un golpe doble que podrá ir desde un eco hasta dos golpes separados en función de lo grande que sea el desfase. Por esta razón no debéis nunca fiaros de la vista imagen-sonido a la hora de sincronizar, sino de la "imagen” de esas ondas en la pantalla multicanal de vuestro Cooledit. ;-)

Personalmente me concedo desfases máximos de 10 ms, aunque a veces puedan escapárseme trozos de 15 ó 20. Este nivel de exigencia ha de ser tomado muy en serio y a rajatabla, no solo por perfeccionar la sincronización, sino porque necesitamos la máxima exactitud posible si queremos mezclar posteriormente audio VO y audio doblado para mejorar la calidad (proceso que ya estudiaremos más adelante). Tampoco hay que fiarse de aquello que "parezca" que está sincronizado,


Página 8 de 20

los técnicos de sonido de doblaje recurren a muchas argucias para encajar esos doblajes, y en ocasiones tenemos desfases positivos en un minuto que pueden pasar a negativos al minuto siguiente y volver a cambiar unos pocos segundos después. Esto obliga a repasarse todo el audio de forma minuciosa comprobando que la sincronización se mantiene. Todo esto requiere mucho tiempo y paciencia, pero ya avisamos de que estos métodos no son para comodones, y el que algo quiere algo le cuesta. ;-)

Dejamos para la siguiente sección otros detalles sobre sincronización, sobre todo qué hacer en aquellos casos en los que ambas bandas de audio difieren en tamaño, cómo compensar el problema de los diferentes frame-rates, etc. También hablaremos en posteriores apartados sobre cómo mejorar la calidad de los audios, filtrar ruidos, etc.

5.- Sincronización (2ª parte) Hasta ahora hemos visto la parte teórica de como emprender una sincronización

cuando las cosas más o menos encajan. Empecemos a ir tratando aquellos casos problemáticos, en los que vemos que la banda de audio original y la doblada no coinciden ni aunque las intentemos pegar con superglue. Existen dos razones por las cuales esto puede suceder, veámoslas por separado:

Caso 1: Los frame rates no coinciden

Por norma general, en Europa utilizamos un formato normalizado de 25 fps (Frames per second = Fotogramas por segundo), mientras que en USA tienen 2 formatos diferentes para cine y TV, que son 23,976 y 29,97 fps. Generalmente, cuando las películas se exportan a Europa se convierten los formatos para adaptarlos a la norma europea y por ello los doblajes se encuentran hechos a esa velocidad de 25 fps, mientras que las VO mantienen la velocidad original. Por esa razón, cuando intentamos unir un doblaje (hecho a 25 fps) con la imagen que conserva un frame rate diferente vemos que no coincide. Así pues, hay que convertir alguno.

¿Qué hacer? Aquellos que sólo utilizan la banda de audio doblada lo tienen fácil, simplemente cambian el frame rate del video a 25 con el Virtualdub y santas pascuas. Pero ya vimos en la parte anterior la conveniencia de utilizar la VO, no sólo para sincronizar correctamente, sino también para utilizarla mejorando la calidad de la banda doblada (aspecto que ya veremos de forma extensa en los próximos apartados). No seamos pues tan vaguetes y vamos a currar un poco con esas bandas, que el resultado merecerá la pena.

Veamos. Tenemos por un lado una imagen y un audio original a 29,97 y un doblaje a 25 fps, dos opciones. La pregunta del millón es: ¿cuál convertimos? La cuestión primordial es la siguiente: por mucho que queramos aprovechar el audio VO, el que nos va a mandar es el audio doblado que es el que realmente queremos que se escuche, por lo que tenemos que decidir si pasar ese audio a 29,97 no nos va a "apitufar" demasiado las voces (al pasar a un frame rate superior, el sonido lógicamente se acelerará). Parece evidente que si de la VO solo vamos a aprovechar música y efectos, en estos se note mucho menos una disminución de la velocidad. Esto no debe ser aplicado como norma general, sino que cada caso requiere su estudio, pero lo habitual es adaptar la velocidad del video a la velocidad del audio doblado.

Así pues, el video lo pasamos a 25 fps con el Virtualdub, pero con el audio VO tenemos que hacer otro tipo de operaciones para que nos siga valiendo. Para ello lo


Página 9 de 20

mejor es recurrir a la ley de proporción, y el cociente entre 29,97 y 25 nos da un factor de corrección de 1'1988. Pongamos por ejemplo una película cuya duración VO es de 1h 34 min. 43 seg. (5683 segundos), multiplicamos por 1,1988 y obtenemos 6812,78 segundos, que son exactamente 1h 53 min. 32 seg. 780 ms. Es decir, tenemos que hacer que esa banda de audio VO pase a durar exactamente ese tiempo.

Para ello, tanto el Cooledit como el Soundforge tienen sus herramientas propias. Personalmente, yo vuelvo a recurrir a mi viejo amigo el Soundforge que, aunque más lentorro para estas cosas, es muchísimo más fiable y preciso que nuestro común amigo el Cooledit, el cual es impagable para sincronizar y otras hierbas pero se vuelve algo majara con estas operaciones. La opción que tenemos que utilizar está en Process->Time Stretch. Es importante que lo hagamos sobre la onda en formato wav, ya que aunque el Soundforge permite trabajar directamente sobre mp3 y otros formatos, realizar la operación de reajuste de tiempo sobre formatos comprimidos te dará errores de por lo menos 2 ó 3 segundos en el proceso, algo totalmente inadmisible pues perderíamos la sincronización correcta. Poned la cantidad exacta de tiempo que queréis que pase a tener el audio (incluid los milisegundos, que el programa vea que hiláis fino X-D) y tras un ratejo de espera ya tenéis el audio reajustado al nuevo timing, con un ligero error de unos pocos milisegundos, fácilmente corregibles al sincronizar, y que sobre hora y media es una buena precisión y un bajísimo margen de error.

Volved a insertarlo sobre el video reconvertido a 25 fps y tenéis que ver que la sincronizac ión sigue siendo perfecta, si no fuera así es que os habríais equivocado en alguna parte del proceso, revisad los pasos. El mismo procedimiento habría que seguir si decidiéramos pasar el audio doblado a la velocidad original de la imagen, simplemente aplicar el factor de corrección que corresponda. Aquí os dejo una tablita para ayudaros:

BAJAR FRAME RATE:

Ø Pasar de 29,97 a 25 -> 1'1988 Ø Pasar de 25 a 23,976 -> 1'0427 Ø Pasar de 29,97 a 23,976 -> 1'25

SUBIR FRAME RATE:

Ø Pasar de 23,976 a 29,97 -> 0'8 Ø Pasar de 23,976 a 25 -> 0'95904 Ø Pasar de 25 a 29,97 -> 0'83417

Tras haber realizado correctamente todo los pasos, tenéis por fin dos bandas de audio y una de video normalizadas todas a una misma velocidad, ya podéis realizar tranquilamente los todos procedimientos de sincronización y mezcla sobre ellas.

Caso 2: Los frame rates son aparentemente iguales pero los audios no coinciden

Esto es algo muy común cuando se extrae audio de un magnetoscopio VHS, ya que los motores de arrastre a veces van más deprisa o más despacio según el aparato y la cinta. También podemos encontrarnos chapucillas sobre ripeos de imagen, en los que el ripeador ha variado el frame rate para apañar algún desajuste o vaya usted a saber, y así podemos encontrarnos frame rates tan variopintos como 26'34, 25'09, 28'743, o por lo general cualquier número decimal comprendido entre 21 y 30. Estos casos son por suerte muy poco normales y mi consejo es que intentéis trabajar al valor normalizado de 25 fps en la medida de lo posible. Evitaréis problemas de


Página 10 de 20

compatibilidad y reproducción, y los ávidos pasadores a VCD de todo lo que se mueve os lo agradecerán. ;-)

En este caso concreto, estamos hablando de aquellas desincronías progresivas que se producen de forma constante a lo largo de una película. Si hacemos coincidir el principio, la desincronía se va haciendo cada vez mayor y si hacemos coincidir en mitad de la grabación se nos van principio y final, toda una pesadilla, eh?

Como ya dije, normalmente estas desincronías progresivas se deben normalmente a un defecto en la captura de los audios. También los resampleados conducen en ocasiones a este tipo de cambios, aunque en su caso son muy poco acusados (unos pocos segundos en hora y media). Corregir esto es bastante sencillo, lo más complicado es determinar con exactitud la desviación a corregir.

Veamos: El caso más habitual es tener un audio capturado de una emisión en TV, lo que implica que dicho audio tiene cortes publicitarios, fundidos, saltos, fotogramas perdidos y otras sorpresas que no descubriremos hasta que no vayamos comparando con el audio VO. Es por tanto prácticamente imposible calcular con la exactitud requerida qué cantidad de tiempo necesitamos añadir o quitar para que la banda de audio encaje, a no ser que fuéramos revisándola segundo a segundo en busca de esos cortes y calculando cronómetro en mano comparándola con la VO... Un trabajo de chinos y no estamos metiendo el audio en chino, así que busquemos otra forma.

El mejor método que he encontrado hasta la fecha es el de la extrapolación, consiste en buscar dos referencias auditivas claramente destacables y separadas entre sí por la mayor cantidad de tiempo posible sin que exista ningún tipo de corte ni salto entre medias. Medimos el tiempo entre ellas en la VO, medimos el tiempo entre esas mismas referencias en el doblaje y anotamos la diferencia. Dicha diferencia dividida entre la longitud del fragmento es la corrección que hay que aplicar al audio completo para ajustarlo. Veámoslo mejor con un ejemplo:

1. Cogemos una puerta que se cierra en el instante 12:28.645 en la VO. Buscamos el mismo sonido en la doblada y lo encontramos en 12:32.540.

2. La siguiente referencia seleccionada la tenemos en 20:34:750 en la VO, lo que hace una duración de 8 minutos, 6 segundos y 105 milisegundos para el fragmento de audio seleccionado.

3. En el audio doblado, si el timing fuese exacto al del audio VO, por lógica la segunda referencia debería aparecer en el instante 20:38.645, y sin embargo vemos que no aparece hasta 20:39.850, lo que implica que la duración de ese fragmento en el audio doblado es de 8 minutos, 7 segundos y 310 milisegundos, es decir, 1'205 segundos de desviación (más lento) para dicho periodo de tiempo.

Por lógica la cosa nos conduce a una sencilla regla de tres: si en 487,310 segundos se ha producido una desviación de 1'205 segundos, ¿que desviación habría que calcular para el total de la película? Pasamos a segundos el total de la duración de la banda de audio, calculamos la fórmula y eso nos da un factor de corrección resultante. Dicho factor lo aplicamos al audio doblado y obtenemos la duración que debe tener el mismo, recurrimos de nuevo a la función "time stretch" de nuestro Soundforge y ya tenemos por fin el audio ajustado a su velocidad adecuada.

Seguimos con el ejemplo anterior: suponiendo que la banda de audio doblada dure 42' 15" 120 ms, eso hace un total de 2535,120 segundos. Multiplicamos 2535,12 por 1'205 y lo dividimos por 487,310 y el resultado nos da 6,269 segundos. Así pues, esos son los segundos de variación que tenemos que aplicarle al audio doblado, en nuestro caso y, dado que el doblaje iba mas lento que la VO, tenemos que descontarle


Página 11 de 20

6,269 segundos al audio doblado para que encaje con el VO, por lo que al hacer un stretching el valor a buscar será de 2528,851, que traducido a minutos son 42' 08" 851 ms. Ese es el valor al que tenemos que reducir nuestro desincronizado y rebelde audio.

Evidentemente este método de extrapolación es bastante útil, pero no exacto al 100%. Es bueno recurrir a dos o más tomas diferentes para verificar que el factor de corrección a aplicar es el correcto, cuantas más tomas hagamos mejor podremos calcular dicho factor, y por tanto más exacto será el método. Pensad que aunque al final no tengamos un audio sincronizado a la perfección, al menos lo tendremos bastante más aproximado al tamaño que debe tener, por lo que nos será mucho más fácil ajustar las pequeñas desviaciones de forma manual, ya que estaremos hablando de unos pocos milisegundos cada varios minutos.

No os fiéis de los valores obtenidos para intentar corregir los desajustes de velocidad de un magnetoscopio (vulgo video), ya que en estos depende mucho de factores como el tamaño y tensión de la cinta, si está al principio o al final de la misma, e incluso de la temperatura de la misma. Si un reproductor de video falla en su control de velocidad, te dará velocidades diferentes para cada caso así que no podrás realizar una extrapolación única sino que tendrás que afinar cada vez con los cálculos. Así que o cambias de magnetoscopio o te armas de paciencia. ;-)

6.- Sincronización (3ª parte)

Tras haber visto cómo debemos encarar las sincronizaciones y cómo solucionar las grandes desviaciones, dedicamos esta tercera y última parte sobre sincros (que no del manual, ya que aun nos faltan más partes) a unos cuantos pequeños trucos útiles y a cómo solucionar algunos de los contratiempos más habituales. Vamos a analizar cómo resolver algunos casos particulares que os podéis encontrar frecuentemente:

• FALTA UN TROZO DEL AUDIO DOBLADO (O BIEN HAY UN TROZO SIN DOBLAR)

Si la parte que os falta no contiene diálogos entonces no lo dudéis, recurrid a la VO que os quedará un apaño de primera calidad. Si por el contrario la parte que os falta lleva diálogos (según la Ley de Murphy eso se cumplirá siempre X-D), lo primero que hay que intentar evidentemente es localizar otro audio de "repuesto" del que poder tomar ese trozo, aunque sea a inferior calidad, y si son varios mejor que mejor (ya que así podemos compensar algo las pérdidas de calidad). Si no tenemos forma humana de conseguir esos "repuestos" entonces tendremos que intentar sacar todo el partido que podamos a la VO. De una u otra forma lo podremos solventar, pero nunca dejéis esa parte en blanco, o peor aún recortéis el video para eliminar ese trozo.

Para completar esa parte que os falta mi consejo es que no os preocupéis de andar cortando y pegando, requiere mucho más trabajo y precisión, y es mucho más complicado rectificar si algo no os gusta cómo queda. Dejad la parte que os falta en silencio y recurrid a la opción multipista (multitrack) del Cooledit abriendo tantas pistas nuevas como audios tengamos a insertar. Eso nos permitirá hacer transiciones mucho más elaboradas, poder mezclar diferentes fuentes de audio y ajustar perfectamente los niveles. Hablaremos de forma más extendida sobre mezclas, transiciones, ajustes, niveles y todo esto cuando nos dediquemos al tema de mezclas más adelante.

• ES IMPOSIBLE LOCALIZAR REFERENCIAS EN UN FRAGMENTO LARGO

Ocurre a veces que nos tiramos bastantes minutos sin poder encontrar un solo sonido o cambio musical que nos permita emparejar el doblaje con la VO, por lo que podemos estar perdiendo sincronía durante bastante tiempo sin que nos demos cuenta. Evidentemente la forma fácil de solucionarlo es meter un tajo (o insertar un


Página 12 de 20

trozo, según se necesite) para ajustar dicho desfase en el lugar que nos sea más conveniente, pero esto no arregla el desfase durante todo ese tiempo (que seguirá desincronizado), provocará un salto en el audio (salvo que hagamos el típico truco de utilizar el fundido a negro más cercano) y además es una soberana chapuza.

Si nos ocurre esto y queremos hacerlo bien, no nos queda más remedio que recurrir a la ayuda de la imagen, aunque sin fiarnos demasiado de nuestro ojo que ya vimos que no es tan preciso como nuestro oído. Miremos la película y veamos en qué momentos de diálogo se pueden ver los labios del que habla, comprobemos esos momentos de forma que el audio doblado coincida al máximo posible con el VO y verifiquemos lo mismo en diferentes escenas separadas al menos 30 segundos unas de otras. Es importante fijarse en los principios y finales de frase, ya que el mismo efecto de desincronía produce ver que la voz comienza antes o después que el movimiento de labios, como ver que dicho movimiento termina antes de que la voz acabe, o continúa aunque la voz haya terminado. Nunca os fijéis como referencia en aquellas voces que pertenezcan a actores fuera de cuadro o de espaldas, ya que los actores de doblaje solo afinan con el movimiento de labios. Si éstos no se ven, las voces pueden desfasarse con respecto a las VO hasta más de un segundo, por lo que no sirven para efectos de sincronía.

Si lo hacéis siguiendo estas reglas veréis que afináis la sincronización al milisegundo sin necesidad de quemaros las pestañas viendo una y otra vez la misma secuencia. Para comprobar vuestro progreso salvad de vez en cuando la onda, insertádsela al video con el Virtualdub y veis cómo os está quedando la cosa, aunque, como ya os comenté, conforme vayáis pillando práctica no necesitaréis recurrir a la imagen prácticamente nunca.

Fijaos en un curioso hecho: mirar atentamente algo, concentrarse con la vista en detalles, produce cansancio y hasta dolor de cabeza. Escuchar atentamente sin embargo es mucho más relajante y se puede hacer durante bastante tiempo sin sentir tanto cansancio (salvo que escuches atentamente un martillo neumático, un tablao flamenco taconeando a toda pastilla o a un político soltándose un discurso X-D).

• HAY SATURACIONES, INTERFERENCIAS O RUIDOS

En otra parte hablaremos sobre filtrado, ecualizado y corrección de ondas, por lo que ya trataremos el tema en su momento. Basta decir que son procesos que nada tienen que ver con la sincronización y que se realizan de forma independiente a ésta. Pueden hacerse antes o después por igual, aunque personalmente prefiero hacerlas siempre a posteriori por varias razones:

1. Haber sincronizado un audio implica haberlo escuchado prácticamente entero, por lo que tenemos una mejor impresión sobre lo que tenemos y lo que necesitamos modificar. Si nos ponemos a modificar algo antes de haberlo escuchado corremos el riesgo de efectuar cambios que afecten de desigual manera a toda la onda. Un ejemplo: aumentar graves cuando sólo hay una carencia de graves en los primeros minutos, con eso creamos una saturación de bajos innecesaria en todo el resto del audio.

2. No sólo habremos seguido el audio doblado sino que habremos escuchado bastante del audio original. Tendremos una idea más aproximada y nuestro oído estará más acostumbrado a escuchar algo que suena como debe para poder tomarlo como referencia.

3. Ecualizar y filtrar puede eliminar o atenuar muchos sonidos que podrían servirnos como referencia para poder sincronizar las bandas de audio. Mejor trastear después sobre un audio ya perfectamente sincronizado que no lamentar a posteriori el habernos cargado todos los sonidos de fondo... cuando ya es demasiado tarde.


Página 13 de 20

4. Poder utilizar el audio VO en ocasiones nos va a proporcionar un tremendo incremento de calidad en el audio resultante (como ya veremos más adelante), pero para ello necesitamos que el doblaje esté perfectamente sincronizado. Hasta entonces no podremos escuchar el resultado y por tanto no sabemos si la banda de audio doblado necesita de determinadas correcciones y filtrados.

En suma, la única corrección que debéis hacer antes de sincronizar es, en todo caso y sólo si resulta muy insoportable, la eliminación del ruido de fondo, pero siempre con precaución y afinando mucho el filtrado para no perder partes importantes.

Tal vez haya más casos que os podáis encontrar y que no estén contemplados en este manual, pero creemos que hemos tocado los más habituales. Si tenéis algún caso raro del que no hayamos hablado decídnoslo e intentaremos ver la forma de solucionarlo, así haremos crecer este manual con la experiencia de muchos.

CONSEJOS FINALES SOBRE SINCRONÍA

Para terminar con el apartado sobre sincronizaciones, y como norma general, seguimos insistiendo en algo que venimos diciendo desde el principio "no hagáis chapuzas si lo podéis solucionar de una forma más elegante". Ya sé que hay mucho vago por ahí suelto pero dudo siquiera que se molesten en leer este manual, así que si estás leyendo esto es que el tema te interesa y tratas de hacerlo lo mejor posible. También sé de sobra que muchas de esas "pequeñas victorias" solucionando problemas que al principio parecían irresolubles se quedan con el único reconocimiento de ti mismo contigo mismo, porque nadie se va a enterar de lo que has tenido que hacer para poder solventar ese pequeño fallito. Si precisamente lo has dejado que casi no se nota nada... ¿quien se va a enterar? Pues como ya digo: tú mismo eres el que sabe lo que has hecho, y no debe haber nadie más exigente que uno mismo a la hora de hacer una tarea, si es que queremos hacerla realmente bien. Así que ánimo, que merece la pena, y si hoy no te sale déjalo y lo vuelves a intentar mañana o pasado, que ya verás como acabas solucionándolo (y esto, aunque os parezca de perogrullo, es el mejor consejo que os puedo dar).

Un último consejo: no tengáis mucha prisa y os pongáis a hacer sincros como locos, que no hemos acabado el manual y faltan partes muy interesantes que os harán mejorar muy mucho los audios. Un pelín de paciencia que todo llegará. ;-)

7.- APROVECHAMIENTO DE LAS BANDAS VO (Versiones Originales) - Parte 1

Este capítulo es uno de los más importantes del llamado "método SCL" (o "método QS" como lo denomina el maestro Dhusuf), ya que es uno de los procesos que más nos van a ayudar a lograr mejorar la calidad de los audios. Pero debéis tener claro que no se trata de un proceso aislado, sino de una fase más de una serie de procedimientos destinados a trabajar con audios. Si aplicáis sólo estas técnicas sin hacer caso del resto de procesos con el audio, seguiréis haciendo las cosas a medias. Así que os recomiendo aún más paciencia, que no sólo hay 6 partes previas a este apartado sino que después de él habrá aún otras poquillas más. Pero no os cortéis de ir aplicando todo lo dicho para ir cogiendo el tranquillo, que como ya dijimos la práctica es un ingrediente fundamental.

La utilización de las bandas sonoras tiene varias aplicaciones, veamos las más importantes (algunas ya se han comentado):

1. Ayuda a la sincronización como referencia 100% exacta


Página 14 de 20

2. Nos proporciona una referencia sobre el sonido como ayuda para ecualizar correctamente el doblado

3. Sirve para rellenar aquellos trozos del doblaje que falten o sean defectuosos

4. Podemos mezclarla total o parcialmente para realzar la calidad y el estéreo del doblaje

Por todo ello, es evidente que cuanto mejor sea la banda sonora original de más utilidad nos será. Lo ideal sería contar con el audio en AC3, o en su defecto mp3 a 160 Kbps mínimo. Si el audio original está a 128 o menos entonces podemos olvidarnos de usarla al 100%, aunque evidentemente aún nos puede servir para los puntos 1, 2 y 3. Pero centrémonos en los puntos 3 y 4, ¿cómo podemos aprovechar ese audio VO y mezclarlo con el doblaje?

Podemos “cortar y pegar” los trozos en los que no hay diálogos, sólo música y efectos. Pongo lo de “cortar y pegar” entre comillas porque no se trata de hacerlo literalmente, sino más bien de mezclar. Lo que haríamos sería abrir con el Cooledit en una pista una copia del audio VO e ir eliminando los trozos con diálogo. Para evitar que haya altibajos tendríamos luego que ir con toda paciencia usando los fade in y fade out en cada trozo para que las transiciones se realicen de forma gradual. Evidentemente si queremos que este proceso sea lo más perfecto posible, entonces al audio doblado habría que realizarle las mismas operaciones pero a la inversa, con el fin de que el volumen del audio a lo largo de toda la película fuese homogéneo.

Pero existe un sencillo truco que podemos realizar y que nos ayudará a eliminar en parte esas voces VO no deseadas: la técnica del audio inverso. Veamos en qué se basa esta técnica: como ya hemos comentado, una banda sonora se compone de tres partes que se graban y procesan por separado: música, efectos y diálogos. La música y los efectos se graban lógicamente en estéreo pero los diálogos suelen grabarse en mono con el fin de que se puedan escuchar por igual por ambos canales. Esto significa que en cada canal (L y R, de Left y Right, respectivamente izquierdo y derecho) tenemos sonidos diferentes y sonidos comunes a ambos canales.

Cuando a una onda le sumamos su inverso, el resultado es la anulación del sonido, digamos que "se restan". Si habéis leído los "Cuentos de la Taberna del Ciervo Blanco" del maestro Arthur C. Clarke recordaréis que una de las historias trata precisamente sobre una máquina capaz de generar silencio basándose en la suma de ondas inversas. Aparte de ser un libro excelente, es una buena historia que ayuda a comprender de qué estamos hablando. Aplicando ese fundamento a nuestros audios lo que haríamos sería lo siguiente (explico primero la parte teórica):

Creamos una copia del canal izquierdo (L), invertimos la onda y la sumamos al canal derecho (R). De la misma forma hacemos el mismo proceso con el canal derecho sobre el izquierdo. El resultado sería el siguiente:

L2 = L1 - R1

R2 = R1 - L1

Donde L2 y R2 son los canales izquierdo y derecho resultantes, y L1 y R1 los canales tal y como estaban antes del proceso. ¿Qué hemos conseguido con esto? Pues sencillamente eliminar de cada canal aquellos sonidos que se hallan por igual en ambos (es decir, sonidos monofónicos) y mantener sin embargo aquellos diferentes (los estereofónicos).

Con respecto a lo que buscábamos eliminar (las voces), el aspecto positivo es que las voces originales han disminuido bastante de intensidad, hasta incluso desaparecer del todo en algunas partes. Como aspecto negativo nos encontraremos


Página 15 de 20

con que en muchas partes las voces no desaparecen sino que solo se amortiguan, y además en según que BSO’s este truco de mezcla de audios inversos tiene mayor o menor incidencia. Así pues no basta con realizar el método inverso, sino que hay que revisar (escuchando atentamente) toda la banda de audio en busca de esas voces residuales para irlas eliminando, o si no, no podríamos utilizar esa banda resultante. Este es el proceso más largo y tedioso de todo el método, pero es necesario para completar el proceso correctamente. Podéis eliminar los trozos que contengan voces residuales disminuyendo su volumen o incluso silenciándolos del todo y realizando fade out al principio del fragmento a eliminar y fade in al final para que las transiciones sean suaves y no se noten en la mezcla final las variaciones de volumen. En caso de duda podemos escuchar la mezcla de canales y ver cómo quedaría el resultado, ya que muchas voces residuales pueden quedar tapadas por el doblaje y no haría falta eliminarlas del todo, aunque de esto hay que asegurarse muy bien porque el que no lo oigamos con nuestros cascos y/o altavoces no significa que no se vayan a escuchar con otros diferentes.

Con respecto a lo que buscábamos mantener (música y efectos), el aspecto negativo es lo primero que resalta ya que ha variado el sonido de la música y los efectos, lógico al haber eliminado parte de los sonidos que componían todo el conjunto, así que si escuchamos sólo ese audio resultante, lo que oímos nos resulta extraño y algo incompleto. Pero hay que tener en cuenta que no vamos a usar esa onda por si sola, sino mezclada con otras. Cuando lleguemos a la parte de mezclas podremos ver cómo la incorporación de esta banda procesada y bien mezclada y compensada, nos incrementa muchísimo la calidad de sonido del conjunto.

Está claro en todo este proceso que lo primero que necesitamos es obtener una VO de la mejor calidad posible y, por supuesto, estéreo REAL. Por esa razón descartamos cualquier formato por debajo de los 160 kbps, es necesario trabajar con bitrate constante (CBR) en lugar de variable (VBR), siempre es mejor el audio en AC3 que en MP3 y son preferibles los sample rates de 48 KHz en lugar de los tan malditamente usados 44,1. Hace unos años, cuando mandar 1 simple Mb por módem era tarea que llevaba varios minutos, tenía sentido que se apurase el tamaño de los archivos arañando por aquí y por allá, pero hoy en día resulta absurdo andar ahorrando unos pocos bytes en algo tan importante. Si alguien no nota "apenas" diferencia entre un mp3 a 128 con un mp3 a 160 ó 192, le aconsejaría que cogiese unos buenos altavoces (o mejor aún, unos buenos cascos) y después de escuchar bien ambos formatos se atreviese a seguir diciendo lo mismo. Por supuesto hablamos de sonidos limpios y bien ecualizados, que una lata a 128 y una lata a 192 no se llevan demasiada diferencia que digamos. X-D

Así pués, la situación ideal de partida es contar con un audio original en formato AC3. Pero tengamos en cuenta, que la estructura de un fichero AC3 puede ir desde 2 hasta 6 canales. Veamos los distintos tipos que nos pdemos encontrar:

Ø 2 canales: L y R

Ø 3 canales: L y R + Surround

Ø 3 canales: L y R + Frontal (formato obsoleto)

Ø 4 canales: L y R delantero + L y R trasero (creo que este tampoco se usa ya)

Ø 4 canales: L y R + Frontal + Surround (conocido como 3.1)

Ø 5 canales: L y R delantero + L y R trasero + Surround (fué el famoso 4.1)

Ø 6 canales: L y R delantero + Frontal + L y R trasero + Surround (el tan popular 5.1)


Página 16 de 20

Creo que hay por ahí ya especificaciones 6.1 y 7.1, pero no las he trabajado aún, además dudo que os encontréis por ahora un DVD con una configuración distinta a las detalladas, y aunque así fuera el procedimiento a seguir no iba a variar. Así que una vez que conocemos la estructura de nuestro AC3, conviene estudiar cada grupo de canales por separado para ver qué podemos usar de ellos. Mi recomendación es separar los canales en bandas independientes (luego veremos en la parte práctica cómo hacer todo esto) y ver cómo podemos aprovecharlos, ya que cada grabación es distinta y cada técnico de sonido puede haber elegido distintas formas de "repartir" el sonido entre los canales. Si no queremos complicarnos demasiado la vida, ya que nosotros vamos a trabajar en un formato estéreo, podemos reducir el AC3 a formato wav (de dos canales), que es audio sin comprimir y sobre el cual podremos realizar la técnica de la mezcla de audios inversos que vimos antes.

Si queremos trastear antes un poco, podemos realizar diferentes pruebas con las diferentes bandas. Por ejemplo podemos escuchar la banda surround para ver si nos puede valer, o podemos realizar mezclas de audio inverso con los canales delanteros y traseros para ver con qué combinación nos queda un audio más aprovechable.

Tened en cuenta que las grabaciones originales en formato 5.1 son muy, muy recientes, y que en muchas ocasiones (sobre todo en películas y series que tengan unos pocos añitos) lo que estáis escuchando no es un 5.1 real, sino una adaptación a 6 canales realizada por los técnicos de grabación a partir de una fuente original estéreo. Esto quiere decir que en muchas ocasiones nos vamos a encontrar con que los canales L y R delanteros y los traseros son prácticamente idénticos (se han limitado a duplicarlos), que el "surround" no es más que una banda monofónica con un filtro de corte a frecuencias bajas y que el frontal es simplemente una suma de L+R dividida por dos. Vamos, que de 2 canales se han sacado hábilmente 6 así por la pata. X-D

Básicamente, el trabajo con audios VO requiere (como todo) paciencia, práctica y muchas pruebas. No hay dos audios iguales y por tanto no se pueden dar instrucciones que sirvan por igual para todos los casos. Los que trabajamos con series tenemos la ventaja de que normalmente en ellas se mantiene una homogeneidad a lo largo de cada temporada (aunque no siempre), por lo que son los primeros episodios a los que tendremos que dedicar más tiempo. Una vez hayamos trabajado esos primeros episodios conoceremos ya un montón de detalles que nos van a valer para los siguientes, y eso siempre supone un ahorro de tiempo.

Es bueno, pues, detenerse en los primeros episodios de una serie dedicándoles tiempo y esfuerzo a conocerlos y tratar de sacarles partido, ya que todo ese tiempo empleado repercutirá a nuestro favor más adelante. De la misma forma, también es mejor, lógicamente, que la misma persona haga todos los episodios de una misma temporada, o en su defecto un grupo reducido de personas con buena comunicación entre ellos (y similares niveles de exigencia) y realizando todos, de común acuerdo, las mismas operaciones.

8.- APROVECHAMIENTO DE LAS BANDAS VO (Versiones Originales) - Parte 2

Para todos los procesos que necesitamos realizar tenéis varios programas muy buenos, mi consejo es que utilicéis aquel con el que más cómodos os sintáis o el que más prestaciones os proporcione. Tened en cuenta que los programas cambian y mejoran constantemente, por lo que el mejor programa para algo hoy puede dejar de serlo pasado mañana, así que no vamos a recomendar ninguno en particular. Los programas que os voy a mencionar son los que uso yo en este momento, pero eso no


Página 17 de 20

quita para que pueda usarse cualquier otro programa que os de las mismas o incluso mejores prestaciones.

Para analizar y extraer los AC3 yo utilizo el Ciler's AC3 Tool. Primeramente de todo conviene usar la opción "launch analysis ", la cual nos va a proporcionar toda la información que necesitamos conocer sobre el contenido y la estructura de ese AC3, especialmente qué canales incorpora. Una vez sabemos de cuántos canales consta el fichero, ya podemos comenzar la extracción a formato wav. Os recomiendo probar distintas formas de equilibrar los controles ya que obtendréis resultados muy diferentes según la naturaleza del AC3 con el que estéis trabajando. Como primera prueba, sacad los canales de forma separada para poder escuchar posteriormente el contenido de dichos canales. Al hacer la conversión AC3 -> wav debéis seleccionar el downmix (-d) y el output channels configuration (-o), ahí es donde hay que decirle lo que queréis que os saque. Si el AC3 es 2.0 evidentemente sólo podréis obtener un wav estéreo, así que no hay más opciones (sólo se podrán intercambiar los canales como mucho), pero si el AC3 es, por ejemplo, 5.1 se le puede indicar que mantenga el formato 5.1, y de esa forma os sacará 6 wavs, correspondientes a cada canal del AC3. Posteriormente abrís todos esos wavs en modo multipista en el Cooledit y ya podréis trajinar con ellos a gusto.

También podéis realizar el "downmix" (mezclado) para reducir a un estéreo normal en sus dos canales L/R. La mejor forma de obtener resultados es probar y conocer, no existe una regla única y tendríamos que estar aplicando distintas reglas para cada caso con el que podríamos encontrarnos, y no se trata de hacer eterno este manual. X-D

Otra cosa muy útil que podemos realizar con el AC3 Tool es aumentar el nivel de ganancia de entrada (Main Gain Correction) en aquellos casos en los que el nivel de volumen del AC3 extraído sea muy bajo. Esto nos permite subir el volumen en caso de necesidad a partir de la propia fuente, en lugar de tener que hacerlo posteriormente sobre un sonido ya procesado y reconvertido.

Si el formato en el que tenéis la VO es mp3, entonces tendremos que usar algún programa que nos lo convierta a wav. Yo utilizo para ello el Soundforge, pero tenéis un buen montón de utilidades que podéis usar. Aseguraos únicamente de respetar el sample rate que tengáis en el fichero original, ya mencionamos en partes anteriores de este manual la importancia de preservar la homogeneidad.

Una vez tenemos ya en wav todo el material con el que vamos a trabajar (bandas originales, doblajes y lo que se tercie), entonces necesitamos un programa de edición de ondas que sea multicanal. Yo utilizo el Cooledit, un estupendo programa que permite abrir y procesar tantas bandas de audio como necesitemos, tanto individualmente como la mezcla de todas ellas. Es como tener una mesa de mezclas virtual en la que además podemos editar por completo cada uno de los canales, hacer y deshacer todo lo que haga falta, y escuchar en tiempo real el resultado.

Además el Cooledit incorpora una serie de procesos predefinidos que podemos utilizar, y uno de ellos es precisamente el "vocal cut". El vocal cut va a hacer exactamente lo que describimos en la parte teórica, es decir realizar la mezcla de ondas inversas entre canales cruzados en un sólo paso. Pero tened cuidado a la hora de utilizarlo porque en algunas versiones del Cooledit el proceso lo realiza de forma incompleta o imprecisa, y hay por ahí unas cuantas versiones diferentes funcionando. Editad el proceso predefinido y ved lo que está realmente haciendo para ver si es el proceso correcto que describimos anteriormente, y así podéis usarlo con más tranquilidad.

Importante también es que tengáis en cuenta que los programas son software, y que el software tiene sus fallos y sus sorpresitas desagradables. Trabajando bajo entorno Windows es muy común quedarse corto de memoria por la mala gestión de la


Página 18 de 20

misma que hace. Cooledit y Soundforge necesitan bastante memoria (sobre todo cuando cargas varias ondas y haces muchas modificaciones sobre ellas). Puede ocurrir con relativa facilidad que te quedes corto de memoria mientras estás trabajando y sin que te des cuenta las ondas empiecen a corromperse, si salvas y sobrescribes en ese momento el trabajo (como es conveniente hacer frecuentemente), puedes machacar todo el trabajo hecho hasta el momento. Si eso te ocurre después de llevar varios días con un audio recalcitrante te aseguro que es para darse de cabezazos con el monitor. Es, pues, conveniente asegurarse de que todo sigue en su sitio, y ante la duda salva los progresos con distinto nombre, así al menos solo tendrás que retroceder hasta lo último que guardaste.

Otro tema importante: no modifiquéis nunca el archivo de la banda de audio original ya que va a ser vuestro punto de referencia para muchos procesos y os hará falta tenerlo íntegro. Realizad copias del mismo y abrid cada proceso en una pista distinta. Ahora comprenderéis por qué es tan vital (como decíamos en la parte referente a sincronizaciones) que la sincronización sea lo más perfecta posible. Si vamos a mezclar diferentes ondas es importante, no sólo que se hallen lo más sincronizadas posible (siempre tomando como referencia la VO original, que es la que manda), sino que además se hallen en fase, y que los canales L y R sean los mismos en todas las bandas a mezclar (que no estén intercambiados).

Para que comprendáis esto un poquito mejor, os comentaremos en qué afectan ambas cuestiones con más detalle. Recordad que hemos aplicado una inversión de fase para eliminar las voces, por lo que evidentemente mezclar dos ondas con fase inversa hace que en lugar de sumarse ambos sonidos, en realidad se anulen. Por ello si no nos damos cuenta de ello y sumamos dos ondas, ambas con buen sonido pero con fases opuestas, el resultado será una onda bastante disminuida, mas baja de volumen y de peor calidad que las dos anteriores por separado, ya que hemos eliminado sonidos en lugar de sumarlos. Así que como veis, el "pequeño detallito" de las fases es muy, muy importante. Que no os pase como a mí, que en más de una ocasión se me ha escapado alguna de estas trastadas por no verificar bien los canales antes de sumarlos. ;-)

Con respecto al intercambio de L y R, os lo explicaré con un ejemplo sencillote. Tenemos un sonido de una moto que se acerca por la izquierda, pasa por delante de nosotros a toda pastilla y se aleja por la derecha. En un sonido estéreo correcto escucharíamos a la moto acercarse por el canal L, se iría incrementando dicho sonido conforme se acercara y a partir de cierto punto, cuando la moto estuviera muy cerquita, el sonido empezaría a escucharse también por el canal R y aumentando rápidamente. En el momento en el que la moto estuviera delante de nosotros ambos canales emitirían el mismo sonido, y a partir de ahí comenzaría a desaparecer rápidamente del canal L para quedar sólo en el canal R. Toda esta secuencia dura apenas unas décimas de segundo, pero si el sonido y la imagen están bien conjuntadas el efecto que nos produce al ver-oír el paso de la moto es lo más parecido a la realidad. Ese es el fundamento del estéreo, intentar reproducir lo mejor posible la realidad de cómo escuchamos al contar con dos oídos que nos permiten sentir esa "espacialidad" o "tridimensionalidad" del sonido. Pues bien, evidentemente, si cuando mezclamos dos ondas no tenemos en cuenta la homogeneidad de esa distribución de canales, podemos anular sin querer un precioso estéreo. Acudiendo al ejemplo anterior: en una banda la moto entraría por la izquierda y saldría por la derecha, en la otra banda entraría de derecha a izquierda, y al sumar ambas simplemente escucharíamos todo el rato la moto en el centro; habríamos perdido la sensación de estéreo.

Ahora unas pistas para solventar estos incidentes tontorrones: Comprobar la fase es tan sencillo como encontrar dos sonidos lo más parecidos posible y comparar su forma de onda en la banda original y en la doblada, si ambas ondas llevan la misma


Página 19 de 20

dirección (ascendente o descendente) entonces es que están en fase, mientras que si una es ascendente y la otra descendente entonces es que están invertidas de fase. Para resolverlo simplemente tenemos que modificar una de las bandas y aplicar un simple proceso inversor de onda sobre ella (Nuevo L = antiguo -L y nuevo R = antiguo -R).

De la misma forma podemos detectar los cambios de canal (L por R) inspeccionando la forma de las ondas de forma visual. Buscad en la VO una parte en la que los canales L y R tengan una forma de onda claramente diferente y comparad esa misma parte en las otras bandas a mezclar. Si tenéis dudas sobre cual es la asignación L y R correcta, recurrid a las tradicionales buenas relaciones entre la vista y el oído reproduciendo esa parte del avi original y viendo cuál sería la asignación más lógica según lo que estéis viendo. Si tenéis dudas, dad prioridad a lo que indique la VO ya que normalmente (salvo patochadas raras que a veces se ven) será la que esté correcta. Para corregir una banda con canales cambiados utilizad el "swap channels", que no es más que un simple: (nuevo L = antiguo R y nuevo R = antiguo L).

Si cumplimos correctamente todos los pasos tendremos una serie de bandas que poder mezclar para obtener el audio definitivo. Con el Cooledit podemos escuchar el resultado y asegurarnos de los niveles de volumen a aplicar a cada canal, si subimos demasiado la música y los efectos podemos hacer que resulte difícil escuchar las voces en algunas partes (algunas de por sí ya vienen bastante bajas de origen en ocasiones), y si, por el contrario, bajamos demasiado ese refuerzo, entonces apenas se notarán las mejoras y el trabajo realizado quedará bastante apagado y desperdiciado. Igualmente, un exceso de efecto surround puede ser contraproducente ya que no todo el mundo va a tener unos peazo altavoces 5.1 de 300 €, o va a escuchar los montajes a través de su cadena estéreo. Aquellos que escuchen a través de altavoces sencillitos o del cutre-altavoz de la TV ese sensacional efecto surround pueden sufrir una tortura sónica en forma de ruidos. Hay un buen truco para saber si un grabación va a sonar bien en diferentes entornos: si suena bien y se distinguen los detalles a volumen bajo y sigue sonando bien, sin saturaciones ni distorsiones y siguen distinguiéndose bien voces ruidos y música a volumen muy alto, entonces es que la mezcla está bastante bien compensada.

CONSEJOS FINALES DEL MANUAL

Con todo esto tenéis ya bastantes pistas para proceder a realizar vuestros montajes aprovechando muchas de las posibilidades que tenemos fácilmente a nuestro alcance. Id realizando prácticas y no os desaniméis si al principio las cosas no salen según lo esperado, lo raro sería que os saliera todo bien de primeras. Yo llevo usando estas técnicas bastante tiempo y sigo aprendiendo cosas constantemente, por muy bien que lo hagas siempre se puede mejorar. Y de eso se trata, que cada sincro sea mejor que las anteriores. ;-)

Dejo abierto el manual para alguna entrega posterior, aunque como digo lo principal ya está dicho. Quedan pendientes algunos apuntes sobre ecualización, eliminación de ruidos y algunos truquillos, pero ya hablaremos sobre ello más adelante. También espero comentarios vuestros sobre si el manual explica suficientemente todas las dudas que se os pueden plantear o si consideráis que hay algo que no hemos tocado o que deberíamos explicar más en profundidad. Igualmente será bienvenida cualquier aportación, corrección, puntualización o ampliación a lo dicho que deseéis aportar.

Este manual está hecho con la intención de ayudar a todo aquel que quiera realizar montajes de audio a la mejor calidad posible, e intenta sensibilizar sobre la importancia que tiene un buen sonido. Si todos empezamos a hacer mejores ripeos, con mejor imagen y mejor sonido, todos ganaremos. Espero os sea de utilidad.

26-X-2003 v 1.0


Página 20 de 20

Las webs de ShareRip son:

v Web de Cifirip: http://www.cifirip.tk

v Web de Terrorrip: http://www.terrorrip.tk

v Web de Misteryrip: http://www.misteryrip.tk

v Web de subXpacio: http://www.subxpacio.tk

Si queréis contactar con el autor de este manual dirigíos a:

v [email protected]

Si queréis contactar con la persona que le ha dado formato a este manual dirigíos a:

v [email protected]

Tratamiento de sonido y sincronizaciones

Documents

Transcript of Tratamiento de sonido y sincronizaciones