[Tractament i publicació d'àudio] Pràctica 1: Senyalització acústica

download [Tractament i publicació d'àudio] Pràctica 1: Senyalització acústica

of 11

Transcript of [Tractament i publicació d'àudio] Pràctica 1: Senyalització acústica

  • 7/30/2019 [Tractament i publicaci d'udio] Prctica 1: Senyalitzaci acstica

    1/11

    Jordi Llonch Esteve | CC BY-NC-SA

    Senyalitzaci acsticaTRACTAMENT I PUBLICACI DUDIO: PRCTICA 1

  • 7/30/2019 [Tractament i publicaci d'udio] Prctica 1: Senyalitzaci acstica

    2/11

    TRACTAMENT I PUBLICACI DUDIO Prctica 1: Senyalitzaci acstica

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 1/10

    ndex

    Pregunta 1 ................................................................................................................ 2Pregunta 2 ................................................................................................................ 4

    Pregunta 3 ................................................................................................................ 7

    Bibliografia i altres recursos ............................................................................... 10

  • 7/30/2019 [Tractament i publicaci d'udio] Prctica 1: Senyalitzaci acstica

    3/11

    TRACTAMENT I PUBLICACI DUDIO Prctica 1: Senyalitzaci acstica

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 2/10

    Pregunta 1

    Imagineu que per a una aplicaci de lectura de CD dudio ens demanenquatre sons definits per:

    1. Un so nic per lacci de pitjar qualsevol dels botons de controld'execuci (play, stop i pausa).

    So original: chimes.wavProcs:

    1) Seleccionar els ltims segons del clip i copiar-los en un nou fitxer.2)Seleccionar el so posterior a lltima campana i aplicar lefecte de procs

    de reducci de soroll al nou clip.3)Augmentar el to en 20 semitons.4)Aplicar un efecte de reverberaci de sala.5)Aplicar un filtre de passabanda entre 4.000 Hz i 11.000 Hz.6)Amplificar el resultat en 20 dB.7)Silenciar la part inicial del nou so.8)Eliminar clics.9)Aplicar una fosa logartmica al final del clip.

    2. Un so nic per lacci de pitjar qualsevol dels botons de cercaseqencial (recorregut rpid endavant o recorregut rpid endarrere).

    So original: bidon.wavProcs:1) Reduir el so a 1 segon.2)Augmentar el to en 36 semitons.3)Augmentar el to en 20 semitons ms.4)Aplicar fosa logartmica dentrada i sortida.5)Amplificar el resultat en 3 dB.

    3. Un so nic per lacci de pitjar qualsevol dels botons de canvi discretde pista (canvi de pista endavant i canvi de pista endarrere).

    So original: bombo.wavProcs:

    1) Seleccionar el so del primer bombo i copiar-lo en un nou fitxer.2)Seleccionar el so previ al bombo i aplicar lefecte de procs de reducci

    de soroll al nou clip.3)Augmentar el to en 32 semitons.4)Aplicar un filtre de passaalt a 10.000 Hz.5)Augmentar les freqncies de 1.250 i 1.600 Hz en 30 dB cadascuna.6)Aplicar fosa logartmica dentrada i sortida.7)Amplificar el resultat en 1,5 dB.

  • 7/30/2019 [Tractament i publicaci d'udio] Prctica 1: Senyalitzaci acstica

    4/11

    TRACTAMENT I PUBLICACI DUDIO Prctica 1: Senyalitzaci acstica

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 3/10

    4.Un so nic per lacci de pitjar el bot del ratol fora de qualsevol delscontrols definits.

    So original: xilofon.wav

    Procs:1) Eliminar el clic final present a larxiu original.2)Disminuir el to en 10 semitons.3)Aplicar fosa logartmica de sortida.

  • 7/30/2019 [Tractament i publicaci d'udio] Prctica 1: Senyalitzaci acstica

    5/11

    TRACTAMENT I PUBLICACI DUDIO Prctica 1: Senyalitzaci acstica

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 4/10

    Pregunta 2

    Obriu el fitxer police_sandiego.wav amb un editor de forma dona. Elfitxer cont segments de missatges emesos per la rdio de la policia de San

    Diego, i que posteriorment shan retransms per streaming a la xarxa.

    1. Sha respectat tota la banda audible de 20 Hz a 20 kHz en laretransmissi? (mira lespectre del senyal a diferents punts del fitxer).

    Aquesta visualitzaci lineal de freqncia espectral demostra que no sharespectat tota la banda audible, ja que es veu com tots els sons acaben a la

    banda dels 6 kHz.

    Amb lanlisi de freqncia comprovem lafirmaci anterior i observem quela freqncia inicial se situa al voltant dels 100 Hz. Amb la qual cosa tenimun rang comprs entre els 100 Hz i els 6 kHz, enlloc del rang audible situatentre 20 Hz i 20 kHz.

  • 7/30/2019 [Tractament i publicaci d'udio] Prctica 1: Senyalitzaci acstica

    6/11

    TRACTAMENT I PUBLICACI DUDIO Prctica 1: Senyalitzaci acstica

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 5/10

    2. Observars que hi ha locucions/segments damplitud molt fluixa idaltres damplitud ms forta. Per arreglar aquests desajustos,proposem una compressi. Donada la mala qualitat de ludio

    original, la compressi haur de ser una mica exagerada. Juga amb elsparmetres del llindar i la rtio per aconseguir uns resultats

    acceptables. Juga tamb amb lattack-time del compressor (sensemodificar el ratio i el gain de lapartat anterior), i comenta elsresultats obtinguts. Adjunta a la memria una explicaci dels

    parmetres escollits i el fitxer dudio resultant.

    Desprs de fer proves amb el llindar (el nivell dentrada on comena lacompressi) veiem que cal reduir aquest parmetre de manera considerable

    per a aconseguir disminuir el volum dels sons massa forts. Un valor propera -55 dB ser acceptable.

    La proporci o rtio representa la relaci de compressi que saplica alllindar, aix que quan ms elevada sigui, ms es comprimir el so. Per tant,en aquest cas sha descollir un valor fora elevat per a aconseguir una grancompressi, quelcom que ajudar a arreglar els desajustos sonors del clip.En aquest cas, una relaci de 20 a 1 complir la seva funci.

    Respecte al temps datac, quan ms elevat sigui, ms tard saplicar lefectede compressi utilitzant el llindar i la proporci anteriors, per aix, peraquest clip, no t gaire sentit augmentar massa aquest nombre. Aix doncs,un valor proper a 0 ms ser til.

    3.Ara mirarem darreglar una mica el timbre de la veu. s tpic que pertreure lefecte nasal de veus enregistrades en no massa bonescondicions, haguem daplicar un filtre rebuig-banda entre les

    freqncies d1 kHz o 1,2 kHz. Finalment, per donar una mica de cos ala veu, farem que la corba dequalitzaci sigui constantmentdecreixent amb la freqncia. Pots ajuntar els dos processos a la

    mateixa corba dequalitzaci. Adjunta a la memria una explicacidels parmetres escollits i el fitxer dudio resultant.

    Aquest exercici sha desenvolupat en dues parts. Per comenar, shadeterminat que lefecte nasal es concentrava al voltant dels 1,2 kHz, aixque sha aplicat el filtre rebuig-banda a aquesta freqncia, com mostra la

    imatge de la pgina segent.

  • 7/30/2019 [Tractament i publicaci d'udio] Prctica 1: Senyalitzaci acstica

    7/11

    TRACTAMENT I PUBLICACI DUDIO Prctica 1: Senyalitzaci acstica

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 6/10

    A continuaci, sha aplicat un decreixement de la intensitat a mesura que sesaugmenta la freqncia del clip sencer. La reducci ms forta comena

    entre 1 i 2 kHz i saconsegueix canviar el timbre de la veu i perqu soni demanera menys robtica o enllaunada.

    4.Comenta si els resultats obtinguts desprs daquest procs snsatisfactoris o no. Raona la resposta.

    Tot i que el so obtingut millora la qualitat perceptiva del so original, encarano saconsegueix una normalitzaci total del so, quelcom que seria possiblecomprimint individualment els fragments de so del clip.

    Ara b, la reducci de la percepci nasal i de lefecte denllaunat ha milloratsubstancialment el clip final, que ha disminut la seva percepci de soradiofnic o enllaunat.

  • 7/30/2019 [Tractament i publicaci d'udio] Prctica 1: Senyalitzaci acstica

    8/11

    TRACTAMENT I PUBLICACI DUDIO Prctica 1: Senyalitzaci acstica

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 7/10

    Pregunta 3

    Preneu el fitxer dudio 43555__dobroide__20071103-description-human.wav incls a larxiu Sons_Prctica1_4.zip i realitzeu els segentsexercicis.

    1. Convertiu el fitxer dudio 43555__dobroide__20071103-description-human.wav al format MP3 amb Bit rate = 128 kbps, 44100 Hz.Compareu les mides dels fitxers de larxiu WAV original i lMP3generat.

    El fitxer resultant daquesta compressi ocupa 403 kB, davant dels 4,28 MBde loriginal, aix significa una relaci de compressi de gaireb 11 a 1.

    2. Compareu els espectrogrames dels fitxers WAV i MP3 i comenteu lesdiferncies que trobeu (afegiu al document PDF una imatge per a cada

    un dels espectrogrames.

    Espectrograma del fitxer WAV

    Espectrograma del fitxer MP3

  • 7/30/2019 [Tractament i publicaci d'udio] Prctica 1: Senyalitzaci acstica

    9/11

    TRACTAMENT I PUBLICACI DUDIO Prctica 1: Senyalitzaci acstica

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 8/10

    De les dues imatges anteriors en podem obtenir una de nova formada per ladiferncia delles.

    Imatge diferncia dels espectrogrames WAV i MP3

    Si observem detingudament aquesta imatge, localitzem dos tipus de detalls:per una banda, en color violeta apareixen les freqncies que handesaparegut al fer la compressi en MP3 i, per laltra, en color vermell i verdapareixen les freqncies que han patit variacions a causa del cdeccompressor amb prdues escollit, lMP3.

    3. Detecteu alguna diferncia sonora entre el so WAV i MP3? Proveu areproduir-los en diferents equips (altaveus i auriculars, per exemple).

    De les proves realitzades es pot concloure que no hi ha cap difernciaaudible entre els dos sons. Els equips utilitzats per dur a terme aquestesproves han estat els altaveus dun porttil Dell Studio XPS i uns auriculars

    JVC amb cancellaci de soroll (activada i desactivada).

    A ms, he creat un nou clip dudio intercalant fragments del WAV i lMP3 ilhe reprodut de forma contnua, sense ser capa de discernir quin fragmentpertanyia a cadascun. La imatge segent mostra el procs de creaci daquestnou clip amb Adobe Audition.

  • 7/30/2019 [Tractament i publicaci d'udio] Prctica 1: Senyalitzaci acstica

    10/11

    TRACTAMENT I PUBLICACI DUDIO Prctica 1: Senyalitzaci acstica

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 9/10

    4.Finalment, canvieu la freqncia de mostreig de larxiu WAV (atenci,no lMP3) sense convertir la freqncia del so. La nova freqncia demostreig ha de ser de 22.050 Hz. Explica breument en qu consisteix

    aquest procs. Etiqueteu aquest so amb el nom cognom_so7.wav illiureu-lo juntament amb el document PDF de la prctica.

    El procs de remostrejar consisteix a modificar la freqncia de mostreigdun clip dudio sense alterar les caracterstiques del so. Aquestamodificaci pot ser un augment o una reducci, per sempre es perdrinformaci durant el procs. En cas de disminuir el nombre de mostres persegon dun fitxer dudio, se neliminen algunes i, en el cas dun augment, esporta a terme una interpolaci.

    En disminuir la freqncia de 44.100 Hz a 22.050 Hz, s est eliminant unamostra de cada dues, per tant, el fitxer final disposar de la meitatdinformaci que loriginal i ocupar exactament la meitat.

  • 7/30/2019 [Tractament i publicaci d'udio] Prctica 1: Senyalitzaci acstica

    11/11

    TRACTAMENT I PUBLICACI DUDIO Prctica 1: Senyalitzaci acstica

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 10/10

    Bibliografia i altres recursos

    Berenguer, Josep Manuel. Dalmases i Castellanes, Marc. Jord Puig, Sergi.

    Marn Atars, Aniol. (2013). Tractament i publicaci dudio. FUOC.

    Help Adobe. Adobe Audition. http://helpx.adobe.com/es/audition/topics.html[data de consulta: maig 2013]

    La imatge de la portada s de Nicholas Burroughs (CC BY 3.0), el logotip de la

    UOC s propietat de la Universitat Oberta de Catalunya i la resta dimatges snde creaci prpia i regulades per la mateixa llicncia que aquest document.

    http://helpx.adobe.com/es/audition/topics.htmlhttp://helpx.adobe.com/es/audition/topics.htmlhttp://helpx.adobe.com/es/audition/topics.html