aula-audio

download aula-audio

of 61

Transcript of aula-audio

  • 8/7/2019 aula-audio

    1/61

    Fundamentos de udio

    Sistemas Telemticos

    Ano Lectivo 2002/2003LESI

    Grupo de Comunicaes por Computador

  • 8/7/2019 aula-audio

    2/61

    Sumrio

    Sistema de Audio Humana

    Fsica do Som

    Gravao e Reproduo Analgica Sim Digital

    Compresso udio Mtodos de compresso simples MPEG

  • 8/7/2019 aula-audio

    3/61

    Materias utilizados

    Dr. Ze-Nian Lis course material at:http://www.cs.sfu.ca/CourseCentral/365/li/

    MPEG Audio:http://www.mpeg.org/MPEG/audio.html

  • 8/7/2019 aula-audio

    4/61

  • 8/7/2019 aula-audio

    5/61

    A fsica do Som

    Audio Humana O nosso sistemaauditivo converteenergia sonora em

    energia mecnica paraum impulso nevorso que transmitido para ocerbro.

    O ouvido tem trspartes: externa, mdia einterna.

  • 8/7/2019 aula-audio

    6/61

    A fsica do Som

    Audio humanaO ouvido externoO ouvido externo

    O ouvido externo compreende opavilho auricular e o meato acsticoexterno. O pavilho capta os sons,tendo papel importante na localizaoespacial da fonte sonora,

    extremamente importante paraouvirmos em ambientes ruidosos. Omeato acstico externo conduz ossons at a membrana timpnica.

  • 8/7/2019 aula-audio

    7/61

    A fsica do som

    Audio humanaOuvido internoOuvido interno

    Serve para transformar aenergia sonora emvibraes internas doestrutura ssea da orelhamdia

    As vibraes sotransformadas em ondasde compresso

  • 8/7/2019 aula-audio

    8/61

    A fsica do som

    Audio Humana O ouvido mdio compreende a

    membrana timpnica, a cadeia deossculos (martelo ,bigorna e estribo) e

    os espaos areos do osso temporal,particularmente o antro mastide e asclulas mastideas adjacentes.

    O ouvido mdio desempenha o papel

    de um transformador, que evita aperda de energia das ondas sonoras aopassar de um meio gasoso (ar) a ummeio lquido (a perilinfa da orelha

    interna).

  • 8/7/2019 aula-audio

    9/61

    A fsica do som

    Audio HumanaO ouvido internoO ouvido interno

    Serve para transformar aenergia da onda decompresso num fludointerno do ouvido emimplusos do nervo no

    fludo interno quepodem ser transmitidoao crebro

  • 8/7/2019 aula-audio

    10/61

    Efeito de dissimulao

    Quando um som forte numa determinadafrequncia estimula os pelos da cclea

    As frequncias prximas no so ouvidas casosejam menos significativas (de menoramplitude)

    Apesar do nosso ouvido captar uma certa

    amplitude de frequncias, parte delas no soprocessados por causa do processo de masking

  • 8/7/2019 aula-audio

    11/61

    Termos e Conceitos bsicosNo mbito do nosso sistema de audio

    Sensibilidade s frequncias Mais sensveis de 1-3 KHz

    Directividade De onde nos chega determinado som?

    0.2-3kHz

    Dissimulao (masking) temporal Tambm acontece no domnio dos tempos

  • 8/7/2019 aula-audio

    12/61

    A fsica do som

    Ondas sonoras Uma onda mecnica uma perturbao que

    viaja atravs dum meio transportando energiadum local para outro.

  • 8/7/2019 aula-audio

    13/61

    A fsica do som

    Ondas sonoras Uma onda produz reas de alta e baixa presso

    Quando a onda de alta presso atinge o timpano ele

    move-se para dentro Quando a onda de baixa presso atinge o timpano ele

    move-se para fora.

  • 8/7/2019 aula-audio

    14/61

    A fsica do som Ondas sonoras

    A amplitude o mximo deslocamentopositivo.

    Quanto maior a amplitude mais alto som medido em decibis (db)

  • 8/7/2019 aula-audio

    15/61

    A fsica do som

    Ondas sonoras O comprimento de onda (wavelength) a

    distncia entre dois pontos adjacentes na onda

  • 8/7/2019 aula-audio

    16/61

    A fsica do som

    Ondas sonoras A frequncia da onda o nmero de comprimentos

    de onda por ciclo (normalmente um segundo)

    medida em Hertz (ondas por segundo)

    Quanto maior a frequncia maior o tom

    0 secs time 1 sec

    1 wave 2 waves

    2 Hz

    t

  • 8/7/2019 aula-audio

    17/61

    Representao do som

    Domnio do tempo Representao da variao da amplitude do

    sinal ao longo do tempo Domnio da frequncia

    Representao da amplitude das diferentesfrequncias do sinal num determinadoinstante

  • 8/7/2019 aula-audio

    18/61

    A fsica do somA forma como os humanos se apercebem do somcomo forte ou fraco depende no s da frequnciamas tambm da amplitude (intensidade).

    Limiar da audio(1% dos humanos)

    Maioria dos humanos(Limiar)

    Limiar da dor

    Voz Humana

    Frequncia Fundamental

  • 8/7/2019 aula-audio

    19/61

    A fsica do som

    A gama normal de audio humana entre 20Hze 20000Hz.

    Aqui esto vrias frequncias (0 dB) 60 Hz 440 Hz

    4000 Hz (-6dB: half power) (+6dB: double power)

    13000Hz 20000Hz

  • 8/7/2019 aula-audio

    20/61

    A fsica do som

    A percepo do som inclui trs aspectos: Intensidade (amplitude);

    Tom (frequncia); e, Timbre

    Porqu que o violino e o piano a tocar a mesmanota so to diferentes?

  • 8/7/2019 aula-audio

    21/61

    A fsica do som

    Timbre Definido vagamente como tom, cor, textura do

    som que permite ao crebro distinguir um tomde outro

    Afectado pelas propriedades acsticas doinstrumento e da sala

  • 8/7/2019 aula-audio

    22/61

    Timbre

    Formas de onda complexa so construdascombinando um certo nmero de formas de

    onda mais simples de diferentes amplitudese frequncias

    por esta razo que conseguimos perceber

    tons altos e baixos simultaneamente.

  • 8/7/2019 aula-audio

    23/61

    Timbre

    O som caracterstico duma forma de onda(produzido por um piano ou um violino) chamado o seu timbre.

    O timbre, tambm designado como a cor dumtom, considerado rico ou cheio se o som incluirmuitas frequncias.

    Um som duma onda sinusoidal consideradomontono por incluir apenas uma frequncia

  • 8/7/2019 aula-audio

    24/61

    Timbre

    As diferentes frequncias dum som,combinadas com as suas amplitudes

    variveis, constituem o contedo espectralda forma de onda.

    O contedo espectral (um termo maiscientfico para timbre) varia normalmentecom o tempo.

  • 8/7/2019 aula-audio

    25/61

    Timbre

    A variao das caractersticas espectrais como tempo para uma forma de onda a

    assinatura dum tom que permite a suadescrio com uma string.

  • 8/7/2019 aula-audio

    26/61

    Gravao e Reproduo Analgica

    Um microfone converte as mudanas depresso no ar em mudanas na tensoelctrica.

    Produz-se um sinal analgico. Se se comparar as mudanas de presso do

    ar e as mudanas de tenso elctrica so

    bastante similares .

  • 8/7/2019 aula-audio

    27/61

    Gravao e Reproduo Analgica

    Para gravar um som com ummicrofone, podemos envi-lo para

    uma fita magntica que podeguardar uma rplica do sinalanalgico.

  • 8/7/2019 aula-audio

    28/61

    Gravao e Reproduo Analgica

    Para reproduzir a sua gravao necessita dealgo que crie as diferenas de presso no ar deforma ao nosso ouvido poder interpret-lo

    como um som, isto um altifalante udio. Os altifalantes funcionam movendo um cone

    de uma posio para outra de forma

    consistente..

  • 8/7/2019 aula-audio

    29/61

    Gravao e Reproduo Analgica

    Para mover o cone para frente e para trs oaltifalante tem que ser alimentado por umacorrente elctrica

    Durante a reproduo, o gravador ou o gira-discos geram a corrente que alimenta umamplificador

    Quando ligada ao altifalante a corrente permitereproduzir as mudanas de presso sentidas pelomicrofone durante a gravao.

  • 8/7/2019 aula-audio

    30/61

    Gravao e Reproduo Analgica

    At recentemente o som era gravado emcomo um sinal analgico numa cassete de

    fita magntica ou num disco de vinil. Um problema com este tipo de gravao

    a dificuldade de gravar o sinal analgicosem adicionar rudo.

  • 8/7/2019 aula-audio

    31/61

    Gravao e Reproduo Analgica

    Quando se copia gravaes analgicas temque se converter a gravao magntica

    num sinal elctrico e tornar a gravar o queadiciona ainda mais rudo.

    A edio de som em fita linear.

  • 8/7/2019 aula-audio

    32/61

    Digitalizao do Som

    Quando se trabalha com audio digital hduas questes que precisam de resposta: Que qualidade necessria? Que dbito de dados pode ser tolerado?

    H 3 categoriais de udio digital : Alta fidelidade

    Comunicao telefnica Voz compactada

  • 8/7/2019 aula-audio

    33/61

    Digitalizao do Som

    udio Digital baseado em dois aspectos: Amostragem (tempo)

    Quantificao (nvel)

  • 8/7/2019 aula-audio

    34/61

    Amostragem

    O som natural analgico

    O som digital digital

    Para converso de analgico para digital necessria a amostragem

  • 8/7/2019 aula-audio

    35/61

    Amostragem

    Uma gravao analgica (ie fita magntica) baseadano registo da voltagem como padres de magnetizaonas partculas xidas da fita.

    Uma gravao digital converte as voltagens emnmeros binrios

  • 8/7/2019 aula-audio

    36/61

    Amostragem

    Uma onda analgica pode ser amostrada comum nmero de bits pr-determinado

    Isto chamado a resoluo em bits do sistema

    Quanto mais bits maior a clareza.

    8 bits correspondem a 256 nveis

    16 bits correspondem a 65,536nveis, etc..

    Ganham-se 6db por cada bit 8 bits 256 nveis = 48 dB, 16 bits 65,536

    nveis = 96 dB. Para determinar a gama

    dinmica de um sistema, multiplique a

    taxa de bits por 6.

  • 8/7/2019 aula-audio

    37/61

    Frequncia de amostragem

    A o ritmo de obteno de amostras dum ondaanalgica designada porfrequncia deamostragem

    o nmero de amostras obtidas por segundo.

    A frequncia de amostragem determina alargura de banda do sistema.

  • 8/7/2019 aula-audio

    38/61

    Frequncia de amostragem Quanto maior for a frequncia de amostragem

    maior a possibilidade de capturar as altasfrequncias.

  • 8/7/2019 aula-audio

    39/61

    Frequncia de amostragem Uma onda deve ser amostrada duas vezes para se obter

    uma verdadeira representao (Teoria de Nyquist)

    A frequncia de amostragem deve ser pelos menos odobro da mais alta frequncia do sinal

    Como a gama de audio humana varia de 20 Hz a 20kHz, uma frequncia de amostragem de 44.1 Khzsatisfaz teoricamente as necessidades de audio.

  • 8/7/2019 aula-audio

    40/61

    Frequncia de amostragem

    versus armazenamento Quando aumenta a frequncia deamostragem melhora a qualidade daamostra .

    Com o aumento da qualidade aumenta aquantidade de espao de armazenamentonecessrio.

    Uma velocidade de amostragem de 44.1 kHz comgravao de 16 bit usa aproximadamente 5Mb porminuto. (10Mb para stereo). NOTA: norma CD.

    A 22.05 kHz metade.

  • 8/7/2019 aula-audio

    41/61

    Exemplos de amostragem

    44.1kHz

    22.05kHz

    16kHz

    8kHz

    6Hz

    Msica de 35 Segundos

    Onda sonora gerada para estes 35 segundos.

  • 8/7/2019 aula-audio

    42/61

    udio de alta fidelidade

    O udio Digital apareceu com o CD (CompactLaser Disc)

    A superfcie dum CD virgem reflecte (espelhada)

    A informao digital armazenada como buracosna superfcie.

    Os dados so armazenados com uma nica pistaem espiral desde o interior para fora. Leitura a

    1.2 m/s. Dados armazenados a 1 Mbit/mm2

  • 8/7/2019 aula-audio

    43/61

  • 8/7/2019 aula-audio

    44/61

    Mtodos Simples de

    Compresso Compresso de silncios Adaptative Diferential Pulse Code

    Modulation (ADPCM) CTTITT G.721 --- 16 or 32 Kbits/sec.

    Linear Predictive Coding (LPC)

    Code Excited Linear Predictor (CELP)

  • 8/7/2019 aula-audio

    45/61

    Modelo Psico-Acstico

    Audio e Voz Humana

    Sensibilidade da Audio humana

    Limiar da Audio Dissimulao na Frequncia

    Dissimulao no Tempo

  • 8/7/2019 aula-audio

    46/61

    Limiar da Frequncia

    Experincia :Uma pessoa num quarto em silncio. Aumente a intensidade

    dum tom de 1 Khz at ele se tornar audvel. Varia afrequncia e v registando

    2 4 6 8 10 12 14 16

    0

    10

    20

    30

    40

    bB

    Frequency (KHz)

  • 8/7/2019 aula-audio

    47/61

    Dissimulao na Frequncia

    Experincia:Coloque um tom a 1 kHz (tom para dissimulao) com uma

    amplitude fixa (60 dB). Coloque o tom de teste numa

    frequncia (1.1 kHz) e aumente a sua intensidade at sepoder distinguir. Varia a frequncia do tom de teste ecoloque o valor de limiar de audio.

  • 8/7/2019 aula-audio

    48/61

    Frequency Masking (Contd.) Repeat previous experiment for various frequencies of

    masking tones

  • 8/7/2019 aula-audio

    49/61

    Temporal Masking Se ouvirmos um som e o pararmos demora tempo

    at podermos ouvir um tom prximo na frequncia.

    Enuncie a experincia a realizar

  • 8/7/2019 aula-audio

    50/61

    Efeito total da dissimulao:

  • 8/7/2019 aula-audio

    51/61

    MPEGAudio

    As duas tcnicas avanadas de codificao udioso baseadas em Codificao de sub-banda (SBC)

    Codificao de Transformada Adaptativa A codificao MPEG de Audio

    Tem trs camadas independentes de compresso udio Cada um tem o seu codificador SBC

    Correspondncia entre Tempo e Frequncia Modelo Psico-Acstico Quatificador

  • 8/7/2019 aula-audio

    52/61

    MPEG Audio

    Camada 1 usa codificao de sub-banda

    Camada 2 usa codificao de sub-banda com quadrosmaiores e maior nvel de compresso

    Camada 3

    Usa tanto codificao de sub-banda como detransformada

  • 8/7/2019 aula-audio

    53/61

    MPEG MPEG-1 Audio

    Est concebido para tomar um sinal udio de entradaem PCM e dependendo da camada

    Amostr-lo a 32, 44.1 ou 48 kHz

    Codific-lo de 32 a 192 Kbps por canal udio

    MPEG-1 dbito 1.5 Mbit/seg para udio e vdeo

    1.2 para vdeo e 0.3 para udio Audio CD no compactado tem 44,100 amostras por

    segundo*16 bits/amostra * 2 canais > 1.4 Mbits/seg

    Factor de Compresso 2,7 a 24

  • 8/7/2019 aula-audio

    54/61

    MPEG Com compresso 6:1

    Amostragem a 48 KHz de 16 bits stereo reduzidas a 256 Kbits/seg Sob condies tptimas de audio, ouvintes experimentados no

    conseguem distinguir o clip original e codificado

    Suporta um ou dois canais de udio num dos seguintesmodos1. Monofnico um simples canal de udio

    2. Monofnico dual 2 canais independentes por ex. Portugus eIngls

    3. Stereo para 2 canais stereo que partilham bits mas no usam uma

    codificao stereo conjunta4. Juno stereo- tira partido da correlao entre os dois canais

  • 8/7/2019 aula-audio

    55/61

    Algoritmo de Codificao MPEG

    Filter intoCritical Bands

    (Sub-band filtering

    ComputeMasking

    (PsychoacousticModel)

    Allocate bits(Quantization)

    FormatBitStream

    InputOutput

  • 8/7/2019 aula-audio

    56/61

    Exemplo de Masking e Quantificao

    Banda 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

    Nvel 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1

  • 8/7/2019 aula-audio

    57/61

    MPEG Coding Specifics

    AudioSamples

    Sub-bandfilter 0

    Sub-bandfilter 1

    Sub-bandfilter 2

    Sub-bandfilter 31

    .

    .

    .

    12samples

    12samples

    12samples

    12samples

    12samples

    12samples

    Layer IFrame

    Layer II, IIIFrame

    .

    .

    .

    .

    .

    .

  • 8/7/2019 aula-audio

    58/61

    Especificidades da codificao MPEG

    Camada 1 do MPEG O filtro aplicado um quadro (12x32 = 384 amostras) de cada vez.

    A 48 kHz, cada quadro contm 8ms de som.

    Usa a FFT com 512 pontos para obter uma informao espectral

    detalhada do sinal (filtro de sub-banda). Usa uma faixa defrequncia igual em cada banda.

    Modelo psico-acstico usa apenas o masking na frequncia.

    Aplicaes tpicas Gravao digital em tapes, discos que podem suportar um dbito alto.

    Melhor qualidade conseguida com dbito de 384kbps.

  • 8/7/2019 aula-audio

    59/61

    Especificidades da codificao MPEG

    Camada 2 do MPEG Usa 3 quadros no filtro (anterior, actual e seguinte com um total

    de 1152 amostras). A 48 kHz, cada quadro transporta 24 ms desom.

    Modela um pouco o masking temporal.

    Usa a FTT com 1024-pontos para uma melhor resoluo nafrequncia. Usa uma faixa de frequncia idntica em cada banda.

    Maior qualidade conseguida com um dbito de 256 k bps.

    Aplicaes tpicas Difuso udio, TV, Gravao profissional e Multimedia

  • 8/7/2019 aula-audio

    60/61

    Especificidades da codificao MPEG

    MPEG Layer III Usa melhores filtros nas bandas crticas

    No usa sub-bandas iguais Uses non-equal frequency bands

    O modelo psico-acstico Inclui efeitos de dissimulao temporal

    Tira partido da redundncia steero

    Codificador de Huffman

  • 8/7/2019 aula-audio

    61/61

    Especificidades da codificao MPEG

    MPEGCamada 3

    Codificao da Redundncia Stereo

    Codificao da intensidade stereo --- nos canais de frequnciasuperior codificar a soma dos sinais da direita e esquerda em vez

    de os considerar de forma independente. Codificao Stereo Middle/Side codificar a soma e a subtrao

    dos sinais da esquerda e da direita