aula-audio
-
Upload
andre-santos -
Category
Documents
-
view
221 -
download
0
Transcript of aula-audio
-
8/7/2019 aula-audio
1/61
Fundamentos de udio
Sistemas Telemticos
Ano Lectivo 2002/2003LESI
Grupo de Comunicaes por Computador
-
8/7/2019 aula-audio
2/61
Sumrio
Sistema de Audio Humana
Fsica do Som
Gravao e Reproduo Analgica Sim Digital
Compresso udio Mtodos de compresso simples MPEG
-
8/7/2019 aula-audio
3/61
Materias utilizados
Dr. Ze-Nian Lis course material at:http://www.cs.sfu.ca/CourseCentral/365/li/
MPEG Audio:http://www.mpeg.org/MPEG/audio.html
-
8/7/2019 aula-audio
4/61
-
8/7/2019 aula-audio
5/61
A fsica do Som
Audio Humana O nosso sistemaauditivo converteenergia sonora em
energia mecnica paraum impulso nevorso que transmitido para ocerbro.
O ouvido tem trspartes: externa, mdia einterna.
-
8/7/2019 aula-audio
6/61
A fsica do Som
Audio humanaO ouvido externoO ouvido externo
O ouvido externo compreende opavilho auricular e o meato acsticoexterno. O pavilho capta os sons,tendo papel importante na localizaoespacial da fonte sonora,
extremamente importante paraouvirmos em ambientes ruidosos. Omeato acstico externo conduz ossons at a membrana timpnica.
-
8/7/2019 aula-audio
7/61
A fsica do som
Audio humanaOuvido internoOuvido interno
Serve para transformar aenergia sonora emvibraes internas doestrutura ssea da orelhamdia
As vibraes sotransformadas em ondasde compresso
-
8/7/2019 aula-audio
8/61
A fsica do som
Audio Humana O ouvido mdio compreende a
membrana timpnica, a cadeia deossculos (martelo ,bigorna e estribo) e
os espaos areos do osso temporal,particularmente o antro mastide e asclulas mastideas adjacentes.
O ouvido mdio desempenha o papel
de um transformador, que evita aperda de energia das ondas sonoras aopassar de um meio gasoso (ar) a ummeio lquido (a perilinfa da orelha
interna).
-
8/7/2019 aula-audio
9/61
A fsica do som
Audio HumanaO ouvido internoO ouvido interno
Serve para transformar aenergia da onda decompresso num fludointerno do ouvido emimplusos do nervo no
fludo interno quepodem ser transmitidoao crebro
-
8/7/2019 aula-audio
10/61
Efeito de dissimulao
Quando um som forte numa determinadafrequncia estimula os pelos da cclea
As frequncias prximas no so ouvidas casosejam menos significativas (de menoramplitude)
Apesar do nosso ouvido captar uma certa
amplitude de frequncias, parte delas no soprocessados por causa do processo de masking
-
8/7/2019 aula-audio
11/61
Termos e Conceitos bsicosNo mbito do nosso sistema de audio
Sensibilidade s frequncias Mais sensveis de 1-3 KHz
Directividade De onde nos chega determinado som?
0.2-3kHz
Dissimulao (masking) temporal Tambm acontece no domnio dos tempos
-
8/7/2019 aula-audio
12/61
A fsica do som
Ondas sonoras Uma onda mecnica uma perturbao que
viaja atravs dum meio transportando energiadum local para outro.
-
8/7/2019 aula-audio
13/61
A fsica do som
Ondas sonoras Uma onda produz reas de alta e baixa presso
Quando a onda de alta presso atinge o timpano ele
move-se para dentro Quando a onda de baixa presso atinge o timpano ele
move-se para fora.
-
8/7/2019 aula-audio
14/61
A fsica do som Ondas sonoras
A amplitude o mximo deslocamentopositivo.
Quanto maior a amplitude mais alto som medido em decibis (db)
-
8/7/2019 aula-audio
15/61
A fsica do som
Ondas sonoras O comprimento de onda (wavelength) a
distncia entre dois pontos adjacentes na onda
-
8/7/2019 aula-audio
16/61
A fsica do som
Ondas sonoras A frequncia da onda o nmero de comprimentos
de onda por ciclo (normalmente um segundo)
medida em Hertz (ondas por segundo)
Quanto maior a frequncia maior o tom
0 secs time 1 sec
1 wave 2 waves
2 Hz
t
-
8/7/2019 aula-audio
17/61
Representao do som
Domnio do tempo Representao da variao da amplitude do
sinal ao longo do tempo Domnio da frequncia
Representao da amplitude das diferentesfrequncias do sinal num determinadoinstante
-
8/7/2019 aula-audio
18/61
A fsica do somA forma como os humanos se apercebem do somcomo forte ou fraco depende no s da frequnciamas tambm da amplitude (intensidade).
Limiar da audio(1% dos humanos)
Maioria dos humanos(Limiar)
Limiar da dor
Voz Humana
Frequncia Fundamental
-
8/7/2019 aula-audio
19/61
A fsica do som
A gama normal de audio humana entre 20Hze 20000Hz.
Aqui esto vrias frequncias (0 dB) 60 Hz 440 Hz
4000 Hz (-6dB: half power) (+6dB: double power)
13000Hz 20000Hz
-
8/7/2019 aula-audio
20/61
A fsica do som
A percepo do som inclui trs aspectos: Intensidade (amplitude);
Tom (frequncia); e, Timbre
Porqu que o violino e o piano a tocar a mesmanota so to diferentes?
-
8/7/2019 aula-audio
21/61
A fsica do som
Timbre Definido vagamente como tom, cor, textura do
som que permite ao crebro distinguir um tomde outro
Afectado pelas propriedades acsticas doinstrumento e da sala
-
8/7/2019 aula-audio
22/61
Timbre
Formas de onda complexa so construdascombinando um certo nmero de formas de
onda mais simples de diferentes amplitudese frequncias
por esta razo que conseguimos perceber
tons altos e baixos simultaneamente.
-
8/7/2019 aula-audio
23/61
Timbre
O som caracterstico duma forma de onda(produzido por um piano ou um violino) chamado o seu timbre.
O timbre, tambm designado como a cor dumtom, considerado rico ou cheio se o som incluirmuitas frequncias.
Um som duma onda sinusoidal consideradomontono por incluir apenas uma frequncia
-
8/7/2019 aula-audio
24/61
Timbre
As diferentes frequncias dum som,combinadas com as suas amplitudes
variveis, constituem o contedo espectralda forma de onda.
O contedo espectral (um termo maiscientfico para timbre) varia normalmentecom o tempo.
-
8/7/2019 aula-audio
25/61
Timbre
A variao das caractersticas espectrais como tempo para uma forma de onda a
assinatura dum tom que permite a suadescrio com uma string.
-
8/7/2019 aula-audio
26/61
Gravao e Reproduo Analgica
Um microfone converte as mudanas depresso no ar em mudanas na tensoelctrica.
Produz-se um sinal analgico. Se se comparar as mudanas de presso do
ar e as mudanas de tenso elctrica so
bastante similares .
-
8/7/2019 aula-audio
27/61
Gravao e Reproduo Analgica
Para gravar um som com ummicrofone, podemos envi-lo para
uma fita magntica que podeguardar uma rplica do sinalanalgico.
-
8/7/2019 aula-audio
28/61
Gravao e Reproduo Analgica
Para reproduzir a sua gravao necessita dealgo que crie as diferenas de presso no ar deforma ao nosso ouvido poder interpret-lo
como um som, isto um altifalante udio. Os altifalantes funcionam movendo um cone
de uma posio para outra de forma
consistente..
-
8/7/2019 aula-audio
29/61
Gravao e Reproduo Analgica
Para mover o cone para frente e para trs oaltifalante tem que ser alimentado por umacorrente elctrica
Durante a reproduo, o gravador ou o gira-discos geram a corrente que alimenta umamplificador
Quando ligada ao altifalante a corrente permitereproduzir as mudanas de presso sentidas pelomicrofone durante a gravao.
-
8/7/2019 aula-audio
30/61
Gravao e Reproduo Analgica
At recentemente o som era gravado emcomo um sinal analgico numa cassete de
fita magntica ou num disco de vinil. Um problema com este tipo de gravao
a dificuldade de gravar o sinal analgicosem adicionar rudo.
-
8/7/2019 aula-audio
31/61
Gravao e Reproduo Analgica
Quando se copia gravaes analgicas temque se converter a gravao magntica
num sinal elctrico e tornar a gravar o queadiciona ainda mais rudo.
A edio de som em fita linear.
-
8/7/2019 aula-audio
32/61
Digitalizao do Som
Quando se trabalha com audio digital hduas questes que precisam de resposta: Que qualidade necessria? Que dbito de dados pode ser tolerado?
H 3 categoriais de udio digital : Alta fidelidade
Comunicao telefnica Voz compactada
-
8/7/2019 aula-audio
33/61
Digitalizao do Som
udio Digital baseado em dois aspectos: Amostragem (tempo)
Quantificao (nvel)
-
8/7/2019 aula-audio
34/61
Amostragem
O som natural analgico
O som digital digital
Para converso de analgico para digital necessria a amostragem
-
8/7/2019 aula-audio
35/61
Amostragem
Uma gravao analgica (ie fita magntica) baseadano registo da voltagem como padres de magnetizaonas partculas xidas da fita.
Uma gravao digital converte as voltagens emnmeros binrios
-
8/7/2019 aula-audio
36/61
Amostragem
Uma onda analgica pode ser amostrada comum nmero de bits pr-determinado
Isto chamado a resoluo em bits do sistema
Quanto mais bits maior a clareza.
8 bits correspondem a 256 nveis
16 bits correspondem a 65,536nveis, etc..
Ganham-se 6db por cada bit 8 bits 256 nveis = 48 dB, 16 bits 65,536
nveis = 96 dB. Para determinar a gama
dinmica de um sistema, multiplique a
taxa de bits por 6.
-
8/7/2019 aula-audio
37/61
Frequncia de amostragem
A o ritmo de obteno de amostras dum ondaanalgica designada porfrequncia deamostragem
o nmero de amostras obtidas por segundo.
A frequncia de amostragem determina alargura de banda do sistema.
-
8/7/2019 aula-audio
38/61
Frequncia de amostragem Quanto maior for a frequncia de amostragem
maior a possibilidade de capturar as altasfrequncias.
-
8/7/2019 aula-audio
39/61
Frequncia de amostragem Uma onda deve ser amostrada duas vezes para se obter
uma verdadeira representao (Teoria de Nyquist)
A frequncia de amostragem deve ser pelos menos odobro da mais alta frequncia do sinal
Como a gama de audio humana varia de 20 Hz a 20kHz, uma frequncia de amostragem de 44.1 Khzsatisfaz teoricamente as necessidades de audio.
-
8/7/2019 aula-audio
40/61
Frequncia de amostragem
versus armazenamento Quando aumenta a frequncia deamostragem melhora a qualidade daamostra .
Com o aumento da qualidade aumenta aquantidade de espao de armazenamentonecessrio.
Uma velocidade de amostragem de 44.1 kHz comgravao de 16 bit usa aproximadamente 5Mb porminuto. (10Mb para stereo). NOTA: norma CD.
A 22.05 kHz metade.
-
8/7/2019 aula-audio
41/61
Exemplos de amostragem
44.1kHz
22.05kHz
16kHz
8kHz
6Hz
Msica de 35 Segundos
Onda sonora gerada para estes 35 segundos.
-
8/7/2019 aula-audio
42/61
udio de alta fidelidade
O udio Digital apareceu com o CD (CompactLaser Disc)
A superfcie dum CD virgem reflecte (espelhada)
A informao digital armazenada como buracosna superfcie.
Os dados so armazenados com uma nica pistaem espiral desde o interior para fora. Leitura a
1.2 m/s. Dados armazenados a 1 Mbit/mm2
-
8/7/2019 aula-audio
43/61
-
8/7/2019 aula-audio
44/61
Mtodos Simples de
Compresso Compresso de silncios Adaptative Diferential Pulse Code
Modulation (ADPCM) CTTITT G.721 --- 16 or 32 Kbits/sec.
Linear Predictive Coding (LPC)
Code Excited Linear Predictor (CELP)
-
8/7/2019 aula-audio
45/61
Modelo Psico-Acstico
Audio e Voz Humana
Sensibilidade da Audio humana
Limiar da Audio Dissimulao na Frequncia
Dissimulao no Tempo
-
8/7/2019 aula-audio
46/61
Limiar da Frequncia
Experincia :Uma pessoa num quarto em silncio. Aumente a intensidade
dum tom de 1 Khz at ele se tornar audvel. Varia afrequncia e v registando
2 4 6 8 10 12 14 16
0
10
20
30
40
bB
Frequency (KHz)
-
8/7/2019 aula-audio
47/61
Dissimulao na Frequncia
Experincia:Coloque um tom a 1 kHz (tom para dissimulao) com uma
amplitude fixa (60 dB). Coloque o tom de teste numa
frequncia (1.1 kHz) e aumente a sua intensidade at sepoder distinguir. Varia a frequncia do tom de teste ecoloque o valor de limiar de audio.
-
8/7/2019 aula-audio
48/61
Frequency Masking (Contd.) Repeat previous experiment for various frequencies of
masking tones
-
8/7/2019 aula-audio
49/61
Temporal Masking Se ouvirmos um som e o pararmos demora tempo
at podermos ouvir um tom prximo na frequncia.
Enuncie a experincia a realizar
-
8/7/2019 aula-audio
50/61
Efeito total da dissimulao:
-
8/7/2019 aula-audio
51/61
MPEGAudio
As duas tcnicas avanadas de codificao udioso baseadas em Codificao de sub-banda (SBC)
Codificao de Transformada Adaptativa A codificao MPEG de Audio
Tem trs camadas independentes de compresso udio Cada um tem o seu codificador SBC
Correspondncia entre Tempo e Frequncia Modelo Psico-Acstico Quatificador
-
8/7/2019 aula-audio
52/61
MPEG Audio
Camada 1 usa codificao de sub-banda
Camada 2 usa codificao de sub-banda com quadrosmaiores e maior nvel de compresso
Camada 3
Usa tanto codificao de sub-banda como detransformada
-
8/7/2019 aula-audio
53/61
MPEG MPEG-1 Audio
Est concebido para tomar um sinal udio de entradaem PCM e dependendo da camada
Amostr-lo a 32, 44.1 ou 48 kHz
Codific-lo de 32 a 192 Kbps por canal udio
MPEG-1 dbito 1.5 Mbit/seg para udio e vdeo
1.2 para vdeo e 0.3 para udio Audio CD no compactado tem 44,100 amostras por
segundo*16 bits/amostra * 2 canais > 1.4 Mbits/seg
Factor de Compresso 2,7 a 24
-
8/7/2019 aula-audio
54/61
MPEG Com compresso 6:1
Amostragem a 48 KHz de 16 bits stereo reduzidas a 256 Kbits/seg Sob condies tptimas de audio, ouvintes experimentados no
conseguem distinguir o clip original e codificado
Suporta um ou dois canais de udio num dos seguintesmodos1. Monofnico um simples canal de udio
2. Monofnico dual 2 canais independentes por ex. Portugus eIngls
3. Stereo para 2 canais stereo que partilham bits mas no usam uma
codificao stereo conjunta4. Juno stereo- tira partido da correlao entre os dois canais
-
8/7/2019 aula-audio
55/61
Algoritmo de Codificao MPEG
Filter intoCritical Bands
(Sub-band filtering
ComputeMasking
(PsychoacousticModel)
Allocate bits(Quantization)
FormatBitStream
InputOutput
-
8/7/2019 aula-audio
56/61
Exemplo de Masking e Quantificao
Banda 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Nvel 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1
-
8/7/2019 aula-audio
57/61
MPEG Coding Specifics
AudioSamples
Sub-bandfilter 0
Sub-bandfilter 1
Sub-bandfilter 2
Sub-bandfilter 31
.
.
.
12samples
12samples
12samples
12samples
12samples
12samples
Layer IFrame
Layer II, IIIFrame
.
.
.
.
.
.
-
8/7/2019 aula-audio
58/61
Especificidades da codificao MPEG
Camada 1 do MPEG O filtro aplicado um quadro (12x32 = 384 amostras) de cada vez.
A 48 kHz, cada quadro contm 8ms de som.
Usa a FFT com 512 pontos para obter uma informao espectral
detalhada do sinal (filtro de sub-banda). Usa uma faixa defrequncia igual em cada banda.
Modelo psico-acstico usa apenas o masking na frequncia.
Aplicaes tpicas Gravao digital em tapes, discos que podem suportar um dbito alto.
Melhor qualidade conseguida com dbito de 384kbps.
-
8/7/2019 aula-audio
59/61
Especificidades da codificao MPEG
Camada 2 do MPEG Usa 3 quadros no filtro (anterior, actual e seguinte com um total
de 1152 amostras). A 48 kHz, cada quadro transporta 24 ms desom.
Modela um pouco o masking temporal.
Usa a FTT com 1024-pontos para uma melhor resoluo nafrequncia. Usa uma faixa de frequncia idntica em cada banda.
Maior qualidade conseguida com um dbito de 256 k bps.
Aplicaes tpicas Difuso udio, TV, Gravao profissional e Multimedia
-
8/7/2019 aula-audio
60/61
Especificidades da codificao MPEG
MPEG Layer III Usa melhores filtros nas bandas crticas
No usa sub-bandas iguais Uses non-equal frequency bands
O modelo psico-acstico Inclui efeitos de dissimulao temporal
Tira partido da redundncia steero
Codificador de Huffman
-
8/7/2019 aula-audio
61/61
Especificidades da codificao MPEG
MPEGCamada 3
Codificao da Redundncia Stereo
Codificao da intensidade stereo --- nos canais de frequnciasuperior codificar a soma dos sinais da direita e esquerda em vez
de os considerar de forma independente. Codificao Stereo Middle/Side codificar a soma e a subtrao
dos sinais da esquerda e da direita