Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la...

Post on 13-Mar-2021

9 views 0 download

Transcript of Técnicas de predicción lineal - aholab...Técnicas de predicción lineal Tratamiento digital de la...

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 1

Técnicas de predicción Técnicas de predicción lineallineal

Curso de doctorado 2001/2002Inmaculada Hernáezinma@bips.bi.ehu.es

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 2

Técnicas de predicción lineal

Análisis LPCDescripciónCálculo de los coeficientesCoeficientes PARCORPotencia del análisis LPC: ejemplos

Vocoder LPC

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 3

Análisis LPCEl análisis LPC permite representar la señal de voz y las características espectrales de forma precisa y eficiente, mediante muy pocos parámetros obtenidos mediante cálculos sencillos.Definición:Sean {s(n)} las muestras de la señal de voz tomadas cada Ts seg. Ts<1/2W, W: frecuencia máxima de la señal.Formamos una combinación lineal de P+1 muestras.

s(n)+a1·s(n-1)+a2·s(n-2)+…+ap·s(n-p)=e(n)Si{e(n)}es una variable aleatoria estadísticamente incorrelada, con media cero y varianza σ2 la muestra actual s(n) puede ser linealmente predicha, utilizando p muestras anteriores.El valor predicho:

∑=

−⋅−=p

ii insans

1)()(ˆ

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 4

Análisis LPCFiltro predictor P(z): ∑

=

−⋅−=p

ii insans

1)()(ˆ

∑=

− ⋅⋅−=p

i

ii zSzazS

1)()(ˆ ∑

=

−−=p

i

ii zazP

1

·)(

P(z))(ns )(ˆ ns

Error de predicción

P(z)

)(ns

)(ˆ ns

)(ne+_

A(z)

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 5

Análisis LPC

P(z)

)(ns

)(ˆ ns

)(neH(z)=1/A(z)

∑=

−−=p

i

ii zazP

1·)(

Síntesis LPC:

H(z): estimación de la respuesta del tracto vocal

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 6

Ejemplos análisis LPC

H(ω)

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 7

Ejemplos análisis LPC

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 8

Cálculo de los coeficientes LPC

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 9

Cálculo de los coeficientes LPCMétodo de las autocorrelaciones

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 10

Cálculo de los coeficientes LPC

La matriz [R] es Toepliz: es simétrica, y todos los elementos en las diagonales paralelas a la diagonal principal son iguales. El ‘método de Durbin’ para la resolución de las ecuaciones aprovecha estas propiedades de la la matriz [R].Como s(n)=0 para n<0 y n>N-1, e(n) será grande en 0<n<p pues estamos basando la predicción en muestras que han sido puestas a cero. Lo mismo ocurrirá en el intervalo final N<n<N+p-1. Para disminuir este efecto, se realiza el enventanado de la señal.

ω(n)

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 11

Cálculo de los coeficientes LPCMétodo de las covarianzas

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 12

Algoritmo de Levinson-Durbin

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 13

Análisis PARCOR

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 14

Análisis PARCOR

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 15

Análisis PARCOR

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 16

Análisis PARCOR

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 17

Análisis LPC

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 18

Análisis LPC

¿Cómo suena el residuo?

P(z)P(z)

)(ns

)(ˆ ns

)(ne+_

A(z)

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 19

Análisis LPC

Seña

l ori

gina

l

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 20

Análisis LPC

Resi

duo

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 21

Potencia del análisis LPC: ejemplos

∑=

−−=p

k

kk zazP

1·)(

P(z)P(z)

)(ny

)(ˆ ny

Análisis LPCAnálisis LPC…{ak,Gi}i {ak,Gi}i +1…)(ny

)(nx

Gi

a) Ruido blanco, G=100%>

b) Ruido blanco, G=50%

c) Tren de deltas G=100%

d) Tren de deltas G=50%

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 22

Técnicas de predicción lineal

Análisis LPCDescripciónCálculo de los coeficientesCoeficientes PARCORPotencia del análisis LPC: ejemplos

Vocoder LPC

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 23

Vocoder LPC

Modelo de producción de voz:

GENERADORde PULSOS

PULSOGLOTALG(z)

GENERADORde RUIDO

x

x

TRACTOVOCALV(z)

RADIACIÓNLABIOSR(z)F0

AV

AUCOEFICIENTES

REFLEXIÓN

s(n)

EXCITACIÓNSONORA

EXCITACIÓNSORDA

GENERADORde

EXCITACIONES

TRACTOVOCALH(z)

u(n)

G(z) V(z) R(z)

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 24

Vocoder LPCSimplificación de la excitación en la síntesis:

Tren de impulsos periódicos en los segmentos sonorosRuido gaussianoblanco en los segmentos sordosMantenimiento de la potencia del residuo en la nueva excitación sintética.Ejemplos:

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 25

Decodificador/Codificador LPC

P(z)

+

H(z)x

ANÁLISISLPC

P(z)

- ANÁLISIS-PITCH-U/V

G

CoeficientesReflexión

G

V

U

F0)(nr

)(ˆ ns

)(ns

)(ns

1/F0

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 26

Vocoder LPC10E/FS1015

54 bits/trama

Pitch + U/V->7bitsG->5bitsK1 a K4->5bitsK5 a K8-> 4bitsK9->3bitsK10->2bits

Fs= 8000muestras/s54bits/trama180muestras/trama(22.5ms/trama)

2400bits/seg

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 27

Vocoder LPC10E

Ejemplos:Señal OriginalSeñal transcodificada LPC10E Señal transcodificada LPC10E

(transmisión radio vía satélite)

Características:Nasalidad: modelo todo-polosExcitación sonora simple (tren de impulsos): buzzingTamaño de trama: problemas con las transiciones rápidas (p, t, k…)

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 28

Vocoder LPC10E

En esta gráfica podemos observar la incapacidad del codificador para reproducir elementos de transición rápida (tales como las explosiones de las oclusivas p t k). Lógicamente, este codificador no mantiene la forma de onda de la señal original, ya que el proceso de codificación se fija únicamente en minimizar el error en el módulo de la envolvente espectral.

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 29

Variantes del Vocoder LPC

Gran cantidad de variantes cuyo fin era mejorar la calidad, transmitiendo más información en la señal de excitaciónExcitaciones mixtas pulsos+ruido en diferentes bandas y con diferentes pesos.Sustitución de la delta por un pulso ligeramente más complejoLPC excitado por voz o por resíduo:

Intenta mejorar la calidad de la excitaci`´on, eliminando la detección sordo/sonoro y la estimación del valor del pitchLa excitación es filtrada paso-bajo (fc=800Hz), y se transmite con muy pocos bits. Se utiliza para la reconstrucción ene l receptor.Requiere velocidades de transmisión superiores al LPC10E

Todas las mejoras posteriores se orientaron a mejorar la excitación transmitida (el predictor permanece prácticamente inalterado en todos los esquemas propuestos).

Técnicas de predicción lineal

Tratamiento digital de la señal de voz 30

BibliografíaJ. Makhoul; Linear Prediction: A tutorial review Proc. of the IEEE, April1975 Andreas S. Spanias; Speech Coding: A Tutorial Review Proc. of the IEEE, Vol. 82, no10, October 1994Bishnu S. Atal; Speech Analysis and synthesis by Linear Prediction of the Speech Wave J. Acoust. Soc. Am. Vol.55, pp. 637-655, Aug. 1971Tremain, T.; The government standard linear predictive coding algorithm: LPC-10 Speech Techno1ogy Magazine, April 1982, pp.40-40 J. Campbell and T .E. Tremain; Voiced/unvoiced classification of speech with applications of the W.S. Government LPC-10e algorithm Proc.IEEEInt. Conf. ASSP1986 pp.473-476V. Welch and T. Tremain; A new government standard 2400 bps speech coder IEEE Workshop on Speech Coding for Telecommunicacions, pp. 1626-1640, Oct. 1993Bishnu S. Atal Predictive Coding of Speech at Low Bit RatesIEEE Transactions on Communications, Vol COM-30. no4, April l982, pp. 600-614