Técnicas de predicción lineal
Tratamiento digital de la señal de voz 1
Técnicas de predicción Técnicas de predicción lineallineal
Curso de doctorado 2001/2002Inmaculada Herná[email protected]
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 2
Técnicas de predicción lineal
Análisis LPCDescripciónCálculo de los coeficientesCoeficientes PARCORPotencia del análisis LPC: ejemplos
Vocoder LPC
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 3
Análisis LPCEl análisis LPC permite representar la señal de voz y las características espectrales de forma precisa y eficiente, mediante muy pocos parámetros obtenidos mediante cálculos sencillos.Definición:Sean {s(n)} las muestras de la señal de voz tomadas cada Ts seg. Ts<1/2W, W: frecuencia máxima de la señal.Formamos una combinación lineal de P+1 muestras.
s(n)+a1·s(n-1)+a2·s(n-2)+…+ap·s(n-p)=e(n)Si{e(n)}es una variable aleatoria estadísticamente incorrelada, con media cero y varianza σ2 la muestra actual s(n) puede ser linealmente predicha, utilizando p muestras anteriores.El valor predicho:
∑=
−⋅−=p
ii insans
1)()(ˆ
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 4
Análisis LPCFiltro predictor P(z): ∑
=
−⋅−=p
ii insans
1)()(ˆ
∑=
− ⋅⋅−=p
i
ii zSzazS
1)()(ˆ ∑
=
−−=p
i
ii zazP
1
·)(
P(z))(ns )(ˆ ns
Error de predicción
P(z)
)(ns
)(ˆ ns
)(ne+_
A(z)
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 5
Análisis LPC
P(z)
)(ns
)(ˆ ns
)(neH(z)=1/A(z)
∑=
−−=p
i
ii zazP
1·)(
Síntesis LPC:
H(z): estimación de la respuesta del tracto vocal
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 6
Ejemplos análisis LPC
H(ω)
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 7
Ejemplos análisis LPC
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 8
Cálculo de los coeficientes LPC
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 9
Cálculo de los coeficientes LPCMétodo de las autocorrelaciones
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 10
Cálculo de los coeficientes LPC
La matriz [R] es Toepliz: es simétrica, y todos los elementos en las diagonales paralelas a la diagonal principal son iguales. El ‘método de Durbin’ para la resolución de las ecuaciones aprovecha estas propiedades de la la matriz [R].Como s(n)=0 para n<0 y n>N-1, e(n) será grande en 0<n<p pues estamos basando la predicción en muestras que han sido puestas a cero. Lo mismo ocurrirá en el intervalo final N<n<N+p-1. Para disminuir este efecto, se realiza el enventanado de la señal.
ω(n)
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 11
Cálculo de los coeficientes LPCMétodo de las covarianzas
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 12
Algoritmo de Levinson-Durbin
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 13
Análisis PARCOR
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 14
Análisis PARCOR
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 15
Análisis PARCOR
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 16
Análisis PARCOR
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 17
Análisis LPC
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 18
Análisis LPC
¿Cómo suena el residuo?
P(z)P(z)
)(ns
)(ˆ ns
)(ne+_
A(z)
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 19
Análisis LPC
Seña
l ori
gina
l
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 20
Análisis LPC
Resi
duo
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 21
Potencia del análisis LPC: ejemplos
∑=
−−=p
k
kk zazP
1·)(
P(z)P(z)
)(ny
)(ˆ ny
Análisis LPCAnálisis LPC…{ak,Gi}i {ak,Gi}i +1…)(ny
)(nx
Gi
a) Ruido blanco, G=100%>
b) Ruido blanco, G=50%
c) Tren de deltas G=100%
d) Tren de deltas G=50%
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 22
Técnicas de predicción lineal
Análisis LPCDescripciónCálculo de los coeficientesCoeficientes PARCORPotencia del análisis LPC: ejemplos
Vocoder LPC
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 23
Vocoder LPC
Modelo de producción de voz:
GENERADORde PULSOS
PULSOGLOTALG(z)
GENERADORde RUIDO
x
x
TRACTOVOCALV(z)
RADIACIÓNLABIOSR(z)F0
AV
AUCOEFICIENTES
REFLEXIÓN
s(n)
EXCITACIÓNSONORA
EXCITACIÓNSORDA
GENERADORde
EXCITACIONES
TRACTOVOCALH(z)
u(n)
G(z) V(z) R(z)
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 24
Vocoder LPCSimplificación de la excitación en la síntesis:
Tren de impulsos periódicos en los segmentos sonorosRuido gaussianoblanco en los segmentos sordosMantenimiento de la potencia del residuo en la nueva excitación sintética.Ejemplos:
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 25
Decodificador/Codificador LPC
P(z)
+
H(z)x
ANÁLISISLPC
P(z)
- ANÁLISIS-PITCH-U/V
G
CoeficientesReflexión
G
V
U
F0)(nr
)(ˆ ns
)(ns
)(ns
1/F0
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 26
Vocoder LPC10E/FS1015
54 bits/trama
Pitch + U/V->7bitsG->5bitsK1 a K4->5bitsK5 a K8-> 4bitsK9->3bitsK10->2bits
Fs= 8000muestras/s54bits/trama180muestras/trama(22.5ms/trama)
2400bits/seg
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 27
Vocoder LPC10E
Ejemplos:Señal OriginalSeñal transcodificada LPC10E Señal transcodificada LPC10E
(transmisión radio vía satélite)
Características:Nasalidad: modelo todo-polosExcitación sonora simple (tren de impulsos): buzzingTamaño de trama: problemas con las transiciones rápidas (p, t, k…)
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 28
Vocoder LPC10E
En esta gráfica podemos observar la incapacidad del codificador para reproducir elementos de transición rápida (tales como las explosiones de las oclusivas p t k). Lógicamente, este codificador no mantiene la forma de onda de la señal original, ya que el proceso de codificación se fija únicamente en minimizar el error en el módulo de la envolvente espectral.
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 29
Variantes del Vocoder LPC
Gran cantidad de variantes cuyo fin era mejorar la calidad, transmitiendo más información en la señal de excitaciónExcitaciones mixtas pulsos+ruido en diferentes bandas y con diferentes pesos.Sustitución de la delta por un pulso ligeramente más complejoLPC excitado por voz o por resíduo:
Intenta mejorar la calidad de la excitaci`´on, eliminando la detección sordo/sonoro y la estimación del valor del pitchLa excitación es filtrada paso-bajo (fc=800Hz), y se transmite con muy pocos bits. Se utiliza para la reconstrucción ene l receptor.Requiere velocidades de transmisión superiores al LPC10E
Todas las mejoras posteriores se orientaron a mejorar la excitación transmitida (el predictor permanece prácticamente inalterado en todos los esquemas propuestos).
Técnicas de predicción lineal
Tratamiento digital de la señal de voz 30
BibliografíaJ. Makhoul; Linear Prediction: A tutorial review Proc. of the IEEE, April1975 Andreas S. Spanias; Speech Coding: A Tutorial Review Proc. of the IEEE, Vol. 82, no10, October 1994Bishnu S. Atal; Speech Analysis and synthesis by Linear Prediction of the Speech Wave J. Acoust. Soc. Am. Vol.55, pp. 637-655, Aug. 1971Tremain, T.; The government standard linear predictive coding algorithm: LPC-10 Speech Techno1ogy Magazine, April 1982, pp.40-40 J. Campbell and T .E. Tremain; Voiced/unvoiced classification of speech with applications of the W.S. Government LPC-10e algorithm Proc.IEEEInt. Conf. ASSP1986 pp.473-476V. Welch and T. Tremain; A new government standard 2400 bps speech coder IEEE Workshop on Speech Coding for Telecommunicacions, pp. 1626-1640, Oct. 1993Bishnu S. Atal Predictive Coding of Speech at Low Bit RatesIEEE Transactions on Communications, Vol COM-30. no4, April l982, pp. 600-614
Top Related