Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido...
-
Upload
clara-fidalgo-rico -
Category
Documents
-
view
232 -
download
0
Transcript of Agenda Introducción Señales de Voz Sistema Monoacústico Sistema Estéreo Sistema Híbrido...
Agenda
• Introducción• Señales de Voz• Sistema Monoacústico• Sistema Estéreo• Sistema Híbrido Mono/Estéreo • Detectores de doble Conversación
Introducción
• Objetivos
– Exponer los conceptos básicos de un problema actual
• Características inherentes a la voz humana• Características inherentes a la percepción
humana• Casos de estudio en la generación de eco
– Aplicación de las herramientas de tratamiento estadístico de señales– Aspectos reales a tener en cuenta en el modelo
teórico
Introducción
• Referencia histórica– Problema clásico del procesamiento de
señales– Nuevo impulso en la década del 90
• Retardos de Sistemas Digitales• Nuevas aplicaciones
• Manos Libres• Teleconferencias• Telefonía IP• Localización Espacial
Señales de Voz
• Principales aspectos a considerar– Ancho de banda– Concentración de la energía– Estacionalidad– Percepción humana
Espectro de la señal de voz
• Espectro de Potencia de la señal de voz• Análisis Tiempo-Frecuencia
Generación de eco en las redes
• Red Telefónica tradicional– Desbalance intrínseco del sistema a dos hilos– Significa problema en transmisiones con retardos mayores a
45ms• Redes de Paquetes
Generación de eco en las redes• Redes de Paquetes
– Nuevas aplicaciones de voz– Retardos en el procesamiento
• Necesidad de Buffers– Paquetización– Retardos variables: Jitter
Requisitos del Cancelador de Eco
• De acuerdo a las recomendaciones de ITU-T G.168– Rápida Convergencia Inicial– Bajo nivel de eco de retorno en conversación
simple– Baja divergencia en doble conversación– Detección de doble conversación– Operación en transmisiones fax/modem
10
Criterios de Optimización
2
)(ˆ)()ˆ( ndndEhJ
• Queremos obtener una réplica de la respuesta al impulso h• El camino para esto es encontrar un filtro que haga mínimo el error en términos de:
– Media Cuadrática
- Mínimos Cuadrados Ponderados2
1
)(ˆ)()( ldldnJn
l
ln
Escenarios de Estudio
• Sistemas Mono-Acústicos• Sistemas Multicanal
— Principales características— Diferencias fundamentales
Canceladores de Eco Mono-Acústico
Máxima Atenuación
• Estimamos la señal de eco mediante un filtro de orden N• El valor de N se elige de acuerdo al tiempo de reverberación • Si los valores de filtro se ajustan perfectamente a los
primeros N coeficientes de la respuesta al impulso,
0
2
2
2
0
2
2
0
21
00
2
2
2
2
)(
)(
)()(
)()(
)()(
)()()()(
)(
)(ˆ)((
)(
)(
ii
Nii
ii
Nii
ii
N
ii
ii
NN
kh
kh
ikxkhE
ikxkhE
ikxkhE
ikxkhikxkhE
kdE
kdkdE
kdE
keE
Atenuación Según N
• Para obtener una atenuación de 45dB N1600 • Se requiere alta potencia de cómputo
Algoritmos • Entre los algoritmos más utilizados encontramos:
– NLMS (Normalized Least Mean Square) • Baja Complejidad• Convergencia lenta
– APA (Affine Projection Algorithm)• Solución intermedia respecto a complejidad
y velocidad de convergencia
– RLS (Recursive Least Square)• Alta complejidad y requerimiento de cálculo• Convergencia rápida• Problemas de estabilidad
Algoritmos: comparación
0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.080
0.5
1
1.5
2
2.5
3x 10
-3 Curvas de Aprendizaje
Tiempo(s)
Am
plitu
d
NLMSAPARLS
Algoritmo NLMS
• Frecuentemente elegido por la baja complejidad (2L operaciones por iteración)
• Método de máxima pendiente• Estimación del gradiente muy ruidosa• Paso de adaptación Convergencia Vs
Precisión
Algoritmo NLMS
)(ˆ)()(
)()(ˆ)(ˆ
kdkdke
kxkhkd T
)()(
)()()()(ˆ)1(ˆ
kxkx
kekxkkhkh
T
Formulación del filtro adaptivo:
Estimamos el valor del gradiente en cada iteración por medio de los valores instantáneos
19
Algoritmo RLS
• Orden del filtro O(L^2)• Optimización respecto a cada realización• Ecuación normal determinística
)()(ˆ
)(ˆ)(
,2
,1nr
nh
nhnR
L
L
)( )()(
)()( ,2,1
,2
,1
1
lxlxlx
lxnR T
LTL
L
Ln
l
ln
)(
)()()(
,2
,1
1 lx
lxlynr
L
Ln
l
ln
20
Algoritmo RLS
• Formulación del filtro adaptivo:– Ecuación de Actualización
)()()()1(ˆ)(ˆ 1 nenxnRnhnh
),()1(ˆ)()( nxnhnyneT
1R se calcula en forma recursiva
21
Algoritmo APA
• Se definen error a priori y error a posteriori, respectivamente como:
)1(ˆ)()()( nhnXnyne T
)(ˆ)()()( nhnXnyne Ta
y son vectores que contienen las p últimas muestras de y(n) y e(n)
)(ny )(ne
)1( )1( (n))( pnxnxxnX
22
Algoritmo APA
• Aplicando la restricción:
Obtenemos la formulación del algoritmo
px10)( nea
• Método de error forzado a cero (Zero Forcing Algorithm)
• Orden del filtro O(L)
)()()1(ˆ)(ˆ
)()1(ˆ)(ˆ)(1neXXnXnhnh
nenhnhnX
T
T
0 0.5 1 1.5 2 2.5-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
Tiempo (s)
Am
plitu
d
Señal de Entrada
0 0.5 1 1.5 2 2.5-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6Señal Estimada
Tiempo(s)
Am
plitu
d
Simulaciones: Algoritmo NLMS
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4-0.5
0
0.5Respuesta al Impulso
Tiempo(s)
Am
plitu
d
0 0.5 1 1.5 2 2.5-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6Señal Estimada
Tiempo(s)
Am
plitu
d
0 0.5 1 1.5 2 2.5-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
0.6Señal de Eco
Tiempo(s)
Am
plitu
d
Algoritmo NLMS
0 0.5 1 1.5 2 2.5-0.8
-0.6
-0.4
-0.2
0
0.2
0.4
Error Residual
Tiempo(s)
Am
plitu
d
Algoritmo NLMS: Performance
20 40 60 80 100 120
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4
Comportamiento del Filtro
FiltroResp. Impulso
4620 4630 4640 4650 4660 4670 4680 4690
-0.6
-0.4
-0.2
0
0.2
0.4
Comportamiento del Filtro
Estimacion EcoEntrada
Canceladores de Eco Multicanal
• Sistema Estéreo– Sistemas con requerimientos de localización espacial
• Problemas Fundamentales– Unicidad de la solución
• La solución a la ecuación normal puede estar indefinida
• Correlación cruzada entre canales• La matriz de correlación con número de condición
alto– Seguimiento de caminos de eco
• La aplicación de técnicas del caso monofónico no dan buenos resultados
Cancelador de Eco de dos Canales
• Requiere de alta velocidad de convergencia ante:– Cambios en el recinto de recepción– Cambios de locutor en el lugar de transmisión
• x1(n) y x2(n) fuertemente correlacionadas
Unicidad de la Solución
La minimización de J(n) resulta en la ecuación normal:
M
TMM
TM gnxgnx
,1,2,2,1 )()(
)()(ˆ
)(ˆ)(
,2
,1nr
nh
nhnR
L
L
Las dos señales de entrada del filtro están vinculadas por:
TLiiiLi nhnhnhnh )(ˆ )(ˆ )(ˆ)(ˆ1,1,0,,
Siendo la estimación de los filtros reales:
Si considero L> M y el vector:
Unicidad de la Solución
)( )(
)( )()( )(
)(
)()(
2221
1211,2,1
,2
,1
nRnR
nRnRnxnx
nx
nxEnR T
LTL
L
L
y(n)
(n)x
(n)xE(n)r
L2,
L1,
TT
M
T
M ggu 0 0 0 0 ,1,2
M = Largo de la respuesta al impulso en el lugar de transmisciónN = Largo de la respuesta al impulso en el lugar de recepciónL = Largo del filtro utilizado
Se puede ver que es un vector propio de R con valor propio nulo, y por lo tanto no tenemos solución única a la ecuación normal
Consecuencias de la no unicidad de la solución
TT
MLL ghnh 0 0 )(ˆ,2,1,1
TT
MLL ghnh 0 0 )(ˆ,1,2,2
• La solución a la que llegue el sistema depende de los parámetros del lugar de transmisión
• No se considera una solución adecuada• Si cambia la persona que está hablando debe
reconverger
Desajustes
• En los casos reales vamos a tener L < M• La inversa de la matriz de correlación existe pero va a
estar mal condicionada• Definiendo el desajuste como la relación entre la
solución buscada y la obtenida:
hhh /ˆ
• La solución es única pero el desajuste va a ser importante debido a la correlación cruzada entre las señales de entrada
hhhnQh
hhnhhnhhn
Tt
Tt
TLiLi
T
iLiLi
)(
)(ˆ)(ˆ)( ,,
2
1,,
2min
Efecto Tail
• Se refiere al efecto que produce modelar los filtros con L<N
• Es equivalente a truncar la respuesta al impulso del sistema a estimar
• El residuo hace posible que se tenga solución única• Potencialmente se tiene gran desajuste aunque sea
posible tener buena cancelación de eco• Degradación de la cancelación ante cambios en la
transmisión
Efecto Tail
• Reducción del desajuste– Aumentando el largo de los filtros
• Costoso en términos de memoria y procesamiento
• Procesamiento lento
– Aplicando técnicas de reducción de la correlación cruzada
• Transformaciones no-lineales• Factorización apropiada
Correlación Cruzada
• Función de Coherencia:
)()(
)()(
2211
21
fSfS
fSf
xxxx
xx
• Los valores propios de la matriz de correlación son de la forma:
0)(122 fBA
• Si , la matriz R es singular• Esto ocurre cuando las señales están
relacionadas en forma lineal
1)( f
35
Método de Transformación no-lineal
• Rectificador de media onda– Es preferido por su baja complejidad y por que da
buenos resultados– Se debe cumplir que la distorsión no sea perceptible
por el oído humano– Buenos resultados para valores de menores a 0.5
2
)()()()( 11
11
nxnxnxnx
2
)()()()( 22
22
nxnxnxnx
Diseño de Filtros Adaptivos
• Para el caso multicanal deben tener en cuenta la correlación intercanal– Transformación no-lineal– Procesos de inter-innovación
37
Método de Transformación no-lineal
20 30 40 50 60 70
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4FiltroResp. Impulso
20 30 40 50 60 70
-0.4
-0.3
-0.2
-0.1
0
0.1
0.2
0.3
0.4 FiltroResp. Impulso
Sin aplicación
Con aplicación
Sistema Híbrido Mono/Estéreo
• Es un caso particular de procesamiento en sub-bandas
• Reducción del peso de cómputo al sub-muestrear• Aplicación de distintas técnicas según la banda
de frecuencia– El efecto estereofónico es predominante en
frecuencias por debajo de 1KHz– La concentración de la energía de la voz está en las
frecuencias bajas
39
Sistema Híbrido Mono/Estéreo
Detectores de doble Conversación
• Es un elemento importante que aparece en los sistemas de cancelación de Eco
• Se utiliza como protección contra divergencias de los filtros adaptivos– Señales de audio en el lugar de recepción– Ruidos distorsionantes
• La alta convergencia de los algoritmos adaptivos es acompañada de alta divergencia ante doble-conversación
41
Detector de Geigel (Geigel DTD)
• Es un sistema de aplicación comercial• Se comparan las señales de transmisión y recepción• Si se detecta doble-conversación los coeficientes
del filtro quedan “congelados”– Tiempo de hangover es el tiempo mínimo en que
el algoritmo está inhibido
11 , , ,max Lnnnn xxxy
Condición de doble conversación
Comentarios y conclusiones
• La cancelación de Eco es un requisito en muchas aplicaciones actuales
• Las técnicas a utilizar varían según el campo de aplicación y el costo de la solución
• En sistemas multi-canal la correlación entre las señales de entrada juega un rol central
• Otros desarrollos de interés– Filtros adaptivos en sub-bandas– Filtrado en el dominio de frecuencias