debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna...

27
8. REFERENCIAS [I] Freeman J. A. and Skapura ·D. M., "Neural Networks" .. Ed. 1993. [2] Haykin S., "Neuml Networks, A Comprehensive Foundation", Ed. Prentice Hall, 1994. [3] Lapedes, A. &' Farber, R., "How Neuml Nets Works". Neural Processing Systems. Eds. D.Z. Anderson. American Institute of Physics. Pp. 442456. 1988. Pearlmutter B. A., "Dynamic Recu-rrent Neural Networks". Technical Report CMU-CS pag. School of Computer Scince, Carnegie Mellon Univ., 1990. [5] Back, A.D. & Tsoi, A.C., "FIR and IIR Synapses, a new Neural Network Architecture for Time Series Neural Computation. N° 3. Pp. 375-385. 1991. [6] Hee Yeal, & y Sung Yan B.: "An Improved Time Series Prediction by Applying the Learning Method to FIR Neural Networks". Neural Networks. Vol. 10 N°.9. Pp. 1717-1729. 1997. [7] Connor, J.T., Martin, R.D. & Atlas, L.E.: "Recurrent Neuml Networks and Robust Time Series Prediction". IEEE Transactions on Neuml Networks. Vol. 5. 2. Pp. 1994: [8] DeLiang Wang, Xiaomei Liu & Stanley C. Ahalt: "On Temporal Genemlization of Simple Recurrent Networks". Neural Networks. Vol. 9. 7. Pp. 1099-1118. 1996. [9] Bethke, A.D.: "Genetic Algorithms· and Function Optimizers". Tesis Dodoml. University of Michigan. 1981. [IO]Fogel D. B., Fogel L. J., and Porto V. W., "Evolving neural net-works", Biological Cybernetics, vol. 63, pp. 487493, 1990. [l1]Yao X., "A review of evolu-tionary artificial neural networks", Teeh.Rep. Commonweath Scientific and Industrial Research Organization, Victoria, Austmlia, 1992. [12] Angeline, P., Saunders, G and Pollack, J. 1994. "An evolutionary algorithm that constructs recurrent networks". IEEE Tmns. on Neural Networks, 5, 54-65,1994. [13] Mandischer M., "Evolving Recurrent Neuml Networks with Non-binary Encoding", In IEEE Proceedings of the International Conference on Evolutionary Computing (ICEC), Perth, Australia, 1995 [14]Yao X. and Liu Y., "A new evolutionary system for evolving artificial neuml networks", IEEE Transactions on Neuml Networks, (3):694-713, May 1997. [15] Branke J. "Evolutionary algorithms for neural network design and tmining".· Proceedings of the first Nordic Workshop on Genetic Algorithms and its applications, 1995. Kitano, H., "Neurogenetic Learning: An Integmted Method of Designing and Tmining Neural Networks using Genetic Algorithms", Physica D, I, 1994. [17]Liu Y. and Yao X., "A population-based learning algorithm which learns both architectures and weights of neuraL networks". Chinese Journal of Advanced Software Research , Allerton Press Inc., New York, NY 10011, 3( I 1996. [18] Maniezzo V., "Genetic Evolution of the Topology and Weight Distribution of Neural Networks". IEEE Trans. on Neuml Networks. Vol. 5, NO.1, January 1994. [19] Whitley D., Starkweather T., and Bogart C., "Genetic algorithms and neuml networks: optimizing connections and connectivity". Parallel computing, 14:347-361, 1990. [20] Bramlette M.F.: "Initialization, Mutation and Selection Methods in Genetic Algorithms for Function Optimization". Proceedings of the Fourth International Conference on Genetic Algorithms. Ed. Morgan Kaufmann. Eds. R.K. Bclew & L.B. Booker. Pp. 100-107. 1991. Holland J. H., "Adaptation in Natural and Artificial Systems". Ann Arbor: The University of Michigan. Press, 1975. ., [22] Back, T., "Evolutionary Algorithms in Theory and Pmctice". Ed. Oxford University Press. 1996. [23] Pujol J. C. and Poli R., "Evolving Neural Networks Using a Dual Representation with a Combined Crossover Opemtor", IEEE International Conference on Evolutionary Computation, pp. 416421, Anchorage, AK, May 5-9, 1998. IEEE Press. [24]William W. S. "Time Series Analysis. Univariate and Multivariate Methods". Ed. Addison Wesley, 1990. [25] G. E. and Jenkins G. M., "Time Series Analysis Forecasting and Control". Ed. Holden Day, 1976. ,- it , }., " 90 IDENTIFICACION DE 'SISTEMAS MEcANICOS NO LINEALES CON REDES . . NEURONALES ARTIFICIALES Jorge Eduardo Hurtado Gomez [email protected]) , Julian Mauricio Londono Monsalve [email protected]) , Universidad Nacional de Colombia. Sede Manizales Grupo de Control y Procesamiento Digital de Seiiales Resumen: Se presentan resultados del empJeo de Redes Neuronales Artificiales en la identificacion de sistemas dlmlmicos no lineales. Se analizaron dos sistemas especificos: uno constituido por un estrato de suelo y el otro por la estructura de un edificio. Hene en cuenta los fenomenos de propagacion de las ondas sismlcas por los sistemas en analisis. EJ estudio consldera dos etapas: la primera realiza la comparacion del algoritmo de retropropagacion temporal recurrente desarroUado en [5), usado para el aniilisis de la respuesta dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales recurrentes orientado a la identificacion de sistemas. Se encontro que el primero, aunque de tiempos de entrenamiento muy "extensos, conduce a estimaciones mucho mas acertadas que el segundo. Escogido el mejor sistema artificial, en la segunda etapa, se analiza su comportamiento en una estructura de edificacion. Palabras clave: Redes neuronales artificiales, identificacion de sistemas, sistemas no lineales. - 1. INTRODUCCI6N. En ingenieria de terremotos, los principales esfuerzos estan dirigidos a predecir el comportamiento dimimico de un sistema estructural sometido a movimientos teluricos. El punto clave de estos esfuerzos es tomar el modelo matematico ajustado a las camcterlsticas del sistema estructural dado, pam determinar las respuestas dinamicas requeridas. Un problema frecuente, tiene estrecha relaci6n con el comportamiento no lineal' de estos 'sistemas,' que obliga la formulaci6n de rclaciones complejas acompanadas de una severidad matematica dificil de manejar. Debido a la versatilidad y potencial que han mostmdo las Redes Neuronales Artificiales (RNA) en la predicci6n e identificaci6n de sistemas desconocidos, se evaluaran las habilidades de estas, al modelar dos sistemas dimimicos no lineales particulares. Uno formado por la columna de un perfil de suelo y el otro por la estructum de un edificio de 5 niveles. Consecuentemente, la investigaci6n sera sopotte de un amplio rango de sistemas reales, dominados por mecanismos no lineales. EI estudio se orient6 a determinar que red estimarla de mejor forma la relaci6n entre las cargas dinarnicas a la entrada y salida de cada sistema, en este caso partiCUlar, entre las aceleraciones de excitaci6n y respuesta. 2. CASOS ESTUDIADOS. Se . explomn espccificamente dos tipos de RNA especializadas: la red neuronal recurrente para identificaci6n de Sistemas, y la red de retropropagaci6n temporal recurrente. 91 Los sistemas no lineales a modelar consisten en una columna de suelo y una edificaci6n, los cuales seran excitados en su base, por cargas dinamicas conformadas por registros sinteticos de acelemciones, calculados· por el metodo de Modulad6n uniforme tomando el modelo de Kanai - Tajimi [I ]. Las respuestas de los sistemas, usadas como objetivo de predicci6n durante el entrenamiento, fueron calculadas asi: a) Pam el caso de la columna de suelo, con ayuda del programa de analisis de respuesta sismica SHAKE 1 fundamentado en modelos de propagaci6n unidimensional de onda con comportamiento de suelo en mngos lineales [2]; b) Para el segundo caso, la respuesta dinamica de un edificio, fue calcuhida con el programa de analisis de estructuras IDARC, capaz de hacer estimaeiones en rangos inelasticos 2.1. RNA recurrente para identificaci6n de sistemas. En las RNA reeurrentes las salidas de 'u'n grupo de neuronas se retroalimentan como informaci6n de entrada a un con junto de unidades en capas anteriores, en la misma capa 0 incluso sobre SI mismas. Se establecen entonces, comportamientos dinarnicos que no son 'practicables en redesde alimentaci6n estricta hac!a a delante [4].' '. " Xi Fig, 1. Red neuronal con multiples recurrencias. Pam la idcntificaci6n del sistema desconocido por la red, se utiliza el metodo de identificaci6n pamlela, que consiste b:isicamente en conforrnar la entrada de la red con los valores pasados tanto del vector de entrada del sistema X como del vector de salida estimado por la red V . En esencia, se tr:ata de imitar un modelo ARMAX(il y , n x ), cuyo orden esta supeditado al gmdo de retardos en el tiempo que se consideren para cada uno de las variables en proceso. Esto es: V(t) =r(X(t-I), ... ,X(t- n.), V(t-I), . A \ (I) . ... ,YJt- I Programa desarrollado por la Universidad de California (Berkeley)

Transcript of debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna...

Page 1: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

8 REFERENCIAS

[I] Freeman J A and Skapura middotD M Neural Networks Ed Addison~Wesley 1993 [2] Haykin S Neuml Networks A Comprehensive Foundation Interna~tional Ed Prentice Hall 1994 [3] Lapedes A amp Farber R How Neuml Nets Works Neural Informa~tion Processing Systems Eds DZ Anderson American Institute ofPhysics Pp 442456 1988

Pearlmutter B A Dynamic Recu-rrent Neural Networks Technical Report CMU-CS pag 88~191 School of Computer Scince Carnegie Mellon Univ 1990 [5] Back AD amp Tsoi AC FIR and IIR Synapses a new Neural Network Architecture for Time Series Mode~ling Neural Computation Ndeg 3 Pp 375-385 1991 [6] Hee Yeal amp y Sung Yan B An Improved Time Series Prediction by Applying the Layer~by-Layer Learning Method to FIR Neural Networks Neural Networks Vol 10 Ndeg9 Pp 1717-1729 1997 [7] Connor JT Martin RD amp Atlas LE Recurrent Neuml Networks and Robust Time Series Prediction IEEE Transactions on Neuml Networks Vol 5 ~ 2 Pp 240~254

1994 [8] DeLiang Wang Xiaomei Liu amp Stanley C Ahalt On Temporal Genemlization of Simple Recurrent Networks Neural Networks Vol 9 ~ 7 Pp 1099-1118 1996 [9] Bethke AD Genetic Algorithmsmiddot and Function Optimizers Tesis Dodoml University ofMichigan 1981 [IO]Fogel D B Fogel L J and Porto V W Evolving neural net-works Biological Cybernetics vol 63 pp

487493 1990 [l1]Yao X A review of evolu-tionary artificial neural networks TeehRep Commonweath Scientific and Industrial Research Organization Victoria Austmlia 1992 [12] Angeline P Saunders G and Pollack J 1994 An evolutionary algorithm that constructs recurrent networks IEEE Tmns on Neural Networks 5 54-651994 [13] Mandischer M Evolving Recurrent Neuml Networks with Non-binary Encoding In IEEE Proceedings of the International Conference on Evolutionary Computing (ICEC) Perth Australia 1995 [14]Yao X and Liu Y A new evolutionary system for evolving artificial neuml networks IEEE Transactions on Neuml Networks (3)694-713 May 1997 [15] Branke J Evolutionary algorithms for neural network design and tminingmiddot Proceedings of the first Nordic Workshop on Genetic Algorithms and its applications 1995

Kitano H Neurogenetic Learning An Integmted Method of Designing and Tmining Neural Networks using Genetic Algorithms Physica D 75225~238Aug I 1994 [17]Liu Y and Yao X A population-based learning algorithm which learns both architectures and weights of neuraL networks Chinese Journal of Advanced Software Research Allerton Press Inc New York NY 10011 3( I )54~65 1996 [18] Maniezzo V Genetic Evolution of the Topology and Weight Distribution of Neural Networks IEEE Trans on Neuml Networks Vol 5 NO1 January 1994

[19] Whitley D Starkweather T and Bogart C Genetic algorithms and neuml networks optimizing connections and connectivity Parallel computing 14347-361 1990 [20] Bramlette MF Initialization Mutation and Selection Methods in Genetic Algorithms for Function Optimization Proceedings of the Fourth International Conference on Genetic Algorithms Ed Morgan Kaufmann Eds RK Bclew amp LB Booker Pp 100-107 1991

Holland J H Adaptation in Natural and Artificial Systems Ann Arbor The University of Michigan Press 1975

[22] Back T Evolutionary Algorithms in Theory and Pmctice Ed Oxford University Press 1996 [23] Pujol J C and Poli R Evolving Neural Networks Using a Dual Representation with a Combined Crossover Opemtor IEEE International Conference on Evolutionary Computation pp 416421 Anchorage AK May 5-9 1998 IEEE Press [24]William W S Time Series Analysis Univariate and Multivariate Methods Ed Addison Wesley 1990 [25] ~ox G E and Jenkins G M Time Series Analysis Forecasting and Control Ed Holden Day 1976

~

shyit

~

90

IDENTIFICACION DE SISTEMAS MEcANICOS NO LINEALES CON REDES NEURONALES ARTIFICIALES

Jorge Eduardo Hurtado Gomez GhurtadoemtelsamultLnetco) Julian Mauricio Londono Monsalve Gulianlondonohotmai1com)

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Seiiales

Resumen Se presentan resultados del empJeo de Redes Neuronales Artificiales en la identificacion de sistemas dlmlmicos no lineales Se analizaron dos sistemas especificos uno constituido por un estrato de suelo y el otro por la estructura de un edificio S~ Hene en cuenta los fenomenos de propagacion de las ondas sismlcas por los sistemas en analisis EJ estudio consldera dos etapas la primera realiza la comparacion del algoritmo de retropropagacion temporal recurrente desarroUado en [5) usado para el aniilisis de la respuesta dimimica de una columna estratigrafica respecto al sugerido en (6) para el entrenamiento de redes neuronales recurrentes orientado a la identificacion de sistemas Se encontro que el primero aunque de tiempos de entrenamiento muy extensos conduce a estimaciones mucho mas acertadas que el segundo Escogido el mejor sistema artificial en la segunda etapa se analiza su comportamiento en una estructura de edificacion

Palabras clave Redes neuronales artificiales identificacion de sistemas sistemas no lineales shy

1 INTRODUCCI6N

En ingenieria de terremotos los principales esfuerzos estan dirigidos a predecir el comportamiento dimimico de un sistema estructural sometido a movimientos teluricos El punto clave de estos esfuerzos es tomar el modelo matematico ajustado a las camcterlsticas del sistema estructural dado pam determinar las respuestas dinamicas requeridas Un problema frecuente tiene estrecha relaci6n con el comportamiento no lineal de estos sistemas que obliga la formulaci6n de rclaciones complejas acompanadas de una severidad matematica dificil de manejar Debido a la versatilidad y potencial que han mostmdo las Redes Neuronales Artificiales (RNA) en la predicci6n e identificaci6n de sistemas desconocidos se evaluaran las habilidades de estas al modelar dos sistemas dimimicos no lineales particulares Uno formado por la columna de un perfil de suelo y el otro por la estructum de un edificio de 5 niveles Consecuentemente la investigaci6n sera sopotte de un amplio rango de sistemas reales dominados por mecanismos no lineales

EI estudio se orient6 a determinar que red estimarla de mejor forma la relaci6n entre las cargas dinarnicas a la entrada y salida de cada sistema en este caso partiCUlar entre las aceleraciones de excitaci6n y respuesta

2 CASOS ESTUDIADOS

Se explomn espccificamente dos tipos de RNA especializadas la red neuronal recurrente para identificaci6n de Sistemas y la red de retropropagaci6n temporal recurrente

91

Los sistemas no lineales a modelar consisten en una columna de suelo y una edificaci6n los cuales seran excitados en su base por cargas dinamicas conformadas por registros sinteticos de acelemciones calculadosmiddot por el metodo de Modulad6n uniforme tomando el modelo de Kanai - Tajimi [I ] Las respuestas de los sistemas usadas como objetivo de predicci6n durante el entrenamiento fueron calculadas asi a) Pam el caso de la columna de suelo con ayuda del programa de analisis de respuesta sismica SHAKE1 fundamentado en modelos de propagaci6n unidimensional de onda con comportamiento de suelo en mngos lineales [2] b) Para el segundo caso la respuesta dinamica de un edificio fue calcuhida con el programa de analisis de estructuras IDARC capaz de hacer estimaeiones en rangos inelasticos

21 RNA recurrente para identificaci6n de sistemas En las RNA reeurrentes las salidas de un grupo de neuronas se retroalimentan como informaci6n de entrada a un con junto de unidades en capas anteriores en la misma capa 0 incluso sobre SI mismas Se establecen entonces comportamientos dinarnicos que no son practicables en redesde alimentaci6n estricta haca a delante [4]

Xi

Fig 1 Red neuronal con multiples recurrencias

Pam la idcntificaci6n del sistema desconocido por la red se utiliza el metodo de identificaci6n pamlela que consiste bisicamente en conforrnar la entrada de la red con los valores pasados tanto del vector de entrada del sistema X como del

vector de salida estimado por la red V En esencia se trata de imitar un modelo ARMAX(ily nx) cuyo orden esta supeditado al gmdo de retardos en el tiempo que se consideren para cada uno de las variables en proceso Esto es

V(t) =r(X(t-I) X(t- n) V(t-I) bull A (I)

YJt-

I Programa desarrollado por la Universidad de California (Berkeley)

La actualizacion de los parametros internos de la red es gobernada por

w(t +1) =w(t) -11lt1gt(t) (2)

siendo

d(Ln ET (n)E(nraquo _ d(a)eIt(t) = - -shy (3)

dW(t) dW(t)

donde 11 es la tasa de aprendizaje Dado que ltIgt(t) corresponde al gradiente del vector de error E caltulado en cada iteracion de tiempo t sobre todos los patrones 11 de entrenamiento este depende tanto de la entrada del sistema como de los valores pasadosdel vector de salida de la red Para modelar esta subordinacion se emplea elconcepto de derivadas ordenadas [6] asi

ltIgt(t) =L[dY(l1) YdegA+ a (4) n dW(t) J oV(n)

0+a ~ ~a +I o+a oY~n +k) oY(n) oY(n) k=loY(n+k) oY(n)

(5) EI procedimiento de entrenamiento as tornado obUga se consideren los aportes entregados al error en el tiempo corriente por las salidas de lil red en tiempos pasados debido a la recurrencia de estos datos La actualizacion de los pesos se realizani mediante actualizaciOn por bloque (batchshyprocessing)

22 RlVA temporal recllrrelite Estas redes introducen conexiones cori retardo entre neuronas incorporando a la red dependencia en eUiempo de la serle de datos manipulados Adicionalmente cuentan con lazos de retroalimentacion que como ya se menciono dotan al sistema de caracterlsticas dimimicas en su procesamiento [8] La estructura de la RNA y su diagrama funcional se representan en la figura 2

_--fj I

W VR

L---+~t) a) ~a~

Fig 2 Propagacion hacia delante de una red temporal y detalle de una de sus bull conexiones

El valor de la entrada neta para la neurona j en la capa I y su valor de activacion se expresan en (6) y (7) respectivamente

I I R

s~(t) Ls~(t)+bj L LWfr

a-1(t-r)+bj 1=1 1=1 r=O

I

=Lwijashy1(t) +b j (6)

=1

a~(t) =f(s~(traquo)= f[tW Ija-I(t)+b j ) (7)

siendo W ij =lwijl Wij2 wjr bullbullbullbull WijR J y a-I(t) =[a-I(t)a-I(t-l) a-I (t-R)]

Resumiendo elalgoritmo de retropropagacion temporal y

tmnando en cuenta que 8~ (t) es el error que se propaga hacia

atnis a traves de la capa I y 11 es la tasa de aprendizaje Se

tierie que

92

w~ (t + 1) =w~ (t) -11 8~ (t) a- I (t) (8)

- 2ek (t)middot (s (traquo

8~ = (S~(kraquoto~+I(t)W~~1 I=L

I ~ I ~L-l (9)

(k)

Fig 3 Propagacion hacia atms del error en una red temporal

middot3 CONFRONTACION DE LOS SISTEMAS ARTIFICIALES

La parte inicial del estudio estaba orientada a determinar de las dos redes exploradas producia los mejores resultados a la hora de evaluar la respuesta de un sistema dimimiCo no lineal Para tal efecto se apelo a una investigacion afln previa en la que el sistema a identificar correspondio a un estrato de suelo especifico y se trabajo con una RNA de retropropagacion temporal recurrente como la mostrada en 22 [5] Se elabora entonces una red del tipo presentado en eI literal 21 para estimar la respuesta del sistema bajo condiciones semejantes a las adoptadas en la referencia y asi poder cortejar los resultados obtenidos en ambos estudios A continuacion sepresentan las estimaciones producidas por lamiddot red que mejor comportamiento presento durante las exploraciones realizadas para el caso recurrente La arquitectura utilizada consistio en 4 neuronasde entrada las tres primeras para manejar vectores con los valores para las aceleraciones velocidades y desplazamientos2 con treS

2 Calculados a partir de las aceleraciones mediante integra cion numcrica previa correccion por linea de base [3]

niveles de retardo y la ultima para ingresar las estimaciQnes de la red con un retardo de 4 tiempos dos capas ocultas con ocho neuronas cada una y una unica neurona de salida para estimar la ~spuesta en aceleraciones del estrato de suelo en estudio~ Se presentan a continuaci6n la respuesta proporcionada por la red entrenada para dos realizaciones sinteticas con sus equivalentes para el sistema evaluado en la referencia Se observa claramente que la red propuesta en el literal 21 no alcallZa un comportarniento aceptable en ninguna de laS expliiraciones sin embargo las velocidades de convergencia en la fase de entrenamiento son muchos mas altas que en el caso reportado de la red temporal Esta ultima aventaja at primer sistema artificial en el acierto de las estimaciones sobre las respuestas del sistema real considerado Se quiere ahora tomar las facultades que han exhibido cada una de las redes aqui estudiadas para formar un sistema Olucho mas completo Por consiguiente semiddot modificanl el algoritmo de retropropagacion temporal recurrente complementando en su cicIo de propagaci6n del error por la red el concepto de derivadas ordenadas que a juicio de los autoresmiddot prove era importantes caracteristicas necesarias para optimizar el entrenamiento

RlldlliliciOl~ 11 bull EIIT1EHAMENTO

middotmiddotrl------~----~~--------------~----_

~ w~_ Il -

(i-= I o 10 15 20 2S

r9fpoIS50~

(a) Rulmobl nllllica II

02

i~~~~ __ IOE SPUE

STACE

~

~o 1l ~tJ - - o 1$ ---- 10 I

TIMtpO (HoG) 1$ 0 (b)

FWdaeiCIISftDca ~ENTRENAMEHTO

r~

(~ml o 10 11 20 2$

lIIfIIPO S89~

(c)

93

to

- fpoundSPteuro$TA DE fUtA

lJ1LUUIJtMraquoJ~

(d)

Fig 4 (a) y (b) Entrenamiento y simulaci6n con la red reeurrente del literal 21 respectivamente (c) y (d) son resultados extrafdos de [5J para la red

temporal de 22

4 EVALUACIONDE LA RESPUESTA DE LA ESTRUCTURA DE UN EDIFICIO

La siguiente etapa de la exploracion consiste en evaluar el comportamiento de la red de retropropagacion temporal recurrente modificada comparando los tiempos de entrenamiento en el caso ya estudiado Adicionalmente se juzgara su habilidad para estimar la respuesta dinamica de la estructura de un edificio en su 50 nivel al ser excitada en la base por un tren de aceleraciones Esta fase de la investigacion esm en desarrollo

5 CONCLUSIONES

Se encontro que la red recurrente para identificaci6n de sistemas no adquiere igual destreza en el acierto de las estimaciones de la respuesta del sistema examinado a la exhibida por la ted de retropropagaci6n temporal recurrente No obstante las velocidades de convergencia en la fase de entrenamiento para el primer caso son ostensiblemente mayores que para el segundo mostrando mejores caracteristicas para encontrar un valor minimo en la funci6n de costo

REFERENCIAS

[1] BARBAT AH OROSCO Lbull HURTADO JE GALINDO M DefiniCion de la Accion SIsmica Monografias de Ingenierla Sismica No 10 Centro Intemaclonal de Metodos Nurnericos en Ingenieria Barcelona 1994

[2J DAS BM Principles ofSoil Dynamics PWS-Kerit Boston 1993 [3J HURTADO 1 E ModelaciOn estocdstica de la accion sismica

MonografIas de IngenierJa Sismica No 33 Centro Intemacional de Metodos Numencos en Ingenieria Barcelona 1999

[4] middotJANG 1bull SHING R SUN CT y MJZUTANI E Neura-Fuzzyand Soft Computing Prentice HaUNew Jersey 1997

[5] LONDONO 1M y MEZA MA Redes neuranales artificiales aplicadas a la simIlacon de ondas sismlcas a traves del Slielo Tesis de grodo Universidad Nacional de Colombia Sede Manizales 2000

[6J LUO F L Y UNBEHAUEN R Applied neural networks for signal processing Cambridge University PreSs 1998 Pag 317-323

[7] REINHORN AM y KUNNATH SK DARC RESEARCH purposes 1992

[8] WAN ERIC A Finitemiddot Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

CLASIFICACION Y RECONOCIMIENTO DE IMAGENES GEOMETRICAS BAsICAS USANDO RNAs

Olaya Ramirez Fabian A Gallon Cannon a Camilo Eduardo Caicedo Jesus A Lopez Grupo de Percepcion y Sistemas Inteligentes Escuela de Ingenieria Etectrica y Electronica

Universidad del Valle Cali Colombia psieieeunivalleeduco

Abstract Este articulo presenta el desarrollo de una estructura algoritmica basada en una aplicJlcion para el reconocililiento y cIasificacion de imagenes ReI fundamentalmente figuras geometricas mostrando apartes en cuanto al sistema de procesamiento de las imagenes y estructura de red neuronal utilizada demostrando ast la gran capacidad de procesamiento adaptabilidad generalizacion y agrupamiento de las RNA aplicadas a la inteligencia computacional y tomando como esquema que la mayoda de los modelamientos de entornos en vision artificial son desarrollados sobre bases geometricas [Gallon 20011 Este articulo describe el desarrollo de procesamiento de la imagen la obtencion de caracteristicas de cad a patron imagen tipo de arquitectura aprendizaje utilizado y su propio reconocimiento y cIasificaciOn

1 INTRODUCCI6N

Este articulo detalla el desarrollo de una aplicacion para demostrar el alcance de las RNAs en la c1asificacion y en el reconocimiento de imagenes

Este articulo brinda la posibilidad de explorar el desarrollo de la herramienta partiendo con un marco teo rico sustentando las caracteristicas de generalizacion entre otras propiedades que la componen y que las hace tan especiales en este tipo de aplicaciones Luego se presenta el modelo metodologico donde se explica cada uno de los pasos y procesos realizados comenzando desde la captura de la imagen pasando por el procesamiento y extraccion de sus caracteristicas y terminando con el aprendizaje y cIasificacion [Buhmann 99]

El reconocimiento y cIasificacion de imagenes es una hcrramienta crucial para la vision artificial y en especial robOtic a movil debido a que puede reforzar la posicion y orientacion del robot permitiendole interpretar caracteristicas de las senales (en vez de memorizar las senales enteras) por ella la importancia de llegar a un metodo de procesamiento de la imagen que nos permita mane jar diferentes figuras tanto rectas como curvas

2 PERCEPTRON MULrlCAPA

La utilizacion del Perceptron multicapa con el algoritmo de aprendizaje BP se debe a que este permite calctilar el error a la salida de la red en forma exacta y asi propagarlo hacia las otras capas ocultas y con el mismo calcular la medida del error que se tiene en dichas capas asi se pueden variar los

pesos entre las conexi ones asociados con el patron de entrada y salida [Freeman 93]

CAPADE ENTRADA

Unidadesde terldencia Salida = 1

CAPAOCULTA CAPADE SALIDA

CirC1J1o

Cuadrad

Redangl

va

Fig I Red para reconocer y clasificar figuras geometricas[Gallon 200 I]

En la figura 1 se puede observar una estructura de red neuronal para reconocer y cIasificar figuras geometricas que basicamente consta de una capa de entrada que detalla los patrones caracteristicos de cada figura una capa oculta necesaria para el procesamiento de la red y una capa de salida donde se encuentra la relacion con el conjunto de figuras a reconocer y clasificar H

3 SISTEMA DE PROCESAMIENTO DE IMAGEN

Es el momento en el cual tenemos las imagenes en el ordenador asi para la adquisicion de estas se puedeutilizar desde una camara digital hasta un editor de inuigenes dentio del mismo PC con el fin de formar un archivo completo de imagenes para la realizacion de las pruebas y funcionamiento de la herramienta

94

En la figura 2 se puede observar un diagrama de flujo geIler~1 ~e los pasos basicos para reconocimiento y cl~~fi~acion~~ tmagenes

peprtlCtS3do

dominio del problema--_1-shy

adqllisiciro d~ imageotS

bast dt laquolooeimiento

~nocmerto e

ittrpnuclon

dlt

Fig 2 EtapasJundamentales del procesamiento digital de imagenes [Gonzalez 961

31 Preproeesamiento En la rase de Preprocesamiento de las figuras geometricas tal como se ve en la Fig 3 se realizaron los siguientes procedimientos

it Binarizacion

bull Calculo del centro de graved ad bull Normalizaci6n del tamano bull Centrado de la imagen

FIg 3 Algunas representaciones de las imagenes utilizadas por la aplicacion

[Gallon 20011 32 Obtencion de los veeores earaeteristieos

(deseriptores) En esta etapa se obtienen los vectores caracteristicos de cada figuni a reconocer y cIasificar Para ello se parte del centro de la imagen ya procesada y se recorre la matriz de pixeles des de este punto hacia los bordes de la figura sobre las diagonales principales secundarias horizontal y vertical tal como muestra la Fig 4 obteniendo ocho distancias euclidianas que para cada figura seran 10 bastante propia y significativa

t ~ J

3

Fig 4 modelo de descriptores [Gallon 20011

33 Fase de Aprendizaje Esta es la rase de entrenamiento de la red baSados en el algoritmo de aprendizaje Backpropagation y tomando como

95

punto de partida losvectores caracteristicos de cada imagen y SllS respectivas variaciones como rotaciones traslaciones tamaiio etc La arquitectura de red para la c~l este metodoes valido es la de un Perceptron multicapa como eI que se muestra en la Fig 1 y enfatizando asi que el numero de capas utilizado no es fijo y depende exclusivamente del usuario en cuanto a las pruebas y amilisis que se realicen Este aprendizaje tJene comienzo excIusivamente teniendo muy claro las clases de imagenes para las cuales el sistema se va a entrenar luego se escogen los patrones caracteristicos y mas representativos de cada imagen as se puede crear un archivo de patrones con todo eI conjunto anterior como se muestra en la Tabla 1

TABLA 1 ARCHIVO DE ENTRADA PARA ENTRENAMIENTO DE LA RED

[GALLON 2001]

Despues de caigar este archivo de patrones al sistema se procede a ajustar todos los parametros de la red para este caso los del algoritmo de entrenamiento como son alfa beta velocidad de animacion numero de iteracionesyajustar los parametros de la arquitectura como numero de capas numero de neuronas por capa y las respectivas funciones de activaci6n todos estos ajustes y la exactitud de ellos dependen exelusivamente de la experiencia del usuario con sistemas de redes neuronales de este tipo

34 Fase de Reeonocimiento y Clasifieacion Este es el objetivo principal de este desarrollo asi para el conjunto de figuras geometricas escogido se organiza por clases como 10 5011 la clase cuadrado circulo rombo entre

otras y asi la verdadera clasificacion se da despues de vaHdar el sistema es este instante se corrobora el verdadero aprendizaje de la red si esta c1asificacion no tiene exito se procede a evaluar los puntos defallo del sistema y se vuelve a entrenar la red con los ajustes previos que conlleven al mejoramiento en la c1asificacion En la figura 5 se puede observar el procedimiel)to blisico utilizado para 1a obtencion de los resultados del trabajo

~ P Poblacion de objelos

ReconocimienloSeosado Exlraccion d Mediday Rasgos

IProeeamienl I

I

Objeto I)alo Medido Vector de Identificadol Muestreado Rasgos clases

Fig 5 Proceso de reconocimiimto y c1asificaci6n de patrones [Darpa 88]

4 RESULTADOS Y ANALlSIS

Se probaron redes con una sola capa oculta con diferente nfunero de neuronas y funciones de activacion asi durante el proceso de aprendizaje se elcontraron diferentes problemas e inconvenientes como la no-convergencia del proceso de entrenamiento de las redes debido en gran medida a que el conjunto de patrones de entrenamiento excedia la capacidad de aprendizaje de las redes ytambien la apandon de grandes minimos locales en la funcion del error cuadnHico que se generaba por 10 que se dificultaba la posibilidad de alcanzar el minimo global durante e1 entrenamiento tambien surgieron problemas de saturacion en algunas neuronas de la capa oculta Para solucionar estos problemas presentados en principio se decidio analizar diferentes tipos de arquitecturas con diferente numero de capas mimero de neuronas por capa y numero de iteraciones para asi poder llegar a una solucion

satisfactoria Para el entrenamiento de la red se utilizaron las siguientes figuras teniendo en cuenta sus rotaciones y algunos niveles de ruido que en promedio era del 20

Circulo con 23 figuras Cuadrados con 20 figuras Elipse con 36 figuras Pentagono con 33 figuras Rectangulo con 46 figuras Rombo con 43 figuras Triangulo agudo con 80 figuras Para un total de 281 figuras para el entrenamientocada figura con 8 posiciones teniendo un numero de patrones igual al numero de figuras parametrizadas

La seleccion de las figuras para entrenamiento se realiz6 tomando criterios como la representatividad figuras con valores criticos (como figuras de la misma clase pero con patrones muy dijerelltes alas otras) figuras que tuvieran dificultad en e1 procesamiento de 1a imagen (como figllras que en el procediniiento de normalizacicm del tamano pierden algunas caracteristicas) figuras limpias y figuras bien definidas En la busqueda de la mejor red se probaron muchas arquitecturasen la Tabla 2 se presentan algunos de los resultados obtenidos durante la etapa de aprendizaje teniendo en cuenta diferentes criterios en cuanto al numero de capas mimero de neuronas de la capa oculta(CO) tipos de funciones de activacion en capa oculta y capa de salida y numero de iteracionestambien se presenta en la ultima columna el Error cuadriitico(EC) correspondiente a cada

arquitectura TABLA 2

RESULTADOS DE APRENDIZAffi CON VARIAS ARQUITECTURAS

N0 Ndeg de FA FA Ndeg de Ue EC cap neur co CS

CO 3 16 3 8 3 8 3 8 2 3 8 3 3 8 3 3 7

3 7 3 3 7 2

3 5 3 7 3 12 1 3 16 4 4

4 16 4 16 I

Funciones de activaci6n 1 Timgencial-sigmoidal 2 Lineal 3 Sigmoidalmiddot

2

2 2 3

2

2 2 2

2 2 2 2 2

23000middot 014

25000 011 25000 015

25000 Instable

25000 046

25000 0377 25000 016

25000 lnestable 25000 inestab1e

25000 022 25000 023

25000 008

25000 007

25000 0058

50000 00008

75000 00003

En la busqueda de la mejor red se encontro que e1 mejor ~ fue de 01 y 0 fue de 00075 aunque tambien respondi6 bien con un ~ de 05 peru con un 0 de 000075 los valores anteriores son determinantes en la busqueda del mejor entrenamiento estos son como factores de amortiguamiento para tratar de evitar un cierto numero de oscilaciones en la busqueda del menor error cuadriitico Otro criterio evaluado fue el numero de iteraciones siendo las arquitecturas de 4 capas las que se desfasaron en ese pariimetro pero comparando estos dos parametros y despues d~ un arduo pruceso de validaci6n acontecio que el tiempo invertido en el numero de iteraciones

es recompensado en Ia validaciol1 de las imagenes

obteniendose un mejor rendimieilto para la arquitectura de 4 capas [Ganon 2001]

96

CONCLUSIONES

pound1 proceso investigativo que se nevo a cabo se encamino a la utiIizacion del algoritmo de aprendizaje Backpropagation aplicado a una red MLP Fig 1 para que interactuaracon el sistema de procesamiento de imagenes por ser no solo el que mejor se acoplaba a las expectativas del desarrollo sino tarnbien por sus caracteristicas El desatrollo en cuanto a procesamiento de imageries frente a aspectos como el tamano posicion orientacion y cIase de imagen at que se llego mediante el desarrollo investigativo dio com() resultado un sistema que Ie presentara al usuiuio la oportunidad de analizar y estudiarmiddot una aplicacion predeterminada nombrada anteriormente y asi mismo poder tener acceso a otro tipo de imagenes desarrolladas por el e interpretadas a su gusto [Reiher 99]

El objetivo de laspruebas que se realizaron en esta aplicacion fue tratar de encontrar los parametros optimos de la red neuronal que consigan reducir al maximo el error en el menor numero de iteraciones aunque no siempre es posible alcanzar eI error minimo con un minimo de iteraciones ya que luego de determinada cantidad de iteraciones elerror decrece muy lentamente Debidomiddot a estomiddot es necesario sacrificar econom~a (aUl1lellto de capas ylo lIeuronas ocultas) [Vapnik 95]

Si las formas de las figuras son muy semejantes entre sf dentro de la misma clase el errormiddot disminuye muy nipidamente consiguiendose un valor muy pequeno Por otro lado si estasfonnas de las figuras son muy diferentes dentro de 1a misma dase la ve10cidad de aprendizaje es muy lenta y en ocasiones ocurren oscilaciones bruscas Luego se puede afirmar que la red aprende formas semejantes con mayor facilidad que formas diferentes En ocasiones si las fonnas de las figuras son muy semejantes entre si excepto algunos diferentes es posible que la red ignore estos ultimos si no hay suficientes neuronas en la capa oculta Tambien para evitar esto se pueden reducir la cantidad de figuras en el entrenamiento escogiendo las mas significativas as ya no habrii mayoria Se comprobo una vez mas que una de las mejores aplicaciones que tienen las redes neuronales artificiales es reconocimiento y clasificacion de patrones aprovechando la capacidad de generalizacion de las redes las cualespueden aprender de una serie de modelos originales de diferentes clase para luego ser ~apaces de determinar la clasea la que pertenecen otras entradas distintas de los patrones aprendidos EI metodo presentado podria considerarse como una primera etapa de clasificaci6n de lmagenes que podria complementarse con otros metodos para asegurar una clasificacion mas detaHada y precisa Asi mismo podrian ll1ejorarse los resultados una forma podria ser aumentando el nUmero de patrones presentados a la red en la fase de aprendizaje 0 aumentando el vector caracteristico de cada patron tambien se podrian utilizar otros metodos de Caracterizacion de las imagenes como por ejemplo valores obtenidos mediante la compresion con otra red neuronal u

otros tipos de redes y algoritmos de aprendizaje 0 utilizando otro tipo de procesamiento de la imageI [Jason 96]

BIBLIOGRAFiA

[Buhmann Malik Perona 99] Joachim M Buhmann Jitendra Malik and Pietro Perona Institute of Informatics University of Bonn Germany Department of electrical and computer science university of California Berkeley 94720 Department of Electrical Engineering California Institute Technology Pasadena 91125 [Darpa 88) Darpa Neural Network Study Ed AFCEA Press Washington 1988 [Freeman Skapura 93) James A Freeman David M Skapura Redes Neuronales-algoritmos Aplicaciones y Tecnicas de Propagacion Addison-wesleyDiaz de santos 1993 [Gallon Olaya 2001] Camilo Gallon Fabian Alonso Olaya R Herramienta de Simulaci6n para el Reconocimiento y Clasificacion de Imagenes con Redes Neuronales Artificiales (UV-SRNA-RCI)Tesis de Pregrado Universidad del Valle Pregrado en Irtgenieria Electronica Santiago de Cali 2001 [Gonzalez 96] Rafael C Gonzalez Richard E Wods Tratamiento Digital de Imagenes Addison - Wesley I Diaz de Santos 1996 [Jason White Chase Luo Sutton 96) Jason A Janet

Mark W White Troy A Chase Ren C Luo John C Sutton 96 (1996) Center for Robotics and Intelligent Machines Departritent of Electrical and Computer Engineering North Carolinamiddot State IEEE International Conference on Robotics and Automation Minneapolis Minnesota April (1996) pag 3598-3604 Addison wesleyiberoarilericana rama 1995 (Vapnik 95] Vapnik V N (1995) The nature ofstatistical learning theory (Springer NY) [Reiher SaidLiSuen 99) Eric Reiher Fady Said Ying Li and Ching Suen Centre de recherche informatique de Montreal 1801 McGill College Avenue Suite 800

Montreal Quebec Canada H3A 2N4 Centre for Pattern Recognition and Machine Intelligence 1550 de Maisonneuve Blvd West Suite GMi06 Montreal Quebec Canada H3G 1M8 Commission III Theory and Algorithms KEY WORDS GIS Cartography Vision Neural Networks Pattern Recognition 1999

Ing FABIANA OLA YARAM1REZ lng CAMILO GALLON Ca~ona

Ingeniero Electr6nico graduado de lngeniero Electr6nico graduado la Unive~sidad del Valle 2001 de la U~iversidad del Valle200 Profesor dellnstituto tecnico rng De Servicios DATECSA PROYECT A e Ing de Campo Cali Colombia OMNICON Cali Colombia camillonlaciudadcom ffaortutopiacom

UNA APROXIMACION A LOS INSTRUMENTOS VIRTUALES PARA EL CONTROL CONREDES NEURONALES Y LOGICA DIFUSA

Ing Jaiber Evelio Cardona (jaibercyubartaunivalleeduco) PhD Eduardo Caicedo (ecaicedoeieeunivalleeduco) MSc Eduardo Owen (ejoweneieelInivalleeduco)

Grupo de Percepcion y Sistemas Inteligentes Escuela de Ingenieria Electrica y Electronica

Universidad del Valle psieieeunivalleeduco

Resumen En el presente articulo se muestra una clase de ~ Backpropagalion E3 instrumentos virtuales diseiiados por el grupo para implementar estrategias difusas y neuron ales y se realiza una aplicacion practica para el control de una planta de presion del Laboratorio de Automatica se comparan los resultados obtenidos ante un control PI clasico un control PI difuso y un control neuronal por modelo inverso especializado de la planta

Palabras clave Redes neuronales sistemas difusos control inteligente Instrumentacion virtual

1 INTRODUC CI6N

Con la adicion de caractcristicas especiales como capacidad de computo y simplificacion de tareas para el operario se incremento el costa de la instrumentacion se penso entonces en mejorar el desempefio sin adicionar gastosUna de las soluciones planteadas fueron los instrumentos virtuales [GOLDBERG 00] incorporando el hardware y el software necesario para que computadoras de propos ito general pudieran realizar eI trabajo dejando a elIas el intercambio de informacion entre el usuario y el sistema

Uno de los programas que permite realizar aplicaciones en instrumentacion virtual es elLabView bajo este software se estan desarrollando en la Universidad del Valle modulos de proposito general llamados instrumentos virtuales en Lab View (VI) para la implementacion de estrategias difusas Figura No 1

y neuronales que permitan realizar aplicaciones de tipo industrial y de laboratorio Los instrumentos virtuales mas importantes se En este articulo se muestran algunos avances en este mencionan a continuacion propos ito aplicando los VI desarrollados al control de una planta de presion bull Inicializa back inicializa Kohonen (Fig No 2)

2 INSTRUMENTOSVlRTUALES DESAR ROLLADOS Permiten asignar a los pesos de la red valores aleatorios entre cero y uno

Para la implementacion de las estrategias inteligentes basadas en logica difusa y redes neuronales backpropagation bull Procesa entrada procesa Kohonen (Fig No 3) y Kohonen se han desarrollado instrumentos virtuales agrupados en submenus dentro del Labview dichos Se entrega un vector de entrada a la red y se calcula la submenus pueden ser incluidos en la paleta de funciones salida Para una red Backpropagation la salida es un estandar La presentacion de los submenus se puede observar vector de valores para una red Kohonen la salida son en la figura No I los pesos de la neurona ganadora y su posicion Bajo los submenus backpropagation y Kohonen se agruparon diferentes funciones que permiten realizar las bull Aprende hasta error (Fig No 4) operaciones basicas para la manipulacion de dichos tipos de redes neuronales artificiales Permite aprender un conjunto de patrones en una red

Backpropagation hasta alcanzar un error determinado

98

bull Aprende patrones en un numero de iteraciones (Fig No 5)

Red tmtrada~Redfinal

inicializa backpropagalion yi

Toma los parametros de la red de entrada y saca una red simaar con numeros aleatorios en sus pesos

Procesa Kohonen

Determina la neurona ganadora de 101 red y da los pesos y 101 ubicaci6n de esta EI primer componente de la ubicaci6n indica 101 columna y la segunda la fila donde esta 101 neurona if m

Figura No 3

Figura No 4

99

iiB Help BIiJE3 Roefe----

Rocero---1 pesos (lilt)) ==I~P Patrones Jrmiddot--middoti

Lmaximo Alfa cero __---I

Alfa efe

Figura No 5

Realiza el aprendizaje de patrones para una red Kohonen en un n1imero de iteraciones determinado

bull Grabar y cargar redes y patrones

Ambos tipos de red tienen modulos para grabar y cargar las redes que se hayan trabajado anteriormente o patrones que esten digitados Para todos los casos se trabajan archivos tipo texto

Bajo el submenu de logica difusa se encuentran funciones para realizar operaciones difusas necesarias para implementar un sistema difuso sus principales instrumentos virtuales son los siguientes

bull Operaciones y 0 y no (figura No 6) Permiten realizar lasoperaciones 16gicas difusas

Figura No 6

bull Difusi6n (Fig No 7)

Tomando los con juntos difusos por medio de vectores calcula el valormiddot de salida realizando el paso de difusion

lmil_~liJi~IJ ~

Coniuntos bOllosos ==~ ~bull bull 1 -Salida(I Valor de entrada -----lt] gt~

Difusionmiddotitli

Figura No 7

bull Inferencia y concrecion (Fig No 8)

Tomando losvalores de pertenencia y las reglas de inferencia se realizan los 6aIculos del valor de salida

DrMil_~rolx itt(f~1h~-

Figura No 8

3 PLATAFORMA DE EXPERlMENTACION

31 Descripcion de laplanta Se desea controlar la presion del aire en un tanque cambiando 1a apertura de una valvula El esquema se muestra en la figura

No9

Flujo de entrada

Figura No9

La planta posee una entrada de flujo constante que alimenta el sistema 1a valvula es normalmentecerrada con una apertura entre 0 y 100 logrando una presionenel tanque

entre 2 y 9 psi

32 Estrategia de control neuronal

Se utilizo la estrategia del modelo inverso especializado de la planta [CASTRO 01] para ello se configuro una red Backpropagation con 3 neuronas de entradas y una neurona de salida ambas con Ia funci6n identidad y 3 neuronas en la eapa oculta con funcion de activacion sigmoidal

Debe existir una fase previa de entrenamiento para 10 que se apticaron varios escalones aleatorios a la entrada del sistema registrarido la salida a un tiempo de muestreo fijo Ia respuesta de la planta ante diversos escalones aleatorios con un tiempo de muestreo de lOOms se muestra en la figura

NolO

Se entreno la red neuronal utilizando como patrones de entrada los val ores de presion presente presion con un retraso y presion con dos retrasos y como patrones de salida la apertura de la valvula con un retraso EI esquema se muestra en la figura NoII

Una vez la red aprende los patrones hasta un error pequeno dicha red se puede utilizar como controlador [HUNT 92] por el esquema mostrado en Ia figura N12

100

Figura No1 O

RNA e

Figura No1 1

Ref

~~ lJ(n) RNA _~LANTAIY(n)

Figura No1 2

33 Estrategia de control difilsO

Se aplico una estrategia difusa PI Mandani [MANDAN I 74] Los conjuntos difusos definidos para el error el cambio del error y 1a salida ~c muestran en la figura No13

E=r

Figura No 13

Se utilizaron 5 reg las que se enuncian por medio de una tabla su definicion se muestra en 1a figura No14

CAMBD DE ERROR negatito ce 10 postilo

ERROR neg a tiro

cero

postilo

Figura No 14

Se utilizo e1 metodo del centro de area para la desfuzzificacion

4 Resultados obtenidos Junto con el controlador difuso y el neuronal se implemento un control PI sintonizado con las reg las de Ziegler Nichols para comparar los resultados

Al aplicar un escalon a la entrada los tres controladores llevaron a la planta a estado estable en un tiempo similar el control por red neuronal no presento sobreimpulso mientras los otros dos si La respuesta se puede ver en la figura No 15

EI esfuerzo de control como respuesta ante el mismo escalon se muestra en la figura No 16 se puede ver que el mayor esfuerzo 10 realiza la red neuronal mientras que los otros dos tienen un cambio mas suave

101

Figura No15

Ante un disturbio las estrategias PI difusa y clasica son capaces de llevar la planta a la referencia deseada mientras que la red neuronal no Las respuestas ante un disturbio se pueden ver en la figura No 17

Figura No16

5 CONCLUSIONES

Se comprobo en forma pnictica uno de los posibles usos de los instrumentos virtu ales desarrollados en LabView y se dejan sentadas las bases para desarrollos posteriores en este senti do

En este trabajo se utilizo el modelo inverso especializado con redes neuronales y el PI difuso para el control de una planta de presion EI resultado obtenido es aceptable al ser comparado con un PI clasico dichas estrategias nos brindan entonces una opcion valida diferente para el control Se pudo ver como un control PI difuso puede responder de manera similar a Ull control PI sin embargo llevarlo a un punto de trabajo bueno requiere

de umi afinacion empirica basada en el conocimiento de la pblnta

Figura No17middot

Al aplicar la estrategia de control por modelo inverso especializado se vio que la respuesta al escalon fue buena sin embargo esto depende del nfunero y calidad de patrones con quese entrene ademas de requerir un nuevo aprendizaje ante cambios severos en las condiciones de trabajo de la planta Esto se puede evidenciar ante la respuesta al disturbio al cambiar las condiciones de la planta el controlador neuronal no pudo llevar el sistema al punto de referencia deseado mientras que los olros dos controladores si 10 10graron

REFERENCIAS

[CASTRO 01] CastroT Orlando Giraldo H Norma Implemtacion de un sistema de control utilizando redes neuronales artificiales por modelo inverso especializado de la planta Colombia Cali Universidad del Valle Tesis de pregrado 2001

[EBERHART 90] Russell C Eberhart Roy W Dobbins Neural Network PC Tools A practical guide 1990

[GOLD BERT 001 GOLBERT Harold What is Virtual Instrumentation IEEE Instrumentation amp Measurement Magazine Diciembre 2000

[HUNT 92] HUNT K J SBARBARO D ZBIKOWSKI R GAWTHROP P J Neural Networks for Control System - A survey Automatica Vol 28 No6

[MANDANI 74] MANDANI EH Applications of Fuzzy algorithms for control ofsymple dynamic plant Proc IEEE 121 (12) 1585 - 15880974)

102

EXTRACCION DE CARACTERiSTICAS RELEVANTES Y RECONOCIMIENTO DE SEN-ALES EMG MEDIANTE UNA RED NEURONAL TIPO PERCEPTRON

MULTICAPA

Victor Grisales (vhgrisalesateneaudistritaleduco) Carlos Sanchez (CarlosAndresieeeorg) Fernando Rosas (FernandoRosasieeeorg) Vladimir Barrero (vbarreroieeeorg) Juan Leon (ipleonieeeorg)

GIDIC - Grupo de Investigacion y Desarrollo en Instrumentacion y Control Universidad Distrital FJDC - Facultad de Ingenieria - Departamento de EIectronica

Bogota - Colombia 200 I

Resumen Este articulo presenta la metodologia para el entrenamiento y valida cion de redes neuronales tipo perceptron multicapa (MLP) mediante un caso de estudio de reconocimiento

de seiiales mioelectricas (EMG) del brazo de un paciente sanD de 3 aiios mediante la utilizaci6n del algoritmo de BackshyPropagation (BP) Se utilizan bases de datos que presentan la relacionexistente entre el espectro de potencia de una senal mioelectrica (a traves de la FFT) y el desarrollo deseado por el paciente sobre las cuilles se aplican (ecnicas de ingenierfa neural para la depuracion de datos Se realiza entrenamiento verificacion y validacion de la redAdemas para la operacion en Ciempo real se propone el desarrollo de una interfaz electronica sobre un procesador digital de senales (ADSP-21061

Palabras claves PrOtesis de miembro superior Senal electromiografica Red Neuronal Artificial Analisis de correlacion Ingenieria neural

1 INTRODUCCION Por muchos anos ha existido la meta en bioingenieria de disenar una protesis controlada a partir de las senales

mioelec-tdcas del brazo para poder ser usada en los pacientes amputados Eneste articulo se presenta la metodologia para la apropiada discriminaci6n de la senal mioelectrica la cual simplemente representa el deseo del paciente para ejecutar cualquier clase de movimiento Apoyados en diferentes investigaciones al respecto [12] tenemos la hipotesis de que la informacion debe ser extraida a

traves deelectrodos de superficie en 4 puntos especiales del brazo

I

Se trata en primera instaneia la adquisicion de las senales mioelectricas junto con la seleccion de caracteristicas relevantes de los movimientos la creacion de bases de datos para el entrenamiento verificacion y validacion de la red

n~uronal y la determinacion del nfunero optimo de neurodos ocultos de la red para efectos de reconocimiento [3] Se realizan diversas pruebas de software considerando el porcentaje de acierto de la red y se realiza un analisis de relevancia con miras a una reduccion de la dimension del vector de entrada

2 PROCEDIMIENTO La red neuronal es utilizada en este sistema para aprender la relacion entre el espectro de potencia de la senal EMG y la

1 Miembro de 1a poderosa familia SHARCreg de procesadores de pUnto flotante de 32 bits)l

actuacion deseada por las personas incapacitadas La red puede diferenciar 7 movimientos de las diferentes seiiales EMG Este sistema esta compuesto por dos partes adquisicion y discriminacion de las senales

21 Parte de adquisici6n La parte de adquisicion consta de electrodos preamplificados de la empresa Delsys los cuales estan disenados con una ganancia de 1000vv y con un fiItro pasabanda de 20-450 Hz Ellos usan la geometria de contacto de barra paralela para asegurar la estabilidad de la senal y la repeticion fiel entre las grabaciones Debe evitarse un contacto pobre entre los electrodos y la piel ademas que se debe buscar la forma de sujetarlos fuertemente Debido a que una posicion inadecuada genera una senal diferente se busca conservar siempre la misma posicion de los electrodos Se trabaj6 con la seccion proximal del brazo y los electrodos se manejaron en forma de anillo utilizando cuatro electrodos uno frente at otro (ver Fig 1) Yun electrodo adicional como referencia

Flenie Fspalila

Localliacion de los electrodos Fig I Descripcion de la localizacion de los electrodos en el brazo del

paciente sano

Dadas las estrategias de entrenamiento de la red se debe definir la forma como estaran compuestas las bases de datos de acuerdo a las diferentes combinaciones en la posicion de los electrodos

De tal forma que si los electrodos se miden con respecto a un punto comtm de referencia se obtienen cuatro mediciones

103

(Oa) Al igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con referencia COlttUltrshy

(

~JP- I ~~_O~[f

(a)

Medicion de voltaje diferencial

fjmiddot ~~Jjl

or- t~Rfr~~~

(b) Fig 2 Localizacion de los electrodos

22 Parte de discriminacion Las seiiales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extension de la muneca pronacion supinacion apertura y

cierre de la mano

~E1E-l o m lID all mo 1000 1210

(b) Flexion de h mlliieca

0112 1 I o 21D lID EIlO mo lIDO 1210

(c) Reposo

Fig 3 Senales e1ectromiograficas

La senal mioelectrica es no periodica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amllisis de Fourier (algoritmo FFT) El espectro de potencia de la senal EMG (ver O)representa una distribucion continua como funcion de su frecuencia

Para la creacion de las bases de datos de trabajo se tomaron como entradas de Ia red neuronal numerosos ejempIos de movimientos incluyendo el reposo a partir de Ia segmentacion de la senal EMG en ventanas de tiempo de aproximadamente 64 ms (l024 muestras a una frecuencia de muestreo de 16 Khz)

)l ~ 1 D 11]] 20J 3D lID SIl all

(a) Apertura de Mano

l j D 11]] 21ll 3D lID SIl all

(II) Flexionde hmlliieca ror---------~--~~---T-----r----

III

3J

2l

10 Dl I D IIll 21ll 3JD IDD roD 6DII

(e) Reposo

Fig4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciaIes junto con las respectivas salidas que confonnan el vector objetivo de clasificacion (Target2

) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen el mismo numero de muestras porque estadisticamente ellos no tienen Ia misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla I)

TABLAl DISTRIBUCI6N DE LOS MOVIJvtIENTOS

J 1 REPOSO 60

Jz APERTURA DE MANO 75

J3 CIERRE DE MANO 75

J4 FLEXI6N DE LA MuNECA 625

J6 EXTENSION DE LA MuNECA 625

J 6 PRONACI6N 625

J SUPINACI6N 625

EI conjunto utilizado de caracteristicas parte de que e~ estos valores esta contenida esenciahnente Ia infonnacion para efectos de clasificaci6n de Ia senal EMG

Sin embargo resulta conveniente una comprobacion yo reduccion del espacio de caracteristicas mediante el analisis

de correlacion segim se explica a continuacion EI analisis de correlacion pennite detenninar Ia dependencia lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor masbajo ell orden de

2 donde las columnas almacenan valores 09 001 para indicar la pertenencia

o no pertenencia a la c1ase de movimiento que c0fesponda

104

irnportanciaEl analisis de correlacion de caiacteristicasparte del calculo de la correlacion y del coefici~nte decorrelaci6n asi 5i se considera un vector caracteristico de entradas X =

Xh xN con Ncaracteristicas la correlacionentre las caracteristicasi-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esta dada en (l)

cCor(Xx)=(IIQ) poundE(X~q)~p)(x(q)_p)(I)Y I J q=l I I J J

donde

E es el operador de valor esperado Xj(qj es el valor de la i-esima caracteristica del vector caracteristico X XV es el valor de la j-esima caracteristica del vector caracteristico X 1 es el valor esperado de la i-esima caracteristica sobre la poblacion de muestra de tamano Q flj es el valor esperado de la j-esima caracteristica sobre la poblacion de muestra de tamano Q

El coeficiente de correlacion estandarizado adimensional esta dado por (2)

~--

Pij =Cij ~(CiiCff) (2)

Esta ecuacion satisface la desigualdad de Cauchy-Sch-vartz quedando acotado el rango para Pij entre los valores-l y I

1 ~ ~j ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pij estara mas cercade cero (Cij 0) Para efectos de reducci6n del numero de entradas a la red neuronal se considera que dos caracteristicas esUin altamente correlacionadas en el caso en el que IPij gt 0707 Para el caso de reconocimiento de senalesEMG se ha considerado que la infonnacion relevante esta contenida en 50 componentes para efectos de reconocimiento de los diferentes movimientos La Tabla II muestra parte de la matriz de correlacion (12 primeras componentes) calculada para la base de datos

I 2 3 4 5 6 7 8 9 10 11 12

y TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACI6N 2 3 4 5 6 7 8 9 10 II 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de nvisar lamatm decoeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pijl lt 0707 por locualse puede decir que noestan altamente correlacionados y en consecuencia puede concluirse que las caracteristicas pueden ser consideradas independientes La parte de discriminacion esta confonnada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizacion del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripcion de cuantas capas tiene el nfunero de neuronas en cada capa la funcion de transferencia de cada capa y como se interconectan elIas entre sL La topologia de la red MLP tiene diferentes capas (ver 0) la capa de entrada (N) unacapa oculta (M) y una capa de salida (J) La capa de salida tiene tantas neuronas como el ntimero de movimientos a desarrollar

El proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validacion y (iii) verificaci6n Las tres (3) bases de datos fueron creadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

105

Vecrorde Entradas

Capade Entrada

Capa Oculta

Capade Salida

Fig 5 Arquiteclura de la red neuronal

TABLA III

11

DISTRIBUCI6N DE DATOS PARA EL APRENDlZAJE DEL MODELO MLP

Movimiento Ejemp Entr Verif ValL REposo 6000 3600 1500 900 APERTURADE 750 450 188 112 MANO CIERREDE MANO 750 450 188 112 FLEXI6NDE 625 375 156 94 MuNECA EXTENSI6N DE 625 375 156 94 MUNECA PRONACI6N 625 375 156 94 SUPINACI6N 625 375 156 94 TOTAL 10000 6000 2500 1500

(Oa) AI igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con Medicion de voltaje referenda COJltUlt clifureJlCial

r-shy

( r ___nlll ( ~____J1 ~ ~r t laquo -1 ~v- fL-Rtr

~_~__ _~_1)7II[f e-~---

(b) Fig 2 Localizaci6n de los electrodos (a)

22 Parte de discriminaci6n Las senales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extensi6n de la mufieca pronaci6n supinacion apertura y

cierre de la mano

~I2E~1a l]] ltOD 6D Em llJJJ Ilm

(a) Apertura de lobno

~~lo 2Il lID EIJl roo HIll =

(b) Flexion de ]a muiieca

oa r--~-----------------

nm l o 211l lID amp10 roo 111l[]

1210

(t) Reposo

Fig 3 Senales electromiograticas

La senal mioeIectrica es no peri6dica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amiHsis de Fourier (algoritmo FFT) El espec1ro de potencia de la senal EMG (vcr O)representa una distribucion continua como funci6n de su frecuencia

Para la creation de las bases de datos de trabajo se tomaron como entradas de la red neuronal numerosos ejemplos de movimientos incluyendo el reposoa partir de la segmentacion de la senal EMG en ventanas de tiempo de aproximadantente 64 ms (1024 muestras a una frecuencia de muestreo de 16 Khz)

~[ j [] VII 2Il m lID EIJl EIJl

(a) Apertura de Mana

l 1 [] VII 211l m lID EIJl EIJl

Ill 40

31

ill

ID []L

D

(b) Flexion de ]a muiieca

IIIl 211l 310 40D IlO Il[]

(c) Reposa

Fig 4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciales junto con las respectivas salidas que conforman el vector objetivo de clasificaci6n (TargeP) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen elmismo numero de muestras porque estadisticamente ell os no tienen la misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla nmiddot

TABLA I DlSTRIBUCION DE LOS MOVlMIENTOS

60REPOSOJ1 75APERTURA DE MANOJz

75CIERRE DE MANOJ3 625FLEXION DE LA MuNECAJ4 625EXTENSION DE LA MuNECAJ6

625PRONACIONJ 6

625SUPINACIONJ

El conjunto utilizado de caracterlsticas parte de que en estos valores esta contenida esencialmente la informaci6n para efectos de c1asificaci6n de la senal EMG

Sin embargo resulta conveniente una comprobacion yo reducci6n del espacio de caracteristicas medianteel analisis de correlacion segun se explica a continuaci6n EI analisis de correlaci6n permite determinar la dependencia

lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor mas bajo ell orden de

2 donde las columnas almacenan valores 09 6 01 pam indicar la pertenenci3

o no pertenencia a la c1ase de movimiento que co~esponda

104

inlportandaEl analisis de correlacion de caracteristicas parte del calculo de la correlacion y del coeficiente decorrelaci6n asi Si se considera un vector caracteristico de entfadas X = XhXN con Ncaracteristicas la correlaci6nentre las caracteristicas i-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esrn dada en (1)

Qc=Cor(XX)(lQ) L E(X~q)-Il)(x(q)_Ilmiddot)(I)

I I J q=l I I J J

donde

E es el operador de valor esperado Xi(q) es el valor de la i-esima caracterlstica del vector caracteristico X Xr) es el valor de la j-esima caracteristica del vector caraderlstico X ~i es el valor esperado de la i-esimacaracteristica sobre la poblacion de muestra de tamafio Q ~j es el valor esperado de la j-esima caracteristica sobre la poblaci6n de muestra de tamano Q

Elcoeficiente decorrelaci6n estandarizado adiinensional esta dado por (2)

Pij = Cij I ~r-(C-iiC-iJ-) (2)

Esta ecuacion satisface la desigmildadde Cauchy-Sch~artz quedando acotado el rango para Pj entre los valores-I y I

-1 ~ Pij ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pj estara mas cerca de cero (Cij 0) Para efectos de reduccion del nfunero de entradas a la red neuronal se considera que dos caracteristicas estan altamente correlacionadas en el caso en el que Pij gt 0707 Para el caso de reconocimiento de senales EMG se ha considerado que la informaci6n relevante esta contenida en 50 componentes para efectos de reconocimiento delos diferentes movimientos La Tabla II muestra parte de la matriz de correlaci6n (12 primeras componentes) calculada para la base de datos

1 2 3 4 5 6 7 8 9 10 11 12

TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACION 2 3 4 5 6 7 8 9 10 11 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de revisar lamatrizde coeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pij lt 0707por 10cual se puede decir que no estan altamente correlacionados y en consecuencia puede concluirsemiddot que las caracterlsticas pueden ser consideradas independientes La parte de discriminacion esta conformada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizaci6n del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripci6n de cmintas capas tiene el numero de neuronas en cada capa la funcion de transferencia decada capa y c6mo se interconectan ellas entre sf La topologia dela red MLP tiene diferentes capas (ver 0) la capade entrada (N) una capa oculta (M) y una capa de salida (1) La capa de salida tiene tantas neuronas como el nfunero de movimientos a desarrollar

EI proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validaci6n y (iii) verificaci6n Las tres (3)bases de datos fueroncreadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

Vector de En1rtdas

Capade Capa Entrada Oculta

Fig 5 Arquitectum de la red neuronal

TABLA III DISTRIBUCION DE DATOS PARA EL APRENDIZAJE DEL MODELO

MLP

I I I

Movimiento Ejemp Entr Verlf ValL REposo 6000 3600 1500 900 APERTURADE MANO

750 450 188 1I2 I

CIERREDE MANO 750 450 188 1I2 FLEXION DE MuNECA

625 375 156 94

i EXTENSION DE MuNECA

625 375 156 94

PRONACION 625 375 156 94 SUPINACION

TOTAL 625 10000

375 6000

156 2500

94 1500 I

105

II

Las pruebas de entrenamiento y validacion se hicierona partir de las bases de datos de trabajo normalizadas ejecutando el programa de entrenamiento de MLP con base en el algoritmo BP

Se realizaron 5 pru~pas para diferentes valores del numero de neurodos de la capa oculta (M) tOl unmiddotminimo de iteraciones de 1000 variando el valor de Mdesde 30 hasta 100 en pasos de 5 A medida que se ejecuta 61 algoritmo de entrenamiento se va evaluando el error de vaHdpoundcion quedando registrada la iteracion para la que se obtiene ~I minimo valor asi como los correspondientes valores de la red El algoritmo se ejecuta

shyhasta que se alcance el numero de iteraciones especificado 0

se logre reducir el error t9tal po debajo del ~nimo preestablecido (0005)

Los valores de los errores mlmmos de entrenamiento y validacion son fundamentalesmiddot cQmo medida para deterrninar el grado de aprendizaje de lalt red y permiten deterrninar el punto a partir del cualla red empieza a memorizar mas que a aprender Se hace tambien necesario prQ9~r la red luego de haber sido entrenada para esto se hace USa de la base de datos de verificacion la cual se pasa a traves de la red neuronal para determinar el porcentaje de aciertos en el reconocimiento de los movimientos dando lugar a la llamada matriz de confusion3

bull

Con base en estos criterios se determinaron las matrices de confusion tanto para entrenamiento como para verificaci6n en cada una de las pruebas realizadas y se concluye que el numero optimo de neurodos para la capa intermedia M en nuestro caso es de 75

3 CONCLUSIONES El amllisis de correlacion de caracteristicas debe hacerse antes de entrenar la red para saber si hay dependencia entre las componentes frtcuenciales

Los valores de los errores mmlmos de entrenamiento y validacion son fundamentales como medida para determinar el grado de aprendizaje de la red especialmente en el punto a partir del cual puede considerarse que la red empieza a memorizar mas que a aprender

Al realizar varias iteraciones se puede escoger el vector de pesos mas adecuado superando el problema de los minimos locales propio del algoritmo de entrenarniento de BP

4 TRABAJO FUTURO Para la openicion en tiempo real [4] se propone que este procedimiento se implemente sobre un procesador digital de senales (ADSP-21061) el cual operara sobre el conjunto de pesos obtenidos gracias a la red y de esta forma poder desarrollar una interfaz electronica que reciba identifique y procese las senales mioelectricas del brazo y ademas que

3 se forma comparando las salidas reales de la red con las salidas deseadas para todos y cada uno de los ejemplos de la base de verificaci6n

controle los movimientos hasicos que se asemejen a los naturales perrnitiendo a su vez ser adaptada al interior de una protesis e1ectromecanica de mano demostrando la efectividad del sistema para pacientes amputados a la altura del tercio proximal (antebrazo) con criterios de viabilidad economica y optimo uso energetico para su funcionamiento EI prototipo planteado presenta la arquitectura de la O

Seihlde los eledloclos

Catr~l5or

~ Digital

I I

Fig 6 Diagrama esquematico de una interfaz para una protesis mioeleclrica

REFERENCIAS [1] Kaduhiko Nishikwa Katsutoshi Kuribayashi Neural

Network Application to a discrimination system for controlled prostheses IEEEIRSJ International Workshop on Intelligent Robots and Systems nov 1991

[2] Adrian del Boca Dong C Park Myoelectric signal recognition using fuzzy clustering and artificial neural networks in real time IEEE Transactions on Biomedical Engineering jun 1990middot

[3] Looney Carl G Pattern recognition using neural networks Theory and algorithms for engineers and scientists Oxford University Press 1997

[4] Embrec Paul C++ Algorithms for Real Time DSP Prentice Hall 1999

[5] Alan V Oppenheim et al j Discrete Time Signal Processing Prentice Hall 1999

AUTORES Ingeniero Victor Hugo Grisales Opta por el master en e1ectrica en la Universidad de los Andes Profesor de tietnpo completo en la Universidad Distrital Director del grupo I+D en instrumentacion y control

Carlos Sanchez Fernando Rosas Vladimir Barrero Juan Leon Estudiantes de ultimo semestre de Ingenieria Electronica en la universidad Distrital FIDC Miembros

Estudiantiles del IEEE

106

ANALISIS ACUSTICO EN LA CLASIFICACION DE SENALES DE VOZ EMPLEANDO RNA

German Castellanos (gcastel1ieeeorg) Francisco Vargas (pcinevadomanizalesunaleduco) Grupo de Control y Procesamiento Digital de Senales - Universidad Nacional de Colombia - Sede Manizales

Resumen Se presenta un sistema de clasificaci6n desefiales de voz basado en sus caracteristicas acusticas el cual se ha dividido en tres partes obtencilm del ensamble inicial de caracterizaci6n acustica de la voz basandose en tecnicas de proceso digital de senales en tlempo real reduccion hasta elmenor ensamble de parametros representativos y suficientemente discriminantes de las clases basandose en tecnlcas estadisticas y por ultimo la construction de las reglas de decisi6n para clasificacion de senales de voz que pueden ser basadas en el empleo de redes neuronales EI sistema rue probado en la clasificaci6n devoz de acuerdo al sexo y edad de los hablanies y como resultado se determinan sus caracteristicas acusticas mayormente influyentesmiddot Ademas esta orieiltado a la tipificacion de norinalidad 0 alteraci6n de las direrentes clases de voz Para el presente trabajo rueronmiddot evaluadas las redes multi-capa y los mapas auto-organizatlvos de Kohonen

L INTRODUCCI6N

En la evaluacion de la voz la metodologia perceptual caracterizada por Ia calificacion de las cualidades vocales segUn el juicio experto de un sujeto necesita habilidades refinadas de escucha EI empleo de tecnologias digitales permite evaluar de manera objetiva la acustica y fisiologia del fenomeno Durante el proceso de evaluacion objetiva de voz normal 0 alteradaes necesario determinar sus caracteristicas cualitativas como es el caso del couelato acustico timbre aspero la emision con quiebres el ataque vocal duro (fmal de frase abortado) voz hiponasalizada y ruido acoplado para lograr muestras que sean altamente fieles alemisor El empleo de sistemas computarizados de anaIisis acustico de voz provee la posibilidad de percibir elementos dificiles de registrar mediante la observacion sUbjetiva convencional

EI uso de caracteristicas acusticas (CA) en la descripcion de normalidad 0 alteracion de voz ha sido probado en VallOS

contextos y con diferentes objetivos por cuanto perrniten ponderar cualitativamente las propiedades de la voz dificilmente realizable por otros metodos [123] Aunque se han Ilevado a cabo estudios de correlacion de estas caracteristicas con la metodologia perceptual sus resultados ademas de ser ambiguos a veces pueden ser contradictorios en el analisis de tipicidad (normalidad) 0 diferentes alteraciones de las senalesmiddot de voz De tal manera que la seleccion

-apropiada de la medida de las CA y su interpretacion sigue siendo un problema sin solucion

parametros representativos de cada clase se realiza el preproceso de los CA sobre los cuales se construye el ensamble inicial de caracterizacion acustica de voz La Seleccion del ensamble efectivo se realiza mejorando la efectividad de empleo de cada uno de los CA para 10 cual se analizan los criterios discriminatorios de correlacion e informacion mutua Finalmente la reduccion de la dimensionalidad de ensamble se realiza por el metoda de las componentes principales Una vez extraidos los parametros necesarios para la caracterizacion de la voz se resuelve la clasificacion de la voz en el tipo normal y no normal (con alteraciones )

MtltJ~ llbIUtl IHlttmllJgt

Fig 1 Diagrama de bloques reconocimiento de palrones de senales de voz

EI reconocimiento de patrones de senales de voz se puede dividir en dos procesosmiddot fundamentales como se aprecia en la figura Imiddot el entrenamiento que comprende la extraccion y seleccion del con junto de caracteristicas acusticas (id iE(I Ni) que representan cada clase de voz kE(lK) y la toma de decisiones que realiza la clasificacion por algun principio discriminante

EI tipo de reconocimiento empleado en el presente trabajo es una derivacionmiddot de lamiddot metodologia propuesta en [22] compuesta de dospartes hasicas a) Extraccion y Seleccion del ensamble efectivo de CA por clase b) el ensamble efectivo de CA es tornado como entrada de una RN usada en calidad de clasificador que en el caso particular fue del tipo backpropagation Asi fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen

2 ENSAMBLE DE CARACTERIZACI6N INICIAL ACUSTICA DE VOZ

La caracterizacion de la voz requiere de un elevado nUmero Elanalisis acustico de un sonido articulado consiste en de valores de CA En el articulo se presentan algoritmos de determinar los indicadoresfisicos de las vibraciones que 10 estimacion en tiempo real para los principales CA que en constituyen tales como la frecuencia la intensidad la general son muy sensibles a las condiciones acusticas de composicion espectral las variaciones del sonido modificadas tnedida [4] Para aumentar la efectividad en el uso de los por la resonancia que actuan originando el producto sonoro

107

que permite predecir la proXima muestra como una percibido [56] La seleccion de parametros que caracterizan

combinacion lineal de las anteriores [10] la voz es tal vez la etapa mas importanteen el desarrollo de sistemas automatizados de su proceso Uno de los principales y(n)=-taky(n-k) (2)problemas en el analisis de las CA de voz consiste en que la mayoria de eUos son sensibles a diferentes condiciones de

k=l

donde q es el orden del predictor y ak son los coeficientes de medicion Este factor conlleva a escoger el ens amble de prediccion lineal (LPC) Los coeficientes ak pueden ser parametros acusticos que brinde la mejor estimacion de determinados a partir del calculo de coeficientes demiddot irregularidad y perturbacion para la clasificacion y autocorrelacion De esta manera se tendcln q coeficientes de reconocimiento de senales de voz En general toda CA de prediccion lineal por cada trama de la senal de voz Tambien amilisis debera cumplir con las siguientes propiedades [6] a) es habitual aplicar el calculo de los coeficientes LPC Debe ser facilmente estimable y 10 menos dependientes de las cepstrales (Ia transformada de Fourier inversa del espectro de perturbaciones ambientales b) Su estimacion debe ser estable amplitud logaritmico) que representan la respuestaen el tiempo y c) No debe ser imitable Las CA pueden ser aproximadamente logaritmica 0 psofometrica del oido agrolJados de acuerdo a las propiedades acusticas que deben humano Los coeficientes LPC cepstrales Ck presentan la medir y los cuales en la practica se asocian en dos categorias ventaja de convertir el ruido convolucional en ruido aditivo y [7] permiten separar la excitacion glotal de los parametros del

tracto vocal Seguidamente se emplea un tipo de ventaneo que a) Parametros cuasiperiodicos Son disenados para la acentue los pesos de los LPC cepstrales con el objeto de captura de varias fonnas de periodicidad de las obtener mayor discriminacion de la envolvente espectral perturbaciones en la senal aclistica Entre los principales

parametros de este gropo estan b) Parametros de perM-bacion Destinados a medir la componente relativa de ruido en la senal de voz Para la

La Frecuencia Fundamental (Fo) que es referida a las estimacion de las perturbaciones de los parametros de la caracteristicas de cuasiperiodicidad de la senal en el tiempo frecuencia fundamental es comun el empleo del promedio Los diferentes metodos de estimacion del calcul0 del Fo relative de perturbacion (RAP Relative Average Perturbation) fueron analizados y comparadosen [S] por tiempo de proceso

definido como [1311] y precision obteniendose que el metodo (AMDF Magnitude Difference Function) [69] es mas veloz cuyo algoritmo esta

dado por iJ n z=(tIZH +z Zi+l -Zi llLRAP 1=1 3 1=1

AM(km)= (3) siendo n es el numero de ciclos consecutivos analizados 1 m

- Lly(n)- y(n-k)w(m-1t) Cuando el panimetro de perturbacion z se refiere al periodo N n=m-N-l) de la frecuencia fundamental se define el Jitter mientras que

en el caso de su amplitud se define el Shimmer [14] EI nivel (1) de perturbaciones tambien puede ser caracterizado por elDonde yen) es la senal digitalizada de voz wen) es la ventana

de proceso con longitud N m es el numero de muestras armonico ruido H 0 energia promedio del ruido de fondo ij(t) empleadas en la estimacion k es el retraso para el cual se esta que se determina como

Tcalculando el AMDF H = 11Jr((r)ciT (4a)

Los formantes En el espectro de una senal de voz se o encuentran regiones de enfasis (Uamadas resonancias) y de donde 1E [01] El componente de ruido N se defme como la deenfasis (antiresonancias) [9] ambas resonancias diferencia de energias de la senal de informacion y del denominadas formantes que siguen patrones comunes en la armonico ruido mayoria de los humanos determinadas basicamente por sus medidas antropometricas [101112] En la practica se nT analizan 5 fonnantes (FI F2 F3 F4 F5) junto con sus N = LJ[yj (1 )-11(1)]2 dT (4b)respectivos anchos de banda (LlWI LlW5Y los cuales se

=1 0 definen como el gropo de frecuencias que hay desde la caida a

donde 1E[O1] Finalmente el armonico ruido se determinposterior y anterior de 3 dB La energia del formante sera el como HNR=HIN Para aplicaciones profesionales la energia

valor del pica y el valor del formante la frecuencia donde se se determina por la diferencia entre la energia de la emision

encuentre el pica anterior [11] La estimacion de los vocal y la energia del ruido ambiente dado por formantes se realizo sobre algoritmos basados en la

suposicion de que la voz puede ser representada por modelos II

P(n) = -1

Ly2 (i) (4c)en fonnadeun numero reducido de indicadores a partir de n 1=1los cuales es posible su reconstruccion adecuada Para esto se S

donde n es el numero de puntos de la senal y(t) OlrD empleantecnicas de prediccion lineal basadas en el a

parametros analizados son la Energia de nlido normalizadmodel ado deltracto vocal mediante un filtro de solo polos (NNE) que ha sido estudiada en varios contextos [71415] Y

108

la excitaciim g16tica a ruido (GNE) estima el ruido en un tren el proceso de medicion influencia de fuertes perturbaciones de pulsos que es tipicamente generado por la oseilacion de los etc En este caso el valor anomalo del arreglo se expresa pliegues de voz [3] mediante el valor critico de la distribucion de Student fp n-2

La cantidad de CA N de representaci6n de voz t es [1717] completado por la primera (parametros delta) y segunda derivada (delta-delta) en el tiempo de los LPC cepstrales [6] y I e- In I[J s Ipn_] (n-I )112I(n-2+(lpnd)lf2 (5) debe realizarse para cada una de los tipos de senales de voz a clasificar Realmente cada CA puede influir de diferente siendo JIll yO respectivamente la media y varianza del manera en la pronunciaci6n de cada palabra En la practica de valor extremo en analisis del arregl0 I p es el nivel de la fonoaudiologia es comllo el empleo de palabras claves 0 significacion A efectos de comparaci6n de las realizaciones maestras En el caso particular se cada muestra fue tomada de losdiferentes parametros acusticos es preferible su basados en la pronunciaci6n de las cinco vocales estandarizacion estadistica Asi

Cabe anotar que el reconocimiento de senales de voz debe (6)~I =(i- mJ)O realizarse en linea por 10 que los algoritmos de proceso deben estar orientados a su desarrollo en tiempo real Los metodos empleados de estimacion de cada caracteristica fundamentalmente empleando metodos de amiJisis en acustica exigen la verificacion de hipotesis de la intervalos de tiempo cortos de los segmentos de voz los homogeneidad la cual se lleva a cabo por el criterio i y en cuales se analizan en [616] casos extremos se emplea el metoda Kolmogorov-Smirnov

[IS] Si laverificacion muestra claramente la invalidez de la hipotesis de gaussividad es importante determinar el tipo de

3 SELECCION DEL ENSAMBLE EFECTNO distribucion de fdp para cada ensambleI y si es posible la forma de su transformacion a la normal La transformacion de

La extraccion de CA se realiz6 acorde a los algoritmos la variable [Jj en sect con distribucion nonnalizada se determina presentados en anteriormente Asi se escogio un conjunto de de la relacion caracteristicas acusticas UiI i= I bullN que representan cada dase de voz k= I $ El sistema automatizado de extraccion ~

de parametros calcula 20 CA para cada una de las cinco ~21C1_ J e_2 dt =Lr M ji(Aji-1 lt Sjlt Aji) voeales (aIlellillollul) pronunciadas en la emision de voz a __ =1 N analizar Como resultado se obtuvo un valor de Nr I 00 para

j

(7)una sola emision de un paciente dado En cuanto a los grupos de clasificaci6n se definieron los siguientes a) Hombre

donde ~gve es el ens amble real de 0 res el nlimero relativo Adulto k=l b) Hombre Nino k=2 c) Mujer Adulta k=3 y d)

de intervalos delhistograma AJi Aji son los valores extremos Mujer Nina y k=4

del intervalo i del histograma del parametro 01 ~ es la frecuencia de ocurrencia en cada intervalo del intervalo i Una

Las estimacion de las CA de voz e es muy sensible a forma empirica alterna de ajuste consiste en la transformacion

faetores tales como las condiciones acusticas de toma de de cada CA 0(1) por diferentes operaciones basicas y

senales (ruido de fondo hardware de registro electronico comunmente empleadas en el tratamiento de voz

tiempo del dia en que se Ie toman las muestras al paciente contenido de las palabras etc) por 10 que la primera tarea a

~(I)=lg((I)plusmna) I01 c(1)=lg(aplusmn (I)(I) resolver en su clasificacion usualmente es el preproceso de

~(I)=1((1)110datos de las realizaciones que esta orientado a aumentar la efectividad en el uso de los parametros representativos de cada clase De otra parte la cantidad de realizaciones 0 Despues de cada transformacion se realiza la prueba i y se

toma aquella operacion que con mayor certeza confirme la ensamble N determina las limitaciones en la eleccion del hipotesis de gaussividad En general para cada []jk se puede metodo de preproeeso en particular se debe evitar el efecto tener una transformacion diferente [23] de valores extremos de ensamble muy pocas realizaciones 0

sobrevaluacion del ensamble [17] Las CA estan construidas La seleccion del ensamble efectivo de los rasgossobreestimaciones por 10 que es importante tener discriminantes constituye el aspecto fundamental en uninformacion sobre la fdp (0 su familia) para la cual se sistema de reconocimiento de patrones Las propiedades que calculan sus momentos Por este motivo el ensamble de deben cumplir las CA para su selecci6n son las siguientes prueba Ne se escogi6 de acuerdo al minima numero de

realizaciones que se deben tener para verificacion de Capacidad discriminante Es decir que separen 10 mashipotesis que para valores dados del nivel de significacion nitidamente posible las clases existentes P 01 Yun error de 10 obteniendose N90 muestras por Confiabilidad Esto es los objetos de una misma clase clase [17] deberan presentar la menor dispersion posible Ausencia de correlacion Es decir evitar en 10 posible la La siguiente etapa en el preproceso de datos esta enla utilizacion de caracteristicas que dependan fuertemente eliminacion de datos anomalos debidos a posibles errores en entre si

109

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 2: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

La actualizacion de los parametros internos de la red es gobernada por

w(t +1) =w(t) -11lt1gt(t) (2)

siendo

d(Ln ET (n)E(nraquo _ d(a)eIt(t) = - -shy (3)

dW(t) dW(t)

donde 11 es la tasa de aprendizaje Dado que ltIgt(t) corresponde al gradiente del vector de error E caltulado en cada iteracion de tiempo t sobre todos los patrones 11 de entrenamiento este depende tanto de la entrada del sistema como de los valores pasadosdel vector de salida de la red Para modelar esta subordinacion se emplea elconcepto de derivadas ordenadas [6] asi

ltIgt(t) =L[dY(l1) YdegA+ a (4) n dW(t) J oV(n)

0+a ~ ~a +I o+a oY~n +k) oY(n) oY(n) k=loY(n+k) oY(n)

(5) EI procedimiento de entrenamiento as tornado obUga se consideren los aportes entregados al error en el tiempo corriente por las salidas de lil red en tiempos pasados debido a la recurrencia de estos datos La actualizacion de los pesos se realizani mediante actualizaciOn por bloque (batchshyprocessing)

22 RlVA temporal recllrrelite Estas redes introducen conexiones cori retardo entre neuronas incorporando a la red dependencia en eUiempo de la serle de datos manipulados Adicionalmente cuentan con lazos de retroalimentacion que como ya se menciono dotan al sistema de caracterlsticas dimimicas en su procesamiento [8] La estructura de la RNA y su diagrama funcional se representan en la figura 2

_--fj I

W VR

L---+~t) a) ~a~

Fig 2 Propagacion hacia delante de una red temporal y detalle de una de sus bull conexiones

El valor de la entrada neta para la neurona j en la capa I y su valor de activacion se expresan en (6) y (7) respectivamente

I I R

s~(t) Ls~(t)+bj L LWfr

a-1(t-r)+bj 1=1 1=1 r=O

I

=Lwijashy1(t) +b j (6)

=1

a~(t) =f(s~(traquo)= f[tW Ija-I(t)+b j ) (7)

siendo W ij =lwijl Wij2 wjr bullbullbullbull WijR J y a-I(t) =[a-I(t)a-I(t-l) a-I (t-R)]

Resumiendo elalgoritmo de retropropagacion temporal y

tmnando en cuenta que 8~ (t) es el error que se propaga hacia

atnis a traves de la capa I y 11 es la tasa de aprendizaje Se

tierie que

92

w~ (t + 1) =w~ (t) -11 8~ (t) a- I (t) (8)

- 2ek (t)middot (s (traquo

8~ = (S~(kraquoto~+I(t)W~~1 I=L

I ~ I ~L-l (9)

(k)

Fig 3 Propagacion hacia atms del error en una red temporal

middot3 CONFRONTACION DE LOS SISTEMAS ARTIFICIALES

La parte inicial del estudio estaba orientada a determinar de las dos redes exploradas producia los mejores resultados a la hora de evaluar la respuesta de un sistema dimimiCo no lineal Para tal efecto se apelo a una investigacion afln previa en la que el sistema a identificar correspondio a un estrato de suelo especifico y se trabajo con una RNA de retropropagacion temporal recurrente como la mostrada en 22 [5] Se elabora entonces una red del tipo presentado en eI literal 21 para estimar la respuesta del sistema bajo condiciones semejantes a las adoptadas en la referencia y asi poder cortejar los resultados obtenidos en ambos estudios A continuacion sepresentan las estimaciones producidas por lamiddot red que mejor comportamiento presento durante las exploraciones realizadas para el caso recurrente La arquitectura utilizada consistio en 4 neuronasde entrada las tres primeras para manejar vectores con los valores para las aceleraciones velocidades y desplazamientos2 con treS

2 Calculados a partir de las aceleraciones mediante integra cion numcrica previa correccion por linea de base [3]

niveles de retardo y la ultima para ingresar las estimaciQnes de la red con un retardo de 4 tiempos dos capas ocultas con ocho neuronas cada una y una unica neurona de salida para estimar la ~spuesta en aceleraciones del estrato de suelo en estudio~ Se presentan a continuaci6n la respuesta proporcionada por la red entrenada para dos realizaciones sinteticas con sus equivalentes para el sistema evaluado en la referencia Se observa claramente que la red propuesta en el literal 21 no alcallZa un comportarniento aceptable en ninguna de laS expliiraciones sin embargo las velocidades de convergencia en la fase de entrenamiento son muchos mas altas que en el caso reportado de la red temporal Esta ultima aventaja at primer sistema artificial en el acierto de las estimaciones sobre las respuestas del sistema real considerado Se quiere ahora tomar las facultades que han exhibido cada una de las redes aqui estudiadas para formar un sistema Olucho mas completo Por consiguiente semiddot modificanl el algoritmo de retropropagacion temporal recurrente complementando en su cicIo de propagaci6n del error por la red el concepto de derivadas ordenadas que a juicio de los autoresmiddot prove era importantes caracteristicas necesarias para optimizar el entrenamiento

RlldlliliciOl~ 11 bull EIIT1EHAMENTO

middotmiddotrl------~----~~--------------~----_

~ w~_ Il -

(i-= I o 10 15 20 2S

r9fpoIS50~

(a) Rulmobl nllllica II

02

i~~~~ __ IOE SPUE

STACE

~

~o 1l ~tJ - - o 1$ ---- 10 I

TIMtpO (HoG) 1$ 0 (b)

FWdaeiCIISftDca ~ENTRENAMEHTO

r~

(~ml o 10 11 20 2$

lIIfIIPO S89~

(c)

93

to

- fpoundSPteuro$TA DE fUtA

lJ1LUUIJtMraquoJ~

(d)

Fig 4 (a) y (b) Entrenamiento y simulaci6n con la red reeurrente del literal 21 respectivamente (c) y (d) son resultados extrafdos de [5J para la red

temporal de 22

4 EVALUACIONDE LA RESPUESTA DE LA ESTRUCTURA DE UN EDIFICIO

La siguiente etapa de la exploracion consiste en evaluar el comportamiento de la red de retropropagacion temporal recurrente modificada comparando los tiempos de entrenamiento en el caso ya estudiado Adicionalmente se juzgara su habilidad para estimar la respuesta dinamica de la estructura de un edificio en su 50 nivel al ser excitada en la base por un tren de aceleraciones Esta fase de la investigacion esm en desarrollo

5 CONCLUSIONES

Se encontro que la red recurrente para identificaci6n de sistemas no adquiere igual destreza en el acierto de las estimaciones de la respuesta del sistema examinado a la exhibida por la ted de retropropagaci6n temporal recurrente No obstante las velocidades de convergencia en la fase de entrenamiento para el primer caso son ostensiblemente mayores que para el segundo mostrando mejores caracteristicas para encontrar un valor minimo en la funci6n de costo

REFERENCIAS

[1] BARBAT AH OROSCO Lbull HURTADO JE GALINDO M DefiniCion de la Accion SIsmica Monografias de Ingenierla Sismica No 10 Centro Intemaclonal de Metodos Nurnericos en Ingenieria Barcelona 1994

[2J DAS BM Principles ofSoil Dynamics PWS-Kerit Boston 1993 [3J HURTADO 1 E ModelaciOn estocdstica de la accion sismica

MonografIas de IngenierJa Sismica No 33 Centro Intemacional de Metodos Numencos en Ingenieria Barcelona 1999

[4] middotJANG 1bull SHING R SUN CT y MJZUTANI E Neura-Fuzzyand Soft Computing Prentice HaUNew Jersey 1997

[5] LONDONO 1M y MEZA MA Redes neuranales artificiales aplicadas a la simIlacon de ondas sismlcas a traves del Slielo Tesis de grodo Universidad Nacional de Colombia Sede Manizales 2000

[6J LUO F L Y UNBEHAUEN R Applied neural networks for signal processing Cambridge University PreSs 1998 Pag 317-323

[7] REINHORN AM y KUNNATH SK DARC RESEARCH purposes 1992

[8] WAN ERIC A Finitemiddot Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

CLASIFICACION Y RECONOCIMIENTO DE IMAGENES GEOMETRICAS BAsICAS USANDO RNAs

Olaya Ramirez Fabian A Gallon Cannon a Camilo Eduardo Caicedo Jesus A Lopez Grupo de Percepcion y Sistemas Inteligentes Escuela de Ingenieria Etectrica y Electronica

Universidad del Valle Cali Colombia psieieeunivalleeduco

Abstract Este articulo presenta el desarrollo de una estructura algoritmica basada en una aplicJlcion para el reconocililiento y cIasificacion de imagenes ReI fundamentalmente figuras geometricas mostrando apartes en cuanto al sistema de procesamiento de las imagenes y estructura de red neuronal utilizada demostrando ast la gran capacidad de procesamiento adaptabilidad generalizacion y agrupamiento de las RNA aplicadas a la inteligencia computacional y tomando como esquema que la mayoda de los modelamientos de entornos en vision artificial son desarrollados sobre bases geometricas [Gallon 20011 Este articulo describe el desarrollo de procesamiento de la imagen la obtencion de caracteristicas de cad a patron imagen tipo de arquitectura aprendizaje utilizado y su propio reconocimiento y cIasificaciOn

1 INTRODUCCI6N

Este articulo detalla el desarrollo de una aplicacion para demostrar el alcance de las RNAs en la c1asificacion y en el reconocimiento de imagenes

Este articulo brinda la posibilidad de explorar el desarrollo de la herramienta partiendo con un marco teo rico sustentando las caracteristicas de generalizacion entre otras propiedades que la componen y que las hace tan especiales en este tipo de aplicaciones Luego se presenta el modelo metodologico donde se explica cada uno de los pasos y procesos realizados comenzando desde la captura de la imagen pasando por el procesamiento y extraccion de sus caracteristicas y terminando con el aprendizaje y cIasificacion [Buhmann 99]

El reconocimiento y cIasificacion de imagenes es una hcrramienta crucial para la vision artificial y en especial robOtic a movil debido a que puede reforzar la posicion y orientacion del robot permitiendole interpretar caracteristicas de las senales (en vez de memorizar las senales enteras) por ella la importancia de llegar a un metodo de procesamiento de la imagen que nos permita mane jar diferentes figuras tanto rectas como curvas

2 PERCEPTRON MULrlCAPA

La utilizacion del Perceptron multicapa con el algoritmo de aprendizaje BP se debe a que este permite calctilar el error a la salida de la red en forma exacta y asi propagarlo hacia las otras capas ocultas y con el mismo calcular la medida del error que se tiene en dichas capas asi se pueden variar los

pesos entre las conexi ones asociados con el patron de entrada y salida [Freeman 93]

CAPADE ENTRADA

Unidadesde terldencia Salida = 1

CAPAOCULTA CAPADE SALIDA

CirC1J1o

Cuadrad

Redangl

va

Fig I Red para reconocer y clasificar figuras geometricas[Gallon 200 I]

En la figura 1 se puede observar una estructura de red neuronal para reconocer y cIasificar figuras geometricas que basicamente consta de una capa de entrada que detalla los patrones caracteristicos de cada figura una capa oculta necesaria para el procesamiento de la red y una capa de salida donde se encuentra la relacion con el conjunto de figuras a reconocer y clasificar H

3 SISTEMA DE PROCESAMIENTO DE IMAGEN

Es el momento en el cual tenemos las imagenes en el ordenador asi para la adquisicion de estas se puedeutilizar desde una camara digital hasta un editor de inuigenes dentio del mismo PC con el fin de formar un archivo completo de imagenes para la realizacion de las pruebas y funcionamiento de la herramienta

94

En la figura 2 se puede observar un diagrama de flujo geIler~1 ~e los pasos basicos para reconocimiento y cl~~fi~acion~~ tmagenes

peprtlCtS3do

dominio del problema--_1-shy

adqllisiciro d~ imageotS

bast dt laquolooeimiento

~nocmerto e

ittrpnuclon

dlt

Fig 2 EtapasJundamentales del procesamiento digital de imagenes [Gonzalez 961

31 Preproeesamiento En la rase de Preprocesamiento de las figuras geometricas tal como se ve en la Fig 3 se realizaron los siguientes procedimientos

it Binarizacion

bull Calculo del centro de graved ad bull Normalizaci6n del tamano bull Centrado de la imagen

FIg 3 Algunas representaciones de las imagenes utilizadas por la aplicacion

[Gallon 20011 32 Obtencion de los veeores earaeteristieos

(deseriptores) En esta etapa se obtienen los vectores caracteristicos de cada figuni a reconocer y cIasificar Para ello se parte del centro de la imagen ya procesada y se recorre la matriz de pixeles des de este punto hacia los bordes de la figura sobre las diagonales principales secundarias horizontal y vertical tal como muestra la Fig 4 obteniendo ocho distancias euclidianas que para cada figura seran 10 bastante propia y significativa

t ~ J

3

Fig 4 modelo de descriptores [Gallon 20011

33 Fase de Aprendizaje Esta es la rase de entrenamiento de la red baSados en el algoritmo de aprendizaje Backpropagation y tomando como

95

punto de partida losvectores caracteristicos de cada imagen y SllS respectivas variaciones como rotaciones traslaciones tamaiio etc La arquitectura de red para la c~l este metodoes valido es la de un Perceptron multicapa como eI que se muestra en la Fig 1 y enfatizando asi que el numero de capas utilizado no es fijo y depende exclusivamente del usuario en cuanto a las pruebas y amilisis que se realicen Este aprendizaje tJene comienzo excIusivamente teniendo muy claro las clases de imagenes para las cuales el sistema se va a entrenar luego se escogen los patrones caracteristicos y mas representativos de cada imagen as se puede crear un archivo de patrones con todo eI conjunto anterior como se muestra en la Tabla 1

TABLA 1 ARCHIVO DE ENTRADA PARA ENTRENAMIENTO DE LA RED

[GALLON 2001]

Despues de caigar este archivo de patrones al sistema se procede a ajustar todos los parametros de la red para este caso los del algoritmo de entrenamiento como son alfa beta velocidad de animacion numero de iteracionesyajustar los parametros de la arquitectura como numero de capas numero de neuronas por capa y las respectivas funciones de activaci6n todos estos ajustes y la exactitud de ellos dependen exelusivamente de la experiencia del usuario con sistemas de redes neuronales de este tipo

34 Fase de Reeonocimiento y Clasifieacion Este es el objetivo principal de este desarrollo asi para el conjunto de figuras geometricas escogido se organiza por clases como 10 5011 la clase cuadrado circulo rombo entre

otras y asi la verdadera clasificacion se da despues de vaHdar el sistema es este instante se corrobora el verdadero aprendizaje de la red si esta c1asificacion no tiene exito se procede a evaluar los puntos defallo del sistema y se vuelve a entrenar la red con los ajustes previos que conlleven al mejoramiento en la c1asificacion En la figura 5 se puede observar el procedimiel)to blisico utilizado para 1a obtencion de los resultados del trabajo

~ P Poblacion de objelos

ReconocimienloSeosado Exlraccion d Mediday Rasgos

IProeeamienl I

I

Objeto I)alo Medido Vector de Identificadol Muestreado Rasgos clases

Fig 5 Proceso de reconocimiimto y c1asificaci6n de patrones [Darpa 88]

4 RESULTADOS Y ANALlSIS

Se probaron redes con una sola capa oculta con diferente nfunero de neuronas y funciones de activacion asi durante el proceso de aprendizaje se elcontraron diferentes problemas e inconvenientes como la no-convergencia del proceso de entrenamiento de las redes debido en gran medida a que el conjunto de patrones de entrenamiento excedia la capacidad de aprendizaje de las redes ytambien la apandon de grandes minimos locales en la funcion del error cuadnHico que se generaba por 10 que se dificultaba la posibilidad de alcanzar el minimo global durante e1 entrenamiento tambien surgieron problemas de saturacion en algunas neuronas de la capa oculta Para solucionar estos problemas presentados en principio se decidio analizar diferentes tipos de arquitecturas con diferente numero de capas mimero de neuronas por capa y numero de iteraciones para asi poder llegar a una solucion

satisfactoria Para el entrenamiento de la red se utilizaron las siguientes figuras teniendo en cuenta sus rotaciones y algunos niveles de ruido que en promedio era del 20

Circulo con 23 figuras Cuadrados con 20 figuras Elipse con 36 figuras Pentagono con 33 figuras Rectangulo con 46 figuras Rombo con 43 figuras Triangulo agudo con 80 figuras Para un total de 281 figuras para el entrenamientocada figura con 8 posiciones teniendo un numero de patrones igual al numero de figuras parametrizadas

La seleccion de las figuras para entrenamiento se realiz6 tomando criterios como la representatividad figuras con valores criticos (como figuras de la misma clase pero con patrones muy dijerelltes alas otras) figuras que tuvieran dificultad en e1 procesamiento de 1a imagen (como figllras que en el procediniiento de normalizacicm del tamano pierden algunas caracteristicas) figuras limpias y figuras bien definidas En la busqueda de la mejor red se probaron muchas arquitecturasen la Tabla 2 se presentan algunos de los resultados obtenidos durante la etapa de aprendizaje teniendo en cuenta diferentes criterios en cuanto al numero de capas mimero de neuronas de la capa oculta(CO) tipos de funciones de activacion en capa oculta y capa de salida y numero de iteracionestambien se presenta en la ultima columna el Error cuadriitico(EC) correspondiente a cada

arquitectura TABLA 2

RESULTADOS DE APRENDIZAffi CON VARIAS ARQUITECTURAS

N0 Ndeg de FA FA Ndeg de Ue EC cap neur co CS

CO 3 16 3 8 3 8 3 8 2 3 8 3 3 8 3 3 7

3 7 3 3 7 2

3 5 3 7 3 12 1 3 16 4 4

4 16 4 16 I

Funciones de activaci6n 1 Timgencial-sigmoidal 2 Lineal 3 Sigmoidalmiddot

2

2 2 3

2

2 2 2

2 2 2 2 2

23000middot 014

25000 011 25000 015

25000 Instable

25000 046

25000 0377 25000 016

25000 lnestable 25000 inestab1e

25000 022 25000 023

25000 008

25000 007

25000 0058

50000 00008

75000 00003

En la busqueda de la mejor red se encontro que e1 mejor ~ fue de 01 y 0 fue de 00075 aunque tambien respondi6 bien con un ~ de 05 peru con un 0 de 000075 los valores anteriores son determinantes en la busqueda del mejor entrenamiento estos son como factores de amortiguamiento para tratar de evitar un cierto numero de oscilaciones en la busqueda del menor error cuadriitico Otro criterio evaluado fue el numero de iteraciones siendo las arquitecturas de 4 capas las que se desfasaron en ese pariimetro pero comparando estos dos parametros y despues d~ un arduo pruceso de validaci6n acontecio que el tiempo invertido en el numero de iteraciones

es recompensado en Ia validaciol1 de las imagenes

obteniendose un mejor rendimieilto para la arquitectura de 4 capas [Ganon 2001]

96

CONCLUSIONES

pound1 proceso investigativo que se nevo a cabo se encamino a la utiIizacion del algoritmo de aprendizaje Backpropagation aplicado a una red MLP Fig 1 para que interactuaracon el sistema de procesamiento de imagenes por ser no solo el que mejor se acoplaba a las expectativas del desarrollo sino tarnbien por sus caracteristicas El desatrollo en cuanto a procesamiento de imageries frente a aspectos como el tamano posicion orientacion y cIase de imagen at que se llego mediante el desarrollo investigativo dio com() resultado un sistema que Ie presentara al usuiuio la oportunidad de analizar y estudiarmiddot una aplicacion predeterminada nombrada anteriormente y asi mismo poder tener acceso a otro tipo de imagenes desarrolladas por el e interpretadas a su gusto [Reiher 99]

El objetivo de laspruebas que se realizaron en esta aplicacion fue tratar de encontrar los parametros optimos de la red neuronal que consigan reducir al maximo el error en el menor numero de iteraciones aunque no siempre es posible alcanzar eI error minimo con un minimo de iteraciones ya que luego de determinada cantidad de iteraciones elerror decrece muy lentamente Debidomiddot a estomiddot es necesario sacrificar econom~a (aUl1lellto de capas ylo lIeuronas ocultas) [Vapnik 95]

Si las formas de las figuras son muy semejantes entre sf dentro de la misma clase el errormiddot disminuye muy nipidamente consiguiendose un valor muy pequeno Por otro lado si estasfonnas de las figuras son muy diferentes dentro de 1a misma dase la ve10cidad de aprendizaje es muy lenta y en ocasiones ocurren oscilaciones bruscas Luego se puede afirmar que la red aprende formas semejantes con mayor facilidad que formas diferentes En ocasiones si las fonnas de las figuras son muy semejantes entre si excepto algunos diferentes es posible que la red ignore estos ultimos si no hay suficientes neuronas en la capa oculta Tambien para evitar esto se pueden reducir la cantidad de figuras en el entrenamiento escogiendo las mas significativas as ya no habrii mayoria Se comprobo una vez mas que una de las mejores aplicaciones que tienen las redes neuronales artificiales es reconocimiento y clasificacion de patrones aprovechando la capacidad de generalizacion de las redes las cualespueden aprender de una serie de modelos originales de diferentes clase para luego ser ~apaces de determinar la clasea la que pertenecen otras entradas distintas de los patrones aprendidos EI metodo presentado podria considerarse como una primera etapa de clasificaci6n de lmagenes que podria complementarse con otros metodos para asegurar una clasificacion mas detaHada y precisa Asi mismo podrian ll1ejorarse los resultados una forma podria ser aumentando el nUmero de patrones presentados a la red en la fase de aprendizaje 0 aumentando el vector caracteristico de cada patron tambien se podrian utilizar otros metodos de Caracterizacion de las imagenes como por ejemplo valores obtenidos mediante la compresion con otra red neuronal u

otros tipos de redes y algoritmos de aprendizaje 0 utilizando otro tipo de procesamiento de la imageI [Jason 96]

BIBLIOGRAFiA

[Buhmann Malik Perona 99] Joachim M Buhmann Jitendra Malik and Pietro Perona Institute of Informatics University of Bonn Germany Department of electrical and computer science university of California Berkeley 94720 Department of Electrical Engineering California Institute Technology Pasadena 91125 [Darpa 88) Darpa Neural Network Study Ed AFCEA Press Washington 1988 [Freeman Skapura 93) James A Freeman David M Skapura Redes Neuronales-algoritmos Aplicaciones y Tecnicas de Propagacion Addison-wesleyDiaz de santos 1993 [Gallon Olaya 2001] Camilo Gallon Fabian Alonso Olaya R Herramienta de Simulaci6n para el Reconocimiento y Clasificacion de Imagenes con Redes Neuronales Artificiales (UV-SRNA-RCI)Tesis de Pregrado Universidad del Valle Pregrado en Irtgenieria Electronica Santiago de Cali 2001 [Gonzalez 96] Rafael C Gonzalez Richard E Wods Tratamiento Digital de Imagenes Addison - Wesley I Diaz de Santos 1996 [Jason White Chase Luo Sutton 96) Jason A Janet

Mark W White Troy A Chase Ren C Luo John C Sutton 96 (1996) Center for Robotics and Intelligent Machines Departritent of Electrical and Computer Engineering North Carolinamiddot State IEEE International Conference on Robotics and Automation Minneapolis Minnesota April (1996) pag 3598-3604 Addison wesleyiberoarilericana rama 1995 (Vapnik 95] Vapnik V N (1995) The nature ofstatistical learning theory (Springer NY) [Reiher SaidLiSuen 99) Eric Reiher Fady Said Ying Li and Ching Suen Centre de recherche informatique de Montreal 1801 McGill College Avenue Suite 800

Montreal Quebec Canada H3A 2N4 Centre for Pattern Recognition and Machine Intelligence 1550 de Maisonneuve Blvd West Suite GMi06 Montreal Quebec Canada H3G 1M8 Commission III Theory and Algorithms KEY WORDS GIS Cartography Vision Neural Networks Pattern Recognition 1999

Ing FABIANA OLA YARAM1REZ lng CAMILO GALLON Ca~ona

Ingeniero Electr6nico graduado de lngeniero Electr6nico graduado la Unive~sidad del Valle 2001 de la U~iversidad del Valle200 Profesor dellnstituto tecnico rng De Servicios DATECSA PROYECT A e Ing de Campo Cali Colombia OMNICON Cali Colombia camillonlaciudadcom ffaortutopiacom

UNA APROXIMACION A LOS INSTRUMENTOS VIRTUALES PARA EL CONTROL CONREDES NEURONALES Y LOGICA DIFUSA

Ing Jaiber Evelio Cardona (jaibercyubartaunivalleeduco) PhD Eduardo Caicedo (ecaicedoeieeunivalleeduco) MSc Eduardo Owen (ejoweneieelInivalleeduco)

Grupo de Percepcion y Sistemas Inteligentes Escuela de Ingenieria Electrica y Electronica

Universidad del Valle psieieeunivalleeduco

Resumen En el presente articulo se muestra una clase de ~ Backpropagalion E3 instrumentos virtuales diseiiados por el grupo para implementar estrategias difusas y neuron ales y se realiza una aplicacion practica para el control de una planta de presion del Laboratorio de Automatica se comparan los resultados obtenidos ante un control PI clasico un control PI difuso y un control neuronal por modelo inverso especializado de la planta

Palabras clave Redes neuronales sistemas difusos control inteligente Instrumentacion virtual

1 INTRODUC CI6N

Con la adicion de caractcristicas especiales como capacidad de computo y simplificacion de tareas para el operario se incremento el costa de la instrumentacion se penso entonces en mejorar el desempefio sin adicionar gastosUna de las soluciones planteadas fueron los instrumentos virtuales [GOLDBERG 00] incorporando el hardware y el software necesario para que computadoras de propos ito general pudieran realizar eI trabajo dejando a elIas el intercambio de informacion entre el usuario y el sistema

Uno de los programas que permite realizar aplicaciones en instrumentacion virtual es elLabView bajo este software se estan desarrollando en la Universidad del Valle modulos de proposito general llamados instrumentos virtuales en Lab View (VI) para la implementacion de estrategias difusas Figura No 1

y neuronales que permitan realizar aplicaciones de tipo industrial y de laboratorio Los instrumentos virtuales mas importantes se En este articulo se muestran algunos avances en este mencionan a continuacion propos ito aplicando los VI desarrollados al control de una planta de presion bull Inicializa back inicializa Kohonen (Fig No 2)

2 INSTRUMENTOSVlRTUALES DESAR ROLLADOS Permiten asignar a los pesos de la red valores aleatorios entre cero y uno

Para la implementacion de las estrategias inteligentes basadas en logica difusa y redes neuronales backpropagation bull Procesa entrada procesa Kohonen (Fig No 3) y Kohonen se han desarrollado instrumentos virtuales agrupados en submenus dentro del Labview dichos Se entrega un vector de entrada a la red y se calcula la submenus pueden ser incluidos en la paleta de funciones salida Para una red Backpropagation la salida es un estandar La presentacion de los submenus se puede observar vector de valores para una red Kohonen la salida son en la figura No I los pesos de la neurona ganadora y su posicion Bajo los submenus backpropagation y Kohonen se agruparon diferentes funciones que permiten realizar las bull Aprende hasta error (Fig No 4) operaciones basicas para la manipulacion de dichos tipos de redes neuronales artificiales Permite aprender un conjunto de patrones en una red

Backpropagation hasta alcanzar un error determinado

98

bull Aprende patrones en un numero de iteraciones (Fig No 5)

Red tmtrada~Redfinal

inicializa backpropagalion yi

Toma los parametros de la red de entrada y saca una red simaar con numeros aleatorios en sus pesos

Procesa Kohonen

Determina la neurona ganadora de 101 red y da los pesos y 101 ubicaci6n de esta EI primer componente de la ubicaci6n indica 101 columna y la segunda la fila donde esta 101 neurona if m

Figura No 3

Figura No 4

99

iiB Help BIiJE3 Roefe----

Rocero---1 pesos (lilt)) ==I~P Patrones Jrmiddot--middoti

Lmaximo Alfa cero __---I

Alfa efe

Figura No 5

Realiza el aprendizaje de patrones para una red Kohonen en un n1imero de iteraciones determinado

bull Grabar y cargar redes y patrones

Ambos tipos de red tienen modulos para grabar y cargar las redes que se hayan trabajado anteriormente o patrones que esten digitados Para todos los casos se trabajan archivos tipo texto

Bajo el submenu de logica difusa se encuentran funciones para realizar operaciones difusas necesarias para implementar un sistema difuso sus principales instrumentos virtuales son los siguientes

bull Operaciones y 0 y no (figura No 6) Permiten realizar lasoperaciones 16gicas difusas

Figura No 6

bull Difusi6n (Fig No 7)

Tomando los con juntos difusos por medio de vectores calcula el valormiddot de salida realizando el paso de difusion

lmil_~liJi~IJ ~

Coniuntos bOllosos ==~ ~bull bull 1 -Salida(I Valor de entrada -----lt] gt~

Difusionmiddotitli

Figura No 7

bull Inferencia y concrecion (Fig No 8)

Tomando losvalores de pertenencia y las reglas de inferencia se realizan los 6aIculos del valor de salida

DrMil_~rolx itt(f~1h~-

Figura No 8

3 PLATAFORMA DE EXPERlMENTACION

31 Descripcion de laplanta Se desea controlar la presion del aire en un tanque cambiando 1a apertura de una valvula El esquema se muestra en la figura

No9

Flujo de entrada

Figura No9

La planta posee una entrada de flujo constante que alimenta el sistema 1a valvula es normalmentecerrada con una apertura entre 0 y 100 logrando una presionenel tanque

entre 2 y 9 psi

32 Estrategia de control neuronal

Se utilizo la estrategia del modelo inverso especializado de la planta [CASTRO 01] para ello se configuro una red Backpropagation con 3 neuronas de entradas y una neurona de salida ambas con Ia funci6n identidad y 3 neuronas en la eapa oculta con funcion de activacion sigmoidal

Debe existir una fase previa de entrenamiento para 10 que se apticaron varios escalones aleatorios a la entrada del sistema registrarido la salida a un tiempo de muestreo fijo Ia respuesta de la planta ante diversos escalones aleatorios con un tiempo de muestreo de lOOms se muestra en la figura

NolO

Se entreno la red neuronal utilizando como patrones de entrada los val ores de presion presente presion con un retraso y presion con dos retrasos y como patrones de salida la apertura de la valvula con un retraso EI esquema se muestra en la figura NoII

Una vez la red aprende los patrones hasta un error pequeno dicha red se puede utilizar como controlador [HUNT 92] por el esquema mostrado en Ia figura N12

100

Figura No1 O

RNA e

Figura No1 1

Ref

~~ lJ(n) RNA _~LANTAIY(n)

Figura No1 2

33 Estrategia de control difilsO

Se aplico una estrategia difusa PI Mandani [MANDAN I 74] Los conjuntos difusos definidos para el error el cambio del error y 1a salida ~c muestran en la figura No13

E=r

Figura No 13

Se utilizaron 5 reg las que se enuncian por medio de una tabla su definicion se muestra en 1a figura No14

CAMBD DE ERROR negatito ce 10 postilo

ERROR neg a tiro

cero

postilo

Figura No 14

Se utilizo e1 metodo del centro de area para la desfuzzificacion

4 Resultados obtenidos Junto con el controlador difuso y el neuronal se implemento un control PI sintonizado con las reg las de Ziegler Nichols para comparar los resultados

Al aplicar un escalon a la entrada los tres controladores llevaron a la planta a estado estable en un tiempo similar el control por red neuronal no presento sobreimpulso mientras los otros dos si La respuesta se puede ver en la figura No 15

EI esfuerzo de control como respuesta ante el mismo escalon se muestra en la figura No 16 se puede ver que el mayor esfuerzo 10 realiza la red neuronal mientras que los otros dos tienen un cambio mas suave

101

Figura No15

Ante un disturbio las estrategias PI difusa y clasica son capaces de llevar la planta a la referencia deseada mientras que la red neuronal no Las respuestas ante un disturbio se pueden ver en la figura No 17

Figura No16

5 CONCLUSIONES

Se comprobo en forma pnictica uno de los posibles usos de los instrumentos virtu ales desarrollados en LabView y se dejan sentadas las bases para desarrollos posteriores en este senti do

En este trabajo se utilizo el modelo inverso especializado con redes neuronales y el PI difuso para el control de una planta de presion EI resultado obtenido es aceptable al ser comparado con un PI clasico dichas estrategias nos brindan entonces una opcion valida diferente para el control Se pudo ver como un control PI difuso puede responder de manera similar a Ull control PI sin embargo llevarlo a un punto de trabajo bueno requiere

de umi afinacion empirica basada en el conocimiento de la pblnta

Figura No17middot

Al aplicar la estrategia de control por modelo inverso especializado se vio que la respuesta al escalon fue buena sin embargo esto depende del nfunero y calidad de patrones con quese entrene ademas de requerir un nuevo aprendizaje ante cambios severos en las condiciones de trabajo de la planta Esto se puede evidenciar ante la respuesta al disturbio al cambiar las condiciones de la planta el controlador neuronal no pudo llevar el sistema al punto de referencia deseado mientras que los olros dos controladores si 10 10graron

REFERENCIAS

[CASTRO 01] CastroT Orlando Giraldo H Norma Implemtacion de un sistema de control utilizando redes neuronales artificiales por modelo inverso especializado de la planta Colombia Cali Universidad del Valle Tesis de pregrado 2001

[EBERHART 90] Russell C Eberhart Roy W Dobbins Neural Network PC Tools A practical guide 1990

[GOLD BERT 001 GOLBERT Harold What is Virtual Instrumentation IEEE Instrumentation amp Measurement Magazine Diciembre 2000

[HUNT 92] HUNT K J SBARBARO D ZBIKOWSKI R GAWTHROP P J Neural Networks for Control System - A survey Automatica Vol 28 No6

[MANDANI 74] MANDANI EH Applications of Fuzzy algorithms for control ofsymple dynamic plant Proc IEEE 121 (12) 1585 - 15880974)

102

EXTRACCION DE CARACTERiSTICAS RELEVANTES Y RECONOCIMIENTO DE SEN-ALES EMG MEDIANTE UNA RED NEURONAL TIPO PERCEPTRON

MULTICAPA

Victor Grisales (vhgrisalesateneaudistritaleduco) Carlos Sanchez (CarlosAndresieeeorg) Fernando Rosas (FernandoRosasieeeorg) Vladimir Barrero (vbarreroieeeorg) Juan Leon (ipleonieeeorg)

GIDIC - Grupo de Investigacion y Desarrollo en Instrumentacion y Control Universidad Distrital FJDC - Facultad de Ingenieria - Departamento de EIectronica

Bogota - Colombia 200 I

Resumen Este articulo presenta la metodologia para el entrenamiento y valida cion de redes neuronales tipo perceptron multicapa (MLP) mediante un caso de estudio de reconocimiento

de seiiales mioelectricas (EMG) del brazo de un paciente sanD de 3 aiios mediante la utilizaci6n del algoritmo de BackshyPropagation (BP) Se utilizan bases de datos que presentan la relacionexistente entre el espectro de potencia de una senal mioelectrica (a traves de la FFT) y el desarrollo deseado por el paciente sobre las cuilles se aplican (ecnicas de ingenierfa neural para la depuracion de datos Se realiza entrenamiento verificacion y validacion de la redAdemas para la operacion en Ciempo real se propone el desarrollo de una interfaz electronica sobre un procesador digital de senales (ADSP-21061

Palabras claves PrOtesis de miembro superior Senal electromiografica Red Neuronal Artificial Analisis de correlacion Ingenieria neural

1 INTRODUCCION Por muchos anos ha existido la meta en bioingenieria de disenar una protesis controlada a partir de las senales

mioelec-tdcas del brazo para poder ser usada en los pacientes amputados Eneste articulo se presenta la metodologia para la apropiada discriminaci6n de la senal mioelectrica la cual simplemente representa el deseo del paciente para ejecutar cualquier clase de movimiento Apoyados en diferentes investigaciones al respecto [12] tenemos la hipotesis de que la informacion debe ser extraida a

traves deelectrodos de superficie en 4 puntos especiales del brazo

I

Se trata en primera instaneia la adquisicion de las senales mioelectricas junto con la seleccion de caracteristicas relevantes de los movimientos la creacion de bases de datos para el entrenamiento verificacion y validacion de la red

n~uronal y la determinacion del nfunero optimo de neurodos ocultos de la red para efectos de reconocimiento [3] Se realizan diversas pruebas de software considerando el porcentaje de acierto de la red y se realiza un analisis de relevancia con miras a una reduccion de la dimension del vector de entrada

2 PROCEDIMIENTO La red neuronal es utilizada en este sistema para aprender la relacion entre el espectro de potencia de la senal EMG y la

1 Miembro de 1a poderosa familia SHARCreg de procesadores de pUnto flotante de 32 bits)l

actuacion deseada por las personas incapacitadas La red puede diferenciar 7 movimientos de las diferentes seiiales EMG Este sistema esta compuesto por dos partes adquisicion y discriminacion de las senales

21 Parte de adquisici6n La parte de adquisicion consta de electrodos preamplificados de la empresa Delsys los cuales estan disenados con una ganancia de 1000vv y con un fiItro pasabanda de 20-450 Hz Ellos usan la geometria de contacto de barra paralela para asegurar la estabilidad de la senal y la repeticion fiel entre las grabaciones Debe evitarse un contacto pobre entre los electrodos y la piel ademas que se debe buscar la forma de sujetarlos fuertemente Debido a que una posicion inadecuada genera una senal diferente se busca conservar siempre la misma posicion de los electrodos Se trabaj6 con la seccion proximal del brazo y los electrodos se manejaron en forma de anillo utilizando cuatro electrodos uno frente at otro (ver Fig 1) Yun electrodo adicional como referencia

Flenie Fspalila

Localliacion de los electrodos Fig I Descripcion de la localizacion de los electrodos en el brazo del

paciente sano

Dadas las estrategias de entrenamiento de la red se debe definir la forma como estaran compuestas las bases de datos de acuerdo a las diferentes combinaciones en la posicion de los electrodos

De tal forma que si los electrodos se miden con respecto a un punto comtm de referencia se obtienen cuatro mediciones

103

(Oa) Al igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con referencia COlttUltrshy

(

~JP- I ~~_O~[f

(a)

Medicion de voltaje diferencial

fjmiddot ~~Jjl

or- t~Rfr~~~

(b) Fig 2 Localizacion de los electrodos

22 Parte de discriminacion Las seiiales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extension de la muneca pronacion supinacion apertura y

cierre de la mano

~E1E-l o m lID all mo 1000 1210

(b) Flexion de h mlliieca

0112 1 I o 21D lID EIlO mo lIDO 1210

(c) Reposo

Fig 3 Senales e1ectromiograficas

La senal mioelectrica es no periodica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amllisis de Fourier (algoritmo FFT) El espectro de potencia de la senal EMG (ver O)representa una distribucion continua como funcion de su frecuencia

Para la creacion de las bases de datos de trabajo se tomaron como entradas de Ia red neuronal numerosos ejempIos de movimientos incluyendo el reposo a partir de Ia segmentacion de la senal EMG en ventanas de tiempo de aproximadamente 64 ms (l024 muestras a una frecuencia de muestreo de 16 Khz)

)l ~ 1 D 11]] 20J 3D lID SIl all

(a) Apertura de Mano

l j D 11]] 21ll 3D lID SIl all

(II) Flexionde hmlliieca ror---------~--~~---T-----r----

III

3J

2l

10 Dl I D IIll 21ll 3JD IDD roD 6DII

(e) Reposo

Fig4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciaIes junto con las respectivas salidas que confonnan el vector objetivo de clasificacion (Target2

) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen el mismo numero de muestras porque estadisticamente ellos no tienen Ia misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla I)

TABLAl DISTRIBUCI6N DE LOS MOVIJvtIENTOS

J 1 REPOSO 60

Jz APERTURA DE MANO 75

J3 CIERRE DE MANO 75

J4 FLEXI6N DE LA MuNECA 625

J6 EXTENSION DE LA MuNECA 625

J 6 PRONACI6N 625

J SUPINACI6N 625

EI conjunto utilizado de caracteristicas parte de que e~ estos valores esta contenida esenciahnente Ia infonnacion para efectos de clasificaci6n de Ia senal EMG

Sin embargo resulta conveniente una comprobacion yo reduccion del espacio de caracteristicas mediante el analisis

de correlacion segim se explica a continuacion EI analisis de correlacion pennite detenninar Ia dependencia lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor masbajo ell orden de

2 donde las columnas almacenan valores 09 001 para indicar la pertenencia

o no pertenencia a la c1ase de movimiento que c0fesponda

104

irnportanciaEl analisis de correlacion de caiacteristicasparte del calculo de la correlacion y del coefici~nte decorrelaci6n asi 5i se considera un vector caracteristico de entradas X =

Xh xN con Ncaracteristicas la correlacionentre las caracteristicasi-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esta dada en (l)

cCor(Xx)=(IIQ) poundE(X~q)~p)(x(q)_p)(I)Y I J q=l I I J J

donde

E es el operador de valor esperado Xj(qj es el valor de la i-esima caracteristica del vector caracteristico X XV es el valor de la j-esima caracteristica del vector caracteristico X 1 es el valor esperado de la i-esima caracteristica sobre la poblacion de muestra de tamano Q flj es el valor esperado de la j-esima caracteristica sobre la poblacion de muestra de tamano Q

El coeficiente de correlacion estandarizado adimensional esta dado por (2)

~--

Pij =Cij ~(CiiCff) (2)

Esta ecuacion satisface la desigualdad de Cauchy-Sch-vartz quedando acotado el rango para Pij entre los valores-l y I

1 ~ ~j ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pij estara mas cercade cero (Cij 0) Para efectos de reducci6n del numero de entradas a la red neuronal se considera que dos caracteristicas esUin altamente correlacionadas en el caso en el que IPij gt 0707 Para el caso de reconocimiento de senalesEMG se ha considerado que la infonnacion relevante esta contenida en 50 componentes para efectos de reconocimiento de los diferentes movimientos La Tabla II muestra parte de la matriz de correlacion (12 primeras componentes) calculada para la base de datos

I 2 3 4 5 6 7 8 9 10 11 12

y TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACI6N 2 3 4 5 6 7 8 9 10 II 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de nvisar lamatm decoeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pijl lt 0707 por locualse puede decir que noestan altamente correlacionados y en consecuencia puede concluirse que las caracteristicas pueden ser consideradas independientes La parte de discriminacion esta confonnada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizacion del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripcion de cuantas capas tiene el nfunero de neuronas en cada capa la funcion de transferencia de cada capa y como se interconectan elIas entre sL La topologia de la red MLP tiene diferentes capas (ver 0) la capa de entrada (N) unacapa oculta (M) y una capa de salida (J) La capa de salida tiene tantas neuronas como el ntimero de movimientos a desarrollar

El proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validacion y (iii) verificaci6n Las tres (3) bases de datos fueron creadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

105

Vecrorde Entradas

Capade Entrada

Capa Oculta

Capade Salida

Fig 5 Arquiteclura de la red neuronal

TABLA III

11

DISTRIBUCI6N DE DATOS PARA EL APRENDlZAJE DEL MODELO MLP

Movimiento Ejemp Entr Verif ValL REposo 6000 3600 1500 900 APERTURADE 750 450 188 112 MANO CIERREDE MANO 750 450 188 112 FLEXI6NDE 625 375 156 94 MuNECA EXTENSI6N DE 625 375 156 94 MUNECA PRONACI6N 625 375 156 94 SUPINACI6N 625 375 156 94 TOTAL 10000 6000 2500 1500

(Oa) AI igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con Medicion de voltaje referenda COJltUlt clifureJlCial

r-shy

( r ___nlll ( ~____J1 ~ ~r t laquo -1 ~v- fL-Rtr

~_~__ _~_1)7II[f e-~---

(b) Fig 2 Localizaci6n de los electrodos (a)

22 Parte de discriminaci6n Las senales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extensi6n de la mufieca pronaci6n supinacion apertura y

cierre de la mano

~I2E~1a l]] ltOD 6D Em llJJJ Ilm

(a) Apertura de lobno

~~lo 2Il lID EIJl roo HIll =

(b) Flexion de ]a muiieca

oa r--~-----------------

nm l o 211l lID amp10 roo 111l[]

1210

(t) Reposo

Fig 3 Senales electromiograticas

La senal mioeIectrica es no peri6dica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amiHsis de Fourier (algoritmo FFT) El espec1ro de potencia de la senal EMG (vcr O)representa una distribucion continua como funci6n de su frecuencia

Para la creation de las bases de datos de trabajo se tomaron como entradas de la red neuronal numerosos ejemplos de movimientos incluyendo el reposoa partir de la segmentacion de la senal EMG en ventanas de tiempo de aproximadantente 64 ms (1024 muestras a una frecuencia de muestreo de 16 Khz)

~[ j [] VII 2Il m lID EIJl EIJl

(a) Apertura de Mana

l 1 [] VII 211l m lID EIJl EIJl

Ill 40

31

ill

ID []L

D

(b) Flexion de ]a muiieca

IIIl 211l 310 40D IlO Il[]

(c) Reposa

Fig 4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciales junto con las respectivas salidas que conforman el vector objetivo de clasificaci6n (TargeP) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen elmismo numero de muestras porque estadisticamente ell os no tienen la misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla nmiddot

TABLA I DlSTRIBUCION DE LOS MOVlMIENTOS

60REPOSOJ1 75APERTURA DE MANOJz

75CIERRE DE MANOJ3 625FLEXION DE LA MuNECAJ4 625EXTENSION DE LA MuNECAJ6

625PRONACIONJ 6

625SUPINACIONJ

El conjunto utilizado de caracterlsticas parte de que en estos valores esta contenida esencialmente la informaci6n para efectos de c1asificaci6n de la senal EMG

Sin embargo resulta conveniente una comprobacion yo reducci6n del espacio de caracteristicas medianteel analisis de correlacion segun se explica a continuaci6n EI analisis de correlaci6n permite determinar la dependencia

lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor mas bajo ell orden de

2 donde las columnas almacenan valores 09 6 01 pam indicar la pertenenci3

o no pertenencia a la c1ase de movimiento que co~esponda

104

inlportandaEl analisis de correlacion de caracteristicas parte del calculo de la correlacion y del coeficiente decorrelaci6n asi Si se considera un vector caracteristico de entfadas X = XhXN con Ncaracteristicas la correlaci6nentre las caracteristicas i-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esrn dada en (1)

Qc=Cor(XX)(lQ) L E(X~q)-Il)(x(q)_Ilmiddot)(I)

I I J q=l I I J J

donde

E es el operador de valor esperado Xi(q) es el valor de la i-esima caracterlstica del vector caracteristico X Xr) es el valor de la j-esima caracteristica del vector caraderlstico X ~i es el valor esperado de la i-esimacaracteristica sobre la poblacion de muestra de tamafio Q ~j es el valor esperado de la j-esima caracteristica sobre la poblaci6n de muestra de tamano Q

Elcoeficiente decorrelaci6n estandarizado adiinensional esta dado por (2)

Pij = Cij I ~r-(C-iiC-iJ-) (2)

Esta ecuacion satisface la desigmildadde Cauchy-Sch~artz quedando acotado el rango para Pj entre los valores-I y I

-1 ~ Pij ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pj estara mas cerca de cero (Cij 0) Para efectos de reduccion del nfunero de entradas a la red neuronal se considera que dos caracteristicas estan altamente correlacionadas en el caso en el que Pij gt 0707 Para el caso de reconocimiento de senales EMG se ha considerado que la informaci6n relevante esta contenida en 50 componentes para efectos de reconocimiento delos diferentes movimientos La Tabla II muestra parte de la matriz de correlaci6n (12 primeras componentes) calculada para la base de datos

1 2 3 4 5 6 7 8 9 10 11 12

TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACION 2 3 4 5 6 7 8 9 10 11 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de revisar lamatrizde coeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pij lt 0707por 10cual se puede decir que no estan altamente correlacionados y en consecuencia puede concluirsemiddot que las caracterlsticas pueden ser consideradas independientes La parte de discriminacion esta conformada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizaci6n del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripci6n de cmintas capas tiene el numero de neuronas en cada capa la funcion de transferencia decada capa y c6mo se interconectan ellas entre sf La topologia dela red MLP tiene diferentes capas (ver 0) la capade entrada (N) una capa oculta (M) y una capa de salida (1) La capa de salida tiene tantas neuronas como el nfunero de movimientos a desarrollar

EI proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validaci6n y (iii) verificaci6n Las tres (3)bases de datos fueroncreadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

Vector de En1rtdas

Capade Capa Entrada Oculta

Fig 5 Arquitectum de la red neuronal

TABLA III DISTRIBUCION DE DATOS PARA EL APRENDIZAJE DEL MODELO

MLP

I I I

Movimiento Ejemp Entr Verlf ValL REposo 6000 3600 1500 900 APERTURADE MANO

750 450 188 1I2 I

CIERREDE MANO 750 450 188 1I2 FLEXION DE MuNECA

625 375 156 94

i EXTENSION DE MuNECA

625 375 156 94

PRONACION 625 375 156 94 SUPINACION

TOTAL 625 10000

375 6000

156 2500

94 1500 I

105

II

Las pruebas de entrenamiento y validacion se hicierona partir de las bases de datos de trabajo normalizadas ejecutando el programa de entrenamiento de MLP con base en el algoritmo BP

Se realizaron 5 pru~pas para diferentes valores del numero de neurodos de la capa oculta (M) tOl unmiddotminimo de iteraciones de 1000 variando el valor de Mdesde 30 hasta 100 en pasos de 5 A medida que se ejecuta 61 algoritmo de entrenamiento se va evaluando el error de vaHdpoundcion quedando registrada la iteracion para la que se obtiene ~I minimo valor asi como los correspondientes valores de la red El algoritmo se ejecuta

shyhasta que se alcance el numero de iteraciones especificado 0

se logre reducir el error t9tal po debajo del ~nimo preestablecido (0005)

Los valores de los errores mlmmos de entrenamiento y validacion son fundamentalesmiddot cQmo medida para deterrninar el grado de aprendizaje de lalt red y permiten deterrninar el punto a partir del cualla red empieza a memorizar mas que a aprender Se hace tambien necesario prQ9~r la red luego de haber sido entrenada para esto se hace USa de la base de datos de verificacion la cual se pasa a traves de la red neuronal para determinar el porcentaje de aciertos en el reconocimiento de los movimientos dando lugar a la llamada matriz de confusion3

bull

Con base en estos criterios se determinaron las matrices de confusion tanto para entrenamiento como para verificaci6n en cada una de las pruebas realizadas y se concluye que el numero optimo de neurodos para la capa intermedia M en nuestro caso es de 75

3 CONCLUSIONES El amllisis de correlacion de caracteristicas debe hacerse antes de entrenar la red para saber si hay dependencia entre las componentes frtcuenciales

Los valores de los errores mmlmos de entrenamiento y validacion son fundamentales como medida para determinar el grado de aprendizaje de la red especialmente en el punto a partir del cual puede considerarse que la red empieza a memorizar mas que a aprender

Al realizar varias iteraciones se puede escoger el vector de pesos mas adecuado superando el problema de los minimos locales propio del algoritmo de entrenarniento de BP

4 TRABAJO FUTURO Para la openicion en tiempo real [4] se propone que este procedimiento se implemente sobre un procesador digital de senales (ADSP-21061) el cual operara sobre el conjunto de pesos obtenidos gracias a la red y de esta forma poder desarrollar una interfaz electronica que reciba identifique y procese las senales mioelectricas del brazo y ademas que

3 se forma comparando las salidas reales de la red con las salidas deseadas para todos y cada uno de los ejemplos de la base de verificaci6n

controle los movimientos hasicos que se asemejen a los naturales perrnitiendo a su vez ser adaptada al interior de una protesis e1ectromecanica de mano demostrando la efectividad del sistema para pacientes amputados a la altura del tercio proximal (antebrazo) con criterios de viabilidad economica y optimo uso energetico para su funcionamiento EI prototipo planteado presenta la arquitectura de la O

Seihlde los eledloclos

Catr~l5or

~ Digital

I I

Fig 6 Diagrama esquematico de una interfaz para una protesis mioeleclrica

REFERENCIAS [1] Kaduhiko Nishikwa Katsutoshi Kuribayashi Neural

Network Application to a discrimination system for controlled prostheses IEEEIRSJ International Workshop on Intelligent Robots and Systems nov 1991

[2] Adrian del Boca Dong C Park Myoelectric signal recognition using fuzzy clustering and artificial neural networks in real time IEEE Transactions on Biomedical Engineering jun 1990middot

[3] Looney Carl G Pattern recognition using neural networks Theory and algorithms for engineers and scientists Oxford University Press 1997

[4] Embrec Paul C++ Algorithms for Real Time DSP Prentice Hall 1999

[5] Alan V Oppenheim et al j Discrete Time Signal Processing Prentice Hall 1999

AUTORES Ingeniero Victor Hugo Grisales Opta por el master en e1ectrica en la Universidad de los Andes Profesor de tietnpo completo en la Universidad Distrital Director del grupo I+D en instrumentacion y control

Carlos Sanchez Fernando Rosas Vladimir Barrero Juan Leon Estudiantes de ultimo semestre de Ingenieria Electronica en la universidad Distrital FIDC Miembros

Estudiantiles del IEEE

106

ANALISIS ACUSTICO EN LA CLASIFICACION DE SENALES DE VOZ EMPLEANDO RNA

German Castellanos (gcastel1ieeeorg) Francisco Vargas (pcinevadomanizalesunaleduco) Grupo de Control y Procesamiento Digital de Senales - Universidad Nacional de Colombia - Sede Manizales

Resumen Se presenta un sistema de clasificaci6n desefiales de voz basado en sus caracteristicas acusticas el cual se ha dividido en tres partes obtencilm del ensamble inicial de caracterizaci6n acustica de la voz basandose en tecnicas de proceso digital de senales en tlempo real reduccion hasta elmenor ensamble de parametros representativos y suficientemente discriminantes de las clases basandose en tecnlcas estadisticas y por ultimo la construction de las reglas de decisi6n para clasificacion de senales de voz que pueden ser basadas en el empleo de redes neuronales EI sistema rue probado en la clasificaci6n devoz de acuerdo al sexo y edad de los hablanies y como resultado se determinan sus caracteristicas acusticas mayormente influyentesmiddot Ademas esta orieiltado a la tipificacion de norinalidad 0 alteraci6n de las direrentes clases de voz Para el presente trabajo rueronmiddot evaluadas las redes multi-capa y los mapas auto-organizatlvos de Kohonen

L INTRODUCCI6N

En la evaluacion de la voz la metodologia perceptual caracterizada por Ia calificacion de las cualidades vocales segUn el juicio experto de un sujeto necesita habilidades refinadas de escucha EI empleo de tecnologias digitales permite evaluar de manera objetiva la acustica y fisiologia del fenomeno Durante el proceso de evaluacion objetiva de voz normal 0 alteradaes necesario determinar sus caracteristicas cualitativas como es el caso del couelato acustico timbre aspero la emision con quiebres el ataque vocal duro (fmal de frase abortado) voz hiponasalizada y ruido acoplado para lograr muestras que sean altamente fieles alemisor El empleo de sistemas computarizados de anaIisis acustico de voz provee la posibilidad de percibir elementos dificiles de registrar mediante la observacion sUbjetiva convencional

EI uso de caracteristicas acusticas (CA) en la descripcion de normalidad 0 alteracion de voz ha sido probado en VallOS

contextos y con diferentes objetivos por cuanto perrniten ponderar cualitativamente las propiedades de la voz dificilmente realizable por otros metodos [123] Aunque se han Ilevado a cabo estudios de correlacion de estas caracteristicas con la metodologia perceptual sus resultados ademas de ser ambiguos a veces pueden ser contradictorios en el analisis de tipicidad (normalidad) 0 diferentes alteraciones de las senalesmiddot de voz De tal manera que la seleccion

-apropiada de la medida de las CA y su interpretacion sigue siendo un problema sin solucion

parametros representativos de cada clase se realiza el preproceso de los CA sobre los cuales se construye el ensamble inicial de caracterizacion acustica de voz La Seleccion del ensamble efectivo se realiza mejorando la efectividad de empleo de cada uno de los CA para 10 cual se analizan los criterios discriminatorios de correlacion e informacion mutua Finalmente la reduccion de la dimensionalidad de ensamble se realiza por el metoda de las componentes principales Una vez extraidos los parametros necesarios para la caracterizacion de la voz se resuelve la clasificacion de la voz en el tipo normal y no normal (con alteraciones )

MtltJ~ llbIUtl IHlttmllJgt

Fig 1 Diagrama de bloques reconocimiento de palrones de senales de voz

EI reconocimiento de patrones de senales de voz se puede dividir en dos procesosmiddot fundamentales como se aprecia en la figura Imiddot el entrenamiento que comprende la extraccion y seleccion del con junto de caracteristicas acusticas (id iE(I Ni) que representan cada clase de voz kE(lK) y la toma de decisiones que realiza la clasificacion por algun principio discriminante

EI tipo de reconocimiento empleado en el presente trabajo es una derivacionmiddot de lamiddot metodologia propuesta en [22] compuesta de dospartes hasicas a) Extraccion y Seleccion del ensamble efectivo de CA por clase b) el ensamble efectivo de CA es tornado como entrada de una RN usada en calidad de clasificador que en el caso particular fue del tipo backpropagation Asi fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen

2 ENSAMBLE DE CARACTERIZACI6N INICIAL ACUSTICA DE VOZ

La caracterizacion de la voz requiere de un elevado nUmero Elanalisis acustico de un sonido articulado consiste en de valores de CA En el articulo se presentan algoritmos de determinar los indicadoresfisicos de las vibraciones que 10 estimacion en tiempo real para los principales CA que en constituyen tales como la frecuencia la intensidad la general son muy sensibles a las condiciones acusticas de composicion espectral las variaciones del sonido modificadas tnedida [4] Para aumentar la efectividad en el uso de los por la resonancia que actuan originando el producto sonoro

107

que permite predecir la proXima muestra como una percibido [56] La seleccion de parametros que caracterizan

combinacion lineal de las anteriores [10] la voz es tal vez la etapa mas importanteen el desarrollo de sistemas automatizados de su proceso Uno de los principales y(n)=-taky(n-k) (2)problemas en el analisis de las CA de voz consiste en que la mayoria de eUos son sensibles a diferentes condiciones de

k=l

donde q es el orden del predictor y ak son los coeficientes de medicion Este factor conlleva a escoger el ens amble de prediccion lineal (LPC) Los coeficientes ak pueden ser parametros acusticos que brinde la mejor estimacion de determinados a partir del calculo de coeficientes demiddot irregularidad y perturbacion para la clasificacion y autocorrelacion De esta manera se tendcln q coeficientes de reconocimiento de senales de voz En general toda CA de prediccion lineal por cada trama de la senal de voz Tambien amilisis debera cumplir con las siguientes propiedades [6] a) es habitual aplicar el calculo de los coeficientes LPC Debe ser facilmente estimable y 10 menos dependientes de las cepstrales (Ia transformada de Fourier inversa del espectro de perturbaciones ambientales b) Su estimacion debe ser estable amplitud logaritmico) que representan la respuestaen el tiempo y c) No debe ser imitable Las CA pueden ser aproximadamente logaritmica 0 psofometrica del oido agrolJados de acuerdo a las propiedades acusticas que deben humano Los coeficientes LPC cepstrales Ck presentan la medir y los cuales en la practica se asocian en dos categorias ventaja de convertir el ruido convolucional en ruido aditivo y [7] permiten separar la excitacion glotal de los parametros del

tracto vocal Seguidamente se emplea un tipo de ventaneo que a) Parametros cuasiperiodicos Son disenados para la acentue los pesos de los LPC cepstrales con el objeto de captura de varias fonnas de periodicidad de las obtener mayor discriminacion de la envolvente espectral perturbaciones en la senal aclistica Entre los principales

parametros de este gropo estan b) Parametros de perM-bacion Destinados a medir la componente relativa de ruido en la senal de voz Para la

La Frecuencia Fundamental (Fo) que es referida a las estimacion de las perturbaciones de los parametros de la caracteristicas de cuasiperiodicidad de la senal en el tiempo frecuencia fundamental es comun el empleo del promedio Los diferentes metodos de estimacion del calcul0 del Fo relative de perturbacion (RAP Relative Average Perturbation) fueron analizados y comparadosen [S] por tiempo de proceso

definido como [1311] y precision obteniendose que el metodo (AMDF Magnitude Difference Function) [69] es mas veloz cuyo algoritmo esta

dado por iJ n z=(tIZH +z Zi+l -Zi llLRAP 1=1 3 1=1

AM(km)= (3) siendo n es el numero de ciclos consecutivos analizados 1 m

- Lly(n)- y(n-k)w(m-1t) Cuando el panimetro de perturbacion z se refiere al periodo N n=m-N-l) de la frecuencia fundamental se define el Jitter mientras que

en el caso de su amplitud se define el Shimmer [14] EI nivel (1) de perturbaciones tambien puede ser caracterizado por elDonde yen) es la senal digitalizada de voz wen) es la ventana

de proceso con longitud N m es el numero de muestras armonico ruido H 0 energia promedio del ruido de fondo ij(t) empleadas en la estimacion k es el retraso para el cual se esta que se determina como

Tcalculando el AMDF H = 11Jr((r)ciT (4a)

Los formantes En el espectro de una senal de voz se o encuentran regiones de enfasis (Uamadas resonancias) y de donde 1E [01] El componente de ruido N se defme como la deenfasis (antiresonancias) [9] ambas resonancias diferencia de energias de la senal de informacion y del denominadas formantes que siguen patrones comunes en la armonico ruido mayoria de los humanos determinadas basicamente por sus medidas antropometricas [101112] En la practica se nT analizan 5 fonnantes (FI F2 F3 F4 F5) junto con sus N = LJ[yj (1 )-11(1)]2 dT (4b)respectivos anchos de banda (LlWI LlW5Y los cuales se

=1 0 definen como el gropo de frecuencias que hay desde la caida a

donde 1E[O1] Finalmente el armonico ruido se determinposterior y anterior de 3 dB La energia del formante sera el como HNR=HIN Para aplicaciones profesionales la energia

valor del pica y el valor del formante la frecuencia donde se se determina por la diferencia entre la energia de la emision

encuentre el pica anterior [11] La estimacion de los vocal y la energia del ruido ambiente dado por formantes se realizo sobre algoritmos basados en la

suposicion de que la voz puede ser representada por modelos II

P(n) = -1

Ly2 (i) (4c)en fonnadeun numero reducido de indicadores a partir de n 1=1los cuales es posible su reconstruccion adecuada Para esto se S

donde n es el numero de puntos de la senal y(t) OlrD empleantecnicas de prediccion lineal basadas en el a

parametros analizados son la Energia de nlido normalizadmodel ado deltracto vocal mediante un filtro de solo polos (NNE) que ha sido estudiada en varios contextos [71415] Y

108

la excitaciim g16tica a ruido (GNE) estima el ruido en un tren el proceso de medicion influencia de fuertes perturbaciones de pulsos que es tipicamente generado por la oseilacion de los etc En este caso el valor anomalo del arreglo se expresa pliegues de voz [3] mediante el valor critico de la distribucion de Student fp n-2

La cantidad de CA N de representaci6n de voz t es [1717] completado por la primera (parametros delta) y segunda derivada (delta-delta) en el tiempo de los LPC cepstrales [6] y I e- In I[J s Ipn_] (n-I )112I(n-2+(lpnd)lf2 (5) debe realizarse para cada una de los tipos de senales de voz a clasificar Realmente cada CA puede influir de diferente siendo JIll yO respectivamente la media y varianza del manera en la pronunciaci6n de cada palabra En la practica de valor extremo en analisis del arregl0 I p es el nivel de la fonoaudiologia es comllo el empleo de palabras claves 0 significacion A efectos de comparaci6n de las realizaciones maestras En el caso particular se cada muestra fue tomada de losdiferentes parametros acusticos es preferible su basados en la pronunciaci6n de las cinco vocales estandarizacion estadistica Asi

Cabe anotar que el reconocimiento de senales de voz debe (6)~I =(i- mJ)O realizarse en linea por 10 que los algoritmos de proceso deben estar orientados a su desarrollo en tiempo real Los metodos empleados de estimacion de cada caracteristica fundamentalmente empleando metodos de amiJisis en acustica exigen la verificacion de hipotesis de la intervalos de tiempo cortos de los segmentos de voz los homogeneidad la cual se lleva a cabo por el criterio i y en cuales se analizan en [616] casos extremos se emplea el metoda Kolmogorov-Smirnov

[IS] Si laverificacion muestra claramente la invalidez de la hipotesis de gaussividad es importante determinar el tipo de

3 SELECCION DEL ENSAMBLE EFECTNO distribucion de fdp para cada ensambleI y si es posible la forma de su transformacion a la normal La transformacion de

La extraccion de CA se realiz6 acorde a los algoritmos la variable [Jj en sect con distribucion nonnalizada se determina presentados en anteriormente Asi se escogio un conjunto de de la relacion caracteristicas acusticas UiI i= I bullN que representan cada dase de voz k= I $ El sistema automatizado de extraccion ~

de parametros calcula 20 CA para cada una de las cinco ~21C1_ J e_2 dt =Lr M ji(Aji-1 lt Sjlt Aji) voeales (aIlellillollul) pronunciadas en la emision de voz a __ =1 N analizar Como resultado se obtuvo un valor de Nr I 00 para

j

(7)una sola emision de un paciente dado En cuanto a los grupos de clasificaci6n se definieron los siguientes a) Hombre

donde ~gve es el ens amble real de 0 res el nlimero relativo Adulto k=l b) Hombre Nino k=2 c) Mujer Adulta k=3 y d)

de intervalos delhistograma AJi Aji son los valores extremos Mujer Nina y k=4

del intervalo i del histograma del parametro 01 ~ es la frecuencia de ocurrencia en cada intervalo del intervalo i Una

Las estimacion de las CA de voz e es muy sensible a forma empirica alterna de ajuste consiste en la transformacion

faetores tales como las condiciones acusticas de toma de de cada CA 0(1) por diferentes operaciones basicas y

senales (ruido de fondo hardware de registro electronico comunmente empleadas en el tratamiento de voz

tiempo del dia en que se Ie toman las muestras al paciente contenido de las palabras etc) por 10 que la primera tarea a

~(I)=lg((I)plusmna) I01 c(1)=lg(aplusmn (I)(I) resolver en su clasificacion usualmente es el preproceso de

~(I)=1((1)110datos de las realizaciones que esta orientado a aumentar la efectividad en el uso de los parametros representativos de cada clase De otra parte la cantidad de realizaciones 0 Despues de cada transformacion se realiza la prueba i y se

toma aquella operacion que con mayor certeza confirme la ensamble N determina las limitaciones en la eleccion del hipotesis de gaussividad En general para cada []jk se puede metodo de preproeeso en particular se debe evitar el efecto tener una transformacion diferente [23] de valores extremos de ensamble muy pocas realizaciones 0

sobrevaluacion del ensamble [17] Las CA estan construidas La seleccion del ensamble efectivo de los rasgossobreestimaciones por 10 que es importante tener discriminantes constituye el aspecto fundamental en uninformacion sobre la fdp (0 su familia) para la cual se sistema de reconocimiento de patrones Las propiedades que calculan sus momentos Por este motivo el ensamble de deben cumplir las CA para su selecci6n son las siguientes prueba Ne se escogi6 de acuerdo al minima numero de

realizaciones que se deben tener para verificacion de Capacidad discriminante Es decir que separen 10 mashipotesis que para valores dados del nivel de significacion nitidamente posible las clases existentes P 01 Yun error de 10 obteniendose N90 muestras por Confiabilidad Esto es los objetos de una misma clase clase [17] deberan presentar la menor dispersion posible Ausencia de correlacion Es decir evitar en 10 posible la La siguiente etapa en el preproceso de datos esta enla utilizacion de caracteristicas que dependan fuertemente eliminacion de datos anomalos debidos a posibles errores en entre si

109

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 3: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

CLASIFICACION Y RECONOCIMIENTO DE IMAGENES GEOMETRICAS BAsICAS USANDO RNAs

Olaya Ramirez Fabian A Gallon Cannon a Camilo Eduardo Caicedo Jesus A Lopez Grupo de Percepcion y Sistemas Inteligentes Escuela de Ingenieria Etectrica y Electronica

Universidad del Valle Cali Colombia psieieeunivalleeduco

Abstract Este articulo presenta el desarrollo de una estructura algoritmica basada en una aplicJlcion para el reconocililiento y cIasificacion de imagenes ReI fundamentalmente figuras geometricas mostrando apartes en cuanto al sistema de procesamiento de las imagenes y estructura de red neuronal utilizada demostrando ast la gran capacidad de procesamiento adaptabilidad generalizacion y agrupamiento de las RNA aplicadas a la inteligencia computacional y tomando como esquema que la mayoda de los modelamientos de entornos en vision artificial son desarrollados sobre bases geometricas [Gallon 20011 Este articulo describe el desarrollo de procesamiento de la imagen la obtencion de caracteristicas de cad a patron imagen tipo de arquitectura aprendizaje utilizado y su propio reconocimiento y cIasificaciOn

1 INTRODUCCI6N

Este articulo detalla el desarrollo de una aplicacion para demostrar el alcance de las RNAs en la c1asificacion y en el reconocimiento de imagenes

Este articulo brinda la posibilidad de explorar el desarrollo de la herramienta partiendo con un marco teo rico sustentando las caracteristicas de generalizacion entre otras propiedades que la componen y que las hace tan especiales en este tipo de aplicaciones Luego se presenta el modelo metodologico donde se explica cada uno de los pasos y procesos realizados comenzando desde la captura de la imagen pasando por el procesamiento y extraccion de sus caracteristicas y terminando con el aprendizaje y cIasificacion [Buhmann 99]

El reconocimiento y cIasificacion de imagenes es una hcrramienta crucial para la vision artificial y en especial robOtic a movil debido a que puede reforzar la posicion y orientacion del robot permitiendole interpretar caracteristicas de las senales (en vez de memorizar las senales enteras) por ella la importancia de llegar a un metodo de procesamiento de la imagen que nos permita mane jar diferentes figuras tanto rectas como curvas

2 PERCEPTRON MULrlCAPA

La utilizacion del Perceptron multicapa con el algoritmo de aprendizaje BP se debe a que este permite calctilar el error a la salida de la red en forma exacta y asi propagarlo hacia las otras capas ocultas y con el mismo calcular la medida del error que se tiene en dichas capas asi se pueden variar los

pesos entre las conexi ones asociados con el patron de entrada y salida [Freeman 93]

CAPADE ENTRADA

Unidadesde terldencia Salida = 1

CAPAOCULTA CAPADE SALIDA

CirC1J1o

Cuadrad

Redangl

va

Fig I Red para reconocer y clasificar figuras geometricas[Gallon 200 I]

En la figura 1 se puede observar una estructura de red neuronal para reconocer y cIasificar figuras geometricas que basicamente consta de una capa de entrada que detalla los patrones caracteristicos de cada figura una capa oculta necesaria para el procesamiento de la red y una capa de salida donde se encuentra la relacion con el conjunto de figuras a reconocer y clasificar H

3 SISTEMA DE PROCESAMIENTO DE IMAGEN

Es el momento en el cual tenemos las imagenes en el ordenador asi para la adquisicion de estas se puedeutilizar desde una camara digital hasta un editor de inuigenes dentio del mismo PC con el fin de formar un archivo completo de imagenes para la realizacion de las pruebas y funcionamiento de la herramienta

94

En la figura 2 se puede observar un diagrama de flujo geIler~1 ~e los pasos basicos para reconocimiento y cl~~fi~acion~~ tmagenes

peprtlCtS3do

dominio del problema--_1-shy

adqllisiciro d~ imageotS

bast dt laquolooeimiento

~nocmerto e

ittrpnuclon

dlt

Fig 2 EtapasJundamentales del procesamiento digital de imagenes [Gonzalez 961

31 Preproeesamiento En la rase de Preprocesamiento de las figuras geometricas tal como se ve en la Fig 3 se realizaron los siguientes procedimientos

it Binarizacion

bull Calculo del centro de graved ad bull Normalizaci6n del tamano bull Centrado de la imagen

FIg 3 Algunas representaciones de las imagenes utilizadas por la aplicacion

[Gallon 20011 32 Obtencion de los veeores earaeteristieos

(deseriptores) En esta etapa se obtienen los vectores caracteristicos de cada figuni a reconocer y cIasificar Para ello se parte del centro de la imagen ya procesada y se recorre la matriz de pixeles des de este punto hacia los bordes de la figura sobre las diagonales principales secundarias horizontal y vertical tal como muestra la Fig 4 obteniendo ocho distancias euclidianas que para cada figura seran 10 bastante propia y significativa

t ~ J

3

Fig 4 modelo de descriptores [Gallon 20011

33 Fase de Aprendizaje Esta es la rase de entrenamiento de la red baSados en el algoritmo de aprendizaje Backpropagation y tomando como

95

punto de partida losvectores caracteristicos de cada imagen y SllS respectivas variaciones como rotaciones traslaciones tamaiio etc La arquitectura de red para la c~l este metodoes valido es la de un Perceptron multicapa como eI que se muestra en la Fig 1 y enfatizando asi que el numero de capas utilizado no es fijo y depende exclusivamente del usuario en cuanto a las pruebas y amilisis que se realicen Este aprendizaje tJene comienzo excIusivamente teniendo muy claro las clases de imagenes para las cuales el sistema se va a entrenar luego se escogen los patrones caracteristicos y mas representativos de cada imagen as se puede crear un archivo de patrones con todo eI conjunto anterior como se muestra en la Tabla 1

TABLA 1 ARCHIVO DE ENTRADA PARA ENTRENAMIENTO DE LA RED

[GALLON 2001]

Despues de caigar este archivo de patrones al sistema se procede a ajustar todos los parametros de la red para este caso los del algoritmo de entrenamiento como son alfa beta velocidad de animacion numero de iteracionesyajustar los parametros de la arquitectura como numero de capas numero de neuronas por capa y las respectivas funciones de activaci6n todos estos ajustes y la exactitud de ellos dependen exelusivamente de la experiencia del usuario con sistemas de redes neuronales de este tipo

34 Fase de Reeonocimiento y Clasifieacion Este es el objetivo principal de este desarrollo asi para el conjunto de figuras geometricas escogido se organiza por clases como 10 5011 la clase cuadrado circulo rombo entre

otras y asi la verdadera clasificacion se da despues de vaHdar el sistema es este instante se corrobora el verdadero aprendizaje de la red si esta c1asificacion no tiene exito se procede a evaluar los puntos defallo del sistema y se vuelve a entrenar la red con los ajustes previos que conlleven al mejoramiento en la c1asificacion En la figura 5 se puede observar el procedimiel)to blisico utilizado para 1a obtencion de los resultados del trabajo

~ P Poblacion de objelos

ReconocimienloSeosado Exlraccion d Mediday Rasgos

IProeeamienl I

I

Objeto I)alo Medido Vector de Identificadol Muestreado Rasgos clases

Fig 5 Proceso de reconocimiimto y c1asificaci6n de patrones [Darpa 88]

4 RESULTADOS Y ANALlSIS

Se probaron redes con una sola capa oculta con diferente nfunero de neuronas y funciones de activacion asi durante el proceso de aprendizaje se elcontraron diferentes problemas e inconvenientes como la no-convergencia del proceso de entrenamiento de las redes debido en gran medida a que el conjunto de patrones de entrenamiento excedia la capacidad de aprendizaje de las redes ytambien la apandon de grandes minimos locales en la funcion del error cuadnHico que se generaba por 10 que se dificultaba la posibilidad de alcanzar el minimo global durante e1 entrenamiento tambien surgieron problemas de saturacion en algunas neuronas de la capa oculta Para solucionar estos problemas presentados en principio se decidio analizar diferentes tipos de arquitecturas con diferente numero de capas mimero de neuronas por capa y numero de iteraciones para asi poder llegar a una solucion

satisfactoria Para el entrenamiento de la red se utilizaron las siguientes figuras teniendo en cuenta sus rotaciones y algunos niveles de ruido que en promedio era del 20

Circulo con 23 figuras Cuadrados con 20 figuras Elipse con 36 figuras Pentagono con 33 figuras Rectangulo con 46 figuras Rombo con 43 figuras Triangulo agudo con 80 figuras Para un total de 281 figuras para el entrenamientocada figura con 8 posiciones teniendo un numero de patrones igual al numero de figuras parametrizadas

La seleccion de las figuras para entrenamiento se realiz6 tomando criterios como la representatividad figuras con valores criticos (como figuras de la misma clase pero con patrones muy dijerelltes alas otras) figuras que tuvieran dificultad en e1 procesamiento de 1a imagen (como figllras que en el procediniiento de normalizacicm del tamano pierden algunas caracteristicas) figuras limpias y figuras bien definidas En la busqueda de la mejor red se probaron muchas arquitecturasen la Tabla 2 se presentan algunos de los resultados obtenidos durante la etapa de aprendizaje teniendo en cuenta diferentes criterios en cuanto al numero de capas mimero de neuronas de la capa oculta(CO) tipos de funciones de activacion en capa oculta y capa de salida y numero de iteracionestambien se presenta en la ultima columna el Error cuadriitico(EC) correspondiente a cada

arquitectura TABLA 2

RESULTADOS DE APRENDIZAffi CON VARIAS ARQUITECTURAS

N0 Ndeg de FA FA Ndeg de Ue EC cap neur co CS

CO 3 16 3 8 3 8 3 8 2 3 8 3 3 8 3 3 7

3 7 3 3 7 2

3 5 3 7 3 12 1 3 16 4 4

4 16 4 16 I

Funciones de activaci6n 1 Timgencial-sigmoidal 2 Lineal 3 Sigmoidalmiddot

2

2 2 3

2

2 2 2

2 2 2 2 2

23000middot 014

25000 011 25000 015

25000 Instable

25000 046

25000 0377 25000 016

25000 lnestable 25000 inestab1e

25000 022 25000 023

25000 008

25000 007

25000 0058

50000 00008

75000 00003

En la busqueda de la mejor red se encontro que e1 mejor ~ fue de 01 y 0 fue de 00075 aunque tambien respondi6 bien con un ~ de 05 peru con un 0 de 000075 los valores anteriores son determinantes en la busqueda del mejor entrenamiento estos son como factores de amortiguamiento para tratar de evitar un cierto numero de oscilaciones en la busqueda del menor error cuadriitico Otro criterio evaluado fue el numero de iteraciones siendo las arquitecturas de 4 capas las que se desfasaron en ese pariimetro pero comparando estos dos parametros y despues d~ un arduo pruceso de validaci6n acontecio que el tiempo invertido en el numero de iteraciones

es recompensado en Ia validaciol1 de las imagenes

obteniendose un mejor rendimieilto para la arquitectura de 4 capas [Ganon 2001]

96

CONCLUSIONES

pound1 proceso investigativo que se nevo a cabo se encamino a la utiIizacion del algoritmo de aprendizaje Backpropagation aplicado a una red MLP Fig 1 para que interactuaracon el sistema de procesamiento de imagenes por ser no solo el que mejor se acoplaba a las expectativas del desarrollo sino tarnbien por sus caracteristicas El desatrollo en cuanto a procesamiento de imageries frente a aspectos como el tamano posicion orientacion y cIase de imagen at que se llego mediante el desarrollo investigativo dio com() resultado un sistema que Ie presentara al usuiuio la oportunidad de analizar y estudiarmiddot una aplicacion predeterminada nombrada anteriormente y asi mismo poder tener acceso a otro tipo de imagenes desarrolladas por el e interpretadas a su gusto [Reiher 99]

El objetivo de laspruebas que se realizaron en esta aplicacion fue tratar de encontrar los parametros optimos de la red neuronal que consigan reducir al maximo el error en el menor numero de iteraciones aunque no siempre es posible alcanzar eI error minimo con un minimo de iteraciones ya que luego de determinada cantidad de iteraciones elerror decrece muy lentamente Debidomiddot a estomiddot es necesario sacrificar econom~a (aUl1lellto de capas ylo lIeuronas ocultas) [Vapnik 95]

Si las formas de las figuras son muy semejantes entre sf dentro de la misma clase el errormiddot disminuye muy nipidamente consiguiendose un valor muy pequeno Por otro lado si estasfonnas de las figuras son muy diferentes dentro de 1a misma dase la ve10cidad de aprendizaje es muy lenta y en ocasiones ocurren oscilaciones bruscas Luego se puede afirmar que la red aprende formas semejantes con mayor facilidad que formas diferentes En ocasiones si las fonnas de las figuras son muy semejantes entre si excepto algunos diferentes es posible que la red ignore estos ultimos si no hay suficientes neuronas en la capa oculta Tambien para evitar esto se pueden reducir la cantidad de figuras en el entrenamiento escogiendo las mas significativas as ya no habrii mayoria Se comprobo una vez mas que una de las mejores aplicaciones que tienen las redes neuronales artificiales es reconocimiento y clasificacion de patrones aprovechando la capacidad de generalizacion de las redes las cualespueden aprender de una serie de modelos originales de diferentes clase para luego ser ~apaces de determinar la clasea la que pertenecen otras entradas distintas de los patrones aprendidos EI metodo presentado podria considerarse como una primera etapa de clasificaci6n de lmagenes que podria complementarse con otros metodos para asegurar una clasificacion mas detaHada y precisa Asi mismo podrian ll1ejorarse los resultados una forma podria ser aumentando el nUmero de patrones presentados a la red en la fase de aprendizaje 0 aumentando el vector caracteristico de cada patron tambien se podrian utilizar otros metodos de Caracterizacion de las imagenes como por ejemplo valores obtenidos mediante la compresion con otra red neuronal u

otros tipos de redes y algoritmos de aprendizaje 0 utilizando otro tipo de procesamiento de la imageI [Jason 96]

BIBLIOGRAFiA

[Buhmann Malik Perona 99] Joachim M Buhmann Jitendra Malik and Pietro Perona Institute of Informatics University of Bonn Germany Department of electrical and computer science university of California Berkeley 94720 Department of Electrical Engineering California Institute Technology Pasadena 91125 [Darpa 88) Darpa Neural Network Study Ed AFCEA Press Washington 1988 [Freeman Skapura 93) James A Freeman David M Skapura Redes Neuronales-algoritmos Aplicaciones y Tecnicas de Propagacion Addison-wesleyDiaz de santos 1993 [Gallon Olaya 2001] Camilo Gallon Fabian Alonso Olaya R Herramienta de Simulaci6n para el Reconocimiento y Clasificacion de Imagenes con Redes Neuronales Artificiales (UV-SRNA-RCI)Tesis de Pregrado Universidad del Valle Pregrado en Irtgenieria Electronica Santiago de Cali 2001 [Gonzalez 96] Rafael C Gonzalez Richard E Wods Tratamiento Digital de Imagenes Addison - Wesley I Diaz de Santos 1996 [Jason White Chase Luo Sutton 96) Jason A Janet

Mark W White Troy A Chase Ren C Luo John C Sutton 96 (1996) Center for Robotics and Intelligent Machines Departritent of Electrical and Computer Engineering North Carolinamiddot State IEEE International Conference on Robotics and Automation Minneapolis Minnesota April (1996) pag 3598-3604 Addison wesleyiberoarilericana rama 1995 (Vapnik 95] Vapnik V N (1995) The nature ofstatistical learning theory (Springer NY) [Reiher SaidLiSuen 99) Eric Reiher Fady Said Ying Li and Ching Suen Centre de recherche informatique de Montreal 1801 McGill College Avenue Suite 800

Montreal Quebec Canada H3A 2N4 Centre for Pattern Recognition and Machine Intelligence 1550 de Maisonneuve Blvd West Suite GMi06 Montreal Quebec Canada H3G 1M8 Commission III Theory and Algorithms KEY WORDS GIS Cartography Vision Neural Networks Pattern Recognition 1999

Ing FABIANA OLA YARAM1REZ lng CAMILO GALLON Ca~ona

Ingeniero Electr6nico graduado de lngeniero Electr6nico graduado la Unive~sidad del Valle 2001 de la U~iversidad del Valle200 Profesor dellnstituto tecnico rng De Servicios DATECSA PROYECT A e Ing de Campo Cali Colombia OMNICON Cali Colombia camillonlaciudadcom ffaortutopiacom

UNA APROXIMACION A LOS INSTRUMENTOS VIRTUALES PARA EL CONTROL CONREDES NEURONALES Y LOGICA DIFUSA

Ing Jaiber Evelio Cardona (jaibercyubartaunivalleeduco) PhD Eduardo Caicedo (ecaicedoeieeunivalleeduco) MSc Eduardo Owen (ejoweneieelInivalleeduco)

Grupo de Percepcion y Sistemas Inteligentes Escuela de Ingenieria Electrica y Electronica

Universidad del Valle psieieeunivalleeduco

Resumen En el presente articulo se muestra una clase de ~ Backpropagalion E3 instrumentos virtuales diseiiados por el grupo para implementar estrategias difusas y neuron ales y se realiza una aplicacion practica para el control de una planta de presion del Laboratorio de Automatica se comparan los resultados obtenidos ante un control PI clasico un control PI difuso y un control neuronal por modelo inverso especializado de la planta

Palabras clave Redes neuronales sistemas difusos control inteligente Instrumentacion virtual

1 INTRODUC CI6N

Con la adicion de caractcristicas especiales como capacidad de computo y simplificacion de tareas para el operario se incremento el costa de la instrumentacion se penso entonces en mejorar el desempefio sin adicionar gastosUna de las soluciones planteadas fueron los instrumentos virtuales [GOLDBERG 00] incorporando el hardware y el software necesario para que computadoras de propos ito general pudieran realizar eI trabajo dejando a elIas el intercambio de informacion entre el usuario y el sistema

Uno de los programas que permite realizar aplicaciones en instrumentacion virtual es elLabView bajo este software se estan desarrollando en la Universidad del Valle modulos de proposito general llamados instrumentos virtuales en Lab View (VI) para la implementacion de estrategias difusas Figura No 1

y neuronales que permitan realizar aplicaciones de tipo industrial y de laboratorio Los instrumentos virtuales mas importantes se En este articulo se muestran algunos avances en este mencionan a continuacion propos ito aplicando los VI desarrollados al control de una planta de presion bull Inicializa back inicializa Kohonen (Fig No 2)

2 INSTRUMENTOSVlRTUALES DESAR ROLLADOS Permiten asignar a los pesos de la red valores aleatorios entre cero y uno

Para la implementacion de las estrategias inteligentes basadas en logica difusa y redes neuronales backpropagation bull Procesa entrada procesa Kohonen (Fig No 3) y Kohonen se han desarrollado instrumentos virtuales agrupados en submenus dentro del Labview dichos Se entrega un vector de entrada a la red y se calcula la submenus pueden ser incluidos en la paleta de funciones salida Para una red Backpropagation la salida es un estandar La presentacion de los submenus se puede observar vector de valores para una red Kohonen la salida son en la figura No I los pesos de la neurona ganadora y su posicion Bajo los submenus backpropagation y Kohonen se agruparon diferentes funciones que permiten realizar las bull Aprende hasta error (Fig No 4) operaciones basicas para la manipulacion de dichos tipos de redes neuronales artificiales Permite aprender un conjunto de patrones en una red

Backpropagation hasta alcanzar un error determinado

98

bull Aprende patrones en un numero de iteraciones (Fig No 5)

Red tmtrada~Redfinal

inicializa backpropagalion yi

Toma los parametros de la red de entrada y saca una red simaar con numeros aleatorios en sus pesos

Procesa Kohonen

Determina la neurona ganadora de 101 red y da los pesos y 101 ubicaci6n de esta EI primer componente de la ubicaci6n indica 101 columna y la segunda la fila donde esta 101 neurona if m

Figura No 3

Figura No 4

99

iiB Help BIiJE3 Roefe----

Rocero---1 pesos (lilt)) ==I~P Patrones Jrmiddot--middoti

Lmaximo Alfa cero __---I

Alfa efe

Figura No 5

Realiza el aprendizaje de patrones para una red Kohonen en un n1imero de iteraciones determinado

bull Grabar y cargar redes y patrones

Ambos tipos de red tienen modulos para grabar y cargar las redes que se hayan trabajado anteriormente o patrones que esten digitados Para todos los casos se trabajan archivos tipo texto

Bajo el submenu de logica difusa se encuentran funciones para realizar operaciones difusas necesarias para implementar un sistema difuso sus principales instrumentos virtuales son los siguientes

bull Operaciones y 0 y no (figura No 6) Permiten realizar lasoperaciones 16gicas difusas

Figura No 6

bull Difusi6n (Fig No 7)

Tomando los con juntos difusos por medio de vectores calcula el valormiddot de salida realizando el paso de difusion

lmil_~liJi~IJ ~

Coniuntos bOllosos ==~ ~bull bull 1 -Salida(I Valor de entrada -----lt] gt~

Difusionmiddotitli

Figura No 7

bull Inferencia y concrecion (Fig No 8)

Tomando losvalores de pertenencia y las reglas de inferencia se realizan los 6aIculos del valor de salida

DrMil_~rolx itt(f~1h~-

Figura No 8

3 PLATAFORMA DE EXPERlMENTACION

31 Descripcion de laplanta Se desea controlar la presion del aire en un tanque cambiando 1a apertura de una valvula El esquema se muestra en la figura

No9

Flujo de entrada

Figura No9

La planta posee una entrada de flujo constante que alimenta el sistema 1a valvula es normalmentecerrada con una apertura entre 0 y 100 logrando una presionenel tanque

entre 2 y 9 psi

32 Estrategia de control neuronal

Se utilizo la estrategia del modelo inverso especializado de la planta [CASTRO 01] para ello se configuro una red Backpropagation con 3 neuronas de entradas y una neurona de salida ambas con Ia funci6n identidad y 3 neuronas en la eapa oculta con funcion de activacion sigmoidal

Debe existir una fase previa de entrenamiento para 10 que se apticaron varios escalones aleatorios a la entrada del sistema registrarido la salida a un tiempo de muestreo fijo Ia respuesta de la planta ante diversos escalones aleatorios con un tiempo de muestreo de lOOms se muestra en la figura

NolO

Se entreno la red neuronal utilizando como patrones de entrada los val ores de presion presente presion con un retraso y presion con dos retrasos y como patrones de salida la apertura de la valvula con un retraso EI esquema se muestra en la figura NoII

Una vez la red aprende los patrones hasta un error pequeno dicha red se puede utilizar como controlador [HUNT 92] por el esquema mostrado en Ia figura N12

100

Figura No1 O

RNA e

Figura No1 1

Ref

~~ lJ(n) RNA _~LANTAIY(n)

Figura No1 2

33 Estrategia de control difilsO

Se aplico una estrategia difusa PI Mandani [MANDAN I 74] Los conjuntos difusos definidos para el error el cambio del error y 1a salida ~c muestran en la figura No13

E=r

Figura No 13

Se utilizaron 5 reg las que se enuncian por medio de una tabla su definicion se muestra en 1a figura No14

CAMBD DE ERROR negatito ce 10 postilo

ERROR neg a tiro

cero

postilo

Figura No 14

Se utilizo e1 metodo del centro de area para la desfuzzificacion

4 Resultados obtenidos Junto con el controlador difuso y el neuronal se implemento un control PI sintonizado con las reg las de Ziegler Nichols para comparar los resultados

Al aplicar un escalon a la entrada los tres controladores llevaron a la planta a estado estable en un tiempo similar el control por red neuronal no presento sobreimpulso mientras los otros dos si La respuesta se puede ver en la figura No 15

EI esfuerzo de control como respuesta ante el mismo escalon se muestra en la figura No 16 se puede ver que el mayor esfuerzo 10 realiza la red neuronal mientras que los otros dos tienen un cambio mas suave

101

Figura No15

Ante un disturbio las estrategias PI difusa y clasica son capaces de llevar la planta a la referencia deseada mientras que la red neuronal no Las respuestas ante un disturbio se pueden ver en la figura No 17

Figura No16

5 CONCLUSIONES

Se comprobo en forma pnictica uno de los posibles usos de los instrumentos virtu ales desarrollados en LabView y se dejan sentadas las bases para desarrollos posteriores en este senti do

En este trabajo se utilizo el modelo inverso especializado con redes neuronales y el PI difuso para el control de una planta de presion EI resultado obtenido es aceptable al ser comparado con un PI clasico dichas estrategias nos brindan entonces una opcion valida diferente para el control Se pudo ver como un control PI difuso puede responder de manera similar a Ull control PI sin embargo llevarlo a un punto de trabajo bueno requiere

de umi afinacion empirica basada en el conocimiento de la pblnta

Figura No17middot

Al aplicar la estrategia de control por modelo inverso especializado se vio que la respuesta al escalon fue buena sin embargo esto depende del nfunero y calidad de patrones con quese entrene ademas de requerir un nuevo aprendizaje ante cambios severos en las condiciones de trabajo de la planta Esto se puede evidenciar ante la respuesta al disturbio al cambiar las condiciones de la planta el controlador neuronal no pudo llevar el sistema al punto de referencia deseado mientras que los olros dos controladores si 10 10graron

REFERENCIAS

[CASTRO 01] CastroT Orlando Giraldo H Norma Implemtacion de un sistema de control utilizando redes neuronales artificiales por modelo inverso especializado de la planta Colombia Cali Universidad del Valle Tesis de pregrado 2001

[EBERHART 90] Russell C Eberhart Roy W Dobbins Neural Network PC Tools A practical guide 1990

[GOLD BERT 001 GOLBERT Harold What is Virtual Instrumentation IEEE Instrumentation amp Measurement Magazine Diciembre 2000

[HUNT 92] HUNT K J SBARBARO D ZBIKOWSKI R GAWTHROP P J Neural Networks for Control System - A survey Automatica Vol 28 No6

[MANDANI 74] MANDANI EH Applications of Fuzzy algorithms for control ofsymple dynamic plant Proc IEEE 121 (12) 1585 - 15880974)

102

EXTRACCION DE CARACTERiSTICAS RELEVANTES Y RECONOCIMIENTO DE SEN-ALES EMG MEDIANTE UNA RED NEURONAL TIPO PERCEPTRON

MULTICAPA

Victor Grisales (vhgrisalesateneaudistritaleduco) Carlos Sanchez (CarlosAndresieeeorg) Fernando Rosas (FernandoRosasieeeorg) Vladimir Barrero (vbarreroieeeorg) Juan Leon (ipleonieeeorg)

GIDIC - Grupo de Investigacion y Desarrollo en Instrumentacion y Control Universidad Distrital FJDC - Facultad de Ingenieria - Departamento de EIectronica

Bogota - Colombia 200 I

Resumen Este articulo presenta la metodologia para el entrenamiento y valida cion de redes neuronales tipo perceptron multicapa (MLP) mediante un caso de estudio de reconocimiento

de seiiales mioelectricas (EMG) del brazo de un paciente sanD de 3 aiios mediante la utilizaci6n del algoritmo de BackshyPropagation (BP) Se utilizan bases de datos que presentan la relacionexistente entre el espectro de potencia de una senal mioelectrica (a traves de la FFT) y el desarrollo deseado por el paciente sobre las cuilles se aplican (ecnicas de ingenierfa neural para la depuracion de datos Se realiza entrenamiento verificacion y validacion de la redAdemas para la operacion en Ciempo real se propone el desarrollo de una interfaz electronica sobre un procesador digital de senales (ADSP-21061

Palabras claves PrOtesis de miembro superior Senal electromiografica Red Neuronal Artificial Analisis de correlacion Ingenieria neural

1 INTRODUCCION Por muchos anos ha existido la meta en bioingenieria de disenar una protesis controlada a partir de las senales

mioelec-tdcas del brazo para poder ser usada en los pacientes amputados Eneste articulo se presenta la metodologia para la apropiada discriminaci6n de la senal mioelectrica la cual simplemente representa el deseo del paciente para ejecutar cualquier clase de movimiento Apoyados en diferentes investigaciones al respecto [12] tenemos la hipotesis de que la informacion debe ser extraida a

traves deelectrodos de superficie en 4 puntos especiales del brazo

I

Se trata en primera instaneia la adquisicion de las senales mioelectricas junto con la seleccion de caracteristicas relevantes de los movimientos la creacion de bases de datos para el entrenamiento verificacion y validacion de la red

n~uronal y la determinacion del nfunero optimo de neurodos ocultos de la red para efectos de reconocimiento [3] Se realizan diversas pruebas de software considerando el porcentaje de acierto de la red y se realiza un analisis de relevancia con miras a una reduccion de la dimension del vector de entrada

2 PROCEDIMIENTO La red neuronal es utilizada en este sistema para aprender la relacion entre el espectro de potencia de la senal EMG y la

1 Miembro de 1a poderosa familia SHARCreg de procesadores de pUnto flotante de 32 bits)l

actuacion deseada por las personas incapacitadas La red puede diferenciar 7 movimientos de las diferentes seiiales EMG Este sistema esta compuesto por dos partes adquisicion y discriminacion de las senales

21 Parte de adquisici6n La parte de adquisicion consta de electrodos preamplificados de la empresa Delsys los cuales estan disenados con una ganancia de 1000vv y con un fiItro pasabanda de 20-450 Hz Ellos usan la geometria de contacto de barra paralela para asegurar la estabilidad de la senal y la repeticion fiel entre las grabaciones Debe evitarse un contacto pobre entre los electrodos y la piel ademas que se debe buscar la forma de sujetarlos fuertemente Debido a que una posicion inadecuada genera una senal diferente se busca conservar siempre la misma posicion de los electrodos Se trabaj6 con la seccion proximal del brazo y los electrodos se manejaron en forma de anillo utilizando cuatro electrodos uno frente at otro (ver Fig 1) Yun electrodo adicional como referencia

Flenie Fspalila

Localliacion de los electrodos Fig I Descripcion de la localizacion de los electrodos en el brazo del

paciente sano

Dadas las estrategias de entrenamiento de la red se debe definir la forma como estaran compuestas las bases de datos de acuerdo a las diferentes combinaciones en la posicion de los electrodos

De tal forma que si los electrodos se miden con respecto a un punto comtm de referencia se obtienen cuatro mediciones

103

(Oa) Al igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con referencia COlttUltrshy

(

~JP- I ~~_O~[f

(a)

Medicion de voltaje diferencial

fjmiddot ~~Jjl

or- t~Rfr~~~

(b) Fig 2 Localizacion de los electrodos

22 Parte de discriminacion Las seiiales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extension de la muneca pronacion supinacion apertura y

cierre de la mano

~E1E-l o m lID all mo 1000 1210

(b) Flexion de h mlliieca

0112 1 I o 21D lID EIlO mo lIDO 1210

(c) Reposo

Fig 3 Senales e1ectromiograficas

La senal mioelectrica es no periodica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amllisis de Fourier (algoritmo FFT) El espectro de potencia de la senal EMG (ver O)representa una distribucion continua como funcion de su frecuencia

Para la creacion de las bases de datos de trabajo se tomaron como entradas de Ia red neuronal numerosos ejempIos de movimientos incluyendo el reposo a partir de Ia segmentacion de la senal EMG en ventanas de tiempo de aproximadamente 64 ms (l024 muestras a una frecuencia de muestreo de 16 Khz)

)l ~ 1 D 11]] 20J 3D lID SIl all

(a) Apertura de Mano

l j D 11]] 21ll 3D lID SIl all

(II) Flexionde hmlliieca ror---------~--~~---T-----r----

III

3J

2l

10 Dl I D IIll 21ll 3JD IDD roD 6DII

(e) Reposo

Fig4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciaIes junto con las respectivas salidas que confonnan el vector objetivo de clasificacion (Target2

) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen el mismo numero de muestras porque estadisticamente ellos no tienen Ia misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla I)

TABLAl DISTRIBUCI6N DE LOS MOVIJvtIENTOS

J 1 REPOSO 60

Jz APERTURA DE MANO 75

J3 CIERRE DE MANO 75

J4 FLEXI6N DE LA MuNECA 625

J6 EXTENSION DE LA MuNECA 625

J 6 PRONACI6N 625

J SUPINACI6N 625

EI conjunto utilizado de caracteristicas parte de que e~ estos valores esta contenida esenciahnente Ia infonnacion para efectos de clasificaci6n de Ia senal EMG

Sin embargo resulta conveniente una comprobacion yo reduccion del espacio de caracteristicas mediante el analisis

de correlacion segim se explica a continuacion EI analisis de correlacion pennite detenninar Ia dependencia lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor masbajo ell orden de

2 donde las columnas almacenan valores 09 001 para indicar la pertenencia

o no pertenencia a la c1ase de movimiento que c0fesponda

104

irnportanciaEl analisis de correlacion de caiacteristicasparte del calculo de la correlacion y del coefici~nte decorrelaci6n asi 5i se considera un vector caracteristico de entradas X =

Xh xN con Ncaracteristicas la correlacionentre las caracteristicasi-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esta dada en (l)

cCor(Xx)=(IIQ) poundE(X~q)~p)(x(q)_p)(I)Y I J q=l I I J J

donde

E es el operador de valor esperado Xj(qj es el valor de la i-esima caracteristica del vector caracteristico X XV es el valor de la j-esima caracteristica del vector caracteristico X 1 es el valor esperado de la i-esima caracteristica sobre la poblacion de muestra de tamano Q flj es el valor esperado de la j-esima caracteristica sobre la poblacion de muestra de tamano Q

El coeficiente de correlacion estandarizado adimensional esta dado por (2)

~--

Pij =Cij ~(CiiCff) (2)

Esta ecuacion satisface la desigualdad de Cauchy-Sch-vartz quedando acotado el rango para Pij entre los valores-l y I

1 ~ ~j ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pij estara mas cercade cero (Cij 0) Para efectos de reducci6n del numero de entradas a la red neuronal se considera que dos caracteristicas esUin altamente correlacionadas en el caso en el que IPij gt 0707 Para el caso de reconocimiento de senalesEMG se ha considerado que la infonnacion relevante esta contenida en 50 componentes para efectos de reconocimiento de los diferentes movimientos La Tabla II muestra parte de la matriz de correlacion (12 primeras componentes) calculada para la base de datos

I 2 3 4 5 6 7 8 9 10 11 12

y TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACI6N 2 3 4 5 6 7 8 9 10 II 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de nvisar lamatm decoeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pijl lt 0707 por locualse puede decir que noestan altamente correlacionados y en consecuencia puede concluirse que las caracteristicas pueden ser consideradas independientes La parte de discriminacion esta confonnada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizacion del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripcion de cuantas capas tiene el nfunero de neuronas en cada capa la funcion de transferencia de cada capa y como se interconectan elIas entre sL La topologia de la red MLP tiene diferentes capas (ver 0) la capa de entrada (N) unacapa oculta (M) y una capa de salida (J) La capa de salida tiene tantas neuronas como el ntimero de movimientos a desarrollar

El proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validacion y (iii) verificaci6n Las tres (3) bases de datos fueron creadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

105

Vecrorde Entradas

Capade Entrada

Capa Oculta

Capade Salida

Fig 5 Arquiteclura de la red neuronal

TABLA III

11

DISTRIBUCI6N DE DATOS PARA EL APRENDlZAJE DEL MODELO MLP

Movimiento Ejemp Entr Verif ValL REposo 6000 3600 1500 900 APERTURADE 750 450 188 112 MANO CIERREDE MANO 750 450 188 112 FLEXI6NDE 625 375 156 94 MuNECA EXTENSI6N DE 625 375 156 94 MUNECA PRONACI6N 625 375 156 94 SUPINACI6N 625 375 156 94 TOTAL 10000 6000 2500 1500

(Oa) AI igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con Medicion de voltaje referenda COJltUlt clifureJlCial

r-shy

( r ___nlll ( ~____J1 ~ ~r t laquo -1 ~v- fL-Rtr

~_~__ _~_1)7II[f e-~---

(b) Fig 2 Localizaci6n de los electrodos (a)

22 Parte de discriminaci6n Las senales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extensi6n de la mufieca pronaci6n supinacion apertura y

cierre de la mano

~I2E~1a l]] ltOD 6D Em llJJJ Ilm

(a) Apertura de lobno

~~lo 2Il lID EIJl roo HIll =

(b) Flexion de ]a muiieca

oa r--~-----------------

nm l o 211l lID amp10 roo 111l[]

1210

(t) Reposo

Fig 3 Senales electromiograticas

La senal mioeIectrica es no peri6dica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amiHsis de Fourier (algoritmo FFT) El espec1ro de potencia de la senal EMG (vcr O)representa una distribucion continua como funci6n de su frecuencia

Para la creation de las bases de datos de trabajo se tomaron como entradas de la red neuronal numerosos ejemplos de movimientos incluyendo el reposoa partir de la segmentacion de la senal EMG en ventanas de tiempo de aproximadantente 64 ms (1024 muestras a una frecuencia de muestreo de 16 Khz)

~[ j [] VII 2Il m lID EIJl EIJl

(a) Apertura de Mana

l 1 [] VII 211l m lID EIJl EIJl

Ill 40

31

ill

ID []L

D

(b) Flexion de ]a muiieca

IIIl 211l 310 40D IlO Il[]

(c) Reposa

Fig 4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciales junto con las respectivas salidas que conforman el vector objetivo de clasificaci6n (TargeP) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen elmismo numero de muestras porque estadisticamente ell os no tienen la misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla nmiddot

TABLA I DlSTRIBUCION DE LOS MOVlMIENTOS

60REPOSOJ1 75APERTURA DE MANOJz

75CIERRE DE MANOJ3 625FLEXION DE LA MuNECAJ4 625EXTENSION DE LA MuNECAJ6

625PRONACIONJ 6

625SUPINACIONJ

El conjunto utilizado de caracterlsticas parte de que en estos valores esta contenida esencialmente la informaci6n para efectos de c1asificaci6n de la senal EMG

Sin embargo resulta conveniente una comprobacion yo reducci6n del espacio de caracteristicas medianteel analisis de correlacion segun se explica a continuaci6n EI analisis de correlaci6n permite determinar la dependencia

lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor mas bajo ell orden de

2 donde las columnas almacenan valores 09 6 01 pam indicar la pertenenci3

o no pertenencia a la c1ase de movimiento que co~esponda

104

inlportandaEl analisis de correlacion de caracteristicas parte del calculo de la correlacion y del coeficiente decorrelaci6n asi Si se considera un vector caracteristico de entfadas X = XhXN con Ncaracteristicas la correlaci6nentre las caracteristicas i-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esrn dada en (1)

Qc=Cor(XX)(lQ) L E(X~q)-Il)(x(q)_Ilmiddot)(I)

I I J q=l I I J J

donde

E es el operador de valor esperado Xi(q) es el valor de la i-esima caracterlstica del vector caracteristico X Xr) es el valor de la j-esima caracteristica del vector caraderlstico X ~i es el valor esperado de la i-esimacaracteristica sobre la poblacion de muestra de tamafio Q ~j es el valor esperado de la j-esima caracteristica sobre la poblaci6n de muestra de tamano Q

Elcoeficiente decorrelaci6n estandarizado adiinensional esta dado por (2)

Pij = Cij I ~r-(C-iiC-iJ-) (2)

Esta ecuacion satisface la desigmildadde Cauchy-Sch~artz quedando acotado el rango para Pj entre los valores-I y I

-1 ~ Pij ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pj estara mas cerca de cero (Cij 0) Para efectos de reduccion del nfunero de entradas a la red neuronal se considera que dos caracteristicas estan altamente correlacionadas en el caso en el que Pij gt 0707 Para el caso de reconocimiento de senales EMG se ha considerado que la informaci6n relevante esta contenida en 50 componentes para efectos de reconocimiento delos diferentes movimientos La Tabla II muestra parte de la matriz de correlaci6n (12 primeras componentes) calculada para la base de datos

1 2 3 4 5 6 7 8 9 10 11 12

TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACION 2 3 4 5 6 7 8 9 10 11 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de revisar lamatrizde coeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pij lt 0707por 10cual se puede decir que no estan altamente correlacionados y en consecuencia puede concluirsemiddot que las caracterlsticas pueden ser consideradas independientes La parte de discriminacion esta conformada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizaci6n del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripci6n de cmintas capas tiene el numero de neuronas en cada capa la funcion de transferencia decada capa y c6mo se interconectan ellas entre sf La topologia dela red MLP tiene diferentes capas (ver 0) la capade entrada (N) una capa oculta (M) y una capa de salida (1) La capa de salida tiene tantas neuronas como el nfunero de movimientos a desarrollar

EI proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validaci6n y (iii) verificaci6n Las tres (3)bases de datos fueroncreadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

Vector de En1rtdas

Capade Capa Entrada Oculta

Fig 5 Arquitectum de la red neuronal

TABLA III DISTRIBUCION DE DATOS PARA EL APRENDIZAJE DEL MODELO

MLP

I I I

Movimiento Ejemp Entr Verlf ValL REposo 6000 3600 1500 900 APERTURADE MANO

750 450 188 1I2 I

CIERREDE MANO 750 450 188 1I2 FLEXION DE MuNECA

625 375 156 94

i EXTENSION DE MuNECA

625 375 156 94

PRONACION 625 375 156 94 SUPINACION

TOTAL 625 10000

375 6000

156 2500

94 1500 I

105

II

Las pruebas de entrenamiento y validacion se hicierona partir de las bases de datos de trabajo normalizadas ejecutando el programa de entrenamiento de MLP con base en el algoritmo BP

Se realizaron 5 pru~pas para diferentes valores del numero de neurodos de la capa oculta (M) tOl unmiddotminimo de iteraciones de 1000 variando el valor de Mdesde 30 hasta 100 en pasos de 5 A medida que se ejecuta 61 algoritmo de entrenamiento se va evaluando el error de vaHdpoundcion quedando registrada la iteracion para la que se obtiene ~I minimo valor asi como los correspondientes valores de la red El algoritmo se ejecuta

shyhasta que se alcance el numero de iteraciones especificado 0

se logre reducir el error t9tal po debajo del ~nimo preestablecido (0005)

Los valores de los errores mlmmos de entrenamiento y validacion son fundamentalesmiddot cQmo medida para deterrninar el grado de aprendizaje de lalt red y permiten deterrninar el punto a partir del cualla red empieza a memorizar mas que a aprender Se hace tambien necesario prQ9~r la red luego de haber sido entrenada para esto se hace USa de la base de datos de verificacion la cual se pasa a traves de la red neuronal para determinar el porcentaje de aciertos en el reconocimiento de los movimientos dando lugar a la llamada matriz de confusion3

bull

Con base en estos criterios se determinaron las matrices de confusion tanto para entrenamiento como para verificaci6n en cada una de las pruebas realizadas y se concluye que el numero optimo de neurodos para la capa intermedia M en nuestro caso es de 75

3 CONCLUSIONES El amllisis de correlacion de caracteristicas debe hacerse antes de entrenar la red para saber si hay dependencia entre las componentes frtcuenciales

Los valores de los errores mmlmos de entrenamiento y validacion son fundamentales como medida para determinar el grado de aprendizaje de la red especialmente en el punto a partir del cual puede considerarse que la red empieza a memorizar mas que a aprender

Al realizar varias iteraciones se puede escoger el vector de pesos mas adecuado superando el problema de los minimos locales propio del algoritmo de entrenarniento de BP

4 TRABAJO FUTURO Para la openicion en tiempo real [4] se propone que este procedimiento se implemente sobre un procesador digital de senales (ADSP-21061) el cual operara sobre el conjunto de pesos obtenidos gracias a la red y de esta forma poder desarrollar una interfaz electronica que reciba identifique y procese las senales mioelectricas del brazo y ademas que

3 se forma comparando las salidas reales de la red con las salidas deseadas para todos y cada uno de los ejemplos de la base de verificaci6n

controle los movimientos hasicos que se asemejen a los naturales perrnitiendo a su vez ser adaptada al interior de una protesis e1ectromecanica de mano demostrando la efectividad del sistema para pacientes amputados a la altura del tercio proximal (antebrazo) con criterios de viabilidad economica y optimo uso energetico para su funcionamiento EI prototipo planteado presenta la arquitectura de la O

Seihlde los eledloclos

Catr~l5or

~ Digital

I I

Fig 6 Diagrama esquematico de una interfaz para una protesis mioeleclrica

REFERENCIAS [1] Kaduhiko Nishikwa Katsutoshi Kuribayashi Neural

Network Application to a discrimination system for controlled prostheses IEEEIRSJ International Workshop on Intelligent Robots and Systems nov 1991

[2] Adrian del Boca Dong C Park Myoelectric signal recognition using fuzzy clustering and artificial neural networks in real time IEEE Transactions on Biomedical Engineering jun 1990middot

[3] Looney Carl G Pattern recognition using neural networks Theory and algorithms for engineers and scientists Oxford University Press 1997

[4] Embrec Paul C++ Algorithms for Real Time DSP Prentice Hall 1999

[5] Alan V Oppenheim et al j Discrete Time Signal Processing Prentice Hall 1999

AUTORES Ingeniero Victor Hugo Grisales Opta por el master en e1ectrica en la Universidad de los Andes Profesor de tietnpo completo en la Universidad Distrital Director del grupo I+D en instrumentacion y control

Carlos Sanchez Fernando Rosas Vladimir Barrero Juan Leon Estudiantes de ultimo semestre de Ingenieria Electronica en la universidad Distrital FIDC Miembros

Estudiantiles del IEEE

106

ANALISIS ACUSTICO EN LA CLASIFICACION DE SENALES DE VOZ EMPLEANDO RNA

German Castellanos (gcastel1ieeeorg) Francisco Vargas (pcinevadomanizalesunaleduco) Grupo de Control y Procesamiento Digital de Senales - Universidad Nacional de Colombia - Sede Manizales

Resumen Se presenta un sistema de clasificaci6n desefiales de voz basado en sus caracteristicas acusticas el cual se ha dividido en tres partes obtencilm del ensamble inicial de caracterizaci6n acustica de la voz basandose en tecnicas de proceso digital de senales en tlempo real reduccion hasta elmenor ensamble de parametros representativos y suficientemente discriminantes de las clases basandose en tecnlcas estadisticas y por ultimo la construction de las reglas de decisi6n para clasificacion de senales de voz que pueden ser basadas en el empleo de redes neuronales EI sistema rue probado en la clasificaci6n devoz de acuerdo al sexo y edad de los hablanies y como resultado se determinan sus caracteristicas acusticas mayormente influyentesmiddot Ademas esta orieiltado a la tipificacion de norinalidad 0 alteraci6n de las direrentes clases de voz Para el presente trabajo rueronmiddot evaluadas las redes multi-capa y los mapas auto-organizatlvos de Kohonen

L INTRODUCCI6N

En la evaluacion de la voz la metodologia perceptual caracterizada por Ia calificacion de las cualidades vocales segUn el juicio experto de un sujeto necesita habilidades refinadas de escucha EI empleo de tecnologias digitales permite evaluar de manera objetiva la acustica y fisiologia del fenomeno Durante el proceso de evaluacion objetiva de voz normal 0 alteradaes necesario determinar sus caracteristicas cualitativas como es el caso del couelato acustico timbre aspero la emision con quiebres el ataque vocal duro (fmal de frase abortado) voz hiponasalizada y ruido acoplado para lograr muestras que sean altamente fieles alemisor El empleo de sistemas computarizados de anaIisis acustico de voz provee la posibilidad de percibir elementos dificiles de registrar mediante la observacion sUbjetiva convencional

EI uso de caracteristicas acusticas (CA) en la descripcion de normalidad 0 alteracion de voz ha sido probado en VallOS

contextos y con diferentes objetivos por cuanto perrniten ponderar cualitativamente las propiedades de la voz dificilmente realizable por otros metodos [123] Aunque se han Ilevado a cabo estudios de correlacion de estas caracteristicas con la metodologia perceptual sus resultados ademas de ser ambiguos a veces pueden ser contradictorios en el analisis de tipicidad (normalidad) 0 diferentes alteraciones de las senalesmiddot de voz De tal manera que la seleccion

-apropiada de la medida de las CA y su interpretacion sigue siendo un problema sin solucion

parametros representativos de cada clase se realiza el preproceso de los CA sobre los cuales se construye el ensamble inicial de caracterizacion acustica de voz La Seleccion del ensamble efectivo se realiza mejorando la efectividad de empleo de cada uno de los CA para 10 cual se analizan los criterios discriminatorios de correlacion e informacion mutua Finalmente la reduccion de la dimensionalidad de ensamble se realiza por el metoda de las componentes principales Una vez extraidos los parametros necesarios para la caracterizacion de la voz se resuelve la clasificacion de la voz en el tipo normal y no normal (con alteraciones )

MtltJ~ llbIUtl IHlttmllJgt

Fig 1 Diagrama de bloques reconocimiento de palrones de senales de voz

EI reconocimiento de patrones de senales de voz se puede dividir en dos procesosmiddot fundamentales como se aprecia en la figura Imiddot el entrenamiento que comprende la extraccion y seleccion del con junto de caracteristicas acusticas (id iE(I Ni) que representan cada clase de voz kE(lK) y la toma de decisiones que realiza la clasificacion por algun principio discriminante

EI tipo de reconocimiento empleado en el presente trabajo es una derivacionmiddot de lamiddot metodologia propuesta en [22] compuesta de dospartes hasicas a) Extraccion y Seleccion del ensamble efectivo de CA por clase b) el ensamble efectivo de CA es tornado como entrada de una RN usada en calidad de clasificador que en el caso particular fue del tipo backpropagation Asi fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen

2 ENSAMBLE DE CARACTERIZACI6N INICIAL ACUSTICA DE VOZ

La caracterizacion de la voz requiere de un elevado nUmero Elanalisis acustico de un sonido articulado consiste en de valores de CA En el articulo se presentan algoritmos de determinar los indicadoresfisicos de las vibraciones que 10 estimacion en tiempo real para los principales CA que en constituyen tales como la frecuencia la intensidad la general son muy sensibles a las condiciones acusticas de composicion espectral las variaciones del sonido modificadas tnedida [4] Para aumentar la efectividad en el uso de los por la resonancia que actuan originando el producto sonoro

107

que permite predecir la proXima muestra como una percibido [56] La seleccion de parametros que caracterizan

combinacion lineal de las anteriores [10] la voz es tal vez la etapa mas importanteen el desarrollo de sistemas automatizados de su proceso Uno de los principales y(n)=-taky(n-k) (2)problemas en el analisis de las CA de voz consiste en que la mayoria de eUos son sensibles a diferentes condiciones de

k=l

donde q es el orden del predictor y ak son los coeficientes de medicion Este factor conlleva a escoger el ens amble de prediccion lineal (LPC) Los coeficientes ak pueden ser parametros acusticos que brinde la mejor estimacion de determinados a partir del calculo de coeficientes demiddot irregularidad y perturbacion para la clasificacion y autocorrelacion De esta manera se tendcln q coeficientes de reconocimiento de senales de voz En general toda CA de prediccion lineal por cada trama de la senal de voz Tambien amilisis debera cumplir con las siguientes propiedades [6] a) es habitual aplicar el calculo de los coeficientes LPC Debe ser facilmente estimable y 10 menos dependientes de las cepstrales (Ia transformada de Fourier inversa del espectro de perturbaciones ambientales b) Su estimacion debe ser estable amplitud logaritmico) que representan la respuestaen el tiempo y c) No debe ser imitable Las CA pueden ser aproximadamente logaritmica 0 psofometrica del oido agrolJados de acuerdo a las propiedades acusticas que deben humano Los coeficientes LPC cepstrales Ck presentan la medir y los cuales en la practica se asocian en dos categorias ventaja de convertir el ruido convolucional en ruido aditivo y [7] permiten separar la excitacion glotal de los parametros del

tracto vocal Seguidamente se emplea un tipo de ventaneo que a) Parametros cuasiperiodicos Son disenados para la acentue los pesos de los LPC cepstrales con el objeto de captura de varias fonnas de periodicidad de las obtener mayor discriminacion de la envolvente espectral perturbaciones en la senal aclistica Entre los principales

parametros de este gropo estan b) Parametros de perM-bacion Destinados a medir la componente relativa de ruido en la senal de voz Para la

La Frecuencia Fundamental (Fo) que es referida a las estimacion de las perturbaciones de los parametros de la caracteristicas de cuasiperiodicidad de la senal en el tiempo frecuencia fundamental es comun el empleo del promedio Los diferentes metodos de estimacion del calcul0 del Fo relative de perturbacion (RAP Relative Average Perturbation) fueron analizados y comparadosen [S] por tiempo de proceso

definido como [1311] y precision obteniendose que el metodo (AMDF Magnitude Difference Function) [69] es mas veloz cuyo algoritmo esta

dado por iJ n z=(tIZH +z Zi+l -Zi llLRAP 1=1 3 1=1

AM(km)= (3) siendo n es el numero de ciclos consecutivos analizados 1 m

- Lly(n)- y(n-k)w(m-1t) Cuando el panimetro de perturbacion z se refiere al periodo N n=m-N-l) de la frecuencia fundamental se define el Jitter mientras que

en el caso de su amplitud se define el Shimmer [14] EI nivel (1) de perturbaciones tambien puede ser caracterizado por elDonde yen) es la senal digitalizada de voz wen) es la ventana

de proceso con longitud N m es el numero de muestras armonico ruido H 0 energia promedio del ruido de fondo ij(t) empleadas en la estimacion k es el retraso para el cual se esta que se determina como

Tcalculando el AMDF H = 11Jr((r)ciT (4a)

Los formantes En el espectro de una senal de voz se o encuentran regiones de enfasis (Uamadas resonancias) y de donde 1E [01] El componente de ruido N se defme como la deenfasis (antiresonancias) [9] ambas resonancias diferencia de energias de la senal de informacion y del denominadas formantes que siguen patrones comunes en la armonico ruido mayoria de los humanos determinadas basicamente por sus medidas antropometricas [101112] En la practica se nT analizan 5 fonnantes (FI F2 F3 F4 F5) junto con sus N = LJ[yj (1 )-11(1)]2 dT (4b)respectivos anchos de banda (LlWI LlW5Y los cuales se

=1 0 definen como el gropo de frecuencias que hay desde la caida a

donde 1E[O1] Finalmente el armonico ruido se determinposterior y anterior de 3 dB La energia del formante sera el como HNR=HIN Para aplicaciones profesionales la energia

valor del pica y el valor del formante la frecuencia donde se se determina por la diferencia entre la energia de la emision

encuentre el pica anterior [11] La estimacion de los vocal y la energia del ruido ambiente dado por formantes se realizo sobre algoritmos basados en la

suposicion de que la voz puede ser representada por modelos II

P(n) = -1

Ly2 (i) (4c)en fonnadeun numero reducido de indicadores a partir de n 1=1los cuales es posible su reconstruccion adecuada Para esto se S

donde n es el numero de puntos de la senal y(t) OlrD empleantecnicas de prediccion lineal basadas en el a

parametros analizados son la Energia de nlido normalizadmodel ado deltracto vocal mediante un filtro de solo polos (NNE) que ha sido estudiada en varios contextos [71415] Y

108

la excitaciim g16tica a ruido (GNE) estima el ruido en un tren el proceso de medicion influencia de fuertes perturbaciones de pulsos que es tipicamente generado por la oseilacion de los etc En este caso el valor anomalo del arreglo se expresa pliegues de voz [3] mediante el valor critico de la distribucion de Student fp n-2

La cantidad de CA N de representaci6n de voz t es [1717] completado por la primera (parametros delta) y segunda derivada (delta-delta) en el tiempo de los LPC cepstrales [6] y I e- In I[J s Ipn_] (n-I )112I(n-2+(lpnd)lf2 (5) debe realizarse para cada una de los tipos de senales de voz a clasificar Realmente cada CA puede influir de diferente siendo JIll yO respectivamente la media y varianza del manera en la pronunciaci6n de cada palabra En la practica de valor extremo en analisis del arregl0 I p es el nivel de la fonoaudiologia es comllo el empleo de palabras claves 0 significacion A efectos de comparaci6n de las realizaciones maestras En el caso particular se cada muestra fue tomada de losdiferentes parametros acusticos es preferible su basados en la pronunciaci6n de las cinco vocales estandarizacion estadistica Asi

Cabe anotar que el reconocimiento de senales de voz debe (6)~I =(i- mJ)O realizarse en linea por 10 que los algoritmos de proceso deben estar orientados a su desarrollo en tiempo real Los metodos empleados de estimacion de cada caracteristica fundamentalmente empleando metodos de amiJisis en acustica exigen la verificacion de hipotesis de la intervalos de tiempo cortos de los segmentos de voz los homogeneidad la cual se lleva a cabo por el criterio i y en cuales se analizan en [616] casos extremos se emplea el metoda Kolmogorov-Smirnov

[IS] Si laverificacion muestra claramente la invalidez de la hipotesis de gaussividad es importante determinar el tipo de

3 SELECCION DEL ENSAMBLE EFECTNO distribucion de fdp para cada ensambleI y si es posible la forma de su transformacion a la normal La transformacion de

La extraccion de CA se realiz6 acorde a los algoritmos la variable [Jj en sect con distribucion nonnalizada se determina presentados en anteriormente Asi se escogio un conjunto de de la relacion caracteristicas acusticas UiI i= I bullN que representan cada dase de voz k= I $ El sistema automatizado de extraccion ~

de parametros calcula 20 CA para cada una de las cinco ~21C1_ J e_2 dt =Lr M ji(Aji-1 lt Sjlt Aji) voeales (aIlellillollul) pronunciadas en la emision de voz a __ =1 N analizar Como resultado se obtuvo un valor de Nr I 00 para

j

(7)una sola emision de un paciente dado En cuanto a los grupos de clasificaci6n se definieron los siguientes a) Hombre

donde ~gve es el ens amble real de 0 res el nlimero relativo Adulto k=l b) Hombre Nino k=2 c) Mujer Adulta k=3 y d)

de intervalos delhistograma AJi Aji son los valores extremos Mujer Nina y k=4

del intervalo i del histograma del parametro 01 ~ es la frecuencia de ocurrencia en cada intervalo del intervalo i Una

Las estimacion de las CA de voz e es muy sensible a forma empirica alterna de ajuste consiste en la transformacion

faetores tales como las condiciones acusticas de toma de de cada CA 0(1) por diferentes operaciones basicas y

senales (ruido de fondo hardware de registro electronico comunmente empleadas en el tratamiento de voz

tiempo del dia en que se Ie toman las muestras al paciente contenido de las palabras etc) por 10 que la primera tarea a

~(I)=lg((I)plusmna) I01 c(1)=lg(aplusmn (I)(I) resolver en su clasificacion usualmente es el preproceso de

~(I)=1((1)110datos de las realizaciones que esta orientado a aumentar la efectividad en el uso de los parametros representativos de cada clase De otra parte la cantidad de realizaciones 0 Despues de cada transformacion se realiza la prueba i y se

toma aquella operacion que con mayor certeza confirme la ensamble N determina las limitaciones en la eleccion del hipotesis de gaussividad En general para cada []jk se puede metodo de preproeeso en particular se debe evitar el efecto tener una transformacion diferente [23] de valores extremos de ensamble muy pocas realizaciones 0

sobrevaluacion del ensamble [17] Las CA estan construidas La seleccion del ensamble efectivo de los rasgossobreestimaciones por 10 que es importante tener discriminantes constituye el aspecto fundamental en uninformacion sobre la fdp (0 su familia) para la cual se sistema de reconocimiento de patrones Las propiedades que calculan sus momentos Por este motivo el ensamble de deben cumplir las CA para su selecci6n son las siguientes prueba Ne se escogi6 de acuerdo al minima numero de

realizaciones que se deben tener para verificacion de Capacidad discriminante Es decir que separen 10 mashipotesis que para valores dados del nivel de significacion nitidamente posible las clases existentes P 01 Yun error de 10 obteniendose N90 muestras por Confiabilidad Esto es los objetos de una misma clase clase [17] deberan presentar la menor dispersion posible Ausencia de correlacion Es decir evitar en 10 posible la La siguiente etapa en el preproceso de datos esta enla utilizacion de caracteristicas que dependan fuertemente eliminacion de datos anomalos debidos a posibles errores en entre si

109

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 4: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

otras y asi la verdadera clasificacion se da despues de vaHdar el sistema es este instante se corrobora el verdadero aprendizaje de la red si esta c1asificacion no tiene exito se procede a evaluar los puntos defallo del sistema y se vuelve a entrenar la red con los ajustes previos que conlleven al mejoramiento en la c1asificacion En la figura 5 se puede observar el procedimiel)to blisico utilizado para 1a obtencion de los resultados del trabajo

~ P Poblacion de objelos

ReconocimienloSeosado Exlraccion d Mediday Rasgos

IProeeamienl I

I

Objeto I)alo Medido Vector de Identificadol Muestreado Rasgos clases

Fig 5 Proceso de reconocimiimto y c1asificaci6n de patrones [Darpa 88]

4 RESULTADOS Y ANALlSIS

Se probaron redes con una sola capa oculta con diferente nfunero de neuronas y funciones de activacion asi durante el proceso de aprendizaje se elcontraron diferentes problemas e inconvenientes como la no-convergencia del proceso de entrenamiento de las redes debido en gran medida a que el conjunto de patrones de entrenamiento excedia la capacidad de aprendizaje de las redes ytambien la apandon de grandes minimos locales en la funcion del error cuadnHico que se generaba por 10 que se dificultaba la posibilidad de alcanzar el minimo global durante e1 entrenamiento tambien surgieron problemas de saturacion en algunas neuronas de la capa oculta Para solucionar estos problemas presentados en principio se decidio analizar diferentes tipos de arquitecturas con diferente numero de capas mimero de neuronas por capa y numero de iteraciones para asi poder llegar a una solucion

satisfactoria Para el entrenamiento de la red se utilizaron las siguientes figuras teniendo en cuenta sus rotaciones y algunos niveles de ruido que en promedio era del 20

Circulo con 23 figuras Cuadrados con 20 figuras Elipse con 36 figuras Pentagono con 33 figuras Rectangulo con 46 figuras Rombo con 43 figuras Triangulo agudo con 80 figuras Para un total de 281 figuras para el entrenamientocada figura con 8 posiciones teniendo un numero de patrones igual al numero de figuras parametrizadas

La seleccion de las figuras para entrenamiento se realiz6 tomando criterios como la representatividad figuras con valores criticos (como figuras de la misma clase pero con patrones muy dijerelltes alas otras) figuras que tuvieran dificultad en e1 procesamiento de 1a imagen (como figllras que en el procediniiento de normalizacicm del tamano pierden algunas caracteristicas) figuras limpias y figuras bien definidas En la busqueda de la mejor red se probaron muchas arquitecturasen la Tabla 2 se presentan algunos de los resultados obtenidos durante la etapa de aprendizaje teniendo en cuenta diferentes criterios en cuanto al numero de capas mimero de neuronas de la capa oculta(CO) tipos de funciones de activacion en capa oculta y capa de salida y numero de iteracionestambien se presenta en la ultima columna el Error cuadriitico(EC) correspondiente a cada

arquitectura TABLA 2

RESULTADOS DE APRENDIZAffi CON VARIAS ARQUITECTURAS

N0 Ndeg de FA FA Ndeg de Ue EC cap neur co CS

CO 3 16 3 8 3 8 3 8 2 3 8 3 3 8 3 3 7

3 7 3 3 7 2

3 5 3 7 3 12 1 3 16 4 4

4 16 4 16 I

Funciones de activaci6n 1 Timgencial-sigmoidal 2 Lineal 3 Sigmoidalmiddot

2

2 2 3

2

2 2 2

2 2 2 2 2

23000middot 014

25000 011 25000 015

25000 Instable

25000 046

25000 0377 25000 016

25000 lnestable 25000 inestab1e

25000 022 25000 023

25000 008

25000 007

25000 0058

50000 00008

75000 00003

En la busqueda de la mejor red se encontro que e1 mejor ~ fue de 01 y 0 fue de 00075 aunque tambien respondi6 bien con un ~ de 05 peru con un 0 de 000075 los valores anteriores son determinantes en la busqueda del mejor entrenamiento estos son como factores de amortiguamiento para tratar de evitar un cierto numero de oscilaciones en la busqueda del menor error cuadriitico Otro criterio evaluado fue el numero de iteraciones siendo las arquitecturas de 4 capas las que se desfasaron en ese pariimetro pero comparando estos dos parametros y despues d~ un arduo pruceso de validaci6n acontecio que el tiempo invertido en el numero de iteraciones

es recompensado en Ia validaciol1 de las imagenes

obteniendose un mejor rendimieilto para la arquitectura de 4 capas [Ganon 2001]

96

CONCLUSIONES

pound1 proceso investigativo que se nevo a cabo se encamino a la utiIizacion del algoritmo de aprendizaje Backpropagation aplicado a una red MLP Fig 1 para que interactuaracon el sistema de procesamiento de imagenes por ser no solo el que mejor se acoplaba a las expectativas del desarrollo sino tarnbien por sus caracteristicas El desatrollo en cuanto a procesamiento de imageries frente a aspectos como el tamano posicion orientacion y cIase de imagen at que se llego mediante el desarrollo investigativo dio com() resultado un sistema que Ie presentara al usuiuio la oportunidad de analizar y estudiarmiddot una aplicacion predeterminada nombrada anteriormente y asi mismo poder tener acceso a otro tipo de imagenes desarrolladas por el e interpretadas a su gusto [Reiher 99]

El objetivo de laspruebas que se realizaron en esta aplicacion fue tratar de encontrar los parametros optimos de la red neuronal que consigan reducir al maximo el error en el menor numero de iteraciones aunque no siempre es posible alcanzar eI error minimo con un minimo de iteraciones ya que luego de determinada cantidad de iteraciones elerror decrece muy lentamente Debidomiddot a estomiddot es necesario sacrificar econom~a (aUl1lellto de capas ylo lIeuronas ocultas) [Vapnik 95]

Si las formas de las figuras son muy semejantes entre sf dentro de la misma clase el errormiddot disminuye muy nipidamente consiguiendose un valor muy pequeno Por otro lado si estasfonnas de las figuras son muy diferentes dentro de 1a misma dase la ve10cidad de aprendizaje es muy lenta y en ocasiones ocurren oscilaciones bruscas Luego se puede afirmar que la red aprende formas semejantes con mayor facilidad que formas diferentes En ocasiones si las fonnas de las figuras son muy semejantes entre si excepto algunos diferentes es posible que la red ignore estos ultimos si no hay suficientes neuronas en la capa oculta Tambien para evitar esto se pueden reducir la cantidad de figuras en el entrenamiento escogiendo las mas significativas as ya no habrii mayoria Se comprobo una vez mas que una de las mejores aplicaciones que tienen las redes neuronales artificiales es reconocimiento y clasificacion de patrones aprovechando la capacidad de generalizacion de las redes las cualespueden aprender de una serie de modelos originales de diferentes clase para luego ser ~apaces de determinar la clasea la que pertenecen otras entradas distintas de los patrones aprendidos EI metodo presentado podria considerarse como una primera etapa de clasificaci6n de lmagenes que podria complementarse con otros metodos para asegurar una clasificacion mas detaHada y precisa Asi mismo podrian ll1ejorarse los resultados una forma podria ser aumentando el nUmero de patrones presentados a la red en la fase de aprendizaje 0 aumentando el vector caracteristico de cada patron tambien se podrian utilizar otros metodos de Caracterizacion de las imagenes como por ejemplo valores obtenidos mediante la compresion con otra red neuronal u

otros tipos de redes y algoritmos de aprendizaje 0 utilizando otro tipo de procesamiento de la imageI [Jason 96]

BIBLIOGRAFiA

[Buhmann Malik Perona 99] Joachim M Buhmann Jitendra Malik and Pietro Perona Institute of Informatics University of Bonn Germany Department of electrical and computer science university of California Berkeley 94720 Department of Electrical Engineering California Institute Technology Pasadena 91125 [Darpa 88) Darpa Neural Network Study Ed AFCEA Press Washington 1988 [Freeman Skapura 93) James A Freeman David M Skapura Redes Neuronales-algoritmos Aplicaciones y Tecnicas de Propagacion Addison-wesleyDiaz de santos 1993 [Gallon Olaya 2001] Camilo Gallon Fabian Alonso Olaya R Herramienta de Simulaci6n para el Reconocimiento y Clasificacion de Imagenes con Redes Neuronales Artificiales (UV-SRNA-RCI)Tesis de Pregrado Universidad del Valle Pregrado en Irtgenieria Electronica Santiago de Cali 2001 [Gonzalez 96] Rafael C Gonzalez Richard E Wods Tratamiento Digital de Imagenes Addison - Wesley I Diaz de Santos 1996 [Jason White Chase Luo Sutton 96) Jason A Janet

Mark W White Troy A Chase Ren C Luo John C Sutton 96 (1996) Center for Robotics and Intelligent Machines Departritent of Electrical and Computer Engineering North Carolinamiddot State IEEE International Conference on Robotics and Automation Minneapolis Minnesota April (1996) pag 3598-3604 Addison wesleyiberoarilericana rama 1995 (Vapnik 95] Vapnik V N (1995) The nature ofstatistical learning theory (Springer NY) [Reiher SaidLiSuen 99) Eric Reiher Fady Said Ying Li and Ching Suen Centre de recherche informatique de Montreal 1801 McGill College Avenue Suite 800

Montreal Quebec Canada H3A 2N4 Centre for Pattern Recognition and Machine Intelligence 1550 de Maisonneuve Blvd West Suite GMi06 Montreal Quebec Canada H3G 1M8 Commission III Theory and Algorithms KEY WORDS GIS Cartography Vision Neural Networks Pattern Recognition 1999

Ing FABIANA OLA YARAM1REZ lng CAMILO GALLON Ca~ona

Ingeniero Electr6nico graduado de lngeniero Electr6nico graduado la Unive~sidad del Valle 2001 de la U~iversidad del Valle200 Profesor dellnstituto tecnico rng De Servicios DATECSA PROYECT A e Ing de Campo Cali Colombia OMNICON Cali Colombia camillonlaciudadcom ffaortutopiacom

UNA APROXIMACION A LOS INSTRUMENTOS VIRTUALES PARA EL CONTROL CONREDES NEURONALES Y LOGICA DIFUSA

Ing Jaiber Evelio Cardona (jaibercyubartaunivalleeduco) PhD Eduardo Caicedo (ecaicedoeieeunivalleeduco) MSc Eduardo Owen (ejoweneieelInivalleeduco)

Grupo de Percepcion y Sistemas Inteligentes Escuela de Ingenieria Electrica y Electronica

Universidad del Valle psieieeunivalleeduco

Resumen En el presente articulo se muestra una clase de ~ Backpropagalion E3 instrumentos virtuales diseiiados por el grupo para implementar estrategias difusas y neuron ales y se realiza una aplicacion practica para el control de una planta de presion del Laboratorio de Automatica se comparan los resultados obtenidos ante un control PI clasico un control PI difuso y un control neuronal por modelo inverso especializado de la planta

Palabras clave Redes neuronales sistemas difusos control inteligente Instrumentacion virtual

1 INTRODUC CI6N

Con la adicion de caractcristicas especiales como capacidad de computo y simplificacion de tareas para el operario se incremento el costa de la instrumentacion se penso entonces en mejorar el desempefio sin adicionar gastosUna de las soluciones planteadas fueron los instrumentos virtuales [GOLDBERG 00] incorporando el hardware y el software necesario para que computadoras de propos ito general pudieran realizar eI trabajo dejando a elIas el intercambio de informacion entre el usuario y el sistema

Uno de los programas que permite realizar aplicaciones en instrumentacion virtual es elLabView bajo este software se estan desarrollando en la Universidad del Valle modulos de proposito general llamados instrumentos virtuales en Lab View (VI) para la implementacion de estrategias difusas Figura No 1

y neuronales que permitan realizar aplicaciones de tipo industrial y de laboratorio Los instrumentos virtuales mas importantes se En este articulo se muestran algunos avances en este mencionan a continuacion propos ito aplicando los VI desarrollados al control de una planta de presion bull Inicializa back inicializa Kohonen (Fig No 2)

2 INSTRUMENTOSVlRTUALES DESAR ROLLADOS Permiten asignar a los pesos de la red valores aleatorios entre cero y uno

Para la implementacion de las estrategias inteligentes basadas en logica difusa y redes neuronales backpropagation bull Procesa entrada procesa Kohonen (Fig No 3) y Kohonen se han desarrollado instrumentos virtuales agrupados en submenus dentro del Labview dichos Se entrega un vector de entrada a la red y se calcula la submenus pueden ser incluidos en la paleta de funciones salida Para una red Backpropagation la salida es un estandar La presentacion de los submenus se puede observar vector de valores para una red Kohonen la salida son en la figura No I los pesos de la neurona ganadora y su posicion Bajo los submenus backpropagation y Kohonen se agruparon diferentes funciones que permiten realizar las bull Aprende hasta error (Fig No 4) operaciones basicas para la manipulacion de dichos tipos de redes neuronales artificiales Permite aprender un conjunto de patrones en una red

Backpropagation hasta alcanzar un error determinado

98

bull Aprende patrones en un numero de iteraciones (Fig No 5)

Red tmtrada~Redfinal

inicializa backpropagalion yi

Toma los parametros de la red de entrada y saca una red simaar con numeros aleatorios en sus pesos

Procesa Kohonen

Determina la neurona ganadora de 101 red y da los pesos y 101 ubicaci6n de esta EI primer componente de la ubicaci6n indica 101 columna y la segunda la fila donde esta 101 neurona if m

Figura No 3

Figura No 4

99

iiB Help BIiJE3 Roefe----

Rocero---1 pesos (lilt)) ==I~P Patrones Jrmiddot--middoti

Lmaximo Alfa cero __---I

Alfa efe

Figura No 5

Realiza el aprendizaje de patrones para una red Kohonen en un n1imero de iteraciones determinado

bull Grabar y cargar redes y patrones

Ambos tipos de red tienen modulos para grabar y cargar las redes que se hayan trabajado anteriormente o patrones que esten digitados Para todos los casos se trabajan archivos tipo texto

Bajo el submenu de logica difusa se encuentran funciones para realizar operaciones difusas necesarias para implementar un sistema difuso sus principales instrumentos virtuales son los siguientes

bull Operaciones y 0 y no (figura No 6) Permiten realizar lasoperaciones 16gicas difusas

Figura No 6

bull Difusi6n (Fig No 7)

Tomando los con juntos difusos por medio de vectores calcula el valormiddot de salida realizando el paso de difusion

lmil_~liJi~IJ ~

Coniuntos bOllosos ==~ ~bull bull 1 -Salida(I Valor de entrada -----lt] gt~

Difusionmiddotitli

Figura No 7

bull Inferencia y concrecion (Fig No 8)

Tomando losvalores de pertenencia y las reglas de inferencia se realizan los 6aIculos del valor de salida

DrMil_~rolx itt(f~1h~-

Figura No 8

3 PLATAFORMA DE EXPERlMENTACION

31 Descripcion de laplanta Se desea controlar la presion del aire en un tanque cambiando 1a apertura de una valvula El esquema se muestra en la figura

No9

Flujo de entrada

Figura No9

La planta posee una entrada de flujo constante que alimenta el sistema 1a valvula es normalmentecerrada con una apertura entre 0 y 100 logrando una presionenel tanque

entre 2 y 9 psi

32 Estrategia de control neuronal

Se utilizo la estrategia del modelo inverso especializado de la planta [CASTRO 01] para ello se configuro una red Backpropagation con 3 neuronas de entradas y una neurona de salida ambas con Ia funci6n identidad y 3 neuronas en la eapa oculta con funcion de activacion sigmoidal

Debe existir una fase previa de entrenamiento para 10 que se apticaron varios escalones aleatorios a la entrada del sistema registrarido la salida a un tiempo de muestreo fijo Ia respuesta de la planta ante diversos escalones aleatorios con un tiempo de muestreo de lOOms se muestra en la figura

NolO

Se entreno la red neuronal utilizando como patrones de entrada los val ores de presion presente presion con un retraso y presion con dos retrasos y como patrones de salida la apertura de la valvula con un retraso EI esquema se muestra en la figura NoII

Una vez la red aprende los patrones hasta un error pequeno dicha red se puede utilizar como controlador [HUNT 92] por el esquema mostrado en Ia figura N12

100

Figura No1 O

RNA e

Figura No1 1

Ref

~~ lJ(n) RNA _~LANTAIY(n)

Figura No1 2

33 Estrategia de control difilsO

Se aplico una estrategia difusa PI Mandani [MANDAN I 74] Los conjuntos difusos definidos para el error el cambio del error y 1a salida ~c muestran en la figura No13

E=r

Figura No 13

Se utilizaron 5 reg las que se enuncian por medio de una tabla su definicion se muestra en 1a figura No14

CAMBD DE ERROR negatito ce 10 postilo

ERROR neg a tiro

cero

postilo

Figura No 14

Se utilizo e1 metodo del centro de area para la desfuzzificacion

4 Resultados obtenidos Junto con el controlador difuso y el neuronal se implemento un control PI sintonizado con las reg las de Ziegler Nichols para comparar los resultados

Al aplicar un escalon a la entrada los tres controladores llevaron a la planta a estado estable en un tiempo similar el control por red neuronal no presento sobreimpulso mientras los otros dos si La respuesta se puede ver en la figura No 15

EI esfuerzo de control como respuesta ante el mismo escalon se muestra en la figura No 16 se puede ver que el mayor esfuerzo 10 realiza la red neuronal mientras que los otros dos tienen un cambio mas suave

101

Figura No15

Ante un disturbio las estrategias PI difusa y clasica son capaces de llevar la planta a la referencia deseada mientras que la red neuronal no Las respuestas ante un disturbio se pueden ver en la figura No 17

Figura No16

5 CONCLUSIONES

Se comprobo en forma pnictica uno de los posibles usos de los instrumentos virtu ales desarrollados en LabView y se dejan sentadas las bases para desarrollos posteriores en este senti do

En este trabajo se utilizo el modelo inverso especializado con redes neuronales y el PI difuso para el control de una planta de presion EI resultado obtenido es aceptable al ser comparado con un PI clasico dichas estrategias nos brindan entonces una opcion valida diferente para el control Se pudo ver como un control PI difuso puede responder de manera similar a Ull control PI sin embargo llevarlo a un punto de trabajo bueno requiere

de umi afinacion empirica basada en el conocimiento de la pblnta

Figura No17middot

Al aplicar la estrategia de control por modelo inverso especializado se vio que la respuesta al escalon fue buena sin embargo esto depende del nfunero y calidad de patrones con quese entrene ademas de requerir un nuevo aprendizaje ante cambios severos en las condiciones de trabajo de la planta Esto se puede evidenciar ante la respuesta al disturbio al cambiar las condiciones de la planta el controlador neuronal no pudo llevar el sistema al punto de referencia deseado mientras que los olros dos controladores si 10 10graron

REFERENCIAS

[CASTRO 01] CastroT Orlando Giraldo H Norma Implemtacion de un sistema de control utilizando redes neuronales artificiales por modelo inverso especializado de la planta Colombia Cali Universidad del Valle Tesis de pregrado 2001

[EBERHART 90] Russell C Eberhart Roy W Dobbins Neural Network PC Tools A practical guide 1990

[GOLD BERT 001 GOLBERT Harold What is Virtual Instrumentation IEEE Instrumentation amp Measurement Magazine Diciembre 2000

[HUNT 92] HUNT K J SBARBARO D ZBIKOWSKI R GAWTHROP P J Neural Networks for Control System - A survey Automatica Vol 28 No6

[MANDANI 74] MANDANI EH Applications of Fuzzy algorithms for control ofsymple dynamic plant Proc IEEE 121 (12) 1585 - 15880974)

102

EXTRACCION DE CARACTERiSTICAS RELEVANTES Y RECONOCIMIENTO DE SEN-ALES EMG MEDIANTE UNA RED NEURONAL TIPO PERCEPTRON

MULTICAPA

Victor Grisales (vhgrisalesateneaudistritaleduco) Carlos Sanchez (CarlosAndresieeeorg) Fernando Rosas (FernandoRosasieeeorg) Vladimir Barrero (vbarreroieeeorg) Juan Leon (ipleonieeeorg)

GIDIC - Grupo de Investigacion y Desarrollo en Instrumentacion y Control Universidad Distrital FJDC - Facultad de Ingenieria - Departamento de EIectronica

Bogota - Colombia 200 I

Resumen Este articulo presenta la metodologia para el entrenamiento y valida cion de redes neuronales tipo perceptron multicapa (MLP) mediante un caso de estudio de reconocimiento

de seiiales mioelectricas (EMG) del brazo de un paciente sanD de 3 aiios mediante la utilizaci6n del algoritmo de BackshyPropagation (BP) Se utilizan bases de datos que presentan la relacionexistente entre el espectro de potencia de una senal mioelectrica (a traves de la FFT) y el desarrollo deseado por el paciente sobre las cuilles se aplican (ecnicas de ingenierfa neural para la depuracion de datos Se realiza entrenamiento verificacion y validacion de la redAdemas para la operacion en Ciempo real se propone el desarrollo de una interfaz electronica sobre un procesador digital de senales (ADSP-21061

Palabras claves PrOtesis de miembro superior Senal electromiografica Red Neuronal Artificial Analisis de correlacion Ingenieria neural

1 INTRODUCCION Por muchos anos ha existido la meta en bioingenieria de disenar una protesis controlada a partir de las senales

mioelec-tdcas del brazo para poder ser usada en los pacientes amputados Eneste articulo se presenta la metodologia para la apropiada discriminaci6n de la senal mioelectrica la cual simplemente representa el deseo del paciente para ejecutar cualquier clase de movimiento Apoyados en diferentes investigaciones al respecto [12] tenemos la hipotesis de que la informacion debe ser extraida a

traves deelectrodos de superficie en 4 puntos especiales del brazo

I

Se trata en primera instaneia la adquisicion de las senales mioelectricas junto con la seleccion de caracteristicas relevantes de los movimientos la creacion de bases de datos para el entrenamiento verificacion y validacion de la red

n~uronal y la determinacion del nfunero optimo de neurodos ocultos de la red para efectos de reconocimiento [3] Se realizan diversas pruebas de software considerando el porcentaje de acierto de la red y se realiza un analisis de relevancia con miras a una reduccion de la dimension del vector de entrada

2 PROCEDIMIENTO La red neuronal es utilizada en este sistema para aprender la relacion entre el espectro de potencia de la senal EMG y la

1 Miembro de 1a poderosa familia SHARCreg de procesadores de pUnto flotante de 32 bits)l

actuacion deseada por las personas incapacitadas La red puede diferenciar 7 movimientos de las diferentes seiiales EMG Este sistema esta compuesto por dos partes adquisicion y discriminacion de las senales

21 Parte de adquisici6n La parte de adquisicion consta de electrodos preamplificados de la empresa Delsys los cuales estan disenados con una ganancia de 1000vv y con un fiItro pasabanda de 20-450 Hz Ellos usan la geometria de contacto de barra paralela para asegurar la estabilidad de la senal y la repeticion fiel entre las grabaciones Debe evitarse un contacto pobre entre los electrodos y la piel ademas que se debe buscar la forma de sujetarlos fuertemente Debido a que una posicion inadecuada genera una senal diferente se busca conservar siempre la misma posicion de los electrodos Se trabaj6 con la seccion proximal del brazo y los electrodos se manejaron en forma de anillo utilizando cuatro electrodos uno frente at otro (ver Fig 1) Yun electrodo adicional como referencia

Flenie Fspalila

Localliacion de los electrodos Fig I Descripcion de la localizacion de los electrodos en el brazo del

paciente sano

Dadas las estrategias de entrenamiento de la red se debe definir la forma como estaran compuestas las bases de datos de acuerdo a las diferentes combinaciones en la posicion de los electrodos

De tal forma que si los electrodos se miden con respecto a un punto comtm de referencia se obtienen cuatro mediciones

103

(Oa) Al igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con referencia COlttUltrshy

(

~JP- I ~~_O~[f

(a)

Medicion de voltaje diferencial

fjmiddot ~~Jjl

or- t~Rfr~~~

(b) Fig 2 Localizacion de los electrodos

22 Parte de discriminacion Las seiiales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extension de la muneca pronacion supinacion apertura y

cierre de la mano

~E1E-l o m lID all mo 1000 1210

(b) Flexion de h mlliieca

0112 1 I o 21D lID EIlO mo lIDO 1210

(c) Reposo

Fig 3 Senales e1ectromiograficas

La senal mioelectrica es no periodica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amllisis de Fourier (algoritmo FFT) El espectro de potencia de la senal EMG (ver O)representa una distribucion continua como funcion de su frecuencia

Para la creacion de las bases de datos de trabajo se tomaron como entradas de Ia red neuronal numerosos ejempIos de movimientos incluyendo el reposo a partir de Ia segmentacion de la senal EMG en ventanas de tiempo de aproximadamente 64 ms (l024 muestras a una frecuencia de muestreo de 16 Khz)

)l ~ 1 D 11]] 20J 3D lID SIl all

(a) Apertura de Mano

l j D 11]] 21ll 3D lID SIl all

(II) Flexionde hmlliieca ror---------~--~~---T-----r----

III

3J

2l

10 Dl I D IIll 21ll 3JD IDD roD 6DII

(e) Reposo

Fig4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciaIes junto con las respectivas salidas que confonnan el vector objetivo de clasificacion (Target2

) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen el mismo numero de muestras porque estadisticamente ellos no tienen Ia misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla I)

TABLAl DISTRIBUCI6N DE LOS MOVIJvtIENTOS

J 1 REPOSO 60

Jz APERTURA DE MANO 75

J3 CIERRE DE MANO 75

J4 FLEXI6N DE LA MuNECA 625

J6 EXTENSION DE LA MuNECA 625

J 6 PRONACI6N 625

J SUPINACI6N 625

EI conjunto utilizado de caracteristicas parte de que e~ estos valores esta contenida esenciahnente Ia infonnacion para efectos de clasificaci6n de Ia senal EMG

Sin embargo resulta conveniente una comprobacion yo reduccion del espacio de caracteristicas mediante el analisis

de correlacion segim se explica a continuacion EI analisis de correlacion pennite detenninar Ia dependencia lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor masbajo ell orden de

2 donde las columnas almacenan valores 09 001 para indicar la pertenencia

o no pertenencia a la c1ase de movimiento que c0fesponda

104

irnportanciaEl analisis de correlacion de caiacteristicasparte del calculo de la correlacion y del coefici~nte decorrelaci6n asi 5i se considera un vector caracteristico de entradas X =

Xh xN con Ncaracteristicas la correlacionentre las caracteristicasi-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esta dada en (l)

cCor(Xx)=(IIQ) poundE(X~q)~p)(x(q)_p)(I)Y I J q=l I I J J

donde

E es el operador de valor esperado Xj(qj es el valor de la i-esima caracteristica del vector caracteristico X XV es el valor de la j-esima caracteristica del vector caracteristico X 1 es el valor esperado de la i-esima caracteristica sobre la poblacion de muestra de tamano Q flj es el valor esperado de la j-esima caracteristica sobre la poblacion de muestra de tamano Q

El coeficiente de correlacion estandarizado adimensional esta dado por (2)

~--

Pij =Cij ~(CiiCff) (2)

Esta ecuacion satisface la desigualdad de Cauchy-Sch-vartz quedando acotado el rango para Pij entre los valores-l y I

1 ~ ~j ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pij estara mas cercade cero (Cij 0) Para efectos de reducci6n del numero de entradas a la red neuronal se considera que dos caracteristicas esUin altamente correlacionadas en el caso en el que IPij gt 0707 Para el caso de reconocimiento de senalesEMG se ha considerado que la infonnacion relevante esta contenida en 50 componentes para efectos de reconocimiento de los diferentes movimientos La Tabla II muestra parte de la matriz de correlacion (12 primeras componentes) calculada para la base de datos

I 2 3 4 5 6 7 8 9 10 11 12

y TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACI6N 2 3 4 5 6 7 8 9 10 II 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de nvisar lamatm decoeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pijl lt 0707 por locualse puede decir que noestan altamente correlacionados y en consecuencia puede concluirse que las caracteristicas pueden ser consideradas independientes La parte de discriminacion esta confonnada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizacion del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripcion de cuantas capas tiene el nfunero de neuronas en cada capa la funcion de transferencia de cada capa y como se interconectan elIas entre sL La topologia de la red MLP tiene diferentes capas (ver 0) la capa de entrada (N) unacapa oculta (M) y una capa de salida (J) La capa de salida tiene tantas neuronas como el ntimero de movimientos a desarrollar

El proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validacion y (iii) verificaci6n Las tres (3) bases de datos fueron creadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

105

Vecrorde Entradas

Capade Entrada

Capa Oculta

Capade Salida

Fig 5 Arquiteclura de la red neuronal

TABLA III

11

DISTRIBUCI6N DE DATOS PARA EL APRENDlZAJE DEL MODELO MLP

Movimiento Ejemp Entr Verif ValL REposo 6000 3600 1500 900 APERTURADE 750 450 188 112 MANO CIERREDE MANO 750 450 188 112 FLEXI6NDE 625 375 156 94 MuNECA EXTENSI6N DE 625 375 156 94 MUNECA PRONACI6N 625 375 156 94 SUPINACI6N 625 375 156 94 TOTAL 10000 6000 2500 1500

(Oa) AI igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con Medicion de voltaje referenda COJltUlt clifureJlCial

r-shy

( r ___nlll ( ~____J1 ~ ~r t laquo -1 ~v- fL-Rtr

~_~__ _~_1)7II[f e-~---

(b) Fig 2 Localizaci6n de los electrodos (a)

22 Parte de discriminaci6n Las senales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extensi6n de la mufieca pronaci6n supinacion apertura y

cierre de la mano

~I2E~1a l]] ltOD 6D Em llJJJ Ilm

(a) Apertura de lobno

~~lo 2Il lID EIJl roo HIll =

(b) Flexion de ]a muiieca

oa r--~-----------------

nm l o 211l lID amp10 roo 111l[]

1210

(t) Reposo

Fig 3 Senales electromiograticas

La senal mioeIectrica es no peri6dica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amiHsis de Fourier (algoritmo FFT) El espec1ro de potencia de la senal EMG (vcr O)representa una distribucion continua como funci6n de su frecuencia

Para la creation de las bases de datos de trabajo se tomaron como entradas de la red neuronal numerosos ejemplos de movimientos incluyendo el reposoa partir de la segmentacion de la senal EMG en ventanas de tiempo de aproximadantente 64 ms (1024 muestras a una frecuencia de muestreo de 16 Khz)

~[ j [] VII 2Il m lID EIJl EIJl

(a) Apertura de Mana

l 1 [] VII 211l m lID EIJl EIJl

Ill 40

31

ill

ID []L

D

(b) Flexion de ]a muiieca

IIIl 211l 310 40D IlO Il[]

(c) Reposa

Fig 4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciales junto con las respectivas salidas que conforman el vector objetivo de clasificaci6n (TargeP) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen elmismo numero de muestras porque estadisticamente ell os no tienen la misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla nmiddot

TABLA I DlSTRIBUCION DE LOS MOVlMIENTOS

60REPOSOJ1 75APERTURA DE MANOJz

75CIERRE DE MANOJ3 625FLEXION DE LA MuNECAJ4 625EXTENSION DE LA MuNECAJ6

625PRONACIONJ 6

625SUPINACIONJ

El conjunto utilizado de caracterlsticas parte de que en estos valores esta contenida esencialmente la informaci6n para efectos de c1asificaci6n de la senal EMG

Sin embargo resulta conveniente una comprobacion yo reducci6n del espacio de caracteristicas medianteel analisis de correlacion segun se explica a continuaci6n EI analisis de correlaci6n permite determinar la dependencia

lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor mas bajo ell orden de

2 donde las columnas almacenan valores 09 6 01 pam indicar la pertenenci3

o no pertenencia a la c1ase de movimiento que co~esponda

104

inlportandaEl analisis de correlacion de caracteristicas parte del calculo de la correlacion y del coeficiente decorrelaci6n asi Si se considera un vector caracteristico de entfadas X = XhXN con Ncaracteristicas la correlaci6nentre las caracteristicas i-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esrn dada en (1)

Qc=Cor(XX)(lQ) L E(X~q)-Il)(x(q)_Ilmiddot)(I)

I I J q=l I I J J

donde

E es el operador de valor esperado Xi(q) es el valor de la i-esima caracterlstica del vector caracteristico X Xr) es el valor de la j-esima caracteristica del vector caraderlstico X ~i es el valor esperado de la i-esimacaracteristica sobre la poblacion de muestra de tamafio Q ~j es el valor esperado de la j-esima caracteristica sobre la poblaci6n de muestra de tamano Q

Elcoeficiente decorrelaci6n estandarizado adiinensional esta dado por (2)

Pij = Cij I ~r-(C-iiC-iJ-) (2)

Esta ecuacion satisface la desigmildadde Cauchy-Sch~artz quedando acotado el rango para Pj entre los valores-I y I

-1 ~ Pij ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pj estara mas cerca de cero (Cij 0) Para efectos de reduccion del nfunero de entradas a la red neuronal se considera que dos caracteristicas estan altamente correlacionadas en el caso en el que Pij gt 0707 Para el caso de reconocimiento de senales EMG se ha considerado que la informaci6n relevante esta contenida en 50 componentes para efectos de reconocimiento delos diferentes movimientos La Tabla II muestra parte de la matriz de correlaci6n (12 primeras componentes) calculada para la base de datos

1 2 3 4 5 6 7 8 9 10 11 12

TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACION 2 3 4 5 6 7 8 9 10 11 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de revisar lamatrizde coeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pij lt 0707por 10cual se puede decir que no estan altamente correlacionados y en consecuencia puede concluirsemiddot que las caracterlsticas pueden ser consideradas independientes La parte de discriminacion esta conformada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizaci6n del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripci6n de cmintas capas tiene el numero de neuronas en cada capa la funcion de transferencia decada capa y c6mo se interconectan ellas entre sf La topologia dela red MLP tiene diferentes capas (ver 0) la capade entrada (N) una capa oculta (M) y una capa de salida (1) La capa de salida tiene tantas neuronas como el nfunero de movimientos a desarrollar

EI proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validaci6n y (iii) verificaci6n Las tres (3)bases de datos fueroncreadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

Vector de En1rtdas

Capade Capa Entrada Oculta

Fig 5 Arquitectum de la red neuronal

TABLA III DISTRIBUCION DE DATOS PARA EL APRENDIZAJE DEL MODELO

MLP

I I I

Movimiento Ejemp Entr Verlf ValL REposo 6000 3600 1500 900 APERTURADE MANO

750 450 188 1I2 I

CIERREDE MANO 750 450 188 1I2 FLEXION DE MuNECA

625 375 156 94

i EXTENSION DE MuNECA

625 375 156 94

PRONACION 625 375 156 94 SUPINACION

TOTAL 625 10000

375 6000

156 2500

94 1500 I

105

II

Las pruebas de entrenamiento y validacion se hicierona partir de las bases de datos de trabajo normalizadas ejecutando el programa de entrenamiento de MLP con base en el algoritmo BP

Se realizaron 5 pru~pas para diferentes valores del numero de neurodos de la capa oculta (M) tOl unmiddotminimo de iteraciones de 1000 variando el valor de Mdesde 30 hasta 100 en pasos de 5 A medida que se ejecuta 61 algoritmo de entrenamiento se va evaluando el error de vaHdpoundcion quedando registrada la iteracion para la que se obtiene ~I minimo valor asi como los correspondientes valores de la red El algoritmo se ejecuta

shyhasta que se alcance el numero de iteraciones especificado 0

se logre reducir el error t9tal po debajo del ~nimo preestablecido (0005)

Los valores de los errores mlmmos de entrenamiento y validacion son fundamentalesmiddot cQmo medida para deterrninar el grado de aprendizaje de lalt red y permiten deterrninar el punto a partir del cualla red empieza a memorizar mas que a aprender Se hace tambien necesario prQ9~r la red luego de haber sido entrenada para esto se hace USa de la base de datos de verificacion la cual se pasa a traves de la red neuronal para determinar el porcentaje de aciertos en el reconocimiento de los movimientos dando lugar a la llamada matriz de confusion3

bull

Con base en estos criterios se determinaron las matrices de confusion tanto para entrenamiento como para verificaci6n en cada una de las pruebas realizadas y se concluye que el numero optimo de neurodos para la capa intermedia M en nuestro caso es de 75

3 CONCLUSIONES El amllisis de correlacion de caracteristicas debe hacerse antes de entrenar la red para saber si hay dependencia entre las componentes frtcuenciales

Los valores de los errores mmlmos de entrenamiento y validacion son fundamentales como medida para determinar el grado de aprendizaje de la red especialmente en el punto a partir del cual puede considerarse que la red empieza a memorizar mas que a aprender

Al realizar varias iteraciones se puede escoger el vector de pesos mas adecuado superando el problema de los minimos locales propio del algoritmo de entrenarniento de BP

4 TRABAJO FUTURO Para la openicion en tiempo real [4] se propone que este procedimiento se implemente sobre un procesador digital de senales (ADSP-21061) el cual operara sobre el conjunto de pesos obtenidos gracias a la red y de esta forma poder desarrollar una interfaz electronica que reciba identifique y procese las senales mioelectricas del brazo y ademas que

3 se forma comparando las salidas reales de la red con las salidas deseadas para todos y cada uno de los ejemplos de la base de verificaci6n

controle los movimientos hasicos que se asemejen a los naturales perrnitiendo a su vez ser adaptada al interior de una protesis e1ectromecanica de mano demostrando la efectividad del sistema para pacientes amputados a la altura del tercio proximal (antebrazo) con criterios de viabilidad economica y optimo uso energetico para su funcionamiento EI prototipo planteado presenta la arquitectura de la O

Seihlde los eledloclos

Catr~l5or

~ Digital

I I

Fig 6 Diagrama esquematico de una interfaz para una protesis mioeleclrica

REFERENCIAS [1] Kaduhiko Nishikwa Katsutoshi Kuribayashi Neural

Network Application to a discrimination system for controlled prostheses IEEEIRSJ International Workshop on Intelligent Robots and Systems nov 1991

[2] Adrian del Boca Dong C Park Myoelectric signal recognition using fuzzy clustering and artificial neural networks in real time IEEE Transactions on Biomedical Engineering jun 1990middot

[3] Looney Carl G Pattern recognition using neural networks Theory and algorithms for engineers and scientists Oxford University Press 1997

[4] Embrec Paul C++ Algorithms for Real Time DSP Prentice Hall 1999

[5] Alan V Oppenheim et al j Discrete Time Signal Processing Prentice Hall 1999

AUTORES Ingeniero Victor Hugo Grisales Opta por el master en e1ectrica en la Universidad de los Andes Profesor de tietnpo completo en la Universidad Distrital Director del grupo I+D en instrumentacion y control

Carlos Sanchez Fernando Rosas Vladimir Barrero Juan Leon Estudiantes de ultimo semestre de Ingenieria Electronica en la universidad Distrital FIDC Miembros

Estudiantiles del IEEE

106

ANALISIS ACUSTICO EN LA CLASIFICACION DE SENALES DE VOZ EMPLEANDO RNA

German Castellanos (gcastel1ieeeorg) Francisco Vargas (pcinevadomanizalesunaleduco) Grupo de Control y Procesamiento Digital de Senales - Universidad Nacional de Colombia - Sede Manizales

Resumen Se presenta un sistema de clasificaci6n desefiales de voz basado en sus caracteristicas acusticas el cual se ha dividido en tres partes obtencilm del ensamble inicial de caracterizaci6n acustica de la voz basandose en tecnicas de proceso digital de senales en tlempo real reduccion hasta elmenor ensamble de parametros representativos y suficientemente discriminantes de las clases basandose en tecnlcas estadisticas y por ultimo la construction de las reglas de decisi6n para clasificacion de senales de voz que pueden ser basadas en el empleo de redes neuronales EI sistema rue probado en la clasificaci6n devoz de acuerdo al sexo y edad de los hablanies y como resultado se determinan sus caracteristicas acusticas mayormente influyentesmiddot Ademas esta orieiltado a la tipificacion de norinalidad 0 alteraci6n de las direrentes clases de voz Para el presente trabajo rueronmiddot evaluadas las redes multi-capa y los mapas auto-organizatlvos de Kohonen

L INTRODUCCI6N

En la evaluacion de la voz la metodologia perceptual caracterizada por Ia calificacion de las cualidades vocales segUn el juicio experto de un sujeto necesita habilidades refinadas de escucha EI empleo de tecnologias digitales permite evaluar de manera objetiva la acustica y fisiologia del fenomeno Durante el proceso de evaluacion objetiva de voz normal 0 alteradaes necesario determinar sus caracteristicas cualitativas como es el caso del couelato acustico timbre aspero la emision con quiebres el ataque vocal duro (fmal de frase abortado) voz hiponasalizada y ruido acoplado para lograr muestras que sean altamente fieles alemisor El empleo de sistemas computarizados de anaIisis acustico de voz provee la posibilidad de percibir elementos dificiles de registrar mediante la observacion sUbjetiva convencional

EI uso de caracteristicas acusticas (CA) en la descripcion de normalidad 0 alteracion de voz ha sido probado en VallOS

contextos y con diferentes objetivos por cuanto perrniten ponderar cualitativamente las propiedades de la voz dificilmente realizable por otros metodos [123] Aunque se han Ilevado a cabo estudios de correlacion de estas caracteristicas con la metodologia perceptual sus resultados ademas de ser ambiguos a veces pueden ser contradictorios en el analisis de tipicidad (normalidad) 0 diferentes alteraciones de las senalesmiddot de voz De tal manera que la seleccion

-apropiada de la medida de las CA y su interpretacion sigue siendo un problema sin solucion

parametros representativos de cada clase se realiza el preproceso de los CA sobre los cuales se construye el ensamble inicial de caracterizacion acustica de voz La Seleccion del ensamble efectivo se realiza mejorando la efectividad de empleo de cada uno de los CA para 10 cual se analizan los criterios discriminatorios de correlacion e informacion mutua Finalmente la reduccion de la dimensionalidad de ensamble se realiza por el metoda de las componentes principales Una vez extraidos los parametros necesarios para la caracterizacion de la voz se resuelve la clasificacion de la voz en el tipo normal y no normal (con alteraciones )

MtltJ~ llbIUtl IHlttmllJgt

Fig 1 Diagrama de bloques reconocimiento de palrones de senales de voz

EI reconocimiento de patrones de senales de voz se puede dividir en dos procesosmiddot fundamentales como se aprecia en la figura Imiddot el entrenamiento que comprende la extraccion y seleccion del con junto de caracteristicas acusticas (id iE(I Ni) que representan cada clase de voz kE(lK) y la toma de decisiones que realiza la clasificacion por algun principio discriminante

EI tipo de reconocimiento empleado en el presente trabajo es una derivacionmiddot de lamiddot metodologia propuesta en [22] compuesta de dospartes hasicas a) Extraccion y Seleccion del ensamble efectivo de CA por clase b) el ensamble efectivo de CA es tornado como entrada de una RN usada en calidad de clasificador que en el caso particular fue del tipo backpropagation Asi fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen

2 ENSAMBLE DE CARACTERIZACI6N INICIAL ACUSTICA DE VOZ

La caracterizacion de la voz requiere de un elevado nUmero Elanalisis acustico de un sonido articulado consiste en de valores de CA En el articulo se presentan algoritmos de determinar los indicadoresfisicos de las vibraciones que 10 estimacion en tiempo real para los principales CA que en constituyen tales como la frecuencia la intensidad la general son muy sensibles a las condiciones acusticas de composicion espectral las variaciones del sonido modificadas tnedida [4] Para aumentar la efectividad en el uso de los por la resonancia que actuan originando el producto sonoro

107

que permite predecir la proXima muestra como una percibido [56] La seleccion de parametros que caracterizan

combinacion lineal de las anteriores [10] la voz es tal vez la etapa mas importanteen el desarrollo de sistemas automatizados de su proceso Uno de los principales y(n)=-taky(n-k) (2)problemas en el analisis de las CA de voz consiste en que la mayoria de eUos son sensibles a diferentes condiciones de

k=l

donde q es el orden del predictor y ak son los coeficientes de medicion Este factor conlleva a escoger el ens amble de prediccion lineal (LPC) Los coeficientes ak pueden ser parametros acusticos que brinde la mejor estimacion de determinados a partir del calculo de coeficientes demiddot irregularidad y perturbacion para la clasificacion y autocorrelacion De esta manera se tendcln q coeficientes de reconocimiento de senales de voz En general toda CA de prediccion lineal por cada trama de la senal de voz Tambien amilisis debera cumplir con las siguientes propiedades [6] a) es habitual aplicar el calculo de los coeficientes LPC Debe ser facilmente estimable y 10 menos dependientes de las cepstrales (Ia transformada de Fourier inversa del espectro de perturbaciones ambientales b) Su estimacion debe ser estable amplitud logaritmico) que representan la respuestaen el tiempo y c) No debe ser imitable Las CA pueden ser aproximadamente logaritmica 0 psofometrica del oido agrolJados de acuerdo a las propiedades acusticas que deben humano Los coeficientes LPC cepstrales Ck presentan la medir y los cuales en la practica se asocian en dos categorias ventaja de convertir el ruido convolucional en ruido aditivo y [7] permiten separar la excitacion glotal de los parametros del

tracto vocal Seguidamente se emplea un tipo de ventaneo que a) Parametros cuasiperiodicos Son disenados para la acentue los pesos de los LPC cepstrales con el objeto de captura de varias fonnas de periodicidad de las obtener mayor discriminacion de la envolvente espectral perturbaciones en la senal aclistica Entre los principales

parametros de este gropo estan b) Parametros de perM-bacion Destinados a medir la componente relativa de ruido en la senal de voz Para la

La Frecuencia Fundamental (Fo) que es referida a las estimacion de las perturbaciones de los parametros de la caracteristicas de cuasiperiodicidad de la senal en el tiempo frecuencia fundamental es comun el empleo del promedio Los diferentes metodos de estimacion del calcul0 del Fo relative de perturbacion (RAP Relative Average Perturbation) fueron analizados y comparadosen [S] por tiempo de proceso

definido como [1311] y precision obteniendose que el metodo (AMDF Magnitude Difference Function) [69] es mas veloz cuyo algoritmo esta

dado por iJ n z=(tIZH +z Zi+l -Zi llLRAP 1=1 3 1=1

AM(km)= (3) siendo n es el numero de ciclos consecutivos analizados 1 m

- Lly(n)- y(n-k)w(m-1t) Cuando el panimetro de perturbacion z se refiere al periodo N n=m-N-l) de la frecuencia fundamental se define el Jitter mientras que

en el caso de su amplitud se define el Shimmer [14] EI nivel (1) de perturbaciones tambien puede ser caracterizado por elDonde yen) es la senal digitalizada de voz wen) es la ventana

de proceso con longitud N m es el numero de muestras armonico ruido H 0 energia promedio del ruido de fondo ij(t) empleadas en la estimacion k es el retraso para el cual se esta que se determina como

Tcalculando el AMDF H = 11Jr((r)ciT (4a)

Los formantes En el espectro de una senal de voz se o encuentran regiones de enfasis (Uamadas resonancias) y de donde 1E [01] El componente de ruido N se defme como la deenfasis (antiresonancias) [9] ambas resonancias diferencia de energias de la senal de informacion y del denominadas formantes que siguen patrones comunes en la armonico ruido mayoria de los humanos determinadas basicamente por sus medidas antropometricas [101112] En la practica se nT analizan 5 fonnantes (FI F2 F3 F4 F5) junto con sus N = LJ[yj (1 )-11(1)]2 dT (4b)respectivos anchos de banda (LlWI LlW5Y los cuales se

=1 0 definen como el gropo de frecuencias que hay desde la caida a

donde 1E[O1] Finalmente el armonico ruido se determinposterior y anterior de 3 dB La energia del formante sera el como HNR=HIN Para aplicaciones profesionales la energia

valor del pica y el valor del formante la frecuencia donde se se determina por la diferencia entre la energia de la emision

encuentre el pica anterior [11] La estimacion de los vocal y la energia del ruido ambiente dado por formantes se realizo sobre algoritmos basados en la

suposicion de que la voz puede ser representada por modelos II

P(n) = -1

Ly2 (i) (4c)en fonnadeun numero reducido de indicadores a partir de n 1=1los cuales es posible su reconstruccion adecuada Para esto se S

donde n es el numero de puntos de la senal y(t) OlrD empleantecnicas de prediccion lineal basadas en el a

parametros analizados son la Energia de nlido normalizadmodel ado deltracto vocal mediante un filtro de solo polos (NNE) que ha sido estudiada en varios contextos [71415] Y

108

la excitaciim g16tica a ruido (GNE) estima el ruido en un tren el proceso de medicion influencia de fuertes perturbaciones de pulsos que es tipicamente generado por la oseilacion de los etc En este caso el valor anomalo del arreglo se expresa pliegues de voz [3] mediante el valor critico de la distribucion de Student fp n-2

La cantidad de CA N de representaci6n de voz t es [1717] completado por la primera (parametros delta) y segunda derivada (delta-delta) en el tiempo de los LPC cepstrales [6] y I e- In I[J s Ipn_] (n-I )112I(n-2+(lpnd)lf2 (5) debe realizarse para cada una de los tipos de senales de voz a clasificar Realmente cada CA puede influir de diferente siendo JIll yO respectivamente la media y varianza del manera en la pronunciaci6n de cada palabra En la practica de valor extremo en analisis del arregl0 I p es el nivel de la fonoaudiologia es comllo el empleo de palabras claves 0 significacion A efectos de comparaci6n de las realizaciones maestras En el caso particular se cada muestra fue tomada de losdiferentes parametros acusticos es preferible su basados en la pronunciaci6n de las cinco vocales estandarizacion estadistica Asi

Cabe anotar que el reconocimiento de senales de voz debe (6)~I =(i- mJ)O realizarse en linea por 10 que los algoritmos de proceso deben estar orientados a su desarrollo en tiempo real Los metodos empleados de estimacion de cada caracteristica fundamentalmente empleando metodos de amiJisis en acustica exigen la verificacion de hipotesis de la intervalos de tiempo cortos de los segmentos de voz los homogeneidad la cual se lleva a cabo por el criterio i y en cuales se analizan en [616] casos extremos se emplea el metoda Kolmogorov-Smirnov

[IS] Si laverificacion muestra claramente la invalidez de la hipotesis de gaussividad es importante determinar el tipo de

3 SELECCION DEL ENSAMBLE EFECTNO distribucion de fdp para cada ensambleI y si es posible la forma de su transformacion a la normal La transformacion de

La extraccion de CA se realiz6 acorde a los algoritmos la variable [Jj en sect con distribucion nonnalizada se determina presentados en anteriormente Asi se escogio un conjunto de de la relacion caracteristicas acusticas UiI i= I bullN que representan cada dase de voz k= I $ El sistema automatizado de extraccion ~

de parametros calcula 20 CA para cada una de las cinco ~21C1_ J e_2 dt =Lr M ji(Aji-1 lt Sjlt Aji) voeales (aIlellillollul) pronunciadas en la emision de voz a __ =1 N analizar Como resultado se obtuvo un valor de Nr I 00 para

j

(7)una sola emision de un paciente dado En cuanto a los grupos de clasificaci6n se definieron los siguientes a) Hombre

donde ~gve es el ens amble real de 0 res el nlimero relativo Adulto k=l b) Hombre Nino k=2 c) Mujer Adulta k=3 y d)

de intervalos delhistograma AJi Aji son los valores extremos Mujer Nina y k=4

del intervalo i del histograma del parametro 01 ~ es la frecuencia de ocurrencia en cada intervalo del intervalo i Una

Las estimacion de las CA de voz e es muy sensible a forma empirica alterna de ajuste consiste en la transformacion

faetores tales como las condiciones acusticas de toma de de cada CA 0(1) por diferentes operaciones basicas y

senales (ruido de fondo hardware de registro electronico comunmente empleadas en el tratamiento de voz

tiempo del dia en que se Ie toman las muestras al paciente contenido de las palabras etc) por 10 que la primera tarea a

~(I)=lg((I)plusmna) I01 c(1)=lg(aplusmn (I)(I) resolver en su clasificacion usualmente es el preproceso de

~(I)=1((1)110datos de las realizaciones que esta orientado a aumentar la efectividad en el uso de los parametros representativos de cada clase De otra parte la cantidad de realizaciones 0 Despues de cada transformacion se realiza la prueba i y se

toma aquella operacion que con mayor certeza confirme la ensamble N determina las limitaciones en la eleccion del hipotesis de gaussividad En general para cada []jk se puede metodo de preproeeso en particular se debe evitar el efecto tener una transformacion diferente [23] de valores extremos de ensamble muy pocas realizaciones 0

sobrevaluacion del ensamble [17] Las CA estan construidas La seleccion del ensamble efectivo de los rasgossobreestimaciones por 10 que es importante tener discriminantes constituye el aspecto fundamental en uninformacion sobre la fdp (0 su familia) para la cual se sistema de reconocimiento de patrones Las propiedades que calculan sus momentos Por este motivo el ensamble de deben cumplir las CA para su selecci6n son las siguientes prueba Ne se escogi6 de acuerdo al minima numero de

realizaciones que se deben tener para verificacion de Capacidad discriminante Es decir que separen 10 mashipotesis que para valores dados del nivel de significacion nitidamente posible las clases existentes P 01 Yun error de 10 obteniendose N90 muestras por Confiabilidad Esto es los objetos de una misma clase clase [17] deberan presentar la menor dispersion posible Ausencia de correlacion Es decir evitar en 10 posible la La siguiente etapa en el preproceso de datos esta enla utilizacion de caracteristicas que dependan fuertemente eliminacion de datos anomalos debidos a posibles errores en entre si

109

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 5: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

UNA APROXIMACION A LOS INSTRUMENTOS VIRTUALES PARA EL CONTROL CONREDES NEURONALES Y LOGICA DIFUSA

Ing Jaiber Evelio Cardona (jaibercyubartaunivalleeduco) PhD Eduardo Caicedo (ecaicedoeieeunivalleeduco) MSc Eduardo Owen (ejoweneieelInivalleeduco)

Grupo de Percepcion y Sistemas Inteligentes Escuela de Ingenieria Electrica y Electronica

Universidad del Valle psieieeunivalleeduco

Resumen En el presente articulo se muestra una clase de ~ Backpropagalion E3 instrumentos virtuales diseiiados por el grupo para implementar estrategias difusas y neuron ales y se realiza una aplicacion practica para el control de una planta de presion del Laboratorio de Automatica se comparan los resultados obtenidos ante un control PI clasico un control PI difuso y un control neuronal por modelo inverso especializado de la planta

Palabras clave Redes neuronales sistemas difusos control inteligente Instrumentacion virtual

1 INTRODUC CI6N

Con la adicion de caractcristicas especiales como capacidad de computo y simplificacion de tareas para el operario se incremento el costa de la instrumentacion se penso entonces en mejorar el desempefio sin adicionar gastosUna de las soluciones planteadas fueron los instrumentos virtuales [GOLDBERG 00] incorporando el hardware y el software necesario para que computadoras de propos ito general pudieran realizar eI trabajo dejando a elIas el intercambio de informacion entre el usuario y el sistema

Uno de los programas que permite realizar aplicaciones en instrumentacion virtual es elLabView bajo este software se estan desarrollando en la Universidad del Valle modulos de proposito general llamados instrumentos virtuales en Lab View (VI) para la implementacion de estrategias difusas Figura No 1

y neuronales que permitan realizar aplicaciones de tipo industrial y de laboratorio Los instrumentos virtuales mas importantes se En este articulo se muestran algunos avances en este mencionan a continuacion propos ito aplicando los VI desarrollados al control de una planta de presion bull Inicializa back inicializa Kohonen (Fig No 2)

2 INSTRUMENTOSVlRTUALES DESAR ROLLADOS Permiten asignar a los pesos de la red valores aleatorios entre cero y uno

Para la implementacion de las estrategias inteligentes basadas en logica difusa y redes neuronales backpropagation bull Procesa entrada procesa Kohonen (Fig No 3) y Kohonen se han desarrollado instrumentos virtuales agrupados en submenus dentro del Labview dichos Se entrega un vector de entrada a la red y se calcula la submenus pueden ser incluidos en la paleta de funciones salida Para una red Backpropagation la salida es un estandar La presentacion de los submenus se puede observar vector de valores para una red Kohonen la salida son en la figura No I los pesos de la neurona ganadora y su posicion Bajo los submenus backpropagation y Kohonen se agruparon diferentes funciones que permiten realizar las bull Aprende hasta error (Fig No 4) operaciones basicas para la manipulacion de dichos tipos de redes neuronales artificiales Permite aprender un conjunto de patrones en una red

Backpropagation hasta alcanzar un error determinado

98

bull Aprende patrones en un numero de iteraciones (Fig No 5)

Red tmtrada~Redfinal

inicializa backpropagalion yi

Toma los parametros de la red de entrada y saca una red simaar con numeros aleatorios en sus pesos

Procesa Kohonen

Determina la neurona ganadora de 101 red y da los pesos y 101 ubicaci6n de esta EI primer componente de la ubicaci6n indica 101 columna y la segunda la fila donde esta 101 neurona if m

Figura No 3

Figura No 4

99

iiB Help BIiJE3 Roefe----

Rocero---1 pesos (lilt)) ==I~P Patrones Jrmiddot--middoti

Lmaximo Alfa cero __---I

Alfa efe

Figura No 5

Realiza el aprendizaje de patrones para una red Kohonen en un n1imero de iteraciones determinado

bull Grabar y cargar redes y patrones

Ambos tipos de red tienen modulos para grabar y cargar las redes que se hayan trabajado anteriormente o patrones que esten digitados Para todos los casos se trabajan archivos tipo texto

Bajo el submenu de logica difusa se encuentran funciones para realizar operaciones difusas necesarias para implementar un sistema difuso sus principales instrumentos virtuales son los siguientes

bull Operaciones y 0 y no (figura No 6) Permiten realizar lasoperaciones 16gicas difusas

Figura No 6

bull Difusi6n (Fig No 7)

Tomando los con juntos difusos por medio de vectores calcula el valormiddot de salida realizando el paso de difusion

lmil_~liJi~IJ ~

Coniuntos bOllosos ==~ ~bull bull 1 -Salida(I Valor de entrada -----lt] gt~

Difusionmiddotitli

Figura No 7

bull Inferencia y concrecion (Fig No 8)

Tomando losvalores de pertenencia y las reglas de inferencia se realizan los 6aIculos del valor de salida

DrMil_~rolx itt(f~1h~-

Figura No 8

3 PLATAFORMA DE EXPERlMENTACION

31 Descripcion de laplanta Se desea controlar la presion del aire en un tanque cambiando 1a apertura de una valvula El esquema se muestra en la figura

No9

Flujo de entrada

Figura No9

La planta posee una entrada de flujo constante que alimenta el sistema 1a valvula es normalmentecerrada con una apertura entre 0 y 100 logrando una presionenel tanque

entre 2 y 9 psi

32 Estrategia de control neuronal

Se utilizo la estrategia del modelo inverso especializado de la planta [CASTRO 01] para ello se configuro una red Backpropagation con 3 neuronas de entradas y una neurona de salida ambas con Ia funci6n identidad y 3 neuronas en la eapa oculta con funcion de activacion sigmoidal

Debe existir una fase previa de entrenamiento para 10 que se apticaron varios escalones aleatorios a la entrada del sistema registrarido la salida a un tiempo de muestreo fijo Ia respuesta de la planta ante diversos escalones aleatorios con un tiempo de muestreo de lOOms se muestra en la figura

NolO

Se entreno la red neuronal utilizando como patrones de entrada los val ores de presion presente presion con un retraso y presion con dos retrasos y como patrones de salida la apertura de la valvula con un retraso EI esquema se muestra en la figura NoII

Una vez la red aprende los patrones hasta un error pequeno dicha red se puede utilizar como controlador [HUNT 92] por el esquema mostrado en Ia figura N12

100

Figura No1 O

RNA e

Figura No1 1

Ref

~~ lJ(n) RNA _~LANTAIY(n)

Figura No1 2

33 Estrategia de control difilsO

Se aplico una estrategia difusa PI Mandani [MANDAN I 74] Los conjuntos difusos definidos para el error el cambio del error y 1a salida ~c muestran en la figura No13

E=r

Figura No 13

Se utilizaron 5 reg las que se enuncian por medio de una tabla su definicion se muestra en 1a figura No14

CAMBD DE ERROR negatito ce 10 postilo

ERROR neg a tiro

cero

postilo

Figura No 14

Se utilizo e1 metodo del centro de area para la desfuzzificacion

4 Resultados obtenidos Junto con el controlador difuso y el neuronal se implemento un control PI sintonizado con las reg las de Ziegler Nichols para comparar los resultados

Al aplicar un escalon a la entrada los tres controladores llevaron a la planta a estado estable en un tiempo similar el control por red neuronal no presento sobreimpulso mientras los otros dos si La respuesta se puede ver en la figura No 15

EI esfuerzo de control como respuesta ante el mismo escalon se muestra en la figura No 16 se puede ver que el mayor esfuerzo 10 realiza la red neuronal mientras que los otros dos tienen un cambio mas suave

101

Figura No15

Ante un disturbio las estrategias PI difusa y clasica son capaces de llevar la planta a la referencia deseada mientras que la red neuronal no Las respuestas ante un disturbio se pueden ver en la figura No 17

Figura No16

5 CONCLUSIONES

Se comprobo en forma pnictica uno de los posibles usos de los instrumentos virtu ales desarrollados en LabView y se dejan sentadas las bases para desarrollos posteriores en este senti do

En este trabajo se utilizo el modelo inverso especializado con redes neuronales y el PI difuso para el control de una planta de presion EI resultado obtenido es aceptable al ser comparado con un PI clasico dichas estrategias nos brindan entonces una opcion valida diferente para el control Se pudo ver como un control PI difuso puede responder de manera similar a Ull control PI sin embargo llevarlo a un punto de trabajo bueno requiere

de umi afinacion empirica basada en el conocimiento de la pblnta

Figura No17middot

Al aplicar la estrategia de control por modelo inverso especializado se vio que la respuesta al escalon fue buena sin embargo esto depende del nfunero y calidad de patrones con quese entrene ademas de requerir un nuevo aprendizaje ante cambios severos en las condiciones de trabajo de la planta Esto se puede evidenciar ante la respuesta al disturbio al cambiar las condiciones de la planta el controlador neuronal no pudo llevar el sistema al punto de referencia deseado mientras que los olros dos controladores si 10 10graron

REFERENCIAS

[CASTRO 01] CastroT Orlando Giraldo H Norma Implemtacion de un sistema de control utilizando redes neuronales artificiales por modelo inverso especializado de la planta Colombia Cali Universidad del Valle Tesis de pregrado 2001

[EBERHART 90] Russell C Eberhart Roy W Dobbins Neural Network PC Tools A practical guide 1990

[GOLD BERT 001 GOLBERT Harold What is Virtual Instrumentation IEEE Instrumentation amp Measurement Magazine Diciembre 2000

[HUNT 92] HUNT K J SBARBARO D ZBIKOWSKI R GAWTHROP P J Neural Networks for Control System - A survey Automatica Vol 28 No6

[MANDANI 74] MANDANI EH Applications of Fuzzy algorithms for control ofsymple dynamic plant Proc IEEE 121 (12) 1585 - 15880974)

102

EXTRACCION DE CARACTERiSTICAS RELEVANTES Y RECONOCIMIENTO DE SEN-ALES EMG MEDIANTE UNA RED NEURONAL TIPO PERCEPTRON

MULTICAPA

Victor Grisales (vhgrisalesateneaudistritaleduco) Carlos Sanchez (CarlosAndresieeeorg) Fernando Rosas (FernandoRosasieeeorg) Vladimir Barrero (vbarreroieeeorg) Juan Leon (ipleonieeeorg)

GIDIC - Grupo de Investigacion y Desarrollo en Instrumentacion y Control Universidad Distrital FJDC - Facultad de Ingenieria - Departamento de EIectronica

Bogota - Colombia 200 I

Resumen Este articulo presenta la metodologia para el entrenamiento y valida cion de redes neuronales tipo perceptron multicapa (MLP) mediante un caso de estudio de reconocimiento

de seiiales mioelectricas (EMG) del brazo de un paciente sanD de 3 aiios mediante la utilizaci6n del algoritmo de BackshyPropagation (BP) Se utilizan bases de datos que presentan la relacionexistente entre el espectro de potencia de una senal mioelectrica (a traves de la FFT) y el desarrollo deseado por el paciente sobre las cuilles se aplican (ecnicas de ingenierfa neural para la depuracion de datos Se realiza entrenamiento verificacion y validacion de la redAdemas para la operacion en Ciempo real se propone el desarrollo de una interfaz electronica sobre un procesador digital de senales (ADSP-21061

Palabras claves PrOtesis de miembro superior Senal electromiografica Red Neuronal Artificial Analisis de correlacion Ingenieria neural

1 INTRODUCCION Por muchos anos ha existido la meta en bioingenieria de disenar una protesis controlada a partir de las senales

mioelec-tdcas del brazo para poder ser usada en los pacientes amputados Eneste articulo se presenta la metodologia para la apropiada discriminaci6n de la senal mioelectrica la cual simplemente representa el deseo del paciente para ejecutar cualquier clase de movimiento Apoyados en diferentes investigaciones al respecto [12] tenemos la hipotesis de que la informacion debe ser extraida a

traves deelectrodos de superficie en 4 puntos especiales del brazo

I

Se trata en primera instaneia la adquisicion de las senales mioelectricas junto con la seleccion de caracteristicas relevantes de los movimientos la creacion de bases de datos para el entrenamiento verificacion y validacion de la red

n~uronal y la determinacion del nfunero optimo de neurodos ocultos de la red para efectos de reconocimiento [3] Se realizan diversas pruebas de software considerando el porcentaje de acierto de la red y se realiza un analisis de relevancia con miras a una reduccion de la dimension del vector de entrada

2 PROCEDIMIENTO La red neuronal es utilizada en este sistema para aprender la relacion entre el espectro de potencia de la senal EMG y la

1 Miembro de 1a poderosa familia SHARCreg de procesadores de pUnto flotante de 32 bits)l

actuacion deseada por las personas incapacitadas La red puede diferenciar 7 movimientos de las diferentes seiiales EMG Este sistema esta compuesto por dos partes adquisicion y discriminacion de las senales

21 Parte de adquisici6n La parte de adquisicion consta de electrodos preamplificados de la empresa Delsys los cuales estan disenados con una ganancia de 1000vv y con un fiItro pasabanda de 20-450 Hz Ellos usan la geometria de contacto de barra paralela para asegurar la estabilidad de la senal y la repeticion fiel entre las grabaciones Debe evitarse un contacto pobre entre los electrodos y la piel ademas que se debe buscar la forma de sujetarlos fuertemente Debido a que una posicion inadecuada genera una senal diferente se busca conservar siempre la misma posicion de los electrodos Se trabaj6 con la seccion proximal del brazo y los electrodos se manejaron en forma de anillo utilizando cuatro electrodos uno frente at otro (ver Fig 1) Yun electrodo adicional como referencia

Flenie Fspalila

Localliacion de los electrodos Fig I Descripcion de la localizacion de los electrodos en el brazo del

paciente sano

Dadas las estrategias de entrenamiento de la red se debe definir la forma como estaran compuestas las bases de datos de acuerdo a las diferentes combinaciones en la posicion de los electrodos

De tal forma que si los electrodos se miden con respecto a un punto comtm de referencia se obtienen cuatro mediciones

103

(Oa) Al igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con referencia COlttUltrshy

(

~JP- I ~~_O~[f

(a)

Medicion de voltaje diferencial

fjmiddot ~~Jjl

or- t~Rfr~~~

(b) Fig 2 Localizacion de los electrodos

22 Parte de discriminacion Las seiiales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extension de la muneca pronacion supinacion apertura y

cierre de la mano

~E1E-l o m lID all mo 1000 1210

(b) Flexion de h mlliieca

0112 1 I o 21D lID EIlO mo lIDO 1210

(c) Reposo

Fig 3 Senales e1ectromiograficas

La senal mioelectrica es no periodica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amllisis de Fourier (algoritmo FFT) El espectro de potencia de la senal EMG (ver O)representa una distribucion continua como funcion de su frecuencia

Para la creacion de las bases de datos de trabajo se tomaron como entradas de Ia red neuronal numerosos ejempIos de movimientos incluyendo el reposo a partir de Ia segmentacion de la senal EMG en ventanas de tiempo de aproximadamente 64 ms (l024 muestras a una frecuencia de muestreo de 16 Khz)

)l ~ 1 D 11]] 20J 3D lID SIl all

(a) Apertura de Mano

l j D 11]] 21ll 3D lID SIl all

(II) Flexionde hmlliieca ror---------~--~~---T-----r----

III

3J

2l

10 Dl I D IIll 21ll 3JD IDD roD 6DII

(e) Reposo

Fig4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciaIes junto con las respectivas salidas que confonnan el vector objetivo de clasificacion (Target2

) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen el mismo numero de muestras porque estadisticamente ellos no tienen Ia misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla I)

TABLAl DISTRIBUCI6N DE LOS MOVIJvtIENTOS

J 1 REPOSO 60

Jz APERTURA DE MANO 75

J3 CIERRE DE MANO 75

J4 FLEXI6N DE LA MuNECA 625

J6 EXTENSION DE LA MuNECA 625

J 6 PRONACI6N 625

J SUPINACI6N 625

EI conjunto utilizado de caracteristicas parte de que e~ estos valores esta contenida esenciahnente Ia infonnacion para efectos de clasificaci6n de Ia senal EMG

Sin embargo resulta conveniente una comprobacion yo reduccion del espacio de caracteristicas mediante el analisis

de correlacion segim se explica a continuacion EI analisis de correlacion pennite detenninar Ia dependencia lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor masbajo ell orden de

2 donde las columnas almacenan valores 09 001 para indicar la pertenencia

o no pertenencia a la c1ase de movimiento que c0fesponda

104

irnportanciaEl analisis de correlacion de caiacteristicasparte del calculo de la correlacion y del coefici~nte decorrelaci6n asi 5i se considera un vector caracteristico de entradas X =

Xh xN con Ncaracteristicas la correlacionentre las caracteristicasi-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esta dada en (l)

cCor(Xx)=(IIQ) poundE(X~q)~p)(x(q)_p)(I)Y I J q=l I I J J

donde

E es el operador de valor esperado Xj(qj es el valor de la i-esima caracteristica del vector caracteristico X XV es el valor de la j-esima caracteristica del vector caracteristico X 1 es el valor esperado de la i-esima caracteristica sobre la poblacion de muestra de tamano Q flj es el valor esperado de la j-esima caracteristica sobre la poblacion de muestra de tamano Q

El coeficiente de correlacion estandarizado adimensional esta dado por (2)

~--

Pij =Cij ~(CiiCff) (2)

Esta ecuacion satisface la desigualdad de Cauchy-Sch-vartz quedando acotado el rango para Pij entre los valores-l y I

1 ~ ~j ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pij estara mas cercade cero (Cij 0) Para efectos de reducci6n del numero de entradas a la red neuronal se considera que dos caracteristicas esUin altamente correlacionadas en el caso en el que IPij gt 0707 Para el caso de reconocimiento de senalesEMG se ha considerado que la infonnacion relevante esta contenida en 50 componentes para efectos de reconocimiento de los diferentes movimientos La Tabla II muestra parte de la matriz de correlacion (12 primeras componentes) calculada para la base de datos

I 2 3 4 5 6 7 8 9 10 11 12

y TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACI6N 2 3 4 5 6 7 8 9 10 II 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de nvisar lamatm decoeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pijl lt 0707 por locualse puede decir que noestan altamente correlacionados y en consecuencia puede concluirse que las caracteristicas pueden ser consideradas independientes La parte de discriminacion esta confonnada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizacion del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripcion de cuantas capas tiene el nfunero de neuronas en cada capa la funcion de transferencia de cada capa y como se interconectan elIas entre sL La topologia de la red MLP tiene diferentes capas (ver 0) la capa de entrada (N) unacapa oculta (M) y una capa de salida (J) La capa de salida tiene tantas neuronas como el ntimero de movimientos a desarrollar

El proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validacion y (iii) verificaci6n Las tres (3) bases de datos fueron creadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

105

Vecrorde Entradas

Capade Entrada

Capa Oculta

Capade Salida

Fig 5 Arquiteclura de la red neuronal

TABLA III

11

DISTRIBUCI6N DE DATOS PARA EL APRENDlZAJE DEL MODELO MLP

Movimiento Ejemp Entr Verif ValL REposo 6000 3600 1500 900 APERTURADE 750 450 188 112 MANO CIERREDE MANO 750 450 188 112 FLEXI6NDE 625 375 156 94 MuNECA EXTENSI6N DE 625 375 156 94 MUNECA PRONACI6N 625 375 156 94 SUPINACI6N 625 375 156 94 TOTAL 10000 6000 2500 1500

(Oa) AI igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con Medicion de voltaje referenda COJltUlt clifureJlCial

r-shy

( r ___nlll ( ~____J1 ~ ~r t laquo -1 ~v- fL-Rtr

~_~__ _~_1)7II[f e-~---

(b) Fig 2 Localizaci6n de los electrodos (a)

22 Parte de discriminaci6n Las senales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extensi6n de la mufieca pronaci6n supinacion apertura y

cierre de la mano

~I2E~1a l]] ltOD 6D Em llJJJ Ilm

(a) Apertura de lobno

~~lo 2Il lID EIJl roo HIll =

(b) Flexion de ]a muiieca

oa r--~-----------------

nm l o 211l lID amp10 roo 111l[]

1210

(t) Reposo

Fig 3 Senales electromiograticas

La senal mioeIectrica es no peri6dica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amiHsis de Fourier (algoritmo FFT) El espec1ro de potencia de la senal EMG (vcr O)representa una distribucion continua como funci6n de su frecuencia

Para la creation de las bases de datos de trabajo se tomaron como entradas de la red neuronal numerosos ejemplos de movimientos incluyendo el reposoa partir de la segmentacion de la senal EMG en ventanas de tiempo de aproximadantente 64 ms (1024 muestras a una frecuencia de muestreo de 16 Khz)

~[ j [] VII 2Il m lID EIJl EIJl

(a) Apertura de Mana

l 1 [] VII 211l m lID EIJl EIJl

Ill 40

31

ill

ID []L

D

(b) Flexion de ]a muiieca

IIIl 211l 310 40D IlO Il[]

(c) Reposa

Fig 4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciales junto con las respectivas salidas que conforman el vector objetivo de clasificaci6n (TargeP) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen elmismo numero de muestras porque estadisticamente ell os no tienen la misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla nmiddot

TABLA I DlSTRIBUCION DE LOS MOVlMIENTOS

60REPOSOJ1 75APERTURA DE MANOJz

75CIERRE DE MANOJ3 625FLEXION DE LA MuNECAJ4 625EXTENSION DE LA MuNECAJ6

625PRONACIONJ 6

625SUPINACIONJ

El conjunto utilizado de caracterlsticas parte de que en estos valores esta contenida esencialmente la informaci6n para efectos de c1asificaci6n de la senal EMG

Sin embargo resulta conveniente una comprobacion yo reducci6n del espacio de caracteristicas medianteel analisis de correlacion segun se explica a continuaci6n EI analisis de correlaci6n permite determinar la dependencia

lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor mas bajo ell orden de

2 donde las columnas almacenan valores 09 6 01 pam indicar la pertenenci3

o no pertenencia a la c1ase de movimiento que co~esponda

104

inlportandaEl analisis de correlacion de caracteristicas parte del calculo de la correlacion y del coeficiente decorrelaci6n asi Si se considera un vector caracteristico de entfadas X = XhXN con Ncaracteristicas la correlaci6nentre las caracteristicas i-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esrn dada en (1)

Qc=Cor(XX)(lQ) L E(X~q)-Il)(x(q)_Ilmiddot)(I)

I I J q=l I I J J

donde

E es el operador de valor esperado Xi(q) es el valor de la i-esima caracterlstica del vector caracteristico X Xr) es el valor de la j-esima caracteristica del vector caraderlstico X ~i es el valor esperado de la i-esimacaracteristica sobre la poblacion de muestra de tamafio Q ~j es el valor esperado de la j-esima caracteristica sobre la poblaci6n de muestra de tamano Q

Elcoeficiente decorrelaci6n estandarizado adiinensional esta dado por (2)

Pij = Cij I ~r-(C-iiC-iJ-) (2)

Esta ecuacion satisface la desigmildadde Cauchy-Sch~artz quedando acotado el rango para Pj entre los valores-I y I

-1 ~ Pij ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pj estara mas cerca de cero (Cij 0) Para efectos de reduccion del nfunero de entradas a la red neuronal se considera que dos caracteristicas estan altamente correlacionadas en el caso en el que Pij gt 0707 Para el caso de reconocimiento de senales EMG se ha considerado que la informaci6n relevante esta contenida en 50 componentes para efectos de reconocimiento delos diferentes movimientos La Tabla II muestra parte de la matriz de correlaci6n (12 primeras componentes) calculada para la base de datos

1 2 3 4 5 6 7 8 9 10 11 12

TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACION 2 3 4 5 6 7 8 9 10 11 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de revisar lamatrizde coeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pij lt 0707por 10cual se puede decir que no estan altamente correlacionados y en consecuencia puede concluirsemiddot que las caracterlsticas pueden ser consideradas independientes La parte de discriminacion esta conformada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizaci6n del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripci6n de cmintas capas tiene el numero de neuronas en cada capa la funcion de transferencia decada capa y c6mo se interconectan ellas entre sf La topologia dela red MLP tiene diferentes capas (ver 0) la capade entrada (N) una capa oculta (M) y una capa de salida (1) La capa de salida tiene tantas neuronas como el nfunero de movimientos a desarrollar

EI proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validaci6n y (iii) verificaci6n Las tres (3)bases de datos fueroncreadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

Vector de En1rtdas

Capade Capa Entrada Oculta

Fig 5 Arquitectum de la red neuronal

TABLA III DISTRIBUCION DE DATOS PARA EL APRENDIZAJE DEL MODELO

MLP

I I I

Movimiento Ejemp Entr Verlf ValL REposo 6000 3600 1500 900 APERTURADE MANO

750 450 188 1I2 I

CIERREDE MANO 750 450 188 1I2 FLEXION DE MuNECA

625 375 156 94

i EXTENSION DE MuNECA

625 375 156 94

PRONACION 625 375 156 94 SUPINACION

TOTAL 625 10000

375 6000

156 2500

94 1500 I

105

II

Las pruebas de entrenamiento y validacion se hicierona partir de las bases de datos de trabajo normalizadas ejecutando el programa de entrenamiento de MLP con base en el algoritmo BP

Se realizaron 5 pru~pas para diferentes valores del numero de neurodos de la capa oculta (M) tOl unmiddotminimo de iteraciones de 1000 variando el valor de Mdesde 30 hasta 100 en pasos de 5 A medida que se ejecuta 61 algoritmo de entrenamiento se va evaluando el error de vaHdpoundcion quedando registrada la iteracion para la que se obtiene ~I minimo valor asi como los correspondientes valores de la red El algoritmo se ejecuta

shyhasta que se alcance el numero de iteraciones especificado 0

se logre reducir el error t9tal po debajo del ~nimo preestablecido (0005)

Los valores de los errores mlmmos de entrenamiento y validacion son fundamentalesmiddot cQmo medida para deterrninar el grado de aprendizaje de lalt red y permiten deterrninar el punto a partir del cualla red empieza a memorizar mas que a aprender Se hace tambien necesario prQ9~r la red luego de haber sido entrenada para esto se hace USa de la base de datos de verificacion la cual se pasa a traves de la red neuronal para determinar el porcentaje de aciertos en el reconocimiento de los movimientos dando lugar a la llamada matriz de confusion3

bull

Con base en estos criterios se determinaron las matrices de confusion tanto para entrenamiento como para verificaci6n en cada una de las pruebas realizadas y se concluye que el numero optimo de neurodos para la capa intermedia M en nuestro caso es de 75

3 CONCLUSIONES El amllisis de correlacion de caracteristicas debe hacerse antes de entrenar la red para saber si hay dependencia entre las componentes frtcuenciales

Los valores de los errores mmlmos de entrenamiento y validacion son fundamentales como medida para determinar el grado de aprendizaje de la red especialmente en el punto a partir del cual puede considerarse que la red empieza a memorizar mas que a aprender

Al realizar varias iteraciones se puede escoger el vector de pesos mas adecuado superando el problema de los minimos locales propio del algoritmo de entrenarniento de BP

4 TRABAJO FUTURO Para la openicion en tiempo real [4] se propone que este procedimiento se implemente sobre un procesador digital de senales (ADSP-21061) el cual operara sobre el conjunto de pesos obtenidos gracias a la red y de esta forma poder desarrollar una interfaz electronica que reciba identifique y procese las senales mioelectricas del brazo y ademas que

3 se forma comparando las salidas reales de la red con las salidas deseadas para todos y cada uno de los ejemplos de la base de verificaci6n

controle los movimientos hasicos que se asemejen a los naturales perrnitiendo a su vez ser adaptada al interior de una protesis e1ectromecanica de mano demostrando la efectividad del sistema para pacientes amputados a la altura del tercio proximal (antebrazo) con criterios de viabilidad economica y optimo uso energetico para su funcionamiento EI prototipo planteado presenta la arquitectura de la O

Seihlde los eledloclos

Catr~l5or

~ Digital

I I

Fig 6 Diagrama esquematico de una interfaz para una protesis mioeleclrica

REFERENCIAS [1] Kaduhiko Nishikwa Katsutoshi Kuribayashi Neural

Network Application to a discrimination system for controlled prostheses IEEEIRSJ International Workshop on Intelligent Robots and Systems nov 1991

[2] Adrian del Boca Dong C Park Myoelectric signal recognition using fuzzy clustering and artificial neural networks in real time IEEE Transactions on Biomedical Engineering jun 1990middot

[3] Looney Carl G Pattern recognition using neural networks Theory and algorithms for engineers and scientists Oxford University Press 1997

[4] Embrec Paul C++ Algorithms for Real Time DSP Prentice Hall 1999

[5] Alan V Oppenheim et al j Discrete Time Signal Processing Prentice Hall 1999

AUTORES Ingeniero Victor Hugo Grisales Opta por el master en e1ectrica en la Universidad de los Andes Profesor de tietnpo completo en la Universidad Distrital Director del grupo I+D en instrumentacion y control

Carlos Sanchez Fernando Rosas Vladimir Barrero Juan Leon Estudiantes de ultimo semestre de Ingenieria Electronica en la universidad Distrital FIDC Miembros

Estudiantiles del IEEE

106

ANALISIS ACUSTICO EN LA CLASIFICACION DE SENALES DE VOZ EMPLEANDO RNA

German Castellanos (gcastel1ieeeorg) Francisco Vargas (pcinevadomanizalesunaleduco) Grupo de Control y Procesamiento Digital de Senales - Universidad Nacional de Colombia - Sede Manizales

Resumen Se presenta un sistema de clasificaci6n desefiales de voz basado en sus caracteristicas acusticas el cual se ha dividido en tres partes obtencilm del ensamble inicial de caracterizaci6n acustica de la voz basandose en tecnicas de proceso digital de senales en tlempo real reduccion hasta elmenor ensamble de parametros representativos y suficientemente discriminantes de las clases basandose en tecnlcas estadisticas y por ultimo la construction de las reglas de decisi6n para clasificacion de senales de voz que pueden ser basadas en el empleo de redes neuronales EI sistema rue probado en la clasificaci6n devoz de acuerdo al sexo y edad de los hablanies y como resultado se determinan sus caracteristicas acusticas mayormente influyentesmiddot Ademas esta orieiltado a la tipificacion de norinalidad 0 alteraci6n de las direrentes clases de voz Para el presente trabajo rueronmiddot evaluadas las redes multi-capa y los mapas auto-organizatlvos de Kohonen

L INTRODUCCI6N

En la evaluacion de la voz la metodologia perceptual caracterizada por Ia calificacion de las cualidades vocales segUn el juicio experto de un sujeto necesita habilidades refinadas de escucha EI empleo de tecnologias digitales permite evaluar de manera objetiva la acustica y fisiologia del fenomeno Durante el proceso de evaluacion objetiva de voz normal 0 alteradaes necesario determinar sus caracteristicas cualitativas como es el caso del couelato acustico timbre aspero la emision con quiebres el ataque vocal duro (fmal de frase abortado) voz hiponasalizada y ruido acoplado para lograr muestras que sean altamente fieles alemisor El empleo de sistemas computarizados de anaIisis acustico de voz provee la posibilidad de percibir elementos dificiles de registrar mediante la observacion sUbjetiva convencional

EI uso de caracteristicas acusticas (CA) en la descripcion de normalidad 0 alteracion de voz ha sido probado en VallOS

contextos y con diferentes objetivos por cuanto perrniten ponderar cualitativamente las propiedades de la voz dificilmente realizable por otros metodos [123] Aunque se han Ilevado a cabo estudios de correlacion de estas caracteristicas con la metodologia perceptual sus resultados ademas de ser ambiguos a veces pueden ser contradictorios en el analisis de tipicidad (normalidad) 0 diferentes alteraciones de las senalesmiddot de voz De tal manera que la seleccion

-apropiada de la medida de las CA y su interpretacion sigue siendo un problema sin solucion

parametros representativos de cada clase se realiza el preproceso de los CA sobre los cuales se construye el ensamble inicial de caracterizacion acustica de voz La Seleccion del ensamble efectivo se realiza mejorando la efectividad de empleo de cada uno de los CA para 10 cual se analizan los criterios discriminatorios de correlacion e informacion mutua Finalmente la reduccion de la dimensionalidad de ensamble se realiza por el metoda de las componentes principales Una vez extraidos los parametros necesarios para la caracterizacion de la voz se resuelve la clasificacion de la voz en el tipo normal y no normal (con alteraciones )

MtltJ~ llbIUtl IHlttmllJgt

Fig 1 Diagrama de bloques reconocimiento de palrones de senales de voz

EI reconocimiento de patrones de senales de voz se puede dividir en dos procesosmiddot fundamentales como se aprecia en la figura Imiddot el entrenamiento que comprende la extraccion y seleccion del con junto de caracteristicas acusticas (id iE(I Ni) que representan cada clase de voz kE(lK) y la toma de decisiones que realiza la clasificacion por algun principio discriminante

EI tipo de reconocimiento empleado en el presente trabajo es una derivacionmiddot de lamiddot metodologia propuesta en [22] compuesta de dospartes hasicas a) Extraccion y Seleccion del ensamble efectivo de CA por clase b) el ensamble efectivo de CA es tornado como entrada de una RN usada en calidad de clasificador que en el caso particular fue del tipo backpropagation Asi fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen

2 ENSAMBLE DE CARACTERIZACI6N INICIAL ACUSTICA DE VOZ

La caracterizacion de la voz requiere de un elevado nUmero Elanalisis acustico de un sonido articulado consiste en de valores de CA En el articulo se presentan algoritmos de determinar los indicadoresfisicos de las vibraciones que 10 estimacion en tiempo real para los principales CA que en constituyen tales como la frecuencia la intensidad la general son muy sensibles a las condiciones acusticas de composicion espectral las variaciones del sonido modificadas tnedida [4] Para aumentar la efectividad en el uso de los por la resonancia que actuan originando el producto sonoro

107

que permite predecir la proXima muestra como una percibido [56] La seleccion de parametros que caracterizan

combinacion lineal de las anteriores [10] la voz es tal vez la etapa mas importanteen el desarrollo de sistemas automatizados de su proceso Uno de los principales y(n)=-taky(n-k) (2)problemas en el analisis de las CA de voz consiste en que la mayoria de eUos son sensibles a diferentes condiciones de

k=l

donde q es el orden del predictor y ak son los coeficientes de medicion Este factor conlleva a escoger el ens amble de prediccion lineal (LPC) Los coeficientes ak pueden ser parametros acusticos que brinde la mejor estimacion de determinados a partir del calculo de coeficientes demiddot irregularidad y perturbacion para la clasificacion y autocorrelacion De esta manera se tendcln q coeficientes de reconocimiento de senales de voz En general toda CA de prediccion lineal por cada trama de la senal de voz Tambien amilisis debera cumplir con las siguientes propiedades [6] a) es habitual aplicar el calculo de los coeficientes LPC Debe ser facilmente estimable y 10 menos dependientes de las cepstrales (Ia transformada de Fourier inversa del espectro de perturbaciones ambientales b) Su estimacion debe ser estable amplitud logaritmico) que representan la respuestaen el tiempo y c) No debe ser imitable Las CA pueden ser aproximadamente logaritmica 0 psofometrica del oido agrolJados de acuerdo a las propiedades acusticas que deben humano Los coeficientes LPC cepstrales Ck presentan la medir y los cuales en la practica se asocian en dos categorias ventaja de convertir el ruido convolucional en ruido aditivo y [7] permiten separar la excitacion glotal de los parametros del

tracto vocal Seguidamente se emplea un tipo de ventaneo que a) Parametros cuasiperiodicos Son disenados para la acentue los pesos de los LPC cepstrales con el objeto de captura de varias fonnas de periodicidad de las obtener mayor discriminacion de la envolvente espectral perturbaciones en la senal aclistica Entre los principales

parametros de este gropo estan b) Parametros de perM-bacion Destinados a medir la componente relativa de ruido en la senal de voz Para la

La Frecuencia Fundamental (Fo) que es referida a las estimacion de las perturbaciones de los parametros de la caracteristicas de cuasiperiodicidad de la senal en el tiempo frecuencia fundamental es comun el empleo del promedio Los diferentes metodos de estimacion del calcul0 del Fo relative de perturbacion (RAP Relative Average Perturbation) fueron analizados y comparadosen [S] por tiempo de proceso

definido como [1311] y precision obteniendose que el metodo (AMDF Magnitude Difference Function) [69] es mas veloz cuyo algoritmo esta

dado por iJ n z=(tIZH +z Zi+l -Zi llLRAP 1=1 3 1=1

AM(km)= (3) siendo n es el numero de ciclos consecutivos analizados 1 m

- Lly(n)- y(n-k)w(m-1t) Cuando el panimetro de perturbacion z se refiere al periodo N n=m-N-l) de la frecuencia fundamental se define el Jitter mientras que

en el caso de su amplitud se define el Shimmer [14] EI nivel (1) de perturbaciones tambien puede ser caracterizado por elDonde yen) es la senal digitalizada de voz wen) es la ventana

de proceso con longitud N m es el numero de muestras armonico ruido H 0 energia promedio del ruido de fondo ij(t) empleadas en la estimacion k es el retraso para el cual se esta que se determina como

Tcalculando el AMDF H = 11Jr((r)ciT (4a)

Los formantes En el espectro de una senal de voz se o encuentran regiones de enfasis (Uamadas resonancias) y de donde 1E [01] El componente de ruido N se defme como la deenfasis (antiresonancias) [9] ambas resonancias diferencia de energias de la senal de informacion y del denominadas formantes que siguen patrones comunes en la armonico ruido mayoria de los humanos determinadas basicamente por sus medidas antropometricas [101112] En la practica se nT analizan 5 fonnantes (FI F2 F3 F4 F5) junto con sus N = LJ[yj (1 )-11(1)]2 dT (4b)respectivos anchos de banda (LlWI LlW5Y los cuales se

=1 0 definen como el gropo de frecuencias que hay desde la caida a

donde 1E[O1] Finalmente el armonico ruido se determinposterior y anterior de 3 dB La energia del formante sera el como HNR=HIN Para aplicaciones profesionales la energia

valor del pica y el valor del formante la frecuencia donde se se determina por la diferencia entre la energia de la emision

encuentre el pica anterior [11] La estimacion de los vocal y la energia del ruido ambiente dado por formantes se realizo sobre algoritmos basados en la

suposicion de que la voz puede ser representada por modelos II

P(n) = -1

Ly2 (i) (4c)en fonnadeun numero reducido de indicadores a partir de n 1=1los cuales es posible su reconstruccion adecuada Para esto se S

donde n es el numero de puntos de la senal y(t) OlrD empleantecnicas de prediccion lineal basadas en el a

parametros analizados son la Energia de nlido normalizadmodel ado deltracto vocal mediante un filtro de solo polos (NNE) que ha sido estudiada en varios contextos [71415] Y

108

la excitaciim g16tica a ruido (GNE) estima el ruido en un tren el proceso de medicion influencia de fuertes perturbaciones de pulsos que es tipicamente generado por la oseilacion de los etc En este caso el valor anomalo del arreglo se expresa pliegues de voz [3] mediante el valor critico de la distribucion de Student fp n-2

La cantidad de CA N de representaci6n de voz t es [1717] completado por la primera (parametros delta) y segunda derivada (delta-delta) en el tiempo de los LPC cepstrales [6] y I e- In I[J s Ipn_] (n-I )112I(n-2+(lpnd)lf2 (5) debe realizarse para cada una de los tipos de senales de voz a clasificar Realmente cada CA puede influir de diferente siendo JIll yO respectivamente la media y varianza del manera en la pronunciaci6n de cada palabra En la practica de valor extremo en analisis del arregl0 I p es el nivel de la fonoaudiologia es comllo el empleo de palabras claves 0 significacion A efectos de comparaci6n de las realizaciones maestras En el caso particular se cada muestra fue tomada de losdiferentes parametros acusticos es preferible su basados en la pronunciaci6n de las cinco vocales estandarizacion estadistica Asi

Cabe anotar que el reconocimiento de senales de voz debe (6)~I =(i- mJ)O realizarse en linea por 10 que los algoritmos de proceso deben estar orientados a su desarrollo en tiempo real Los metodos empleados de estimacion de cada caracteristica fundamentalmente empleando metodos de amiJisis en acustica exigen la verificacion de hipotesis de la intervalos de tiempo cortos de los segmentos de voz los homogeneidad la cual se lleva a cabo por el criterio i y en cuales se analizan en [616] casos extremos se emplea el metoda Kolmogorov-Smirnov

[IS] Si laverificacion muestra claramente la invalidez de la hipotesis de gaussividad es importante determinar el tipo de

3 SELECCION DEL ENSAMBLE EFECTNO distribucion de fdp para cada ensambleI y si es posible la forma de su transformacion a la normal La transformacion de

La extraccion de CA se realiz6 acorde a los algoritmos la variable [Jj en sect con distribucion nonnalizada se determina presentados en anteriormente Asi se escogio un conjunto de de la relacion caracteristicas acusticas UiI i= I bullN que representan cada dase de voz k= I $ El sistema automatizado de extraccion ~

de parametros calcula 20 CA para cada una de las cinco ~21C1_ J e_2 dt =Lr M ji(Aji-1 lt Sjlt Aji) voeales (aIlellillollul) pronunciadas en la emision de voz a __ =1 N analizar Como resultado se obtuvo un valor de Nr I 00 para

j

(7)una sola emision de un paciente dado En cuanto a los grupos de clasificaci6n se definieron los siguientes a) Hombre

donde ~gve es el ens amble real de 0 res el nlimero relativo Adulto k=l b) Hombre Nino k=2 c) Mujer Adulta k=3 y d)

de intervalos delhistograma AJi Aji son los valores extremos Mujer Nina y k=4

del intervalo i del histograma del parametro 01 ~ es la frecuencia de ocurrencia en cada intervalo del intervalo i Una

Las estimacion de las CA de voz e es muy sensible a forma empirica alterna de ajuste consiste en la transformacion

faetores tales como las condiciones acusticas de toma de de cada CA 0(1) por diferentes operaciones basicas y

senales (ruido de fondo hardware de registro electronico comunmente empleadas en el tratamiento de voz

tiempo del dia en que se Ie toman las muestras al paciente contenido de las palabras etc) por 10 que la primera tarea a

~(I)=lg((I)plusmna) I01 c(1)=lg(aplusmn (I)(I) resolver en su clasificacion usualmente es el preproceso de

~(I)=1((1)110datos de las realizaciones que esta orientado a aumentar la efectividad en el uso de los parametros representativos de cada clase De otra parte la cantidad de realizaciones 0 Despues de cada transformacion se realiza la prueba i y se

toma aquella operacion que con mayor certeza confirme la ensamble N determina las limitaciones en la eleccion del hipotesis de gaussividad En general para cada []jk se puede metodo de preproeeso en particular se debe evitar el efecto tener una transformacion diferente [23] de valores extremos de ensamble muy pocas realizaciones 0

sobrevaluacion del ensamble [17] Las CA estan construidas La seleccion del ensamble efectivo de los rasgossobreestimaciones por 10 que es importante tener discriminantes constituye el aspecto fundamental en uninformacion sobre la fdp (0 su familia) para la cual se sistema de reconocimiento de patrones Las propiedades que calculan sus momentos Por este motivo el ensamble de deben cumplir las CA para su selecci6n son las siguientes prueba Ne se escogi6 de acuerdo al minima numero de

realizaciones que se deben tener para verificacion de Capacidad discriminante Es decir que separen 10 mashipotesis que para valores dados del nivel de significacion nitidamente posible las clases existentes P 01 Yun error de 10 obteniendose N90 muestras por Confiabilidad Esto es los objetos de una misma clase clase [17] deberan presentar la menor dispersion posible Ausencia de correlacion Es decir evitar en 10 posible la La siguiente etapa en el preproceso de datos esta enla utilizacion de caracteristicas que dependan fuertemente eliminacion de datos anomalos debidos a posibles errores en entre si

109

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 6: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

DrMil_~rolx itt(f~1h~-

Figura No 8

3 PLATAFORMA DE EXPERlMENTACION

31 Descripcion de laplanta Se desea controlar la presion del aire en un tanque cambiando 1a apertura de una valvula El esquema se muestra en la figura

No9

Flujo de entrada

Figura No9

La planta posee una entrada de flujo constante que alimenta el sistema 1a valvula es normalmentecerrada con una apertura entre 0 y 100 logrando una presionenel tanque

entre 2 y 9 psi

32 Estrategia de control neuronal

Se utilizo la estrategia del modelo inverso especializado de la planta [CASTRO 01] para ello se configuro una red Backpropagation con 3 neuronas de entradas y una neurona de salida ambas con Ia funci6n identidad y 3 neuronas en la eapa oculta con funcion de activacion sigmoidal

Debe existir una fase previa de entrenamiento para 10 que se apticaron varios escalones aleatorios a la entrada del sistema registrarido la salida a un tiempo de muestreo fijo Ia respuesta de la planta ante diversos escalones aleatorios con un tiempo de muestreo de lOOms se muestra en la figura

NolO

Se entreno la red neuronal utilizando como patrones de entrada los val ores de presion presente presion con un retraso y presion con dos retrasos y como patrones de salida la apertura de la valvula con un retraso EI esquema se muestra en la figura NoII

Una vez la red aprende los patrones hasta un error pequeno dicha red se puede utilizar como controlador [HUNT 92] por el esquema mostrado en Ia figura N12

100

Figura No1 O

RNA e

Figura No1 1

Ref

~~ lJ(n) RNA _~LANTAIY(n)

Figura No1 2

33 Estrategia de control difilsO

Se aplico una estrategia difusa PI Mandani [MANDAN I 74] Los conjuntos difusos definidos para el error el cambio del error y 1a salida ~c muestran en la figura No13

E=r

Figura No 13

Se utilizaron 5 reg las que se enuncian por medio de una tabla su definicion se muestra en 1a figura No14

CAMBD DE ERROR negatito ce 10 postilo

ERROR neg a tiro

cero

postilo

Figura No 14

Se utilizo e1 metodo del centro de area para la desfuzzificacion

4 Resultados obtenidos Junto con el controlador difuso y el neuronal se implemento un control PI sintonizado con las reg las de Ziegler Nichols para comparar los resultados

Al aplicar un escalon a la entrada los tres controladores llevaron a la planta a estado estable en un tiempo similar el control por red neuronal no presento sobreimpulso mientras los otros dos si La respuesta se puede ver en la figura No 15

EI esfuerzo de control como respuesta ante el mismo escalon se muestra en la figura No 16 se puede ver que el mayor esfuerzo 10 realiza la red neuronal mientras que los otros dos tienen un cambio mas suave

101

Figura No15

Ante un disturbio las estrategias PI difusa y clasica son capaces de llevar la planta a la referencia deseada mientras que la red neuronal no Las respuestas ante un disturbio se pueden ver en la figura No 17

Figura No16

5 CONCLUSIONES

Se comprobo en forma pnictica uno de los posibles usos de los instrumentos virtu ales desarrollados en LabView y se dejan sentadas las bases para desarrollos posteriores en este senti do

En este trabajo se utilizo el modelo inverso especializado con redes neuronales y el PI difuso para el control de una planta de presion EI resultado obtenido es aceptable al ser comparado con un PI clasico dichas estrategias nos brindan entonces una opcion valida diferente para el control Se pudo ver como un control PI difuso puede responder de manera similar a Ull control PI sin embargo llevarlo a un punto de trabajo bueno requiere

de umi afinacion empirica basada en el conocimiento de la pblnta

Figura No17middot

Al aplicar la estrategia de control por modelo inverso especializado se vio que la respuesta al escalon fue buena sin embargo esto depende del nfunero y calidad de patrones con quese entrene ademas de requerir un nuevo aprendizaje ante cambios severos en las condiciones de trabajo de la planta Esto se puede evidenciar ante la respuesta al disturbio al cambiar las condiciones de la planta el controlador neuronal no pudo llevar el sistema al punto de referencia deseado mientras que los olros dos controladores si 10 10graron

REFERENCIAS

[CASTRO 01] CastroT Orlando Giraldo H Norma Implemtacion de un sistema de control utilizando redes neuronales artificiales por modelo inverso especializado de la planta Colombia Cali Universidad del Valle Tesis de pregrado 2001

[EBERHART 90] Russell C Eberhart Roy W Dobbins Neural Network PC Tools A practical guide 1990

[GOLD BERT 001 GOLBERT Harold What is Virtual Instrumentation IEEE Instrumentation amp Measurement Magazine Diciembre 2000

[HUNT 92] HUNT K J SBARBARO D ZBIKOWSKI R GAWTHROP P J Neural Networks for Control System - A survey Automatica Vol 28 No6

[MANDANI 74] MANDANI EH Applications of Fuzzy algorithms for control ofsymple dynamic plant Proc IEEE 121 (12) 1585 - 15880974)

102

EXTRACCION DE CARACTERiSTICAS RELEVANTES Y RECONOCIMIENTO DE SEN-ALES EMG MEDIANTE UNA RED NEURONAL TIPO PERCEPTRON

MULTICAPA

Victor Grisales (vhgrisalesateneaudistritaleduco) Carlos Sanchez (CarlosAndresieeeorg) Fernando Rosas (FernandoRosasieeeorg) Vladimir Barrero (vbarreroieeeorg) Juan Leon (ipleonieeeorg)

GIDIC - Grupo de Investigacion y Desarrollo en Instrumentacion y Control Universidad Distrital FJDC - Facultad de Ingenieria - Departamento de EIectronica

Bogota - Colombia 200 I

Resumen Este articulo presenta la metodologia para el entrenamiento y valida cion de redes neuronales tipo perceptron multicapa (MLP) mediante un caso de estudio de reconocimiento

de seiiales mioelectricas (EMG) del brazo de un paciente sanD de 3 aiios mediante la utilizaci6n del algoritmo de BackshyPropagation (BP) Se utilizan bases de datos que presentan la relacionexistente entre el espectro de potencia de una senal mioelectrica (a traves de la FFT) y el desarrollo deseado por el paciente sobre las cuilles se aplican (ecnicas de ingenierfa neural para la depuracion de datos Se realiza entrenamiento verificacion y validacion de la redAdemas para la operacion en Ciempo real se propone el desarrollo de una interfaz electronica sobre un procesador digital de senales (ADSP-21061

Palabras claves PrOtesis de miembro superior Senal electromiografica Red Neuronal Artificial Analisis de correlacion Ingenieria neural

1 INTRODUCCION Por muchos anos ha existido la meta en bioingenieria de disenar una protesis controlada a partir de las senales

mioelec-tdcas del brazo para poder ser usada en los pacientes amputados Eneste articulo se presenta la metodologia para la apropiada discriminaci6n de la senal mioelectrica la cual simplemente representa el deseo del paciente para ejecutar cualquier clase de movimiento Apoyados en diferentes investigaciones al respecto [12] tenemos la hipotesis de que la informacion debe ser extraida a

traves deelectrodos de superficie en 4 puntos especiales del brazo

I

Se trata en primera instaneia la adquisicion de las senales mioelectricas junto con la seleccion de caracteristicas relevantes de los movimientos la creacion de bases de datos para el entrenamiento verificacion y validacion de la red

n~uronal y la determinacion del nfunero optimo de neurodos ocultos de la red para efectos de reconocimiento [3] Se realizan diversas pruebas de software considerando el porcentaje de acierto de la red y se realiza un analisis de relevancia con miras a una reduccion de la dimension del vector de entrada

2 PROCEDIMIENTO La red neuronal es utilizada en este sistema para aprender la relacion entre el espectro de potencia de la senal EMG y la

1 Miembro de 1a poderosa familia SHARCreg de procesadores de pUnto flotante de 32 bits)l

actuacion deseada por las personas incapacitadas La red puede diferenciar 7 movimientos de las diferentes seiiales EMG Este sistema esta compuesto por dos partes adquisicion y discriminacion de las senales

21 Parte de adquisici6n La parte de adquisicion consta de electrodos preamplificados de la empresa Delsys los cuales estan disenados con una ganancia de 1000vv y con un fiItro pasabanda de 20-450 Hz Ellos usan la geometria de contacto de barra paralela para asegurar la estabilidad de la senal y la repeticion fiel entre las grabaciones Debe evitarse un contacto pobre entre los electrodos y la piel ademas que se debe buscar la forma de sujetarlos fuertemente Debido a que una posicion inadecuada genera una senal diferente se busca conservar siempre la misma posicion de los electrodos Se trabaj6 con la seccion proximal del brazo y los electrodos se manejaron en forma de anillo utilizando cuatro electrodos uno frente at otro (ver Fig 1) Yun electrodo adicional como referencia

Flenie Fspalila

Localliacion de los electrodos Fig I Descripcion de la localizacion de los electrodos en el brazo del

paciente sano

Dadas las estrategias de entrenamiento de la red se debe definir la forma como estaran compuestas las bases de datos de acuerdo a las diferentes combinaciones en la posicion de los electrodos

De tal forma que si los electrodos se miden con respecto a un punto comtm de referencia se obtienen cuatro mediciones

103

(Oa) Al igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con referencia COlttUltrshy

(

~JP- I ~~_O~[f

(a)

Medicion de voltaje diferencial

fjmiddot ~~Jjl

or- t~Rfr~~~

(b) Fig 2 Localizacion de los electrodos

22 Parte de discriminacion Las seiiales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extension de la muneca pronacion supinacion apertura y

cierre de la mano

~E1E-l o m lID all mo 1000 1210

(b) Flexion de h mlliieca

0112 1 I o 21D lID EIlO mo lIDO 1210

(c) Reposo

Fig 3 Senales e1ectromiograficas

La senal mioelectrica es no periodica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amllisis de Fourier (algoritmo FFT) El espectro de potencia de la senal EMG (ver O)representa una distribucion continua como funcion de su frecuencia

Para la creacion de las bases de datos de trabajo se tomaron como entradas de Ia red neuronal numerosos ejempIos de movimientos incluyendo el reposo a partir de Ia segmentacion de la senal EMG en ventanas de tiempo de aproximadamente 64 ms (l024 muestras a una frecuencia de muestreo de 16 Khz)

)l ~ 1 D 11]] 20J 3D lID SIl all

(a) Apertura de Mano

l j D 11]] 21ll 3D lID SIl all

(II) Flexionde hmlliieca ror---------~--~~---T-----r----

III

3J

2l

10 Dl I D IIll 21ll 3JD IDD roD 6DII

(e) Reposo

Fig4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciaIes junto con las respectivas salidas que confonnan el vector objetivo de clasificacion (Target2

) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen el mismo numero de muestras porque estadisticamente ellos no tienen Ia misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla I)

TABLAl DISTRIBUCI6N DE LOS MOVIJvtIENTOS

J 1 REPOSO 60

Jz APERTURA DE MANO 75

J3 CIERRE DE MANO 75

J4 FLEXI6N DE LA MuNECA 625

J6 EXTENSION DE LA MuNECA 625

J 6 PRONACI6N 625

J SUPINACI6N 625

EI conjunto utilizado de caracteristicas parte de que e~ estos valores esta contenida esenciahnente Ia infonnacion para efectos de clasificaci6n de Ia senal EMG

Sin embargo resulta conveniente una comprobacion yo reduccion del espacio de caracteristicas mediante el analisis

de correlacion segim se explica a continuacion EI analisis de correlacion pennite detenninar Ia dependencia lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor masbajo ell orden de

2 donde las columnas almacenan valores 09 001 para indicar la pertenencia

o no pertenencia a la c1ase de movimiento que c0fesponda

104

irnportanciaEl analisis de correlacion de caiacteristicasparte del calculo de la correlacion y del coefici~nte decorrelaci6n asi 5i se considera un vector caracteristico de entradas X =

Xh xN con Ncaracteristicas la correlacionentre las caracteristicasi-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esta dada en (l)

cCor(Xx)=(IIQ) poundE(X~q)~p)(x(q)_p)(I)Y I J q=l I I J J

donde

E es el operador de valor esperado Xj(qj es el valor de la i-esima caracteristica del vector caracteristico X XV es el valor de la j-esima caracteristica del vector caracteristico X 1 es el valor esperado de la i-esima caracteristica sobre la poblacion de muestra de tamano Q flj es el valor esperado de la j-esima caracteristica sobre la poblacion de muestra de tamano Q

El coeficiente de correlacion estandarizado adimensional esta dado por (2)

~--

Pij =Cij ~(CiiCff) (2)

Esta ecuacion satisface la desigualdad de Cauchy-Sch-vartz quedando acotado el rango para Pij entre los valores-l y I

1 ~ ~j ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pij estara mas cercade cero (Cij 0) Para efectos de reducci6n del numero de entradas a la red neuronal se considera que dos caracteristicas esUin altamente correlacionadas en el caso en el que IPij gt 0707 Para el caso de reconocimiento de senalesEMG se ha considerado que la infonnacion relevante esta contenida en 50 componentes para efectos de reconocimiento de los diferentes movimientos La Tabla II muestra parte de la matriz de correlacion (12 primeras componentes) calculada para la base de datos

I 2 3 4 5 6 7 8 9 10 11 12

y TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACI6N 2 3 4 5 6 7 8 9 10 II 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de nvisar lamatm decoeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pijl lt 0707 por locualse puede decir que noestan altamente correlacionados y en consecuencia puede concluirse que las caracteristicas pueden ser consideradas independientes La parte de discriminacion esta confonnada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizacion del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripcion de cuantas capas tiene el nfunero de neuronas en cada capa la funcion de transferencia de cada capa y como se interconectan elIas entre sL La topologia de la red MLP tiene diferentes capas (ver 0) la capa de entrada (N) unacapa oculta (M) y una capa de salida (J) La capa de salida tiene tantas neuronas como el ntimero de movimientos a desarrollar

El proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validacion y (iii) verificaci6n Las tres (3) bases de datos fueron creadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

105

Vecrorde Entradas

Capade Entrada

Capa Oculta

Capade Salida

Fig 5 Arquiteclura de la red neuronal

TABLA III

11

DISTRIBUCI6N DE DATOS PARA EL APRENDlZAJE DEL MODELO MLP

Movimiento Ejemp Entr Verif ValL REposo 6000 3600 1500 900 APERTURADE 750 450 188 112 MANO CIERREDE MANO 750 450 188 112 FLEXI6NDE 625 375 156 94 MuNECA EXTENSI6N DE 625 375 156 94 MUNECA PRONACI6N 625 375 156 94 SUPINACI6N 625 375 156 94 TOTAL 10000 6000 2500 1500

(Oa) AI igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con Medicion de voltaje referenda COJltUlt clifureJlCial

r-shy

( r ___nlll ( ~____J1 ~ ~r t laquo -1 ~v- fL-Rtr

~_~__ _~_1)7II[f e-~---

(b) Fig 2 Localizaci6n de los electrodos (a)

22 Parte de discriminaci6n Las senales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extensi6n de la mufieca pronaci6n supinacion apertura y

cierre de la mano

~I2E~1a l]] ltOD 6D Em llJJJ Ilm

(a) Apertura de lobno

~~lo 2Il lID EIJl roo HIll =

(b) Flexion de ]a muiieca

oa r--~-----------------

nm l o 211l lID amp10 roo 111l[]

1210

(t) Reposo

Fig 3 Senales electromiograticas

La senal mioeIectrica es no peri6dica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amiHsis de Fourier (algoritmo FFT) El espec1ro de potencia de la senal EMG (vcr O)representa una distribucion continua como funci6n de su frecuencia

Para la creation de las bases de datos de trabajo se tomaron como entradas de la red neuronal numerosos ejemplos de movimientos incluyendo el reposoa partir de la segmentacion de la senal EMG en ventanas de tiempo de aproximadantente 64 ms (1024 muestras a una frecuencia de muestreo de 16 Khz)

~[ j [] VII 2Il m lID EIJl EIJl

(a) Apertura de Mana

l 1 [] VII 211l m lID EIJl EIJl

Ill 40

31

ill

ID []L

D

(b) Flexion de ]a muiieca

IIIl 211l 310 40D IlO Il[]

(c) Reposa

Fig 4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciales junto con las respectivas salidas que conforman el vector objetivo de clasificaci6n (TargeP) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen elmismo numero de muestras porque estadisticamente ell os no tienen la misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla nmiddot

TABLA I DlSTRIBUCION DE LOS MOVlMIENTOS

60REPOSOJ1 75APERTURA DE MANOJz

75CIERRE DE MANOJ3 625FLEXION DE LA MuNECAJ4 625EXTENSION DE LA MuNECAJ6

625PRONACIONJ 6

625SUPINACIONJ

El conjunto utilizado de caracterlsticas parte de que en estos valores esta contenida esencialmente la informaci6n para efectos de c1asificaci6n de la senal EMG

Sin embargo resulta conveniente una comprobacion yo reducci6n del espacio de caracteristicas medianteel analisis de correlacion segun se explica a continuaci6n EI analisis de correlaci6n permite determinar la dependencia

lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor mas bajo ell orden de

2 donde las columnas almacenan valores 09 6 01 pam indicar la pertenenci3

o no pertenencia a la c1ase de movimiento que co~esponda

104

inlportandaEl analisis de correlacion de caracteristicas parte del calculo de la correlacion y del coeficiente decorrelaci6n asi Si se considera un vector caracteristico de entfadas X = XhXN con Ncaracteristicas la correlaci6nentre las caracteristicas i-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esrn dada en (1)

Qc=Cor(XX)(lQ) L E(X~q)-Il)(x(q)_Ilmiddot)(I)

I I J q=l I I J J

donde

E es el operador de valor esperado Xi(q) es el valor de la i-esima caracterlstica del vector caracteristico X Xr) es el valor de la j-esima caracteristica del vector caraderlstico X ~i es el valor esperado de la i-esimacaracteristica sobre la poblacion de muestra de tamafio Q ~j es el valor esperado de la j-esima caracteristica sobre la poblaci6n de muestra de tamano Q

Elcoeficiente decorrelaci6n estandarizado adiinensional esta dado por (2)

Pij = Cij I ~r-(C-iiC-iJ-) (2)

Esta ecuacion satisface la desigmildadde Cauchy-Sch~artz quedando acotado el rango para Pj entre los valores-I y I

-1 ~ Pij ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pj estara mas cerca de cero (Cij 0) Para efectos de reduccion del nfunero de entradas a la red neuronal se considera que dos caracteristicas estan altamente correlacionadas en el caso en el que Pij gt 0707 Para el caso de reconocimiento de senales EMG se ha considerado que la informaci6n relevante esta contenida en 50 componentes para efectos de reconocimiento delos diferentes movimientos La Tabla II muestra parte de la matriz de correlaci6n (12 primeras componentes) calculada para la base de datos

1 2 3 4 5 6 7 8 9 10 11 12

TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACION 2 3 4 5 6 7 8 9 10 11 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de revisar lamatrizde coeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pij lt 0707por 10cual se puede decir que no estan altamente correlacionados y en consecuencia puede concluirsemiddot que las caracterlsticas pueden ser consideradas independientes La parte de discriminacion esta conformada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizaci6n del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripci6n de cmintas capas tiene el numero de neuronas en cada capa la funcion de transferencia decada capa y c6mo se interconectan ellas entre sf La topologia dela red MLP tiene diferentes capas (ver 0) la capade entrada (N) una capa oculta (M) y una capa de salida (1) La capa de salida tiene tantas neuronas como el nfunero de movimientos a desarrollar

EI proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validaci6n y (iii) verificaci6n Las tres (3)bases de datos fueroncreadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

Vector de En1rtdas

Capade Capa Entrada Oculta

Fig 5 Arquitectum de la red neuronal

TABLA III DISTRIBUCION DE DATOS PARA EL APRENDIZAJE DEL MODELO

MLP

I I I

Movimiento Ejemp Entr Verlf ValL REposo 6000 3600 1500 900 APERTURADE MANO

750 450 188 1I2 I

CIERREDE MANO 750 450 188 1I2 FLEXION DE MuNECA

625 375 156 94

i EXTENSION DE MuNECA

625 375 156 94

PRONACION 625 375 156 94 SUPINACION

TOTAL 625 10000

375 6000

156 2500

94 1500 I

105

II

Las pruebas de entrenamiento y validacion se hicierona partir de las bases de datos de trabajo normalizadas ejecutando el programa de entrenamiento de MLP con base en el algoritmo BP

Se realizaron 5 pru~pas para diferentes valores del numero de neurodos de la capa oculta (M) tOl unmiddotminimo de iteraciones de 1000 variando el valor de Mdesde 30 hasta 100 en pasos de 5 A medida que se ejecuta 61 algoritmo de entrenamiento se va evaluando el error de vaHdpoundcion quedando registrada la iteracion para la que se obtiene ~I minimo valor asi como los correspondientes valores de la red El algoritmo se ejecuta

shyhasta que se alcance el numero de iteraciones especificado 0

se logre reducir el error t9tal po debajo del ~nimo preestablecido (0005)

Los valores de los errores mlmmos de entrenamiento y validacion son fundamentalesmiddot cQmo medida para deterrninar el grado de aprendizaje de lalt red y permiten deterrninar el punto a partir del cualla red empieza a memorizar mas que a aprender Se hace tambien necesario prQ9~r la red luego de haber sido entrenada para esto se hace USa de la base de datos de verificacion la cual se pasa a traves de la red neuronal para determinar el porcentaje de aciertos en el reconocimiento de los movimientos dando lugar a la llamada matriz de confusion3

bull

Con base en estos criterios se determinaron las matrices de confusion tanto para entrenamiento como para verificaci6n en cada una de las pruebas realizadas y se concluye que el numero optimo de neurodos para la capa intermedia M en nuestro caso es de 75

3 CONCLUSIONES El amllisis de correlacion de caracteristicas debe hacerse antes de entrenar la red para saber si hay dependencia entre las componentes frtcuenciales

Los valores de los errores mmlmos de entrenamiento y validacion son fundamentales como medida para determinar el grado de aprendizaje de la red especialmente en el punto a partir del cual puede considerarse que la red empieza a memorizar mas que a aprender

Al realizar varias iteraciones se puede escoger el vector de pesos mas adecuado superando el problema de los minimos locales propio del algoritmo de entrenarniento de BP

4 TRABAJO FUTURO Para la openicion en tiempo real [4] se propone que este procedimiento se implemente sobre un procesador digital de senales (ADSP-21061) el cual operara sobre el conjunto de pesos obtenidos gracias a la red y de esta forma poder desarrollar una interfaz electronica que reciba identifique y procese las senales mioelectricas del brazo y ademas que

3 se forma comparando las salidas reales de la red con las salidas deseadas para todos y cada uno de los ejemplos de la base de verificaci6n

controle los movimientos hasicos que se asemejen a los naturales perrnitiendo a su vez ser adaptada al interior de una protesis e1ectromecanica de mano demostrando la efectividad del sistema para pacientes amputados a la altura del tercio proximal (antebrazo) con criterios de viabilidad economica y optimo uso energetico para su funcionamiento EI prototipo planteado presenta la arquitectura de la O

Seihlde los eledloclos

Catr~l5or

~ Digital

I I

Fig 6 Diagrama esquematico de una interfaz para una protesis mioeleclrica

REFERENCIAS [1] Kaduhiko Nishikwa Katsutoshi Kuribayashi Neural

Network Application to a discrimination system for controlled prostheses IEEEIRSJ International Workshop on Intelligent Robots and Systems nov 1991

[2] Adrian del Boca Dong C Park Myoelectric signal recognition using fuzzy clustering and artificial neural networks in real time IEEE Transactions on Biomedical Engineering jun 1990middot

[3] Looney Carl G Pattern recognition using neural networks Theory and algorithms for engineers and scientists Oxford University Press 1997

[4] Embrec Paul C++ Algorithms for Real Time DSP Prentice Hall 1999

[5] Alan V Oppenheim et al j Discrete Time Signal Processing Prentice Hall 1999

AUTORES Ingeniero Victor Hugo Grisales Opta por el master en e1ectrica en la Universidad de los Andes Profesor de tietnpo completo en la Universidad Distrital Director del grupo I+D en instrumentacion y control

Carlos Sanchez Fernando Rosas Vladimir Barrero Juan Leon Estudiantes de ultimo semestre de Ingenieria Electronica en la universidad Distrital FIDC Miembros

Estudiantiles del IEEE

106

ANALISIS ACUSTICO EN LA CLASIFICACION DE SENALES DE VOZ EMPLEANDO RNA

German Castellanos (gcastel1ieeeorg) Francisco Vargas (pcinevadomanizalesunaleduco) Grupo de Control y Procesamiento Digital de Senales - Universidad Nacional de Colombia - Sede Manizales

Resumen Se presenta un sistema de clasificaci6n desefiales de voz basado en sus caracteristicas acusticas el cual se ha dividido en tres partes obtencilm del ensamble inicial de caracterizaci6n acustica de la voz basandose en tecnicas de proceso digital de senales en tlempo real reduccion hasta elmenor ensamble de parametros representativos y suficientemente discriminantes de las clases basandose en tecnlcas estadisticas y por ultimo la construction de las reglas de decisi6n para clasificacion de senales de voz que pueden ser basadas en el empleo de redes neuronales EI sistema rue probado en la clasificaci6n devoz de acuerdo al sexo y edad de los hablanies y como resultado se determinan sus caracteristicas acusticas mayormente influyentesmiddot Ademas esta orieiltado a la tipificacion de norinalidad 0 alteraci6n de las direrentes clases de voz Para el presente trabajo rueronmiddot evaluadas las redes multi-capa y los mapas auto-organizatlvos de Kohonen

L INTRODUCCI6N

En la evaluacion de la voz la metodologia perceptual caracterizada por Ia calificacion de las cualidades vocales segUn el juicio experto de un sujeto necesita habilidades refinadas de escucha EI empleo de tecnologias digitales permite evaluar de manera objetiva la acustica y fisiologia del fenomeno Durante el proceso de evaluacion objetiva de voz normal 0 alteradaes necesario determinar sus caracteristicas cualitativas como es el caso del couelato acustico timbre aspero la emision con quiebres el ataque vocal duro (fmal de frase abortado) voz hiponasalizada y ruido acoplado para lograr muestras que sean altamente fieles alemisor El empleo de sistemas computarizados de anaIisis acustico de voz provee la posibilidad de percibir elementos dificiles de registrar mediante la observacion sUbjetiva convencional

EI uso de caracteristicas acusticas (CA) en la descripcion de normalidad 0 alteracion de voz ha sido probado en VallOS

contextos y con diferentes objetivos por cuanto perrniten ponderar cualitativamente las propiedades de la voz dificilmente realizable por otros metodos [123] Aunque se han Ilevado a cabo estudios de correlacion de estas caracteristicas con la metodologia perceptual sus resultados ademas de ser ambiguos a veces pueden ser contradictorios en el analisis de tipicidad (normalidad) 0 diferentes alteraciones de las senalesmiddot de voz De tal manera que la seleccion

-apropiada de la medida de las CA y su interpretacion sigue siendo un problema sin solucion

parametros representativos de cada clase se realiza el preproceso de los CA sobre los cuales se construye el ensamble inicial de caracterizacion acustica de voz La Seleccion del ensamble efectivo se realiza mejorando la efectividad de empleo de cada uno de los CA para 10 cual se analizan los criterios discriminatorios de correlacion e informacion mutua Finalmente la reduccion de la dimensionalidad de ensamble se realiza por el metoda de las componentes principales Una vez extraidos los parametros necesarios para la caracterizacion de la voz se resuelve la clasificacion de la voz en el tipo normal y no normal (con alteraciones )

MtltJ~ llbIUtl IHlttmllJgt

Fig 1 Diagrama de bloques reconocimiento de palrones de senales de voz

EI reconocimiento de patrones de senales de voz se puede dividir en dos procesosmiddot fundamentales como se aprecia en la figura Imiddot el entrenamiento que comprende la extraccion y seleccion del con junto de caracteristicas acusticas (id iE(I Ni) que representan cada clase de voz kE(lK) y la toma de decisiones que realiza la clasificacion por algun principio discriminante

EI tipo de reconocimiento empleado en el presente trabajo es una derivacionmiddot de lamiddot metodologia propuesta en [22] compuesta de dospartes hasicas a) Extraccion y Seleccion del ensamble efectivo de CA por clase b) el ensamble efectivo de CA es tornado como entrada de una RN usada en calidad de clasificador que en el caso particular fue del tipo backpropagation Asi fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen

2 ENSAMBLE DE CARACTERIZACI6N INICIAL ACUSTICA DE VOZ

La caracterizacion de la voz requiere de un elevado nUmero Elanalisis acustico de un sonido articulado consiste en de valores de CA En el articulo se presentan algoritmos de determinar los indicadoresfisicos de las vibraciones que 10 estimacion en tiempo real para los principales CA que en constituyen tales como la frecuencia la intensidad la general son muy sensibles a las condiciones acusticas de composicion espectral las variaciones del sonido modificadas tnedida [4] Para aumentar la efectividad en el uso de los por la resonancia que actuan originando el producto sonoro

107

que permite predecir la proXima muestra como una percibido [56] La seleccion de parametros que caracterizan

combinacion lineal de las anteriores [10] la voz es tal vez la etapa mas importanteen el desarrollo de sistemas automatizados de su proceso Uno de los principales y(n)=-taky(n-k) (2)problemas en el analisis de las CA de voz consiste en que la mayoria de eUos son sensibles a diferentes condiciones de

k=l

donde q es el orden del predictor y ak son los coeficientes de medicion Este factor conlleva a escoger el ens amble de prediccion lineal (LPC) Los coeficientes ak pueden ser parametros acusticos que brinde la mejor estimacion de determinados a partir del calculo de coeficientes demiddot irregularidad y perturbacion para la clasificacion y autocorrelacion De esta manera se tendcln q coeficientes de reconocimiento de senales de voz En general toda CA de prediccion lineal por cada trama de la senal de voz Tambien amilisis debera cumplir con las siguientes propiedades [6] a) es habitual aplicar el calculo de los coeficientes LPC Debe ser facilmente estimable y 10 menos dependientes de las cepstrales (Ia transformada de Fourier inversa del espectro de perturbaciones ambientales b) Su estimacion debe ser estable amplitud logaritmico) que representan la respuestaen el tiempo y c) No debe ser imitable Las CA pueden ser aproximadamente logaritmica 0 psofometrica del oido agrolJados de acuerdo a las propiedades acusticas que deben humano Los coeficientes LPC cepstrales Ck presentan la medir y los cuales en la practica se asocian en dos categorias ventaja de convertir el ruido convolucional en ruido aditivo y [7] permiten separar la excitacion glotal de los parametros del

tracto vocal Seguidamente se emplea un tipo de ventaneo que a) Parametros cuasiperiodicos Son disenados para la acentue los pesos de los LPC cepstrales con el objeto de captura de varias fonnas de periodicidad de las obtener mayor discriminacion de la envolvente espectral perturbaciones en la senal aclistica Entre los principales

parametros de este gropo estan b) Parametros de perM-bacion Destinados a medir la componente relativa de ruido en la senal de voz Para la

La Frecuencia Fundamental (Fo) que es referida a las estimacion de las perturbaciones de los parametros de la caracteristicas de cuasiperiodicidad de la senal en el tiempo frecuencia fundamental es comun el empleo del promedio Los diferentes metodos de estimacion del calcul0 del Fo relative de perturbacion (RAP Relative Average Perturbation) fueron analizados y comparadosen [S] por tiempo de proceso

definido como [1311] y precision obteniendose que el metodo (AMDF Magnitude Difference Function) [69] es mas veloz cuyo algoritmo esta

dado por iJ n z=(tIZH +z Zi+l -Zi llLRAP 1=1 3 1=1

AM(km)= (3) siendo n es el numero de ciclos consecutivos analizados 1 m

- Lly(n)- y(n-k)w(m-1t) Cuando el panimetro de perturbacion z se refiere al periodo N n=m-N-l) de la frecuencia fundamental se define el Jitter mientras que

en el caso de su amplitud se define el Shimmer [14] EI nivel (1) de perturbaciones tambien puede ser caracterizado por elDonde yen) es la senal digitalizada de voz wen) es la ventana

de proceso con longitud N m es el numero de muestras armonico ruido H 0 energia promedio del ruido de fondo ij(t) empleadas en la estimacion k es el retraso para el cual se esta que se determina como

Tcalculando el AMDF H = 11Jr((r)ciT (4a)

Los formantes En el espectro de una senal de voz se o encuentran regiones de enfasis (Uamadas resonancias) y de donde 1E [01] El componente de ruido N se defme como la deenfasis (antiresonancias) [9] ambas resonancias diferencia de energias de la senal de informacion y del denominadas formantes que siguen patrones comunes en la armonico ruido mayoria de los humanos determinadas basicamente por sus medidas antropometricas [101112] En la practica se nT analizan 5 fonnantes (FI F2 F3 F4 F5) junto con sus N = LJ[yj (1 )-11(1)]2 dT (4b)respectivos anchos de banda (LlWI LlW5Y los cuales se

=1 0 definen como el gropo de frecuencias que hay desde la caida a

donde 1E[O1] Finalmente el armonico ruido se determinposterior y anterior de 3 dB La energia del formante sera el como HNR=HIN Para aplicaciones profesionales la energia

valor del pica y el valor del formante la frecuencia donde se se determina por la diferencia entre la energia de la emision

encuentre el pica anterior [11] La estimacion de los vocal y la energia del ruido ambiente dado por formantes se realizo sobre algoritmos basados en la

suposicion de que la voz puede ser representada por modelos II

P(n) = -1

Ly2 (i) (4c)en fonnadeun numero reducido de indicadores a partir de n 1=1los cuales es posible su reconstruccion adecuada Para esto se S

donde n es el numero de puntos de la senal y(t) OlrD empleantecnicas de prediccion lineal basadas en el a

parametros analizados son la Energia de nlido normalizadmodel ado deltracto vocal mediante un filtro de solo polos (NNE) que ha sido estudiada en varios contextos [71415] Y

108

la excitaciim g16tica a ruido (GNE) estima el ruido en un tren el proceso de medicion influencia de fuertes perturbaciones de pulsos que es tipicamente generado por la oseilacion de los etc En este caso el valor anomalo del arreglo se expresa pliegues de voz [3] mediante el valor critico de la distribucion de Student fp n-2

La cantidad de CA N de representaci6n de voz t es [1717] completado por la primera (parametros delta) y segunda derivada (delta-delta) en el tiempo de los LPC cepstrales [6] y I e- In I[J s Ipn_] (n-I )112I(n-2+(lpnd)lf2 (5) debe realizarse para cada una de los tipos de senales de voz a clasificar Realmente cada CA puede influir de diferente siendo JIll yO respectivamente la media y varianza del manera en la pronunciaci6n de cada palabra En la practica de valor extremo en analisis del arregl0 I p es el nivel de la fonoaudiologia es comllo el empleo de palabras claves 0 significacion A efectos de comparaci6n de las realizaciones maestras En el caso particular se cada muestra fue tomada de losdiferentes parametros acusticos es preferible su basados en la pronunciaci6n de las cinco vocales estandarizacion estadistica Asi

Cabe anotar que el reconocimiento de senales de voz debe (6)~I =(i- mJ)O realizarse en linea por 10 que los algoritmos de proceso deben estar orientados a su desarrollo en tiempo real Los metodos empleados de estimacion de cada caracteristica fundamentalmente empleando metodos de amiJisis en acustica exigen la verificacion de hipotesis de la intervalos de tiempo cortos de los segmentos de voz los homogeneidad la cual se lleva a cabo por el criterio i y en cuales se analizan en [616] casos extremos se emplea el metoda Kolmogorov-Smirnov

[IS] Si laverificacion muestra claramente la invalidez de la hipotesis de gaussividad es importante determinar el tipo de

3 SELECCION DEL ENSAMBLE EFECTNO distribucion de fdp para cada ensambleI y si es posible la forma de su transformacion a la normal La transformacion de

La extraccion de CA se realiz6 acorde a los algoritmos la variable [Jj en sect con distribucion nonnalizada se determina presentados en anteriormente Asi se escogio un conjunto de de la relacion caracteristicas acusticas UiI i= I bullN que representan cada dase de voz k= I $ El sistema automatizado de extraccion ~

de parametros calcula 20 CA para cada una de las cinco ~21C1_ J e_2 dt =Lr M ji(Aji-1 lt Sjlt Aji) voeales (aIlellillollul) pronunciadas en la emision de voz a __ =1 N analizar Como resultado se obtuvo un valor de Nr I 00 para

j

(7)una sola emision de un paciente dado En cuanto a los grupos de clasificaci6n se definieron los siguientes a) Hombre

donde ~gve es el ens amble real de 0 res el nlimero relativo Adulto k=l b) Hombre Nino k=2 c) Mujer Adulta k=3 y d)

de intervalos delhistograma AJi Aji son los valores extremos Mujer Nina y k=4

del intervalo i del histograma del parametro 01 ~ es la frecuencia de ocurrencia en cada intervalo del intervalo i Una

Las estimacion de las CA de voz e es muy sensible a forma empirica alterna de ajuste consiste en la transformacion

faetores tales como las condiciones acusticas de toma de de cada CA 0(1) por diferentes operaciones basicas y

senales (ruido de fondo hardware de registro electronico comunmente empleadas en el tratamiento de voz

tiempo del dia en que se Ie toman las muestras al paciente contenido de las palabras etc) por 10 que la primera tarea a

~(I)=lg((I)plusmna) I01 c(1)=lg(aplusmn (I)(I) resolver en su clasificacion usualmente es el preproceso de

~(I)=1((1)110datos de las realizaciones que esta orientado a aumentar la efectividad en el uso de los parametros representativos de cada clase De otra parte la cantidad de realizaciones 0 Despues de cada transformacion se realiza la prueba i y se

toma aquella operacion que con mayor certeza confirme la ensamble N determina las limitaciones en la eleccion del hipotesis de gaussividad En general para cada []jk se puede metodo de preproeeso en particular se debe evitar el efecto tener una transformacion diferente [23] de valores extremos de ensamble muy pocas realizaciones 0

sobrevaluacion del ensamble [17] Las CA estan construidas La seleccion del ensamble efectivo de los rasgossobreestimaciones por 10 que es importante tener discriminantes constituye el aspecto fundamental en uninformacion sobre la fdp (0 su familia) para la cual se sistema de reconocimiento de patrones Las propiedades que calculan sus momentos Por este motivo el ensamble de deben cumplir las CA para su selecci6n son las siguientes prueba Ne se escogi6 de acuerdo al minima numero de

realizaciones que se deben tener para verificacion de Capacidad discriminante Es decir que separen 10 mashipotesis que para valores dados del nivel de significacion nitidamente posible las clases existentes P 01 Yun error de 10 obteniendose N90 muestras por Confiabilidad Esto es los objetos de una misma clase clase [17] deberan presentar la menor dispersion posible Ausencia de correlacion Es decir evitar en 10 posible la La siguiente etapa en el preproceso de datos esta enla utilizacion de caracteristicas que dependan fuertemente eliminacion de datos anomalos debidos a posibles errores en entre si

109

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 7: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

de umi afinacion empirica basada en el conocimiento de la pblnta

Figura No17middot

Al aplicar la estrategia de control por modelo inverso especializado se vio que la respuesta al escalon fue buena sin embargo esto depende del nfunero y calidad de patrones con quese entrene ademas de requerir un nuevo aprendizaje ante cambios severos en las condiciones de trabajo de la planta Esto se puede evidenciar ante la respuesta al disturbio al cambiar las condiciones de la planta el controlador neuronal no pudo llevar el sistema al punto de referencia deseado mientras que los olros dos controladores si 10 10graron

REFERENCIAS

[CASTRO 01] CastroT Orlando Giraldo H Norma Implemtacion de un sistema de control utilizando redes neuronales artificiales por modelo inverso especializado de la planta Colombia Cali Universidad del Valle Tesis de pregrado 2001

[EBERHART 90] Russell C Eberhart Roy W Dobbins Neural Network PC Tools A practical guide 1990

[GOLD BERT 001 GOLBERT Harold What is Virtual Instrumentation IEEE Instrumentation amp Measurement Magazine Diciembre 2000

[HUNT 92] HUNT K J SBARBARO D ZBIKOWSKI R GAWTHROP P J Neural Networks for Control System - A survey Automatica Vol 28 No6

[MANDANI 74] MANDANI EH Applications of Fuzzy algorithms for control ofsymple dynamic plant Proc IEEE 121 (12) 1585 - 15880974)

102

EXTRACCION DE CARACTERiSTICAS RELEVANTES Y RECONOCIMIENTO DE SEN-ALES EMG MEDIANTE UNA RED NEURONAL TIPO PERCEPTRON

MULTICAPA

Victor Grisales (vhgrisalesateneaudistritaleduco) Carlos Sanchez (CarlosAndresieeeorg) Fernando Rosas (FernandoRosasieeeorg) Vladimir Barrero (vbarreroieeeorg) Juan Leon (ipleonieeeorg)

GIDIC - Grupo de Investigacion y Desarrollo en Instrumentacion y Control Universidad Distrital FJDC - Facultad de Ingenieria - Departamento de EIectronica

Bogota - Colombia 200 I

Resumen Este articulo presenta la metodologia para el entrenamiento y valida cion de redes neuronales tipo perceptron multicapa (MLP) mediante un caso de estudio de reconocimiento

de seiiales mioelectricas (EMG) del brazo de un paciente sanD de 3 aiios mediante la utilizaci6n del algoritmo de BackshyPropagation (BP) Se utilizan bases de datos que presentan la relacionexistente entre el espectro de potencia de una senal mioelectrica (a traves de la FFT) y el desarrollo deseado por el paciente sobre las cuilles se aplican (ecnicas de ingenierfa neural para la depuracion de datos Se realiza entrenamiento verificacion y validacion de la redAdemas para la operacion en Ciempo real se propone el desarrollo de una interfaz electronica sobre un procesador digital de senales (ADSP-21061

Palabras claves PrOtesis de miembro superior Senal electromiografica Red Neuronal Artificial Analisis de correlacion Ingenieria neural

1 INTRODUCCION Por muchos anos ha existido la meta en bioingenieria de disenar una protesis controlada a partir de las senales

mioelec-tdcas del brazo para poder ser usada en los pacientes amputados Eneste articulo se presenta la metodologia para la apropiada discriminaci6n de la senal mioelectrica la cual simplemente representa el deseo del paciente para ejecutar cualquier clase de movimiento Apoyados en diferentes investigaciones al respecto [12] tenemos la hipotesis de que la informacion debe ser extraida a

traves deelectrodos de superficie en 4 puntos especiales del brazo

I

Se trata en primera instaneia la adquisicion de las senales mioelectricas junto con la seleccion de caracteristicas relevantes de los movimientos la creacion de bases de datos para el entrenamiento verificacion y validacion de la red

n~uronal y la determinacion del nfunero optimo de neurodos ocultos de la red para efectos de reconocimiento [3] Se realizan diversas pruebas de software considerando el porcentaje de acierto de la red y se realiza un analisis de relevancia con miras a una reduccion de la dimension del vector de entrada

2 PROCEDIMIENTO La red neuronal es utilizada en este sistema para aprender la relacion entre el espectro de potencia de la senal EMG y la

1 Miembro de 1a poderosa familia SHARCreg de procesadores de pUnto flotante de 32 bits)l

actuacion deseada por las personas incapacitadas La red puede diferenciar 7 movimientos de las diferentes seiiales EMG Este sistema esta compuesto por dos partes adquisicion y discriminacion de las senales

21 Parte de adquisici6n La parte de adquisicion consta de electrodos preamplificados de la empresa Delsys los cuales estan disenados con una ganancia de 1000vv y con un fiItro pasabanda de 20-450 Hz Ellos usan la geometria de contacto de barra paralela para asegurar la estabilidad de la senal y la repeticion fiel entre las grabaciones Debe evitarse un contacto pobre entre los electrodos y la piel ademas que se debe buscar la forma de sujetarlos fuertemente Debido a que una posicion inadecuada genera una senal diferente se busca conservar siempre la misma posicion de los electrodos Se trabaj6 con la seccion proximal del brazo y los electrodos se manejaron en forma de anillo utilizando cuatro electrodos uno frente at otro (ver Fig 1) Yun electrodo adicional como referencia

Flenie Fspalila

Localliacion de los electrodos Fig I Descripcion de la localizacion de los electrodos en el brazo del

paciente sano

Dadas las estrategias de entrenamiento de la red se debe definir la forma como estaran compuestas las bases de datos de acuerdo a las diferentes combinaciones en la posicion de los electrodos

De tal forma que si los electrodos se miden con respecto a un punto comtm de referencia se obtienen cuatro mediciones

103

(Oa) Al igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con referencia COlttUltrshy

(

~JP- I ~~_O~[f

(a)

Medicion de voltaje diferencial

fjmiddot ~~Jjl

or- t~Rfr~~~

(b) Fig 2 Localizacion de los electrodos

22 Parte de discriminacion Las seiiales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extension de la muneca pronacion supinacion apertura y

cierre de la mano

~E1E-l o m lID all mo 1000 1210

(b) Flexion de h mlliieca

0112 1 I o 21D lID EIlO mo lIDO 1210

(c) Reposo

Fig 3 Senales e1ectromiograficas

La senal mioelectrica es no periodica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amllisis de Fourier (algoritmo FFT) El espectro de potencia de la senal EMG (ver O)representa una distribucion continua como funcion de su frecuencia

Para la creacion de las bases de datos de trabajo se tomaron como entradas de Ia red neuronal numerosos ejempIos de movimientos incluyendo el reposo a partir de Ia segmentacion de la senal EMG en ventanas de tiempo de aproximadamente 64 ms (l024 muestras a una frecuencia de muestreo de 16 Khz)

)l ~ 1 D 11]] 20J 3D lID SIl all

(a) Apertura de Mano

l j D 11]] 21ll 3D lID SIl all

(II) Flexionde hmlliieca ror---------~--~~---T-----r----

III

3J

2l

10 Dl I D IIll 21ll 3JD IDD roD 6DII

(e) Reposo

Fig4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciaIes junto con las respectivas salidas que confonnan el vector objetivo de clasificacion (Target2

) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen el mismo numero de muestras porque estadisticamente ellos no tienen Ia misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla I)

TABLAl DISTRIBUCI6N DE LOS MOVIJvtIENTOS

J 1 REPOSO 60

Jz APERTURA DE MANO 75

J3 CIERRE DE MANO 75

J4 FLEXI6N DE LA MuNECA 625

J6 EXTENSION DE LA MuNECA 625

J 6 PRONACI6N 625

J SUPINACI6N 625

EI conjunto utilizado de caracteristicas parte de que e~ estos valores esta contenida esenciahnente Ia infonnacion para efectos de clasificaci6n de Ia senal EMG

Sin embargo resulta conveniente una comprobacion yo reduccion del espacio de caracteristicas mediante el analisis

de correlacion segim se explica a continuacion EI analisis de correlacion pennite detenninar Ia dependencia lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor masbajo ell orden de

2 donde las columnas almacenan valores 09 001 para indicar la pertenencia

o no pertenencia a la c1ase de movimiento que c0fesponda

104

irnportanciaEl analisis de correlacion de caiacteristicasparte del calculo de la correlacion y del coefici~nte decorrelaci6n asi 5i se considera un vector caracteristico de entradas X =

Xh xN con Ncaracteristicas la correlacionentre las caracteristicasi-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esta dada en (l)

cCor(Xx)=(IIQ) poundE(X~q)~p)(x(q)_p)(I)Y I J q=l I I J J

donde

E es el operador de valor esperado Xj(qj es el valor de la i-esima caracteristica del vector caracteristico X XV es el valor de la j-esima caracteristica del vector caracteristico X 1 es el valor esperado de la i-esima caracteristica sobre la poblacion de muestra de tamano Q flj es el valor esperado de la j-esima caracteristica sobre la poblacion de muestra de tamano Q

El coeficiente de correlacion estandarizado adimensional esta dado por (2)

~--

Pij =Cij ~(CiiCff) (2)

Esta ecuacion satisface la desigualdad de Cauchy-Sch-vartz quedando acotado el rango para Pij entre los valores-l y I

1 ~ ~j ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pij estara mas cercade cero (Cij 0) Para efectos de reducci6n del numero de entradas a la red neuronal se considera que dos caracteristicas esUin altamente correlacionadas en el caso en el que IPij gt 0707 Para el caso de reconocimiento de senalesEMG se ha considerado que la infonnacion relevante esta contenida en 50 componentes para efectos de reconocimiento de los diferentes movimientos La Tabla II muestra parte de la matriz de correlacion (12 primeras componentes) calculada para la base de datos

I 2 3 4 5 6 7 8 9 10 11 12

y TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACI6N 2 3 4 5 6 7 8 9 10 II 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de nvisar lamatm decoeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pijl lt 0707 por locualse puede decir que noestan altamente correlacionados y en consecuencia puede concluirse que las caracteristicas pueden ser consideradas independientes La parte de discriminacion esta confonnada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizacion del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripcion de cuantas capas tiene el nfunero de neuronas en cada capa la funcion de transferencia de cada capa y como se interconectan elIas entre sL La topologia de la red MLP tiene diferentes capas (ver 0) la capa de entrada (N) unacapa oculta (M) y una capa de salida (J) La capa de salida tiene tantas neuronas como el ntimero de movimientos a desarrollar

El proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validacion y (iii) verificaci6n Las tres (3) bases de datos fueron creadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

105

Vecrorde Entradas

Capade Entrada

Capa Oculta

Capade Salida

Fig 5 Arquiteclura de la red neuronal

TABLA III

11

DISTRIBUCI6N DE DATOS PARA EL APRENDlZAJE DEL MODELO MLP

Movimiento Ejemp Entr Verif ValL REposo 6000 3600 1500 900 APERTURADE 750 450 188 112 MANO CIERREDE MANO 750 450 188 112 FLEXI6NDE 625 375 156 94 MuNECA EXTENSI6N DE 625 375 156 94 MUNECA PRONACI6N 625 375 156 94 SUPINACI6N 625 375 156 94 TOTAL 10000 6000 2500 1500

(Oa) AI igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con Medicion de voltaje referenda COJltUlt clifureJlCial

r-shy

( r ___nlll ( ~____J1 ~ ~r t laquo -1 ~v- fL-Rtr

~_~__ _~_1)7II[f e-~---

(b) Fig 2 Localizaci6n de los electrodos (a)

22 Parte de discriminaci6n Las senales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extensi6n de la mufieca pronaci6n supinacion apertura y

cierre de la mano

~I2E~1a l]] ltOD 6D Em llJJJ Ilm

(a) Apertura de lobno

~~lo 2Il lID EIJl roo HIll =

(b) Flexion de ]a muiieca

oa r--~-----------------

nm l o 211l lID amp10 roo 111l[]

1210

(t) Reposo

Fig 3 Senales electromiograticas

La senal mioeIectrica es no peri6dica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amiHsis de Fourier (algoritmo FFT) El espec1ro de potencia de la senal EMG (vcr O)representa una distribucion continua como funci6n de su frecuencia

Para la creation de las bases de datos de trabajo se tomaron como entradas de la red neuronal numerosos ejemplos de movimientos incluyendo el reposoa partir de la segmentacion de la senal EMG en ventanas de tiempo de aproximadantente 64 ms (1024 muestras a una frecuencia de muestreo de 16 Khz)

~[ j [] VII 2Il m lID EIJl EIJl

(a) Apertura de Mana

l 1 [] VII 211l m lID EIJl EIJl

Ill 40

31

ill

ID []L

D

(b) Flexion de ]a muiieca

IIIl 211l 310 40D IlO Il[]

(c) Reposa

Fig 4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciales junto con las respectivas salidas que conforman el vector objetivo de clasificaci6n (TargeP) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen elmismo numero de muestras porque estadisticamente ell os no tienen la misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla nmiddot

TABLA I DlSTRIBUCION DE LOS MOVlMIENTOS

60REPOSOJ1 75APERTURA DE MANOJz

75CIERRE DE MANOJ3 625FLEXION DE LA MuNECAJ4 625EXTENSION DE LA MuNECAJ6

625PRONACIONJ 6

625SUPINACIONJ

El conjunto utilizado de caracterlsticas parte de que en estos valores esta contenida esencialmente la informaci6n para efectos de c1asificaci6n de la senal EMG

Sin embargo resulta conveniente una comprobacion yo reducci6n del espacio de caracteristicas medianteel analisis de correlacion segun se explica a continuaci6n EI analisis de correlaci6n permite determinar la dependencia

lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor mas bajo ell orden de

2 donde las columnas almacenan valores 09 6 01 pam indicar la pertenenci3

o no pertenencia a la c1ase de movimiento que co~esponda

104

inlportandaEl analisis de correlacion de caracteristicas parte del calculo de la correlacion y del coeficiente decorrelaci6n asi Si se considera un vector caracteristico de entfadas X = XhXN con Ncaracteristicas la correlaci6nentre las caracteristicas i-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esrn dada en (1)

Qc=Cor(XX)(lQ) L E(X~q)-Il)(x(q)_Ilmiddot)(I)

I I J q=l I I J J

donde

E es el operador de valor esperado Xi(q) es el valor de la i-esima caracterlstica del vector caracteristico X Xr) es el valor de la j-esima caracteristica del vector caraderlstico X ~i es el valor esperado de la i-esimacaracteristica sobre la poblacion de muestra de tamafio Q ~j es el valor esperado de la j-esima caracteristica sobre la poblaci6n de muestra de tamano Q

Elcoeficiente decorrelaci6n estandarizado adiinensional esta dado por (2)

Pij = Cij I ~r-(C-iiC-iJ-) (2)

Esta ecuacion satisface la desigmildadde Cauchy-Sch~artz quedando acotado el rango para Pj entre los valores-I y I

-1 ~ Pij ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pj estara mas cerca de cero (Cij 0) Para efectos de reduccion del nfunero de entradas a la red neuronal se considera que dos caracteristicas estan altamente correlacionadas en el caso en el que Pij gt 0707 Para el caso de reconocimiento de senales EMG se ha considerado que la informaci6n relevante esta contenida en 50 componentes para efectos de reconocimiento delos diferentes movimientos La Tabla II muestra parte de la matriz de correlaci6n (12 primeras componentes) calculada para la base de datos

1 2 3 4 5 6 7 8 9 10 11 12

TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACION 2 3 4 5 6 7 8 9 10 11 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de revisar lamatrizde coeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pij lt 0707por 10cual se puede decir que no estan altamente correlacionados y en consecuencia puede concluirsemiddot que las caracterlsticas pueden ser consideradas independientes La parte de discriminacion esta conformada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizaci6n del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripci6n de cmintas capas tiene el numero de neuronas en cada capa la funcion de transferencia decada capa y c6mo se interconectan ellas entre sf La topologia dela red MLP tiene diferentes capas (ver 0) la capade entrada (N) una capa oculta (M) y una capa de salida (1) La capa de salida tiene tantas neuronas como el nfunero de movimientos a desarrollar

EI proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validaci6n y (iii) verificaci6n Las tres (3)bases de datos fueroncreadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

Vector de En1rtdas

Capade Capa Entrada Oculta

Fig 5 Arquitectum de la red neuronal

TABLA III DISTRIBUCION DE DATOS PARA EL APRENDIZAJE DEL MODELO

MLP

I I I

Movimiento Ejemp Entr Verlf ValL REposo 6000 3600 1500 900 APERTURADE MANO

750 450 188 1I2 I

CIERREDE MANO 750 450 188 1I2 FLEXION DE MuNECA

625 375 156 94

i EXTENSION DE MuNECA

625 375 156 94

PRONACION 625 375 156 94 SUPINACION

TOTAL 625 10000

375 6000

156 2500

94 1500 I

105

II

Las pruebas de entrenamiento y validacion se hicierona partir de las bases de datos de trabajo normalizadas ejecutando el programa de entrenamiento de MLP con base en el algoritmo BP

Se realizaron 5 pru~pas para diferentes valores del numero de neurodos de la capa oculta (M) tOl unmiddotminimo de iteraciones de 1000 variando el valor de Mdesde 30 hasta 100 en pasos de 5 A medida que se ejecuta 61 algoritmo de entrenamiento se va evaluando el error de vaHdpoundcion quedando registrada la iteracion para la que se obtiene ~I minimo valor asi como los correspondientes valores de la red El algoritmo se ejecuta

shyhasta que se alcance el numero de iteraciones especificado 0

se logre reducir el error t9tal po debajo del ~nimo preestablecido (0005)

Los valores de los errores mlmmos de entrenamiento y validacion son fundamentalesmiddot cQmo medida para deterrninar el grado de aprendizaje de lalt red y permiten deterrninar el punto a partir del cualla red empieza a memorizar mas que a aprender Se hace tambien necesario prQ9~r la red luego de haber sido entrenada para esto se hace USa de la base de datos de verificacion la cual se pasa a traves de la red neuronal para determinar el porcentaje de aciertos en el reconocimiento de los movimientos dando lugar a la llamada matriz de confusion3

bull

Con base en estos criterios se determinaron las matrices de confusion tanto para entrenamiento como para verificaci6n en cada una de las pruebas realizadas y se concluye que el numero optimo de neurodos para la capa intermedia M en nuestro caso es de 75

3 CONCLUSIONES El amllisis de correlacion de caracteristicas debe hacerse antes de entrenar la red para saber si hay dependencia entre las componentes frtcuenciales

Los valores de los errores mmlmos de entrenamiento y validacion son fundamentales como medida para determinar el grado de aprendizaje de la red especialmente en el punto a partir del cual puede considerarse que la red empieza a memorizar mas que a aprender

Al realizar varias iteraciones se puede escoger el vector de pesos mas adecuado superando el problema de los minimos locales propio del algoritmo de entrenarniento de BP

4 TRABAJO FUTURO Para la openicion en tiempo real [4] se propone que este procedimiento se implemente sobre un procesador digital de senales (ADSP-21061) el cual operara sobre el conjunto de pesos obtenidos gracias a la red y de esta forma poder desarrollar una interfaz electronica que reciba identifique y procese las senales mioelectricas del brazo y ademas que

3 se forma comparando las salidas reales de la red con las salidas deseadas para todos y cada uno de los ejemplos de la base de verificaci6n

controle los movimientos hasicos que se asemejen a los naturales perrnitiendo a su vez ser adaptada al interior de una protesis e1ectromecanica de mano demostrando la efectividad del sistema para pacientes amputados a la altura del tercio proximal (antebrazo) con criterios de viabilidad economica y optimo uso energetico para su funcionamiento EI prototipo planteado presenta la arquitectura de la O

Seihlde los eledloclos

Catr~l5or

~ Digital

I I

Fig 6 Diagrama esquematico de una interfaz para una protesis mioeleclrica

REFERENCIAS [1] Kaduhiko Nishikwa Katsutoshi Kuribayashi Neural

Network Application to a discrimination system for controlled prostheses IEEEIRSJ International Workshop on Intelligent Robots and Systems nov 1991

[2] Adrian del Boca Dong C Park Myoelectric signal recognition using fuzzy clustering and artificial neural networks in real time IEEE Transactions on Biomedical Engineering jun 1990middot

[3] Looney Carl G Pattern recognition using neural networks Theory and algorithms for engineers and scientists Oxford University Press 1997

[4] Embrec Paul C++ Algorithms for Real Time DSP Prentice Hall 1999

[5] Alan V Oppenheim et al j Discrete Time Signal Processing Prentice Hall 1999

AUTORES Ingeniero Victor Hugo Grisales Opta por el master en e1ectrica en la Universidad de los Andes Profesor de tietnpo completo en la Universidad Distrital Director del grupo I+D en instrumentacion y control

Carlos Sanchez Fernando Rosas Vladimir Barrero Juan Leon Estudiantes de ultimo semestre de Ingenieria Electronica en la universidad Distrital FIDC Miembros

Estudiantiles del IEEE

106

ANALISIS ACUSTICO EN LA CLASIFICACION DE SENALES DE VOZ EMPLEANDO RNA

German Castellanos (gcastel1ieeeorg) Francisco Vargas (pcinevadomanizalesunaleduco) Grupo de Control y Procesamiento Digital de Senales - Universidad Nacional de Colombia - Sede Manizales

Resumen Se presenta un sistema de clasificaci6n desefiales de voz basado en sus caracteristicas acusticas el cual se ha dividido en tres partes obtencilm del ensamble inicial de caracterizaci6n acustica de la voz basandose en tecnicas de proceso digital de senales en tlempo real reduccion hasta elmenor ensamble de parametros representativos y suficientemente discriminantes de las clases basandose en tecnlcas estadisticas y por ultimo la construction de las reglas de decisi6n para clasificacion de senales de voz que pueden ser basadas en el empleo de redes neuronales EI sistema rue probado en la clasificaci6n devoz de acuerdo al sexo y edad de los hablanies y como resultado se determinan sus caracteristicas acusticas mayormente influyentesmiddot Ademas esta orieiltado a la tipificacion de norinalidad 0 alteraci6n de las direrentes clases de voz Para el presente trabajo rueronmiddot evaluadas las redes multi-capa y los mapas auto-organizatlvos de Kohonen

L INTRODUCCI6N

En la evaluacion de la voz la metodologia perceptual caracterizada por Ia calificacion de las cualidades vocales segUn el juicio experto de un sujeto necesita habilidades refinadas de escucha EI empleo de tecnologias digitales permite evaluar de manera objetiva la acustica y fisiologia del fenomeno Durante el proceso de evaluacion objetiva de voz normal 0 alteradaes necesario determinar sus caracteristicas cualitativas como es el caso del couelato acustico timbre aspero la emision con quiebres el ataque vocal duro (fmal de frase abortado) voz hiponasalizada y ruido acoplado para lograr muestras que sean altamente fieles alemisor El empleo de sistemas computarizados de anaIisis acustico de voz provee la posibilidad de percibir elementos dificiles de registrar mediante la observacion sUbjetiva convencional

EI uso de caracteristicas acusticas (CA) en la descripcion de normalidad 0 alteracion de voz ha sido probado en VallOS

contextos y con diferentes objetivos por cuanto perrniten ponderar cualitativamente las propiedades de la voz dificilmente realizable por otros metodos [123] Aunque se han Ilevado a cabo estudios de correlacion de estas caracteristicas con la metodologia perceptual sus resultados ademas de ser ambiguos a veces pueden ser contradictorios en el analisis de tipicidad (normalidad) 0 diferentes alteraciones de las senalesmiddot de voz De tal manera que la seleccion

-apropiada de la medida de las CA y su interpretacion sigue siendo un problema sin solucion

parametros representativos de cada clase se realiza el preproceso de los CA sobre los cuales se construye el ensamble inicial de caracterizacion acustica de voz La Seleccion del ensamble efectivo se realiza mejorando la efectividad de empleo de cada uno de los CA para 10 cual se analizan los criterios discriminatorios de correlacion e informacion mutua Finalmente la reduccion de la dimensionalidad de ensamble se realiza por el metoda de las componentes principales Una vez extraidos los parametros necesarios para la caracterizacion de la voz se resuelve la clasificacion de la voz en el tipo normal y no normal (con alteraciones )

MtltJ~ llbIUtl IHlttmllJgt

Fig 1 Diagrama de bloques reconocimiento de palrones de senales de voz

EI reconocimiento de patrones de senales de voz se puede dividir en dos procesosmiddot fundamentales como se aprecia en la figura Imiddot el entrenamiento que comprende la extraccion y seleccion del con junto de caracteristicas acusticas (id iE(I Ni) que representan cada clase de voz kE(lK) y la toma de decisiones que realiza la clasificacion por algun principio discriminante

EI tipo de reconocimiento empleado en el presente trabajo es una derivacionmiddot de lamiddot metodologia propuesta en [22] compuesta de dospartes hasicas a) Extraccion y Seleccion del ensamble efectivo de CA por clase b) el ensamble efectivo de CA es tornado como entrada de una RN usada en calidad de clasificador que en el caso particular fue del tipo backpropagation Asi fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen

2 ENSAMBLE DE CARACTERIZACI6N INICIAL ACUSTICA DE VOZ

La caracterizacion de la voz requiere de un elevado nUmero Elanalisis acustico de un sonido articulado consiste en de valores de CA En el articulo se presentan algoritmos de determinar los indicadoresfisicos de las vibraciones que 10 estimacion en tiempo real para los principales CA que en constituyen tales como la frecuencia la intensidad la general son muy sensibles a las condiciones acusticas de composicion espectral las variaciones del sonido modificadas tnedida [4] Para aumentar la efectividad en el uso de los por la resonancia que actuan originando el producto sonoro

107

que permite predecir la proXima muestra como una percibido [56] La seleccion de parametros que caracterizan

combinacion lineal de las anteriores [10] la voz es tal vez la etapa mas importanteen el desarrollo de sistemas automatizados de su proceso Uno de los principales y(n)=-taky(n-k) (2)problemas en el analisis de las CA de voz consiste en que la mayoria de eUos son sensibles a diferentes condiciones de

k=l

donde q es el orden del predictor y ak son los coeficientes de medicion Este factor conlleva a escoger el ens amble de prediccion lineal (LPC) Los coeficientes ak pueden ser parametros acusticos que brinde la mejor estimacion de determinados a partir del calculo de coeficientes demiddot irregularidad y perturbacion para la clasificacion y autocorrelacion De esta manera se tendcln q coeficientes de reconocimiento de senales de voz En general toda CA de prediccion lineal por cada trama de la senal de voz Tambien amilisis debera cumplir con las siguientes propiedades [6] a) es habitual aplicar el calculo de los coeficientes LPC Debe ser facilmente estimable y 10 menos dependientes de las cepstrales (Ia transformada de Fourier inversa del espectro de perturbaciones ambientales b) Su estimacion debe ser estable amplitud logaritmico) que representan la respuestaen el tiempo y c) No debe ser imitable Las CA pueden ser aproximadamente logaritmica 0 psofometrica del oido agrolJados de acuerdo a las propiedades acusticas que deben humano Los coeficientes LPC cepstrales Ck presentan la medir y los cuales en la practica se asocian en dos categorias ventaja de convertir el ruido convolucional en ruido aditivo y [7] permiten separar la excitacion glotal de los parametros del

tracto vocal Seguidamente se emplea un tipo de ventaneo que a) Parametros cuasiperiodicos Son disenados para la acentue los pesos de los LPC cepstrales con el objeto de captura de varias fonnas de periodicidad de las obtener mayor discriminacion de la envolvente espectral perturbaciones en la senal aclistica Entre los principales

parametros de este gropo estan b) Parametros de perM-bacion Destinados a medir la componente relativa de ruido en la senal de voz Para la

La Frecuencia Fundamental (Fo) que es referida a las estimacion de las perturbaciones de los parametros de la caracteristicas de cuasiperiodicidad de la senal en el tiempo frecuencia fundamental es comun el empleo del promedio Los diferentes metodos de estimacion del calcul0 del Fo relative de perturbacion (RAP Relative Average Perturbation) fueron analizados y comparadosen [S] por tiempo de proceso

definido como [1311] y precision obteniendose que el metodo (AMDF Magnitude Difference Function) [69] es mas veloz cuyo algoritmo esta

dado por iJ n z=(tIZH +z Zi+l -Zi llLRAP 1=1 3 1=1

AM(km)= (3) siendo n es el numero de ciclos consecutivos analizados 1 m

- Lly(n)- y(n-k)w(m-1t) Cuando el panimetro de perturbacion z se refiere al periodo N n=m-N-l) de la frecuencia fundamental se define el Jitter mientras que

en el caso de su amplitud se define el Shimmer [14] EI nivel (1) de perturbaciones tambien puede ser caracterizado por elDonde yen) es la senal digitalizada de voz wen) es la ventana

de proceso con longitud N m es el numero de muestras armonico ruido H 0 energia promedio del ruido de fondo ij(t) empleadas en la estimacion k es el retraso para el cual se esta que se determina como

Tcalculando el AMDF H = 11Jr((r)ciT (4a)

Los formantes En el espectro de una senal de voz se o encuentran regiones de enfasis (Uamadas resonancias) y de donde 1E [01] El componente de ruido N se defme como la deenfasis (antiresonancias) [9] ambas resonancias diferencia de energias de la senal de informacion y del denominadas formantes que siguen patrones comunes en la armonico ruido mayoria de los humanos determinadas basicamente por sus medidas antropometricas [101112] En la practica se nT analizan 5 fonnantes (FI F2 F3 F4 F5) junto con sus N = LJ[yj (1 )-11(1)]2 dT (4b)respectivos anchos de banda (LlWI LlW5Y los cuales se

=1 0 definen como el gropo de frecuencias que hay desde la caida a

donde 1E[O1] Finalmente el armonico ruido se determinposterior y anterior de 3 dB La energia del formante sera el como HNR=HIN Para aplicaciones profesionales la energia

valor del pica y el valor del formante la frecuencia donde se se determina por la diferencia entre la energia de la emision

encuentre el pica anterior [11] La estimacion de los vocal y la energia del ruido ambiente dado por formantes se realizo sobre algoritmos basados en la

suposicion de que la voz puede ser representada por modelos II

P(n) = -1

Ly2 (i) (4c)en fonnadeun numero reducido de indicadores a partir de n 1=1los cuales es posible su reconstruccion adecuada Para esto se S

donde n es el numero de puntos de la senal y(t) OlrD empleantecnicas de prediccion lineal basadas en el a

parametros analizados son la Energia de nlido normalizadmodel ado deltracto vocal mediante un filtro de solo polos (NNE) que ha sido estudiada en varios contextos [71415] Y

108

la excitaciim g16tica a ruido (GNE) estima el ruido en un tren el proceso de medicion influencia de fuertes perturbaciones de pulsos que es tipicamente generado por la oseilacion de los etc En este caso el valor anomalo del arreglo se expresa pliegues de voz [3] mediante el valor critico de la distribucion de Student fp n-2

La cantidad de CA N de representaci6n de voz t es [1717] completado por la primera (parametros delta) y segunda derivada (delta-delta) en el tiempo de los LPC cepstrales [6] y I e- In I[J s Ipn_] (n-I )112I(n-2+(lpnd)lf2 (5) debe realizarse para cada una de los tipos de senales de voz a clasificar Realmente cada CA puede influir de diferente siendo JIll yO respectivamente la media y varianza del manera en la pronunciaci6n de cada palabra En la practica de valor extremo en analisis del arregl0 I p es el nivel de la fonoaudiologia es comllo el empleo de palabras claves 0 significacion A efectos de comparaci6n de las realizaciones maestras En el caso particular se cada muestra fue tomada de losdiferentes parametros acusticos es preferible su basados en la pronunciaci6n de las cinco vocales estandarizacion estadistica Asi

Cabe anotar que el reconocimiento de senales de voz debe (6)~I =(i- mJ)O realizarse en linea por 10 que los algoritmos de proceso deben estar orientados a su desarrollo en tiempo real Los metodos empleados de estimacion de cada caracteristica fundamentalmente empleando metodos de amiJisis en acustica exigen la verificacion de hipotesis de la intervalos de tiempo cortos de los segmentos de voz los homogeneidad la cual se lleva a cabo por el criterio i y en cuales se analizan en [616] casos extremos se emplea el metoda Kolmogorov-Smirnov

[IS] Si laverificacion muestra claramente la invalidez de la hipotesis de gaussividad es importante determinar el tipo de

3 SELECCION DEL ENSAMBLE EFECTNO distribucion de fdp para cada ensambleI y si es posible la forma de su transformacion a la normal La transformacion de

La extraccion de CA se realiz6 acorde a los algoritmos la variable [Jj en sect con distribucion nonnalizada se determina presentados en anteriormente Asi se escogio un conjunto de de la relacion caracteristicas acusticas UiI i= I bullN que representan cada dase de voz k= I $ El sistema automatizado de extraccion ~

de parametros calcula 20 CA para cada una de las cinco ~21C1_ J e_2 dt =Lr M ji(Aji-1 lt Sjlt Aji) voeales (aIlellillollul) pronunciadas en la emision de voz a __ =1 N analizar Como resultado se obtuvo un valor de Nr I 00 para

j

(7)una sola emision de un paciente dado En cuanto a los grupos de clasificaci6n se definieron los siguientes a) Hombre

donde ~gve es el ens amble real de 0 res el nlimero relativo Adulto k=l b) Hombre Nino k=2 c) Mujer Adulta k=3 y d)

de intervalos delhistograma AJi Aji son los valores extremos Mujer Nina y k=4

del intervalo i del histograma del parametro 01 ~ es la frecuencia de ocurrencia en cada intervalo del intervalo i Una

Las estimacion de las CA de voz e es muy sensible a forma empirica alterna de ajuste consiste en la transformacion

faetores tales como las condiciones acusticas de toma de de cada CA 0(1) por diferentes operaciones basicas y

senales (ruido de fondo hardware de registro electronico comunmente empleadas en el tratamiento de voz

tiempo del dia en que se Ie toman las muestras al paciente contenido de las palabras etc) por 10 que la primera tarea a

~(I)=lg((I)plusmna) I01 c(1)=lg(aplusmn (I)(I) resolver en su clasificacion usualmente es el preproceso de

~(I)=1((1)110datos de las realizaciones que esta orientado a aumentar la efectividad en el uso de los parametros representativos de cada clase De otra parte la cantidad de realizaciones 0 Despues de cada transformacion se realiza la prueba i y se

toma aquella operacion que con mayor certeza confirme la ensamble N determina las limitaciones en la eleccion del hipotesis de gaussividad En general para cada []jk se puede metodo de preproeeso en particular se debe evitar el efecto tener una transformacion diferente [23] de valores extremos de ensamble muy pocas realizaciones 0

sobrevaluacion del ensamble [17] Las CA estan construidas La seleccion del ensamble efectivo de los rasgossobreestimaciones por 10 que es importante tener discriminantes constituye el aspecto fundamental en uninformacion sobre la fdp (0 su familia) para la cual se sistema de reconocimiento de patrones Las propiedades que calculan sus momentos Por este motivo el ensamble de deben cumplir las CA para su selecci6n son las siguientes prueba Ne se escogi6 de acuerdo al minima numero de

realizaciones que se deben tener para verificacion de Capacidad discriminante Es decir que separen 10 mashipotesis que para valores dados del nivel de significacion nitidamente posible las clases existentes P 01 Yun error de 10 obteniendose N90 muestras por Confiabilidad Esto es los objetos de una misma clase clase [17] deberan presentar la menor dispersion posible Ausencia de correlacion Es decir evitar en 10 posible la La siguiente etapa en el preproceso de datos esta enla utilizacion de caracteristicas que dependan fuertemente eliminacion de datos anomalos debidos a posibles errores en entre si

109

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 8: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

(Oa) Al igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con referencia COlttUltrshy

(

~JP- I ~~_O~[f

(a)

Medicion de voltaje diferencial

fjmiddot ~~Jjl

or- t~Rfr~~~

(b) Fig 2 Localizacion de los electrodos

22 Parte de discriminacion Las seiiales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extension de la muneca pronacion supinacion apertura y

cierre de la mano

~E1E-l o m lID all mo 1000 1210

(b) Flexion de h mlliieca

0112 1 I o 21D lID EIlO mo lIDO 1210

(c) Reposo

Fig 3 Senales e1ectromiograficas

La senal mioelectrica es no periodica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amllisis de Fourier (algoritmo FFT) El espectro de potencia de la senal EMG (ver O)representa una distribucion continua como funcion de su frecuencia

Para la creacion de las bases de datos de trabajo se tomaron como entradas de Ia red neuronal numerosos ejempIos de movimientos incluyendo el reposo a partir de Ia segmentacion de la senal EMG en ventanas de tiempo de aproximadamente 64 ms (l024 muestras a una frecuencia de muestreo de 16 Khz)

)l ~ 1 D 11]] 20J 3D lID SIl all

(a) Apertura de Mano

l j D 11]] 21ll 3D lID SIl all

(II) Flexionde hmlliieca ror---------~--~~---T-----r----

III

3J

2l

10 Dl I D IIll 21ll 3JD IDD roD 6DII

(e) Reposo

Fig4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciaIes junto con las respectivas salidas que confonnan el vector objetivo de clasificacion (Target2

) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen el mismo numero de muestras porque estadisticamente ellos no tienen Ia misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla I)

TABLAl DISTRIBUCI6N DE LOS MOVIJvtIENTOS

J 1 REPOSO 60

Jz APERTURA DE MANO 75

J3 CIERRE DE MANO 75

J4 FLEXI6N DE LA MuNECA 625

J6 EXTENSION DE LA MuNECA 625

J 6 PRONACI6N 625

J SUPINACI6N 625

EI conjunto utilizado de caracteristicas parte de que e~ estos valores esta contenida esenciahnente Ia infonnacion para efectos de clasificaci6n de Ia senal EMG

Sin embargo resulta conveniente una comprobacion yo reduccion del espacio de caracteristicas mediante el analisis

de correlacion segim se explica a continuacion EI analisis de correlacion pennite detenninar Ia dependencia lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor masbajo ell orden de

2 donde las columnas almacenan valores 09 001 para indicar la pertenencia

o no pertenencia a la c1ase de movimiento que c0fesponda

104

irnportanciaEl analisis de correlacion de caiacteristicasparte del calculo de la correlacion y del coefici~nte decorrelaci6n asi 5i se considera un vector caracteristico de entradas X =

Xh xN con Ncaracteristicas la correlacionentre las caracteristicasi-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esta dada en (l)

cCor(Xx)=(IIQ) poundE(X~q)~p)(x(q)_p)(I)Y I J q=l I I J J

donde

E es el operador de valor esperado Xj(qj es el valor de la i-esima caracteristica del vector caracteristico X XV es el valor de la j-esima caracteristica del vector caracteristico X 1 es el valor esperado de la i-esima caracteristica sobre la poblacion de muestra de tamano Q flj es el valor esperado de la j-esima caracteristica sobre la poblacion de muestra de tamano Q

El coeficiente de correlacion estandarizado adimensional esta dado por (2)

~--

Pij =Cij ~(CiiCff) (2)

Esta ecuacion satisface la desigualdad de Cauchy-Sch-vartz quedando acotado el rango para Pij entre los valores-l y I

1 ~ ~j ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pij estara mas cercade cero (Cij 0) Para efectos de reducci6n del numero de entradas a la red neuronal se considera que dos caracteristicas esUin altamente correlacionadas en el caso en el que IPij gt 0707 Para el caso de reconocimiento de senalesEMG se ha considerado que la infonnacion relevante esta contenida en 50 componentes para efectos de reconocimiento de los diferentes movimientos La Tabla II muestra parte de la matriz de correlacion (12 primeras componentes) calculada para la base de datos

I 2 3 4 5 6 7 8 9 10 11 12

y TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACI6N 2 3 4 5 6 7 8 9 10 II 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de nvisar lamatm decoeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pijl lt 0707 por locualse puede decir que noestan altamente correlacionados y en consecuencia puede concluirse que las caracteristicas pueden ser consideradas independientes La parte de discriminacion esta confonnada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizacion del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripcion de cuantas capas tiene el nfunero de neuronas en cada capa la funcion de transferencia de cada capa y como se interconectan elIas entre sL La topologia de la red MLP tiene diferentes capas (ver 0) la capa de entrada (N) unacapa oculta (M) y una capa de salida (J) La capa de salida tiene tantas neuronas como el ntimero de movimientos a desarrollar

El proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validacion y (iii) verificaci6n Las tres (3) bases de datos fueron creadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

105

Vecrorde Entradas

Capade Entrada

Capa Oculta

Capade Salida

Fig 5 Arquiteclura de la red neuronal

TABLA III

11

DISTRIBUCI6N DE DATOS PARA EL APRENDlZAJE DEL MODELO MLP

Movimiento Ejemp Entr Verif ValL REposo 6000 3600 1500 900 APERTURADE 750 450 188 112 MANO CIERREDE MANO 750 450 188 112 FLEXI6NDE 625 375 156 94 MuNECA EXTENSI6N DE 625 375 156 94 MUNECA PRONACI6N 625 375 156 94 SUPINACI6N 625 375 156 94 TOTAL 10000 6000 2500 1500

(Oa) AI igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con Medicion de voltaje referenda COJltUlt clifureJlCial

r-shy

( r ___nlll ( ~____J1 ~ ~r t laquo -1 ~v- fL-Rtr

~_~__ _~_1)7II[f e-~---

(b) Fig 2 Localizaci6n de los electrodos (a)

22 Parte de discriminaci6n Las senales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extensi6n de la mufieca pronaci6n supinacion apertura y

cierre de la mano

~I2E~1a l]] ltOD 6D Em llJJJ Ilm

(a) Apertura de lobno

~~lo 2Il lID EIJl roo HIll =

(b) Flexion de ]a muiieca

oa r--~-----------------

nm l o 211l lID amp10 roo 111l[]

1210

(t) Reposo

Fig 3 Senales electromiograticas

La senal mioeIectrica es no peri6dica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amiHsis de Fourier (algoritmo FFT) El espec1ro de potencia de la senal EMG (vcr O)representa una distribucion continua como funci6n de su frecuencia

Para la creation de las bases de datos de trabajo se tomaron como entradas de la red neuronal numerosos ejemplos de movimientos incluyendo el reposoa partir de la segmentacion de la senal EMG en ventanas de tiempo de aproximadantente 64 ms (1024 muestras a una frecuencia de muestreo de 16 Khz)

~[ j [] VII 2Il m lID EIJl EIJl

(a) Apertura de Mana

l 1 [] VII 211l m lID EIJl EIJl

Ill 40

31

ill

ID []L

D

(b) Flexion de ]a muiieca

IIIl 211l 310 40D IlO Il[]

(c) Reposa

Fig 4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciales junto con las respectivas salidas que conforman el vector objetivo de clasificaci6n (TargeP) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen elmismo numero de muestras porque estadisticamente ell os no tienen la misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla nmiddot

TABLA I DlSTRIBUCION DE LOS MOVlMIENTOS

60REPOSOJ1 75APERTURA DE MANOJz

75CIERRE DE MANOJ3 625FLEXION DE LA MuNECAJ4 625EXTENSION DE LA MuNECAJ6

625PRONACIONJ 6

625SUPINACIONJ

El conjunto utilizado de caracterlsticas parte de que en estos valores esta contenida esencialmente la informaci6n para efectos de c1asificaci6n de la senal EMG

Sin embargo resulta conveniente una comprobacion yo reducci6n del espacio de caracteristicas medianteel analisis de correlacion segun se explica a continuaci6n EI analisis de correlaci6n permite determinar la dependencia

lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor mas bajo ell orden de

2 donde las columnas almacenan valores 09 6 01 pam indicar la pertenenci3

o no pertenencia a la c1ase de movimiento que co~esponda

104

inlportandaEl analisis de correlacion de caracteristicas parte del calculo de la correlacion y del coeficiente decorrelaci6n asi Si se considera un vector caracteristico de entfadas X = XhXN con Ncaracteristicas la correlaci6nentre las caracteristicas i-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esrn dada en (1)

Qc=Cor(XX)(lQ) L E(X~q)-Il)(x(q)_Ilmiddot)(I)

I I J q=l I I J J

donde

E es el operador de valor esperado Xi(q) es el valor de la i-esima caracterlstica del vector caracteristico X Xr) es el valor de la j-esima caracteristica del vector caraderlstico X ~i es el valor esperado de la i-esimacaracteristica sobre la poblacion de muestra de tamafio Q ~j es el valor esperado de la j-esima caracteristica sobre la poblaci6n de muestra de tamano Q

Elcoeficiente decorrelaci6n estandarizado adiinensional esta dado por (2)

Pij = Cij I ~r-(C-iiC-iJ-) (2)

Esta ecuacion satisface la desigmildadde Cauchy-Sch~artz quedando acotado el rango para Pj entre los valores-I y I

-1 ~ Pij ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pj estara mas cerca de cero (Cij 0) Para efectos de reduccion del nfunero de entradas a la red neuronal se considera que dos caracteristicas estan altamente correlacionadas en el caso en el que Pij gt 0707 Para el caso de reconocimiento de senales EMG se ha considerado que la informaci6n relevante esta contenida en 50 componentes para efectos de reconocimiento delos diferentes movimientos La Tabla II muestra parte de la matriz de correlaci6n (12 primeras componentes) calculada para la base de datos

1 2 3 4 5 6 7 8 9 10 11 12

TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACION 2 3 4 5 6 7 8 9 10 11 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de revisar lamatrizde coeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pij lt 0707por 10cual se puede decir que no estan altamente correlacionados y en consecuencia puede concluirsemiddot que las caracterlsticas pueden ser consideradas independientes La parte de discriminacion esta conformada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizaci6n del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripci6n de cmintas capas tiene el numero de neuronas en cada capa la funcion de transferencia decada capa y c6mo se interconectan ellas entre sf La topologia dela red MLP tiene diferentes capas (ver 0) la capade entrada (N) una capa oculta (M) y una capa de salida (1) La capa de salida tiene tantas neuronas como el nfunero de movimientos a desarrollar

EI proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validaci6n y (iii) verificaci6n Las tres (3)bases de datos fueroncreadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

Vector de En1rtdas

Capade Capa Entrada Oculta

Fig 5 Arquitectum de la red neuronal

TABLA III DISTRIBUCION DE DATOS PARA EL APRENDIZAJE DEL MODELO

MLP

I I I

Movimiento Ejemp Entr Verlf ValL REposo 6000 3600 1500 900 APERTURADE MANO

750 450 188 1I2 I

CIERREDE MANO 750 450 188 1I2 FLEXION DE MuNECA

625 375 156 94

i EXTENSION DE MuNECA

625 375 156 94

PRONACION 625 375 156 94 SUPINACION

TOTAL 625 10000

375 6000

156 2500

94 1500 I

105

II

Las pruebas de entrenamiento y validacion se hicierona partir de las bases de datos de trabajo normalizadas ejecutando el programa de entrenamiento de MLP con base en el algoritmo BP

Se realizaron 5 pru~pas para diferentes valores del numero de neurodos de la capa oculta (M) tOl unmiddotminimo de iteraciones de 1000 variando el valor de Mdesde 30 hasta 100 en pasos de 5 A medida que se ejecuta 61 algoritmo de entrenamiento se va evaluando el error de vaHdpoundcion quedando registrada la iteracion para la que se obtiene ~I minimo valor asi como los correspondientes valores de la red El algoritmo se ejecuta

shyhasta que se alcance el numero de iteraciones especificado 0

se logre reducir el error t9tal po debajo del ~nimo preestablecido (0005)

Los valores de los errores mlmmos de entrenamiento y validacion son fundamentalesmiddot cQmo medida para deterrninar el grado de aprendizaje de lalt red y permiten deterrninar el punto a partir del cualla red empieza a memorizar mas que a aprender Se hace tambien necesario prQ9~r la red luego de haber sido entrenada para esto se hace USa de la base de datos de verificacion la cual se pasa a traves de la red neuronal para determinar el porcentaje de aciertos en el reconocimiento de los movimientos dando lugar a la llamada matriz de confusion3

bull

Con base en estos criterios se determinaron las matrices de confusion tanto para entrenamiento como para verificaci6n en cada una de las pruebas realizadas y se concluye que el numero optimo de neurodos para la capa intermedia M en nuestro caso es de 75

3 CONCLUSIONES El amllisis de correlacion de caracteristicas debe hacerse antes de entrenar la red para saber si hay dependencia entre las componentes frtcuenciales

Los valores de los errores mmlmos de entrenamiento y validacion son fundamentales como medida para determinar el grado de aprendizaje de la red especialmente en el punto a partir del cual puede considerarse que la red empieza a memorizar mas que a aprender

Al realizar varias iteraciones se puede escoger el vector de pesos mas adecuado superando el problema de los minimos locales propio del algoritmo de entrenarniento de BP

4 TRABAJO FUTURO Para la openicion en tiempo real [4] se propone que este procedimiento se implemente sobre un procesador digital de senales (ADSP-21061) el cual operara sobre el conjunto de pesos obtenidos gracias a la red y de esta forma poder desarrollar una interfaz electronica que reciba identifique y procese las senales mioelectricas del brazo y ademas que

3 se forma comparando las salidas reales de la red con las salidas deseadas para todos y cada uno de los ejemplos de la base de verificaci6n

controle los movimientos hasicos que se asemejen a los naturales perrnitiendo a su vez ser adaptada al interior de una protesis e1ectromecanica de mano demostrando la efectividad del sistema para pacientes amputados a la altura del tercio proximal (antebrazo) con criterios de viabilidad economica y optimo uso energetico para su funcionamiento EI prototipo planteado presenta la arquitectura de la O

Seihlde los eledloclos

Catr~l5or

~ Digital

I I

Fig 6 Diagrama esquematico de una interfaz para una protesis mioeleclrica

REFERENCIAS [1] Kaduhiko Nishikwa Katsutoshi Kuribayashi Neural

Network Application to a discrimination system for controlled prostheses IEEEIRSJ International Workshop on Intelligent Robots and Systems nov 1991

[2] Adrian del Boca Dong C Park Myoelectric signal recognition using fuzzy clustering and artificial neural networks in real time IEEE Transactions on Biomedical Engineering jun 1990middot

[3] Looney Carl G Pattern recognition using neural networks Theory and algorithms for engineers and scientists Oxford University Press 1997

[4] Embrec Paul C++ Algorithms for Real Time DSP Prentice Hall 1999

[5] Alan V Oppenheim et al j Discrete Time Signal Processing Prentice Hall 1999

AUTORES Ingeniero Victor Hugo Grisales Opta por el master en e1ectrica en la Universidad de los Andes Profesor de tietnpo completo en la Universidad Distrital Director del grupo I+D en instrumentacion y control

Carlos Sanchez Fernando Rosas Vladimir Barrero Juan Leon Estudiantes de ultimo semestre de Ingenieria Electronica en la universidad Distrital FIDC Miembros

Estudiantiles del IEEE

106

ANALISIS ACUSTICO EN LA CLASIFICACION DE SENALES DE VOZ EMPLEANDO RNA

German Castellanos (gcastel1ieeeorg) Francisco Vargas (pcinevadomanizalesunaleduco) Grupo de Control y Procesamiento Digital de Senales - Universidad Nacional de Colombia - Sede Manizales

Resumen Se presenta un sistema de clasificaci6n desefiales de voz basado en sus caracteristicas acusticas el cual se ha dividido en tres partes obtencilm del ensamble inicial de caracterizaci6n acustica de la voz basandose en tecnicas de proceso digital de senales en tlempo real reduccion hasta elmenor ensamble de parametros representativos y suficientemente discriminantes de las clases basandose en tecnlcas estadisticas y por ultimo la construction de las reglas de decisi6n para clasificacion de senales de voz que pueden ser basadas en el empleo de redes neuronales EI sistema rue probado en la clasificaci6n devoz de acuerdo al sexo y edad de los hablanies y como resultado se determinan sus caracteristicas acusticas mayormente influyentesmiddot Ademas esta orieiltado a la tipificacion de norinalidad 0 alteraci6n de las direrentes clases de voz Para el presente trabajo rueronmiddot evaluadas las redes multi-capa y los mapas auto-organizatlvos de Kohonen

L INTRODUCCI6N

En la evaluacion de la voz la metodologia perceptual caracterizada por Ia calificacion de las cualidades vocales segUn el juicio experto de un sujeto necesita habilidades refinadas de escucha EI empleo de tecnologias digitales permite evaluar de manera objetiva la acustica y fisiologia del fenomeno Durante el proceso de evaluacion objetiva de voz normal 0 alteradaes necesario determinar sus caracteristicas cualitativas como es el caso del couelato acustico timbre aspero la emision con quiebres el ataque vocal duro (fmal de frase abortado) voz hiponasalizada y ruido acoplado para lograr muestras que sean altamente fieles alemisor El empleo de sistemas computarizados de anaIisis acustico de voz provee la posibilidad de percibir elementos dificiles de registrar mediante la observacion sUbjetiva convencional

EI uso de caracteristicas acusticas (CA) en la descripcion de normalidad 0 alteracion de voz ha sido probado en VallOS

contextos y con diferentes objetivos por cuanto perrniten ponderar cualitativamente las propiedades de la voz dificilmente realizable por otros metodos [123] Aunque se han Ilevado a cabo estudios de correlacion de estas caracteristicas con la metodologia perceptual sus resultados ademas de ser ambiguos a veces pueden ser contradictorios en el analisis de tipicidad (normalidad) 0 diferentes alteraciones de las senalesmiddot de voz De tal manera que la seleccion

-apropiada de la medida de las CA y su interpretacion sigue siendo un problema sin solucion

parametros representativos de cada clase se realiza el preproceso de los CA sobre los cuales se construye el ensamble inicial de caracterizacion acustica de voz La Seleccion del ensamble efectivo se realiza mejorando la efectividad de empleo de cada uno de los CA para 10 cual se analizan los criterios discriminatorios de correlacion e informacion mutua Finalmente la reduccion de la dimensionalidad de ensamble se realiza por el metoda de las componentes principales Una vez extraidos los parametros necesarios para la caracterizacion de la voz se resuelve la clasificacion de la voz en el tipo normal y no normal (con alteraciones )

MtltJ~ llbIUtl IHlttmllJgt

Fig 1 Diagrama de bloques reconocimiento de palrones de senales de voz

EI reconocimiento de patrones de senales de voz se puede dividir en dos procesosmiddot fundamentales como se aprecia en la figura Imiddot el entrenamiento que comprende la extraccion y seleccion del con junto de caracteristicas acusticas (id iE(I Ni) que representan cada clase de voz kE(lK) y la toma de decisiones que realiza la clasificacion por algun principio discriminante

EI tipo de reconocimiento empleado en el presente trabajo es una derivacionmiddot de lamiddot metodologia propuesta en [22] compuesta de dospartes hasicas a) Extraccion y Seleccion del ensamble efectivo de CA por clase b) el ensamble efectivo de CA es tornado como entrada de una RN usada en calidad de clasificador que en el caso particular fue del tipo backpropagation Asi fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen

2 ENSAMBLE DE CARACTERIZACI6N INICIAL ACUSTICA DE VOZ

La caracterizacion de la voz requiere de un elevado nUmero Elanalisis acustico de un sonido articulado consiste en de valores de CA En el articulo se presentan algoritmos de determinar los indicadoresfisicos de las vibraciones que 10 estimacion en tiempo real para los principales CA que en constituyen tales como la frecuencia la intensidad la general son muy sensibles a las condiciones acusticas de composicion espectral las variaciones del sonido modificadas tnedida [4] Para aumentar la efectividad en el uso de los por la resonancia que actuan originando el producto sonoro

107

que permite predecir la proXima muestra como una percibido [56] La seleccion de parametros que caracterizan

combinacion lineal de las anteriores [10] la voz es tal vez la etapa mas importanteen el desarrollo de sistemas automatizados de su proceso Uno de los principales y(n)=-taky(n-k) (2)problemas en el analisis de las CA de voz consiste en que la mayoria de eUos son sensibles a diferentes condiciones de

k=l

donde q es el orden del predictor y ak son los coeficientes de medicion Este factor conlleva a escoger el ens amble de prediccion lineal (LPC) Los coeficientes ak pueden ser parametros acusticos que brinde la mejor estimacion de determinados a partir del calculo de coeficientes demiddot irregularidad y perturbacion para la clasificacion y autocorrelacion De esta manera se tendcln q coeficientes de reconocimiento de senales de voz En general toda CA de prediccion lineal por cada trama de la senal de voz Tambien amilisis debera cumplir con las siguientes propiedades [6] a) es habitual aplicar el calculo de los coeficientes LPC Debe ser facilmente estimable y 10 menos dependientes de las cepstrales (Ia transformada de Fourier inversa del espectro de perturbaciones ambientales b) Su estimacion debe ser estable amplitud logaritmico) que representan la respuestaen el tiempo y c) No debe ser imitable Las CA pueden ser aproximadamente logaritmica 0 psofometrica del oido agrolJados de acuerdo a las propiedades acusticas que deben humano Los coeficientes LPC cepstrales Ck presentan la medir y los cuales en la practica se asocian en dos categorias ventaja de convertir el ruido convolucional en ruido aditivo y [7] permiten separar la excitacion glotal de los parametros del

tracto vocal Seguidamente se emplea un tipo de ventaneo que a) Parametros cuasiperiodicos Son disenados para la acentue los pesos de los LPC cepstrales con el objeto de captura de varias fonnas de periodicidad de las obtener mayor discriminacion de la envolvente espectral perturbaciones en la senal aclistica Entre los principales

parametros de este gropo estan b) Parametros de perM-bacion Destinados a medir la componente relativa de ruido en la senal de voz Para la

La Frecuencia Fundamental (Fo) que es referida a las estimacion de las perturbaciones de los parametros de la caracteristicas de cuasiperiodicidad de la senal en el tiempo frecuencia fundamental es comun el empleo del promedio Los diferentes metodos de estimacion del calcul0 del Fo relative de perturbacion (RAP Relative Average Perturbation) fueron analizados y comparadosen [S] por tiempo de proceso

definido como [1311] y precision obteniendose que el metodo (AMDF Magnitude Difference Function) [69] es mas veloz cuyo algoritmo esta

dado por iJ n z=(tIZH +z Zi+l -Zi llLRAP 1=1 3 1=1

AM(km)= (3) siendo n es el numero de ciclos consecutivos analizados 1 m

- Lly(n)- y(n-k)w(m-1t) Cuando el panimetro de perturbacion z se refiere al periodo N n=m-N-l) de la frecuencia fundamental se define el Jitter mientras que

en el caso de su amplitud se define el Shimmer [14] EI nivel (1) de perturbaciones tambien puede ser caracterizado por elDonde yen) es la senal digitalizada de voz wen) es la ventana

de proceso con longitud N m es el numero de muestras armonico ruido H 0 energia promedio del ruido de fondo ij(t) empleadas en la estimacion k es el retraso para el cual se esta que se determina como

Tcalculando el AMDF H = 11Jr((r)ciT (4a)

Los formantes En el espectro de una senal de voz se o encuentran regiones de enfasis (Uamadas resonancias) y de donde 1E [01] El componente de ruido N se defme como la deenfasis (antiresonancias) [9] ambas resonancias diferencia de energias de la senal de informacion y del denominadas formantes que siguen patrones comunes en la armonico ruido mayoria de los humanos determinadas basicamente por sus medidas antropometricas [101112] En la practica se nT analizan 5 fonnantes (FI F2 F3 F4 F5) junto con sus N = LJ[yj (1 )-11(1)]2 dT (4b)respectivos anchos de banda (LlWI LlW5Y los cuales se

=1 0 definen como el gropo de frecuencias que hay desde la caida a

donde 1E[O1] Finalmente el armonico ruido se determinposterior y anterior de 3 dB La energia del formante sera el como HNR=HIN Para aplicaciones profesionales la energia

valor del pica y el valor del formante la frecuencia donde se se determina por la diferencia entre la energia de la emision

encuentre el pica anterior [11] La estimacion de los vocal y la energia del ruido ambiente dado por formantes se realizo sobre algoritmos basados en la

suposicion de que la voz puede ser representada por modelos II

P(n) = -1

Ly2 (i) (4c)en fonnadeun numero reducido de indicadores a partir de n 1=1los cuales es posible su reconstruccion adecuada Para esto se S

donde n es el numero de puntos de la senal y(t) OlrD empleantecnicas de prediccion lineal basadas en el a

parametros analizados son la Energia de nlido normalizadmodel ado deltracto vocal mediante un filtro de solo polos (NNE) que ha sido estudiada en varios contextos [71415] Y

108

la excitaciim g16tica a ruido (GNE) estima el ruido en un tren el proceso de medicion influencia de fuertes perturbaciones de pulsos que es tipicamente generado por la oseilacion de los etc En este caso el valor anomalo del arreglo se expresa pliegues de voz [3] mediante el valor critico de la distribucion de Student fp n-2

La cantidad de CA N de representaci6n de voz t es [1717] completado por la primera (parametros delta) y segunda derivada (delta-delta) en el tiempo de los LPC cepstrales [6] y I e- In I[J s Ipn_] (n-I )112I(n-2+(lpnd)lf2 (5) debe realizarse para cada una de los tipos de senales de voz a clasificar Realmente cada CA puede influir de diferente siendo JIll yO respectivamente la media y varianza del manera en la pronunciaci6n de cada palabra En la practica de valor extremo en analisis del arregl0 I p es el nivel de la fonoaudiologia es comllo el empleo de palabras claves 0 significacion A efectos de comparaci6n de las realizaciones maestras En el caso particular se cada muestra fue tomada de losdiferentes parametros acusticos es preferible su basados en la pronunciaci6n de las cinco vocales estandarizacion estadistica Asi

Cabe anotar que el reconocimiento de senales de voz debe (6)~I =(i- mJ)O realizarse en linea por 10 que los algoritmos de proceso deben estar orientados a su desarrollo en tiempo real Los metodos empleados de estimacion de cada caracteristica fundamentalmente empleando metodos de amiJisis en acustica exigen la verificacion de hipotesis de la intervalos de tiempo cortos de los segmentos de voz los homogeneidad la cual se lleva a cabo por el criterio i y en cuales se analizan en [616] casos extremos se emplea el metoda Kolmogorov-Smirnov

[IS] Si laverificacion muestra claramente la invalidez de la hipotesis de gaussividad es importante determinar el tipo de

3 SELECCION DEL ENSAMBLE EFECTNO distribucion de fdp para cada ensambleI y si es posible la forma de su transformacion a la normal La transformacion de

La extraccion de CA se realiz6 acorde a los algoritmos la variable [Jj en sect con distribucion nonnalizada se determina presentados en anteriormente Asi se escogio un conjunto de de la relacion caracteristicas acusticas UiI i= I bullN que representan cada dase de voz k= I $ El sistema automatizado de extraccion ~

de parametros calcula 20 CA para cada una de las cinco ~21C1_ J e_2 dt =Lr M ji(Aji-1 lt Sjlt Aji) voeales (aIlellillollul) pronunciadas en la emision de voz a __ =1 N analizar Como resultado se obtuvo un valor de Nr I 00 para

j

(7)una sola emision de un paciente dado En cuanto a los grupos de clasificaci6n se definieron los siguientes a) Hombre

donde ~gve es el ens amble real de 0 res el nlimero relativo Adulto k=l b) Hombre Nino k=2 c) Mujer Adulta k=3 y d)

de intervalos delhistograma AJi Aji son los valores extremos Mujer Nina y k=4

del intervalo i del histograma del parametro 01 ~ es la frecuencia de ocurrencia en cada intervalo del intervalo i Una

Las estimacion de las CA de voz e es muy sensible a forma empirica alterna de ajuste consiste en la transformacion

faetores tales como las condiciones acusticas de toma de de cada CA 0(1) por diferentes operaciones basicas y

senales (ruido de fondo hardware de registro electronico comunmente empleadas en el tratamiento de voz

tiempo del dia en que se Ie toman las muestras al paciente contenido de las palabras etc) por 10 que la primera tarea a

~(I)=lg((I)plusmna) I01 c(1)=lg(aplusmn (I)(I) resolver en su clasificacion usualmente es el preproceso de

~(I)=1((1)110datos de las realizaciones que esta orientado a aumentar la efectividad en el uso de los parametros representativos de cada clase De otra parte la cantidad de realizaciones 0 Despues de cada transformacion se realiza la prueba i y se

toma aquella operacion que con mayor certeza confirme la ensamble N determina las limitaciones en la eleccion del hipotesis de gaussividad En general para cada []jk se puede metodo de preproeeso en particular se debe evitar el efecto tener una transformacion diferente [23] de valores extremos de ensamble muy pocas realizaciones 0

sobrevaluacion del ensamble [17] Las CA estan construidas La seleccion del ensamble efectivo de los rasgossobreestimaciones por 10 que es importante tener discriminantes constituye el aspecto fundamental en uninformacion sobre la fdp (0 su familia) para la cual se sistema de reconocimiento de patrones Las propiedades que calculan sus momentos Por este motivo el ensamble de deben cumplir las CA para su selecci6n son las siguientes prueba Ne se escogi6 de acuerdo al minima numero de

realizaciones que se deben tener para verificacion de Capacidad discriminante Es decir que separen 10 mashipotesis que para valores dados del nivel de significacion nitidamente posible las clases existentes P 01 Yun error de 10 obteniendose N90 muestras por Confiabilidad Esto es los objetos de una misma clase clase [17] deberan presentar la menor dispersion posible Ausencia de correlacion Es decir evitar en 10 posible la La siguiente etapa en el preproceso de datos esta enla utilizacion de caracteristicas que dependan fuertemente eliminacion de datos anomalos debidos a posibles errores en entre si

109

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 9: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

(Oa) AI igual que una medida diferencial se hace tomando los valores de las parejas de electrodos (Ob)

Medicion de voltaje con Medicion de voltaje referenda COJltUlt clifureJlCial

r-shy

( r ___nlll ( ~____J1 ~ ~r t laquo -1 ~v- fL-Rtr

~_~__ _~_1)7II[f e-~---

(b) Fig 2 Localizaci6n de los electrodos (a)

22 Parte de discriminaci6n Las senales fueron adquiridas del brazo derecho del paciente

realizando los siguientes movimientos reposo flexion y extensi6n de la mufieca pronaci6n supinacion apertura y

cierre de la mano

~I2E~1a l]] ltOD 6D Em llJJJ Ilm

(a) Apertura de lobno

~~lo 2Il lID EIJl roo HIll =

(b) Flexion de ]a muiieca

oa r--~-----------------

nm l o 211l lID amp10 roo 111l[]

1210

(t) Reposo

Fig 3 Senales electromiograticas

La senal mioeIectrica es no peri6dica y posee todas las caracteristicas de una senal aleatoria (ver Fig 3) y consecuentemente puede ser analizada usando el amiHsis de Fourier (algoritmo FFT) El espec1ro de potencia de la senal EMG (vcr O)representa una distribucion continua como funci6n de su frecuencia

Para la creation de las bases de datos de trabajo se tomaron como entradas de la red neuronal numerosos ejemplos de movimientos incluyendo el reposoa partir de la segmentacion de la senal EMG en ventanas de tiempo de aproximadantente 64 ms (1024 muestras a una frecuencia de muestreo de 16 Khz)

~[ j [] VII 2Il m lID EIJl EIJl

(a) Apertura de Mana

l 1 [] VII 211l m lID EIJl EIJl

Ill 40

31

ill

ID []L

D

(b) Flexion de ]a muiieca

IIIl 211l 310 40D IlO Il[]

(c) Reposa

Fig 4 Espectro de las senales EMG

Se construye asi una base de datos que contiene 50 columnas correspondientes a las componentes frecuenciales junto con las respectivas salidas que conforman el vector objetivo de clasificaci6n (TargeP) con el que se identifican los 6 movimientos mas el reposo y 10000 filas correspondientes a los ejemplos de cada movimiento

En la base de datos no todo los movimientos tienen elmismo numero de muestras porque estadisticamente ell os no tienen la misma probabilidad de ocurrir por consiguiente los porcentajes se diferencian contra cada movimiento (ver Tabla nmiddot

TABLA I DlSTRIBUCION DE LOS MOVlMIENTOS

60REPOSOJ1 75APERTURA DE MANOJz

75CIERRE DE MANOJ3 625FLEXION DE LA MuNECAJ4 625EXTENSION DE LA MuNECAJ6

625PRONACIONJ 6

625SUPINACIONJ

El conjunto utilizado de caracterlsticas parte de que en estos valores esta contenida esencialmente la informaci6n para efectos de c1asificaci6n de la senal EMG

Sin embargo resulta conveniente una comprobacion yo reducci6n del espacio de caracteristicas medianteel analisis de correlacion segun se explica a continuaci6n EI analisis de correlaci6n permite determinar la dependencia

lineal entre caracteristicas con el fin de reducir 0 eliminar aquellas que tengan un valor mas bajo ell orden de

2 donde las columnas almacenan valores 09 6 01 pam indicar la pertenenci3

o no pertenencia a la c1ase de movimiento que co~esponda

104

inlportandaEl analisis de correlacion de caracteristicas parte del calculo de la correlacion y del coeficiente decorrelaci6n asi Si se considera un vector caracteristico de entfadas X = XhXN con Ncaracteristicas la correlaci6nentre las caracteristicas i-esima y j-esimade un vector caracteristico de una poblacion de muestra de Qejemplos esrn dada en (1)

Qc=Cor(XX)(lQ) L E(X~q)-Il)(x(q)_Ilmiddot)(I)

I I J q=l I I J J

donde

E es el operador de valor esperado Xi(q) es el valor de la i-esima caracterlstica del vector caracteristico X Xr) es el valor de la j-esima caracteristica del vector caraderlstico X ~i es el valor esperado de la i-esimacaracteristica sobre la poblacion de muestra de tamafio Q ~j es el valor esperado de la j-esima caracteristica sobre la poblaci6n de muestra de tamano Q

Elcoeficiente decorrelaci6n estandarizado adiinensional esta dado por (2)

Pij = Cij I ~r-(C-iiC-iJ-) (2)

Esta ecuacion satisface la desigmildadde Cauchy-Sch~artz quedando acotado el rango para Pj entre los valores-I y I

-1 ~ Pij ~ 1 (3)

Una mayor independencia entre Xi y Xj significa que Pj estara mas cerca de cero (Cij 0) Para efectos de reduccion del nfunero de entradas a la red neuronal se considera que dos caracteristicas estan altamente correlacionadas en el caso en el que Pij gt 0707 Para el caso de reconocimiento de senales EMG se ha considerado que la informaci6n relevante esta contenida en 50 componentes para efectos de reconocimiento delos diferentes movimientos La Tabla II muestra parte de la matriz de correlaci6n (12 primeras componentes) calculada para la base de datos

1 2 3 4 5 6 7 8 9 10 11 12

TABLA II PRIMERAS DOCE COMPONENTES DE LA MATRIZ DE

CORRELACION 2 3 4 5 6 7 8 9 10 11 12 13 O - 01 02 - - - - - - - -

- 01 - - - - - - - - 00 - - - 00 03 06 01 03 05 00

03 - - - - 02 01 - -05 - - - 00 - - -

01 00 - - - 01 00 00 02 00 01 05 01

03 - 01 03 01 01 05 06 -

03 01 -03 -

00

Luego de revisar lamatrizde coeficientes de correlacion se comprueba que todos los coeficientes tierien un valor Pij lt 0707por 10cual se puede decir que no estan altamente correlacionados y en consecuencia puede concluirsemiddot que las caracterlsticas pueden ser consideradas independientes La parte de discriminacion esta conformada por el calculo espectral dela senal EMG y la red La Red aprende (off-line) mediante la utilizaci6n del algoritrno BP como un metodo de aprendizaje supervisado

La arquitectura de la red consiste en una descripci6n de cmintas capas tiene el numero de neuronas en cada capa la funcion de transferencia decada capa y c6mo se interconectan ellas entre sf La topologia dela red MLP tiene diferentes capas (ver 0) la capade entrada (N) una capa oculta (M) y una capa de salida (1) La capa de salida tiene tantas neuronas como el nfunero de movimientos a desarrollar

EI proceso para asegurar el aprendizaje de una red MLP consiste en construir tres bases de datos (i) entrenamiento (ii) validaci6n y (iii) verificaci6n Las tres (3)bases de datos fueroncreadas a partir de labase de datos principal (10000 ejemplos) como sigue (i) 60 usado para el entrenamiento (ii) 15 para la validacion y (iii) 25 para la prueba de verificacion del modelo MLP (ver Tabla III)

Vector de En1rtdas

Capade Capa Entrada Oculta

Fig 5 Arquitectum de la red neuronal

TABLA III DISTRIBUCION DE DATOS PARA EL APRENDIZAJE DEL MODELO

MLP

I I I

Movimiento Ejemp Entr Verlf ValL REposo 6000 3600 1500 900 APERTURADE MANO

750 450 188 1I2 I

CIERREDE MANO 750 450 188 1I2 FLEXION DE MuNECA

625 375 156 94

i EXTENSION DE MuNECA

625 375 156 94

PRONACION 625 375 156 94 SUPINACION

TOTAL 625 10000

375 6000

156 2500

94 1500 I

105

II

Las pruebas de entrenamiento y validacion se hicierona partir de las bases de datos de trabajo normalizadas ejecutando el programa de entrenamiento de MLP con base en el algoritmo BP

Se realizaron 5 pru~pas para diferentes valores del numero de neurodos de la capa oculta (M) tOl unmiddotminimo de iteraciones de 1000 variando el valor de Mdesde 30 hasta 100 en pasos de 5 A medida que se ejecuta 61 algoritmo de entrenamiento se va evaluando el error de vaHdpoundcion quedando registrada la iteracion para la que se obtiene ~I minimo valor asi como los correspondientes valores de la red El algoritmo se ejecuta

shyhasta que se alcance el numero de iteraciones especificado 0

se logre reducir el error t9tal po debajo del ~nimo preestablecido (0005)

Los valores de los errores mlmmos de entrenamiento y validacion son fundamentalesmiddot cQmo medida para deterrninar el grado de aprendizaje de lalt red y permiten deterrninar el punto a partir del cualla red empieza a memorizar mas que a aprender Se hace tambien necesario prQ9~r la red luego de haber sido entrenada para esto se hace USa de la base de datos de verificacion la cual se pasa a traves de la red neuronal para determinar el porcentaje de aciertos en el reconocimiento de los movimientos dando lugar a la llamada matriz de confusion3

bull

Con base en estos criterios se determinaron las matrices de confusion tanto para entrenamiento como para verificaci6n en cada una de las pruebas realizadas y se concluye que el numero optimo de neurodos para la capa intermedia M en nuestro caso es de 75

3 CONCLUSIONES El amllisis de correlacion de caracteristicas debe hacerse antes de entrenar la red para saber si hay dependencia entre las componentes frtcuenciales

Los valores de los errores mmlmos de entrenamiento y validacion son fundamentales como medida para determinar el grado de aprendizaje de la red especialmente en el punto a partir del cual puede considerarse que la red empieza a memorizar mas que a aprender

Al realizar varias iteraciones se puede escoger el vector de pesos mas adecuado superando el problema de los minimos locales propio del algoritmo de entrenarniento de BP

4 TRABAJO FUTURO Para la openicion en tiempo real [4] se propone que este procedimiento se implemente sobre un procesador digital de senales (ADSP-21061) el cual operara sobre el conjunto de pesos obtenidos gracias a la red y de esta forma poder desarrollar una interfaz electronica que reciba identifique y procese las senales mioelectricas del brazo y ademas que

3 se forma comparando las salidas reales de la red con las salidas deseadas para todos y cada uno de los ejemplos de la base de verificaci6n

controle los movimientos hasicos que se asemejen a los naturales perrnitiendo a su vez ser adaptada al interior de una protesis e1ectromecanica de mano demostrando la efectividad del sistema para pacientes amputados a la altura del tercio proximal (antebrazo) con criterios de viabilidad economica y optimo uso energetico para su funcionamiento EI prototipo planteado presenta la arquitectura de la O

Seihlde los eledloclos

Catr~l5or

~ Digital

I I

Fig 6 Diagrama esquematico de una interfaz para una protesis mioeleclrica

REFERENCIAS [1] Kaduhiko Nishikwa Katsutoshi Kuribayashi Neural

Network Application to a discrimination system for controlled prostheses IEEEIRSJ International Workshop on Intelligent Robots and Systems nov 1991

[2] Adrian del Boca Dong C Park Myoelectric signal recognition using fuzzy clustering and artificial neural networks in real time IEEE Transactions on Biomedical Engineering jun 1990middot

[3] Looney Carl G Pattern recognition using neural networks Theory and algorithms for engineers and scientists Oxford University Press 1997

[4] Embrec Paul C++ Algorithms for Real Time DSP Prentice Hall 1999

[5] Alan V Oppenheim et al j Discrete Time Signal Processing Prentice Hall 1999

AUTORES Ingeniero Victor Hugo Grisales Opta por el master en e1ectrica en la Universidad de los Andes Profesor de tietnpo completo en la Universidad Distrital Director del grupo I+D en instrumentacion y control

Carlos Sanchez Fernando Rosas Vladimir Barrero Juan Leon Estudiantes de ultimo semestre de Ingenieria Electronica en la universidad Distrital FIDC Miembros

Estudiantiles del IEEE

106

ANALISIS ACUSTICO EN LA CLASIFICACION DE SENALES DE VOZ EMPLEANDO RNA

German Castellanos (gcastel1ieeeorg) Francisco Vargas (pcinevadomanizalesunaleduco) Grupo de Control y Procesamiento Digital de Senales - Universidad Nacional de Colombia - Sede Manizales

Resumen Se presenta un sistema de clasificaci6n desefiales de voz basado en sus caracteristicas acusticas el cual se ha dividido en tres partes obtencilm del ensamble inicial de caracterizaci6n acustica de la voz basandose en tecnicas de proceso digital de senales en tlempo real reduccion hasta elmenor ensamble de parametros representativos y suficientemente discriminantes de las clases basandose en tecnlcas estadisticas y por ultimo la construction de las reglas de decisi6n para clasificacion de senales de voz que pueden ser basadas en el empleo de redes neuronales EI sistema rue probado en la clasificaci6n devoz de acuerdo al sexo y edad de los hablanies y como resultado se determinan sus caracteristicas acusticas mayormente influyentesmiddot Ademas esta orieiltado a la tipificacion de norinalidad 0 alteraci6n de las direrentes clases de voz Para el presente trabajo rueronmiddot evaluadas las redes multi-capa y los mapas auto-organizatlvos de Kohonen

L INTRODUCCI6N

En la evaluacion de la voz la metodologia perceptual caracterizada por Ia calificacion de las cualidades vocales segUn el juicio experto de un sujeto necesita habilidades refinadas de escucha EI empleo de tecnologias digitales permite evaluar de manera objetiva la acustica y fisiologia del fenomeno Durante el proceso de evaluacion objetiva de voz normal 0 alteradaes necesario determinar sus caracteristicas cualitativas como es el caso del couelato acustico timbre aspero la emision con quiebres el ataque vocal duro (fmal de frase abortado) voz hiponasalizada y ruido acoplado para lograr muestras que sean altamente fieles alemisor El empleo de sistemas computarizados de anaIisis acustico de voz provee la posibilidad de percibir elementos dificiles de registrar mediante la observacion sUbjetiva convencional

EI uso de caracteristicas acusticas (CA) en la descripcion de normalidad 0 alteracion de voz ha sido probado en VallOS

contextos y con diferentes objetivos por cuanto perrniten ponderar cualitativamente las propiedades de la voz dificilmente realizable por otros metodos [123] Aunque se han Ilevado a cabo estudios de correlacion de estas caracteristicas con la metodologia perceptual sus resultados ademas de ser ambiguos a veces pueden ser contradictorios en el analisis de tipicidad (normalidad) 0 diferentes alteraciones de las senalesmiddot de voz De tal manera que la seleccion

-apropiada de la medida de las CA y su interpretacion sigue siendo un problema sin solucion

parametros representativos de cada clase se realiza el preproceso de los CA sobre los cuales se construye el ensamble inicial de caracterizacion acustica de voz La Seleccion del ensamble efectivo se realiza mejorando la efectividad de empleo de cada uno de los CA para 10 cual se analizan los criterios discriminatorios de correlacion e informacion mutua Finalmente la reduccion de la dimensionalidad de ensamble se realiza por el metoda de las componentes principales Una vez extraidos los parametros necesarios para la caracterizacion de la voz se resuelve la clasificacion de la voz en el tipo normal y no normal (con alteraciones )

MtltJ~ llbIUtl IHlttmllJgt

Fig 1 Diagrama de bloques reconocimiento de palrones de senales de voz

EI reconocimiento de patrones de senales de voz se puede dividir en dos procesosmiddot fundamentales como se aprecia en la figura Imiddot el entrenamiento que comprende la extraccion y seleccion del con junto de caracteristicas acusticas (id iE(I Ni) que representan cada clase de voz kE(lK) y la toma de decisiones que realiza la clasificacion por algun principio discriminante

EI tipo de reconocimiento empleado en el presente trabajo es una derivacionmiddot de lamiddot metodologia propuesta en [22] compuesta de dospartes hasicas a) Extraccion y Seleccion del ensamble efectivo de CA por clase b) el ensamble efectivo de CA es tornado como entrada de una RN usada en calidad de clasificador que en el caso particular fue del tipo backpropagation Asi fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen

2 ENSAMBLE DE CARACTERIZACI6N INICIAL ACUSTICA DE VOZ

La caracterizacion de la voz requiere de un elevado nUmero Elanalisis acustico de un sonido articulado consiste en de valores de CA En el articulo se presentan algoritmos de determinar los indicadoresfisicos de las vibraciones que 10 estimacion en tiempo real para los principales CA que en constituyen tales como la frecuencia la intensidad la general son muy sensibles a las condiciones acusticas de composicion espectral las variaciones del sonido modificadas tnedida [4] Para aumentar la efectividad en el uso de los por la resonancia que actuan originando el producto sonoro

107

que permite predecir la proXima muestra como una percibido [56] La seleccion de parametros que caracterizan

combinacion lineal de las anteriores [10] la voz es tal vez la etapa mas importanteen el desarrollo de sistemas automatizados de su proceso Uno de los principales y(n)=-taky(n-k) (2)problemas en el analisis de las CA de voz consiste en que la mayoria de eUos son sensibles a diferentes condiciones de

k=l

donde q es el orden del predictor y ak son los coeficientes de medicion Este factor conlleva a escoger el ens amble de prediccion lineal (LPC) Los coeficientes ak pueden ser parametros acusticos que brinde la mejor estimacion de determinados a partir del calculo de coeficientes demiddot irregularidad y perturbacion para la clasificacion y autocorrelacion De esta manera se tendcln q coeficientes de reconocimiento de senales de voz En general toda CA de prediccion lineal por cada trama de la senal de voz Tambien amilisis debera cumplir con las siguientes propiedades [6] a) es habitual aplicar el calculo de los coeficientes LPC Debe ser facilmente estimable y 10 menos dependientes de las cepstrales (Ia transformada de Fourier inversa del espectro de perturbaciones ambientales b) Su estimacion debe ser estable amplitud logaritmico) que representan la respuestaen el tiempo y c) No debe ser imitable Las CA pueden ser aproximadamente logaritmica 0 psofometrica del oido agrolJados de acuerdo a las propiedades acusticas que deben humano Los coeficientes LPC cepstrales Ck presentan la medir y los cuales en la practica se asocian en dos categorias ventaja de convertir el ruido convolucional en ruido aditivo y [7] permiten separar la excitacion glotal de los parametros del

tracto vocal Seguidamente se emplea un tipo de ventaneo que a) Parametros cuasiperiodicos Son disenados para la acentue los pesos de los LPC cepstrales con el objeto de captura de varias fonnas de periodicidad de las obtener mayor discriminacion de la envolvente espectral perturbaciones en la senal aclistica Entre los principales

parametros de este gropo estan b) Parametros de perM-bacion Destinados a medir la componente relativa de ruido en la senal de voz Para la

La Frecuencia Fundamental (Fo) que es referida a las estimacion de las perturbaciones de los parametros de la caracteristicas de cuasiperiodicidad de la senal en el tiempo frecuencia fundamental es comun el empleo del promedio Los diferentes metodos de estimacion del calcul0 del Fo relative de perturbacion (RAP Relative Average Perturbation) fueron analizados y comparadosen [S] por tiempo de proceso

definido como [1311] y precision obteniendose que el metodo (AMDF Magnitude Difference Function) [69] es mas veloz cuyo algoritmo esta

dado por iJ n z=(tIZH +z Zi+l -Zi llLRAP 1=1 3 1=1

AM(km)= (3) siendo n es el numero de ciclos consecutivos analizados 1 m

- Lly(n)- y(n-k)w(m-1t) Cuando el panimetro de perturbacion z se refiere al periodo N n=m-N-l) de la frecuencia fundamental se define el Jitter mientras que

en el caso de su amplitud se define el Shimmer [14] EI nivel (1) de perturbaciones tambien puede ser caracterizado por elDonde yen) es la senal digitalizada de voz wen) es la ventana

de proceso con longitud N m es el numero de muestras armonico ruido H 0 energia promedio del ruido de fondo ij(t) empleadas en la estimacion k es el retraso para el cual se esta que se determina como

Tcalculando el AMDF H = 11Jr((r)ciT (4a)

Los formantes En el espectro de una senal de voz se o encuentran regiones de enfasis (Uamadas resonancias) y de donde 1E [01] El componente de ruido N se defme como la deenfasis (antiresonancias) [9] ambas resonancias diferencia de energias de la senal de informacion y del denominadas formantes que siguen patrones comunes en la armonico ruido mayoria de los humanos determinadas basicamente por sus medidas antropometricas [101112] En la practica se nT analizan 5 fonnantes (FI F2 F3 F4 F5) junto con sus N = LJ[yj (1 )-11(1)]2 dT (4b)respectivos anchos de banda (LlWI LlW5Y los cuales se

=1 0 definen como el gropo de frecuencias que hay desde la caida a

donde 1E[O1] Finalmente el armonico ruido se determinposterior y anterior de 3 dB La energia del formante sera el como HNR=HIN Para aplicaciones profesionales la energia

valor del pica y el valor del formante la frecuencia donde se se determina por la diferencia entre la energia de la emision

encuentre el pica anterior [11] La estimacion de los vocal y la energia del ruido ambiente dado por formantes se realizo sobre algoritmos basados en la

suposicion de que la voz puede ser representada por modelos II

P(n) = -1

Ly2 (i) (4c)en fonnadeun numero reducido de indicadores a partir de n 1=1los cuales es posible su reconstruccion adecuada Para esto se S

donde n es el numero de puntos de la senal y(t) OlrD empleantecnicas de prediccion lineal basadas en el a

parametros analizados son la Energia de nlido normalizadmodel ado deltracto vocal mediante un filtro de solo polos (NNE) que ha sido estudiada en varios contextos [71415] Y

108

la excitaciim g16tica a ruido (GNE) estima el ruido en un tren el proceso de medicion influencia de fuertes perturbaciones de pulsos que es tipicamente generado por la oseilacion de los etc En este caso el valor anomalo del arreglo se expresa pliegues de voz [3] mediante el valor critico de la distribucion de Student fp n-2

La cantidad de CA N de representaci6n de voz t es [1717] completado por la primera (parametros delta) y segunda derivada (delta-delta) en el tiempo de los LPC cepstrales [6] y I e- In I[J s Ipn_] (n-I )112I(n-2+(lpnd)lf2 (5) debe realizarse para cada una de los tipos de senales de voz a clasificar Realmente cada CA puede influir de diferente siendo JIll yO respectivamente la media y varianza del manera en la pronunciaci6n de cada palabra En la practica de valor extremo en analisis del arregl0 I p es el nivel de la fonoaudiologia es comllo el empleo de palabras claves 0 significacion A efectos de comparaci6n de las realizaciones maestras En el caso particular se cada muestra fue tomada de losdiferentes parametros acusticos es preferible su basados en la pronunciaci6n de las cinco vocales estandarizacion estadistica Asi

Cabe anotar que el reconocimiento de senales de voz debe (6)~I =(i- mJ)O realizarse en linea por 10 que los algoritmos de proceso deben estar orientados a su desarrollo en tiempo real Los metodos empleados de estimacion de cada caracteristica fundamentalmente empleando metodos de amiJisis en acustica exigen la verificacion de hipotesis de la intervalos de tiempo cortos de los segmentos de voz los homogeneidad la cual se lleva a cabo por el criterio i y en cuales se analizan en [616] casos extremos se emplea el metoda Kolmogorov-Smirnov

[IS] Si laverificacion muestra claramente la invalidez de la hipotesis de gaussividad es importante determinar el tipo de

3 SELECCION DEL ENSAMBLE EFECTNO distribucion de fdp para cada ensambleI y si es posible la forma de su transformacion a la normal La transformacion de

La extraccion de CA se realiz6 acorde a los algoritmos la variable [Jj en sect con distribucion nonnalizada se determina presentados en anteriormente Asi se escogio un conjunto de de la relacion caracteristicas acusticas UiI i= I bullN que representan cada dase de voz k= I $ El sistema automatizado de extraccion ~

de parametros calcula 20 CA para cada una de las cinco ~21C1_ J e_2 dt =Lr M ji(Aji-1 lt Sjlt Aji) voeales (aIlellillollul) pronunciadas en la emision de voz a __ =1 N analizar Como resultado se obtuvo un valor de Nr I 00 para

j

(7)una sola emision de un paciente dado En cuanto a los grupos de clasificaci6n se definieron los siguientes a) Hombre

donde ~gve es el ens amble real de 0 res el nlimero relativo Adulto k=l b) Hombre Nino k=2 c) Mujer Adulta k=3 y d)

de intervalos delhistograma AJi Aji son los valores extremos Mujer Nina y k=4

del intervalo i del histograma del parametro 01 ~ es la frecuencia de ocurrencia en cada intervalo del intervalo i Una

Las estimacion de las CA de voz e es muy sensible a forma empirica alterna de ajuste consiste en la transformacion

faetores tales como las condiciones acusticas de toma de de cada CA 0(1) por diferentes operaciones basicas y

senales (ruido de fondo hardware de registro electronico comunmente empleadas en el tratamiento de voz

tiempo del dia en que se Ie toman las muestras al paciente contenido de las palabras etc) por 10 que la primera tarea a

~(I)=lg((I)plusmna) I01 c(1)=lg(aplusmn (I)(I) resolver en su clasificacion usualmente es el preproceso de

~(I)=1((1)110datos de las realizaciones que esta orientado a aumentar la efectividad en el uso de los parametros representativos de cada clase De otra parte la cantidad de realizaciones 0 Despues de cada transformacion se realiza la prueba i y se

toma aquella operacion que con mayor certeza confirme la ensamble N determina las limitaciones en la eleccion del hipotesis de gaussividad En general para cada []jk se puede metodo de preproeeso en particular se debe evitar el efecto tener una transformacion diferente [23] de valores extremos de ensamble muy pocas realizaciones 0

sobrevaluacion del ensamble [17] Las CA estan construidas La seleccion del ensamble efectivo de los rasgossobreestimaciones por 10 que es importante tener discriminantes constituye el aspecto fundamental en uninformacion sobre la fdp (0 su familia) para la cual se sistema de reconocimiento de patrones Las propiedades que calculan sus momentos Por este motivo el ensamble de deben cumplir las CA para su selecci6n son las siguientes prueba Ne se escogi6 de acuerdo al minima numero de

realizaciones que se deben tener para verificacion de Capacidad discriminante Es decir que separen 10 mashipotesis que para valores dados del nivel de significacion nitidamente posible las clases existentes P 01 Yun error de 10 obteniendose N90 muestras por Confiabilidad Esto es los objetos de una misma clase clase [17] deberan presentar la menor dispersion posible Ausencia de correlacion Es decir evitar en 10 posible la La siguiente etapa en el preproceso de datos esta enla utilizacion de caracteristicas que dependan fuertemente eliminacion de datos anomalos debidos a posibles errores en entre si

109

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 10: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

II

Las pruebas de entrenamiento y validacion se hicierona partir de las bases de datos de trabajo normalizadas ejecutando el programa de entrenamiento de MLP con base en el algoritmo BP

Se realizaron 5 pru~pas para diferentes valores del numero de neurodos de la capa oculta (M) tOl unmiddotminimo de iteraciones de 1000 variando el valor de Mdesde 30 hasta 100 en pasos de 5 A medida que se ejecuta 61 algoritmo de entrenamiento se va evaluando el error de vaHdpoundcion quedando registrada la iteracion para la que se obtiene ~I minimo valor asi como los correspondientes valores de la red El algoritmo se ejecuta

shyhasta que se alcance el numero de iteraciones especificado 0

se logre reducir el error t9tal po debajo del ~nimo preestablecido (0005)

Los valores de los errores mlmmos de entrenamiento y validacion son fundamentalesmiddot cQmo medida para deterrninar el grado de aprendizaje de lalt red y permiten deterrninar el punto a partir del cualla red empieza a memorizar mas que a aprender Se hace tambien necesario prQ9~r la red luego de haber sido entrenada para esto se hace USa de la base de datos de verificacion la cual se pasa a traves de la red neuronal para determinar el porcentaje de aciertos en el reconocimiento de los movimientos dando lugar a la llamada matriz de confusion3

bull

Con base en estos criterios se determinaron las matrices de confusion tanto para entrenamiento como para verificaci6n en cada una de las pruebas realizadas y se concluye que el numero optimo de neurodos para la capa intermedia M en nuestro caso es de 75

3 CONCLUSIONES El amllisis de correlacion de caracteristicas debe hacerse antes de entrenar la red para saber si hay dependencia entre las componentes frtcuenciales

Los valores de los errores mmlmos de entrenamiento y validacion son fundamentales como medida para determinar el grado de aprendizaje de la red especialmente en el punto a partir del cual puede considerarse que la red empieza a memorizar mas que a aprender

Al realizar varias iteraciones se puede escoger el vector de pesos mas adecuado superando el problema de los minimos locales propio del algoritmo de entrenarniento de BP

4 TRABAJO FUTURO Para la openicion en tiempo real [4] se propone que este procedimiento se implemente sobre un procesador digital de senales (ADSP-21061) el cual operara sobre el conjunto de pesos obtenidos gracias a la red y de esta forma poder desarrollar una interfaz electronica que reciba identifique y procese las senales mioelectricas del brazo y ademas que

3 se forma comparando las salidas reales de la red con las salidas deseadas para todos y cada uno de los ejemplos de la base de verificaci6n

controle los movimientos hasicos que se asemejen a los naturales perrnitiendo a su vez ser adaptada al interior de una protesis e1ectromecanica de mano demostrando la efectividad del sistema para pacientes amputados a la altura del tercio proximal (antebrazo) con criterios de viabilidad economica y optimo uso energetico para su funcionamiento EI prototipo planteado presenta la arquitectura de la O

Seihlde los eledloclos

Catr~l5or

~ Digital

I I

Fig 6 Diagrama esquematico de una interfaz para una protesis mioeleclrica

REFERENCIAS [1] Kaduhiko Nishikwa Katsutoshi Kuribayashi Neural

Network Application to a discrimination system for controlled prostheses IEEEIRSJ International Workshop on Intelligent Robots and Systems nov 1991

[2] Adrian del Boca Dong C Park Myoelectric signal recognition using fuzzy clustering and artificial neural networks in real time IEEE Transactions on Biomedical Engineering jun 1990middot

[3] Looney Carl G Pattern recognition using neural networks Theory and algorithms for engineers and scientists Oxford University Press 1997

[4] Embrec Paul C++ Algorithms for Real Time DSP Prentice Hall 1999

[5] Alan V Oppenheim et al j Discrete Time Signal Processing Prentice Hall 1999

AUTORES Ingeniero Victor Hugo Grisales Opta por el master en e1ectrica en la Universidad de los Andes Profesor de tietnpo completo en la Universidad Distrital Director del grupo I+D en instrumentacion y control

Carlos Sanchez Fernando Rosas Vladimir Barrero Juan Leon Estudiantes de ultimo semestre de Ingenieria Electronica en la universidad Distrital FIDC Miembros

Estudiantiles del IEEE

106

ANALISIS ACUSTICO EN LA CLASIFICACION DE SENALES DE VOZ EMPLEANDO RNA

German Castellanos (gcastel1ieeeorg) Francisco Vargas (pcinevadomanizalesunaleduco) Grupo de Control y Procesamiento Digital de Senales - Universidad Nacional de Colombia - Sede Manizales

Resumen Se presenta un sistema de clasificaci6n desefiales de voz basado en sus caracteristicas acusticas el cual se ha dividido en tres partes obtencilm del ensamble inicial de caracterizaci6n acustica de la voz basandose en tecnicas de proceso digital de senales en tlempo real reduccion hasta elmenor ensamble de parametros representativos y suficientemente discriminantes de las clases basandose en tecnlcas estadisticas y por ultimo la construction de las reglas de decisi6n para clasificacion de senales de voz que pueden ser basadas en el empleo de redes neuronales EI sistema rue probado en la clasificaci6n devoz de acuerdo al sexo y edad de los hablanies y como resultado se determinan sus caracteristicas acusticas mayormente influyentesmiddot Ademas esta orieiltado a la tipificacion de norinalidad 0 alteraci6n de las direrentes clases de voz Para el presente trabajo rueronmiddot evaluadas las redes multi-capa y los mapas auto-organizatlvos de Kohonen

L INTRODUCCI6N

En la evaluacion de la voz la metodologia perceptual caracterizada por Ia calificacion de las cualidades vocales segUn el juicio experto de un sujeto necesita habilidades refinadas de escucha EI empleo de tecnologias digitales permite evaluar de manera objetiva la acustica y fisiologia del fenomeno Durante el proceso de evaluacion objetiva de voz normal 0 alteradaes necesario determinar sus caracteristicas cualitativas como es el caso del couelato acustico timbre aspero la emision con quiebres el ataque vocal duro (fmal de frase abortado) voz hiponasalizada y ruido acoplado para lograr muestras que sean altamente fieles alemisor El empleo de sistemas computarizados de anaIisis acustico de voz provee la posibilidad de percibir elementos dificiles de registrar mediante la observacion sUbjetiva convencional

EI uso de caracteristicas acusticas (CA) en la descripcion de normalidad 0 alteracion de voz ha sido probado en VallOS

contextos y con diferentes objetivos por cuanto perrniten ponderar cualitativamente las propiedades de la voz dificilmente realizable por otros metodos [123] Aunque se han Ilevado a cabo estudios de correlacion de estas caracteristicas con la metodologia perceptual sus resultados ademas de ser ambiguos a veces pueden ser contradictorios en el analisis de tipicidad (normalidad) 0 diferentes alteraciones de las senalesmiddot de voz De tal manera que la seleccion

-apropiada de la medida de las CA y su interpretacion sigue siendo un problema sin solucion

parametros representativos de cada clase se realiza el preproceso de los CA sobre los cuales se construye el ensamble inicial de caracterizacion acustica de voz La Seleccion del ensamble efectivo se realiza mejorando la efectividad de empleo de cada uno de los CA para 10 cual se analizan los criterios discriminatorios de correlacion e informacion mutua Finalmente la reduccion de la dimensionalidad de ensamble se realiza por el metoda de las componentes principales Una vez extraidos los parametros necesarios para la caracterizacion de la voz se resuelve la clasificacion de la voz en el tipo normal y no normal (con alteraciones )

MtltJ~ llbIUtl IHlttmllJgt

Fig 1 Diagrama de bloques reconocimiento de palrones de senales de voz

EI reconocimiento de patrones de senales de voz se puede dividir en dos procesosmiddot fundamentales como se aprecia en la figura Imiddot el entrenamiento que comprende la extraccion y seleccion del con junto de caracteristicas acusticas (id iE(I Ni) que representan cada clase de voz kE(lK) y la toma de decisiones que realiza la clasificacion por algun principio discriminante

EI tipo de reconocimiento empleado en el presente trabajo es una derivacionmiddot de lamiddot metodologia propuesta en [22] compuesta de dospartes hasicas a) Extraccion y Seleccion del ensamble efectivo de CA por clase b) el ensamble efectivo de CA es tornado como entrada de una RN usada en calidad de clasificador que en el caso particular fue del tipo backpropagation Asi fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen

2 ENSAMBLE DE CARACTERIZACI6N INICIAL ACUSTICA DE VOZ

La caracterizacion de la voz requiere de un elevado nUmero Elanalisis acustico de un sonido articulado consiste en de valores de CA En el articulo se presentan algoritmos de determinar los indicadoresfisicos de las vibraciones que 10 estimacion en tiempo real para los principales CA que en constituyen tales como la frecuencia la intensidad la general son muy sensibles a las condiciones acusticas de composicion espectral las variaciones del sonido modificadas tnedida [4] Para aumentar la efectividad en el uso de los por la resonancia que actuan originando el producto sonoro

107

que permite predecir la proXima muestra como una percibido [56] La seleccion de parametros que caracterizan

combinacion lineal de las anteriores [10] la voz es tal vez la etapa mas importanteen el desarrollo de sistemas automatizados de su proceso Uno de los principales y(n)=-taky(n-k) (2)problemas en el analisis de las CA de voz consiste en que la mayoria de eUos son sensibles a diferentes condiciones de

k=l

donde q es el orden del predictor y ak son los coeficientes de medicion Este factor conlleva a escoger el ens amble de prediccion lineal (LPC) Los coeficientes ak pueden ser parametros acusticos que brinde la mejor estimacion de determinados a partir del calculo de coeficientes demiddot irregularidad y perturbacion para la clasificacion y autocorrelacion De esta manera se tendcln q coeficientes de reconocimiento de senales de voz En general toda CA de prediccion lineal por cada trama de la senal de voz Tambien amilisis debera cumplir con las siguientes propiedades [6] a) es habitual aplicar el calculo de los coeficientes LPC Debe ser facilmente estimable y 10 menos dependientes de las cepstrales (Ia transformada de Fourier inversa del espectro de perturbaciones ambientales b) Su estimacion debe ser estable amplitud logaritmico) que representan la respuestaen el tiempo y c) No debe ser imitable Las CA pueden ser aproximadamente logaritmica 0 psofometrica del oido agrolJados de acuerdo a las propiedades acusticas que deben humano Los coeficientes LPC cepstrales Ck presentan la medir y los cuales en la practica se asocian en dos categorias ventaja de convertir el ruido convolucional en ruido aditivo y [7] permiten separar la excitacion glotal de los parametros del

tracto vocal Seguidamente se emplea un tipo de ventaneo que a) Parametros cuasiperiodicos Son disenados para la acentue los pesos de los LPC cepstrales con el objeto de captura de varias fonnas de periodicidad de las obtener mayor discriminacion de la envolvente espectral perturbaciones en la senal aclistica Entre los principales

parametros de este gropo estan b) Parametros de perM-bacion Destinados a medir la componente relativa de ruido en la senal de voz Para la

La Frecuencia Fundamental (Fo) que es referida a las estimacion de las perturbaciones de los parametros de la caracteristicas de cuasiperiodicidad de la senal en el tiempo frecuencia fundamental es comun el empleo del promedio Los diferentes metodos de estimacion del calcul0 del Fo relative de perturbacion (RAP Relative Average Perturbation) fueron analizados y comparadosen [S] por tiempo de proceso

definido como [1311] y precision obteniendose que el metodo (AMDF Magnitude Difference Function) [69] es mas veloz cuyo algoritmo esta

dado por iJ n z=(tIZH +z Zi+l -Zi llLRAP 1=1 3 1=1

AM(km)= (3) siendo n es el numero de ciclos consecutivos analizados 1 m

- Lly(n)- y(n-k)w(m-1t) Cuando el panimetro de perturbacion z se refiere al periodo N n=m-N-l) de la frecuencia fundamental se define el Jitter mientras que

en el caso de su amplitud se define el Shimmer [14] EI nivel (1) de perturbaciones tambien puede ser caracterizado por elDonde yen) es la senal digitalizada de voz wen) es la ventana

de proceso con longitud N m es el numero de muestras armonico ruido H 0 energia promedio del ruido de fondo ij(t) empleadas en la estimacion k es el retraso para el cual se esta que se determina como

Tcalculando el AMDF H = 11Jr((r)ciT (4a)

Los formantes En el espectro de una senal de voz se o encuentran regiones de enfasis (Uamadas resonancias) y de donde 1E [01] El componente de ruido N se defme como la deenfasis (antiresonancias) [9] ambas resonancias diferencia de energias de la senal de informacion y del denominadas formantes que siguen patrones comunes en la armonico ruido mayoria de los humanos determinadas basicamente por sus medidas antropometricas [101112] En la practica se nT analizan 5 fonnantes (FI F2 F3 F4 F5) junto con sus N = LJ[yj (1 )-11(1)]2 dT (4b)respectivos anchos de banda (LlWI LlW5Y los cuales se

=1 0 definen como el gropo de frecuencias que hay desde la caida a

donde 1E[O1] Finalmente el armonico ruido se determinposterior y anterior de 3 dB La energia del formante sera el como HNR=HIN Para aplicaciones profesionales la energia

valor del pica y el valor del formante la frecuencia donde se se determina por la diferencia entre la energia de la emision

encuentre el pica anterior [11] La estimacion de los vocal y la energia del ruido ambiente dado por formantes se realizo sobre algoritmos basados en la

suposicion de que la voz puede ser representada por modelos II

P(n) = -1

Ly2 (i) (4c)en fonnadeun numero reducido de indicadores a partir de n 1=1los cuales es posible su reconstruccion adecuada Para esto se S

donde n es el numero de puntos de la senal y(t) OlrD empleantecnicas de prediccion lineal basadas en el a

parametros analizados son la Energia de nlido normalizadmodel ado deltracto vocal mediante un filtro de solo polos (NNE) que ha sido estudiada en varios contextos [71415] Y

108

la excitaciim g16tica a ruido (GNE) estima el ruido en un tren el proceso de medicion influencia de fuertes perturbaciones de pulsos que es tipicamente generado por la oseilacion de los etc En este caso el valor anomalo del arreglo se expresa pliegues de voz [3] mediante el valor critico de la distribucion de Student fp n-2

La cantidad de CA N de representaci6n de voz t es [1717] completado por la primera (parametros delta) y segunda derivada (delta-delta) en el tiempo de los LPC cepstrales [6] y I e- In I[J s Ipn_] (n-I )112I(n-2+(lpnd)lf2 (5) debe realizarse para cada una de los tipos de senales de voz a clasificar Realmente cada CA puede influir de diferente siendo JIll yO respectivamente la media y varianza del manera en la pronunciaci6n de cada palabra En la practica de valor extremo en analisis del arregl0 I p es el nivel de la fonoaudiologia es comllo el empleo de palabras claves 0 significacion A efectos de comparaci6n de las realizaciones maestras En el caso particular se cada muestra fue tomada de losdiferentes parametros acusticos es preferible su basados en la pronunciaci6n de las cinco vocales estandarizacion estadistica Asi

Cabe anotar que el reconocimiento de senales de voz debe (6)~I =(i- mJ)O realizarse en linea por 10 que los algoritmos de proceso deben estar orientados a su desarrollo en tiempo real Los metodos empleados de estimacion de cada caracteristica fundamentalmente empleando metodos de amiJisis en acustica exigen la verificacion de hipotesis de la intervalos de tiempo cortos de los segmentos de voz los homogeneidad la cual se lleva a cabo por el criterio i y en cuales se analizan en [616] casos extremos se emplea el metoda Kolmogorov-Smirnov

[IS] Si laverificacion muestra claramente la invalidez de la hipotesis de gaussividad es importante determinar el tipo de

3 SELECCION DEL ENSAMBLE EFECTNO distribucion de fdp para cada ensambleI y si es posible la forma de su transformacion a la normal La transformacion de

La extraccion de CA se realiz6 acorde a los algoritmos la variable [Jj en sect con distribucion nonnalizada se determina presentados en anteriormente Asi se escogio un conjunto de de la relacion caracteristicas acusticas UiI i= I bullN que representan cada dase de voz k= I $ El sistema automatizado de extraccion ~

de parametros calcula 20 CA para cada una de las cinco ~21C1_ J e_2 dt =Lr M ji(Aji-1 lt Sjlt Aji) voeales (aIlellillollul) pronunciadas en la emision de voz a __ =1 N analizar Como resultado se obtuvo un valor de Nr I 00 para

j

(7)una sola emision de un paciente dado En cuanto a los grupos de clasificaci6n se definieron los siguientes a) Hombre

donde ~gve es el ens amble real de 0 res el nlimero relativo Adulto k=l b) Hombre Nino k=2 c) Mujer Adulta k=3 y d)

de intervalos delhistograma AJi Aji son los valores extremos Mujer Nina y k=4

del intervalo i del histograma del parametro 01 ~ es la frecuencia de ocurrencia en cada intervalo del intervalo i Una

Las estimacion de las CA de voz e es muy sensible a forma empirica alterna de ajuste consiste en la transformacion

faetores tales como las condiciones acusticas de toma de de cada CA 0(1) por diferentes operaciones basicas y

senales (ruido de fondo hardware de registro electronico comunmente empleadas en el tratamiento de voz

tiempo del dia en que se Ie toman las muestras al paciente contenido de las palabras etc) por 10 que la primera tarea a

~(I)=lg((I)plusmna) I01 c(1)=lg(aplusmn (I)(I) resolver en su clasificacion usualmente es el preproceso de

~(I)=1((1)110datos de las realizaciones que esta orientado a aumentar la efectividad en el uso de los parametros representativos de cada clase De otra parte la cantidad de realizaciones 0 Despues de cada transformacion se realiza la prueba i y se

toma aquella operacion que con mayor certeza confirme la ensamble N determina las limitaciones en la eleccion del hipotesis de gaussividad En general para cada []jk se puede metodo de preproeeso en particular se debe evitar el efecto tener una transformacion diferente [23] de valores extremos de ensamble muy pocas realizaciones 0

sobrevaluacion del ensamble [17] Las CA estan construidas La seleccion del ensamble efectivo de los rasgossobreestimaciones por 10 que es importante tener discriminantes constituye el aspecto fundamental en uninformacion sobre la fdp (0 su familia) para la cual se sistema de reconocimiento de patrones Las propiedades que calculan sus momentos Por este motivo el ensamble de deben cumplir las CA para su selecci6n son las siguientes prueba Ne se escogi6 de acuerdo al minima numero de

realizaciones que se deben tener para verificacion de Capacidad discriminante Es decir que separen 10 mashipotesis que para valores dados del nivel de significacion nitidamente posible las clases existentes P 01 Yun error de 10 obteniendose N90 muestras por Confiabilidad Esto es los objetos de una misma clase clase [17] deberan presentar la menor dispersion posible Ausencia de correlacion Es decir evitar en 10 posible la La siguiente etapa en el preproceso de datos esta enla utilizacion de caracteristicas que dependan fuertemente eliminacion de datos anomalos debidos a posibles errores en entre si

109

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 11: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

que permite predecir la proXima muestra como una percibido [56] La seleccion de parametros que caracterizan

combinacion lineal de las anteriores [10] la voz es tal vez la etapa mas importanteen el desarrollo de sistemas automatizados de su proceso Uno de los principales y(n)=-taky(n-k) (2)problemas en el analisis de las CA de voz consiste en que la mayoria de eUos son sensibles a diferentes condiciones de

k=l

donde q es el orden del predictor y ak son los coeficientes de medicion Este factor conlleva a escoger el ens amble de prediccion lineal (LPC) Los coeficientes ak pueden ser parametros acusticos que brinde la mejor estimacion de determinados a partir del calculo de coeficientes demiddot irregularidad y perturbacion para la clasificacion y autocorrelacion De esta manera se tendcln q coeficientes de reconocimiento de senales de voz En general toda CA de prediccion lineal por cada trama de la senal de voz Tambien amilisis debera cumplir con las siguientes propiedades [6] a) es habitual aplicar el calculo de los coeficientes LPC Debe ser facilmente estimable y 10 menos dependientes de las cepstrales (Ia transformada de Fourier inversa del espectro de perturbaciones ambientales b) Su estimacion debe ser estable amplitud logaritmico) que representan la respuestaen el tiempo y c) No debe ser imitable Las CA pueden ser aproximadamente logaritmica 0 psofometrica del oido agrolJados de acuerdo a las propiedades acusticas que deben humano Los coeficientes LPC cepstrales Ck presentan la medir y los cuales en la practica se asocian en dos categorias ventaja de convertir el ruido convolucional en ruido aditivo y [7] permiten separar la excitacion glotal de los parametros del

tracto vocal Seguidamente se emplea un tipo de ventaneo que a) Parametros cuasiperiodicos Son disenados para la acentue los pesos de los LPC cepstrales con el objeto de captura de varias fonnas de periodicidad de las obtener mayor discriminacion de la envolvente espectral perturbaciones en la senal aclistica Entre los principales

parametros de este gropo estan b) Parametros de perM-bacion Destinados a medir la componente relativa de ruido en la senal de voz Para la

La Frecuencia Fundamental (Fo) que es referida a las estimacion de las perturbaciones de los parametros de la caracteristicas de cuasiperiodicidad de la senal en el tiempo frecuencia fundamental es comun el empleo del promedio Los diferentes metodos de estimacion del calcul0 del Fo relative de perturbacion (RAP Relative Average Perturbation) fueron analizados y comparadosen [S] por tiempo de proceso

definido como [1311] y precision obteniendose que el metodo (AMDF Magnitude Difference Function) [69] es mas veloz cuyo algoritmo esta

dado por iJ n z=(tIZH +z Zi+l -Zi llLRAP 1=1 3 1=1

AM(km)= (3) siendo n es el numero de ciclos consecutivos analizados 1 m

- Lly(n)- y(n-k)w(m-1t) Cuando el panimetro de perturbacion z se refiere al periodo N n=m-N-l) de la frecuencia fundamental se define el Jitter mientras que

en el caso de su amplitud se define el Shimmer [14] EI nivel (1) de perturbaciones tambien puede ser caracterizado por elDonde yen) es la senal digitalizada de voz wen) es la ventana

de proceso con longitud N m es el numero de muestras armonico ruido H 0 energia promedio del ruido de fondo ij(t) empleadas en la estimacion k es el retraso para el cual se esta que se determina como

Tcalculando el AMDF H = 11Jr((r)ciT (4a)

Los formantes En el espectro de una senal de voz se o encuentran regiones de enfasis (Uamadas resonancias) y de donde 1E [01] El componente de ruido N se defme como la deenfasis (antiresonancias) [9] ambas resonancias diferencia de energias de la senal de informacion y del denominadas formantes que siguen patrones comunes en la armonico ruido mayoria de los humanos determinadas basicamente por sus medidas antropometricas [101112] En la practica se nT analizan 5 fonnantes (FI F2 F3 F4 F5) junto con sus N = LJ[yj (1 )-11(1)]2 dT (4b)respectivos anchos de banda (LlWI LlW5Y los cuales se

=1 0 definen como el gropo de frecuencias que hay desde la caida a

donde 1E[O1] Finalmente el armonico ruido se determinposterior y anterior de 3 dB La energia del formante sera el como HNR=HIN Para aplicaciones profesionales la energia

valor del pica y el valor del formante la frecuencia donde se se determina por la diferencia entre la energia de la emision

encuentre el pica anterior [11] La estimacion de los vocal y la energia del ruido ambiente dado por formantes se realizo sobre algoritmos basados en la

suposicion de que la voz puede ser representada por modelos II

P(n) = -1

Ly2 (i) (4c)en fonnadeun numero reducido de indicadores a partir de n 1=1los cuales es posible su reconstruccion adecuada Para esto se S

donde n es el numero de puntos de la senal y(t) OlrD empleantecnicas de prediccion lineal basadas en el a

parametros analizados son la Energia de nlido normalizadmodel ado deltracto vocal mediante un filtro de solo polos (NNE) que ha sido estudiada en varios contextos [71415] Y

108

la excitaciim g16tica a ruido (GNE) estima el ruido en un tren el proceso de medicion influencia de fuertes perturbaciones de pulsos que es tipicamente generado por la oseilacion de los etc En este caso el valor anomalo del arreglo se expresa pliegues de voz [3] mediante el valor critico de la distribucion de Student fp n-2

La cantidad de CA N de representaci6n de voz t es [1717] completado por la primera (parametros delta) y segunda derivada (delta-delta) en el tiempo de los LPC cepstrales [6] y I e- In I[J s Ipn_] (n-I )112I(n-2+(lpnd)lf2 (5) debe realizarse para cada una de los tipos de senales de voz a clasificar Realmente cada CA puede influir de diferente siendo JIll yO respectivamente la media y varianza del manera en la pronunciaci6n de cada palabra En la practica de valor extremo en analisis del arregl0 I p es el nivel de la fonoaudiologia es comllo el empleo de palabras claves 0 significacion A efectos de comparaci6n de las realizaciones maestras En el caso particular se cada muestra fue tomada de losdiferentes parametros acusticos es preferible su basados en la pronunciaci6n de las cinco vocales estandarizacion estadistica Asi

Cabe anotar que el reconocimiento de senales de voz debe (6)~I =(i- mJ)O realizarse en linea por 10 que los algoritmos de proceso deben estar orientados a su desarrollo en tiempo real Los metodos empleados de estimacion de cada caracteristica fundamentalmente empleando metodos de amiJisis en acustica exigen la verificacion de hipotesis de la intervalos de tiempo cortos de los segmentos de voz los homogeneidad la cual se lleva a cabo por el criterio i y en cuales se analizan en [616] casos extremos se emplea el metoda Kolmogorov-Smirnov

[IS] Si laverificacion muestra claramente la invalidez de la hipotesis de gaussividad es importante determinar el tipo de

3 SELECCION DEL ENSAMBLE EFECTNO distribucion de fdp para cada ensambleI y si es posible la forma de su transformacion a la normal La transformacion de

La extraccion de CA se realiz6 acorde a los algoritmos la variable [Jj en sect con distribucion nonnalizada se determina presentados en anteriormente Asi se escogio un conjunto de de la relacion caracteristicas acusticas UiI i= I bullN que representan cada dase de voz k= I $ El sistema automatizado de extraccion ~

de parametros calcula 20 CA para cada una de las cinco ~21C1_ J e_2 dt =Lr M ji(Aji-1 lt Sjlt Aji) voeales (aIlellillollul) pronunciadas en la emision de voz a __ =1 N analizar Como resultado se obtuvo un valor de Nr I 00 para

j

(7)una sola emision de un paciente dado En cuanto a los grupos de clasificaci6n se definieron los siguientes a) Hombre

donde ~gve es el ens amble real de 0 res el nlimero relativo Adulto k=l b) Hombre Nino k=2 c) Mujer Adulta k=3 y d)

de intervalos delhistograma AJi Aji son los valores extremos Mujer Nina y k=4

del intervalo i del histograma del parametro 01 ~ es la frecuencia de ocurrencia en cada intervalo del intervalo i Una

Las estimacion de las CA de voz e es muy sensible a forma empirica alterna de ajuste consiste en la transformacion

faetores tales como las condiciones acusticas de toma de de cada CA 0(1) por diferentes operaciones basicas y

senales (ruido de fondo hardware de registro electronico comunmente empleadas en el tratamiento de voz

tiempo del dia en que se Ie toman las muestras al paciente contenido de las palabras etc) por 10 que la primera tarea a

~(I)=lg((I)plusmna) I01 c(1)=lg(aplusmn (I)(I) resolver en su clasificacion usualmente es el preproceso de

~(I)=1((1)110datos de las realizaciones que esta orientado a aumentar la efectividad en el uso de los parametros representativos de cada clase De otra parte la cantidad de realizaciones 0 Despues de cada transformacion se realiza la prueba i y se

toma aquella operacion que con mayor certeza confirme la ensamble N determina las limitaciones en la eleccion del hipotesis de gaussividad En general para cada []jk se puede metodo de preproeeso en particular se debe evitar el efecto tener una transformacion diferente [23] de valores extremos de ensamble muy pocas realizaciones 0

sobrevaluacion del ensamble [17] Las CA estan construidas La seleccion del ensamble efectivo de los rasgossobreestimaciones por 10 que es importante tener discriminantes constituye el aspecto fundamental en uninformacion sobre la fdp (0 su familia) para la cual se sistema de reconocimiento de patrones Las propiedades que calculan sus momentos Por este motivo el ensamble de deben cumplir las CA para su selecci6n son las siguientes prueba Ne se escogi6 de acuerdo al minima numero de

realizaciones que se deben tener para verificacion de Capacidad discriminante Es decir que separen 10 mashipotesis que para valores dados del nivel de significacion nitidamente posible las clases existentes P 01 Yun error de 10 obteniendose N90 muestras por Confiabilidad Esto es los objetos de una misma clase clase [17] deberan presentar la menor dispersion posible Ausencia de correlacion Es decir evitar en 10 posible la La siguiente etapa en el preproceso de datos esta enla utilizacion de caracteristicas que dependan fuertemente eliminacion de datos anomalos debidos a posibles errores en entre si

109

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 12: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

-- -~ --- -- --- -~ -

Para cumplir con los requerimientos de diIculo en tiempo real del reconocimiento de cada c1ase la presencia de un gran numero de panimetros acusticos puede ser una limitacion ademas de hacer mas compleja la regia de cIasificaci6n De otra parte el mismo proceso de entrenamiento no se debe realizar mientras no se disminuya al maximo la redundancia en cada uno de las CA de la matriz inicial Por 10 que es necesario la reduccion de la cantidad inicial Nr de CA hasta un valor nr asegurandose de brindar un nivel minimo dn de confiabiIidad en el reeonocimiento conservandose la condici6n dN ~n~Osiendo lJ la maxima divergencia en el valor de eonfiabilidad dada por

v

Dv = 1- LPa(k) Jp(xl k)dk (8) k=1 Krk

donde Knk es el espacio completo de soluciones excluyendo la clase k p(k) probabilidad a priori de aparicion del patron con clase k p(xlk) la fdp condicional de la aparicion de las CA perteneciente a la k clase Por cuanto este eriterio depende fundamentalmente del metodo de reeepci6n y no de alguna medida de diferenciaci6n entre las clases se emplean los siguientes criterios

I a) El criterio discriminatorio basado en la comparaci6n de las matrices de covariacion entre clases por todos los espacios de soluciones [19]

E = I -det(MK)ldet(Mr) (9)

Donde det(MK) y det(Mr) son los determinantes de las matrices de covariacion por clase y entre clase respectivamente EI criterio refleja la diferenciaci6n entre clases bajo la condici6n de _que cada uno de las CA sean efectiva y su coeficiente de correlacion sea el maximo

Pk= cov(1~)1(OIOj)=I (10)

EI criterio E mostrani la efectividad del sistema en los casos cuando OltES1 Por 10 tanto la minimizacion de la dimension del sistema inicial se puede llevar a cabo minimizando hasta el conjunto de CA para el eual se cumpla la desigualdad

EN-EnS e (II)

Para la reducci6n de la matriz inicial hasta el ensamble efectivo de CA se emplea metodo aproximativo de componentes principales [20] Como resultado del amHisis de componentes principales se tiene que la cantidad de CA que representan eada clase de voz se reduce de Nr hasta nr

Para el Anaisis discriminante del ensamble de clases se emple6 el indice de Fisher que cuantifica simuItaneamente la separacion interclases y la fiabilidad intema de las clases Una CA sera tanto mas discriminante cuanto mayor sea su indice de Fisher Es decir interesa que la distancia de las medidas de dos clases sea elevada yal mismo tiempo que la fiabilidad de ambas clases tambien 10 sea Lo anterior es valido para distribuciones biclase Asi para e1 numero dado de clases K

que cada una contiene un nUmero nr igual de CA Si4 representativas el indice de fisher se da como [24J

1 ~ - 2 ~- LJ(mk -m)

F- K k=1 (12)

- -K-~-CA t I~-~-(-t-k---m-)-Tk

1 K siendo m = Link (13)

K k=1

la media de las medias

La selecci6n del ensamble efectivo de CA se puede describir en el siguiente procedimiento

Ensamble Inicial de Datos

Estimacion de CA i i=1NshyDeterminaci6n de nUmero de clases K y caleul0 mimero minimo muestras por clase Ne Conformaci6n Matriz Inicial de CA (NxNr) Analisis ANOVA Preproceso realizaciones de CA i Estandarizaci6n estadistica eliminaci6n valores an6malos test de hipotesis transformacion de variables Analisis de efectividad parametrica analisis de correlaci6n informacion mutua Matriz Inicial de CA corregida Selecci6n ensamble efectivo Reducci6n de variables analisis de componentes principales Conformacion de Matriz Efeetiva de CA (n~exnr~N) Aniilisis discriminante por clases caleulo indice Fisher por clases Er Ae=Ei -Er

4 EMPLEO DE RN EN EL RECONOCIMIENTO DE TIPOLOGIAS DE SENALES DE VOZ

Para el reconocimiento de voz en presente trabajo fueron evaluadas las redes multi-capa y los mapas auto-organizativos de Kohonen Teniendo en cuenta su desempeno se deterrnin6 que la etapa de clasificaci6n fuese llevada a cabo por una red multi-capa con la totalidad de sus conexiones de tipo adaptativo y entrenada usando el algoritmo de Backpropagation en la cual una buena generalizacion solo puede ser obtenida disenando una arquitectura de red que contenga cierta cantidad de conocimiento a priori del problema que para el caso en analisis corresponde a 1a clasificacion de senales de voz dependiendo de su naturaleza normal 0 con alteraciones

Para la etapa de entrenamiento fueron utilizadas 50 muestrllS

por clase Las regiones de decision obtenidas para la red multi-Capa son del tipo cuasi 6ptillas y su desempeno de clasificaci6n es comparable al de los algoritmoS

110

~

convenciona1es tales como el de K-nearest neighbor y LB F~ Metodos de [6] Castellanos G Botero Vargasc1asificacion Gaussiana [21 J Estimaci6n de- Panimetros en el Analisis Acustico de

Voz VI SimposioNacional de Tratamiento de Senales Imagenes y Vision Artificial U Andes 2000

5 RESULTADOS Y CONCLUSIONES J [7] Dejonckere P Principal components in voic~bullbull middot pathology Voice 4 96-1051995

El presente trabajo se realizo sobre el sistema MIRLA [8] Disefio y desarrollo del analizador acustico desarrollado pOf la UN Sede Manizales orientado a la - computarizado de voz Navarro N Lopez A Tcsis

evaluaci6n objetiva de la voz el cual consta de 3 partes Manizales UN 2000 Modulo de Analisis Acustico de Voz M de Caracterizaci6n y [9] Deller 1 Jr Proakis J Discrete time processing of

Reconocimiento de Voz y el M de gestion y procesamiento speech signals new jersey 1993 de informacion [10] Parson Th Voice and speech processing New York

McGraw Hill 1987 La realizacion de estimaciones en diferentes ambientes [U] Menaldi Jackson La voz normal Argentina acusticos mostro que existen panimetros aitamente panamericana 1992 vulnerables sin embargo no afectan de igual manera todas las [12] Gurlekian J El hombre dialoga con la maquina Buenos voca1es Poreste motivo y en orden a mejorar la calidad de aires 1986 las estimaciones el analisis de la matriz inicial de CA se lIeva [13] Parsa V Bielamowicz S et al Comparison of voice acabo por cada vocal analysis systems for perturbation measurement En

journal of spee~h and hearing vo139 feb 1996 p 126shyE1 analisis inicial del ensamble obtenido mostr6 la influencia 134 de las diferentes vocales (abiertas 0 cerradas) en la estimaci6n [14] Kasuya H Ogawa S Kiruchi Y Ebihara S An acoustic de los CA asi los anchos de banda de los formantes A W2 analysis of pathological voice and its application to IW3 AW4 y AW5 para la vocal 101 y los anchos AW2 y evaluation of laryngeal pathology Speech comm IW3 para la luI resultaron ser altamente sensibles eon valores 5171-181 1986

practicamente inmanejables En general se encontro que los [15] Harris M C Manual de medidas acusticas y control parametros de jitter shimmer y frecueneia fundamental son del ruido Vol 1 Madrid McGHilI 1995 las CA mayoritariamente representativas Los demas [16] Castellanos GVitola F Betancourth F Comparacion parametros de formantes y sus imchos de band as respectivos de algoritmos de reconocimiento en tiempo real para presentan alta dispersion y su peso significativo en la diccionarios reducidos de voi I Seminario Internacional

descripcion de las clases es relativamente baja de Ing Electronica VIS Bucaramanga 2001 [17] Petrovich ML Davidovich MI Estimacion estadistica y

As mismo se encontr6 que en orden a mejorar la prueba de hipotesis en el PC (Rus) Finansy i Statistika discriminacion entre grupos de voces de una misma clase se M1989 deben trabajar medidas mas robustas de cambio de las CA [18] Borovkov Estadistica Matematica Estimaci6n de

mayoritarias como se sugiere en [3J Por ultimo la parametros Verificacion de hipotesis Mir 1984 comparaci6n en el desempeno de los tipos de redes analizados [19] Ramishvili G Reconodmiento Automatizado del de BP y SOM resultaron ser similares tal vez debido a que en hablante (Rus) RiS 1981 las RN del Ultimo tipo no se aprovecha la relacion que pueda [20] Doltsinis I Stochastic analysis of multivariate systems entre las palabras pronunciadas in computational mechanics and engineering

CINMEBarcelona1999 BIBLIOGRAFIA [21] Looney C Pattern Recognition using neural networks

Oxford 1997 [lJ Kreiman J Gerrat B The perceptual structure of [22] Hartmut D y Hartmut H Classifying biosignals with

pathologic voice quality 1 Acoustic Soc Am 100 wavelet network Department of medical informatics 1787-1795 University of Heidelberg Oct 1996

[2] De krom G Some spectral correlates of pathological [23] Michaelis D Frohlich M Selection and combination breathy and rough voice quality for different types of of acoustic features for the description of pathologic vowel fragments 1 Speech Hear Res 38 794-811 voices Drittes Physikalisches Institut Germany

[3] Michaelis D Strube H Empirical study to test [24] Marava)) A Reconocimiento de formas y vision independence of different acoustic obice parameters on artificial Addison Wesley a large obice database Eurospeech 95~ Vol 3 pp18911shy1894

[4] Vargas F Sistema Automatizado de tipificacion de voz normal basado en el analisis acustico de senales Tesis UN sede Manizales 2001

[5] Sundberg J Perceptual aspects ofsiIlging Journal of voice vol 8 no 2 junl994 p106-122

111

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 13: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

SEGMENTACI6N DE IMAGENES DE GEL DE ELECTROFORESIS EMPLEANDO LA RED NEURONAL AIiiTFICIAL PCNN

Nallig Leal (nlealpragmacomco) Jose A Bohorquez Esmeide Leal Jaime Montoya Universidad de Antioquia Colombia

John William Branch Owbranchperseusunalmededuco) Universidad Nacional de Colombia Sede Medellin

Resumen Una de las tareas mas complejas dentro del procesamiento digital de imagenes (PDI) es la segmeltacion siendo esta aun mas dificil cuando las imagenes en tratamiento carecen de uniCormidad son ruidosas y presentan bajo contraste es este el caso de las imagenes de gel de electroCoresis en las que tecnicas convencionales de segmentacion tienen un pobre desempefio Existen numerosas tecnicas para segmentar imagenes digitales sin embargo la aplicacion de una u otra depended de las caracteristicas de la imagen en cuestion Recientemente se han incorporado y adaptado modelos de redes neuronales artiliciales para el PDI siendo el modelo peNN muy apropiado para la segmentacion de imagenes de gel de electroCoresis Este articulo describe un conjunto de filtros digitales y la secuencia en que estos deben ser aplicados para proporcionar a las imagenes de gel de electroCoresis las caracterlsticas necesarias para que la segmentacion mediante la red peNN arroje buenos resultados

palabras clave segmentacion electroforesis peNN

I INTRODUCCION

La electroforesis es un proceso de separaCi6n electroquimica en el que moleculas biol6gicas tales como proteinas 0

fragmentos de ADN 0 ARN sehacen migrar a traves de un sustrato especifico (agarosa 0 gel de electroforesis) bajo la influencia de una corriente electrica

El proceso puede ser usado para separar mezclas de moleculas sobre la base de su tamano molecular haciendo uso de sus diferencias de carga electrica Esta diferencia bajo Ia carga de un campo electrico causa que materiales biol6gicos individuales del mismo tamano migren a posiciones discretas dentro del gel La colecci6n de estas mUltiples posiciones en un modo lineal muestra la separaci6n de materiales biologicos mezclados en perfiles especificos de electroforesis[ll

Los resultados del proceso de electroforesis sori consignados en una imagen digital denominada imagen de gel de electroforesis Normalmente estasmiddot imagenes son ruidosas bajas en contraste y poco uniformes caracteristicas poco deseables que dificultan la tarea de segmentacion El procesamiento digital (POI) de imagenes ofrece filtros que tienen como fund6n eHminar las caracteristicas indeseables presentes en la imagen dotandola con las condiciones necesarias para que un posterior proceso de segmentaci6n arroje buenos resultados

Recientemente se han incorporado y adaptado modelos de redes neuron ales artificiales para el procesamiento digital de imagenes como 10 son los modelos de Hopfield y Backpropagatkm en el reconocimiento y el modelo Pulsed Coupled Neural Network (PCNN)[21en la segmentaci6n este ultimo posee caracteristicas muy apropiadas para la

segmentaci6n de imagenes de gel de electroforesis El modelo PCNN es una modificaci6n del modelo original de Eckhom el cual ha sido adaptado para realizar una apropiada segmentacion de imagenes digitales

La primera secci6n de este articulo expone un conjunto de filtros digitales y la secuencia en que estos deben ser empleados con la finalidadde eliminar caracteristicas indeseables en las imagenes de gel de electroforesis indican do las mejoras realizadas con cada uno de ellos sobre tales imagenes En la segunda secci6n se describe el funcionamiento de la red neuronal PCNN disenada para la segmentaci6n de imagenes y posteriormente se muestra su aplicaci6n en la segmentaci6n de imagenes de gel de electroforesis Por ultimo la tercera secci6n presenta un caso de estudio en el cual se aplicaron los filtros ya mencionados y se empleo la red PCNN en la construccion de un sistema automatico de clasificaci6n fenotipicade un individuo a partir de imagenes de gel deelectroforesis

II FUENTE DE INFORMACION

las imagenes que son objeto de analisis provienen del proceso de electroforesis en este proceso se utilizan reactivos que tienen la finalidad de hacer visibles los fragmentos ampliados de ADN 0 ARN presentes en el gel de agarosael uso de tales reactivos introduce informaci6n adicional (ruido) en la imagen la cual se comporta en algunos casos de Ia misma manera que 10 hace la informaci6n de interes por los fragmentos ampliados de ADN 0 ARN y en otros imposibilita la extraccion de esta es decir cuando las bandas son tenues (presentan un nivel de gris muy bajo) se yen afectadas por el ruido introducido hasta el punto de que estas puedan llegar a confundirse con el fondo de la imagen 10 cual imp ide su detecci6n La figura I ilustra una imagen de gel de electroforesis luego de su captura y digitalizaci6n

Fig I Imagen de gel de e1ectroforesis

112

Otra caracteristica no deseable presente en las imagenes provenientes del proceso de electroforesis tiene que ver con la poca uniformidad de los objetos que representan la informacion de interes Estos objetos denominados bandas muestran grim variabilidad en 10 que a los niveles de gris (pixeles que conforman el objeto) se refiere Generalmente los niveles de gris de los pixeles que conforman estos objetos tienden a ser brillantes en el interior de estos y tienden a atenuarse en la periferia Esta carencia de uniformidad hace mas dificil que la tecnica empleada para segmentar la imagen produzca buenos resultados

En la siguiente secci6n se expone un conjunto de filtros digitales y la secuencia en que deben ser usadospara mejorar la calidad de las imagenes de gel de electroforesis esta secuencias de filtros han mostrado experimentalmente tener un buen resultado

III MEJORA DE LA IMAGEN

Al aplicar tecnicas de POI para el mejoramiento de la cali dad de las imagenes es necesario tener presente que cada imagen presenta caracteristicas muy particulares las cuales dependen del proceso al que fueron sometidas antes de ser capturadas al dispositivo de captura y otros factores que pueden afectar la distribuci6n de luz sobre esta Por esta razon cada tipo de imagen requiere el uso de fiItros especificos que mejor se acomoden al problema en tratamiento Los filtros de media mediana y gaussiano (muy utilizados para la eliminaci6n de ruido en las imagenes) aplicados sobre las imagenes de gel de electroforesis mostraron no ser muy adecuados en cambio la operacion niorfol6gica de apertura gener6 buenos resultados sobre la imagen como 10 ilustra la figura 2

(a) (b) Fig 2 La figura 2a es una banda extraida de una imagen original de gel de electroforesis la figura 2b muestra los resultados luego de la aplicaci6n del

filtro de apertura

Se puede apreciar claramente que el objeto (banda) preserva en general su brillo y forma ademas de presentar una distribuci6n mas uniforme de las intensidades de los niveles de gris de los pixeles que 10 confonnan

Otra caracteristica presente en las imagenes de gel de electroforesis es el bajo contraste Cuando se esta tratando Con imagenes de niveles de gris se puede inferir a partir de su histograma como es la distribucion de sus niveles de gris Se emple6 un metodo de estiramiento del histograma que logra redistribuir las intensidades de los niveles de gris de la imagen de forma que imagenes bien contrastadas no sufran una variacion significativa en la distribucion de sus niveles de gris mientras que en las imagenes de bajo contraste ocurra 10 Contrario comolo muestra la Fig 3

113

L iiiI --~---~~

(a) (b) Fig 3 La figura 3a muestra una imagen original de gel de electroforesis La figura 3b muestra la imagen luego del estiramiento de

IV SEGMENTACION DE LA IMAGEN

La segmentaci6n de imagenes es fundamental en tareas de reconocimiento e interpretacion de patrones provenientes de una imagen Se dice que una imagen es segmentada cuando esta es dividida en regiones algunas de las cuales constituyen la InformaCi6n relevantepresente ell ella Dicho de otra forma la segmentaci6n es el proceso de extracci6n de los objetos presentes en la imagen En general la segmentaci6n automatica es una de las tareas mas dificiles en el procesamiento de imagenes esta determina el eventual exito 0

fracaso del analisis de un determinado problema de reconocimiento e interpretacion De hecho la segmentaci6n rara vez Ilega a alcanzar una soluci6n satisfactoria es por ella que se debe tener cuidado al escoger los parnmetros y las tecnicas que sirvan para aumentar el grado de exactitud en la obtenci6n de una segmentacion robusta por tal razon se ha escogido la Red Neuronal PCNN para llevar a cabo dicha tarea

Pulse Coupled Neural Network (PCNN) Esta red es un procesadorde prop6sito general que tiene la

habilidad de extraer de una imagen caracteristicas tales como textura contomo (bordes) ademas de suavizar y segmentar la imagen (siendo esta ultima su caracterfstica mas potente) Las caracteristicas que presenta est a red son las siguientes

I EI campo receptivo de alimentaci6n cada neurona Nk (ver la Fig 4) Recibe una entrada extema Fk(t) la cual equivale al valor de la intensidad de cada pixel

Yp(t) Yj(t) c1pOltlo

---+----1------- enlazamie11lo ceptivo

FigA Arquitectura de una neurona de

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 14: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

2 Actividad intema La entrada de enlazamiento Lk modula la entrada de alimentacion de una fonna no lineal para produCir la actividad intema de la neurona

Uk(t) = Fk(t)(l + J3k L k(t) ) (1)

Lk (t) =LUkjYj(t)v exp(-t 111) (2)

Donde ~k una constante positiva es conocida como el coeficiente de enlazamiento de la neurona Nk El coefieiente de enlazamiento proporciona un medio simple y efectivo de control de la influencia de la entrada de enlazamiento de la red en la actividad intema de la neurona 3 Generador de pulsos el generador de pulsos consiste~ en una funcion genera dora de impulsos y un generador de senal de umbra El generador de senal de umbral denotado por TSGk da como salida la senal de umbral fMt) Cada vez que la neurona de pulso acoplado pulsa su generador de senal de umbral es cargado a un valor predetenninado V k indiferente del valor de la senal de umbral antes de que la neurona pulsara Se asume que el valor de Vk es mas grande que cualquier valor posible de la actividad intema de la neurona Asumiendo dos pulsaciones de la neurona Nk en Tl y T2 la operacion del generador de la senal de umbral es descnta por la siguiente ecuacion

Vk

para I II

[(f_1 ]t=1J 8k

(t)=J 1kIvmiddote

k para II lt t lt 12

(3) V

k para I = 12

donde 1k es la constante de dec aida de tiempo de TSG k

El estado de activacion de la neurona Nk es Y y su valor esta detenninado por la siguiente expresi6n

I si Uk gt6k

Yk = oen otros Casos (4)

En la red PCNN sucede un fenomeno conocido como fenomeno de captura gracias a este fenomeno se lleva a cabo la segmentaci6nde la imagen Una neurona que pulsa en un tiempo t puede capturar a las neuronas vecinas si el aporte que esta les brinda (por medio de la entrada de enlazamiento) es 10 suficientemente grande como para aumentar su actividad intema de tal modo que sobrepase su valor umbra La neurona 0 neuronas capturadas pulsan y a su vez envian senales de enlazamiento a sus neuronas vecinas posiblemente capturando a otragt neuronas y asi sucesivamente hasta que el enlazamiento que aportan las neuronas que han pulsado no

contribuye a incrementar la actividad intema de las neuronas vecinas Todo este proceso se da instantaneamente de fonna que las neuronas correspondientes a regiones de la imagen con pixeles de intensidad similar quemiddot pulsen al mismo tiempo identifican los objetos presentes en la imagen 1

La figura 5 ilustra la fonna como opera la red PCNN aplicada sobre una imagen de gel electroforesis Esta imagen fue previamente tratada con los fiItros de mejora mencionados antenonnente (Estiramiento del histograma y Apertura)

I I ~ I I I gtbullbullbull~ t

f bull

1 I

I

It 1bull I tbull I tI tbullI I

t11bull I

i I t1 III

iI

I 1bull1

( t

(a) (b) Fig 5 La Fig 5a Muestra una imagen de gel de eleetroforesis

previamente tratada con los filtros de la seecion III La Fig 5b muestra el proeeso de segmentaeion realizado por la PCNN

La figura 5a presenta la imagen original y la figura 5b las primeras pulsaciones cuando esta imagen fue usada como entrada a la red Se puede observar que las regiones mas brillantes de la imagen son las que pulsan primero puesto que las neuronas correspondicntes poseen mayor actividad intema Las partes de la figura 5b que poseen un mismo color indican que las neuronas correspondientes pulsaron en lln mismo instantede tiempo Las regiones identificadas con un mismo color y correspondientes a neuronas adyacentes indican los objetos encontrados por la red

Experimentalmente se probaron diferentes combinacioncs de filtros y metodos de segmentacion convencionales de ID (filtros de media mediana gaussianos sobel eutre otros) mediante los cuales no se obtuvieron resultados satisfactorios como los conseguidos aplicando la red PCNN y los filtros expuestos en la secci6n III en una secuencia especifica como 10 ilustra la figura 6

Estiramiento del

Fig 6 Secuencia obtenida experimentalmente para lograr 1ma buena segmentacion de imagenes de gel de e1ectroforesis

I Para mayor eomprensioll del funcionamiento de la red PCNN dirijase a ta referencia 4

114

V CASO DE ESTUDIO (CLASIFICACI6N FENOTIPICA HUMANA)

EI laboratorio central de investigaciones de la Universidad de Antioquia (LCI) entre las muchas pruebas de laboratorio que realiza en la actualidad desarrolla una prueba fundamental para detenninar el grado de compatibilidad de personas que senln sometidas a transplantes esta prueba denominada prueba de HLA es realizada con base en el anaIisis de imagenes de gel de electroforesis Para detenninar la cIasificacion fenotipica de un individuo humano el personal experto encargado de realizar tal clasificaci6n debe analizar las imagenes de gel de electroforesis el personal encargado de clasificar estas imagenes debe identificar los pozos localizadosen ellas al igual que cada una de las bandas de interes Los pozos hacen referenda a los lugares en los cuales son sembrados los fragmentos de ADN Las bandas de interes son aquellos fragmentos de ADN que han sufrido un mayor desplazamiento a partir del sitio donde fueron sembrados y con las cuales se entrara a detenninar la clasificaci6n fenotipica del individuo Esto se detalla en la figura 7

+- sio5dofttris ~~ ~ lIWaJal)l1nH IPJu1mdII

Fig 7 Imagen de gel de electroforesis en la eual se seiiala la informacion que se debe interpretar para determinar la c1asifieaeion fenotipica de un

individuo La figura 8 Muestra el esquema general de un sistema

Infonnatico desarrollado para lograr realizar una muy buena clasificacion fenotipica humana de fonna automatica la cual sirve de apoyo al personal experto que realiza las pruebas de HLA

AGRADECIMIENTOS

Los autores agradecen al personal del laboratorio central de investigaciones de la Universidad de Antioquia su colaboraci6n en la realizacion del proyecto anterionnente descrito el cual fue base para la elaboracion de este articulo

CONCLUSIONES

Se logro establecer una secuencia de filtros capaz de proporcionar a las imagenes de gel de electroforesis condiciones que pennitan a un sistema infonnatico lograr una buena segmentacion de estas

t exoert humang

Fig 8 lustra la secuencia de pasos que se deben seguir para lograr una buena aproximacion a un sistema automatico de c1asificaei6n fenotipica de

individuos mediante el analisis de imagenes de gel de eleetroforcsis

Los filtros espachiles como los de media mediana y gaussiano mostraron no ser eficientes al momento de eliminar el ruido en las imagenes de gel de electroforesis ya que los resultados obtenidos al segmentar dichas imagenes con la red neuronal PCNN no fueron tan buenos como los obtenidos al procesar la imagen con los filtros morfologicos

BIBLIOGRAFiA

[I] Ye Xiang Suen Ching Y Chanet Mohamed Wang Eugenia A recent Development in Analysis of Electrophoresis Gels Vision Interface pag 432- 438 1999 Trois - Rivieres Canada 19 shy 21 May [2] Kuntimad G Ranganath H S Perfect Image

Segmentation Using Pulse Coupled Neural Networks IEEE

Transaction on Neural Networkspag 591-598 Vol 10 No 3

May 1999

[3] Gozalez C Rafael Woods E Richard (1996) Tratamiento digital de Imagenes Addison - Wesley 1 Diaz de Santos [4] Weeks Arthur R Jr (1996) Fundamental Electronic Image Processing SPIE Optical Engineering Press - IEEE Press

Autores Jose A Boh6rquez M Esmeide A Leal N Nallig E Leal N Jaime I Montoya G Ingenieros deSistemas Universidad de Antioquia Medellin Colombia

Revisor John William Branch B Ingeniero de Minas Msc Escuela de Sistemas Facultad de Minas Universidad Nacional de Colombia - Sede Medellin

115

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 15: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

DETECCION EN TIEMPOREAL DE ARRIBO DE EVENTOS SiSMICOS EMPLEANDO REDES NEURONALES

G Castellanos A Meza J Eduardo Hurtado pcinevadomanizalesunaleduco

Universidad Nacional de Colombia Sede Manizales Grupo de Control y Procesamiento Digital de Senales

Son sustancialmente no estacionarias y la influencia de Resumell Se presenta el diseiio e implementacion sobre redes perturbaciones no gaussianas relacionadas con

neuronales de un detector secuencial basado en la relacion de fenomenos geologicos no tiene el mismo canicter todo elverosimilitud y orientado a la deteccion de eventos sismicos en tiempo asi pueden presentarse intervalos relativamentc tiempo real el cual resulta ser lineal para el caso del ruido de limpios de ruido 0 por el contrario con niveles fuertes blanco gaussiano y cuya realizacion practica no es compleja

Por cuanto en el caso de ruido no Gaussiano el dispositivo debe de este considerarse del tipo no lineal y de compleja realizacion La cantidad promedio de cambios abruptos que se practica En el articulo se sugiere el empleo de redes neuron ales suceden depende en gran medida de la estructura que puedan aproximar una gran clase de mapeo no lineal En el geologica puntual sobre la que se registran las medidas entrenamiento de las redes se analizaron funciones Ademas de la tarea de segmentacion en las senales caracteristicas del tipo valor absoluto y filtradon Teager Se sismicas debe realizarse la estimacion entre sus registros estudlo la fidelidad del detector y se encontro que esta

ubieados en diferentes sitios geograficos y condicionados fundamentalmente no cambia para las clases comunes de ruido por los mecanismos de propagacion de energia en lasno gaussiano presentes en seiiales sismicas De Igual manera se

logro disminuir sustancialmente el tiempo proceso para la placas geologicas deteccion del arribo

Basados en 10 anterior se requiere que el algoritrno de segmentacion de estas senales cumpla con los siguientes

I INTRODUCCION requerimientos [12] j

En los ultimos anos se ha propuesto una cantidad Debe ser independiente de la distribuci6n del moinento considerable de metodos de deteccion de cambios abruptos de aparicion de los cambios en las senales para dar respuesta a las diversas aplicaciones que incluyen la Debe pennitir su empleo en condiciones de deteccion de defectos en sensores y accionamientos amllisis incertidumbre en los parametros de las senales antes Y de ECG Y voz deteccion de eventos SlsmlCOS despues del cambio de las propiedades del registro radiolocalizacion etc En la deteccion de eventos sismicos es Debe realizar la deteceion del cambio abrupto en el fundamental la estimacion del momento de arribo de la menor tiempo posible primera onda significativa (onda P)middot necesaria en la La estimaci6n del momento de arribo en principio se puede localizacion de la fuente origen realizar manualmente por analistas expertos como es el caso

de la mayoria de los centros de registro sismicos del pais 10 Las senales analizadas en el presente articulo son del tipo unishy que hace de esta tarea dispendiosa en el tiempo y de caracter dimensionales que registran el desplazamiento sismico en un sUbjetivo El desarrollo actual de las tecnicas de sentido ortogonal EI arribo de la senal sismica puede ser procesamiento digital de senales permite la automatizacion en observado por cambios en la amplitud frecuencia y el amilisis de eventos sismicos en tiempo real incluyendo caracteristicas de polarizacion que pueden ser analizados procedimientos para deteccion del arribo e identificacion de la tomando diferentes funciones caracteristicas entre las cuales fase de la senal en diferentes registros sismognificos estan el valor absoluto de la derivada valor cuadratico la Fundamentalmente se analizan dos tecnicas de deteccion de envolvente filtraci6n Teager entre otras De cualquier cambios abruptos la primera esta basada en el cambio de las manera el empleo directo del registro inicial del sismografo propiedades estadisticas de las senales 0 sus funeiones no es muy conveniente hacerlo por cuanto tiene dos caracteristicas [1234567] y la segunda basada en el polaridades y es muy dependiente de la fuente sismica Asi empleo de redes neuronales (RN) [891011] Aunque ambas niismo son altamente dependientes de la magnitud y tecnicas tradicionalmente son tratadas como totalmente distancia al epicentro del sismo por tanto es preferible su diferentes en el articulo se propone el empleo de RN del tipo nonnalizacion antes de ser procesada Asi mismo el analisis DackPropagation (BP) con estructura sintetizada a partir de de las senales sismicas se puede llevar a cabo directamente tecnicas estadisticas La red es entrenada con una cantidad de sobre el registro en el tiempo 0 sobre su representacion en pequeiia de muestras y luego utilizada en fonna de filtrO algtin plano complejo (espectro de potencia transfonnada de deslizante (estimador ell linea) a 10 largo del registrO

HUbert wavelets etc) sismognifico

La senales sismicas tienen las siguientes particularidades

116

2 DETECCION EN TIEMPO REAL DE CAMBIOS ABRUPTOS POR METODOS EST AotSTICOS

considerese una secueneia de variables aleatorias x(k) 19$1 con funcion densidad de probabilidad (fdp) condicional pv(x~(k-l)x(l) EI parametro (J toma los valores de (J=(Jo=COllst para tgo (siendo to el momento de tiempo en que ocurre un cambio abrupto) y fJ= (J1=const para pto EI objetivo principal es determinar la ocurrencia 0 no de un cambio abrupto tan rapido como se pueda Se asume ademas que en cada momento de analisis se considera la existencia de un solo cambio En cada ventanade analisis en ticmpo realla deteccion es realizada por una regia de parada que usualmcnte toma la forma [112]

fa= itif n gn(x(l ) x(nraquo lt Ar (1)

donde Ar es un umbral de referencia dado y gn (n 1) es una familia de funciones que dependede n+l muestras Si el

momento de ocurrencia es fa = k entonces es suficiente la observacion del proceso hasta la muestra x(k) esto es a medida que vayan llegando los datos el algoritrno estima el cambio abrupto de ahi el nombre de secufmcial 0 detecd6n en tiempo real El detector sintetizado debe tener un valor alto de tiempo medio entre falsas alarmas para un retardo pequeno en la deteccion del cambio Particularmente se toma como optimo el detector que para un valor fijo de tiempo mcdio entre falsas alarmas el retardo en la deteccion sea el miniino [4] En la tarea de deteccion propuesta para una realizacion dada x(k) se deben analizar dos diferentes bipotesis

Ho 1s1~ pV(xl x( kJ) x(l raquo= poo(x~(k-1) x(lraquo - no hubo cambio

H existe un 15la5n tal que para 15k5ta-l pv(xl x(k-1) x(l) peo(xl x(kshy

1)x(1raquo parata5k5n pV(xl x(k-1) x(l) POI(xl x(kshy

l)x(lraquo - bubo cambio (2)

Los criterios us ados en prueba de hipotesis son un compromiso entre la posibilidad de detectar cambios que realmente hall an ocurrido 10 que requiere dos condiciones la primera gran sensibilidad a efectosde alta frecuencia y la segunda la posibilidad de no detectar nada cuando no esta presente el cambio 10 que requiere baja sensibilidad a los efcctos del ruido [I] Obviamente desde el punto de vista pnictico ambas condiciones son contradictorias

Basicamente el modelo de influencia del cambio abrupto en la s~fial observada define el metodo de su deteccion En algunas aplicaciones esta influencia es simple y directa sobre la senal de salida mientras en otros es mas compleja y puede describirse por el cambio en la dinamica del sistema La deteccion de cambios abruptos en senales sismicas es referida al primer caso en donde es importante que esta se realice en ticmpo real

La descripcion de las senales sismicas se puede realizar por medio de los modelos autorregresivos en los cuales el vector del parametro (J de la pv(x) es funcion de los parametros del modelo autoregresivo de media deslizante (ARMA) En este caso la secuencia aleatoria x(k) se asume estacionaria y con muestras independientemente estadisticas con presencia ruido blanco Gaussiano para simplificacion del modelo Formalmente la tarea de deteccion del cambio abrupto en este caso corresponde al cambio en la estimacion parametrica de la media varianza 0 matrices de correlacion de los coeficientes del modelo ARMA [13]

En la deteccion de cambios abruptos es comun eI empleo de la regia de decision de maximo de probabilidad a posteriori (MAP) [2] e implementado por e110garitmo de la relacion de verosimilitud el cual se define como

Ax(k)= p(xIHlL p(x IHo)

(3)

Sin embargo en la pnictica la efectividaddecada algoritrno esta relacionada con su complejidad por 10 que semiddot han desarroUado middotmiddototros detectores masmiddot middotsimples del tipo no parametric os entre eUos el de derivada filtrada [13] sumas cumulativas [15] etc En la practica es comun el empleo del metododel disparo (STAILTA) el cual continuamente calcula elvalor medio de la amplitud absoluta de la senal sismica COil dos ventanas que se mueven en el tiempo en forma consecutiva la ventana de tiempo eorta (STA sllort-termshyaverage) es sensible a los eventos sismieos mientras la ventana de tiempo larga (LTA long-term-average) proporciona informacion sobre la amplitud tempqral del ntido sismico del sitio Cuando la proporcion de ambosexcede un umbral fijado previamente se declara la presencia del evento Los parametros de activacion del ST NLT A dependen del tipo de aplieacion de la condicion de ruido sismico de las propiedades de las sefiales [16] No bay ninguna regia general cada aplicacion requiere un estudio previo solo la experiencia habilita la determinacion de umbrales de disparo

3 EMPLEO DE RN EN LA DETECCION DE SENALES SiSMICAS

EI calculo de la relacion de verosimilitud fundamentalmente depende de la funcion densidad de probabilidad del ruido P(11) Si el ruido es blanco gaussiano debido a que existe un mapeo lineal de Ax(k) con los parametros de entrada entonces la sintesis y realizacion pnictica del detector lineal no es compleja Asi la detecci6n de un cambio abrupto acorde a la descripcion hecha en (2) corresponde al caso simple de analisis cuando se tiene un solo patron dado s(k) 15k5iz que representa eI cambio abrupto mas ruido blanco gaussiano 11(k) 15k5iz con media E[11(k)]=O y varianza E[111(k)]=ci entonces el modelo de la senal de entrada sera

y(k) = s(k) + 11(k) Is-k5iz (4) La regIa de decision que implcmenta la relacion de verosimilitud (3) para el modelo de senal dado en (4)

117

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 16: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

bullbull 06

bull

(b)

corresponde a la distancia euclidiana de los vectores y y s la cual se puede expresar por la desigualdad

L(y(k)-s(k))2 gt Ao (5) k=1

siendo 10 el umbral de detecci6n Se puede demostrar que el algoritmo (5) puede ser simplificado hasta un dispositivo que calcule el produeto esealar de y con s (correlador) [18]

n

z(n)=(ys)= Ls(k)x(k) gt Ao (6) k=1

Acordes con la estructura del correlador (6) mostrada en la figura la se sugiere una red de tres capas con n neuronas en la capa de entrada m neuronas en la capa oculta y funci6n de transferencia fi(- ) y una neurona como capa de salida con funcion de transferencia fi(middot ) La decisi6n que debe tomar el detector se puede representar en dos estados logicos 0 no hay eambio 1 existe eambio por tanto la ultima capa que implementa el dispositivo de toma de decisiones debe tener una sola neurona pero con una de activaci6n acorde a los valores de los estados 16gicos (sigmoide con alta pendiente) La decision como tal se toma comparando la funci6n de verosimilitud con el umbral de decision 10 por tanto la Ultima capa tambien debe ser descentrada en un valor proporcional rshyAsi si las sumas ponderadas de la salida de la capa escondida exceden este umbral entonces la neurona de la capa de salida tomara el valor de I indicando que hubo cambio abrupto en caso contrario su valor sem O

z(f)compaxCii x L rador

sCk)

Fig I Estructura del correlador gaussiano estadlstico y su hom61ogo realizado sobre RN BP

En principio la estructura del detector secuencial descrito puede ser implementado con una red neuronal del tipo

retropropagacion (figura Ib) Los pesos wij 15i511 denotan la conexi6n entre la neurona i en la capa de entrada y la neurona j en la capa oculta mientras )i(k) Y hik) LSj5nl corresponden a su salida y funcion de activacion respectivamente w2) denota la conexi6n entre la neurona j de la capa oculta y la neurona en la capa de salida Se define respectivamente z(k) J3(k) y como la salida la funcion de activacion y el umbral para la neurona en la capa de La entrada y la salida de toda la red neuronal se describini

como

z(k) = f(tWjYk) +r1 = f(t WJf(~ wjx(k)+lJj )+ r1

yk) =(~wjx(k) + lJj ) (7)

La ecuacion (7) implementa la relacion de verosimilitud dada en (3) para el modelo de senal (4) Sin embargo en caso de tener ruido no Gaussiano a la entrada del detector la funci6n Ax(k) tiene un caracter no lineal con la entrada y practicamente es muy dificH hallar una expresion expliCita con el vector de entrada 10 que dificulta la sintesis del detector EI detector basado en la relaci6n de verosimilitud para ruido no Gaussiano por tanto debe considerarse como un dispositivo con mapeo no lineal Por cuanto las redes neuronales del tipo MLP pueden aproximar una gran clase de mapeo no lineal su aplicacion se ha considerado en la detecci6n de senales [1920] Asi la ecuaci6n (7) muestra que z(k) presenta una relacion no lineal con la entrada xi(k) la cual esta Msicamente determinada por la conexi6n de pesos Wi) y Wjl(2) (155n 1y9n) En [20] se sugiere la realizaci6n de la funcion Ax(k) a traves de (7) para senales de entrada con diferente fdp a la gaussiana entrenando adecuadamente los pesos de la RN en orden a obtener e1 nivel de no linealidad requerido por el detector

4 ENTRENAMIENTO Y PRUEBA DEL DETECTOR

El entrenamiento de la RN se resume en tres etapas

Caracterizacion Y preproceso de las seiiales sismicas EI ensamble inicial de senales sismicas correspondia a realizaciones registradas por las diferentes estaciones de la red sismologica de Caldas las cuales fueron segmentadas manualmente con ayuda de especialistas en dos clases discriminantes Perturbaciones sismicas (ruido lluvia pasO cercano de personas a los sensores etc) y eventos (tremores

de magnitud apreciable) Con el objeto de aumentar la efedividad del estimador se nevo a cabo el preproceso de

cada una de las realizaciones que incluyo normaliiaci6n estadistica test de Gaussividad estimacion y normalizaci6n de los espectros de potencia y de funciones de correlacion Y por ultimo en calidad de funci6n caracteristica para el

118

analisis de las senales en el tiempo se analizaron dos variantes el valor absoluto y filtracion Teager Finalmente se considera que el espectro informativo esm contenido entre 1 y 25 Hz

10 5 2t1 f~_ptt)

tmpO(amp9g)

HBTCGlAIMCf FAEClfNOA rElJTTVA

no

004

0

001

no

01 --edlIIIIlJ ~ 4 -4 middot2 0 6

Fig 2 a) Espectro de potencia b) funci6n de correlaci6n y c) fdp de realizaciones de ruido de diferentes estaciones slsmicas

EI analisis conjunto para las senales de ruido sismicas de sus espectros de potencia (figura 2a) funciones de auto y crossshycorrclacion (figura 2b) y basados en el test de KolmogorovshySmirnov de vaIidacion de hipotesis para lit fdp (95 de exito) se puede tomar como valida la presunci6n sobre la gaussividad de estas perturbaciones (figura 2c)

Etapa de entrenamiento Se realizo mlllzanao como funciones caracteristicas el valor absoluto y filtracion teager de la senal con una relacion senallruido (SIN) de 20dB Se seleccionaron 200 muestras pertenecientes a un mismo evento de las cuales 100 representan el ruido ylas otras la senal mas ruido con un retardo en el tiempo de 006 seg (6 datos) Asi la red era alimentada con una matriz de 200x6 elementos

~n la pnictica se puede hacer inicialmente el valor del umbral 19ual a cero De igual manera como regIa de toma de decision se establecio la siguiente A=[ 01]

119

La validaci6n de la RN la cual se realizo con los 49 registros restantes EI momenta de arribo de la senal era estimado por la posicion del primer valor de salida A=1 dado por la RNA Los resultados obtenidos de la validacion son comparados con los momentos de ambos estimados manualmente Para eliminar disminuir la probabilidad de falsos disparos se implemento un filtro de mediana

aRVA a Pltt Vs RElAOOO EeNAL FUOO

Ii)

M354ii4S

CUFrV Pe Vf a~GITUO OE IU1ERVtlO (IE E~rrFfAllAmiddotMnITO

~

ltfISO

imiddot JJO

tiO

20

In

1 bull

~

~

=

~ ~ rdetlbI

bull ro

n

Fig 3 a) Variaci6n de probabilidad de error para diferentes relaciones SIN b) Variaci6n de probabilidad de error para diferentes retardos BIN=20 dB

Para probar los rangos de validez del modelo neuronal planteado tanto para el caso de valor absoluto como el de filtraci6n teager del registro se calculo la probabiJidad de error en Ii deteccion de la senal agregando al vector original de entrada ruido generado artificialmente hasta alcanzar relaciones SIN entre 3 y 45 dB (Fig 3a) De igual manera se evaluo el comportamiento de la red al modificar el numero de retardos entrenamiento los figura 3b

(4 8 16 32 y 64 datos) tornados para resultados pueden ser evaluados en

el la

5 RESULT ADOS Y CONCLUSIONES

La red que implementa el detectorestadistico secuencial para la deteccion de cambios abruptos fue sintetizada basandose en la estructura del correlador 0 filtro acoplado para eI caso de ruido gaussiano Aunque la RN puede ser empleada en la realizacion de filtros acoplados para otrosmiddot tipos de ruido no gaussiano determinando adecuadamente sus pesos y estructuraSin embargo debe tenerse en cuenta los siguientes momentos

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 17: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

I

El amllisis cuantitativo de la caUdad del detector de RN es muy complejo y los metodos conocidos de ajuste de sus pesos y estructura en orden a optimizar la deteccion

[9]

[10]

[11 ] son todos heuristicos [3]

La fidelidad del detector RN basicamente esta dada por la relacion senal ruido tal y como ocurre con el detector estadistico El detector RN puede mejorar su rendimiento escogiendo adecuadamente el tipo de funcion caracteristica que acentue los rasgos que se desean diferenciar como es el caso de la filtracion teager para el ~ual se comprobo que permite manejar relaciones SIN mas bajas y disminuir el error en la estimaci6n del tiempo de arribo En aplicaciones donde la aleatoriedad del proceso a la entrada sea cambiante en el tiempo de manera notable el detector de RN puede ser incluido dentro de un sistema de entrenamiento recursivo que permita el cambio de sus pesos con respecto al cambio de aleatoriedad de la senal a la entrada En otras palabras la red puede adaptarse a las condiciones de cambio de la senal a la entrada EI metodo present ado de sintesis de deteccion secuencial sobre RN puede ser generalizado para el caso de tener multiples senales simplemente agregando mas neuronas en la capa de salida [II]

Finalmente por cuanto la tarea de deteccion de senales puede ser analizada como un problema de clasificacion el algoritmo de deteccion aqui presentado puede ser empleado en tareas de clasificaci6n automatizada de eventos sismicos

Agradecimientos Los autores expresan su agradecimiento a Carlos Vargas (Ingeominas Manizales) por sus valiosos comentarios en la elaboracion del articulo

[2]

[3]

[4]

[5]

[6]

REFERENCIAS

Basseville M Nikiforov 1 Detection of Abrupt Changes Theory and Application IRISNCNRS Rennes France and Institute ofControl Sciences Moscow Russia Basseville M Benbeniste A Detection ofabrupt changes in signals alld dynamical systems SV 1986 Sleeman R Y Van E T Robust automatic P-phase picking An on-line implementation in the analysis of broad-band seismogram recordings Seismology Division Royal Netherlands Meteorological Institute Wilhelminalaan - The Netherlands 1999 Shirjaev A Ob optimalnyj metodaj v zadachaj skoryshevo obnaruzhenija 19638pp 26-51M Allen R V Automatic earthquake recognition and timing from single trace Bull Seismol Soc Am 68 1521-1532

1978 Anderson KR Automatic Processing of local earthquake data PhD thesis Mass Ins Of Technol Cambrige 1978

[7] Pisarenk V F Kushnir A F Savin 1 V Statistical adaptive algorithms for estimation of onset moments of seismic phases Phys Earth Planet Inter 47 4-101987 McCormack MD Zaucha D E Dushek D W First-break refraction event picking and seismic data trace using neural networks Geophysi(s 5867-781993

[8]

[13]

[14]

[16]

[18]

[20]

120

Murat M M Rudman A Automated first arrival picking a neural network approach Geophys Prospec 40587-604 Wang ] I Teng Artificial neural network-based seismic detector Bull Seismol Soc Am 85 308-319 1996 Hengchang Dai Colin M The application of Backshypropagation neural network to automatic picking seismic from single-component recordings J of Geophysical Research v 102n B7 15105-15113 1997 Doob JL Stochastic Processes Ed Wiley NY 1953 Deshayes J Picard D Principe dvariance sur Ie processus de vraisemblance Anna1es de lIHPV20 1-201984 Basseville M Edge detection using sequential methods for change in level Part n IEEE Trans on ASSP ASSP 29132shy

50 feb 1981 Hines WO A simple monitor of a system with sudden parameter changes IEEE Trans On Inf TH it 22 2 210shy

216 march 1976 Berger J Sax R Seismic detectors The state of the art

SSR-R-80-4588 Baer M Kradolfer U An Automatic phase pecker for local and teleseismic events Bull Seismol Soc Am 77 1437shy

1445 1993 Zjuko A Fink L Teorija Peredachi Signalov Radio i Svjaz

M1986 Lippmann R Bekman P Adaptive Neural Ney Preprocessing for signal detection in non gaussian noise Adv Neural Information Processing System Vol I 1989 pp 124-132 Fa-Long L Unbehauen R Neural network for signal detection Cambridge 1998 pp 112-151

REDES NEURONALES ARTIFICIALES APLICADAS EN LA SIMULACION DE LA FILTRACION DE ONriAS SiSMICAS A TRA vESDEL SUELO

JMLondono M A Meza Oliveros J Eduardo Hurtado -pcinevadomanizalesunaleduco

Universidad Nacional de Colombia SedeManizales Grupo deControl y ProcesamientoDigital de Senales

Resumen Se presentan resultados de aplicacion de las redes neuronales artifieiales para estimar la transformacion que sufren las ondas sismica a su paso por el suelo Se exploraron diversas arquitecturasy algoritmos de entrenamiento de las redes asf como dos alternativas sobre el mapeo entre la excitaeion Sismica en la roca y la respuesta en campo libre es decir usando las senales sismicas 0 los espectros de respuesta de aceIeraci6n Se concIuyo que e) tipo de red neuronal conocida como de retropropagacion es aplicable solo aI caso del mapeo del espectro de aceleraeion bajo Ia condition de que los espectros usados en 1a fase de production de la red no presenten grandes diferencias de magnitud con los usados para el entrenamiento Por otra parte se encontro que la red de retropropagacion con retrasos es aItamente adecuada para el caso deentrenamlento con seiialesen laroca y 1a superficie siempreycuando los sismos de entrenamiento y produceion respectivamente presenten semejanzas en sus pIanos de fase

Palabra~ clave RelIes neuronales artificiales identific~ci6n de sistemas ondas sismicas ~ ~

L INTRODUCCI6N

Los m~~iinieritos sismicos en la superficie i~rrestre son cauSados poi fenomenos que involucrim la liberacion de una grancantidad deenergia la cual se propaga a travesdel suelo en rorinade ondas que pueden ser registradas pol aparatos especificos como los acelerometros parasu posterior identificaci6n y analisis

Un mismo evento sismico causa efectos que varian para cada una de las regiones sobre el globo terrestre incluso en una misma region segun las propiedades dimlmicas y geometricas de los diversos depositos alii existentes este fenomeno es conocido como condiciones locales de sitio [14] Debido a que muy pocas veces las estructuras se cimientan sobre el lecho rocoso y que en la mayoria de las ocasiones se requiere posar la cimentaci6n en terrenos de menor cali dad situados en estratos superiores es necesario conocer coal es el efecto de la existericia de estas capas de suelo sobre las caracteristicas sismologicas del lugar en que medida varian los panimetros de la amenaza sismica regional y que tipos de efectos adiCionales ptieden ocasionarse can el fin de adoptar un deteiminado valor de la accion Sismica de diseno

LaSredes neuronales artificiales (RNA) son funciones caracterizadas porun alto grado de parametrizaci6n y una fuerte interconexion entre las variables y transfoimaciones de

estas que buscan representar de manera conveniente el Illapeo de variables de entrada sobre las de salida de un sistema dimimico complejo De esta manera si se logra realizar estimativos correctos de la respuesta del sistema con

las RNA se puede utilizar estas como sustituto del sistema tanto en su forma instrumental como en su modelo matematico

En este trabajo se estudia su aplicabilidad al problema de la amplificacion de las ondassismicas a traves de capas de suelo La investigacion giro en tome a encontrar la relacion existente entre las cargas dimimicas que producen -Ia excitaci6n en la base dellecho rocoso y la respuesta generada

en superficie por el estrato particular de suelo en estudio

2 ESTIMACI6N DE CARACTERiSTICAS CON RNA

Se reemplazani un sistema flsico por una red neuronal artificial para lograr una estimaci6naceptable de las

caracteristicas del sistema a partir de senales de entrada y salida para 10 clial se requirio de la fusion de las dos siguientes redes especializadas

21 RNA recurrlmtes Se caracterizan por que las salidas deun grupo de neuronas se retroalimentan como informacion de entrada a un conjunto de unidades en capas anteriores en la misma capa 0 incluso sobre si mismasComo consecuencia de estas conexiones se establecen comportamientos dinamicos al interior de la red

que no son practicables en redes de alimentacion estricta hacia adelantePor sus conexiones una RNA recurrente puede ser vista como un sistema dinamico no lineal [II] el comportamiento limite en un sistema dinamico no lineal puede alcanzar un estado estable (punta fJjo) una oscitacion (cicIo limite) 0 una inestabilidad aperiodica (caos) Cuando el espacio de estado de un sistema dinamico no lineal es dibujado estos tres regimenes tienen caracteristicas graficas propias llamadas atractores los puntos fgos se muestran como atractores puntuales losciclos limites como atractores peri6dicos y los ca6ticos como atractores an6malos usualmente de naturaleza fractal Pequenos cambios en los parametros de control pueden llevar a fases de transicion entre estos regimenes

121

En el entrenamiento una RNA recurrente actua como filtro comprimiendo la infonriaci6n historica para representarla 10 mejor posibJe Esto es mas eficaz cuando la informacion historica importante nOesta demasiado distante en el pasado (alta correlacion) La arquitecturay el entrenamientodeesta red no son ostensiblemente compHcados En muchos casas los lazos recurrentes tienden a pesos fijos y la regia de apreridizaje general de retropropagacion puede ser generalizada sin dificultadLa activaci6n- a de un nodo

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 18: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

puede ser representad~ por la siguiente ecuacion diferencial propaga hacia atnis a traves de la capa y 11 es la tasa de donde Xi representa las entradas extemas aprendizaje

w~(t+ 1)=w~(t)-11 o~(t)middota-I(t) I ( 5 ) Ill =-a+ ~yp) (1 )

= w lj (t)-6wij(t)

En general la solucion para (I) exhibe oscilaciones pero es -2ekCt)middot(s(t)) =L

necesario obligar la convergencia a puntos fijos queseran la 0- K 6 salida de la red Para su calculo se supone que el punto fijo J - (sj(kraquoa~+I(t)wj1 lL-I () existe y es estable esto es ill = 0 entonces se puede escribir

(2) donde hi representa la entrada neta PaHlcada qodo

a = f(~a+x)~~) middot(2)

22 RNA de retropropagaci6n temporal Estas corresponden a algoritmos de entrenar redes de propagacion hacia delante Se diferencia del convencional porque introduce conexiones con retardo entrelneUrOna1 para dade caracteristicas dinamicas a los elementos de procesamiento Estas conexiones temporales pueden ser pensadas a manera de los coeficientes de filtros de respuesta (k)

Fig 2 Propagacion hacia atras del error en una red temporalal impulso fmito (FIR) comunmente usados en el procesarniento de senales digitales EI sentido de esta

3 RESULTADOS EXPERIMENTALES modificacion es incorporar a la red ladependencia en el tiempo de la serie de datos manipulados[I3]

La investigacion se condujo mediante la metodologiade ensayo y error Las pruebas realiza~as fueron las siguientes

Prueba 1 Inicia con uno de los algoritmos mas usuales en las diversas aplicaciones de las RNA denominados de retropropagaei6n (Backpropagation) [7] Se inici6 el entrenamiento con un patron de entrada-salida formado por registros de aceleraciones en roca basal y superficie libre respeetivamente Se usaron los eventos F33aRn y F33aSn de la redSMART-I de Taiwan [6] La fase de entrenarniento se puede resumir como sigue

bull Entradas X(t) Y(tJ t = 1 n bull Arquitectura I Imiddot 6middot 6 I neuronacapa bull Ndeg de ciclos 2000

ahJ bull tl

L-_-+t(l) bull (E) t(

s(t) bull Tiempo II min bull EMC

1 460 mlseg2 Fig I Propagacion hacia delante de una red temporal

bull Entrenamiento Mal

EI valor de la entrada neta para la neurona j en la capa y su bull Simulacion Mal

valor de activaci6n se expresan en (3) y (4) respectivarnente I I R EI diseiio de la RNA no es sufieiente para aprender la senal

s~(t)= ~gt~(t)+bj = L LWr a-ICt-r)+bj presentada La informacion suministrada es demasiado I~I 1=1 r=O ( 3 ) ca6tica confunde a la red y esta solo exhibe como salida una I pequeiia oscitacion alrededor del eje cero durante todo el LWija-I(t)+bj evento

=1 Prueba 2 Para ordenar los datos de entrada a Ia red se

aj(t) = f(s~(traquo)~ f(~ ~va-I(t)+bl ) (4) establecio un modelo NARMAX [I] para el eual la salida Y(t) correspondiente a las aceleracionesen superficie para nuestro caso solo depende de los valores pasados de entrada siendo wij=lWiWij2 bullbull wijr bull bull WijRJ X(t) que son las aceleraciones en roca para el mismoevenlO

-1 () r I-I () -1 ( bull I) -1 ( R)]ya l t=la t af (- at tshysismico Se implemento ademas el algoritmo de

En resUmen el algoritmo de retropropagaeion temporal se

define como sigue donde el valor O~(t) es error que se I En todos los casos se usaton funciones de activaci6n tallgente-sigmoide rata capas ocultas y Iinealespara la de salida

Error cuadratico liledio

122

r

entrenamiento de retropropagacion modificado por COtFCqHm EST ~IAZOAltER1tJ

Levenberg-Marqurupt [12]

Entradas X(t- r) Y(t)t= 1n H~=~l r =1 4 bull4 Z 4 bull bull 10 _ _12

bull Arquitectum 4middot 6middot 3middot 1 neuronacapa bull N de cic1os 7400 bull Tiempo 150 min bull EMC 328 mlseg2

bull Entrenaniiento Mal ~ I ~ 10 I ~lbull Simulacion Mal (b)El umeo progreso respeeto a la primer prueba es que esta

flO~NT tlaquoInELAZOCEMAOO

exhibe oscilaciones en la etapa de simulacion aJ lIegar a la fase fuerte del evento indistintamente de su magnitud sin embargo los resultados son aun demasiadci imprecisos y por ~no se refma el modelo tomado de la teona de identificacion I~de sistemas agregando a la entrada un vector que controle la dependencia en el tiempo de la salida del sistema J~

-t

Prueba 3 En este caso se desea que la salida Y(t) nb s610 dlipenda de los val ores pasados de entrada X(t) sino tambien 10 I

bull middot78 to~~ f -f1pI _ _~RHAIde su propia historia en el tiempo De nuevo seutiliza el algoritmo de entrenamiento de retropropagacion modificado (c)

ACEFICAWEHroF30tamLAlCCEAfWJOpor medio de Ia optimizacion de Levenberg-Marquardt Se ~~r---~--------r---

L f J

__-

trabajocOll elparderegistros F39aRn y F39aSn de Iii re(i f f~SMART-I de Taiwan POf que presentan las maximaS ~1

i aceIeraciones entro de Ia gama de registros disponibles pues ~

pruebas realizadas sobre aceierogramas suaves produjeron f resultados defieientes en rangos de aceleraciones fuertes ~~

-001

01~x(t-r) Y ) t=I bullbull nbull Entradas (t ~I f I Y(t-I) r==1 4 bull ~ u _ u ~ u

-1- _1bull Arquitectura 6middot 6middot 3middot 1 neuronacapa

(e)bull Ndeg de ciclos 300 Fig 3 (a) Simulation law abierto de vector de entrenamiento (fragmento debull Tiempo 5 min F39aSn) (b) Siml1Iacion lazo abierto para registros F39aSe (e) Simulation a

bull EMC 205 mlseg2 Iazo eerrado del registro de entrenamiento completo F39aSn (d)

bull Entrenamiento Bien Acercamiento de los primeros datos de la figura e

bull Simulacion supeditada al tipo de produccion Este ensayo es una aproximaclOn inicial a las RNA

F39C~NORTE -EHJJmNAUIfUTn recurrentes en su proceso especifico conocido como trabajo a lazo abierto [12] Se observa que en muy pocos ciclos de

entrenainiento la curva del errorse estabiliza y alcanza unIf ~ valor minimo aceptable ademas de un buen desempeiio de Ia -2 f

~1 serato red al hacer simulaciones a lazo abierto Se presenta una -tlDPflESTADELARXA elevada capacidad de generalizacion ante cuaIquier evento

sismico suministrado a lared ya sea estefuerte 0 suave (fig 11 ~ 3a 3b) pero al realizar las simulaciones a lazo cerrado (con

u retroalimentaci6n) la red exhibe una alta sensibilidad a la11 =Y~~ o ~Setl presencia de pequefios errores (fig 3c) ya que estos se van

acumulando punto tras punto dtsenibocando en una(a) efectividad nula despues de unos pocos puntos de predicci6n generando un desbordamiento en los datos simulados (fig 3d)

Esta red presenta optimas caractensticas para ser usada en control de estructuras [IJ donde es uti aI momento de predecir ei movimiento de una edificacion en un paso de tiempo inmediatamente futuro Con el coriocimiento de 1Inos cuantos puntos del registro real tanto de entrada como de salida medidos en instantes inmediatamente antenores [4J

123

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 19: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

Prueba 4 Esta exploracion surge por la necesidad de suavizar las senales de entradas de la red Se trabaja con el logaritmo en base 10 del espectro de aceleracion tomada en un instante t y el valltu del periodo correspondiente para estimar el valor del espectro logaritmico de aceleraciones en superficie para el mismo t Entrenado con el algoritrno de Levenberg-Marquardt sobre los datos generados a partir del

evento F41 de la red SMART-1

Log(Sa (Iraquo bull Entradas x Log(Say (Iraquo

T(t)

bull Arquitectura 2middot 2 2 I neuronalcapa bull N de ciclos 10450 bull Tiempo 835 hr

2 bull EMC 145 mlseg bull Entrenamiento Bien bull Simulacion supeditada al tipo de evento En general se observa un buen comportamiento del sistema artificial El entrenamiento (fig 4a) y simulacion para eventos considerados como d6biles similares en magnitud al de entrenamiento es aceptable (fig 4b) No obstante la validacion para los eventos clasificados como moderados 0

fuertes no presenta unmiddot buen desempeno (fig 4cEsto evidencia la insuficiencia de la red para generalizar eventos en rangos muy diferentes a los tot1uidos para el entrenamiento por 10 que se hace necesario una mejor clasificaci6n de los patrones de entrenamiento

r===- J gt0 0$ 1 no a 2$ l

~) I_Real ~_ ~AIt4IttC---- I bull ~ t U a u ~

PlOdoiSIIq) I_AnI ___8i~fl4ld1

(a)

~-~j - - n _ bullbull

~-------~= o 05 1 U 2 25 J

p~-V11-J1ul _~~~Aedl f33 COYPOHE~~ mspuESiA DE RNA

ltc 1 bull U t 1~ an)

p~aql l_AelII ___~Attodl

(b)

- middot-- middotmiddot -nnmiddot __n_II~~ ~ U I 1 2 U ~

pnodo($ttll_~ ~RiMI

l~~

~ I~ 2 I

iU bull 5 au) P~ l_AnI ___~AtdJ

(c) Fig 4 (a) Fase de entrenamiento evento F41 N-S (b) y (c) simulaciones para

los eventos F33 NmiddotS y F45 EmiddotW respectivamente

Prueba 5 Teniendo en cuenta los resultados aceptables obtenidos con las sefiales suavizadas y observando la tendencia de cualquiersistema dinfunico de imponersu periodo natural de vibracion a la onda incidente [9] se procedio a realizar una evaluacion de los espectros de respuesta de aceleraciones para amortiguamientos del 2 5 y 10 del critico sobre todos los registros sismicos [8]EI patron de comportamiento encontrado permite manejar en principio dos RNA para precisar la respuesta del suelo entre amplificacion y atenuacion Para ello se decidio filtrar laS senales tomando como periodo de corte a 05 s mediante el disefio de un filtro digital pasa-banda Adicionalmente se tomaron como datos de entrada del sistema no solo las acelernciones del evento sino tambi6n sus velocidades y

desplazarriientos convenienteinente escalados estos ultimos fueron caIculados mediantela integracion num6rica de los registros de aceleraciones luego de haber realizado 1a correccion por linea de base Los algoritmos usados hasta el momento no permiten un apropiado manejo dimimico ni de la dependencia en el tiempo demandados por las senales sismicas Por ello se opl6 por la aplicacion del algoritmo de retropropagacion temporal igualmente se considero conveniente el uso del gradiente instantaneo y la funcion de costa instantanea [2) al mismo tiempo que se acoplaron lazos recurrentes entre las capas de entrada y salida para forzar el cumplimiento de las exigencias impuestas por la serie de datos objeto de la prediccion bull Entradas Xc(t - r) Y() t = 1 n

r 13 donde Xc es un vector que aceleraciones velocidades y

desplazamientos bull Arquitectura 43 106 84 1 neuron8retarwlCapa bull N de ciclos 70000 bull Tiempo 78 hr

2 bull EMC 181 mlseg bull Entrenamiento Bien bull Simulaci6n Mal Se alcanzo un buen resultado en el entrenamiento de la red para ambas fases de la exploracion indicando que se esta manejando debidamente el sistema artificial Uno de loS logros destacables en esta prueba es el control sobre el desbordamiento de los datos pues las simulaciones se realizaIl a lazo cerrado adem as existe estabilidad en el proceso de entrenamiento puesto que se alcanzo un error niinimo estable

124

_ubull_

Ij~ ~E ~

(a)

I~ ~ - middot---middot~---~ r

J~~l~~~fbull ----It

(b)

1~w1~ e i l ~ ~----~

Iamp~ - (c)

Fig 5 (a) (b) y (c) corresponden a la suma de las respuestas de las redes en ambas fases de entrenamiento para los eventosF43 Este (vector de

entrenamiento) F43 Norte F41 Este en su orden

EI sistema de RNA esta en camino de asimilar con sUficiencia el fenomeno que se quiere describir sin embargo el hecho de que no se logre un buen desempefio en Ia validacion del disefio para ninguna de las simulaciones se imputa a la heterogeneidad en los patrones de entrenamiento debido a que corresponden a eventos sismicos de caracteristicas muy diferentes entre S1 Estas diferencias pueden ser observadas en el graficomiddot que muestra la relacion dinamica que existe entre las variables que se quieren interrelacionar los diagram as de

fase 0 atractores (fig 6)

125

Fig 6 Relaciones dinamicas para eventos sismicos de la red SMART-I Taiwan

Prueba 6 La heterogeneiclad de los eventos sismicos a los que se tuvo acceso ocasionan que el suelo estudiado vatie su comportamiento entre rangos lineales y no lineales para cada caso esto impide a la RNA encontrar patrones de genemlizacion en el fen6meno estudiado Se busco entonces obtener muestras de entrenamiento mas homogeneas y con un numero de datos 10 suficientemente representativos de elIas Fue asi como se decidio tmbajar con registros sint6ticos de aceleraciones generados con parametros adecuados para la obtenci6n de aceleraciones propias de una geologia en roca Fueron generados mediante el metodo de modulacion uniforme aplicando el modelo de Kalla Tajimi [3] Para completar los pares de patrones de entrenamitmto de la RNA (roca-superficie) fue necesario procesar los registros sinteticos con el progmma de analisis de respuesta sismica SHAKE que esta fundamentado en modelos de propagacion de onda unidimensional concomportamiento del suelo en el rango lineal [5] Se utiliza la misma estructum de red y el mismo algoritmo de entrenamiento de la prueba anterior

bull Entradas Xct - r) yet) t = 1 11

r 3 donde Xc es un vector que acelemciones velocidades y

desplazamientos bull Arquitectura 43 86 84 1 neuronaretardlcapa bull Ndeg de cic1os 10000 bull Tiempo 258 hr bull EMC 154mlseg2

bull Entrenamiento Bien bull Simulacion Bien Se generaron cincuenta registros sinteticos de aceleraciones en roca con un intervalo de tiempo de 002 seg y sus respectivas respuestas en superficie calculadas con el programa de amllisis dinamico SHAKE

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 20: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

j~ I o 5 10 1$ 0 II

r ts-9 MSPJEsTA[ttAHA

1~1rt bull to l 20 2S

nrro I)

(a) poundlVECmoOE AE8~8TADEACtlfAACtIHIS Alt

Uj

s

OAI

s OJ

u

bullbull oMi

I

bull Itf2U3~14$ P~eg) (~ __$ RHAI

(b)

i~lbull $ bull ~ B 8 H -

1FE= I o bull to tI

r__

(c) Ur_~_sPE_bullbull=bullL==~_

bull

lu

0

~ ~ _--shy

1$2U3U44S ~I_Sh ___~A1tAmiddot1

(d) fSEEcmOMEOOOE $OREAlIt4CDfES

bullbull-_-_ -shy J I

bull 1 tS 2 U 2 3$ 4 p~ t_srIIot _~tJU

(e)

ESfpoundCmo tltDEBlESV-GIOHE5TamptlaquoWf tiE 5lJ IIIEAllZACDtE5

~ jus

bull 1 f U U ~

P~) _ShaM ___S~RmiddotHAl (t)

Fig 7 (a) y (b) registro sintetico de entrenamiento y sus espectros de respuesta (c) y (d) simulaci6n de una realizaci6n sintetica y su espectros de respuesta dc aceleraciones (e) y (f) espectrO de respuesta de aceleTaciones medio y media+desviaci6n eslimdar de 50 realizaciones (NOTA todos los

espectros para un 5 del amortiguamiento critico)

La figura 7 evidencia que la arquitectura de RNA empleada el manejo de las entradas y el algoritmo utiIizado en esta exploracion son acertados y ban permitido a al sistema artificial encontrar los pesos y tendencias optimos para establecer una correspondencia apropiada entre los datos de entrada y salida del sistema real con precision suficiente desde el punto de vista practico Tanto parillos acelerogramas como para los espectros de respuesta de aceleraciones los valores estimados por la red se ajustan aceptablemente en fase frecuencia y magnitud a los datos reales Asimismo se explorola respuestade lared al evaluar 50 registros sinteticosmiddot encontiando una alta precision con los valores reales evaluados sobre los espectros de respuesta de aceleraciones correspondiente a los valores de la media y la media mas la desviaci6n estindar del conjunto analizado

alzah~ s1)~~ 1 PoM~CrISriltl~~

G1

~ j

t)

r-~

~+(Izin~~CI3 ~lti~1Str~ltt11

~~~

-)~2- middot01 (f (q f1

~e ~

Fig 8 Relaciones dimimicas para 4 realizaciones sinteticas En la figum 8 se muestran las relaciones dimimicas de 4 acelerogramas sinteticos Se advierte que existe afmidad entre elias mostrandoque los sismos poseen caracteristicliS similares corroborando la necesidad de bomogeneizar los datos para alcanzar un buen comportamiento del sistema neuronal artificial

4 CONCLUSIONES

EI exito en el manejo de RNA tiene relaciori directacon la adaptacion que se baga de esta al problema en amilisis Se requiere de una arquitectura y un algoritmo de entrenamiento que representen apropiadamente el sistema real que se desea reemplazarsiendo necesario incluso crear 0 modificar

126

algoritmos existentes En caso concreto se preciso de un sistema artificial con caracteristicas dinamicas y espacio~ temporales obligando a la implementacion de un bibrido entre las RNA de retropropagacion temporal y recurrentes adicionando la propiedad del gradiente instantaneo La presente investigacion constituye un primer paso en la

utilizacion de inteligencia artificial para describir el comportamiento de los suelos En futuras aplicaciones se considera la incorporacion de sistemas 16gicos difilSOS para manejar las limitaciones en cuanto manejo de senales con diagramas de fase siinilares creando sistemas generales que permitan c1asificar la informacion disponible para que sea procesada por subredes especializadas

REFERENCIAS

[IJ ASTROM K Y WITIENMARK B Computer Controlled Systems Lund Institute of Technology 1994

[2J BACK A WAN E LAWRENCE S Y TSOI A A UnifYing View of Some Training Algorithms for Multilayer Perceptrons with FIR Filters Synapses 1999

[3J BARBAT AH OROSCO L HURTADO JE GALINDO M Defillicion de la Accion Sismica Monografias de Ingenieria Sismica No 10 Centro Internacional de Metodos Numericos en Ingenieria Barcelona 1994

[4J CHEN H QI G YANG J AMINI F Neural Networkor Dynamic MJdel Identification Journal of Engineering Mechanics 121 1377-1381 1995

[5J DAS HM Principlesmiddot of Soil Dynamics PWS-Kent Boston 1993

[6] FIGUERAS S BLAZQUEZ R ROCA A y GOULA R Site Effects in the SMART-I Accelerometefarray Proceedings of Fifth International Conference on Seismic Zonation 731middot 738 Nice Ouest Editions 1995

[7] FREEMAN J A Y SKAPURA D M Redes neuronales -Algoritmosaplicaciones y tecnicas de programacion Ed Addison-WesleylDlaz de Santos Wilmington USA 1993

[8J GARCIA L E Dinamica Estructural Aplicada Al Disefio Sismico Universidad de los Andes Santafe de Bogota 1998

[9] HATCHER R D Structural Geology Merrill Publishing Company Toronto 1990

[10] HURTADO J E Modelacion estocastica de la accion sismica Monografias de Ingenieria Sismica No 33 Centro

Internacional de Metodos Numericos en Ingenieria Barcelona 1999

[IIJ JANG J SHING R SUN CT y MIZUTANI E NeuroshyFuzzy and Soft Computing Prentice Hall New Jersey 1997

[12] LIN CT y LEE CSG Nellral Fuzzy System Prentice Hall New Jersey 1996

[13J WAN ERIC A Finite Impulse Response Neural Networks With Applications In Time Series Prediction PhD Thesis Stanford University November 1993

[14] YEPEZ F ABRICIO Metodologia para Ie evaluacibn de fa vlInerabilidad y riesgo sismico de estructuras aplicando tecnicas de simuadon Tesis doctoral Universidad politecnica de Cataluiia Barcelona Espana 1996

127

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 21: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

INV ARIANZAS EN DOS DIMENSIONES TRASLACIONROTACION Y CAMBIO DE ESCALA CON REDES NEURONALES DE ALTO ORDEN

)

Stella J Olivero M (stellaoliveromyahoocom ) Francisco 1 Ibargilen O (frajibochotl1tailcom ) Eduardo F Caicedo B (psieieeunivalleeduco - ecaicedoeieeunivalleeduco)

ijGrupo de Inteligencia Computacional Escuelil de Ingenieria Electrica y Electronica

Universidad del Valle Colombia

Abstract -This work is focused only on a small subclass ofthe En la arquitectura del Perceptron de Alto Orden no hay capas problems corresponding to the human ability to recognize ocultas pero si existen las asi llamadas Conexiones de alto patterns such as images andor written characters (by hand or orden Estas conexiones no lineales usualmente se propagan by typewriters) independently of its size orientation or position haciaadelante y se forman con el producto de dos 0 mas which is done when a document Is read or concrete figures are entradasobserved without thinking on it A high order neural network

Este tipo de red neuronal tiene algunas ventajas sobre clwas designed to be invariant to geometric transormations such Perceptron multicapa Es una arquitectura simple que reduce as scale traslation and rotation on a plane The Invariances are

incorporated directly into the network architecture thus for 2D potencialmente el numero de parametros requeridos para el images recognition the network only needs to learn one view of entreriamiento preteridiendo asi aprender mas rapidamente each class object and not numerous scaled rotated and traslated teniendo a su vez un tiempo de respuesta mas corto es decir views The image to work is represented by a matrix of either mayor veloCidad ensu tiempo derespuesta muy a pesar de la active or inactive pixels (ie the character T) The High Order gran cantidad de calculos requeridos para este tipo de rcd Neural Network used for such a purpose is the Third Order [Thimnd997] [Giles 1987] Perceptron which will take charge oflooking for the correlation among its inputs based on the invariance to geometric

2 INV ARIANZAS CON UN PERCEPTRON DE transformations that we have incorporated to the network TERCER ORDEN architecture

Keywords High order neural networks geometric El reconocimiento automatico de imagenes ha sido a 10 largo invariances pattern recognition two-dimensional images de mas de 30 anos un campo de interes en la Inteligencia

Artificial proceso en el cual se encuentranentre otros la l INTRODUCCION captacion de imagenes extraccion de caracteristicas la

identificacion de partes identificacion invariante a

IPorque pensar en las Redes de Alto Orden c~-~l( iiiEI Perceptron estlindar es aceptado como la primera red 0

gt~ W neuronal artificial [Rosenblatt 1958] Sin embargo esta red ~0 yen -~~~~~

tiene una importante limitacion su capacidad para clasificar y para aproximar modelos esta fuertemente restringida a tipos de separabilidad lineal sin embargo esta topologia es la base del desarrollo de nuevos modelos que superan dichas limitaciones Uno de los modelos con mas trascendencia 10

lt1constituye el Perceptron Multicapa de Alto Orden [Minsky Fig I Red neuronal de tercer orden las entradas son correlacionadas en 1969] Minsky y Papert hicieron un analisis exhaustivo

tripletas en el preprocesamientomatematico del Perceptron Multicapa de Alto Orden descubriendo importantes potencialidades en ellos sin

transformaciones geometricas 0 a cambios de iluminacion embargo tambien encontraron que estos Perceptrones de Alto

oc1usion parcial de los objetos etc Orden eran impracticos (en su tiempo debido a la falta de Motivados por esta problematica se penso en obtener un recursos computacionales) debido a la gran explosion sistema robusto a las invarianzas de traslacion cambio de

combinatoria de terminos de alto orden que se debia manejar escala y rotacion en un plano de manera simultanea situacion que aim no se supera del todo cuando se pretende Para tal proposito se propone usar una red neuronal de tercer trabajar con gran cantidad de datos haciendose necesarias las orden como se muestra en la figura I estrategias de seleccion de la informacion Todas las entradas en una red de tercer orden son primero El ampliamente conocido Perceptron estandar tambien puede combinadas en tripletas en Ia capa de preprocesamiento y la ser llevado a un Perceptron de Alto Orden Ademas es salidaes determinada aplicando la funcion de activacion a Inimportante indicar que este ultimo es Ull caso particular del entrada neta ecuacion (1) tal como se realiza en unPerceptron Multicapa de Alto Orden de Minsky y Papert Perceptron estandar [Giles1987bJ [Reid 1989J [Perantonis [Minsky 1969] [Giles 1987] [Hertz 1991] [Fiesler 1997] 1992] [Bishop 1995]

128

El caracter a identificar se toma dentro de una matriz pixeles y = f ~W(i j kl)x jXX (1) en forma binaria los cuales pueden estar activQs 0 inactivos

A fin de facilitar el procedimiento se trabaja con una informacion parcial de los datos presenlandose a la red

Cada combinacion de tres pixeles forma un triangulo con sus solamente las coordenadas de los pixeles activos

angulos internos definidos como (0 3 r) [Reid 1989] Se procede a introducir los datos de entrada a la red los cuales estiin conforrnados por las coordenadas cartesianas del

[Spirkovska 1992] tambien cabe mencionar que los respectivo pixel en la capa de preprocesamiento se forman

triangulos son invariantes a cambios en su posicion tamano 0 grupos de tres entradas para asi obtener los angulos internos

rota cion en un plano como se muestra en la figura 2 del triangulo que definen tales puntos como se muestra en la figura 2 Los triangulos representan las invarianzas frente a traslacion rotaci6n y cambio de escala por 10 tanto es muy importante establecer dentro de la capa de preprocesamiento la relacion establecida por los angulos internos de un triangulo ecuaci6n (5)

a = COs-1[(c 2 +b2 -a2 )2bc]

Fig 2 Invarianza a Posicion traslacion y rotacion en un plano 3 = COS-I [(c2

- b2 + a2)2ac] (5) Asi a fin de construir la red a que sea invariante a estos tres cambios simultaneamente restringimos los pesos de tal forma r =COS-I [(a 2 +b2

- c2)2ba] que todos los conjuntos de tripletas que geometricamente forman triangulos semejantes son conectados a la salida con En donde a bye representan la medida de los lados el mismo peso como 10 muestra la ecuacion (2) [Reid 1989] opuestos a los angulos a f3 y r respectivamente[Spirkovska 1992]

Una vez establecidos los angulos internos para cad a tripleta de entradas se verifica si estos angulos no han sido hallados

Wi k = w(io 3 r) = w(i 3 ro) (2) antes para asignarle el peso almacenado para tal caso de no ser asi los pesos se asignan de manera aleatoria Se continua = w(i ro 3) con el proceso de entrenamiento apIicando la regIa del

Esto es cierto siempre y cuando la secuencia en la medicion Perceptron y ajustando los pesos como se indic6 en las

de los angulos sea la misma pero no importando que angulo ecuaciones (2) (3) y (4) se mida primero Para la actualizaci6n de los pesos se aplica la ecuacion (3)

4 APRENDIZAJE Y V ALIDACION

LW=O(Sd -sr)xjxkx (3) Para el aprendizaje de la red se utilizQ un caracter base que nos representara la letra T como se muestra en la figura 3 Donde 0 representa la rata de aprendizaje Sd es la salida

deseada y S r es la salida real de la red quedando los nuevos

pesos asi

Wew =Wold +Lw (4) II3 PROCEDIMIENTO EXPERIMENTAL

Fig 3 Representacion del caracter T con el cualla red fue entrenada Se aborda el problema de reconocimiento de tres transformaciones geometricas simultaneas con el algoritrno Debido a la explosion combinatoria que se presenta al trabajar de red de alto orden desarrollado y se prueba con uno de los con redes neuronales de alto orden se trabajarii con parte de problemas clasicos de identificacion de invarianzas como 10 la informacion que representa las imagenes decir solo con la es Ia discriminacion de los caracteres T y C propuesto informacion que corresponde a las coordenadas de los pixeles por Rumelhart en 1986 [Rumelhart 1986] este problemaha activos 10 cual podria llamarse conectividad especificasido posteriormente retomado por algunos autores como existen otros tipos de metodos para realizar la seleccion ejemplo para presentar sus desarrollos sobre el tema parcial de las entradas como por ejemplo la conectividad

regional local y la conectividad muestreada [Reid 1989J El problema TIC originalmente solo se propone para ser [Spirkovska 1992] invariante a cambio traslacion y a rotacion con giros restringidos a 90 grados la invarianza a cambio de escala fue EI proceso consta de dos pasos el de entrenamiento (en el propuesta en trabajos posteriores [Giles 1986b J [Spirkovska cual la red debe aprender un unico caracter T presentado) y 1992] de vaIidacion (el cual se realiza con la presentacion de varias

representaciones de la letra T con algunas yo todas las

129

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 22: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

bullbullbull bullbullbull bullbullbull

transfonnaciones deseadas a la red neuronal de alto orden) Una vez se ha entrenado la red se guarda Ia matriz de pesos y se procede a continuar con la validacion Para la validacion se Ie presentaron a la red diferentes tipos de representaciones de la letra T trasladada rotada aumentada disminuida de tamano y en muchos casos con todas las transfonnaciones simultaneas y tambh~n se lepresentan patrones a los cuales se les ha eliminado cierta infonnacion ejemplos de patrones con los que se realizaron las validaciones son presentados en la figura4 Los resultados de la validaci6n muestran un exito total pues el 100 de los casos presentados fueron correctamente clasificados

II Fig 4 Representacion del canicter T con las diferentes transfonnaciones con las cuales la red fue validada obteniimdose un 100 de precision en la

identificacion

5 CONCLUSIONES

Los resultados obtenidos son muy satisfactorios respecto a trabajos del mismo tipo realizados con las redes neuronales tradicionales debido a que no es necesario presentar en el proceso de aprendizaje muestras de patrones con todas las transfonnaciones que se desean identificar

Se desarrollo un algoritmo robusto ante las transfonnaciones geometricas elegidas

Este tipo de prueba resulta prometedor en diferentes campos de la Inteligencia Computacional que necesite de reconocimiento optico como por ejemplo en el campo especifico del reconocimiento 6ptico de caracteres (OCR) se encuentra para citar algunos ejemplosla identificacion de manuscritos el reconocimiento de imagenes meilicas etc

Podemos entrenar la red para que por cada salida logre identificar dos caracteres y por 10 tanto si aumentamos el numero de salidas podemos mediante la presentacion de un

patron base lograr de una fonna mas robusta el reconocimiento por completo del alfabeto con menos cantidad de tiempo de entrenamiento

6 REFERENCIAS

[Augustein I 997J M Augustein and M Winterbottom IIInvariant Object Recognition Using High Order Neural Networks Line Segment Spectra and Multi-Resolution Training International Journal ofNeural Systems 8 ndeg 3 pp 251-2621997

[Bishop 1995] C Bishop Neural Networks for Pattern Recognition Oxford University Press ppl33-135 326shy329

[Fiesler 1997] E Fiesler and R Beale IIHandbook of Neural ComputatIon1I OUP and lOP Pub 1997

[Giles 1987aJ C Giles et al Encoding Invariances in High Order Neural Networks Prenetado a la IEEE Con On Neural Inf Proc Systems-Natural and Synthetic Nov 1987 [Giles 1987b] C Giles and T Maxwell Learning Invariance and Geeneralization in High-Order Neural Networks Applied Optics 26 11deg 23 pp 4972-4978 Dic1987

[Minsky 1969] M L Minsky and S A Papert Perceptrons MIT Press Cambridge Massachusetts 1969

[Perantonis 1992] Perantonis S Y Lisboa PTraslation Rotation and Sacle Invariant Pattern Recognition by HighshyOrder Neural Networks and Moments Classifier IEEE Trans On Neural Networks vol 3 Ndeg 2 pp241-25I marzo 1992

[Reid 1989] M Reid and 1 Spirkovska Rapid Training of High~Order Neural Networks for Invariant Pattern Recognition Proc Joint Int Conf on Neural Networks pp 689-692 Washington DC 1989

[Rosenblatt 1958] F Rosenblatt The Perceptron A Probabilistic Model for Infonnation Storage and Organization in the Brain Psychological Review 65 Reimpreso en el texto Neurocomputing (J Anderson y E Rosenfeld ed) pp 92-114 MIT Press 1998

[Rumelhart 1986J D Rumelhart et al Learning Internal Representations by Error Propagation Ch 8 in Parallel Distributed Processing vol 1 MIT Press 1986

[Spirkovska 1992] 1 Spirkovska et al Conectivity Strategies for High-Order Neural Networks Applied to Pattern Recognition NASA Ames Research Center 1992 [Thimm 1997J G Thimm Optimization of High Order Perceptron IDIAP 1997

130

7 Autores

Stella J Olivero Marquez Licenciada en Educacion Especialidad Matematicas y Fisica de la Universidad del

Atlantico aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas lnteligentes de la Universidad del Valle

Francisco J Ibargiien Ocampo Profesor de la Universidad de San Buenaventura Ingeniero Electricista de la Universidad del Valle aspirante a obtener el titulo de Magister en Automatica e integrante del grupo Percepcion y Sistemas Inteligentes de la Universidad del Valle

Eduardo F Caicedo Bravo Ingeniero Electricista Universidad del Valle PhD en Infonnatica Industrial de la UPM Profesor Titular Director del grupo de investigacion Percepcion y Sistemas lnteligentes Director de la Escuela de Ingenieria Electrica y Electronica de la Universidad del Valle

131

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 23: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

EXTRACCION DE CARACTERiSTICAS DE ENTRAMADOS DE HILOS PARA LA CLASIFICACION DE PATRONES DE FALLOS DE TEXTURAS EN TEJIDOS

PLANOS

Adalberto Gabriel Diaz (gdiazsigmaeafiteduco) Universidad EAFIT Medellin Colombia

Abstract This paper explains an algorithm used to extract the characteristics of a pattern of threads in the structure of plane weaves from textile piece images in order to detect and to classify the existence of possible weaving flaws corresponding to the interlaced yarns The algorithm development start with the analysis of sbade areas in 2-D images which have been obtained using light sources to illuminate in oblique direction and in opposed sides the textile piece The captured images are processed witb arithmetic operations and they manifest in the sbade projection the renef in a texture of patterns defined by tbe levels of gray in the images Tbe characteristics or distribution of tbe situations of tbe patb of the threads are extracted by using pattern recognition operations in which bas been developed with a lot of success the operation of Morfo-variallce The result is a pixels distribution image whicb indicate tbe distribution characteristics and state of tbe threads in the pattern of tbe textile J

Keywords illumination shades vision 3D textile inspection relief vision textile structure pattern recognition morphology image processing

1 INTRODUCCION

Los procesos de inspeccion realizados por medio de procesamiento de imagenes se apoyan en algoritmos de reconocimiento patrones los cuales clasifican los elementos por sus caracteristicas defmidas en un espacio Rn y que son comunes a situaciones que 10 identifican como similares En el proceso de inspeccion textil se presenta el caso de situaciones caracteristicas que se repiten horizontal y verticalmente tanto en su estructura como en su acabado en toda la extension del tejido aproximandose a la definicion matematica de patron y que deben ser reconocidos y ubicadas en su posicion sobre la superficie de la imagen

El espado dimensional de una imagen de grises que contenga informacion sobre los fallos de tejido es muy elevado tratandose de analizarla directamente desde el espacio distribucion valoracion y re1acion de pixeles Por tal motivo en este trabajo se presenta un metodo de reduccion del espacio n-dimensional donde se puede definir claramente las caracteristicas que puedan clasificar un fallo de tipo estructural del tejido el cual se obtiene a partir de imagenes digitalizadas con efectos de sombras [1] y con un procesamiento adecuado se consiguen imagenes que defmen la estructura del tejido independiente del acabado haciendo un reconocimiento de cada una de las situaciones de los hilos en el tejido suministrando informacion caracteristica del

estado del tejido para posteriormente evaluar el estado de calidad

2 RECONOCIMIENTO DE PATRONES

El proceso de reconocimiento de patrones lleva asociado un sistema deadquisicioh de datos de tal forma que en eIlos se pueda apreciar y evaluar las caracteristicas que se asoci~ para la definicion de patron[2] las cuales estan limitadas a los dominios especiales de la aplicacion en partes del ambiente Al espacio de este dominio se Ie llama Clase[3] y los elementos del domino se llaman Patrolles los cuales se representan como funciones-vector multivariables

1

nnt ---

t

Fig I Reconocimiento de patrones

Y rl (XI X2middot bull Xn)

Yr2 (XI X2 Xn)

Yr(X) =

Yrm(XI X2 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddot Xn)

Los patrones que no pueden ser aceptados en algunas de las clases previstas perteneceran a una clase Hamada de rechazo

3 DETECCION DE FALLOS EN TEJIDOS PLANOS

Los fallos en estos tejidos se manifiestan como una alteracion en la secuencia repetitiva de los patrones relacionadas con su textura bien sea porque estos se han alterado se han desplazado 0 porque no existen

Estructuralmente el Patron del Tejido es una mana entrelazada de hilos la cua es defmida por cl disefiador de tejido textil y en la cual se defmen las situaciones de los hilos en forma codificada

132

Fig 2 Estructura del tejido

TABLA I CODIGO DE SITIJACIONES LOS HILOS EN EL TEJlDO

54 lib IIV

TAI~iT~--btlililbtt

IF

TT-1Tm~It~1l1nD

PT IPulnfl OIli1 Ipuml~ OUfcentmbll I Jrimbrili-~~W

EI espacio del vector de caracteristicasque permita c1asificar las estructuras del tejido en cIases correspondientes a falIos de tejido se defme por la posicion regularidad orientacion densidad y simetria [4] [5] de Jas Sitllaciones que prescntan los hilos en el entramado del tejido tanto de trama como de urdimbre en cada puntodel recorrido end area del tejido

La algoritrnica del problema esta enfocada a conseguir informacion acerca del levantamiento de los hilos en su recorrido a partir de imagenes 2D para obtener la distribuci6n de estas situaciones sobre la superficie del tejido

Fig 3 Esquema del sistema para la detecci6nde fallos

El desarrollo experimental de este algoritmo se reaJiz6 sobre las herramientas de PDIWIN (UPV) software desarrollado en Builder C++ 40

133

4 ADQUISICION DE IMAGENES

El algoritmo aqui propuesto se inicia con la captura de 4 imagenes[lJ simultaneas sobre la misma area del tejido Cada de las cuales ha sido iluminada con una fuente de luz blanca en direccion oblicua con un levantamiento horizontal () en lados perpendiculares a las direcciones de los hilos de trama y Urdimbre (imagenes norte sur oeste este) y equidistantes del centro 6ptico de la camara Las sombras proyectadas relacionan la informacion con el levantamiento topografico de los hilos sobre Ja superficie

Fig4 Irnagenes de sombras iluminadas por (a) Norte (b)Sur (c)Oeste (d) Este

5 IMAGEN ESTRUCTURAL DEL TEJIDO

AI hacer)a resta de lasimagenes S-N y O-E se aprecia en forma independiente las caracteristicas de los hilos de trama y urdimbre respectivamente

Fig 5 Imagenes resta (a) SmiddotN (b) O-E

La suma promedio de las imagenes resta genera una imagen donde se visualiza la estructura del tejido observandose todas las Sitlraciones de los hilos en el area ademas se observa que se ha eliminado la componente del acabado (estampado)

Fig 6 Imagen estructuraI compuesta

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 24: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

51 Reconocimiento de situaciones de hios

La identificacion de las situaciones de los hilos peunite extraer la estructura real del tejido [6] [7] Esto es un procedimiento que obedece tambicn a otro caso de reconocimiento de patrones enquistado dentro del problema de deteccion de faIlosmiddotestructurales[8] Donde las situaciones estan definidas dentro de un espectro de founas en niveles de grises Para los hilos de trama se realiza el reconocimiento en la imagen N-S para los hilos de urdimbre en la Imagen 0shyE Y en la imagen COlllpllesta se identifican caracteristicas comunes tales como los huecos del tejido y algunos faIlos gencricos

Son muchas las tccnicas de reconocimiento que para este tipo de patrones se pueden implementar Segmentacion[9] Comparacion de Plantillas Amllisis de Fourier [10] [11] Clasificacion Estadistica[12] Comparaci6n Sintactica 0

Estructural Rompimiento de Periodicidad [13] Redes Neuronales Operaciones de Morfologia Algoritmos de Recuperaci6n de Profundidades [14] etc

Para este caso se ha disefiado un novedoso metodo de reconocimiento de patrones apoyado en operaciones de morfologia [IS] [16] [17] A esta operacion se Ie ha llamado Morfo-Variatlza la cual utiliza un elemento estructurante no plano como elemento clasificador

511 Clasijicador

Es un kemel que define las caracteristicas de los patrones de cada una de las situaciones de los hilos en la superficie

bull Cada situaci6n (patron) esta definido sobre la base de la founa y distribucion del levantamiento de niveles de gris en la zona que ocupa el patron

bull Las founas se presentan con irregulafidad dado que dependen de las dimensiones y tipode hilos los ajustes de los entramados como de los eventUales fallos propios de los hilos y tcjidos

bull La ubicacion de estos patrones tiende a tener una distribucion regular en el area del tejido pero esto no es garantia de unifounidad como de distribuci6n regular de ellos

bull Cada patron estara asociado a un c6digo que 10 relaciona con la situacion en la estructura del disefio del tejido

Dado que hay una similitud en la founa de las superficies de niveles de grises en la descripcion de la textura del tejido el clasificador es un kernel modelo que trata de aproximar c identificar las situaciones que a el se asemejan Estc se construye seleccionando prototipos padres y ca1culando las diferencias entre val ores medios de brillo y los niveles de gris de la imagen en la zona respectiva del seleccionado kernel padre

Fig 7 Obtention del kernel

Para obtener un kernel que sea representativo de todas las muestras se toman varios prototipos Padres con los cuales se optimiza hasta obtener uno mejor por medio de diferentes metodos iterativos estadisticos 0 tambien por medio algoritmos de evolucion genetica La representatividad de kernel a las situaciones que debe reconocer defme estadisticamente la calidad del c1asificador Este se puede mejorar aumentando el n6mero de iteraciones en su fase de obtencion

512 Clasijicaciofl

El algoritmo de clasificacion aqui propuesto se apoya en Ia operacion de Morfo-Variatlza la cual toma el clasificador (Kemef) optimiiado para explorar la imagen con un procedimiento de reconocimiento de patrones En cada posicion de la imagen se ca1cula la varianza de las diferencias en pixels entre el kernel y los niveles de gris de la imagen Este valor es colocado en el centro del kernel generandose entonces una nueva imagen resultante de niveles de grises la cual revela la identificacion (Variama) del elemento estructurante con la situacion de los hilos reconocida en una posicion (xy) de la imagen

Fig 8 Imagen resultante de Morfo-Varianza sobre la imagen SoN

Una vista en perspectiva de la imagen anterior pennite ver la efectividad del algoritmo

Fig 9 Vision en perspectiva dellevantamiento de grises

134

Los levantamientos de los niveles de gris estan relacionados con probabilidad de semejanza entre el kernel y la situaci6n que se esta reconociendo En un tejido con mucha regularidad estos tendriin ~ucha identidad y las elevaciones sernn mas pronunciadas pero si el tejido es mas irregular cl reconocimiento generara una identificacion dispersa por 10 tanto es necesario concretar dentro de una vecindad en un pixel el punto donde el patron ha tenido mayor identidad Para esto se Ie aplica un procedimiento de detecci6n de maximos regionales consiguiendose asi tener una pequeiia zona de pixels blancos donde el patr6n ha presentado mayor semejanza luego con un proceso de centrado de masas se reduce a un pixella zona de reconocimiento

Fig 10 Imagen de situacion reconocida de trama sobre urdimbre

6 CARACTERiSTICAS DEL TEJIDO

Las caracteristicas del patroll del tejido que dan expresadas en las posiciones y distribuciones situaciones reconocidas

de los pixeles de las

En las siguientes figuras se mureconocimiento de estas situaciones

estra un ejemplo de

bull Para hilos de trama

SoT [I] TIU [- ] B-T []

Fig II Resumen de situaciones de trama

bull Para hilos de urdimbre

SoU [] UlT [ I] B-U[ I ]

I ~-

~lt 11 A 4 ~ ~ middot~~~t~r ~ ~ ~ ~ ( ~ bull ( 1 ~~ 4

fmiddot4 ~ 101 ~l~~~~ltI S~~ r~f 4 ~J ~~ ti I ~ bull ( i 4 bull

( ( t ~ f

Fig 12 Resumen de situaciones de urdimbre

EI clasificador final de fallos utilizara esta matrices de situaciones de los hilos reconocidas para clasificar la estructura deltrozo de tejido en Clases de falIos y calidad

7 CONCLUSIONES

Con este trabajo se ha incursionado en tres temas de mucho interes

Aplicacion del algoritrrio de extraccion de infounacion 3D a partir demiddot imagenes 2D las cuales han sido iluminadas en founa oblicua para manifestar en las zonas de brillo y sombras infounacion sobre el relieve de levantamiento de la superficie

Desarrollo e implementacion del algoritrno de MorfoshyVarianza para el reconocimiento de patrones caracterizados en base allevantamiento de los niveles de grises

Aplicacion de estos principios en el problema de inspeccion de calidad en la industria textil detectando e identificando los fallos que presenta la estructura de entrelazado de los hilos en tejidos pianos con miras a generar acciones correctivas en el sistemas de control

REFERENCIAS

[I] Adalberto Gabriel Diaz Vision 3-D with Images 2D by Mediate the Analysis of Shades for the Illumination Angle with the Surface proc SPIE vol44 19-242 200 I (aceptado) [2] RODuda P E Hart andD G Stork) Pattern Classification (2nd ed) John Wiley and Sons 2001 [3] Cortijo Fl Reconocimiento de Patrones y Analisis de Imagenes httpdecsaiugres-cb [4] Pico FI Asensi SC Carcia-Charnizo 1M Feature extraction with an associative neural network and its application in industrial quality control Engineering Applications of Bio-Inspired Artificial Neural Networks International Work-Conference on Artificialand Natural Neural Networks IWANN 99 Proceedings Vol 2 (Lecture Notes in Computer Science Vol 1607) p xxiii+907 460-6 1999 [S] Chetverikov DmitryPattern Orientation and Texture Symmetry Computer Analysis ofImages and Patterns pp 222-229 Springer lecture notes in Computer Science vol 970 1995 [6] Chetverikov Dmitry Structural Defects General Approach and Application to Textile Inspection Proc ISth

ICPR Barcelona 2000 [7] Chetverikov Dmitry Texture Analysis Using Feature Based Pairwise Interaction Maps httpvisualipansztakLhulfbimwebfbimwebhtml 1998 [8] Chetverikov Dmitry Gede Krisztian Textures and structural defects Computer Analysis of[mages and patterns volume Lecture Notes in Computer Science vo11296 pages 167-174 Springer Verlag 1997 [9 ] Ngan Phillip M Coombs Bernard D Segmentation of Intensity Basins Gray- Scale Images Computers and Biomedical Reseaech 27 39-44 (1994)

135 1

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 25: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

[10 ]Chan C Pang G Fabric defect detection by Fourier analysis IEEE transactions on Industry Applications voL 36 No 05 SeptemberOctober 2000 pI267 [II ]Konik H Laget B Redortier B Calonnier M proc SPIE Machine Vision Applications in Industrial Inspection IV vol 2665 1996 [12 ]Jain Ani K Duin RPW Kastori R Statistical Pattern Recognition A Review IEEE transactions on Pattern Analysis and Machine Intelligence vol 22 No 1 January 2000 [13 ]ThomasT and Cattoen M Automatic inspection of simply patterned material in the textile industry proc SPIE Machine Vision Applications in Industrial inspection II vol 21831994 [14] Bichsel M Pentland A PA Simple Algorithm for Shape from Shading CVPR Conference on Computer Vision and Pattern Recognition Champaign Illinois June 1518 pp 459-4631992 [15 ] Serra Jean Image Analysis and Mathematical Morphology VI Academic Pres 1982 [16] Serra Jean Image Analysis and Mathematical Morphology V2 Theoretical Advances Academic Pres 1988 p 141-157 [17 ] Dougherty Edward R Mathematical Morphology in image Processing Rochester Institute of Technology NY 1992 p 446-481

Adalberto G Diaz Ingeniero Electronico UPB Medellin Especializado en Automatizacion Universidad de Bochum Alemania Suficiencia investigativa y candidato a doctor Universidad Politecnica de Valencia Espana Docente Investigador en areas de procesamientode imagenes redes neuronales control de procesos Universidad Eafit Medellin

NONLINEAR PID CONTROLLER USING A NEURAL NETWORK

Alberto Delgado (adelgadoieeorg)

Departamento de Ingenieria EIectrica y Electronica Universidad Nacional de Colombia Bogota

Abstract- In this paper a feedfonvard neural network is used to implement a nonlinear PID controller in a closed loop with a nonlinear plant The neural network is trained on line with the chemotaxis algorithm to match the actual plant response with a desired closed loop response

Index Terms- ileural networks nonlinear PID nonlinear control

I INTRODUCTION

PID control is an old technique that has been used to control linear plants successfully [IJ Some estimates indicate that more than 90 of all controllers used in

todays process industry are of the PID type

The reasons that make PID controllers so popular are [2]

Acceptable control for most industrial processes An old proven technique The three terms are easily understood ) The exactplant model is not required The parameters are easily adjusted

The simplicity of the PID control implies some limitations that must be solved y more complex controllers

1 Plants with long dead times

1 Plants with nonlinearities

Here a nonlinear PID controller is proposed by using a three layered neural network as the nonlinear map to generate the control input for the plant The network has the structure 3-Nshy1 the inputs are the closed loop error the integral of the closed loop error and the derivative of the close loop error the network output is u(t)

The nonlinear PID is used to control a nonlinear plant and the overall closed loop response approximates a desired linear response after training the neural network

The paper is developed as follows in section tWo the nonlinear PID is presented Section -three introduces the

closed loop and the desired closed loop dynamics Section four shows the simulations for the training input arid for a step input Inmiddot section five the closed loop stability is discussed and fmally the conclusions are formulated in section six

II NONLINEAR PID Using the closed loop error the three terms of the PID are

obtained

PI = e(t)

(I)P2 =fe(t)dt

de(t)P3=ili

PI

P2

P3

Fig I Feedforward neural network used to implement a nonlinear PID

These terms are the inputs of a feedforwardneural network 3-N-I as shown in figure 1 The network has not bias weights and the activation function for the hidden units is tanh

The network output is the control signal u(t)

t(t) = LN

ci Janh(PI())1 +P2 012 +P3 03) (2) 1=1

Where

ro(ij) neural network input weights c(l) neural network output weights tanh( ) hidden units sigmoid function N number of hidden neurons

During training the parameters c(l) are bounded so u(t) is bounded this isimportant for the closed loop stability

136 137

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 26: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

Notice that if we approximate the function tanb(9) the PlD controller is linear and can be written as

u(t) =kpp +k1middotpz +kd P3 N

k p =L c 1 (0 11

1=1 N

k i = L c 1 middot(012

1=1

N

k d =LeI middot(013

1= 1

~ 9 then

(3)

(4)

In principle the nonlinear PlD contains as a frrst order term in the Taylor expansion the linear PlD

III CLOSED Loop

Figure 2 is the closed loop with the nonlinear PID and the nonlinear plant The performance index J is calculated using the actual and desired outputs (8)

Desired Closed Loop I Dynamics IyIt)

+ -------~

J

e(t)AI Nonlinear I~I Nonlinear II Ir(t)

Pill u(t) Plantmiddot yet) bull

Fig 2 Closed loop with the nonlinear PID and nonlinear plant

The plant is a DC motor controlled with the armature voltage and has a pendulum fixed to the axis [3] The state equations are

dx l-=Xzdt

dxz =-98sin(x)+x3dt

dx3 = -lOxz -10x3 +10u dt (5)

y=x

where

Xl angle (rad) X2 angular velocity (radsec) XJ armature current (A)

The closed loop desired dynamics is a second order system described by bull Damping ratio ~ = 112 bull Zero steady state error for a step input bull Natural frequency ltOn = 2 bull Poles S12 = - 1plusmnj

The desired closed loop transfer function is

2 (6)T(s)=--shy+2s+2

and the corresponding

state equations are

dZ l-=Z2 dt (7)

dzz =-2Zl - 2zz + 2r dt

Yd = z

The neural network is trained with the algorithm known as chemotaxis [4 5] to minimize the performance index (8) between the desired output Yd(t) and the actual output yet)

IV SIMULATIONS

rr 2J= Jof[Yd(r)-y(r)] dr (8)

The closed loop structure shown in figure 2 was implemented as a function in MATLAB and the main

program also a MATLAB function was the algorithm known as chemotaxis

The numerical values for the simulation are

bull Integration time T 001 s bull Number of samples NS = 2000 bull Simulation time tr= NST =20 s bull Number ofhidden neurons N = 3 bull Number of iterations itmax = 100 N

The main program calls the closed loop function with a fixed set of parameters ro(ij) and c(l) the function returns the performance index J this is called one iteration

The training reference ret) was a sequence of steps as folloWS

0 t lt 5 ret) 10

138

5 t lt 10 ret) =-10 (9)

to t lt 15 ret) = 05 IS t lt 20 ret) = -05

The weights of the neural network after training are

Matrix ro (lOa)

- 09582 - 11071 - 33227 72555 02049 - 02169 01250 - 63026 - 17424

Vectorc (lOb)

- 58506 39988

-42757

Figure 3 presents the desired closed loop response Yd(t) and the actual plant output yet) after a successful training with a final performance index J =453 Figure 4 is the controller output u(t) Figure 5 is the reference input and the closed loop error there are peaks when the reference changes abruptly

The evolution of the performance index J during the training is presented in figure 6 in this case chemotaxis finds the solution rapidly roughly one hour in a 600 MHz CPU

After training the closed loop is tested with another reference input Figure 7 presents the desired closed loop response and the actual closed loop response when the reference is a step ret) = 05 In this case the simulation time was reduced to 10 S in order to see the details of the responses

Figure 8 shows the output u(t) of the nonlinear PID notice that there are abrupt changes at the beginning this is due to the PID controller derivative term The control action can be limited in magnitude and in the rat~ of change but the performance index takes a higher value

Figure 9 presents the close loop error and the reference it is clear that the close loop error goes to zero smoothly due to the integral action

V STABILITY

We can study the stability of the closed loop from two points of view firstly a linear analysis if the pendulum angle is

small and secondly a nonlinear analysis if the plant is stable under persistent disturbances

139

t(Ilil GUild IHlilllrd OWI~J )JlttJ

~ 1-bullbull (=n+- +f~i

~l bullbull r os-middot -+- I t t 1) middot+ middotrmiddot middotmiddot

t~ i Lj LJjr ~j_U middot i i l

l t t r - --bull 1-bullbull L middot1middot1~3~-- ~---

N7 I bull

l t

1 ~Iii 0 2 laquo amp a

m

nn~tHd U N ~

Fig 3 Desired response (dashed) and actual response (solid)

~

-LJ m ~

Fig 4 Nonlinear PID output there are fast changes caused by the derivative term

j5

Fig S Closed loop error e(l) and reference ret)

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141

Page 27: debdigital.unal.edu.co/10623/13/19259573.Parte3.pdf · 2013-10-29 · dimimica de una columna estratigrafica, respecto al sugerido en (6) para el entrenamiento de redes neuronales

Tlu ~~ ~ t r~--~---~--~r---11 ~~ I I ~

$01 ~I~gt I middot~~~r~ L~~Lmiddot~T~~L~L~~~middot t t f )lt t

t f bull - bullt J bull ~ l bull

l(JJ _ l1- t _ I ~ - ~ _J -~-- ~

f ~ bull l bull

j t bull I t

~ ~ 1~ ()OO bullbullbull middotmiddotmiddotmiddotmiddot-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~middotmiddot Ymiddot--middotfmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot fllIl ~ ~ Iii bull middotmiddotmiddot~middotmiddotmiddotmiddot-middot-middot~ middotmiddot~middotmiddotmiddotmiddotmiddot middot~middotmiddot~middotmiddotmiddotle t l ~ I - _ 1 bull bull bull f f J ~ ern gtr~Nklh klil ltJlrNktf ~r-gt lgttttJi~ ~t ~ ~

it OJ LL LLLgttiJ j I

_ f bull J t ~ JIIJ ~ ~ -r -JII ~ t t i bull bull

If bull I bull t bull

lltJ _ __ - shy -t _ - - J __t -shy shy

~ On tl) r Xl 4tJ ro fJl ]171 1pound) 00 1(Jl

imtraquo~ ~

Fig 6 Performance index as a function of the iterations finalvalue J = 453

raJI Oil~ lulf] ~t lJliNt ~tl ftJiNH11J Or-___~f9 ~t r~w -If ~l~

~ J bull t bull f f i jlf I bull bull t

ot~ -~ - r- i~ -~ -middot~r~~middotmiddot _rmiddot bull J f _ 1 bull

~~f- -l ~- Jimiddot (lfj~k f middotr t bull -V ---~---rmiddot ---oril t t 10 bull J t

l ~ t rmiddot f bull I bull ISD~ - shy 1 1 ~ middot -c ~~ ~ ~ Jr I ~ ~ E 1 t ~

1 f bull f-= 1 J bull f J _ ~ J bull I ~ l bull-D ~ bullbullbull V~ ~ ~ ~ f i ~ l i ~ 1 l l

(j j ~ _ f~ ~ __ ~ _ _ __ bull__w - _L __r bull I ~ t gt( (

I ~ l i -i-1 I l

1

j f yen f J01 ~~r ~~ -l(Hioltv$ gt-oll-~_laquol-gtt-4lo- ~ f r t i i

1 1 5 lt ltY

Tlulq

Fig 7 Desired response (dashed) and actual response (solid) for a step

reference Un Plfl i~

l f - _ 1) tmiddot ~

tr I ~ ~ _~ ~ H_ ~ ~gtOlt~ 0 ~ ~ ~ It ~ f ltI ~ t J ~ oil l t

I bull t t laquo t

51~37lT middot F~r-middotf ~ t bull bull 01 II 111 ~ t bull bull to( ~ ~

4 ~-- middot~-middotr-middotmiddot-~middotmiddot-middot-middot-middotmiddotmiddot~middot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot $ 1 ~ ~ ~ $ t f bull bullbull 01

~ Y ~ -- lt ~ _ t ~ t Ie ~ t

f f J t ~__ bullbull 4 _ - bullbull bullbullbull bull - bullbullbull -

2 IJ1

if t bull ~ O

4 bull 41 bull 1

r-~ bullbull 1 II 1~6l bullbull II

10

Fig 8 Nonlinear PID output there are spikes due to the derivative term

ne t_~~____middotyi~_yenmiddot_fmiddot~~f~T_~Nltgt~f_m

O~ bull ~ ~ ~ ~ ~ I t ~ tit

fJ t I~~ ~-~ ~ _~ ~- M

i 1 ~~ f If bull ttl I

I]Jlmiddot-middot--~middot middot~middotmiddotmiddotmiddoti-- ~- L ~ ~ ~ t ~ ~- ~ l2 t bull 1 f I to bull I bull t ~ ) bull02 ~ ~ -~- - r ~ bull --

llt I ( t t IfI ~ 4 t I I bull t))middot ~

f ~ I ~

o I bull bull shy ~ ~ ~ ~ ~ shy ~

~

0111gt bullbull -lt~lt~ ~HIl Z J

____ 1shy~

1 5 7 a

TnC 9 10

Fig 9 Closed loop error and reference input the steady state error is zero because of the PID integral action

A Linear analysis

When the angle of the pendulum issmall (less than 171) ==

03 rad) the plant equations can be linearized sin(xJ == XI

and the corresponding transfer function is

10 G(s) =S3 + 1008 2 + 198s +98 (11)

With the neural network weight values (10) the three gainsof the corresponding linearized PID (4) are

kp= 3408 ki = 3424 kd = 2602

and the transfer function of the PID is

D( ) _ 2602s2 + 3408s + 3424

s - (12) s

The closed loop transfer function is given by

D(s)G(s) T(s) =1+ D(s)G(s)

The closed loop poles are

- 41930 + 157358i - 41930 shy 157358i - 08070 + 08000i

- 08070 - 08000i

(13)

this is a stable second order system considering only the poles

close to jro

140

B Nonlinear analysis

The pendulum is a nonlinear system and it is stable under persistent disturbances [6] around the main stable equilibrium point XI =X2 = O bull

The closed loop stability is guaranteed if the controller output is bounded Taking the nonn in (2) it can be seen that

N

lu(t)1 ~ Licil ItI(t)1 ~ rif12~

using the numerical values (10) the input is bounded

(14)

Figure 4 and 8middot show that this is indeed the case It is important to mention that the bound depends on the output weights of the neural network increasing the number of hidden neurons creates a bigger bound

VI CONCLUSIONS

Traditional PID controllers aremiddot suitable for linear plants or nonlinear plants around an operating point When the operating region is increased the perfonnance of the PID decreases and other control techniques must be used

In this work a nonlinear PlD controller with a feedfOlward neural network as the nonlinear map has been proposed to control a nonlinear plant The closed loop structure with PID and plant follows a desired closed loop dynamics after training the network

The simulations have shown that the nonlinear PID in combination with the plant can produce a close middotloop dynamics that behaves linearly in a region (-57 + 57deg ) which is beyond the linear operating region (- 171) + 171)

The stability was discussed for both the linear and nonlinear cases In the linear case the closed loop of the linearized PID and the linearized plant is stable with poles on the left side of the complex plane For the nonlinear case the closed loop is stable because the plant is stable under persistent disturbances around the origin and the controller output is bounded

REFERENCES

Atherton DP PID controller tuning lEi Computing and Control (specialfeature PlD Tuning Methods) Vol 10 No2 pp 44-50 1999

[2] Panagopoulos H PID Control Design Extension Application Lund Wallin amp Dalhom 2000

[3] Kuschewski JG Hui S Zak SH Application offeedforward neural networks to dynamical system identification and control IEEE Transactions on Control Systems Technology I pp 37- 49 1993

[41 Bremermann IIJ and Anderson RW An alternative to BackshyPropagation a simple rule of synaptic modification for neural net training and memory Report of the Center for Pure and Applied Mathematics PAM - 483 University ofCalifornia 1990

5] DelgadC A Inteligencia Artificial y Minirobots Bogota ECOE Ediciones 1998

[6] Hahn WStabilityofMotlon Berlin Springer Verlag 1967

141