Reconocimiento de Patrones y el aprendizaje no supervisado

download Reconocimiento de Patrones y el aprendizaje no supervisado

of 6

Transcript of Reconocimiento de Patrones y el aprendizaje no supervisado

  • 7/28/2019 Reconocimiento de Patrones y el aprendizaje no supervisado

    1/6

    Reconocimiento de patrones y el aprendizaje nosupervisado

    Jess Cceres TelloServicios Informticos

    Profesor del Dpto. Ciencias de la ComputacinEscuela Tcnica Superior de Informtica

    Universidad de [email protected]

    Resumen.Este artculo muestra una introduccin al reconocimiento de pa-trones entrando ms en detalle en el aprendizaje de sistemas no supervisadoslos cuales debern, una vez proporcionados todos los tipos de patrones, deci-dir cul es el que ms se ajusta al sistema en cuestin. Se concluye el artculoanalizando los problemas existentes en un sistema de aprendizaje no supervi-sado como son los sistemas topogrficos en los que coexisten un nmero ele-vado de patrones lineales.

    1 Introduccin

    La visin artificial nos permite reducir el problema de una imagen a ciertas formasgeomtricas, a partir de ellas podemos analizar el problema e intentar comprender

    ante qu objeto nos encontramos, principalmente esto se realiza mediante el recono-cimiento de patrones.Es una disciplina dependiente de la inteligencia artificial, ya que nos permite, a

    partir de unos datos la adquisicin de conocimientos, adems los sistemas de recono-cimiento de patrones suelen incorporar un mtodo de aprendizaje, normalmente me-diante un algoritmo inductivo.

    Es importante resaltar la necesidad de introducir un mtodo de evaluacin paraanalizar dicho algoritmo, ya que, en el caso de que dicha evaluacin fuese negativareducira la eficiencia del algoritmo.

    2 Anlisis estadstico

    La primera aproximacin al reconocimiento de patrones es simplemente estadsti-ca, es a veces tambin la ms eficiente. Este mtodo consiste en analizar el patrncomo una variable aleatoria n-dimensional compuesta porncomponentes, x1, x2,..., xn,tales que xi pertenece a Gi para i = 1, 2,..., n.

  • 7/28/2019 Reconocimiento de Patrones y el aprendizaje no supervisado

    2/6

    Figura 1: Ejemplo de espacio de patrones 1

    Un patrn se representa como un punto en el espacio de patrones P. El espacio depatrones P es un espacio de dimensionalidad determinada por el nmero de variablesconsideradas y se define como el conjunto de todos los valores posibles que puedetomar el patrn X, esto es, el producto cartesiano de todos los pares de Gi .

    La tarea fundamental de un sistema de reconocimiento de patrones (clasificador) esla de asignar a cada patrn de entrada una etiqueta. Dos patrones diferentes deberanasignarse a una misma clase si son similares y a clases diferentes si no lo son. Lacuestin que se plantea ahora es la definicin de una medida de similitud entre patro-

    nes.En definitiva, se supone que el proceso de adquisicin es biunvoco y continuo.

    Estas consideraciones sugieren que si las representaciones de dos patrones estn muycercanas en el espacio de representacin, entonces los patrones deben tener un altogrado de similitud. No obstante, no puede afirmarse tajantemente que a mayor distan-cia menor similitud ya que la medida (absoluta) de distancia depende de la escala enla que se cuantifiquen las variables asociadas al patrn.

    Los sistemas de adquisicin introducen cierta distorsin o ruido, lo que produceuna variabilidad en la representacin de los patrones. Aunque es posible controlareficientemente en muchos casos esta distorsin mediante el calibrado de los sistemasde adquisicin de datos, aparece otra fuente de variabilidad por la propia naturalezade los patrones.

    Con mucha frecuencia, patrones de una misma clase difieren, incluso significati-vamente. Un ejemplo sencillo es el de los sistemas de reconocimiento de caracteresOCR que pueden interpretar diversos tipos de letra. Bien, en el caso ms simple, en elque se trata un solo tipo de letra, la variabilidad de los patrones se debe a factorestales como el granulado, el color y calidad del papel o el tipo de tinta empleado.

    1 Fuente del grfico:http://www-etsi2.ugr.es/depar/ccia/rf/www/tema1_00-01_www/node6.html.

  • 7/28/2019 Reconocimiento de Patrones y el aprendizaje no supervisado

    3/6

    De lo que se trata es de extraer la informacin relevante a partir de la clasificacinde informacin suministrada por los sensores (datos en bruto). De forma general esteproblema puede plantearse como sigue. Dado un conjunto de patronesn-dimensionales X = [x1, x2,..., xn]T se trata de obtener un nuevo conjunto (carac-tersticas) d-dimensionales Y = [y1, y2,..., yd]T donde dn.

    Esto se consigue con varios mtodos.1. Reduciendo la dimensionalidad de los datos, si los patrones son de alta

    dimensionalidad, el coste computacional asociado a la clasificacin puedeser muy alto. Las tcnicas dedicadas a seleccionar las variables ms rele-vantes se dicen de seleccin de caractersticas y reducen la dimensionali-dad de los patrones.

    2. Cambiando el espacio de representacin. El objetivo es obtener una nuevarepresentacin de los patrones en la que los agrupamientos aparezcan se-parados si son de diferente clase y que haya un agrupamiento por clase.Esto puede conseguirse aplicando alguna transformacin sobre los datosoriginales. Estas transformaciones suelen ser transformaciones lineales yel objetivo suele ser maximizar la varianza, los vectores resultantes delproceso de seleccin o extraccin se denominan caractersticas.

    A este conjunto se le debe asignar clases, siendo este el objetivo del sistema, lasclases idealmente son disjuntas, quedando claramente discriminada la pertenencia oexclusin de un elemento a la clase concreta. La problemtica empieza cuando estospatrones no estn agrupados de manera ideal o en el peor de los casos cuando estnsolapados, dando entonces lugar a una problemtica clasificacin dado que para unpatrn podemos deducir que pertenece a dos o ms clases.

    Esto suele resolverse dado que la muestra suele ser multidimensional, lo cual nos

    permite discriminar en funcin de la relacin de las clases seleccionadas por estosvalores, dado que si se adhiere a alguna clase concreta podemos decantarnos por larelacin entre estas.

    Un apartado importante es el aprendizaje del sistema, pudiendo ser ste supervisa-do o no supervisado.

    3 Aprendizaje no supervisado

    El principal problema surge cuando el sistema toma la decisin de elegir un deter-minado patrn de entre todos los proporcionados. Es el sistema el que debe determi-nar la clase de la cual se obtiene ese patrn.

    Otro problema aadido es la toma de decisiones, correctas o no, aqu entra en jue-go la lgica difusa, en la utilizacin de tcnicas de clustering difuso.El clustering o agrupamiento es el proceso de particionar un conjunto de datos (u

    objetos) en un conjunto de subclases significativas llamadas grupos (clusters). Ungrupo es una coleccin de objetos de datos que son similares a otros y as pueden sertratados colectivamente como un grupo.

    El agrupamiento es una forma de clasificacin no supervisada en la que, a diferen-cia de la supervisada, no se conocen las etiquetas de las clases (no hay clases predefi-nidas) y puede que tampoco se conozca el nmero de grupos.

  • 7/28/2019 Reconocimiento de Patrones y el aprendizaje no supervisado

    4/6

    Un buen mtodo de agrupamiento produce grupos de alta calidad en los cuales lasimilitud dentro del grupo es alta y la similitud entre las clases es baja. La medida desimilitud se define usualmente por proximidad en un espacio multidimensional.

    3.1 Agrupamiento difuso

    Este mtodo (desarrollado por Dunn en 1973y mejorado por Bezdek en 1981 ) seutiliza con frecuencia en el reconocimiento de patrones. Se basa en la minimizacinde la siguiente funcin:

    Para todo nmero m verdadero mayor de 1, el uij es el grado de la calidad demiembro de xi en el grupo j , xi es el i-ensimo datos medios d-dimensionales, cj es elcentro de la d-dimensin del agrupamiento, y ||*|| es cualquier norma que expresa lasemejanza entre cualesquiera datos medidos y el centro.

    La distribucin borrosa se realiza con una optimizacin de la funcin anterior,con la actualizacin del ij y de los centros c j de la calidad del miembro u del grupo.

    Esta iteracin parar cuando

    donde es un criterio de lafinalizacin de la iteracin y su valor estar entre 0 y1, mientras que k es el paso de la iteracin. Este procedimiento converge a un valormnimo tambin llamado punto de la silla de montar de Jm.

    El algoritmo se compone de los pasos siguientes:1. Inicializar la matriz del ij de U=[u ], U (0)2. En el k-paso: calcular los vectores de los centros C (k) = [ cj ] con U (k)3. Actualizar U(k) a U(k+1)4. Si ||U (k+1) - U (k) ||

  • 7/28/2019 Reconocimiento de Patrones y el aprendizaje no supervisado

    5/6

    limitados a cada agrupacin por medio de una funcin, que representa el comporta-miento borroso de este algoritmo. Para esto, se tendr que construir simplemente unamatriz apropiada llamada U cuyos elementos sean valores entre 0 y 1, y representar elgrado de proximidad entre los datos y los centros de las agrupaciones.

    4 Problemtica en los sistemas de aprendizaje no supervisado:Caso Prctico.

    Un claro ejemplo de sistema con aprendizaje no supervisado lo constituyen los sis-temas topogrficos. Estos sistemas se caracterizan por tener como entrada una Foto-

    grafa area y como salida la elaboracin de un mapa. Esto se consigue analizando lospatrones y modificando el mapa por su equivalente simblico en el caso de los patro-nes ms sencillos, los patrones topogrficos puntuales, los cuales representan en losmapas los objetos cartogrficos, cuyos tamaos son menores en relacin con el tama-o del territorio, presentado en el mapa. Dependiendo de la escala del mapa, a estaclase de patrones geogrficos pueden pertenecer: ciudades, pueblos, aeropuertos, etc.

    Entre los problemas de la digitalizacin de los patrones puntuales, se puede plan-tear un problema particular de reconocimiento de puntos geodsicos y puestos hidro-lgicos, los cuales se presentan numerosamente en mapas topogrficos de mediaescala que se necesitan para la creacin de modelos digitales de relieve. Estos patro-nes se dibujan en los mapas, como un grupo de smbolos, como formas y/o colores,los cuales representan sus caractersticas constructivas. Los smbolos de puntos geo-dsicos, generalmente vienen con informacin textual, que indica su nombre registra-

    do y la altura de su punto de referencia. Los smbolos de puestos hidrolgicos tam-bin vienen con informacin textual estructurada, que contiene el nombre registradode puesto, la indicacin de altura del agua o la corriente, tipo de depsitos de fondo,etc. Las caractersticas indicadas para los smbolos de patrones, pueden usarse efecti-vamente para el desarrollo de algoritmos de reconocimiento automtico de patronespuntuales.

    Otro de los problemas que se pueden plantear es la representacin de patrones car-togrficos lineales, definidos por que el tamao de los cuales, en una direccin esmucho menor que en la otra. Los patrones lineales representan en los mapa; ros,autopistas, fallas tectnicas de la corteza terrestre, etc. Los patrones de este tipo sedibujan en mapas en forma de lneas de diferentes tipos, colores y anchos. Cada ele-mento puede tener su propio valor informativo. El resultado de la digitalizacin de lospatrones lineales debe contener una secuencia de las coordenadas de los arcos, los

    cuales se aproximan el patrn y, en caso de un reconocimiento posible, los atributosdel patrn. La identificacin de los patrones lineales se complica por el hecho de quese dibujan en mapas no solamente con lneas continuas, sino con lneas de una topo-loga distinta (continuas, discontinuas, doble lnea, etc.)

    Tambin existe el problema del reconocimiento de las isolneas de la altura de lasuperficie terrestre. Las isolneas se dibujan en mapas con lneas continuas y trazosdel mismo ancho y color. El reconocimiento de las isolneas se complica por el hecho

  • 7/28/2019 Reconocimiento de Patrones y el aprendizaje no supervisado

    6/6

    de que, generalmente, tienen discontinuidades en las cuales se escribe el valor delparmetro correspondiente para una isolnea dada. Estos nmeros se ponen en elmapa con una orientacin definida con respecto a la isolnea marcada. En los lugaresde marcacin numrica o de alta densidad de isolneas, una parte de isolneas afinespuede desaparecer. Con frecuencia se utilizan dos grupos de isolneas en los mapas:principales y adicionales. Las imgenes de estas ltimas isolneas se diferencian porel tipo de lneas. Las imgenes de las isolneas pueden contener "berg-rayas", o seg-mentos cortos con longitud fija, los cuales se ponen perpendicularmente a la isolneamisma, con orientacin hacia la disminucin del valor numrico de parmetro

    Sin embargo, al crear los algoritmos de reconocimiento para sistemas con isol-neas, se pueden usar de acuerdo a sus especificaciones geomtricas: las isolneas nopueden cruzarse y cada una es cerrada o comienza y cierra en la frontera de una re-

    gin. El resultado de la digitalizacin de isolneas debe contener una secuencia de lascoordenadas de los arcos, los cuales aproximan estas lneas, con un restablecimientomximo posible de los segmentos ausentes en las isolneas y una tabla con los valoresdel parmetro correspondiente.

    Referencias

    Juan Carlos Camara. Posibilidades de Websemanticohttp://www.iua.upf.es/~jblat/material/doctorat/students/jccbis/Web_Semantico.htm

    MNDEZ RODRGUEZ, Eva Mara. RDF: Un modelo de metadatosflexible para las bibliotecas digitales del prximo milenio.http://www.cobdc.org/jornades/7JCD/1.pdf

    RDF Model Theory.W3C Working Draft 29 April 2002.http://www.w3.org/TR/rdf-mt/#graphsyntax

    RDF Tutorial. Pierre-Antoine Champin. http://www710.univ-lyon1.fr/~champin/rdf-tutorial/rdf-tutorial.html

    Resource Description Framework (RDF): Concepts and Abstract Syntax.W3C Working Draft 08 November 2002.http://www.w3.org/TR/2002/WD-rdf-concepts-20021108/

    W3C. Resource Description Framework (RDF). http://www.w3.org/RDF/