Microsoft power point curso-2006_sesion2_kohonen

36
Mapas Autoorganizados o Mapas de Kohonen (s2) Miguel BARRETO Investigador MINISTERIO DE AGRICULTURA Y DESARROLLO RURAL asocaña

Transcript of Microsoft power point curso-2006_sesion2_kohonen

Page 1: Microsoft power point   curso-2006_sesion2_kohonen

Mapas Autoorganizados o Mapas de Kohonen (s2)

Miguel BARRETOInvestigador

MINISTERIO DE AGRICULTURA Y DESARROLLO

RURAL

asocaña

Page 2: Microsoft power point   curso-2006_sesion2_kohonen

Bondades de los SOM

Los mapas auto organizados son una herramienta para la visualización de datos en altas dimensiones. Básicamente SOM produce un grafico de similaridad de los datos de entrada. Convierte las relaciones estadísticas no lineales entre datos de alta dimensionalidad en simples relaciones geométricas en puntos de una imagen en una visualización de baja dimensionalidad

En contraste con los métodos clásicos, los SOM proporcionan una fácil visualización, tomando pocas suposiciones y restricciones además es capaz de manejar grandes grupos de datos y aislar patrones y estructuras de los datos.

Por estas razones los Self-organizing maps han empezado a ser de gran interés para en exploración y análisis de datos, data mining también y en procesos agro-ecológicos.

Page 3: Microsoft power point   curso-2006_sesion2_kohonen

Reducción de dimensionalidad

Ejemplos (Estímulos del espacio de entrada)

t = 0

x

y

tfinal

x

y

Reducción de dimension

Page 4: Microsoft power point   curso-2006_sesion2_kohonen

Tres dimensiones

z

x

y

x

y

x

y

Salida

Ejemplos (Estímulos del espacio de entrada)

Reducción de dimension

Page 5: Microsoft power point   curso-2006_sesion2_kohonen

Tres dimensiones

z

x

y

x

y

SalidaEjemplos (Estímulos del espacio de entrada)

Reducción de dimension

Page 6: Microsoft power point   curso-2006_sesion2_kohonen

Tres dimensiones

z

x

y

x

y

SalidaEjemplos (Estímulos del espacio de entrada)

Reducción de dimension

Page 7: Microsoft power point   curso-2006_sesion2_kohonen

13 Dimensiones

0000000000001100Nada

0000000001111001Vuela

0111101100000000Corre

0001111011110000CazaOtros

0000000001111111Plumas

0111001000000000Crin

1110000000000000Pezuñas

1111111110000000Pelo

11111111100000004 Patas

00000000011111112 patasTiene

1111100000000000Grande

0000001111000000Mediano(a)

0000010000111111Pequeño(a)

Es

VacaCebraCaballoLeónTigreGatoLoboperroloboÁguilaHalcónBúhoGansoPatoGallinaPalomaAtributo

13 Dimensiones

Reducción de dimension

Page 8: Microsoft power point   curso-2006_sesion2_kohonen

13 Dimensiones

Ganso Pato

Vaca

Cebra

Caballo

Gallina

Paloma

Halcón

Búho

Águila

Gato

Tigre León

Lobo

Perro

Zorro

Reducción de dimension

Page 9: Microsoft power point   curso-2006_sesion2_kohonen

13 Dimensiones

Ganso Pato

VacaCebra

Caballo

Gallina

Paloma

Halcón

Búho

Águila

Gato

Tigre León

Lobo

Perro

Zorro

Reducción de dimension

Page 10: Microsoft power point   curso-2006_sesion2_kohonen

Procesar información incompleta

Page 11: Microsoft power point   curso-2006_sesion2_kohonen

Calidad de vida en el mundo

Calidad de vida en el mundo

Estadísticas del banco mundial sobre varios países en el año 1992 fueron usadas.39 indicadores fueron tomados describiendo varios factores de calidad de vida tales como salud, nutrición, calida de los servicios públicos, acceso a la educación etc.

Países que tenían indicadores similares se ubicaron cerca el uno del otro en el mapa.

Procesar información incompleta

Page 12: Microsoft power point   curso-2006_sesion2_kohonen

Calidad de vida en el mundo

Países en mayúscula fueron usados para crear el mapa de Kohonen, algunos con datos faltantes.

Países en minúscula fueron ubicados después del entrenamiento del mapa, algunos con mas de 11 datos faltantes

Procesar información incompleta

Page 13: Microsoft power point   curso-2006_sesion2_kohonen

Calidad de vida en el mundo

Procesar información incompleta

Calidades de vida similares en países de Europa y Japon

Calidades de vida similares en países de Europa del este y Portugal

che = Suiza mas de once datos faltantes

Calidades de vida similares en África

moz = Mozambiquemas de once datos faltantes

mex = Méxicomas de once datos faltantes

Page 14: Microsoft power point   curso-2006_sesion2_kohonen

Conservación de la topología

Page 15: Microsoft power point   curso-2006_sesion2_kohonen

Doble hélice

Conservación de la topología

Page 16: Microsoft power point   curso-2006_sesion2_kohonen

Visualización

Page 17: Microsoft power point   curso-2006_sesion2_kohonen

Análisis de los mapas

Visualización

Page 18: Microsoft power point   curso-2006_sesion2_kohonen

Ejemplo práctico

Page 19: Microsoft power point   curso-2006_sesion2_kohonen

Características de la base de datos

Numero de datos: 150 (50 en cada una de las tres clases) Datos Faltantes : NingunoDistribución de las clases: 33.3% para cada una de las tres clases

Título: Iris Plants DatabaseFuentes:(a) Creador: R.A. Fisher

Atributos :1. Largo del sépalo en cm.2. Ancho del sépalo en cm.3. Largo del pétalo en cm.4. Ancho del pétalo en cm.5. Clases: Iris SetosaIris VersicolorIris Virgínica

Ejemplo práctico

Page 20: Microsoft power point   curso-2006_sesion2_kohonen

Iris Plants Database

Iris Setosa Iris Versicolor Iris Virgínica

Ejemplo práctico

Page 21: Microsoft power point   curso-2006_sesion2_kohonen

Distribución de clases de iris en América del norte

Iris Setosa Iris Versicolor Iris Virgínica

Ejemplo práctico

Page 22: Microsoft power point   curso-2006_sesion2_kohonen

Visualización de los mapas

Ejemplo práctico

Page 23: Microsoft power point   curso-2006_sesion2_kohonen

Visualización de los mapas

Ejemplo práctico

Page 24: Microsoft power point   curso-2006_sesion2_kohonen

Visualización de los mapas

Ejemplo práctico

Page 25: Microsoft power point   curso-2006_sesion2_kohonen

U-matrix

Ejemplo práctico

Page 26: Microsoft power point   curso-2006_sesion2_kohonen

Planos que componen el mapa

Ejemplo práctico

Page 27: Microsoft power point   curso-2006_sesion2_kohonen

Planos que componen el mapa

Ejemplo práctico

Page 28: Microsoft power point   curso-2006_sesion2_kohonen

Planos que componen el mapa

Ejemplo práctico

Page 29: Microsoft power point   curso-2006_sesion2_kohonen

Labels

Ejemplo práctico

Page 30: Microsoft power point   curso-2006_sesion2_kohonen

Labels

Ejemplo práctico

Page 31: Microsoft power point   curso-2006_sesion2_kohonen

Herramientas

Page 32: Microsoft power point   curso-2006_sesion2_kohonen

SOMToolbox

Herramientas

http://www.cis.hut.fi/projects/somtoolbox/

Herramienta elaborada en el laboratorio de Teuvo Kohonen en: TheLaboratory of Computer and Information Science (CIS) en Helsinki University of Technology.

Es un toobox gratuito, que explota las bondades de Matlab(visualización, programación etc.).

Esta muy bien documentado y ha sido usado para el desarrollo de numerosos artículos científicos.

Su utilización es sencilla y posee entornos gráficos que facilitan su uso.

Existe una versión llamada sompack, para uso en línea de comandos que no necesita el uso de Matlab. http://www.cis.hut.fi/research/som_lvq_pak.shtml

Page 33: Microsoft power point   curso-2006_sesion2_kohonen

Data bionics ESOM

http://databionic-esom.sourceforge.net/

Esta herramienta al igual que el SOMToolbox permite el entrenamiento, visualización y análisis de mapas de Kohonen.

Es una herramienta de domino publico elaborada enteramente en JAVA.

Su código fuente esta disponible.

Es una herramienta fácil de usar y totalmente grafica.

Herramientas

Page 34: Microsoft power point   curso-2006_sesion2_kohonen

Practica SOMToolbox

Adiccionar el toolbox a Matlab>>pathtool

Leer los datos de nuestro archivo>> sD = som_read_data (‘iris.data');

Preprocesamiento de los datos>> preprocess(sD)

Normalizacion>> sD = som_normalize(sD,'var');

Entrenar la red>> sM = som_make(sD);

Calcular los labels>> sM = som_autolabel(sM,sD,'vote');

Herramientas/ SOMToolbox

Page 35: Microsoft power point   curso-2006_sesion2_kohonen

Practica SOMToolbox

Visualizar el mapa (U-Matrix) y los planos que lo componen

>> som_show(sM,'umat','all','comp',1:4,'empty','Labels','norm','d');

Colocar los labels>>som_show_add('label',sM,'subplot',6);

Herramientas/ SOMToolbox

Page 36: Microsoft power point   curso-2006_sesion2_kohonen

Utilizando la ayuda gráfica

Leer los datos de nuestro archivo>> sD = som_read_data (‘iris.data');

Normalizar>> sD = som_normalize(sD,'var');

Lanzar la aplicación ajustar parámetros y entrenar>> som_gui([sD])

Calcular los labels>> sM = som_autolabel(sM,sD,'vote');

Visualizar el mapa (U-Matrix) y los planos que lo componen

>> som_show(sM,'umat','all','comp',1:4,'empty','Labels','norm','d');

Colocar los labels>>som_show_add('label',sM,'subplot',6);

Herramientas/ SOMToolbox