Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Aprendizaje Computacional
Eduardo Morales, Enrique Sucar
INAOE
(INAOE) 1 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Contenido
1 Introduccion
2 Espacio de Hipotesis
3 Tipos y Tareas de Aprendizaje
4 Sistemas Recientes
(INAOE) 2 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Introduccion
Introduccion
• La capacidad de aprender es uno de los atributosdistintivos del ser humano
• El aprendizaje es una de las principales areas de IA• Generacion y almacenamiento de datos +
automatizacion procesos + avances enalmacenamiento⇒ muchos datos
• Interes comercial⇒ desarrollo acelerado
(INAOE) 3 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Introduccion
Aprendizaje Computacional
• Posiblemente la caracterıstica mas distintiva de lainteligencia humana
• Desde el comienzo de las computadoras secuestiono si serıan capaces de aprender
• La capacidad de aprendizaje abre una amplia gama denuevas aplicaciones
• El entender como aprenden las maquinas nos puedeayudar a entender el aprendizaje humano
(INAOE) 4 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Introduccion
Aprendizaje Computacional
El aprendizaje humano es diverso e incluye:
• Adquisicion de conocimiento• Desarrollo de habilidades a traves de instruccion y
practica• Organizacion de conocimiento• Descubrimiento de hechos• ...
De la misma forma ML estudia y modela,computacionalmente, los procesos de aprendizaje en susdiversas manifestacionesSe tiene mas teorıa y mas aplicaciones lo que refleja masmaduracion
(INAOE) 5 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Introduccion
Definiciones
Aprendizaje: Es el campo de estudio que le da a lascomputadoras la habilidad de aprender sin ser programadasexplıcitamente [Samuel, 59]
Aprendizaje: Cambios adaptivos en el sistema para hacer lamisma tarea(s) de la misma problacion de una manera maseficiente y efectiva la proxima vez [Simon, 83].
Aprendizaje: Un programa de computadora se dice queaprende de experiencia E con respecto a una clase detareas T y medida de desempeno D, si su desempeno enlas tareas en T , medidas con D, mejora con experiencia E[Mitchell, 97].
(INAOE) 6 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Introduccion
Objetivos
Los objetivos dependen de la perspectiva:• Ingenieril (resolver tareas)• Simulacion cognitiva• Analisis teorico
Programar una maquina lleva mucho tiempo, ML puedesuavizar ese proceso
(INAOE) 7 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Introduccion
Aprendizaje en Sistemas Expertos
Desde el punto de vista de sistemas basados enconocimiento...
“. . . knowledge is currently acquired in a verypainstaking way; individual computer scientistswork with individual experts to explicate theexpert’s heuristics – the problem of knowledgeacquisition is the critical bottleneck in artificialintelligence.” Feigenbaum and McCorduck
(INAOE) 8 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Introduccion
Aprendizaje en Sistemas Expertos
Desde el punto de vista de sistemas basados enconocimiento...
“Knowledge engineers have generally assumedthat the procedural knowledge which drives anexpert’s skilled behavior can be elicited bydialogue. The findings of the past decade in brainscience, cognitive psychology and commercialsoftware do not support this idea. Evidence islacking that skills, having once reached the“automization” stage, can be de-automized bydialogue so as to make their inner workingsaccessible to introspective report.” Donald Michie
(INAOE) 9 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Espacio de Hipotesis
El Espacio de Hipotesis
• Lenguaje de Hipotesis: sintaxis usada en laconstruccion de hipotesis
• Espacio de Hipotesis: conjunto de todas las posibleshipotesis dentro del lenguaje de hipotesis
• El lenguaje de hipotesis determina el espacio dehipotesis del cual el metodo selecciona sus reglas eimpone restricciones/preferencias en lo que se puedeaprender y que estrategias de razonamiento utilizar
• Al escoger un lenguaje, debemos de considerar lo quequeremos que el sistema realice, la informacion que sele debe de proporcionar y si lo va a resolver a tiempo
• Existe, como en los metodos de inferencia de KR, unbalance fundamental entre la expresividad y laeficiencia
(INAOE) 10 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Espacio de Hipotesis
Espacio de Hipotesis
X Y
XY
X Y
XY XY XY
f(X).f(a).
f(X) :- g(Y). f(X) :- h(Y).
f(a) :- g(b), h(c).
f(b).f(c).
f(a) :- g(X). f(c) :- h(c).
(INAOE) 11 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Espacio de Hipotesis
Espacio de Hipotesis
x
f(x)f(x) = mx + b
f(x) = ax + bx + c2
f(x) = ax + bx + cx + d23
(INAOE) 12 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Espacio de Hipotesis
Lenguaje de Hipotesis
• El lenguaje de hipotesis depende del area deaplicacion. Una vez definido, una buena parte deltiempo se dedica a seleccionar cuidadosamente lasestructuras de conocimiento adecuadas para la tareade aprendizaje.
• Este tiempo se vuelve mas crıtico cuando el lenguaje dehipotesis restringe la expresividad y el conocimiento deldominio tiene que adaptarse al formalismo adoptado.
• El proceso de inducion puede verse como unabusqueda de hipotesis o reglas.
(INAOE) 13 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Espacio de Hipotesis
Metodos de inferencia
• Intuitivamente un metodo de inferencia es un procesocomputacional de algun tipo que lee ejemplos yproduce hipotesis del espacio de hipotesis.
• Existe una gran cantidad de metodos: Algunos realizanajustes graduales en base a refuerzos sobrepredicciones sucesivas (e.g., RL, NN, etc.). Otrosconstruyen incrementalmente hipotesis tratando decubrir la mayor parte de un conjunto de ejemplos (e.g.,reglas de clasificacion, ILP) o en base a mejoresparticiones de ejemplos (e.g., TDIDT). Otros, guardanejemplos prototıpicos (e.g., CBR, IBL). Algunos buscanrelaciones entre variables (e.g., BN). Finalmente,algunos algoritmos combinan o modifican hipotesispromisorias (e.g., GA).
(INAOE) 14 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Espacio de Hipotesis
Criterio de Exito
En la practica queremos ciertas garantıas de la calidad de lahipotesis. Las mas comunes son que sea completo yconsistente
• Una hipotesis es completa si cubre todos los ejemplospositivos
• Una hipotesis es consistente si no cubre a ninguno delos ejemplos negativos
A veces el usuario determina el criterio de paro. Si elsistema genera sus propios ejemplos, este lo determina.
(INAOE) 15 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Espacio de Hipotesis
Completo y Consistente
x x
xxx
x
Completo y Consistente
x x
xxx
x
Completo e Inconsistente
x x
xxx
x
Inompleto y Consistente
x x
xxx
x
Incompleto e Inconsistente
H H
H H
Figura: Completo y Consistente (X positivos y O negativos).(INAOE) 16 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tipos de Aprendizaje
En general podemos dividir los sistemas de aprendizaje conbase en los modelos que aprenden:• Modelos logicos (reglas, arboles, ILP, ...)• Modelos geometricos y basados en distancia (modelos
lineales, kernels, clustering, ...)• Modelos estadısticos (Bayesianos, GP, ...)
(INAOE) 17 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tareas de Aprendizaje
• Descripcion: normalmente es usada como analisispreliminar de los datos (resumen, caracterısticas de losdatos, casos extremos, etc.). Con esto, el usuario sesensibiliza con los datos y su estructuraBusca derivar descripciones concisas de caracterısticasde los datos (e.g., medias, desviaciones estandares,etc.).
(INAOE) 18 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Descripcion
(INAOE) 19 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Descripcion
(INAOE) 20 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tareas de Aprendizaje
• Prediccion: Clasificacion y Estimacion.• Clasificacion: Los datos son objetos caracterizados
por atributos que pertenecen a diferentes clases(etiquetas discretas).La meta es inducir un modelo para poder predecir unaclase dados los valores de los atributos.Se usan por ejemplo, arboles de decision, reglas, SVM,etc.
(INAOE) 21 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Clasificacion
(INAOE) 22 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tecnicas Comunes
• Arboles de decision y reglas de clasificacion: realizancortes sobre una variable (lo cual limita su expresividad,pero facilita su comprension). Generalmente se usantecnicas heurısticas en su construccion (e.g., ID3, C4.5,CN2).
(INAOE) 23 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tecnicas Comunes
DV_T
NO2_F
SO2_L O3_L
RH_F
TMP_F
O3_Q
NO2_X DV_X
DV_F
DV_L
NO2_T
TMP_L
O3_X
SO2_F
RH_Q
NOX_X
RH_L
O3_Q
DV_T
VV_Q
HORA
VV_T
NO2_T
RH_QNOX_X
RH_L DV_X
C2
C4
C6
C8
C11 C13
C1
C3
C5
C7
C10
C12
C5
C4
C7 C4
C5 C10C1
C11
C7 C3
C3
C7C2
C6 C6 C2 C3
120
57
4946
72
39 89
11
32
39
219484 286
4587
291219
168
227
2310
346
43423
231
43
77
162
Figura: Prediccion de Ozono en la Ciudad de Mexico.(INAOE) 24 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tecnicas Comunes
• Metodos basados en ejemplos prototıpicos: se hacenaproximaciones con base en los ejemplos o casos masconocidos (Examplar–based learning y Case–basedresoning). El problema es como determinar una medidade similaridad adecuada.
(INAOE) 25 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tecnicas Comunes• Modelos relacionales: Programacion logica inductiva (o
ILP), en donde la busqueda del modelo se basa enlogica y heurısitcas.
nitrofurazone 4-nitropenta[cd]pyrene
6-nitro-7,8,9,10-tetrahydrobenzo[a]pyrene 4-nitroindole
ACTIVO
INACTIVO
O = N CH = N - NH - C - NH
OO
+
-
N = O
O
+
-
N
OO
+
- N H
N
OO+
-
U
V Y = Z
XW
Figura: Prediccion de mutagenesis.
(INAOE) 26 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tareas de Aprendizaje
• Prediccion: Clasificacion y Estimacion.• Estimacion o Regresion: las clases son continuas.
La meta es inducir un modelo para poder predecir elvalor de la clase dados los valores de los atributos.Se usan por ejemplo, arboles de regresion, regresionlineal, redes neuronales, LWR, etc.
(INAOE) 27 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Redes Neuronales
Entradas Salidas
(INAOE) 28 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tareas de Aprendizaje
• Segmentacion: separacion de los datos en subgruposo clases interesantes.Las clases pueden ser exhaustivas y mutuamenteexclusivas o jerarquicas y con traslapes.Se puede utilizar con un clasificadorSe usan algoritmos de clustering, SOM(self-organization maps), EM (expectationmaximization), k−means, etc.Normalmente el usuario tiene una buena capacidad deformar las clases
(INAOE) 29 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Clustering
• Clustering: agrupan datos cuya distanciamultidimensional dentro de la clase es pequena y entreclases es grande.
x
x
x
xx
x
(INAOE) 30 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Clustering
(INAOE) 31 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tareas de Aprendizaje
• Analisis de dependencias: El valor de un elementopuede usarse para predecir el valor de otro. Ladependencia puede ser probabilıstica, puede definiruna red de dependencias o puede ser funcional (leyesfısicas).Tambien se ha enfocado a encontrar si existe una altaproporcion de valores de algunos atributos que ocurrencon cierta medida de confianza junto con valores deotros atributos.Se pueden utilizar redes Bayesianas, redes causales, yreglas de asociacion.
(INAOE) 32 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tecnicas Comunes
• Modelos graficos de dependencias probabilısticas:basicamente se utilizan redes bayesianas, en dondedado un modelo estructural y probabilıstico, seencuentran los valores de ciertas variables dadosvalores de otras variables.
(INAOE) 33 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tecnicas Comunes
edad
buenestudian.
nivel socio- econo.
autoextra
anoauto
kilome.
seguri.experien.
habilid. manejo
histor.manejo
marca
ABS
bolsas aire
calidadmanejo
condic.camino
accident
valor comerc.
antirobo
lugarhogar
robo
costocochepropio
costopropied.
costootrosautos
costopersonal costo
medico
defensas
danospersona.
Figura: Red Bayesiana de seguros de coches.
(INAOE) 34 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tecnicas Comunes
• Reglas de Asociacion: reglas que relacionan unconjunto de pares atributo-valor con otros paresatributo-valor. Por ejemplo:
edad(X ,20 . . . 29) ∧ ingresos(X ,20K . . . 29K )⇒ compra(X,CD)[soporte = 2 %,confianza = 60 %]
(INAOE) 35 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tareas de Aprendizaje
• Deteccion de desviaciones, casos extremos oanomalias: Detectar los cambios mas significativos enlos datos con respecto a valores pasados o normales.Sirve para filtrar grandes volumenes de datos que sonmenos probables de ser interesantes. El problemaesta en determinar cuando una desviacion essignificativa para ser de interes.
(INAOE) 36 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Deteccion de desviaciones
• Ejemplo sencillo: Detectar valores fuera de rango• Valores que esten fuera de la media/moda + 3 desv.
estd.
(INAOE) 37 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Deteccion de desviaciones
(INAOE) 38 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Deteccion de desviaciones
(INAOE) 39 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tareas de Aprendizaje
• Aprendizaje de la mejor accion a tomar a partir deexperiencia: Esto involucra busqueda y exploracion delambiente. Esto esta relacionado principalmente conaprendizaje por refuerzo, pero tambien con tecnicascomo aprendizaje de macro-operadores, chunking yEBL.
(INAOE) 40 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Aprendizaje por Refuerzo
(INAOE) 41 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Tipos y Tareas de Aprendizaje
Tareas de Aprendizaje
• Optimizacion y busqueda: Existen una gran cantidadde algoritmos de busqueda tanto determinıstica comoaleatoria, individual como poblacional, local comoglobal, que se utilizan principalmente para resolveralgun problema de optimizacion. Aquı podemos incluira los algoritmos geneticos, recocido simulado,ant-colony, tecnicas de busqueda local, enjambres, etc.
(INAOE) 42 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Sistemas Recientes
Algunas Tecnicas Recientes
• Transfer Learning• Ensambles• Semi-supervised learning• Multi-label classification• Gaussian processes• Deep Learning• Concept Drift/Data Streaming• Big Data analysis (Hadoop)• ...
(INAOE) 43 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Sistemas Recientes
Ejemplos
Algunos ejemplos de aplicaciones que usan aprendizaje:• Sistemas de reconocimiento de voz (e.g., SPHINX, Lee
89),• Manejo de vehıculos autonomos (ALVINN, Pomerleau
89)• Clasificacion de nuevas estructuras de astronomıa
(SkyCat, Fayyad et al. 95)• Aprendiendo a jugar Backgammon (TD-Gammon,
Tesauro 92)• Muchas aplicaciones de las que no estamos
conscientes (sistema postal, tarjetas de credito,recomendaciones de Amazon, sistemas de seguridad,uso de combustible en coches, ...)
(INAOE) 44 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Sistemas Recientes
Ejemplos RecientesAlgunos ejemplos mas recientes:• Control en robots autonomos• Control en vehıculos autonomos
• Identificacion de edificios famosos (google googles)• Agrupacion de imagenes parecidas (ImageSwirl) y
etiquetado automatico
• Aprender caras y gatos usando 16,000 procesadores,red neuronal con mas de mil millones de conecciones yusando 10 millones de imgenes.
(INAOE) 45 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Sistemas Recientes
Aplicaciones
Existe una gran cantidad de aplicaciones tales como:• astronomıa• biologıa molecular• aspectos climatologicos• medicina• industria y manufactura• mercadotecnia• inversion en casas de bolsa y banca• deteccion de fraudes y comportamientos inusuales• analisis de canastas de mercado• aprendizaje de tareas en robotica• ...
(INAOE) 46 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Sistemas Recientes
Areas Relacionadas
• Inteligencia Artificial• Metodos Bayesianos• Teorıa de complejidad computacional• Teorıa de control• Teorıa de informacion• Filosofıa• Psicologıa y neurobiologıa• Estadıstica
(INAOE) 47 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Sistemas Recientes
Consideraciones
Algunos puntos que aclarar cuando se quiere correr odesarrollar algun algoritmo de aprendizaje son:• Que algoritmos existen para resolver cierta tarea?
cuando y como usarlos? que propiedades tienen?• Cuantos datos o tiempo de entrenamiento necesito?
que tanta confianza puedo tener en los resultados?• Como y cuando usar conocimiento del dominio?• ...
(INAOE) 48 / 49
Introduccion
Espacio deHipotesis
Tipos y TareasdeAprendizaje
SistemasRecientes
Sistemas Recientes
Retos
• Volumen de datos (mega, giga y hasta terabytes)• Alta dimensionalidad y/o pocos datos• Sobreajuste (overfitting)• Datos y conocimiento dinamicos• Ruido, incertidumbre y datos incompletos y/o esparsos• Relaciones complejas entre campos, jerarquıas, etc.• Interpretacion de los resultados• Incorporacion de conocimiento del dominio• Interaccion activa del usuario• Integracion con otros sistemas
(INAOE) 49 / 49
Top Related