Programa de Estudios

1
IA Programa de estudios Semana Tema Labores 1 Introducción a la IA C++ de repaso Visión de conjunto Agentes: Percepción, decisiones y de actuación 2 Búsqueda y Planificación TAREA1: Busqueda Búsqueda sin información (primero en profundidad, amplitud-En primer lugar, Costo Uniforme) Buscar Informada (A *, Greedy Search) Heurística y Optimización 3 Proyecto 1: Búsqueda y Planificación P1: Buscar 4 Los problemas de satisfacción de restricciones TAREA2: CSPs Vuelta atrás Buscar Restricción de propagación (Comprobación Forward, Arc La consistencia) Explotando Gráfico Estructura 5 Árboles de juego y Teoría de la Decisión TAREA3: Juegos Árboles de juego y Computación con estructura de árbol Minimax, Expectimax, Combinaciones Funciones de evaluación y Aproximaciones Poda Alfa-Beta Teoría de la Decisión Preferencias, Racionalidad y Servicios Públicos Utilidad máxima esperada 6 Proyecto 2: Juego Árboles y Teoría de la Decisión P2: Juegos multi-agente 7 Procesos de Decisión de Markov TAREA4: MDPs Las políticas, recompensas y Valores Valor Iteración Política de iteración 8 Aprendizaje por refuerzo (RL) TAREA5: RL Aprendizaje TD / Q Exploración Aproximación 9 Proyecto 3: Refuerzo de Aprendizaje (RL) P3: RL 10 Conclusión y resumen Práctica final Práctica Final 2 11 semana de exámenes finales y entrega de proyectos. Final

description

desarrollo de programa

Transcript of Programa de Estudios

IA Programa de estudiosSemanaTemaLabores

1Introduccin a la IAC++ de repaso

Visin de conjunto

Agentes: Percepcin, decisiones y de actuacin

2Bsqueda y PlanificacinTAREA1: Busqueda

Bsqueda sin informacin (primero en profundidad, amplitud-En primer lugar, Costo Uniforme)

Buscar Informada (A *, Greedy Search)

Heurstica y Optimizacin

3Proyecto 1: Bsqueda y PlanificacinP1: Buscar

4Los problemas de satisfaccin de restriccionesTAREA2: CSPs

Vuelta atrs Buscar

Restriccin de propagacin (Comprobacin Forward, Arc La consistencia)

Explotando Grfico Estructura

5rboles de juego y Teora de la DecisinTAREA3: Juegos

rboles de juego y Computacin con estructura de rbol

Minimax, Expectimax, Combinaciones

Funciones de evaluacin y Aproximaciones

Poda Alfa-Beta

Teora de la Decisin

Preferencias, Racionalidad y Servicios Pblicos

Utilidad mxima esperada

6Proyecto 2: Juego rboles y Teora de la DecisinP2: Juegos multi-agente

7Procesos de Decisin de Markov TAREA4: MDPs

Las polticas, recompensas y Valores

Valor Iteracin

Poltica de iteracin

8Aprendizaje por refuerzo (RL)TAREA5: RL

Aprendizaje TD / Q

Exploracin

Aproximacin

9Proyecto 3: Refuerzo de Aprendizaje (RL)P3: RL

10Conclusin y resumenPrctica finalPrctica Final 2

11semana de exmenes finales y entrega de proyectos.Final