Post on 05-Mar-2016
7/21/2019 Solucion AR
http://slidepdf.com/reader/full/solucion-ar 1/4
Universidad Autónoma de Yucatán
Facultad de Matemáticas
Licenciatura en Ciencias de la ComputaciónINTELIGENCIA ARTIFICIAL
TAREAAprendizaje supervisadoAprendizaje por refuerzo
Instrucciones
Por equipos: Máximo 3
Tarea escritaLa tarea se recoge al inicio de la clase
Ejercicios
1) A partir de los siguientes ejemplos
X1 X2 X3 X !" 1 1 1 #" " 1 1 #" 1 " 1 $1 " " 1 $1 1 1 " #
• %sar el algoritmo &$nn para determinar la clase del ejemplo
'"("("(" para &*1(3(+
a) 3,+b) 2,+c) 2,-d) 2,-e) 3,+
Para k! 3 e"pates en 2 #ueda por "a$or%a &Para k3 "a$oria -Para k' "a$oria +
• %sar el algoritmo ,ai-e .a/es para determinar la clase del ejemplo
anterior usando Laplace con &*1
p(+)3+!'+2 *p(-) 2+! ' +2 3
p(! . +) 2 + ! 3 + 2 3'p(!! . + ) 2'p(! . -) !+!2+2 !2
7/21/2019 Solucion AR
http://slidepdf.com/reader/full/solucion-ar 2/4
p(!! . -)!2p(2 . +) 2'p(2! . + ) 3'p(2 . -) !2p(2! . - ) /
p(3 . +) !'p(3! . + ) 3+!3+2 *'p(3 . -) 2+!2+23*p(3! . - ) !*p(* . +) 2'p(*! . + ) 3'p(* . -) !*p(*! . - ) 3*
P0(+.) p(+)p(!.+) p(2.+) p(3.+) p(*.+)
(*)(3')(2')(!')(2') 1!
P0(-.) p(-)p(!.-) p(2.-) p(3.-) p(*.-)
(3)(!2)(!2)(3*)(!*) 12
P(-.) 12 13 1*'
2) %sar ,ai-e .a/es con estimador de Laplace para &*1 para determinar siel ejemplo 0P4T 5T6M7 es pel8cula o canci9n
ic: A( Per;ect( <orld( M/( <oman( Prett/( a/( lectric( 5torm( Anot=er(ain/
PL>4%LAA P4T <6LM! P4T <6MA,PTT! <6MA,
4A,4>6,A P4T A!L4T>4 5T6MA,6T? A>,! A!
P(Pe4) 3 + ! + 2 !2P(5an) !2
P(Perfect . Pe4) 2 + ! 6 + !! 3 !P(Perfect . 5an) ! +! 6 + !! 2 !P(7tor" . Pe4) +! 6+ !! !!P(7tor" . 5an) !+! 6 + !! 2!
7/21/2019 Solucion AR
http://slidepdf.com/reader/full/solucion-ar 3/4
P0(Pe4 . Perfect 7tor") P(Pe4)P(Perfect . Pe4) P (7tor" . Pe4)
(!2)(3!)(!!) 1*!
P0(5an . Perfect 7tor") P(5an)P(Perfect . 5an) P (7tor" . 5an)
(!2) (2!)(2!) 1''
P(Pe4 . Perfect 7tor") 1*3
P(5an . Perfect 7tor") 1'
3@ %sando el siguiente entorno etermin8stico con mo-imientos=oriontales / -erticales
e;ueros en parBntesis1C") 2C") 3C") C") +C")
DC") EC") FC") GC") 1"C")
11C$1) 12C$1) 13C#1) 1C") 1+C")
• Actualiar la taHla estado$acci9n usando el algoritmo 5A5A para
la siguiente secuencia Cal;a*"@3( gama*"@2)6, Derecha, 7, Abajo, 12, Derecha, 13
• Actualiar la taHla estado$acci9n usando el algoritmo I para la
siguiente secuencia@ Cal;a*"@3( gama*"@2)1, Abajo, 6, Abajo, 11, Derecha, 12
5arsa8(,9) 8(,9) + a4fa ( + (12)8(,Ab) & 8(,9)) 16! + 13( + (12)(1*!2)-16!) 1''
8(,Ab) 8(,Ab) + a4fa ( -! + 128(!2,9) & 8(,Ab)) 1*!2 + 13(-! + (12)(1323) & 1*!2) 16
I
8(!,Ab) 1!*6 + a4fa( + 12 (16!) & 1!*6) 1!'2
8((,Ab) 1'36 + 13(-! + 12(1*) & 1'36) 1!33
8(!!,9) 12! + 13(-! + 12(13) & 12!) -166
TaHla I
7/21/2019 Solucion AR
http://slidepdf.com/reader/full/solucion-ar 4/4
@ 4ual es el -alor del estado indicado con x usando programaci9ndinámica( donde la pol8tica le asigna a cada acci9n la mismaproHaHilidad
0.3 5.2 2.2
-1.3 x -0.1
2.1 3.1 0.5
Gama = 0.8
9eter"inistico
:a ( '12,-!13,-1!,31!) '12
Estocastico
6 correcto, ! iz#uierda, ! derec;a
Arriba 16 ((16)( '12) + (1!)(13) + (1!)(212)) 31'2
Abajo
16 ((16)( 31!) + (1!)(212) + (1!)(1')) 212
Iz# 16 ((16)( -!13) + (1!)(13) + (1!)(21!)) -1*
9er 16 ((16)( -1!) + (1!)(212) + (1!)(1')) 1!'2
:a 31'2