PROGRAMACIÓN DINÁMICA PROBABILÍSTICA

6

Click here to load reader

description

ejercicios de programación dinamica

Transcript of PROGRAMACIÓN DINÁMICA PROBABILÍSTICA

Page 1: PROGRAMACIÓN DINÁMICA PROBABILÍSTICA

CARACTERÍSTICAS DE PROBLEMAS PDP:

El problema se puede dividir en etapas que requieran una política de decisión en cada una de ellas.

EJEMPLO:

1) Una estudiante universitaria cuenta con 7 días para preparar los exámenes finales de 4 cursos y quiere asignar su tiempo de estudio de la manera más eficiente posible. Necesita por lo menos un día para cada curso y quiere concentrarse solo en un curso cada día por lo que quiere asignar 1, 2, 3 ó 4 días a cada curso. Como hace tiempo tomo un curso de Investigación de Operaciones, decide aplicar programación dinámica para hacer estas asignaciones que maximicen el total de puntos obtenidos en los 4 cursos. Estima que las distintas opciones en días de estudio le redituaran puntos de calificación según la siguiente tabla:

Número de días

Puntos de calificación estimados

Curso

1 2 3 4

0 0 0 0 0

1 3 5 2 6

2 5 5 4 7

3 6 6 7 9

4 7 9 8 9

Etapa 4

S4 F4(S) X4

1 6 1

2 7 2

3 9 3

4 9 4

Etapa 3

Page 2: PROGRAMACIÓN DINÁMICA PROBABILÍSTICA

S3/x3 1 2 3 4 F3(S3) X3

1

2 2+6=8 8 1

3 2+7=9 4+6=10 10 2

4 2+9=11 4+7=11 7+6=13 13 3

5 2+9=11 4+9=13 7+7=14 8+6=14 14 3,4

Etapa 2

S2/x2 1 2 3 4 F2(S) X2

1

2

3 5+8=13 13 1

4 5+10=15 5+8=13 15 1

5 5+13=18 5+10=15 6+8=14 18 1

6 5+14=19 5+13=18 6+10=16 9+8=17 19 1

Etapa 1

S1/x1 1 2 3 4 F1(S) X1

7 3+19=22 5+18=23 6+15=21 7+13=20 23 2

SOLUCION:Curso1 Curso2 Curso3 Curso4

2 1 3 1

2) Imagine que tiene $ 5.000 para invertir y que tendrá la oportunidad de hacerlo en

cualquiera de dos inversiones (A ó B) al principio de cada uno de los próximos

años. Existe

Page 3: PROGRAMACIÓN DINÁMICA PROBABILÍSTICA

incertidumbre respecto al rendimiento de ambas inversiones. Si se invierte en A, se

puede perder todo el dinero o (con probabilidad más alta) obtener$ 10.000 (una

ganancia de $ 5.000) al final del año. Si se invierte en B, se pueden obtener los

mismos $ 5.000 ó (con probabilidad más baja) $ 10.000 al terminar el año.

Las probabilidades para estos eventos son las siguientes:

Se le permite hacer (a lo sumo) una inversión al año y sólo puede invertir $

5000cada vez. (Cualquier cantidad de dinero acumulada queda inútil)

a) Utilice programación dinámica para encontrar la política de inversión que

maximice la cantidad de dinero esperada que tendrá después de los tres años.

b) Utilice programación dinámica para encontrar la política de inversión que maximice la probabilidad de tener por lo menos $ 10000 después de los tres años

Por tanto la política óptima es invertir siempre en A, con una fortuna de espera después de tres años de $ 9800

Page 4: PROGRAMACIÓN DINÁMICA PROBABILÍSTICA

Por tanto la política óptima es invertir siempre en A, con una fortuna de espera después de tres años de $ 9800.

Page 5: PROGRAMACIÓN DINÁMICA PROBABILÍSTICA

Por lo tanto las políticas óptimas son (Con los números en los arcos para representar el retorno de la inversión)

Y la máxima probabilidad de tener al menos $ 10000 al final de tres años es 0.757.

Page 6: PROGRAMACIÓN DINÁMICA PROBABILÍSTICA