incertidumbre

16
Universidad Carlos III de Madrid Curso 2001-2002 Apuntes de Teoría de la Decisión El Modelo Basico de Decision 1 Introducción El objetivo de la ciencia económica es introducir elementos de racionalidad en las decisiones económi- cas. La teoría de la decisión propone una metodología y las herramientas adecuadas para enfocar la toma de decisiones en situaciones de incertidumbre. La teoría de la decisión es parte del instrumen- tal básico de la Teoría Económica. Su metodología tiene numerosas aplicaciones a los problemas de decisión individual más comunes (seguros, inversiones, etc.) y es de uso muy frecuente tanto en Economía Aplicada (Economía Industrial, Economía Pública, Finanzas, etc.) como en Economía de la Empresa (Economía de las Organizaciones, Recursos Humanos, etc.). Decisión e incertidumbre Tomar una decisión signica elegir una acción o una alternativa entre varias disponibles. Si la consecuencia de cada acción o alternativa disponible es cierta y conocida de antemano, tomar una decisión es un acto trivial. Por ejemplo, si en una misma calle un estanco ocial y un vendedor ambulante venden los mismos paquetes de tabaco por 2.2 Euros y 2 Euros respectivamente, cualquier fumador racional acude al vendedor ambulante y se ahorra 20 centavos por paquete. En este caso, la consecuencia de cada decisión (comprar al estanque o comprar al vendedor ambulante) viene determinada por el precio del objeto. Si, por el contrario, la consecuencia de las acciones o alternativas disponibles son inciertas, tomar una decisión es un problema complejo. Por ejemplo, si un forofo del esquí solo puede librarse de su trabajo un n de semana al año para dedicarse a su deporte preferido, jar de antemano con su jefe el n de semana festivo para ir a esquiar es una decisión azarosa ya que el éxito de este único n de semana (¡y de la temporada!) depende de condiciones meteorológicas inciertas y poco previsibles en montaña. Este curso trata de las decisiones en presencia de incertidumbre. Incertidumbre signica que las consecuencias de cada acción o alternativa disponible no se conocen completamente de antemano. Dependen de un suceso aleatorio impredecible e incontrolable por parte del que toma la decisión. Por ejemplo, un agente de bolsa debe invertir una cantidad elevada de dinero y puede elegir entre valores tecnológicos o valores del sector energético. La rentabilidad de su inversión depende de las cotizaciones futuras en la bolsa del valor que elija. Sin embargo, es imposible predecir de antemano el comportamiento exacto de las cotizaciones bursátiles para cada tipo de valor, que depende de variables fuera del alcance de nuestro inversor. En los problemas de decisión con incertidumbre que analizamos conuyen sistemáticamente dos factores de naturaleza muy distinta para determinar el resultado o efecto de una decisión. Por un lado, es importante la alternativa que elige el individuo de entre el conjunto de alternativas posibles 1 Estos apuntes pueden contener errores tipográcos o incluso de cálculo y no cubren necesariamente todo la materia proporcionada en clase por el profesor. En caso de encontrar errores, podéis escribir a [email protected] (Antoni Calvó Armengol). 1

Transcript of incertidumbre

Page 1: incertidumbre

Universidad Carlos III de MadridCurso 2001-2002

Apuntes de Teoría de la DecisiónEl Modelo Basico de Decision1

IntroducciónEl objetivo de la ciencia económica es introducir elementos de racionalidad en las decisiones económi-cas. La teoría de la decisión propone una metodología y las herramientas adecuadas para enfocar latoma de decisiones en situaciones de incertidumbre. La teoría de la decisión es parte del instrumen-tal básico de la Teoría Económica. Su metodología tiene numerosas aplicaciones a los problemasde decisión individual más comunes (seguros, inversiones, etc.) y es de uso muy frecuente tanto enEconomía Aplicada (Economía Industrial, Economía Pública, Finanzas, etc.) como en Economíade la Empresa (Economía de las Organizaciones, Recursos Humanos, etc.).

Decisión e incertidumbreTomar una decisión significa elegir una acción o una alternativa entre varias disponibles. Si laconsecuencia de cada acción o alternativa disponible es cierta y conocida de antemano, tomar unadecisión es un acto trivial. Por ejemplo, si en una misma calle un estanco oficial y un vendedorambulante venden los mismos paquetes de tabaco por 2.2 Euros y 2 Euros respectivamente, cualquierfumador racional acude al vendedor ambulante y se ahorra 20 centavos por paquete. En estecaso, la consecuencia de cada decisión (comprar al estanque o comprar al vendedor ambulante)viene determinada por el precio del objeto. Si, por el contrario, la consecuencia de las acciones oalternativas disponibles son inciertas, tomar una decisión es un problema complejo. Por ejemplo,si un forofo del esquí solo puede librarse de su trabajo un fin de semana al año para dedicarse asu deporte preferido, fijar de antemano con su jefe el fin de semana festivo para ir a esquiar esuna decisión azarosa ya que el éxito de este único fin de semana (¡y de la temporada!) depende decondiciones meteorológicas inciertas y poco previsibles en montaña.Este curso trata de las decisiones en presencia de incertidumbre. Incertidumbre significa que las

consecuencias de cada acción o alternativa disponible no se conocen completamente de antemano.Dependen de un suceso aleatorio impredecible e incontrolable por parte del que toma la decisión.Por ejemplo, un agente de bolsa debe invertir una cantidad elevada de dinero y puede elegir entrevalores tecnológicos o valores del sector energético. La rentabilidad de su inversión depende de lascotizaciones futuras en la bolsa del valor que elija. Sin embargo, es imposible predecir de antemanoel comportamiento exacto de las cotizaciones bursátiles para cada tipo de valor, que depende devariables fuera del alcance de nuestro inversor.En los problemas de decisión con incertidumbre que analizamos confluyen sistemáticamente dos

factores de naturaleza muy distinta para determinar el resultado o efecto de una decisión. Por unlado, es importante la alternativa que elige el individuo de entre el conjunto de alternativas posibles

1Estos apuntes pueden contener errores tipográficos o incluso de cálculo y no cubren necesariamente todo lamateria proporcionada en clase por el profesor. En caso de encontrar errores, podéis escribir a [email protected](Antoni Calvó Armengol).

1

Page 2: incertidumbre

(por ejemplo, invertir en valores tecnológicos o en valores del sector energético, probablemente derentabilidad distinta). Por otro lado, también son determinantes los factores aleatorios inherentesa la incertidumbre del problema analizado (en este caso, las cotizaciones bursátiles son sujetas avariaciones impredecibles). La alternativa es la única variable de control (o variable endógena) delindividuo que toma la decisión, que hace frente además a unos sucesos aleatorios incontrolables (ovariable exógena) que también intervienen de la determinación de sus pagos.En presencia de incertidumbre, las alternativas disponibles son meras loterías de consecuencias

impredecibles. Tomar una decisión es, pues, sinónimo de apostar por una lotería. Tomar una buenadecisión consiste simplemente en realizar una buena apuesta.

La matriz de decisión AIntroducción

Todo problema de decisión en situaciones de incertidumbre se caracteriza por los dos elementossiguientes:

• la decisión es decir, la elección de una alternativa de entre un conjunto o lista de alternativasdisponibles,

• la consecuencia de esta decisión, que el individuo que toma la decisión no conoce con exactitudde antemano ya que depende no sólo de su elección sinó también de un evento aleatorioimpredecible que no controla. Para representar estas consecuencias inciertas introducimos:

— la lista de los estados posibles de la naturaleza o eventos impredecibles no controlablespor parte del individuo que toma la decisión,

— las consecuencias de cada alternativa en cada uno de estos estados posibles de la natu-raleza,

— la información del individuo que toma la decisión sobre la posibilidad de ocurrencia delos distintos estados de la naturaleza.

En este apartado nos centramos en las tres primeras características de un problema de decisiónes decir, la lista de alternativas, la lista de estados de la naturaleza y las consecuencias de cadaalternativa en cada estado. La cuarta característica (la información del individuo) será objeto dela próxima sección.La lista de los estados de la naturaleza debe constituir un conjunto de eventos mutuamente ex-

cluyentes y colectivamente exhaustivos. Mutuamente excluyentes significa que no puede producirsenunca más de un único evento de la lista simultáneamente. Colectivamente exhaustivos significaque siempre se produce al menos un estado de la lista. Supongamos por ejemplo que un individuose plantea ir al monte pero teme la nieve ya que no sabe conducir con la calzada nevada. La con-secuencia (disfrutar o pasar un mal rato) de su decisión (ir o no ir al monte) depende de si nievao no. La lista {nevar, no nevar} es una lista de estados de la naturaleza mutuamente excluyentes(¡nunca pueden producirse los dos eventos nevar y no nevar simultáneamente!) y colectivamenteexhaustivos (siempre se produce al menos un evento: o nieve, o no). Además, estos eventos son rel-evantes para el problema de nuestro individuo al que sólo interesa la presencia o ausencia de nieve.Por el contrario, la lista {nevar, llover} no es colectivamente exhaustiva pues un día soleado no se

2

Page 3: incertidumbre

recoge en ninguna categoría de la lista. Del mismo modo, la lista {nevar, no nevar, estar nublado}no es mutualmente exclusiva pues si nieva entonces necesariamente también está nublado (tambiénpuede estar nublado sin nevar).

Definición

Introducimos la matriz de decisión A a partir del problema de decisión siguiente. Una joven licen-ciada en ingeniería de telecomunicaciones quiere crear su propia empresa de servicios en internet.Para ello debe adquirir equipos informáticos (servidor, modems, etc.). Los equipos disponibles enel mercado ofrecen prestaciones muy variadas, siendo más caros cuanto mayor su capacidad decomunicación y tratamiento de datos. Nuestra ingeniera duda entre adquirir equipos de baja, me-diana o alta capacidad de coste de adquisición respectivamente bajo, mediano y alto. La lista dealternativas disponibles o decisiones posibles contiene tres elementos (d1, d2, d3), que son: d1: adquirir equipos de baja capacidad

d2: adquirir equipos de mediana capacidadd3: adquirir equipos de alta capacidad

La futura empresaria desconoce la demanda real que conseguirá atraer y que deberá atendercon su nuevo servicio y se pregunta qué inversión en infraestructura de comunicación debe realizar.Piensa que su empresa puede tener poco, relativo o mucho éxito y abastecer poca, relativa o muchademanda. El tamaño de esta demanda real depende, sobretodo, de elementos propios al mercadoen internet sobre los que tiene poca influencia (número de competidores futuros, mejora de latecnología, interés por el nuevo producto, etc). El tamaño de su demanda es, en este caso, unevento impredecible, aleatorio y no controlable por parte de nuestra ingeniera. La lista de losposibles tamaños de la demanda constituye la lista de estados de la naturaleza. Anotamos (e1, e2, e2)en esta lista donde: e1: poca demanda

e2: relativa demandae3: mucha demanda

Obviamente, los beneficios de la empresa dependen de la decisión dj de inversión a realizar encapacidad de comunicación (variable de control de la ingeniera) y del éxito de la empresa medido porla demanda real del producto o estado de la naturaleza ei (variable no controlable por la ingeniera).Los beneficios de la empresa son consecuencia de la decisión dj adoptada, que depende también delestado ei acaecido. Anotamos a (ei, dj) = aij la consecuencia de la decisión dj en el estado ei. Ennuestro ejemplo, si la creadora de empresas invierte en unos equipos informáticos de baja capacidad(alternativa d1), la empresa obtendrá 40.000 Euros de beneficios con poca demanda (estado de lanaturaleza e1) es decir, a (e1, d1) = a11 = 40 (en miles de Euros); 10.000 Euros de pérdidas si lademanda es relativa (estado de la naturaleza e2), es decir, a (e2, d1) = a21 = −10; y equilibrarácuentas en caso de mucha demanda (estado de la naturaleza e3) es decir, a (e3, d1) = a31 = 0.Si por el contrario los equipos adquiridos son de capacidad media (alternativa d2) la empresaequilibrará cuentas con poca demanda (a (e1, d2) = a12 = 0), obtendrá 30.000 Euros de beneficioscon demanda relativa (a (e2, d2) = a22 = 30) y 5000 Euros con mucha demanda (a (e3, d2) = a32 = 5).Finalmente, unos equipos de alta capacidad (alternativa d3) producirán 100.000 Euros de pérdidascon poca demanda (a (e1, d3) = a13 = −100), 10.000 Euros de beneficios con demanda relativa(a (e2, d3) = a23 = 10) y 20.000 Euros con mucha demanda (a (e3, d3) = a33 = 20).

3

Page 4: incertidumbre

Dado un problema de decisión como el anterior, la lista (d1, d2, d3) de alternativas disponibles, lalista (e1, e2, e3) de estados de la naturaleza posibles y las consecuencias a (ei, dj) = aij de la decisióndj, j = 1, 2, 3 en el estado ei, i = 1, 2, 3 pueden representarse en una única matriz de pagos A. Enesta matriz A, las alternativas dj dan nombre a las columnas, los estados de la naturaleza ei dannombre a las filas, y las consecuencias aij se sitúan a la intersección de la columna dj y de la fila ei:

A =e1e2e3

d1 d2 d3 40 0 −100−10 30 100 5 20

En general, la matriz de pagos A se escribe:

A =e1...em

d1 · · · dn a11 · · · a1n...

. . ....

am1 · · · amn

Criterios de elecciónSupongamos que nos encontramos ante un problema de decisión representado por una matriz depagos A donde la lista de alternativas posibles (d1, . . . , dn) da nombre a las columnas y la listade estados posibles de la naturaleza (e1, . . . , em) da nombre a las filas. El individuo que debetomar la decisión debe elegir una alternativa dj de la lista (d1, . . . , dn). Sin embargo, al tomar sudecisión, el individuo no puede asegurarse de la consecuencia de su elección. Efectivamente, si eligedj sabe que puede obtener el pago a (e1, dj) = a1j si se cumple el estado de la naturaleza e1, el pagoa (em, dj) = amj si se cumple el estado em o, más generalmente, el pago a (ei, dj) = aij cuando secumple ei. Dicho de otro modo, la consecuencia de cualquier decisión es incierta y constituye unalotería. Tomar una decisión significa simplemente elegir o extraer una de las n columnas de pagosposibles que constituyen la matriz de decisión A.

A =

e1...ei...em

d1 · · · dj · · · dna11 · · · a1j · · · a1n...

.... . .

...ai1 · · · aij · · · ain...

. . ....

...am1 · · · amj · · · amn

decisión djy

dja1j...aij...amj

Elegir dj consiste en ceñirse a la columna de pagos a1j , . . . , aij , . . . , amj que corresponden a

las diferentes consecuencias posibles de la alternativa dj en cada estado de la naturaleza posible.En estas circunstancias, tomar una decisión implica “comparar” columnas de pagos o consecuenciasposibles entre sí. Tomar una decisión es pues sinónimo de apostar por una lotería de pagos inciertos.A continuación indicamos dos métodos posibles de comparación o criterios de elección de alter-

nativas, aplicables a un problema de decisión representado por una matriz de decisión A.

4

Page 5: incertidumbre

El criterio maxmin

Consiste en las tres etapas siguientes:(1) Para cada decisión dj, se detecta el mínimo pago. Se trata de identificar la peor consecuencia

posible asociada a cada decisión.

min {a1j , a2j , . . . , amj} =mini{aij}

Ejemplo: en el caso de la ingeniera que quiere crear una empresa de servicios internet tenemos, para d1: min {40,−10, 0} = −10para d2: min {0, 30, 5} = 0para d3: min {−100, 10, 20} = −100

(2) Se detecta el beneficio máximo entre los mínimos. Se trata de identificar el mayor beneficioentre todos los escenarios pesimistas para evitar los peores. En otros términos, el individuo quetoma la decisión es pesimista y elige la decisión cuyo pago menor es el máximo.

maxnmini{ai1} ,min

i{ai2} , . . . ,min

i{ain}

o=max

jmini{aij}

Ejemplo (sigue): max {−10, 0,−100} = 0(3) Se toma la decisión cuyo mínimo sea el máximo entre todos los mínimos es decir, el maxmin.Ejemplo (sigue): el maxmin es d2.

El criterio maxmax

Consiste en las tres etapas siguientes:(1) Para cada decisión dj, se detecta el máximo beneficio. Se trata de identificar la mejor

consecuencia posible de cada decisión.

max {a1j , a2j , . . . , amj} =maxi{aij}

Ejemplo: para d1: max {40,−10, 0} = 40para d2: max {0, 30, 5} = 30para d3: max {−100, 10, 20} = 20

(2) Se detecta el pago máximo entre los máximos. Se trata de identificar el mayor beneficioentre todos los escenarios optimistas es decir, buscar el mejor de los mejores. En otros términos, elindividuo que toma la decisión es optimista y elige la decisión por la cual el mayor pago posible esmáximo.

maxnmaxi{ai1} ,max

i{ai2} , . . . ,max

i{ain}

o=max

jmaxi{aij}

Ejemplo (sigue): max {40, 30, 20} = 40(3) Se toma la decisión cuyo máximo sea el beneficio máximo entre todos los beneficios máximos

es decir, el maxmax.Ejemplo (sigue): el maxmax es d1.

5

Page 6: incertidumbre

Discusión

Ni el criterio de decisión maxmin (que da lugar a la elección de la alternativa d2 es decir, inversiónen equipos de mediana capacidad) ni el criterio de elección maxmax (que da lugar a la elección dela alternativa d1 es decir, inversión en equipos de baja capacidad) toman en cuenta las distintasprobabilidades p (e1) , . . . , p (em) de ocurrencia de los distintos estados posibles de la naturalezae1, . . . , em. Por ejemplo, si sabemos de antemano y sin ninguna incertidumbre que la empresagenerará mucha demanda de servicio es decir, si el estado de la naturaleza correspondiente e3se cumple con toda certidumbre (p (e3) = 1), la decisión óptima para la ingeniera es invertir enequipos de alta capacidad es decir, elegir la alternativa d3. Si, por el contrario, todo apunta auna futura demanda relativa es decir, p (e2) = 1, cabe adquirir los equipos mejor adaptados demediana capacidad, es decir, se tomará la decisión d2. Finalmente, si se prevé poca demanda sinincertidumbre alguna, es decir, p (e1) = 1, el equipo informático ideal es el de baja capacidad, esdecir, d1.El maxmin huye de los peores beneficios: −100 = a13 y −10 = a21. El maxmax busca el mejor

de los mejores beneficios: 40 = a11. ¿Qué sentido tiene evitar −100 (minmax) o apostarlo todo por40 (maxmax) cuando se sabe de antemano y con toda certeza que no habrá poca demanda, es decirp (e1) = 0? En la sección siguiente se desarrolla un criterio que tenga en cuenta las probabilidadesde los distintos estados de la naturaleza.

El criterio del valor esperado monetario V EM o gananciaesperada

El vector de probabilidades PCompletamos la descripción del problema de decisión con un vector que nos indica las probabilidadesp (ei) = pi de ocurrencia de los distintos estados de la naturaleza e1. Denotamos por P a este vector:

P =

p (e1)...

p (ei)...

p (em)

=p1...pi...pm

P resume la información del individuo que toma la decisión sobre la realización de los estados

posibles de la naturaleza. En el ejemplo anterior de creación de una empresa en internet, la inge-niera puede tener previsiones sobre la demanda que generará su servicio (poca, relativa, mucha) =(e1, e2, e3) atribuyendo una probabilidad p (ei) a cada tipo posible de demanda por lo que se obtieneun vector de probabilidades:

P = p (e1)p (e2)p (e3)

= p1p2p3

que obviamente satisface la condición

3Pi=1

p (ei) =3Pi=1

pi = p1 + p2 + p3 = 1.

6

Page 7: incertidumbre

Un problema de decisión queda representado por el par (A,P):

(A,P) =

e1...ei...em

d1 · · · dj · · · dna11 · · · a1j · · · a1n...

.... . .

...ai1 · · · aij · · · ain...

. . ....

...am1 · · · amj · · · amn

,p1...pi...pm

Por ejemplo, en el caso de la creación de una empresa internet:

(A,P) =

e1e2e3

d1 d2 d3 40 0 −100−10 30 100 5 20

, 0, 30, 50, 2

El criterio V EM

El criterio del valor esperado monetario (ganancia esperada) consiste en las tres etapas siguientes:(1) Para cada decisión dj, se calcula el valor esperado monetario (ganancia esperada) correspon-

diente al vector de probabilidades P

V EM (dj) = p (e1) a1j + p (e2) a2j + · · ·+ p (em) amj =mXi=1

p (ei) aij

= p1a1j + p2a2j + · · ·+ pmamj =mXi=1

piaij

Ejemplo: V EM (d1) = 0, 3× 40 + 0, 5× (−10) + 0, 2× 0 = 7V EM (d2) = 0, 3× 0 + 0, 5× 30 + 0, 2× 5 = 16V EM (d3) = 0, 3× (−100) + 0, 5× 10 + 0, 2× 20 = −21

(2) Se detecta el valor esperado monetario (ganancia esperada) máximo.

max {V EM (d1) , V EM (d2) , . . . , V EM (dn)} =maxj{V EM (dj)} =max

j

(mXi=1

piaij

)

Ejemplo (sigue): max {V EM (d1) , V EM (d2) , V EM (d3)} = max {7, 16,−21} = 16(3) Se toma la decisión cuyo valor esperado monetario (ganancia esperada) sea el máximo entre

todos los valores esperados monetarios (ganancias esperadas). Esta decisión es la decisión óptimay la ganancia esperada asociada el valor esperado monetario de la decisión óptima, anotado V EM∗

Ejemplo (sigue): la decisión óptima es d2 y el valor esperado monetario de la decisión óptimaV EM∗ = 16.

7

Page 8: incertidumbre

Ejercicios

Para los ejercicios descritos a continuación, se trata primero de expresar la situación descrita entérminos de una matriz de pagos A y un vector de probabilidades P , para luego aplicar el criterioV EM de elección de una alternativa. La dificultad del ejercicio, cuando la hay, consiste en identificarcorrectamente el conjunto de alternativas sobre el que recae la decisión, la lista completa de estadosde la naturaleza y los pagos del individuo para cada decisión en cada uno de los estados posibles.Asimismo, la obtención de P puede también a veces ser dificultosa.

Ejercicio 1

Enunciado: un ordenador genera aleatoriamente un número del 1 al 4 (1, 2, 3 ó 4). Determine si unindividuo que maximice la ganancia esperada apostaría 10 euros a uno de los números si el premioen caso de acertar es de 30 euros.Solución:

A =e1 = 1e2 = 2e3 = 3e4 = 4

d1q1

d2q2

d3q3

d4q4

d5q∅

20 −10 −10 −10 0−10 20 −10 −10 0−10 −10 20 −10 0−10 −10 −10 20 0

P =

14141414

½V EM (d1) = · · · = V EM (d4) =

14× (−20) + 3

4× 10 = −2, 5

V EM (d5) = 0 = V EM∗

La solución óptima para el jugador es no apostar (d5) y el valor esperado monetario de estadecisión es V EM∗ = 0.

Ejercicio 5

Enunciado: en una partida de cartas entre los jugadores A y B, A ha apostado 50 euros y B sólo 30euros. Ahora B debe decidir si ver (igualar) la apuesta de A o retirarse. B cree que la probabilidadde que la jugada de A sea mejor es 0.4. Determine qué debe hacer B.Solución:

A = e1 = A mejor jugadae2 = A peor jugada

d1q

B ve

d2q

B no ve· −50 −3050 −30

¸

P =·

410610

¸8

Page 9: incertidumbre

½V EM (d1) =

410× (−50) + 6

10× 50 = 10 = V EM∗

V EM (d2) = −30La decisión óptima para el jugador B es ver (d1) y el valor esperado monetario de esta decisión

es V EM∗ = 10.

Ejercicio 6

Enunciado: Jorge tiene el coche averiado y debe decidir si repararlo o reemplazarlo por otro cocheusado cuyo precio es 900 euros. Reparar su coche costaría 300 euros si la avería es leve y 1.500 eurossi es grave. La probabilidad de que la avería sea grave es 2

3. El objetivo de Jorge es conseguir un

medio de transporte al menor coste esperado posible. ¿Debería reparar su coche o reemplazarlo?Solución:

A = e1 = avería levee2 = avería grave

d1q

reparar

d2q

reemplazar· −300 −900−1.500 −900

¸

P =·

1323

¸½V EM (d1) =

13× (−300) + 2

3× (−1500) = −1.100

V EM (d2) = −900 = V EM∗

La decisión óptima para Jorge es reemplazar el coche (d2) y el valor esperado monetario de estadecisión es V EM∗ = −900.

Ejercicio 3

Enunciado: un agente de ventas por teléfono posee una lista de consumidores potenciales, así comosus números de teléfono. Cada día puede hacer un número limitado de llamadas. Cada llamadatelefónica le cuesta 1 euro y por cada venta que realiza recibe 20 euros de comisión. Su experienciale dice que, de cada 10 llamadas, en 3 tiene suerte y consigue hablar con la persona indicada enla lista. Además, cuando consigue hablar con la persona indicada, 2 de cada 10 de ellas compra elproducto.

(a) Dibujar el árbol de decisión ¿Cuál es el valor esperado de cada llamada telefónica?

(b) La compañía telefónica también ofrece el servicio “persona-a-persona”. Con este servicio sepaga un precio p por llamada sólo si se consigue contactar con la persona deseada. ¿Cuál esel p máximo que el vendedor estaría dispuesto a pagar por cada llamada persona-a-persona?

Solución:

A =e1 = no contesta

e2 = contesta y no comprae3 = contesta y compra

d1q

normal

d2q

pers-a-pers −1 0−1 −p19 20− p

9

Page 10: incertidumbre

P = 7

10310× 8

10310× 2

10

= 7

10241006100

½V EM (d1) =

710× (−1) + 24

100× (−1) + 6

100× 19 = 2

10

V EM (d2) =710× 0 + 24

100× (−p) + 6

100× (20− p) = 12−3p

10

El servicio “persona-a-persona” es la decisión óptima si se cumple 12 − 3p ≥ 2 ⇔ p ≤ 103. El

vendedor está dispuesto a pagar como máximo p∗ = 3, 33 euros por este servicio.

El árbol de decisión

Definición

Hasta ahora hemos representado los problemas de decisión en situación de incertidumbre medianteuna matriz de pagos y un vector de probabilidades (A,P). Existen otras formalizaciones posiblespara un problema de decisión, caracterizado por (recordémoslo) una lista de alternativas, una listade estados posibles de la naturaleza, las consecuencias o pagos de cada alternativa en cada estado,y la información del individuo que toma la decisión sobre las posibles realizaciones de los distintosestados de la naturaleza.En particular, un problema de decisión puede representarse gráficamente en forma de árbol de

decisión. Un árbol de decisión se comprende de:

• una serie de nodos o puntos de toma de decisión de donde emanan tantas ramas como alter-nativas existen (cada rama representa un alternativa posible): nodo de decisión representadopor un cuadrado ¤;

• una serie de nodos de donde emanan tantas ramas como estados de la naturaleza posibles enaquel nodo (una rama representa un estado de la naturaleza): nodo de azar representado porun círculo °;

• sobre cada rama representando un estado de la naturaleza, la probabilidad de ocurrencia delmismo a partir del nodo;

• sobre cada nodo terminal, un valor indicando la ganancia correspondiente al curso de acciónque desemboca en el nodo.

El nodo inicial del arbol de decisión puede ser una acción aleatoria de la naturaleza (nodo deazar°) o una acción del decisor (nodo de decisión ¤). Las alternativas se disponen secuencialmentesobre el arbol como si se ordenaran en el tiempo. El problema de decisión se resuelve por inducciónhacia atrás, sustituyendo los nodos de azar por el valor esperado monetario en aquel nodo. Estaganancia esperada es la suma de los pagos en los nodos terminales inmediatamente posterioresal nodo, ponderados por las probabilidades indicadas sobre las ramas. En general, adoptamos elárbol de decisión en problemas de decisión secuenciales, donde la elección del individuo afecta unasecuencia de acciones. Por el contrario, la matriz de pagos es particularmente apropiada paradecisiones aisladas.

10

Page 11: incertidumbre

Ejercicio 2

Enunciado: se lanza una moneda y se anticipa el resultado (cara o cruz). Si se acierta, se cobran 10euros y se tiene la posibilidad de volver a jugar y, así, hasta tres lanzamientos de la moneda. Si sefalla, se devuelve todo el dinero que se ha ganado y no se tiene la oportunidad de seguir jugando.Al final del juego hay que pagar 2 euros por cada apuesta. Determine la decisión que maximiza laganancia esperada.Solución: Si organizamos los datos según el formato (A,P), obtenemos (+ indica apostar a Cruz

y C indica apostar a Cara):

• 14 alternativas distintas: +,C|{z}1 apuesta

, ++,CC,+C,C+| {z }2 apuestas

, +++,CCC,++C,+C+,C++,CC+,C+C,+CC| {z }3 apuestas

;;

• 8 estados posibles de la naturaleza:(+++,CCC,++C,+C+,C++,CC+,C+C,+CC) ;

• en definitiva, una matriz de decisión A 8× 14 con 112 casillas de consecuencias posibles paracada una de las 14 alternativas en cada uno de los 8 estados posibles de la naturaleza.

En este caso, la representació gráfica en forma de árbol de decisión es más intuitiva, cómoda einmediata. A significa apostar y qA significa no apostar. Como la moneda no está sesgada, cuandoel individuo apuesta, gana (G) con probabilidad 1/2 y pierde (P ) con idéntica probabilidad 1/2.

2ZZZZZ

½½½½½

A

qA0

°ZZZZZ

½½½½½

G : 12

P : 12

−2

2ZZZZZ

½½½½½

A

qA8

°ZZZZZ

½½½½½

G : 12

P : 12

−4

2ZZZZZ

½½½½½

A

qA16

°ZZZZZ

½½½½½

G : 12

P : 12

24

−6

Resolver este juego por inducción hacia atrás supone sustituir los nodos de azar y los eventosaleatorios que emanan de ellos por la ganancia esperada en aquel nodo. En este caso, en el último

11

Page 12: incertidumbre

nodo de azar, el individuo gana 24 con probabilidad 1/2 o pierde −6 con idéntica probabilidad1/2. En este nodo, obtiene una ganancia esperada igual a 1

2× 24 + 1

2× (−6) = 9. El árbol puede

simplificarse al sustituyendo las últimas ramas por esta ganancia esperada 9, que agrega toda lainformación disponible sobre lo que puede acontecer en aquel nodo (ganar 24 o perder −6 conprobabilidades respectivas 1/2 y 1/2). Obtenemos:

2ZZZZZ

½½½½½

A

qA0

°ZZZZZ

½½½½½

G : 12

P : 12

−2

2ZZZZZ

½½½½½

A

qA8

°ZZZZZ

½½½½½

G : 12

P : 12

−4

2ZZZZZ

½½½½½

A

9

qA16

Obviamente, en la última etapa del juego (tercer lanzamiento) el jugador prefiere no apostar(qA) y obtener 16 a apostar (A) y obtener un ganancia esperada igual a 9. Podemos pues sustituirel último nodo de decisión por el resultado de la decisión racional en este nodo es decir, 16.

2ZZZZZ

½½½½½

A

qA0

°ZZZZZ

½½½½½

G : 12

P : 12

−2

2ZZZZZ

½½½½½

A

qA8

°ZZZZZ

½½½½½

G : 12

P : 12

−4

16

Iteramos el proceso de inducción hacia atrás calculando la nueva ganancia esperada en el últimonodo de azar 1

2× 16 + 1

2× (−4) = 6. El jugador prefiere no apostar en un segundo lanzamiento

12

Page 13: incertidumbre

(qA) y obtener 8 a apostar (A) y obtener un ganancia esperada igual a 6.

2ZZZZZ

½½½½½

A

qA0

°ZZZZZ

½½½½½

G : 12

P : 12

−2

2ZZZZZ

½½½½½

A

qA8

6

Finalmente, la última ganancia esperada es igual a 12×8+ 1

2×(−2) = 3 por lo que el jugador prefiere

apostar para un primer lanzamiento y ganar 3 (en términos esperados) a no apostar y quedarse con0.

2ZZZZZ

½½½½½

A

qA0

3

El valor de la información perfecta

Definición

Sea un problema de decisión (A,P). Cuando un individuo posee información perfecta sabe, antes detomar la decisión y sin incertidumbre, el estado de la naturaleza que va a realizarse. Si el individuosabe que va a ocurrir el estado ei sin ambigüedad, es decir, p (ei) = pi = 1, la decisión óptima essimplemente aquélla que maximiza las ganancias en la fila correspondiente a ei. Denotamos porMi

el pago correspondiente a la decisión óptima con información perfecta sobre el estado ei:

Mi = max {ai1, ai2, . . . , ain} =maxj{aij}

El valor esperado monetario con información perfecta V EMIP se calcula simplemente sumandolos pagos Mi correspondientes a las decisiones óptimas en cada estado ponderados por la probabil-idad p (ei) = pi de ocurrencia de cada uno de los estados:

V EMIP = p (e1)M1 + p (e2)M2 + · · ·+ p (em)Mm =mXi=1

p (ei)Mi

= p1M1 + p2M2 + · · ·+ pmMm =mXi=1

piMi

13

Page 14: incertidumbre

Ejemplo: en el caso de creación de una empresa de servicios en internet por parte de una reciénlicenciada en ingeniería de telecomunicaciones recordemos que:

(A,P) = 40 0 −100−10 30 100 5 20

, 0, 30, 50, 2

Por consiguiente: M1 = max {40, 0,−100} = 40

M2 = max {−10, 30, 10} = 30M3 = max {0, 5, 20} = 20

De donde deducimos que V EMIP = 0, 3× 40 + 0, 5× 30 + 0, 2× 20 = 31.Un individuo que conoce exactamente el estado ei que va a realizarse puede asegurarse un pago

Mi en cada uno de estos estados. El valor esperado monetario en información perfecta V EMIPindica la ganancia esperada de aquel individuo que pudiera adaptar su decisión al estado realizadodespués de esta realización.En condiciones de incertidumbre, la toma de decisión debe producirse antes de la realización

del estado de la naturaleza, cuando todo aún es posible. La decisión tomada no puede revisarse yse mantendrá una vez conocido el estado de la naturaleza, sea cual sea. Si el individuo que tomala decisión se rige según el criterio de la ganancia esperada o valor esperado monetario, prevé unaganancia igual a V EM∗ que es la ganancia esperada correspondiente a su decisión óptima. Es fácilver que:

V EMIP ≥ V EM∗

Poseer información perfecta aumenta la ganancia esperada en la cantidad V EMIP−V EM∗ ≥ 0.Por definición, esta diferencia es el valor de la información perfecta V IP :

V IP = V EMIP − V EM∗

El valor de la información perfecta V IP nos indica el valor máximo que el individuo estádispuesto a pagar para librarse de la incertidumbre, comprar información y tomar su decisión coninformación perfecta sobre lo que va a suceder. Si el coste c de adquisición de la información esinferior al valor de la información perfecta V IP , c < V IP , el individuo encargado de tomar ladecisión prefiere comprar la decisión y eliminar la incertidumbre. Si, por el contrario, el coste c esmayor que el valor de la información perfecta V IP , c > V IP , el decisor prefiere no comprar lainformación que se le ofrece y tomar su decisión en condiciones de incertidumbre. La indiferenciaentre comprar y no comprar la información ocurre cuando c = V IP .Ejemplo: en el caso de creación de una empresa internet y inversión en equipos informáticos con

desconocimiento de la demanda futura del servicio tenemos: V IP = 31− 16 = 51.

Ejercicios

Ejercicio 1

Solución: calculamos el pago Mi asociado a la decisión óptima con información perfecta para cadaestado ei. Obtenemos:

14

Page 15: incertidumbre

M1 = max {20,−10,−10,−10, 0} = 20M2 = max {−10, 20,−10,−10, 0} = 20M3 = max {−10,−10, 20,−10, 0} = 20M4 = max {−10,−10,−10, 20, 0} = 20

Con el vector de probabilidades P =£14, 14, 14, 14

¤calculamos el valor esperado monetario con

información perfecta:

V EMIP =1

4× 20 + 1

4× 20 + 1

4× 20 + 1

4× 20 = 20

Sabemos que el valor esperado monetario asociado a la decisión óptima (según el criterio de laganancia esperada) es V EM∗ = 0, de donde deducimos el valor de la información perfecta:

V IP = V EMIP − V EM∗ = 20

Ejercicio 5

Solución: calculamos el pago Mi asociado a la decisión óptima con información perfecta para cadaestado ei. Obtenemos: ½

M1 = max {−50,−30} = −30M2 = max {50,−30} = 50

Con el vector de probabilidades P = £ 410, 610

¤calculamos el valor esperado monetario con infor-

mación perfecta:

V EMIP =4

10× (−30) + 6

10× 50 = 18

Sabemos que el valor esperado monetario asociado a la decisión óptima (según el criterio de laganancia esperada) es V EM∗ = 10, de donde deducimos el valor de la información perfecta:

V IP = V EMIP − V EM∗ = 8

Ejercicio 6

Solución: obtenemos: ½M1 = max {−300,−900} = −300M2 = max {−1500,−900} = −900

Con el vector de probabilidades P = £13, 23

¤calculamos:

V EMIP =1

3× (−300) + 2

3× (−900) = −700

Sabemos que el valor esperado monetario asociado a la decisión óptima (según el criterio de laganancia esperada) es V EM∗ = −900, de donde deducimos el valor de la información perfecta:

V IP = V EMIP − V EM∗ = 200

15

Page 16: incertidumbre

Ejercicio 3

Solución: En este caso la información perfecta consiste en saber antes de la llamada si el potencialcliente contestará al teléfono y si, además, comprará el servicio ofrecido. Obtenemos: M1 = max {−1, 0} = 0

M2 = max {−1,−p}M3 = max {19, 20− p}

Con el vector de probabilidades p =¡710, 24100, 6100

¢calculamos:

V EMIP =7

10× 0 + 24

100×max {−1,−p}+ 6

100×max {19, 20− p}

Por consiguiente, si 0 < p < 1,M2 = −p yM3 = 20−p lo que implica que V EMIP = 1, 2−0, 3p.Si por el contrario, p > 1, M2 = −1 y M3 = 19 de donde deducimos que V EMIP = 0, 9. Sabemosque el valor esperado monetario asociado a la decisión óptima (según el criterio de la gananciaesperada) es V EM∗ = 0, 2 si p > 10

3y V EM∗ = 1, 2− 0, 3p si p < 10

3. Por consiguiente, V IP = (1, 2− 0, 3p)− (1, 2− 0, 3p) = 0 si 0 < p < 1

V IP = 0, 9− (1, 2− 0, 3p) = 0, 3 (p− 1) si 1 < p < 103

V IP = 0, 9− 0, 2 = 0, 7 si 103< p

16