Notas 3 Juegos Dinamicos

download Notas 3 Juegos Dinamicos

of 31

Transcript of Notas 3 Juegos Dinamicos

  • 7/24/2019 Notas 3 Juegos Dinamicos

    1/31

    Juegos Dinamicos*

    Alvaro J. Riascos VillegasUniversidad de los Andes

    Septiembre de 2013

    Indice

    1. Conceptos basicos 2

    2. Aprendizaje y estrategias mixtas 5

    3. Informacion perfecta 9

    4. Informacion imperfecta 154.1. Amenazas no crebles . . . . . . . . . . . . . . . . . . . . . . . . . 154.2. Creencias no crebles . . . . . . . . . . . . . . . . . . . . . . . . . 22

    5. Equilibrio perfecto y propio 25

    6. Aplicaciones 276.1. Oligopolio: Stackelberg . . . . . . . . . . . . . . . . . . . . . . . . 276.2. Diseno de mecanismos . . . . . . . . . . . . . . . . . . . . . . . . 27

    6.2.1. Un problema de externalidades . . . . . . . . . . . . . . . 276.2.2. La solucion de Pigou . . . . . . . . . . . . . . . . . . . . . 286.2.3. El mecanismo de compensacion . . . . . . . . . . . . . . . 296.2.4. El problema del Rey Salomon . . . . . . . . . . . . . . . . 31

    *Notas de clase basadas en Mas-Colell et.al [1995], Myerson , R. [1990] y Vega - Redondo,F[2003].

    1

  • 7/24/2019 Notas 3 Juegos Dinamicos

    2/31

    1. Conceptos basicos

    Muchas situaciones en las que se se presenta la interaccion de varios agen-tes tiene una forma interactiva. Esta dinamica puede ser explcitamentemodelada y de esta forma enriquecer el analisis estatico que hemos estudia-do hasta el momento. La caracterstica fundamental de estas situacionesestrategicas e interactivas es que a lo largo de la interaccion entre losagentes se revela informacion total o parcialmente sobre las aciones de losdemas que pueden ser usadas para revisar las estrategias individuales.

    Definicion 1 Un juego en forma extensiva es una estructura

    = (N,K,R,Z, {Ki}i=1,...,N, {Hi}i=1,...,N, {A(k)}kK\Z, {ui}i=1,...,N)

    donde:

    1. N es un conjunto de jugadores, N ={1, ...N} .1

    2. Kes un conjunto finito que representa los nodos de un arbol.

    3. R es una relacion sobreKque define un arbol.

    4. Zson los nodos terminales del arbol.

    5. {Ki}i=1,...,N es una particion de K\Z que denota los nodos donde cadajugador juega.

    6. Parai = 1,...,N; Hi es una particion deKi. Cadah Hi denota un con-junto de informacion.Las particionesHi son la estructura de informacionde lo agentes en el juego.

    7. Para i= 1,...,N, yk Ki, A(k) denota las acciones posibles del jugadori en el nodo k. Denotamos un elemento de a A(k) por ak. Dados k yk h Hi debe complirse que A(k) = A(k). De esta forma el jugadorno es capaz de distinguir, con base en las acciones factibles en un nodo,en cual de los nodos del conjunto de informacion se encuentra. Luego, elconjunto de acciones factibles en un nodo lo podemos identificar como unconjunto de acciones factibles del conjunto de informacion que contieneal nodo. Abusando un poco del lenguaje definimos A(h) = A(k), k h ydenotamos una acciona A(h) porah.

    8. Para i = 1,...,N, y z Z, ui(z) denota la utilidad del agente i en casode que el resultado final del juego sea el nodo terminalz. Esto no excluye

    que existan pagos intermedios. Interpretamos estas funciones de utilidadcomo funciones de utilidad de von Neumann y Morgentern.

    1En ocasiones adicionamos un jugador no estrategico que denotamos por cero y representala naturaleza.

    2

  • 7/24/2019 Notas 3 Juegos Dinamicos

    3/31

    Nota tecnica 1 La extension de la defincion anterior al caso en el que lospagos dependen de la realizacion de algun evento aleatorio es inmediata (i.e.,

    jugadas de la naturaleza).

    Definicion 2 Sea Ai = hHi

    A(h). Una estrategia pura si para el jugador i =

    1,...,Nen un juego en forma extensiva es una funcionsi: HiAi tal quepara todo h Hi, si(h) A(h).

    Dada una estrategia conjunta (si)i=1,...N esta induce un camino unico alo largo del arbol comenzando en la raz y terminando en algun nodoz = (s) Z. En ocasiones utilizaremos la notacion (s1,...,sN) paradenotar la estrategia conjunta (si)i=1,...N.

    Todo juego en forma extensiva se puede representar de dos formas comojuegos estaticos: forma normal y forma multiagentes o de Selten.

    Definicion 3 (Forma normal) Para i = 1,...,N, sea Si ={si : Hi Ai

    si(h) A(h)}, s S =N

    i=0

    Si y definimos (s) Z como el nodo final co-

    rrespondiente al unico camino que sobre el arbol define la estrategia conjun-ta s. Para i = 1,...,N definimos i(s1,...,sN) = ui((s1,...,sN)). El juegoG = ({1,...,N} , {Si}i=1,...,N, {i}i=1,...,N) se llama la representacion normaldel juego en forma extensiva.

    Es facil ver que un juego en forma normal puede ser la representacionnormal de juegos distintos en forma extensiva.

    La representacion multiagente de Selten informalmente supone la existen-cia de varios agentes de un jugador, uno en cada conjunto de informaci on,que actuan de forma independiente y toman decisiones en nombre del

    jugador que representan.

    Definicion 4 (Forma multiagente o de Selten) SeaN = iN

    {i} Hi el

    conjunto de jugadores. Un jugador es una pareja(i, hi) donde i N yhi Hi.Por simplicidad y mientras no haya riesgo de confusion, denotaremos el agente(i, hi) porhi. Para cada jugadorhi, seaS

    hi

    =A(hi) su conjunto de estrategias.Una estrategia conjunta es s S donde S =

    hiNShi y escribimos s =

    (shi)hiN. Cada estrategia conjunta tiene asociado un nodo terminal z Zque denotamos porz= (shi)hiHi,iN.

    Para cada jugadorhi definimos

    hi((shi)hiN) = ui(((shi)hiN)).

    El juego G = (N,

    Shi

    hiN

    , (hi)hiN) se llama la representacion de Sel-

    ten o multiagente del juego en forma extensiva.

    3

  • 7/24/2019 Notas 3 Juegos Dinamicos

    4/31

    Ejemplo 1 Considere el siguiente juego en forma extensiva (Figura 1).La forma normal de este juego es:

    1\2 y zaw 5,0 1,1ax 4,0 4,0 bw 8,3 0,1bx 7,3 3,0

    y la multiagente es (el agente 1 y 2 representan al jugador 1 y el agente 3representa el juagador 2) :

    Agente 1\2 w xa 5,5,0 4,4,0 b 8,8,3 7,7,3 yAgente 3

    Agente 1\2 w xa 1,1,1 4,4,0 b 0,0,1 3,3,0 zAgente 3

    Observese que los pagos del agente 1 y 2 siempre se repiten ya que represen-tan al mismo jugador 1.

    Ahora, para ver que estas representaciones no son simplemente formas dis-tintas de decir lo mismo, observese que en la forma normal, la eliminacionsecuencial de estrategias debilmente dominadas predice que el jugador uno ju-

    garay y el dos jugarabw. Sin embargo, en la representacion multiagente, nin-guna estrategia es dominada debilmente.

    Ejercicio 1 Se puede modificar este juego para dar un argumento en terminosde estrategias dominadas?

    4

  • 7/24/2019 Notas 3 Juegos Dinamicos

    5/31

    2. Aprendizaje y estrategias mixtas

    En esta seccion veremos la relevancia de definir un modelo de aprendizajeen ambientes inciertos. El paradigma de modelo de aprendizaje en teorade la decision es el regla de Bayes.

    El siguiente ejemplo llama la atencion sobre las sutilezas de este concepto.

    Ejemplo 2 (Paradoja del gato) Una persona esta frente a tres puertas ce-rradas. Se sabe que detras de alguna de las puertas hay un gato y el objetivo dela persona es adivinar en que puerta esta el gato. La persona se le pide escogeruna puerta. Despues una segunda persona que sabe donde esta el gato y cual fuela puerta elegida por la primera persona, abre una de las puertas en la que noeste el gato y que no haya sido la elegida por la primera persona. La primerapersona puede observar que la puerta que fue abierta no tiene el gato y conoce

    la forma de actuar de la segunda persona. Ahora se le pregunta a la primerapersona si deseara cambiar de puerta.El sentido comun dice que no hace diferencia. Pero la teora de la proba-

    bilidad dice otra cosa. La probabilidad de encontrar el gato en la puerta quepermanece cerrada y que no es la elegida por la primera persona es mayor quela elegida incialmente.

    Para formalizar este problema, supongamos que la primera eleccion fue latercera puerta. SeanA1, A2 yA3 los eventos en los cuales el gato esta detras dela puerta1, 2 o 3 respectivamente. SeanB1 yB2 los eventos en los cuales el se-gundo jugador abre la puerta1 o 2 reespectivamente. Nuetro objetivo es calcularP(Ai |Bj) . Entonces dada la informacion del problema es natural suponer:

    P(Ai) =1

    3

    , P(B1|A1) = P(A2 |B2) = 0

    P(B1 |A2) = P(B2 |A1) = 1

    y

    P(B1|A3) = P(B2|A3) =1

    2.

    Entonces si la segunda persona abre la puerta2 es facil calcular, usando laregla de Bayes, P

    A1 |B2) =

    23

    Una motivacion para introducir estrategias mixtas en juegos en formaextensiva es observando que en algunos de estos juegos no necesariamenteexiste un equilibrio en estrategias puras. Por ejemplo, considere el juegode cara y sello en una representacion en forma extensiva.

    Dadas las dos representaciones anteriores, forma normal o de Selten, exis-ten dos formas naturales de definir estrategias mixtas.

    5

  • 7/24/2019 Notas 3 Juegos Dinamicos

    6/31

    Definicion 5 (Estrategias mixtas y de comportamiento) Una estrategiamixta en un juego en forma extensiva es una estrategia mixta del juego en su re-

    presentacion normal. Una estrategia de comportamiento en un juego en formaextensiva es una estrategia mixta del juego en su representacion multiagente.Alternativamente, una estrategia de comportamiento para el jugador i es una

    funcioni : Hi (Ai) tal que para todo h Hi el soporte dei(h) esta con-tenido enA(h).

    Para ver que las dos definiciones de estrategias de comportamiento sonequivalentes considere una estrategia de comportamiento en el sentido deSelten, hi , hi N

    donde hi es un elemento de (Shi

    ) = (A(hi)).Ahora defina i para el jugador i, como i : Hi (Ai) donde i(hi) =hi . La funcioni representa las estrategias de comportamiento en el sen-tido de la ultima definicion. Un argumento muy similar muestra que todaestrategia de comportamientoi define una estrategia de comportamiento

    en el sentido de Selten.

    Para resaltar la diferencia entre los dos conceptos de estrategias mixtasestudiemos el siguiente ejemplo.

    Ejemplo 3 (Estrategias mixtas como estrategias de comportamiento)Considere el siguiente juego de la figura 1A y la estrategia mixta para el jugador1, 0,5[ay] + 0,5[bz]. Una posibilidad para representar esta estrategia como unaestrategia de comportamiento es simplemente asociandole a cada agente (quelo representa en sus conjuntos de informacion) la probabilidad marginal de lasestrategias puras involucradas. Por ejemplo, un candidato natural para la estra-tegia de comportamiento del jugador1 es: (0,5[a] + 0, 5[b], 0,5[y] + 0,5[z]) dondela primera coordenada corresponde a la estrategia mixta en el primer conjunto

    de informacion del jugador1 y la segunda al segundo conjunto de informacion.Sin embargo, esto no parece hacer mayor sentido, pues en la estrategia mixtaoriginal para escogerz es necesario escogerbz y en ese caso, el segundo agentedel jugador 1 jamas jugara y por lo tanto no escogera y en su estrategia decomportamiento.

    Ahora, condicional a que le toca jugar al segundo agente del jugador1, laprobabiliad de escogery es1. Luego otra posible representacion de la estrategiamixta como una estrategia de comportamiento es:(0,5[a] + 0, 5[b], [y]) .

    Este ejemplo motiva la siguiente definicion informal. Decimos que unaestrategia pura si Si para el jugador i en la representacion normal del

    juego es compatible con el conjunto de informacion hi Hi si existe unconjunto de estrategias si para los demas jugadores tal que le estrategiaconjuntas = (si, s

    i) implicapasarporhi.Por ejemplo, considere el juego

    de la figura 2.

    Las estrategias puras para el jugador 1,(B, C) y (B, D) son incompatibles

    con el segundo conjunto de informacion del jugador 1.Seahi HiySi(hi)las estrategias puras del jugador i que son compatibles con el conjunto deinformacion hi.

    6

  • 7/24/2019 Notas 3 Juegos Dinamicos

    7/31

    7

  • 7/24/2019 Notas 3 Juegos Dinamicos

    8/31

    Dada una estrategia mixta i del juego en formal normal, definimos lasiguiente estrategia de comportamiento para el jugador i:

    i(h)(a) =

    i(si)

    {siSi(hi):si(hi)=a}i(si)

    siSi(hi)

    si

    i(si)> 0siSi(hi)

    i(h)(a) =

    i(si){siSi(hi):si(hi)=a}

    si

    i(si)siSi(hi)

    = 0

    Intuitivamente, i(h)(a) es la probabilidad segun i de la accion a condi-cional a pasar por el conjunto de informacion h. Cuando esta probabili-dad de pasar con el conjunto de informacionh es cero, entonces definimosi(h)(a) como la probabilidad no condicional segun i de pasar por elconjunto de imformacionh. Sin embargo, el punto importante es que si la

    probabilidad de pasar por el conjunto de informacion h es cero, entoncesla regla de Bayes no tiene ninguna implicacion sobre la probabilidad enese nodo y puede definirse de forma arbitraria.

    Por ejemplo, en la figura anterior (figura 2), considere la estrategia mixtapara el jugador 1. 1 =

    0, 0, 12 ,

    12

    donde el suponemos que cada coorde-

    nada del vector representa la probabilidad de elegir las estrategias puras(A, C), (A, D), (B, C), (B, D) respectivamente. En este caso

    1(s1)

    s1S1(h1)

    = 0

    y por definicion 1(h)(D) = 12

    .

    En general, mas de una estrategia mixta puede inducir la misma estrategiade comportamiento. Vease figura 1.10 pagina 20 de Vega Redondo.

    El hecho de que dos estrategias mixtas puedan inducir la misma estrategiade comportamiento puede tener consecuencias estrategicas importantes encierto tipo de juegos (figura 1.11 y 1.12 de Vega - Redondo). Los juegos enlos que las estrategias mixtas y de comportamiento son estrategicamenteequivalentes son juegos con memoria perfecta. Esto es, juegos en los queningun jugador olvida sus acciones o informacion adquirida en el pasado.El teorema que establece la equivalencia estrategica entre estrategias mix-tas y de comportamiento en juegos de memoria perfecta se debe a Kuhn(1953).

    Definicion 6 (Memoria Perfecta) Un juego en forma extesiva es dememoria perfecta si ningun jugador olvida las acciones tomadas o la in-

    formacion que en el algun momento tuvo. Formalmente esto se puede ex-presar como:

    1. No olvidar acciones: i no olvida a A(k), k Ki, k = P(k), k =P(k), k = k, donde P(x) denota el conjunto de los predecesoresinmediatos de x, entonces todo par de nodos sucesores de k, k en

    8

  • 7/24/2019 Notas 3 Juegos Dinamicos

    9/31

    los que i deba tomar una decision estan en conjunto de informaciondistintos.

    2. No olvidar informacion pasada: i no olvida informacion pasada sipara todo k Ki k, k h, sik Ki es un predescesor dek entoncesexiste unk Ki predescesor de k tal quek yk estan en el mismoconjunto de informacion.

    De ahora en adelante vamos a considerar unicamente juegos de memoriaperfecta.

    3. Informacion perfecta

    Los juegos de informacion perfecta son juegos en forma extensiva en donde

    los conjuntos de informacion son lo mas finos posibles. Es decir, cadaconjunto de informacion de cada jugador es un singleton (i.e., los jugadoressiempre saben en que nodo del arbol se encuentran). Un ejemplo es elajedrez que discutiremos con cierto detalle mas adelante.

    En los juegos de informacion perfecta, una estrategia si para un jugador ipuede representarse simplemente como si: Ki Ai donde si(k) A(k).

    Todo juego en forma extensiva puede representarse como un juego enforma normal. Luego una primera aproximacion al problema de describirsitematicamente el resultado de un juego dinamico es analizar su formanormal. Sin embargo, esto no explota la naturaleza dinamica del problema.El siguiente ejemplo (entrada de una firma) pone de manifiesto la debilidaddel analisis en forma normal y llama la atencion sobre la necesidad de

    desarrollar conceptos de equilibrio que exploten explcitamente el procesode revelacion de informacion o dinamica del problema.

    Ejemplo 4 (Entrada de una firma) Considere el juego de la Figura 2A.Este juego tiene como representacion normal:

    9

  • 7/24/2019 Notas 3 Juegos Dinamicos

    10/31

    1\2 F C

    N 0,2 0,2 E -1,-1 1,1

    Un concepto interesante en juegos de informacion perfecta es el de estra-tegia de induccion hacia atras.

    Definicion 7 (Induccion hacia atras) Decimos que la estrategia conjuntas=(s1, ...,sN) es una estrategia de induccion hacia atras en un juego de informa-cion perfecta si puede obtenerse de la siguiente forma:

    1. Para cada nodok tal que todo nodo sucesor de k sea terminal, sik Kientoncessi(k) maximiza el pago del agente i entre las posibilidades quetiene en ese nodo.

    2. Convierta el nodo k en un nodo terminal donde los pagos son los quedetermina la estrategiasi(k).

    3. Repita los pasos anteriores hasta llegar la raz del arbol.

    La definicion anterior se extiende de forma natural al caso de estrategiasmixtas.

    Teorema 1 (Kuhn) Si s es una estrategia de induccion hacia atras en unjuego de informacion perfecta entoncess es un equilibrio de Nash - Cournot.

    El converso de este teorema no es cierto. El ejemplo cl asico es el problemade entrada de una firma. En este juego, el equilibrio de Nash - Cournot

    que no es creble no es una estrategia de induccion hacia atras.

    Las estrataegias de induccion hacia atras en un juego de informacion per-fecta son casos especiales del concepto de equilibrio perfecto en subjuegosque introduciremos en la siguiente seccion.

    Teorema 2 (Zermelo) Todo juego de informacion perfecta tiene un equilibriode Nash en estrategias puras que se puede construir mediante induccion haciaatras. Mas aun, si ningun jugador es indiferente entre dos nodos terminales (alo largo del proceso de induccion hacia atras), solo hay un equilibrio de Nashque es una estrategia de induccion hacia atras.2

    Prueba. El teorema es una consecuencia inmediata del teorema de Kuhn.

    2

    Este es el teorema que Mas Colell et.al llaman teorema de Zermelo. Sin embargo, este noes historicamente el teorema Zermelo (1913). Una forma mas cercana al teorema incialmenteprobado por Zermelo es el teorema que afirma que el ajedrez es un juego determinado (veasemas abajo la definicion de juego determinado). El teorema original de Zermelo se considera elprimer teorema importante en teora de juegos. Para una discusion detallada de la contribucionde Zermelo a la teora de juegos vease Schwalbe, U. y P. Walker (1999). Zermelo and the EarlyHistory of Game Theory.

    10

  • 7/24/2019 Notas 3 Juegos Dinamicos

    11/31

    Ejercicio 2 Las estrategias de induccion hacia atras no son necesariamenteunicas.

    El concepto de induccion hacia atras tiene como consecuencia resultadosinesperados y altamente ineficientes. Considere el juego del cienpies deRosenthal (1981) (Figura cienpies).

    Ejercicio 3 Considere el siguiente juego en forma extensiva (Figura 3). Ca-lular la estrategia de induccion hacia atras. Escribir el juego en forma normaly calcular sus equilibrios de Nash y el equilibrio perfecto (en forma normal del

    juego). Observese que el equilibrio perfecto no es una estrategia de inducci onhacia atras (esto contrasta con el concepto de equilibrio perfecto para juegos en

    forma extensiva que introduciremos mas adelante).

    Ejercicio 4 (Vega Redondo pag. 112, basado en van Damme) Considere

    el siguiente juego en forma extensiva. Mostrar que ((A, D), b), ((B, D), a) y((B, C), a) son equilibrios de Nash. En los dos primeros, D no es una amenzacreble. Observese que el uico equilibrio creble el pago es inferior para amboscomparado con((A, D), b).

    El teorema de Zermelo junto con el teorema de von Neumann de juegos

    11

  • 7/24/2019 Notas 3 Juegos Dinamicos

    12/31

    1

    2

    A

    a

    b

    B

    (1, 1)

    (2, 2)

    1

    C

    D

    (0, 3)

    (1, 1)

    Figure 4.2: An extensive-form game with several noncredible equilibria.

    de suma cero tiene implicaciones fuertes sobre los juegos de informaci on

    perfecta de suma cero.

    Teorema 3 Todo juego bilateral de informacion perfecta y suma cero tiene unequilibrio de Nash en estrategias puras (por induccion hacia atras) que a su vezson estrategias maxmin para cada jugador (por el teorema de von Neumann).

    Ejemplo 5 (El juego de ajedrez) Por el anterior teorema existe una estra-tegia para alguno de los jugadores tal que no importa que haga el otro jugador alo largo del juego esta garantiza que el jugador siempre gana o, como m/inimo,empata. El problema fundamental es que no se conoce si las blancas o las negraspueden forzar un empate, o ganar. La limitacion sin embargo no es teorica sinode tipo computacional. En efecto, supongamos que en un tablero jugado se sabeque las blancas pueden ganar con certeza independientemente de lo que el otro

    haga (esto puede ser un nodo final del juego, con el menor numero de fichasposibles y un jaque mate como ultima jugada). Segun el teorema de Zermelo,basta con hacer induccion hacia atras y obtendramos de esa forma un estrate-gia para las blancas que fuerzan una victoria. El problema con esta estrategia esque el numero de jugadas admisibles en el ajedrez ha sido estimado en alrededorde1020 1043 jugadas. Estos son nunero comparables al numero de moleculasen el universo y cualquier busqueda de estrategias optima en un espacio de estadimension es en la actualidad computacionalmente imposible. Esta observacionllama la atencion sobre la importacia de distinguir el concepto de racionalidadentre uno puramente conceptual y uno de tipo computacional. Este ultimo con-cepto sirve como fundamento de la idea de racionalidad limitada y es el centrode estudio de una area nueva y muy fructifera de la teora de juegos conocidacomo teora de algoritmica de juegos.

    Ejercicio 5 Este es un ejercicio para los que conocen un poco logica matemati-ca y es una prueba alternativa del anterior teorema. Escriba una sentencia en ellenguage de primer order que reprente que las blancas tiene una estrategia gana-dora independientemente de la estrategia de las negras. Muestre que la negacionde esta sentencia afirma que las negras tienen una estrategia que garantiza por

    12

  • 7/24/2019 Notas 3 Juegos Dinamicos

    13/31

    lo menos un empate. Luego, como esta frase o su negacion debe ser verdad, es-to prueba que en el ajedrez alguno de los jugadores tiene una estrategia que es

    siempre ganadora o garantiza al menos un empate.

    Un caso particular de juegos de suma cero son los juegos donde las utili-dades posibles de cada jugador estan en el conjunto {1, 1}. Llamaremosa estos juegos, juegos totales de suma cero. El jugador con pago 1 lo lla-maremos el ganador, al otro el perdedor.

    Definicion 8 Para juegos totales de suma cero decimos que el juego es determi-nado si alguno de los dos jugadores tiene una estrategia ganadora independien-temente de lo que el otro haga (i.e., una estrategia estrictamente dominante).

    El teorema anterior implica que todo juego de informacion perfecta, totalde suma cero, es determinado.

    Lo importante de este teorema es que al asegurar que el equilibrio de Nashes tabien una solucion maxmin del juego, esto implica que esas estrate-gias puras aseguran como mnimo el valor del juego para cada jugadorindependientemente de lo que el otro haga. Ademas no existen incentivosunilaterales a desviarse. A continuacion discutimos algunas consecuenciasde la afirmacion anterior para algunos juegos conocidos.

    Ejemplo 6 (Juego de Gale) . Considere el siguiente juego. Dado una figuracon n m cuadrados el juego consiste en retirar de forma iterativa, primeroun jugador despues el otro y as sucesivamente, pedazos como se muestra en la

    figura (figura no incluida). En cada jugada es obligatorio retirar por lo menosun cuadrado. El perdedor es el jugador que esta obligado e retirar el ultimocuadrado.

    Ahora considere tres casos:

    1. n n (la estrategia ganadora es (2,2)).

    2. n m (el primer jugador tiene una estrategia ganadora: Suponga que eljugador 2 tiene una estrategia ganadora, entonces el jugador 1 tiene quetener una estrategia ganadora, una contradiccion).

    3. n , y (en ambos casos el juego es determinado, pueden haberhasta dos estrategias ganadoras).

    Ejemplo 7 (Juegos determinados) . Existen juegos en los que se sabe queuno de los jugadores tiene una estrategia ganadora independientemente de laestrategia del oponente (i.e., el juego es determinado pero no se sabe en fa-

    vor de quien).3

    Para ilustrar esto en un juego sencillo considere un polinomioP(x1,...,xL)enL variablesxii=1,..,L donde cadaxi es un numero entero no ne-gativo. El siguiente es un juego aritmetico asociado al polinomioP(x1,...,xL).

    4

    3Basado en Jones, J.P. 1982. Some undecidable determined games. International Journalof Game Theory. Vol 11. No. 2. Pag 63-70.

    4Decimos que L es la longuitud del juego.

    13

  • 7/24/2019 Notas 3 Juegos Dinamicos

    14/31

    Existen dos jugadores que juegan alternadamente. El jugaor I comienza y escogeun entero no negativo x1. Despues el jugador II escoge un entero no negativo

    x2 y as sucesivamente hasta que a alguno de los dos jugadores le correspon-de escoger el entero xL. El objetivo del ultimo jugador es hacer el polinomioP(x1,...,xL) = 0. El objetivo del otro jugador es hacer este polinomio diferentede cero. Es muy facil demostrar que en todo juego aritmetico el jugador I o el

    jugador II tiene una estrategia ganadora independientemente de lo que el otrohaga (i.e., todo juego aritmetico es determinado).

    Ahora considere el siguiente juego definido por el polinomio P(x1,...; x5) =x21+x

    22+ 2x1x2 x3x5 2x3 2x5 3. En este caso el primer jugador juega

    de segundo, y gana si logra que x21+ x22+ 2x1x2 x3x5 2x3 2x5 3 = 0,

    pero ello se puede reescribir como (x1+ x2)2 + 1 = (x3+ 2)(x5+ 2), de donde

    es facil ver, que dado que el jugador uno escoje x3 y x5 al final, el jugado dostiene una estrategia ganadora si y solo si existen infinitos numeros primos de la

    forman2 + 1, un problema no resuelto de la teora de numeros (en 2015 todavano sabemos).

    Mas interesante aun es el hecho de que existen juegos artimeticos en el quela estrategia ganadora no es efectivamente computable (no es decidible). Rabin(1957) ha dado un ejemplo basado en conjuntos simples. Jones (1981, 1982)muestra como se puede reinterpretar este juego como un juego artimetico.

    Ejemplo 8 (Juegos determinados no decidibles) Rabin (1957). SeanA yB dos jugadores yW N3. Las reglas del juego son: En tres rondas, A yB esco-gen tres numeros naturales (A comienza, despuesB y despuesA). El resultado

    final es una tripla (a,b,c). Si (a,b,c) W gana B.Este juego es determinado(induccion hacias atras).Existe Wdecidible tal que el juego es determinado en

    favor deB . B no puede calcular (con ningun computador incluso hipotetico) su

    estrategia ganadora!

    Ejercicio 6 Taken from http://polymathprojects.org/). The liar guessing gameis a game played between two players A and B. The rules of the game dependon two positive integersk andn which are known to both players.

    At the start of the game, A chooses two integers x andN with1 x N.Player A keepsx secret, and truthfully tellsN to player B. Player B now triesto obtain information about x by asking player A questions as follows. Eachquestion consists of B specifying an arbitrary setSof positive integers (possiblyone specified in a previous question), and asking A whetherx belongs to S. PlayerB may ask as many such questions as he wishes. After each question, player Amust immediately answer it with yes or no, but is allowed to lie as many timesas she wishes; the only restriction is that, among anyk + 1consecutive answers,

    at least one answer must be truthful.After B has asked as many questions as he wants, he must specify a setXofat most n positive integers. Ifx belongs to X, then B wins; otherwise, he loses.Prove that:

    If n 2k, then B can guarantee a win. For all sufficiently large k, thereexists an integern 1,99k such that B cannot guarantee a win.

    14

  • 7/24/2019 Notas 3 Juegos Dinamicos

    15/31

    4. Informacion imperfecta

    4.1. Amenazas no crebles

    El concepto de estrategia de induccion hacia atras no se generaliza deforma inmediata al caso de juegos de informacion imperfecta.

    La generalizacion requiere la introduccion del concepto de subjuego.

    Definicion 9 (Subjuegos) Un subjuego de un juego en forma extensiva es unjuego tal que (1) Comienza con un nodo que define un conjunto de informacion

    que es un singleton. (2) Contiene todos los nodos sucesores y solo estos. (3)Si un nodo esta en el subjuego entonces todo nodo en su conjunto de informa-cion tambien esta (es decir, no hay conjuntos de informacion divididos por elsubjuego).

    Definicion 10 (Equilibrio perfecto en subjuegos) Una estrategia conjun-ta s es un equilibrio perfecto en subjuegos si induce un equilibrio de Nash -Cournot de todo subjuego.5

    La anterior definicion se extiende de forma natural al caso de estrategiasde comportamiento.

    Ejemplo 9 Figura (a). En este juego existen dos equilibrios de Nash en el unicosubjuego (propio): (L, l) y(R, r) y dos en subjuegos: ((O, L)), l) y((I, R), r)

    Ejemplo 10 En el siguiente juego (figura 5) vemos como el concepto de equi-librio perfecto en subjuegos selecciona un unico equilibrio de Nash de tres equi-librios de Nash que existen (en la forma normal del juego).

    5Dada una estrategia de un juego, la estrategia inducida en un subjuego es la restriccion de

    15

  • 7/24/2019 Notas 3 Juegos Dinamicos

    16/31

    El concepto de equilibrio perfecto en subjuegos en un refinamiento estrictodel concepto de equilibrio de Nash - Cournot y generaliza el concepto deinduccion hacia atras. El ejemplo clasico es el juego de entrada de unafirma. Vease el juego de la figura 5 para el caso de juegos de informacionimperfecta.

    Ahora, es interesante que el concepto de equilibrio perfecto en subjuegospuede seleccionar un equilibrio que es dominado por otro equilibrio deNash. El siguiente ejemplo ilustra esta situacion.

    Ejemplo 11 (Ineficiencia del equilibrio perfecto en subjuegos) En el si-guiente juego, figura D, la estrategia ((B, C) , a) es el unico equilibrio perfecto

    en subjuegos. Sin embargo, ((A, D) , b) es un equilibrio de Nash que domina elequilibrio perfecto en subjuegos.

    Teorema 4 En un juego informacion perfecta, el conjunto de estrategias deinduccion hacias atras coincide con los equilibrio perfectos en subjuegos.

    El analogo del teorema de Nash para juegos de informacion imperfecta esel siguiente teorema de Selten.

    Teorema 5 (Selten) Todo juego finito en forma extensiva de memoria per-fecta tiene un equilibrio perfecto en subjuegos (posiblemente en estrategias decomportamiento).

    Ejercicio 7 (Necesidad de memoria perfecta) El siguiente juego ilustra lanecesidad de la hipotesis de memoria perfecta en el teorema de Selten. Demostrarque el juego de la figura no tiene un equilibrio en estrategias de comportamiento.

    la estrategia al subjuego. Esta puede definir un camino que en el juego original nunca hubierasido alcanzado al utilizar la estrategia original. Veanse los ejemplos de equilibrios p erfectosen subjuegos.

    16

  • 7/24/2019 Notas 3 Juegos Dinamicos

    17/31

    4

    1

    4

    1

    0

    1

    0

    1

    1

    0

    1

    0

    0

    1

    0

    1

    2

    1

    1

    Figure 7.39.

    17

  • 7/24/2019 Notas 3 Juegos Dinamicos

    18/31

    Ejemplo 12 (Piccione y Rubinstein) Este es un juego de informacion dememoria imperfecta donde un agente puede estar tentado a cambiar de decisiona pesar de no haber recibido ninguna informacion adicional.

    Si bien el concepto de equilibrio perfecto en subjuegos llama la atencionsobre la necesidad de enfocarse en estrategias conjuntas que sean optimasdinamicamente (a lo largo de todos los subjuegos). Desafortunadamente nologra eliminar todas las amenzas no creibles porque el concepto de equili-brio no distingue entre nodos que pueden ser alcanzados con probabilidadpositiva y aquellos con probabilidad cero de ser alcanzados. Los dos ejem-

    plos siguientes ilustran el problema.

    Ejemplo 13 El siguiente juego, figura C, no tiene subjuegos propios. Los equili-brios de Nash(A, b)y(B, a)son equilibrios perfectos en subjuegos. Sin embargoel primero no es creble. En particular, no es creble que el segundo jugador

    jugarab en caso de tener que jugar.

    Ejemplo 14 El siguiente juego (figura G) tiene un equilibrio perfecto en sub-juegos ((L, m)) que no es creble. Una vez el jugador 1 decide no entrar, in-dependientemente de si el jugador2 cree estar en el nodo x o en el nodo y laestrategia mixta para2, (0,5, 0, 0,5) domina la estrategiam para el jugador2.

    Ejercicio 8 En el juego de la figura G mostrar que el unico equilibrio en el que

    el jugador2 juegam con probabilidad cero es cuando el jugador1 juega L conprobabilidad cero.

    La necesidad de introducir un sistema de expectativas como parte integralde la evaluacion que de un juego la ilustra la siguiente modificacion del

    juego de la figura C. La figura C1 muestra que ((A, b) es un equilibrio de

    18

  • 7/24/2019 Notas 3 Juegos Dinamicos

    19/31

    Nash pero que este sea o no sea creble depende de con que probabilidadcree el jugador que, en caso de que le toque jugar, estar a haciendolo enuno u otro nodo.

    Definamos el conjunto de todas las expectativas del agente i como i =

    hHi(h) donde (h) denota el conjunto de distribuciones de probabilidad

    sobre el conjunto de informacion h.

    Definicion 11 (Sistema de expectativas) Un sistema de expectativas de unjuego es un conjunto funciones{pi}i=1,...N, pi : Hi i tal quepi(h) (h).

    La interpretacion es: pi(h) es la expectativa que tiene el jugador i de estaren cada uno de los nodos de su conjunto de informacion h.

    Definicion 12 (Estimacion) Una estimacion del juego es

    {pi}i=1,...N, {bi}i=1,...N

    donde(pi)i=1,...Nes un sistema de expectativas y(bi)i=1,...N son estrategias decomportamiento.

    19

  • 7/24/2019 Notas 3 Juegos Dinamicos

    20/31

    Dada una estimacion existe una forma natural de definir si las estrategiasde comportamiento son optimas dadas las expectativas de los jugadores(i.e., secuencialmente racionales).

    Fijemos una estimacion del juego:

    {pi}i=1,...N, {bi}i=1,...N

    .

    Sea k un nodo cualquiera, k Ki; definimos ui(b k) como la utilidaddel jugador i cuando suponemos que este se encuentra en este nodo y lasestrategias de comportamiento utilizadas por los jugadores son {bi}i=1,...N.

    Observese que esta utilidad la podemos interpretar como una funcion:ui(b ) : Ki R.

    Definimos la utilidad del jugador i en el conjunto de informacion h Hi cuando el perfil de estrategias de comportamiento es {bi}i=1,...N y lasexpectativas del jugador son pi(h) i(h) como:

    vi(b h) = Epi(h)[ui(b )] .

    Ejemplo 15 Calculemos v1(b I) para el siguiente juego, figura F, (jugador1, conjunto de informacion I como aparece en la figura): Analizamos separa-damente los 3 subjuegos con raz x, y y z (dejando de lado el hecho de queestan en el mismo conjunto de informacion I). Es facil ver que u1(b x) = 4,

    u1(b

    y) = 3 y u1(b

    z) = 6. Supongamor que las expectativas del jugador 1son px = 12

    , py = 13

    , pz = 16

    . Luego, dadas las expectativas del jugador 1 en Iobtenemos: v1(b) = 4.

    Definicion 13 (Racionalidad secuencial) Una estimacion de un juego

    {pi}i=1,...N, {bi}i=1,...N

    es secuencialmente racional si para todo jugador i, conjunto de informaci on

    20

  • 7/24/2019 Notas 3 Juegos Dinamicos

    21/31

    h Hi y estrategia de comportamientobi del jugador i tenemos:

    vi(bi, bi h) vi((bi, bi) h).

    Intuitivamente, dada esa estimacion del juego, ningun jugador tiene incen-tivos unilaterales a desviarse.

    En la figura figura G, el equilibrio prefecto en subjuegos que no es creibleno es racionalmente secuencial.

    Desafortunadamente, una estimacion secuencialmente racional no es nece-sariamente un equilibrio perfecto en subjuegos. Ni siquiera un equilibrio deNash.

    Ejemplo 16 (Racionalidad secuencial en el juego de cara y sello) Considere

    el siguiente juego (Cara y sello): Figura G Este juego tiene un unico equilibriode Nash en estrategias de comportamiento: la estrategia mixta de jugar caracon probabilidad 1

    2. Sin embargo la estimacion: px= 0, py = 1, ((1, 0), (1, 0)) es

    secuencialmente racional pero no es un equilibrio de Nash.

    Vamos a introducir algunas restricciones de compatibilidad entre las ex-pectativas y estrategias de comportamiento de los jugadores.

    Definicion 14 (Consistencia con regla de Bayes) Una estimacion de un

    juego

    {pi}i=1,...N, {bi}i=1,...N

    es consistente con la regla de Bayes si la ex-

    pectativa que tiene cada jugador de estar en un nodo especfico es igual a laprobabilidad condicional de alcanzar el conjunto de informacion al que pertene-ce el nodo, inducida por las estrategias de comportamiento de todos los jugadoresen cada nodo del conjunto de informacion. Observese que esto no impone nin-guna restriccion sobre las expectativas que puede tener un jugador de estar enun nodo particular cuando la probabiliad de llegar al conjunto de informacionque contiene ese nodo es cero.

    21

  • 7/24/2019 Notas 3 Juegos Dinamicos

    22/31

    Definicion 15 (Equilibrio perfecto debil Bayesiano) Una estimacion deun juego es un equilbrio perfecto Bayesiano si es secuencialmente racional y

    si la estimacion es consistente con la regla de Bayes.

    La estimacion del juego de cara y sello del ejemplo anterior no es consis-tente con la regla de Bayes por lo tanto no es un equilibrio perfecto debilBayesiano.

    Un equilibrio perfecto debil Bayesiano no tiene que ser necesariamente unequilibrio perfecto en subjuegos como lo demuestra el siguiente ejemplo.

    Ejemplo 17 (Equilibrio p erfecto debil Bayesiano que no es perfecto en subjuegos)En el juego de la figur 4.5, (B , X , D) es un equilibrio perfecto debil Bayesianoque lo sustenta la creencia del jugador3 de estar en el nodo superior de su con-

    junto de informacion con probabilidad0. Sin embargo, este no es un equilibrioperfecto en subjuegos porque en el unico subjuego propio, la estrategia inducidano es un equilibrio de Nash (el jugador3 tiene incentivos unilaterales a desviar-se).

    1

    2

    A

    X

    Y

    B(1, 0, 3)

    3

    C

    D

    (2, 2, 2)

    (0, 2, 0)

    C

    D

    (0, 1, 0)

    (2, 1, 2)

    3

    Figure 4.5: An extensive-form game with a weak perfect Bayesian equilibrium that is not

    subgame perfect.

    La consistencia con la regla de Bayes deja indeterminadas las expectativasen los conjuntos de informacion que no tiene una probabilidad positiva deser alcanzados.

    4.2. Creencias no crebles

    Dos restricciones adicionales que ayudan a restringir el universo de creen-cias son las siguientes.

    Definicion 16 (Independencia) Las expectativas deben reflejar que los juga-dores escogen sus estrategias de forma independiente.

    22

  • 7/24/2019 Notas 3 Juegos Dinamicos

    23/31

    1

    2

    3 3

    (0) (0)

    (1)(1)

    (1)

    (0)(0) (0) (0)

    [ ] [1 ]

    [ ] [1 ]

    La siguiente figura muestra un juego en el que la restriccion de indepen-dencia sobre la expectativas implica que = .

    Definicion 17 (Simetra) Jugadores con identica informacion deben tener lasmismas expectativas.

    La siguiente figura muestra un juego en el que la restriccion de indepen-dencia y simetra sobre la expectativas implica que = .

    Las hipotesis de consistencia con la regla de Bayes, independencia y si-metra son equivalentesa que la evaluacion de un juego sea consistente enel sentido de la siguiente definicion. 6

    Definicion 18 (Evauluaciones Consistentes) Decimos que una evaluacion

    de un juego

    {pi}i=1,...N, {bi}i=1,...N

    es consistente si existe una sucesion de

    estrategias de comportamiento conjuntas{bni }n tal que:

    1. Para todon y para todo i,bni es de soporte completo o completamente mixta(i.e., toda estrategia pura tiene probabilidad estrictamente positiva de serelegida).

    6Para mas detalles vease Kohlb erg y Reny [1997].

    23

  • 7/24/2019 Notas 3 Juegos Dinamicos

    24/31

    r r

    ll

    1

    2

    3

    (0) (0)

    (1) (1)

    (1)

    (0) (0)

    (0)

    [ ] [1 ]

    [ ] [1 ]

    OUT

    L R

    24

  • 7/24/2019 Notas 3 Juegos Dinamicos

    25/31

    2. Para cada i, la sucesion{bni }n converge abi.

    3. Para cada i

    las espectativas que induce la sucesion{bni }n de acuerdo a laregla de Bayes convergen a las espectativaspi.

    Definicion 19 (Equilibrio Secuencial) Una evaluacion de un juego es unequilibrio secuencial si es consistente y secuencialmente racional.

    Intuitivamente, en ningun momento del juego (aun en conjuntos de infor-macion con probabilidad cero de ser visitados) un jugador tiene incentivosunilaterales a desviarse.

    Ejercicio 9 Dar un ejemplo de un equilibrio perfecto en subjuegos que sea se-cuencialmente racional pero no sea un equilibrio secuencial.

    El analogo al teorema de Nash o al teorema de Selten para equilibrios

    secuenciales es el teorema de Krep y Wilson.

    Teorema 6 (Kreps y Wilson) Todo juego en forma extensiva con memoriaperfecta tiene un equilibrio secuencial (posiblemente en estrategias de compor-tamiento) y todo equilibrio secuencial es un equilibrio perfecto en subjuegos.

    Ejemplo 18 Equilibrio perfecto debil Bayesiano que es perfecto en subjuegospero no equilibrio secuencial. Considere el juego de la figura 4.10 de Vega -Redondo. Las estrategias (A,b,U) son un equilibrio perfecto debil Bayesianosiempre y cuando el jugador3 crea que esta enx31 con probabilidad superior a23

    . Este equilibrio no es creible y no es un equilibrio secuencial. Soportar esteequilibrio requerira una sucesion de expectativas convergiendo a cero en el nodox31. Ahora(B ,b ,U) es un equilibrio secuencial y es creble.

    5. Equilibrio perfecto y propio

    En la figura C el concepto de equilibrio propio elimina el equilibrio nocreible.

    Mas Colell tiene un buen ejemplo de un equilibrio que es secuencial perono perfecto.

    Ver ejemplo 23 de las notas. Las consecuencias de equivocarse al jugar unequilibrio de Nash motiva el concepto de equilibrio propio. En este caso,ese equilibrio lo elimina.

    Analizar figuras 4.6,4.7,4.8 y 4.9 de Vega Redondo (ejemplos de jugadores

    con teorias alternativas, signaling). Esto completa la totalidad del analisisrelevante en Vega Redondo.

    Ejemplo 19 Considere el siguiente juego.(O, F) es Nash, EPS, ES pero no es perfecto. Este equilibrio no es creble.

    25

  • 7/24/2019 Notas 3 Juegos Dinamicos

    26/31

    2

    x31

    a

    U

    V

    b U

    V

    (0, 0, 1)

    (0, 0, 0)

    (0, 0, 0)

    (2, 2, 2)

    3

    1

    A

    B

    (1, 0, 0)

    C

    (0, 1, 0)

    (0, 0, 0)a

    b

    x32

    x21

    x22

    Figure 4.10: An extensive-form game with a WPBE that is not a sequential equilibrium.

    Generated by CamScanner from intsig.com

    26

  • 7/24/2019 Notas 3 Juegos Dinamicos

    27/31

    6. Aplicaciones

    6.1. Oligopolio: Stackelberg

    Este es un juego en dos etapas en las que una firma es lder y toma sudecision de produccion. En la segunda etapa las demas firmas deciden susniveles de produccion.

    Consideremos el caso de dos firmas: Ci(qi) = cqiyP(Q) = max{MdQ, 0}, M,d > y Q = q1+ q2.

    El espacio de estrategias de la firma l der es S1 = R+. El espacio de es-trategias para la firma seguidora es el conjunto de todas las funciones delos reales no negativos en los reales no negativos (la estrategia de la firmaseguidora es condicional a la cantidad producidad por la firma lder).

    La forma de resolver este juego de informacion perfecta es hacer induccion

    hacias atras. Primero encontramos la funcion de mejor respuesta de la firmaseguidora ante cualquier estrategia de la firma lder. Segundo, calculamosla mejor estrategia de la firma lder cuando esta anticipa que la firmaseguidora utilizara su mejor respuesta. En esta caso la solucion es:

    q1 = M c

    2d (1)

    q2 = M c dq1

    2d =

    M c

    4d (2)

    Si comparamos este equilibrio con el equilibrio simetrico en el caso decompetencia a la Cournot, la firma lder produce mas que en el caso decompetencia a la Cournot y la firma seguidora menos. La misma relacionse mantiene para los beneficios.

    Ejercicio 10 Compare los resultados de este modelo de competencia de Stackel-berg con los resultados de competencia monopolstica, Cournot y Bentrand. Enparticular, mostrar que en terminos de excedente del consumidor competencia ala Stackelberg es mejor que competencia a la Cournot y peor que competencia ala Bertrand. Existen otros equilibrios del juego de Stackelberg que sean equlibriosde Nash. Son estos crebles?

    6.2. Diseno de mecanismos

    Vamos a estudiar dos aplicaciones a la teoria de diseno de mecanismos: elmecanismo de compensacion de Varian y el problema de Rey Salomon.

    6.2.1. Un problema de externalidades

    Basado en Varian [1994]: A Solution to the Problem of Externalitieswhen Agents are Well-Informed.

    Implementa asignaciones eficientes como equilibrios perfectos en sub-juegos en:

    27

  • 7/24/2019 Notas 3 Juegos Dinamicos

    28/31

    1. Ambientes economicos con externalidades.

    2. Problemas de competencia imperfecta.

    3. Juegos como el dilema de los prisioneros.

    El mecanismo supone que los agentes conocen las tecnologas y prefe-rencias de los demas agentes pero el regulador no. Este es un ejemplo ti-pico de un problema de informacion completa pues, si bien el reguladordesconoce los fundamentales de las firmas, estas si se conocen entreellas.

    Considere dos fimas i = 1, 2.

    1(x1) = rx1 c(x1), donde r es el precio de venta del producto, x1la cantidad que ofrece la firma 1 y c(x1) el costo.

    2(x1) =e(x1). Es decir, la firma 1 impone una externalidad en lafirma 2.

    Ejercicio 11 Caracterice la solucion eficiente de este problema como unproblema de optimizacion de un planificador central y escriba las condidi-ciones de primer orden del problema. Mostrar que la solucion descentrali-zada no satisface estas ecuaciones y, por lo tanto, es ineficiente.

    Tres soluciones clasicas a este problema:

    1. Coase: negociacion privada en ausencia de costos de transaccion yderechos de propiedad bien definidos.

    2. Arrow: crear un mercado para la externalidad (mercado de dere-chos para generar la externalidad). El problema es que el mercadopuede ser muy delgado.

    3. Pigou: Supone que el regulador conoce las tecnologas. Este meca-

    nismo motiva una modificacion que relaja el anterior supuesto yes la intuicion basica del mecanismo de compensacion.

    6.2.2. La solucion de Pigou

    Cobrar un impuesto a la firma 1 igual a e(x).

    El problema de la firma 1 es:

    rx1 c(x1) e(x1)

    y las C.P.O son:r c(x1) e

    (x1) = 0

    luego si el regulador le impone un impuesto p = e(x1) y la firma

    resuelve:rx1 c(x1) p

    x1

    entonces esta tributacion (lineal) implementa el mecanismo de Pigou.

    El problema es que el regulador no conoce e(x1).

    28

  • 7/24/2019 Notas 3 Juegos Dinamicos

    29/31

    6.2.3. El mecanismo de compensacion

    El mecanismo de compensacion consiste de un juego de informacionimperfecta en dos etapas.

    Dos etapas:

    1. Etapa de revelacion del impuesto y subsidio: Las firmas son lla-madas a anunciar cual es el impuesto Pigoviano que soluciona elproblema de ineficiencia ((p1, p2)).

    2. Pagos netos: Las firmas deben resolver el siguiente problema:

    La firma 1:rx c(x) p2x 1(p1 p2)

    2

    donde 1 es cualquier parametro mayor que cero.

    La firma 2:p1

    x e(x)

    Intuitivamente la firma 1 es llamada a pagar un impuesto proporcionalal costo marginal segun lo reporta la firma 2 y un costo por reportaralgo diferente a lo que reporta 1.

    La firma 2 recibe una compensacion proporcional a lo que la firma 1reporta como el costo marginal.

    Este juego en dos etapas tiene multiple equilibrios de Nash: cualquierstrategia ((x, p), p) donde x maximice el beneficio de la firma 1 es unequilibrio de Nash. Sin embargo, tiene un unico equilibrio perfecto ensubjuegos: ((x, p), p) que implementa las asignaciones de Pigou.

    Para ver esto resolvamos el juego por induccion hacia atras (observeseque en la primera etapa se escogen precios de forma simultanea y en

    la segunda la firma 1 escoge cantidades y la 2 es pasiva). Supongamosque p1, p2 es dado y la firma 1 maximiza su beneficio: esto significaescogerx(p2) tal que:

    r c(x(p2)) p2 = 0

    En la primera etapa del juego, es un juego estatico en el que cada firmaescoge precios de forma simultanea. Dadop2 la firma 1 escogep1 = p2.Esa es su mejor respuesta.

    Ahora, en la primera etapa si la firma 2 maximiza su beneficio entoncesescoge p2 para maximizar:

    p1x(p2) e(x(p2))

    que tiene C.P.O:

    (p1 e(x(p2))) x

    (p2)

    p1 e(x(p2))

    29

  • 7/24/2019 Notas 3 Juegos Dinamicos

    30/31

    Combinando las ecuaciones anteriores obtenemos:

    r c

    (x

    ) e

    (x

    ) = 0

    Se puede demostrar que este es tambien el unico equilibrio en estrate-gias mixtas.

    Este es un mecanismo balanceado en equilibrio pero no por fuera deequilibrio.

    Con mas de dos agentes es posible hacer el mecanismo balanceado porfuera de equilibrio.

    Tambien se puede implementar el mecanismo con impuestos no linea-les.

    Ejemplo 20 (Dilema de los prisioneros) Considere el juego:C D

    C 5,5 2,6

    D 7,1 3,3 La pregunta es, Como se puede inducir la asignacion eficiente en laque ambos cooperan? Sea x1 = 1 si el jugador 1 coopera. Cero delo contrario y lo mismo para el segundo jugador. La utilidad de cada

    jugador la denotamos por ui(x1, x2)

    Ejemplo 21 Mecanismo de compensacion I: El primera etapa los ju-gadores anuncian:

    p112, p

    121

    , (p221, p

    212)

    . En la segunda etapa ellos

    escogen si cooperan o no. El agente1 maximiza:

    u1(x1, x2) +p221x1 p

    212x2 (p

    121 p

    221)

    2

    y2 maximiza:

    u2(x1, x2) +p1

    12

    x2 p1

    21

    x1 (p2

    12 p1

    12)2

    Demostrar que cooperar es un equilibrio perfecto en subjuegos y quecualquier

    p112, p

    121

    , (p221, p

    212)

    tal que:

    4 p121 = p221 2

    3 p112 = p212 1

    son precios que implementan el equilibrio.

    Ejemplo 22 Mecanismo de compensacion II: En la primera etapa losjugadores anuncian:

    p12, p

    21)

    etapa los jugadores anuncian si van acooperar o no. En la segunda etapa ellos escogen si cooperan o no. Elagente1 maximiza:

    u1(x1, x2) p1

    2x2+ p2

    1x1

    y2 maximiza:u2(x1, x2) p

    21x1+ p

    12x2

    Demostrar que cooperar es un equilibrio perfecto en subjuegos y calcularlos precios que implementan el equilibrio (Ayuda: p21 4 yp

    12 1).

    30

  • 7/24/2019 Notas 3 Juegos Dinamicos

    31/31

    6.2.4. El problema del Rey Salomon

    Ejercicio 12 Juegos en forma extensiva (implementacion). Dos mu-jeres,A yB , se aparecen en frente al Rey Salomon con un bebe. Cadauna de las mujeres reclama al bebe como suyo. El valor para la verda-dera madre del bebe es100 y50 para la mujer que no es la verdaderamadre. El Rey no sabe quien es la verdadera madre pero s sabe lasvaloraciones mencionadas. El Rey les propone jugar el siguiente juego.

    1. El Rey va a preguntarle a la mujerA si ella es la verdadera madre.Si dice que no lo es le entrega el bebe a la mujerB . SiA respondeafirmativamente se continua con el siguiente paso.

    2. El Rey le pregunta a la mujerB si es la verdadera madre. Si diceque no lo es se le entrega el bebe a la mujer A. Si responde afir-mativamente la mujerB le debe pagar al Rey75 y se queda con elbebe y la mujerA debe pagarle10 al Rey.

    Responda las siguientes preguntas.

    1. Describa los dos juegos en forma extensiva que resultan de suponerque la mujer A es la verdadera madre y que la mujer B es laverdadera madre.

    2. Calcular el equilibrio perfecto en subjuegos de cada juego.

    3. A pesar de que el Rey no sabe cual es el juego en forma extensi-va que se esta jugando, logra el con este mecanismo entregarle elbebe a la verdadera madre?

    4. Tiene este juego otro equilibrio que no sean perfecto en subjuegos?

    31