SUBJUEGOS PERFECTOS

download SUBJUEGOS PERFECTOS

of 20

Transcript of SUBJUEGOS PERFECTOS

SUBJUEGOS PERFECTOS Credibilidad La idea de credibilidad es muy similar al concepto de induccin hacia atrs. Se trata de que el jugador no pueda tener una mejor ganancia tomando otra accin, es decir su eleccin anticipada debe ser una mejor respuesta. Para el caso del juego de la entrada, las estrategias deben ser tal que constituyan un equilibrio de Nash en el juego despus de la entrada. Lo que se denomina un comportamiento creble en el juego despus de la entrada. Razonable Se puede argumentar que un equilibrio es razonable, porque muchas veces no es razonable tomar ciertas acciones. Es muy similar al concepto de induccin hacia atrs, en cuyo caso solo unas ramas del rbol se juegan, pero para saber que ramas se juegan se tiene que doblar el rbol y revisar la credibilidad en todo el juego. Hay una diferencia entre un juego de informacin imperfecta y juego de informacin perfecta. En el juego de informacin perfecta en cada nodo solo uno de los jugadores tiene que tomar una decisin. La credibilidad se juzga simplemente si es en el mejor inters de ese jugador tomar dicha estrategia. En el juego de informacin imperfecta los jugadores toman decisiones simultneas. Por lo tanto es la credibilidad de las decisiones del grupo lo que se tiene que juzgar. Una manera de verificar esto es revisar si el grupo est jugando un equilibrio de Nash en un componente del juego. Definicin. Un subjuego es una parte de la forma extensiva; una coleccin de ramas y nodos que satisfacen tres propiedades. 1. Comienza en un solo nodo de decisin. 2. Contiene cada sucesor de este nodo 3. Contiene todas las partes de un set de informacin, es decir contiene todos los nodos de un set de informacin. Equilibrio subjuego perfecto Definicin.s1y s2constituyen un subjuego perfecto si para cada subjuego g, s1(g)y s2(g)constituye un equilibrio de Nash en cada subjuego. Vamos a determinar el equilibrio subjuego perfecto de juegos con informacin imperfecta por el procedimiento por induccin hacia atrs. Comenzamos con un subjuego final, es decir un subjuego que termine solo con nodos terminales. Determinamos el equilibrio de Nash. Hacemos lo mismo para todos los subjuego finales.Regresamos al subjuego que precede el subjuego final y ponemos atencin solamente a aquellos equilibrios en el penltimo subjuego que constituyen un equilibrio de Nash en el ltimo juego. Y as sucesivamente hasta que se llegue al subjuego inicial Solucin subjuego perfecto y solucin por induccin hacia atrs El subjuego perfecto es una generalizacin del juego por induccin hacia atrs. Proposicin. Si es un juego de informacin perfecta, la solucin subjuego perfecto es exactamente la misma que la solucin por induccin hacia atrs Representacin de un juego Planteamos la representacindel juego conocido como dilema del prisionero. La polica detiene por un pequeo delito a dos delincuentes sospechosos de un delito grave. A cada uno de los delincuentes por separado se les ofrece el siguiente trato: -Si delatas a tu compaero y l no confiesa te reduzco la pena a un ao y a l le caen diez aos. -Si os delatis mutuamente la pena es de tres aos para cada uno. -Siningunodelataasucompaerosloselespuedecondenaraambosadosaosporeldelito menor. Representacin en forma normal Jugador B delatano delata Jugador Adelata -3, -3 -1, -10 nodelata-10, -1-2, -2 Representacin en forma extensiva 1.2.Equilibrio Una situacin en la que los individuos no tienen incentivos para cambiar su decisin Equilibrio en estrategias dominantes La estrategia de A es una estrategia dominante si la eleccin de A es ptima para cualquier eleccin de B. La estrategia de B es una estrategia dominante si la eleccin de B es ptima para cualquier eleccin de A. A BB -3, -3-1, -10-10, -1-2, -2 delata nodelata d ndd nd Jugador B izquierdaderecha Jugador Aarriba 1, 2 10, 1 abajo12, 1 111, 0 abajo es una estrategia dominante para el jugador A izquierda es una estrategia dominante para el jugador B En este caso, es fcil predecir las jugadas y los pagos finales No siempre existen estrategias dominantes. Por ejemplo: Jugador B izquierdaderecha Jugador Aarriba12, 1 10, 0 abajo0, 011, 2 1 Estrategias dominantes iterativas Jugador B icd Jugador Aa4, 3 2, 7 110, 4 b15, 5 115, 1 -4, -2 Jugador A: no tiene una estrategia dominante. Jugador B: c domina a d. Nunca jugar d. Teniendo en cuenta este hecho resulta que: b es una estrategia dominante para el jugador A. Dado que A juega b, entonces B juega i. Equilibrio de Nash Dos estrategias (a*,b*) constituyen un equilibrio de Nash si a* es la mejor estrategia posible del jugador A cuando B juega b* y b* es la mejor estrategia para B cuando A juega a*. Ejercicio Aplicar este concepto a los ejemplos anteriores. Existe equilibrio de Nash en las casillas en que haya dos marcas. El concepto de equilibrio de Nash presenta los siguientes problemas:1. Puede haber ms de un equilibrio de Nash. 2. En ocasiones no hay un equilibrio de Nash. Ejemplo de juego sin equilibrio de Nash en estrategias puras Jugador B izquierdaderecha Jugador Aarriba0, 0 110, -1 abajo11, 0-1, 3 1 No hay ninguna casilla con dos marcas. Por lo tanto no existe equilibrio de Nash en estrategias puras. Equilibrio de Nash en estrategias mixtas Un agente elige la frecuencia ptima con la que seguir una estrategia dada la frecuencia con la que elija el otro. Se puede demostrar que, bajo ciertas condiciones, siempre existe un equilibrio de Nash en estrategias mixtas. Jugador B izquierda (q)derecha (1-q) Jugador Aarriba (p)0, 00, -1 abajo (1-p)1, 0-1, 3 Los beneficios esperados de cada estrategia y el beneficio esperado para el jugador A se pueden escribir como: ) ) ) ). J ) )0 01 01 1 1 2 10 2 1 1AAAarriba q qabajo q q qE p q p4 ! !4 ! ! 4 ! El jugador A elige p de modo que maximize. JAEH . Es decir: . J ) ) max 2 1 1 0 1p AE q pst pH = Las probabilidades ptimas en funcin de q son las siguientes: 10210 12112q pq pq p"== = Los beneficios esperados de cada estrategia y el beneficio esperado para el jugador B se expresan como: ) ) ) ). J ) ) ) )0 01 01 3 1 3 40 3 4 1 3 4 1BBBizquierda p pderecha p p pE q p q p qH = +=H =+= H = + = El jugador B elige q de modo que maximize. JBE4 . Es decir: . J ) ) max 3 4 1 0 1q BE p qst q4 !e e Las probabilidades ptimas en funcin de p son las siguientes: 30430 14314p qp qp q== "= Las dos probabilidades mutuamente consistentes son: 3 1 ,4 2p q ! ! Ejemplo de equilibrio de Nash en estrategias mixtas Un guardia y un ladrn juegan este juego todas las noches en el edificio de la Facultad. Si el ladrn va a un lugar distinto del guardia consigue un botn y el guardia es despedido. Si coinciden en el mismo lugar, el ladrn va a la crcel. Representamos el juego en forma normal como: Guardia aulario (q)oficinas (1-q) Ladrnaulario (p) -10, 0 1110, -10 oficinas (1-p)110, -10-10, 0 1 No hay equilibrio de Nash en estrategias puras ya que no coinciden dos marcas en la misma casilla. Los beneficios esperados de cada estrategia y el beneficio esperado para el ladrn se expresan como: ) ) ) ). J ) ) ). J ) )10 10 1 10 2010 10 1 20 1010 20 20 10 120 10 1 2LLLLaulario q q qoficinas q q qE q p q pE q p4 !! 4 ! ! 4 !4 ! Las probabilidades ptimas en funcin de q son las siguientes: 11210 12102q pq pq p== "= Los beneficios esperados de cada estrategia y el beneficio esperado para el guardia se expresan como: ) ) ) ). J ) ). J )0 10 1 10 1010 0 1 1010 10 10 110 20 10GGGGaulario p p poficinas p p pE p q p qE p p q4 !! 4 !! 4 ! 4 ! Las probabilidades ptimas en funcin de p son las siguientes: 11210 12102p qp qp q"!!e e! Las dos probabilidades mutuamente consistentes son: 1 1 ,2 2p q ! ! Ejemplo de equilibrios mltiples de Nash La guerra de los sexos Marido boxeoballet Esposaboxeo 110, 5 14, 4 ballet0, 0 15, 10 1 Situaciones no eficientes desde el punto de vista de Pareto Prisionero B confesarno confesar Prisionero Aconfesar1-3, -3 110, -6 no confesar -6, 0 1-1, -1 1.Confesar es una estrategia dominante2.Podan mejorar si cooperasen. No lo hacen porque el juego no se repite. 3.Los individuos irn a la crcel 4.El juez (la polica) disea este mecanismo 5.La sociedad (la polica o el juez) tieneque "gastar" para encarcelarlos. Al diseador del mecanismo legustaraqueestuviesenseisaosenlacrcel perotienequebajarlacondenaatresaospara proporcionales un incentivo a confesar. Como veremos en otras ocasiones en esta clase, es costoso que un individuo revele informacin. 1.3.Juegos repetidos Juego dinmico Un jugador elige una accin tras observar la accin de su oponente Amenaza no creble Ejemplo Un individuo te amenaza con hacer explotar una bomba que tiene en la mano si no le entregas 1 milln de euros. Para completar la matriz de pagos suponemos que los daos del ataque suponen un coste de 5 millones. El anlisis de este juego requiere usar exclusivamente la informacin que se ha dado. Representacin del juego en forma extensiva Este juego dinmico contiene tres subjuegos. El juego al que se enfrenta el jugador B si le da el dinero. El juego al que se enfrenta el jugador B cuando no le da el dinero y, finalmente, el juego completo. La solucin recursiva de este juego consiste en solucionar primero los subjuegos del jugador que juega en segundo lugar y despus el juego total en funcin de los resultados en los subjuegos. Caso 1.A BB -6, -4-1, 1-5, -50, 0 1 pagar 0 no pagar explotar no explotar explotar no explotar El jugador A le da el dinero y el jugador B no explotar la bomba Caso 2.El jugador A no le da el dinero y el jugador B no explotar la bomba. El jugador A debe decidir qu hacer considerando que en ambos casos el jugador B no explotar la bomba. Como consecuencia, elige no darle el dinero. Este resultado es un equilibrio de Nash. No explotar la bomba es una estrategia dominante para el jugador B. Como consecuencia, esa es su accin ptima en cualquier caso. La actuacin ptima del jugador A es no darle el dinero. Este juego contiene una sorpresa cuando se analiza su forma normal. El jugador A tiene dos estrategias, dar el dinero o no darlo. El jugador B tiene cuatro estrategias: Explotar si le da el dinero y explotar si no se lo da ( ee).No explotar si le da el dinero y no explotar si se lo da (nn). Explotar si le da el dinero y no explotar si no se lo da ( en). No explotar si le da el dinero y explotar si no se lo da ( ne). Jugador B eennenne Jugador A1-6,-4 -1,1 1-6,-41-1,1 1 01-5,-510,0 110,0 1 -5,-5 La sorpresa es que el equilibrio que logramos antes usando una solucin recursiva (0, nn) no es el nico equilibrio de Nash. Aparecen otros dos equilibrios: (1, ne) (0, en) El primero de ellos (1, ne) es muy interesante. Se trata de un equilibrio de Nash ya que siB decide jugar ne, el ptimo para A es darle el dinero. Por otra parte, siA le da el dinero es ptimo para B jugar de este modo para que la decisin de A sea ptima (si no plantea explotar la bomba cuando no le da el dinero A no debera drselo). No obstante este equilibrio est basado en una amenaza no creble. Una amenaza que sirve para que la estrategia ptima del jugador A sea pagar la cantidad exigida pero que no se llevara a cabo en caso de llegar a esa tesitura. Por otra parte, el equilibrio de Nash ( 0, en) contiene una accin que nunca se realizara (explotar si te pagan). Ante la estrategia en del jugador B, la estrategia ptima de A es no pagar (0). Por tanto, si A no juega 1, la estrategia de B de explotar la bomba cuando reciba el dinero es irrelevante ya que el juego nunca llega a ese punto. Algunas aclaraciones sobre amenazas no crebles. 1.Setratadeunaactuacinqueapareceenunaestrategiayquenosellevaraacabosiel jugador llegase al punto de tener que hacerla. 2.Sirve para mantener el equilibrio porque afecta ala decisin ptima del oponente.3.ParaevitarequilibriosconamenazasnocreblesserefinaelconceptodeequilibriodeNash buscandoqueelcomportamientodelosagentesseaptimoincluso ensituacionesquenose producen en equilibrio.4.El equilibrio de Nash perfecto en los subjuegos ocurre cuando el equilibrio en los subjuegos es unequilibriodeNash.Estoimplicalaexistenciadeoptimalidadinclusoenaquellasramasdel juego a las que no se accede.5.Estos equilibrios de Nash perfectos en los subjuegos se identifican mediante la bsqueda de la solucin recursiva. Es decir, buscando en primer lugar los equilibrios de Nash en los subjuegos. En el caso analizado anteriormente (1,ne) y (0,en) son equilibrios de Nash pero no son perfectos en los subjuegos. Se exige que la solucin del juego sea un equilibrio perfecto en los subjuegos. En este caso nos quedamos exclusivamente con (0,nn). Ejemplo: amenaza no crebles en la entrada en unmercado La demanda de un mercado viene dada por la ecuacin: 41 P Q = Funcin de costes: ) Cq q ! Equilibrio de Cournot Elproductor 1 produce la cantidad que maximiza su beneficio dada la cantidad que produce el 2. El 2 hace lo mismo. La solucin conjunta a estas dos decisiones constituye el denominado equilibrio de Cournot. El beneficio del productor 1 se escribe como: )1 1 2 1 141 q q q q 4! La condicin de primer orden de este problema de optimizacin es: 11 2 111 241 1 01202q q qqq qx4! !x! Por simetra, la repeticin del proceso para el segundo productor dara como resultado: 2 11202q q = La solucin resulta de resolver el sistema de ecuaciones anterior: )1 21 213, 326, 614, 314, 3 1 13, 3 177q qQP= ===H= H =- = Stackelberg. Modelo lder-seguidor La primera empresa (lder) tiene en cuenta la reaccin de la segunda a su decisin. La segunda toma la decisin del primero como dada. Por tanto, la cantidad producida por la segunda sigue la misma lgica que en el modelo de Cournot. Es decir: 2 11202q q ! La empresa lider tiene en cuenta la reaccin de la seguidora. Es decir, el beneficio se escribe como: 21 1 1 1 1 1 11 141 20 202 2q q q q q q 4! ! La maximizacin del beneficio implica que: 111120 020qqqxH==x= Por tanto, se tiene: ) )121220120 20 102301111 1 20 20011 1 10 100qqQP==- ===H=- =H =- = A continuacin representamos esta situacin como un juego en forma extensiva. Para la empresa lder consideramos dos estrategias: producir la cantidad de Cournot (13) o producir la cantidad del modelo lder seguidora (20). Para la empresa seguidora consideramos dos posibles acciones producir la cantidad del modelo de Cournot (13) o la cantidad del modelo lder seguidora (10). Por tanto, necesitamos calcular el beneficio de dos situaciones que no se haban considerado. En primer lugar: ) )1 21220, 13.333, 37, 67, 6 1 20 1327, 6 1 13, 3 87q qQP= ===H=- =H =- = En segundo lugar: ) )1 21213, 3, 1023, 317, 617, 6 1 13, 3 22217, 6 1 10 167q qQP= ===H=- =H =- = La representacin en forma extensiva es: La solucin recursiva es la siguiente: La empresa 2 elegira b si la empresa 1 eligiese a. La empresa 2 elegira a si la empresa 1 eligiese b. Como consecuencia, la empresa 1, elige a.El equilibrio de Nash perfecto en los subjuegos es (a,ba). Es decir, la empresa1 entra con la cantidad ptima de la empresa lider Stackelberg y la empresa 2 produce la cantidad ptima de la seguidora. El conjunto completo de equilibrios de Nash se observa mejor en una representacin normal del juego. Empresa 2 1 22 200, 1001 132, 87222, 167177, 1771 0 10 (b) 13 (a) 10 (b) 13 (a) 20 (a) 13 (b) bbaaabba Empresa 1 a200, 100132, 87 132, 87200, 100 b222, 167177, 177 222, 167 177, 177 Los equilibrios de Nash son:(a, ba) que la solucin recursiva haba identificado como el equilibrio perfecto en los subjuegos. (b, aa) que es un equilibrio de Nash basado en una amenaza no creible. De hecho, la empresa 2 no producir a (13) cuando la empresa 1 entre como empresa lder jugando a (20). Sin embargo, esta circunstancia nunca llega ya que si la empresa 2 juega siempre a , la estrategia ptima de la empresa 1 es b. En estas circunstancias, la estrategia ptima de2 es aa. De otro modo, la estrategiaptima de la empresa 1 cambiara. Por tanto, nos encontramos ante dos estrategias ptimas mutuamente compatibles. Es decir, un equilibrio de Nash. Ejemplo: reacciones de una empresa que produce en un mercado ante la entrada de una segunda empresa La demanda y los costes son idnticos al ejemplo anterior. La empresa que entra en el mercado puede: 0.EntrarconlacantidaddeequilibriodeCournot(a)buscandolamismareaccinporpartedela empresa que est en el mercado (q2=13). 1.No entrar (b) que, en trminos de produccin, equivale a q2=0. Caso 1. La empresa 2 entra con q2=13, la empresa 1 reacciona a la Cournot q1=13. En este caso, se tiene que 1 2177 H= H = . Caso 2. La empresa 2 entra con q2=13, la empresa 1 produce la cantidad que baja el precio a cero. ) )1 11241 13, 3 0 27, 60 1 27, 6 27, 60 1 13, 3 13, 3P q q = ==H=- = H =- = Caso 3.La empresa 2 no entra y la 1 se comporta como un monopolista. ) )21 1 1 1 1 111 111241 4040 2 0 2041 20 2120 1 20 4000q q q q qq qqP4! ! x4!!!x!!4!v !4 ! Caso 4. )2 112013, 341 13, 3 27, 627, 6 1 13, 3 3550q qP= ===H=- =H = Caso 5. )2 112027, 641 27, 6 13, 313, 3 1 27, 6 3400q qP= ===H=- =H = Caso 6. ) )2 11213, 32041 20 13, 3 7, 67, 6 1 20 1327, 6 1 13, 3 88q qP! !! !4!v !4 !v ! La representacin en forma normal del juego es la siguiente: 2 11 355, 0400, 0 340, 0177, 177132, 88-27, 130 (b)13 (a) 13 (b) 20 (m) 27 (a) 13 (b) 20 (m) 27 (a) Obtencin de equilibrio de Nash perfecto en los subjuegos mediante la solucin recursiva. La empresa 1 produce la cantidad m si la empresa 2 decide no entrar. La empresa 1 produce la cantidad b si la empresa 2 decide entrar. El equilibrio de Nash perfecto en los subjuegos es (mb,a). Corresponde al caso en que la entrada de la empresa 2 conduce a una situacin de duopolio de Cournot. El conjunto completo de equilibrios de Nash se observa mejor en una representacin normal del juego. Empresa 2 ba Empresa 1 bb 355, 0177, 177 bm 355, 0132, 88 ba355, 0-27, -13 mb400, 0177, 177 mm400, 0132, 88 ma400, 0-27, -13 ab340, 0 177, 177 am340, 0132, 88 aa340, 0 -27, -13 En la forma normal aparece el equilibrio de Nash perfecto en los subjuegos obtenido anteriormente mediante la solucin recursiva (mb, a). Existen otros dos equilibrios de Nash que conducen al mismo resultado: (bb, a) y (ab, a). Son equilibrios de Nash que en que se juega una estrategia no ptima en la rama izquierda del juego porque no se llega a ella ya que la empresa 2 no cambia su decisin por estos cambios en la rama izquierda. El equilibrio de Nash (ma, b) es muy interesante. Representa el caso en que la empresa 2 no entra en el mercado ante la perspectiva de que la empresa 1 produzca la cantidad que hace el precio cero si la 2 entra. Es un equilibrio de Nash ya que la 2 no entra, y dado que la 2 no entra, la 1 no tiene incentivos para cambiar esta estrategia. Sin embargo, si la 2 entrase no se comportara de esa manera porque no es ptimo comportarse de esa manera en el rbol derecho del juego. Es decir, este equilibrio contiene una amenaza no creble. Ejemplo 2,0 D I1 I1 D El equilibrio obtenido por solucin recursiva es (II;I). Los equilibrios de Nash en los subjuegos son: Jugador 2 id Jugador 1 i11, 1 113,0 d11,1 0, 21 (i, i) es el equilibrio de Nash en el subjuego. Los equilibrios de Nash en el juego completo son: Jugador 2 id Jugador 1 ii12, 0 1 2, 0 1 id12, 0 1 2, 0 1 di 1, 1 113,0 dd1,10, 2 1 Existen dos equilibrios de Nash: (ii, i) y (id, i). El primero es un equilibrio de Nash en el subjuego. El segundo no lo es. Jugar derecha al final es una amenaza no creble. 1 1 2 1,1 3,00,2 I1D Ejemplo. Tirole, La teora de la organizacin industrial. Pag. 424. Representacin en forma normal. Jugador 2 iiddiddi Jugador 1i12, 01 2, -1 2, 0 112, -1 d1, 013, 1 113, 1 11, 0 Los equilibrios de Nash son: (i, ii ), (d, dd) y (d, id). La solucin recursiva y, por tanto, el equilibrio de Nash perfecto en lossubjuegos es (d, id). Los otros dos equilibrios de Nash corresponden con amenazas no crebles. Es decir, con estrategias que contienen acciones que no se llevaran a cabo si el juego llegase al punto de tener que ejercitarlas. 1.4.Aplicaciones Colusin como juego repetido Productor 2 colusinengao 1 22 2,0 2,-1 1,03,1idi d i d Productor 1colusin 1012, 1012759, 1139 1 engao11139, 7591900, 900 1 Estrategia del "gatillo" Coludir hasta que alguien no coopere. Si alguien no coopera pasar a Cournot. Pago de la colusin: 10121 H Pago del engao: 90011391HH

Se coopera si: ,1012 90011391 11012 1139 1139 900239 127053HH HH HHH" + "+"" La solucin depende del grado de impaciencia de los individuos () y del pago de engaar. Ejemplo de amenaza no creble La solucin recursiva indica que (d, di) es un equilibrio de Nash perfecto en los subjuegos. Representacin en forma normal. Jugador 2 iiddiddi Jugador 1i13, 111, 2113, 11, 2 1 d 2, 1 10, 00, 012, 1 1 Aparecen dos equilibrios de Nash: (i, dd) y (d, di).El equilibrio (i, dd). La amenaza de 2 de jugar derecha si 1 juega derecha hace que 1 juegue izquierda. Dado que 1 juega izquierda la jugada de 2 es ptima. Negociacin en tres etapas Se analiza el reparto de 1 unidad monetaria con una tasa de descuento . 1)A hace una oferta. Si B acepta la oferta concluye el juego. Si B no acepta se pasa a la segunda etapa. 2)B hace una oferta. Si A acepta la oferta concluye el juego. Si A no acepta se pasa a la tercera etapa. 3)El gobierno hace el reparto. AA le corresponde x y a B 1-x. 1 22 3, 1 1, 22, 1 0, 0i d1 i 1d I D1 Solucin recursiva B al hacer una oferta en la segunda etapa sabe cules son los pagos descontados de la tercera etapa: ) , x 1 x H H B debe hacerle una oferta a A que pueda aceptar ( x H ). Por tanto, el reparto propuesto y aceptado por A es: , x 1 x H H A conoce este resultado en la primera etapa. Por tanto, debe hacer una propuesta en la primera etapa que B no rechace ) 1 x H H: ) ) , 1 1 x 1 x H H H H La solucin recursiva evita las amenazas no crebles. Es muy interesante el caso en que x=1 o x=0. Es decir, cuando el gobierno va a dar todo a uno de los agentes. An en ese caso, la oferta en la primera etapa que el agente acepta no es nula. Los agentes evitan la espera a la tercera etapa haciendo una oferta positiva en la primera.