Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe...

25
Juegos de Suma No Cero Maria Luisa P´ erez Segu´ ı [email protected] FCFM - UMSNH Miguel Raggi [email protected] ENES - UNAM 9 de marzo de 2020 Mal´ u Juegos de Suma No Cero 9 de marzo de 2020 1 / 25

Transcript of Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe...

Page 1: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Juegos de Suma No Cero

Maria Luisa Perez Seguı[email protected]

FCFM - UMSNH

Miguel [email protected]

ENES - UNAM

9 de marzo de 2020

Malu Juegos de Suma No Cero 9 de marzo de 2020 1 / 25

Page 2: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Indice:

1 Relacion con suma 0IntroduccionDominacion y Puntos sillaMaximizacion de la EsperanzaEquilibrio de Nash

2 Optimalidad ParetoEstrategias Prudentes

3 Juegos Solubles

Malu Juegos de Suma No Cero 9 de marzo de 2020 2 / 25

Page 3: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Indice:

1 Relacion con suma 0IntroduccionDominacion y Puntos sillaMaximizacion de la EsperanzaEquilibrio de Nash

2 Optimalidad ParetoEstrategias Prudentes

3 Juegos Solubles

Malu Juegos de Suma No Cero 9 de marzo de 2020 3 / 25

Page 4: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Juegos en matrices

Si tenemos un juego que no es de suma 0, (y no se puede convertir auno de suma 0), las utilidades de Rosa y Colın no estaran totalmenteencontradas.

Por lo tanto hay manera de cooperar, aunque tambien puede habercompetencia.

Para la cooperacion, sin embargo, muchas veces se necesita decomunicacion entre los jugadores.

Entonces mucho del analisis de estos juegos depende de lassuposiciones que hagamos de la comunicacion.

Cuando se permite comunicarse antes de escoger la estrategia, aveces se crean nuevas opciones como: promesas, amenazas, etc.

Empezaremos suponiendo que no hay comunicacion y, como antes,los dos jugadores escogen sus estrategias simultaneamente.

Malu Juegos de Suma No Cero 9 de marzo de 2020 4 / 25

Page 5: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

¿Que de lo que hemos estudiado sirve aun?

Una manera razonable de empezar es tratar de ver que cosas delanalisis de juegos de suma 0 aun sirven.

Ejemplo 1. Consideremos el siguiente juego:

Rosa

ColínA B

A

B (0,1)

(3,2)

(1,0)

(2,3)

Malu Juegos de Suma No Cero 9 de marzo de 2020 5 / 25

Page 6: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Dominancia y puntos silla

Obviamente el concepto de dominacion se sigue valiendo, ası que seesperarıa que Rosa jugara A.

Sabiendo esto, Colın deberıa jugar A.

El juego, aunque parece simetrico, favorece a B.

Tambien sigue valiendo la idea de buscar equilibrio con las flechascomo AA en el ejemplo 1.

El correspondiente a un punto silla es donde hay equilibrio.

En otras palabras, un punto silla es una entrada de la matriz tal quela utilidad de Rosa es mayor o igual que todas las de la mismacolumna, y la utilidad de Colın es mayor o igual que todas las delmismo renglon.

Pregunta: ¿Puede haber varios puntos silla no equivalentes?

¡Claro que sı!

Malu Juegos de Suma No Cero 9 de marzo de 2020 6 / 25

Page 7: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Dos puntos silla

Ejemplo 2. El siguiente juego muestra dos puntos silla.

Rosa

ColínA B

A

B

(1,1) (2,5)

(5,2) (-1,-1)

A Rosa le conviene BA, a Colın AB.

¿Que pasa si ambos intentan conseguir lo mejor para ellos mismos?Terminaran en BB, que es lo peor para ambos.

Malu Juegos de Suma No Cero 9 de marzo de 2020 7 / 25

Page 8: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Maximizacion de la Esperanza

¿Existen estrategias mixtas para Rosa y Colın tales que si los dosjuegan con ellas entonces ninguno de los dos ganarıa mas con otraestrategia?

Igual que en suma 0 pensemos en el principio de maximizacion de laesperanza.

Es decir, si sabemos la estrategia (mixta) que jugara el otro, lo mejorque podemos hacer es maximizar la esperanza de nuestra utilidad.

A cada estrategia (mixta) de un jugador, le asociamos una estrategia(mixta) del otro jugador: La mejor respuesta.

Puede haber mas de una, claro.

Malu Juegos de Suma No Cero 9 de marzo de 2020 8 / 25

Page 9: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Maximizacion de la EsperanzaEjemplo 3. Consideremos el siguiente juego:

Rosa

ColínA B

A

B

(2,4) (1,0)

(3,1) (0,4)

De acuerdo al juego de Colın (como si fuera de suma 0), la estrategiamixta de Rosa se obtiene igualando las probabilidades:

4p+ (1− p) = 4(1− p).

Entonces p = 37 y el valor esperado para Colın es 4 4

7 = 167 .

Llamamos a esta la estrategia ecualizadora para Rosa.

De la misma manera, la estrategia ecualizadora para Colın serıa(12A,

12B), que darıa valor esperado a Rosa de 3

2 .

Este es un equilibrio de Nash, pero veremos que NO es la mejorestrategia porque, por ejemplo, AA es mejor para ambos jugadores.

Malu Juegos de Suma No Cero 9 de marzo de 2020 9 / 25

Page 10: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Equilibrio de Nash

En el ejemplo anterior, el equilibrio se encontro cuando cada uno delo jugadores ignoro sus propias utilidades.

Veremos otros casos. En general

Definicion

Decimos que un resultado de un juego es un equilibrio de Nash si ningunjugador tiene incentivo para cambiar con respecto a la estrategia del otro.Es decir, si se jugaron las estrategias (mixtas) R y C, entonces R es unamejor respuesta de C y C es una mejor respuesta de R.

Preguntas:¿Siempre existen?

Sı. La prueba es difıcil y utiliza el teorema del punto fijo de Brouwerpara simplejos (segmentos, triangulos, tetraedros, etcetera).

¿Si hay mas de uno, son equivalentes entre sı?No, ya vimos un ejemplo donde hay dos puntos silla no equivalentes, ytodo punto silla es equilibrio de Nash.

¿Como los encontramos en general?¡Tampoco es facil!

Malu Juegos de Suma No Cero 9 de marzo de 2020 10 / 25

Page 11: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Mas ejemplos

Ejemplo 4. Consideremos el juego:

Rosa

ColínA B

A

B

(3,3) (-1 , 5 )

(5,-1 ) (0,0)

Rosa B domina Rosa A y Colın B domina Colin A; BB es el unicopunto silla.

Sin embargo, AA es mejor para ambos jugadores.

Malu Juegos de Suma No Cero 9 de marzo de 2020 11 / 25

Page 12: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Indice:

1 Relacion con suma 0IntroduccionDominacion y Puntos sillaMaximizacion de la EsperanzaEquilibrio de Nash

2 Optimalidad ParetoEstrategias Prudentes

3 Juegos Solubles

Malu Juegos de Suma No Cero 9 de marzo de 2020 12 / 25

Page 13: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Principio Pareto

Definicion

Decimos que un resultado de un juego es pareto optimo si ningun otroresultado es mejor para uno de los jugadores y no es peor para el otro.

¿Siempre existen? ¡Claro!

¿Puede haber mas de uno? Sı. En el juego anterior todos menos BBson pareto optimos.

Principio

Para que un resultado de un juego sea aceptable como solucion, debe serpareto optimo.

Malu Juegos de Suma No Cero 9 de marzo de 2020 13 / 25

Page 14: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Analisis geometrico de equilibrios y resultados pareto

Retomemos los juegos vistos arriba.

Dibujaremos los polıgonos del plano cartesiano cuyos vertices son lospuntos de la matriz del juego.

¿Cuales son los posibles resultados del juego? Los puntos de la regionacotada por el polıgono.

¿Cuales son los posibles resultados que cumplen el principio pareto?Aquellos que no tienen puntos de la region de resultado que esten a laderecha y arriba.

Encerraremos en un cırculo los puntos de equilibrio y marcaremos losresultados pareto con una lınea roja.

Malu Juegos de Suma No Cero 9 de marzo de 2020 14 / 25

Page 15: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Analisis geometrico de equilibrios y resultados pareto

En el ejemplo 1,

Rosa

ColínA B

A

B (0,1)

(3,2)

(1,0)

(2,3)AA

AB

BA

BB

Vimos que AA es punto de equilibrio.

El segmento de AA a AB es el conjunto de puntos que cumplen lacondicion pareto.

Malu Juegos de Suma No Cero 9 de marzo de 2020 15 / 25

Page 16: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Analisis geometrico de equilibrios y resultados pareto

En el ejemplo 2:

Rosa

ColínA B

A

B

(1,1) (2,5)

(5,2) (-1,-1)AA

AB

BA

BB

Aquı hay dos puntos de equilibrio: AB y BA.

El segmento de AB a BA es el conjunto de puntos que cumplen lacondicion pareto.

Malu Juegos de Suma No Cero 9 de marzo de 2020 16 / 25

Page 17: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Analisis geometrico de equilibrios y resultados pareto

En el ejemplo 3:

Rosa

ColínA B

A

B

(2,4) (1,0)

(3,1) (0,4)

AB

AA

BA

BB

En este caso, encontramos el punto de equilibrio (32 ,167 ).

El segmento de AA a BA es el conjunto de puntos que cumplen lacondicion pareto.

Malu Juegos de Suma No Cero 9 de marzo de 2020 17 / 25

Page 18: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Analisis geometrico de equilibrios y resultados pareto

En el ejemplo 4:

Rosa

ColínA B

A

B

(3,3) (-1,5)

(5,-1 (0,0))

AB

BA

BB

AA

Vimos que (0, 0) es punto de equilibrio.

Los puntos que cumplen la condicion pareto estan en los segmentosde AB a AA, y de AA a BA.

Malu Juegos de Suma No Cero 9 de marzo de 2020 18 / 25

Page 19: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Equilibrios no equivalentes y optimalidad ParetoUn punto de equilibrio es deseable por su estabilidad. Nash probo quesiempre existen.Ya vimos que puede haber varios equilibrios de Nash no equivalentes.¿Cual escogemos?Inclusive, aunque solo haya uno, no necesariamente es pareto optimo.Por ejemplo, en el juego de dilema del prisionero, en “confesar losdos” hay equilibrio de Nash (pues es punto silla), pero no es paretooptimo.

CompañeroConfesar No Confesar

Confesar

No Confesar (-1,-1)

(0,-10)

(-10,0)

(-5,-5)

Entonces no siempre podemos decir “esta es la solucion del juego”.El problema de la teorıa de Juegos de suma no cero es que no siemprees facil encontrar como jugar.

Malu Juegos de Suma No Cero 9 de marzo de 2020 19 / 25

Page 20: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Estrategias prudentesVeamos otra idea basada en la de juegos de suma cero, en la que elequilibrio se encontraba cuando cada jugador seguıa la estrategia demaximizar la ganancia en el peor de los casos.

Retomemos el ejemplo 3:

Rosa

ColínA B

A

B

(2,4) (1,0)

(3,1) (0,4)

AB

AA

BA

BB

Consideremos el juego de suma cero asociado a Rosa:2 → 1↓ ↑3 → 0

Tiene punto silla en AB, ası que Rosa puede asegurar una gananciade al menos 1.

Malu Juegos de Suma No Cero 9 de marzo de 2020 20 / 25

Page 21: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Estrategias prudentes

Definicion

En un juego de suma no cero, la estrategia optima para Rosa se llamaestrategia prudente y el valor del juego para Rosa es el nivel de seguridad.

Entonces, en el juego anterior, la estrategia prudente para Rosa es ABy su nivel de seguridad es 1.

Analogamente, la estrategia prudente para Colın se encuentra en el

juego de suma cero

4 → 0↑ ↓1 ← 4

Ya habıamos visto que la estrategia para Colın es (47A,

37B), y el valor

del juego (es decir, su nivel de seguridad) es 167 .

Si los dos juegan su estrategia prudente, el resultado sera47AA+ 3

7AB =(117 ,

167

),

Entonces Colın obtiene su nivel de seguridad, y Rosa obtiene un pocomas.

Malu Juegos de Suma No Cero 9 de marzo de 2020 21 / 25

Page 22: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Estrategias prudentes

Sin embargo, al dibujar(117 ,

167

)en el polıgono, vemos que tampoco

es Pareto optimo.

De hecho, tampoco es punto de equilibrio porque si Colın piensa queRosa jugara su estrategia prudente, a Colın le conviene jugar A.

Analogamente, si Rosa piensa que Colın jugara su estrategiaprudente, sus ganancias esperadas serıan:

A : 47 · 2 +

37 · 1 = 11

7 ,B : 4

7 · 3 +37 · 0 = 12

7 ,

de modo que le conviene jugar B.

Definicion

En un juego de suma no cero, una estrategia contra-prudente para unjugador es su optima respuesta para la estrategia prudente de su oponente.

Se vuelve un cırculo irresoluble.

Malu Juegos de Suma No Cero 9 de marzo de 2020 22 / 25

Page 23: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Indice:

1 Relacion con suma 0IntroduccionDominacion y Puntos sillaMaximizacion de la EsperanzaEquilibrio de Nash

2 Optimalidad ParetoEstrategias Prudentes

3 Juegos Solubles

Malu Juegos de Suma No Cero 9 de marzo de 2020 23 / 25

Page 24: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Juegos Solubles en el Sentido Estricto

Definicion

Decimos que un juego es soluble en el sentido estricto (o SSS) si:

Hay al menos un equilibrio de Nash que sea Pareto-Optimo

Si hay mas de un equilibrio Pareto-Optimo, todos son equivalentes eintercambiables (no se que quiere decir).

Malu Juegos de Suma No Cero 9 de marzo de 2020 24 / 25

Page 25: Juegos de Suma No Cero - ichi.fismat.umich.mxichi.fismat.umich.mx/cursos/Juegos-5-SumaNoCero.pdfDe nici on En un juego de suma no cero, la estrategia optima para Rosa se llama estrategia

Juegos Solubles en el Sentido Estricto

Ejemplo 5.

Rosa

Colín

(0,0)

(0,-1 )

(2,2)

(2,1)

(0,2)

(1,4)

(1,-1 )

(2,3)

(1,-1 )

A

B

C

A B CAB

AC

AA

BA

BC

BB

CA

CB

CC

Hay dos equilibrios: BB y AC.Sin embargo, solo hay uno que es pareto-optimo: AC.

Malu Juegos de Suma No Cero 9 de marzo de 2020 25 / 25