Juegos en Matricesichi.fismat.umich.mx/cursos/Juegos-2-SumaCero.pdfSuma Cero Ejemplo Diagrama de...

42
Juegos en Matrices Maria Luisa P´ erez Segu´ ı [email protected] FCFM - UMSNH Miguel Raggi [email protected] ENES - UNAM 9 de marzo de 2020 Mal´ u Juegos en Matrices 9 de marzo de 2020 1 / 42

Transcript of Juegos en Matricesichi.fismat.umich.mx/cursos/Juegos-2-SumaCero.pdfSuma Cero Ejemplo Diagrama de...

Juegos en Matrices

Maria Luisa Perez Seguı[email protected]

FCFM - UMSNH

Miguel [email protected]

ENES - UNAM

9 de marzo de 2020

Malu Juegos en Matrices 9 de marzo de 2020 1 / 42

Indice:

1 IntroduccionSuma CeroEjemploDiagrama de Flechas

2 Estrategias PurasPuntos Silla

3 Estrategias MixtasEquilibrio de Nash

Malu Juegos en Matrices 9 de marzo de 2020 2 / 42

Indice:

1 IntroduccionSuma CeroEjemploDiagrama de Flechas

2 Estrategias PurasPuntos Silla

3 Estrategias MixtasEquilibrio de Nash

Malu Juegos en Matrices 9 de marzo de 2020 3 / 42

Juegos en Matrices

Recordemos que un juego (economico) en general se puede expresarcon dos matrices del mismo tamano, o una matriz con dos entradasen cada posicion.

Dos jugadores, Rosa y Colın, juegan.

Simultaneamente Rosa escoge un renglon y Colın una columna.

Rosa obtiene la utilidad que esta en la primera entrada del renglon ycolumna escogidos y Colın obtiene la utilidad de la segunda.

Vamos a suponer que ambos jugadores son racionales e inteligentes.sutil

Malu Juegos en Matrices 9 de marzo de 2020 4 / 42

Suma Cero

Empezaremos con juegos de suma 0, que son juegos en donde laprimera entrada y la segunda entrada en una matriz suman 0.

Es decir, la ganancia de Rosa es la perdida de Colın y viceversa.

Usualmente entonces ponemos solo la matriz de Rosa (la de Colınsera la negativa).

En otras palabras, Rosa tratara de maximizar el numero obtenido yColın tratara de minimizarlo.

Malu Juegos en Matrices 9 de marzo de 2020 5 / 42

Ejemplo

Rosa

ColinA B

A

B 1

-1

5

12

7

1

C

-20

0

D

0

2

-16

3

0

4

16

3C

D

Malu Juegos en Matrices 9 de marzo de 2020 6 / 42

Ejemplo

¿Que debe hacer cada jugador, racionalmente?

Por ejemplo, Colın jamas debe elegir la columna C pues, sin importarlo que haga Rosa, la columna B es mejor que la C.

Cuando pasa esto, decimos que Colın-B domina a Colın-C.

Principio de Dominacion: Un jugador nunca debe elegir una estrategiadominada.

A veces este principio simplifica el juego.

Malu Juegos en Matrices 9 de marzo de 2020 7 / 42

Diagrama de Flechas

explica

Rosa

ColinA B

A

B 1

-1

5

12

7

1

C

-20

0

D

0

2

-16

3

0

4

16

3C

D

Malu Juegos en Matrices 9 de marzo de 2020 8 / 42

Diagrama de Flechas

fijense en el 2

Rosa

ColinA B

A

B 1

-1

5

12

7

1

C

-20

0

D

0

2

-16

3

0

4

16

3C

D

Malu Juegos en Matrices 9 de marzo de 2020 9 / 42

Diagrama de Flechas

Podemos notar que si Rosa juega C, puede asegurar que gana por lomenos 2.

Igualmente, si Colın juega B, puede asegurar que Rosa gana a lo mas2.

Es decir, jugar ası es como jugar lo mas cautelosamente posible paraambos jugadores.

Ademas, notemos que si Rosa juega C y Colın juega B, entoncesambos quedaran conformes, en el sentido de que:

Si Rosa juega C, Colın no va a querer cambiar, y si Colın juega B,Rosa no querra cambiar.

Malu Juegos en Matrices 9 de marzo de 2020 10 / 42

Diagrama de FlechasEn este juego casi cualquier Teorista-de-Juegos recomendarıa a Colınjugar B y a Rosa jugar C.Cualquier otra manera de jugar se pueden aprovechar.Decimos que en un caso ası, el valor del juego es 2.Es decir, el valor del juego es un numero v tal que Rosa puede jugarde manera que al menos gane v, y Colın puede jugar de manera queRosa a lo mas gane v.

Rosa

ColinA B

A

B 1

-1

5

12

7

1

C

-20

0

D

0

2

-16

3

0

4

16

3C

D

Malu Juegos en Matrices 9 de marzo de 2020 11 / 42

Indice:

1 IntroduccionSuma CeroEjemploDiagrama de Flechas

2 Estrategias PurasPuntos Silla

3 Estrategias MixtasEquilibrio de Nash

Malu Juegos en Matrices 9 de marzo de 2020 12 / 42

Puntos silla

Definicion

Sea J una matriz. Decimos que J tiene un punto silla en (a, b) (cona, b ∈ N) si para todos x, y ∈ N tenemos que

J [x, b] ≤ J [a, b] ≤ J [a, y]

.

Es decir, en la columna b, la entrada J [a, b] es la mayor, y en el renglon a,la entrada J [a, b] es la menor.

Malu Juegos en Matrices 9 de marzo de 2020 13 / 42

¿Como encontrar puntos silla?

Ahora, cuando hay un punto silla, ya sabemos que hacer. Pero...¿como los encontramos?

Podrıamos simplemente fijarnos en cada entrada de la matriz y ver sies punto silla. Esto tomarıa tiempo O(n3)!

Obviamente hay una manera mas facil:

De cada renglon, fıjate en el numero mas pequeno. Escoge el masgrande entre estos.

De cada columna, fıjate en el numero mas grande. Escoge el maspequeno entre estos.

Si concuerdan, ahı estan los puntos silla.

Malu Juegos en Matrices 9 de marzo de 2020 14 / 42

Ejemplo

Empezamos con un juego cualquiera.

Rosa

Colín

23

-104

02

57 2

A

B

C

A B C

-15

380 -4 -5

D

D

Malu Juegos en Matrices 9 de marzo de 2020 15 / 42

Ejemplo

De cada renglon, nos fijamos en el numero mas pequeno.

Colín

23

-104

02

57 2

A

B

C

A B C

-15

380 -4 -5

D

D

2-10

2-5

Rosa

Malu Juegos en Matrices 9 de marzo de 2020 16 / 42

Ejemplo

De cada columna, nos fijamos en el numero mas grande.

Rosa

Colín

23

-104

02

57 2

A

B

C

A B C

-15

380 -4 -5

D

D

2-10

2-5

7 8 2 5Malu Juegos en Matrices 9 de marzo de 2020 17 / 42

Ejemplo

Escogemos el mayor de los renglones y el menor de las columnas.

Rosa

Colín

23

-104

02

57 2

A

B

C

A B C

-15

380 -4 -5

D

D

2-10

2-5

7 8 2 5Malu Juegos en Matrices 9 de marzo de 2020 18 / 42

Ejemplo

Si coinciden, entonces tenemos puntos silla.

Rosa

Colín

23

-104

02

57 2

A

B

C

A B C

-15

380 -4 -5

D

D

2-10

2-5

7 8 2 5Malu Juegos en Matrices 9 de marzo de 2020 19 / 42

Puntos silla

No podemos hacer menos que O(n2), pues debemos al menos leer lamatriz.

Eso resuelve totalmente los juegos donde hay puntos silla.

¿Pero que tal que no hay?

¿Que tal si pasa lo de que “yo pienso que tu vas a pensar que yo voya pensar...” ?

Rosa

ColinA B

A

B 1

-1

0

2

Malu Juegos en Matrices 9 de marzo de 2020 20 / 42

Indice:

1 IntroduccionSuma CeroEjemploDiagrama de Flechas

2 Estrategias PurasPuntos Silla

3 Estrategias MixtasEquilibrio de Nash

Malu Juegos en Matrices 9 de marzo de 2020 21 / 42

¿Que juego es?

Rosa

Colín

0

-1

1

0

-1

1

1-1 0

A B C

A

B

C

Malu Juegos en Matrices 9 de marzo de 2020 22 / 42

¡Piedra, Papel o Tijeras!

Rosa

Colín

0

-1

1

0

-1

1

1-1 0

Malu Juegos en Matrices 9 de marzo de 2020 23 / 42

¡Piedra, Papel o Tijeras!

Pregunta: ¿Que hace uno en piedra, papel o tijeras? ¿Cual es la mejorestrategia? dejalos pensarRespuesta: ¡Pues jugar totalmente al azar!

Es decir, uno debe jugar cada posibilidad con probabilidad de1

3, para ser

lo mas impredecible posible y que no se puedan aprovechar de uno.

Malu Juegos en Matrices 9 de marzo de 2020 24 / 42

Estrategias, Puras y Mixtas

Definicion

Una estrategia pura es simplemente como decir “voy a jugar B”.

Una estrategia mixta es una combinacion lineal de suma 1 deestrategias puras. Es decir, es una asignacion de probabilidades paraescoger cada una de las estrategias puras.

Malu Juegos en Matrices 9 de marzo de 2020 25 / 42

Estrategias Mixtas

¿Como encontramos la mejor estrategia en un juego ası?

¿Que significa “la mejor estrategia”?

Por ejemplo, supongamos que Rosa tiene 2 estrategias: A y B. Unaestrategia es, entonces, un numerito p ∈ [0, 1], que dice:

“Juego A con probabilidad p y B con probabilidad (1− p)”.

Supongamos entonces que Colın tiene un espıa y sabe como va ajugar Rosa (i.e. conoce p).

Entonces Colın jugara para minimizar la esperanza de Rosa.

Principio de Maximizacion de Esperanza: Todo jugador debe tratar demaximizar la esperanza de su utilidad.

Malu Juegos en Matrices 9 de marzo de 2020 26 / 42

Principio de Maximizacion de Esperanza

Entonces, sabiendo que Colın jugara ası, ¿que debe hacer Rosa?

Pues debe elegir la p que, cuando Colın elija como jugar, ellamaximice su esperanza.

En general, Rosa debe elegir −→p = (p1, p2, ..., pr) (si Rosa tiene restrategias posibles) de tal modo que, suponiendo que Colın sabecomo jugara ella, Rosa maximizara su esperanza.

Malu Juegos en Matrices 9 de marzo de 2020 27 / 42

Equilibrio de Nash

Proposicion

El resultado del juego que se produce si Rosa elige −→p (suponiendo queColın sabe como jugara ella) y Colın elige −→q (suponiendo que Rosa sabeque hara el) es el mismo.

Definicion

A este resultado le llamamos un Equilibrio de Nash.

Observacion

Si ambos jugadores estan jugando su equilibrio de Nash, ninguno tieneincentivo para cambiar su estrategia.

Malu Juegos en Matrices 9 de marzo de 2020 28 / 42

Ejemplo de equilibrio

Consideremos el siguiente juego.

Rosa

ColínA B

A

B 3

-3

0

2

Malu Juegos en Matrices 9 de marzo de 2020 29 / 42

Equilibrio de Nash

Notamos primero que no tiene punto silla (esto es esencial).

Supongamos que Rosa sabe que Colın jugara con probabilidad de 12

cada columna.

Entonces Rosa escoge el mayor entre:

12 · 2 +

12 · (−3) = −1

2 ,12 · 0 +

12 · (3) = 3

2 .

Pero Colın puede usar otra probabilidad, q, para la columna A (y1− q para la B):

q · 2 + (1− q)(−3),q · 0 + (1− q)(3).

Al igualar estos dos valores obtenemos q = 34 , con lo cual Colın puede

asegurar que Rosa no gane mas de

3

4· 2 + 1

4(−3) = 3

4.

Malu Juegos en Matrices 9 de marzo de 2020 30 / 42

Equilibrio de Nash

El mismo razonamiento puede seguir Rosa buscando la probabilidad pque maximice su esperanza:

p · 2 + (1− p)(−3) = p · 0 + (1− p)3.

Obtiene p = 38 , con lo que asegura ganar, al menos:

3

8· 2 + 3

8(−3) = 3

4.

Entonces la solucion del juego es:

3/4 de A y 1/4 de B para Colın.3/8 de A y 5/8 de B para Rosa.

El valor del juego es 3/4.

Malu Juegos en Matrices 9 de marzo de 2020 31 / 42

Equilibrio de Nash

Pregunta: ¿Siempre hay equilibrio de Nash?Respuesta: Resulta que sı, pero no es facil de probar.

Pregunta: ¿Como encontrar el equilibrio de Nash?Respuesta: Si hay un punto silla, pues ya, es ese. Si no, cada jugador tieneque encontrar una estrategia que haga que al otro le de igual como juega.

Malu Juegos en Matrices 9 de marzo de 2020 32 / 42

Teorema de Von Neumann

Teorema (John von Neumann)

Todo juego economico de suma cero tiene solucion: Hay un numero vllamado el valor del juego y estrategias (mixtas o puras) “optimas” paraRosa y Colın tales que:

Si Rosa juega la estrategia “optima”, obtendra ≥ v, no importa loque haga Colın.

Si Colın juega su estrategia “optima”, obtendra ≤ v, no importa loque haga Rosa.

Ademas, la solucion puede encontrarse como la solucion de un subjuego dek × k.

Malu Juegos en Matrices 9 de marzo de 2020 33 / 42

Teorema de Von Neumann

Antes de ver la prueba veremos como visualizar las soluciones.

Una vez que entendamos bien bien quien es v y cuales son lasestrategias de Rosa y Colın, sera muy facil la prueba.

Lo veremos en un ejemplo pequeno y luego en general.

Malu Juegos en Matrices 9 de marzo de 2020 34 / 42

Juegos de 2× n

Veremos una manera de visualizar las estrategias mixtas en juegos de2× n. Consideremos el siguiente juego:

Rosa

ColínA B

A

C

B

2 3 11 0 4

Malu Juegos en Matrices 9 de marzo de 2020 35 / 42

Juegos de 2× n

Visualicemos el juego de esta manera:

0

1

2

3

4

Rosa A0

1

2

3

4

Rosa B

Colín A

Colín B

Colín

C

Rosa

ColínA B

A

C

B

2 3 11 0 4

Malu Juegos en Matrices 9 de marzo de 2020 36 / 42

Lıneas

Para cada probabilidad x, si Rosa juega con probabilidad x para A, (yprobabilidad 1− x para B), entonces a Colın le conviene escoger lacolumna o combinacion de columnas que aparezca lo mas abajoposible en esa x.

Por otro lado, a Rosa le conviene escoger x de forma que ese lo masalto posible.

Entonces el equilibrio de Nash se encuentra en el punto mas alto de laenvolvente convexa de la region inferior a las lıneas.

Se hace un poco de geometrıa analıtica vectorial.

Se busca x en el que se intersectan la recta por (0, 1) y (1, 4) con larecta por (0, 2) y (1, 1):

(0, 1) + x(1− 0, 4− 1) = (0, 2) + x(1− 0, 1− 2).

Es decir, x tal que 1 + 3x = 2− x.

Entonces x = 14 y el valor del juego es 1 + 3

(14

)= 7

4

(= 2− 1

4

).

Malu Juegos en Matrices 9 de marzo de 2020 37 / 42

¿Cuales son las probabilidades con las que Colın debe jugar?

Debemos resolver el sistema

2q1 + 3q2 + (1− q1 − q2) = 7/4q1 + 0q2 + 4(1− q1 − q2) = 7/4

La solucion es q1 =34 , q2 = 0, 1− q1 − q2 =

14 ; es decir, debe escoger

la columna A con probabilidad 34 , y la columna C con probabilidad 1

4(no debe escoger la columna B).

De hecho, en juego de 2× n, todas las probabilidades para Colın,salvo tal vez 2, son 0, porque el punto de equilibrio se encuentra en lainterseccion de dos rectas. Ası, el juego se convierte en uno de 2× 2.

Y entonces es mas facil: solo buscamos la probabilidad q para Colın A(y 1− q para C) y, como ya sabemos que el valor es el mismo, solonecesitamos una ecuacion (usando cualquiera de Rosa A o Rosa B):2q + (1− q) = 7/4, de donde q = 3/4.

Malu Juegos en Matrices 9 de marzo de 2020 38 / 42

Lıneas

¿Como se ve que una estrategia de Colın domine a otra? La rectaque domina queda por arriba de la otra.

¿Como se ve que una estrategia de Rosa domine a otra? Las rectasno se intersectan.

Observacion: Si Rosa esta jugando con su estrategia “optima”, todaslas “lıneas” (estrategias de Colın) que pasan por ese punto deinterseccion “le dan igual” a Colın.

Malu Juegos en Matrices 9 de marzo de 2020 39 / 42

En mas dimensiones

¿Que pasa si no es de 2× n? ¿Como le podemos hacer?

Pues podemos analizarlo igual, con planos, hiperplanos, etc.

Necesitamos entonces encontrar el maximo punto del “convexomınimo”.

Eso se hace con algo que se llama Optimizacion Lineal (o“programacion lineal”).

Entonces la solucion del juego sera la solucion de un juego de k × k,pues solo necesitamos k hiperplanos en dimension k para determinarun punto.

Malu Juegos en Matrices 9 de marzo de 2020 40 / 42

Teorema de Von Neumann

Pregunta: ¿Que falta por probar del Teorema?Respuesta: Lo que falta de probar del Teorema es que el valor del juego esel mismo para Rosa y Colın.

Ya probamos que hay un numerito vR y una estrategia para Rosa quele asegura que, no importa que haga Colın, ella obtendra al menos vR.

Lo mismo para Colın, con un numerito vC , que asegura que Rosa noobtendra mas de vC .

Queremos ver entonces, que vC = vR.

Obviamente vR ≤ vC .

Malu Juegos en Matrices 9 de marzo de 2020 41 / 42

Programacion Lineal

El numerito encontrado vR es tal que Rosa no puede mejorar:

Que para cualquier otra estrategia que haga, Colın puede jugar paraque ella obtenga menos (o igual) que vR.

Para los que sepan Optimizacion Lineal: El “programa” de Colın es eldual del de Rosa.

Malu Juegos en Matrices 9 de marzo de 2020 42 / 42