Teoria de Juegos TERMINADO
-
Upload
orange-jm-be -
Category
Documents
-
view
1.124 -
download
6
Transcript of Teoria de Juegos TERMINADO
![Page 1: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/1.jpg)
Teoria de Juegos1. Introducción
Un juego es una interacción entre dos o más personas, es una situación en donde el bienestar o utilidad depende no solo de uno sino de los demás, esta interacción es una situación conflictiva donde cada persona busca lograr un determinado objetico a costa de los demás, la vida cotidiana muchas veces entra en este fenómeno matemático.La teoría de los juegos es una rama de la matemática e dedica al estudio de la siguiente llamadas de conflicto, donde uno o más decisores buscan minimizar perdidas a costa de otros, minimizando sus máximas perdidas (Minimax) o maximizar sus mínimas ganancias (Maximax).El objetivo del estudio es encontrar la forma o estrategia donde el decisor o jugador pueda tomar las decisiones los más efectivamente posible, buscando maximizar el beneficio de sus decisiones.La teoría de juegos puede aplicarse en muchas casos campos de entorno actual, desde lo social hasta lo económico. Por ejemplo:
El análisis en las negociacionesLas negociaciones entre sindicato y empresa, puede analizarse como un juego donde cada arte busca ganar a costa del otro en cuestión de salarios.
La competencia en el ámbito comercialLas empresas pueden ser agresivas frente a nuevas competencias los cuales surgen esporádicamente en el mercado, afectando los precios, costos, etc.
Análisis políticoLa competencia de candidatos en los comicios electorales, haciendo un análisis tano de la población y alguna corriente política en función de gobierno.
En el campo militarEn el análisis estratégico de vencer al oponente en un nivel de conflicto.
2. Elementos de la Teoría de Juegos
JuegoSituación de conflicto, donde dos o mas decisores intentan alcanzar un objetivo seleccionando, ganar a costo de otros bajo ciertas reglas.Donde:
n>=cuando n=2 el juego se llama de dos personasn>2 el juego se llama de n personas
ReglasPolíticas conocidos por jugadores, constituyen los cursos de acción los cuales pueden ser elegidos de acuerdo a los objetivos perseguidos por los jugadores.
ResultadosSon posibles combinaciones o conjunto de estrategias optimas para cada jugador, desarrollado bajo una serie de condiciones los cuales permiten terminar la competitividad o juego. Entre los posibles resultados están; ganar, perder y empatar.
EstrategiaUna estrategia es un algoritmo completo para jugar un juego, enumerando implícitamente los movimientos de los jugadores en cada situación del juego, las estrategias conducen a realizar movidas o elección de un curso de acción en particular de un conjunto de alternativas posibles, denominadas estrategias puras o mixtas.
Estrategia Pura, es aquella en al cual cada una de as movidas hechas por un jugador a lo largo del juego corresponde a una única opción o curso de acción.
![Page 2: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/2.jpg)
Estrategia mixta, es aquella en la cual no siempre se opta por el mismo curso de acción a lo largo del juego.Para el jugador A el conjunto de estrategias 1, 2, …,mPara el jugador Bel conjunto de estrategias 1, 2, …,n
Valor del Juego
Es el promedio de ganancias a lo largo de las múltiples jugadas, donde cada jugador indica cual e el beneficio o pérdida a recibir.
Técnica
Conjunto de reglas mediante las cuales se intenta resolver el juego, encontrando las estrategias optimas para cada jugador. Esto se desarrolla bajo ciertos criterios de decisión.
Matriz de Pagos
Es una tabla la cual permite a los jugadores clasificar sus estrategias aplicando técnicas a esta tabla se podrá lograr resultados óptimos, para los jugadores.
La matriz de la figura caracteriza el proceso de la teoría de juegos, para cada combinación de estrategias de un jugador A, frente a las estrategias de otro Jugador B, se obtiene una consecuencia.
Entonces, la matriz de pagos estará estructurada de a siguiente forma
Donde:El jugador A, escoge una estrategia i disponible entre 1, 2,…, m estrategiasEl jugador B, escoge una estrategia J disponible entre 1, 2,…, n estrategias
![Page 3: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/3.jpg)
3. Tipos de Juegos Las situaciones de conflicto abordados por un modelo de juego, permite establecer diferentes tipos de juego o modelos de juego, pero entre los más importantes y más estudiados están:
Juegos suma- cero para dos oponentesEste juego se caracteriza porque un jugador gana lo que otro jugador pierde.
Juegos suma- diferente de cero o metas juegosEn estos tipos de juegos es inusual que los competidores estén en un conflicto total, además, no se permite la cooperación entre jugadores.
Juego suma cero para dos oponentes
En este tipo de juegos existe dos jugadores, un jugador A (juega las estrategias de los reglones de i a m estrategias) y un jugador B (juega las estrategias de las columnas de j a n estrategias). Si el jugador A elige una estrategia m y el jugador B elige una estrategia n, entonces el jugador A gana u obtiene un beneficio a costa del jugador B, es decir el jugador A, gana lo que el jugador B pierde.
a) Estrategias PurasEs un juego o partida, cada jugador tiene a su disposición un conjunto de movidas o estrategias (, j estrategias del jugador A y B), si u jugador elige una acción esto corresponde a una nica opción o curso de acción, esto con una probabilidad de 1, entonces el jugador esta eligiendo una estrategia pura.
Punto SillaCuando el jugador A, entre en juego, elige una estrategia, esta maximizara sus mínimas ganancias a im
(reglón de matriz de pagos), entonces el jugador B elegirá, una estrategia la cual minimice sus pérdidas máximas aij (columnas de la matriz pagos).Si el valor del criterio minimax (jugador B)es igual al valor del criterio maximin (jugador A), las movidas realizadas por los jugadores forman las estrategias puras conocidas como estrategias puras optimas, entonces el juego tiene un punto silla, este punto silla conduce a la solución del juego, es decir, el jugador A juega una estrategia pura optima frente a la estrategia pura optima del jugador B, el siguiente grafico refleja este proceso del juego suma cero para dos oponentes.
Donde:ami y anj representa un elemento de consecuencia para la matriz de pagos.
Punto Silla
Valor MiniMax = Valor MaxiMin
![Page 4: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/4.jpg)
b) Estrategias Mixtas
La inestabilidad de un juego es producto de la no existencia del punto silla, para encontrar soluciones optimas ante la inestabilidad del juego, se recurro a las estrategias mixtas.En las combinaciones mixtas los jugadores A y B, pueden jugar todas las estrategias de acuerdo al conjunto de probabilidades (x1,x2,x3,…,xn ) y (y1, y2, y3,…yn) por tanto para el jugador A el Jugador B respectivamente. Para el conjunto de probabilidades, se establece la siguiente ecuación.
∑i=1
m
x i=∑j=1
n
y j=1
x i , y j≥0 , para todai y j
La matriz de pagos, estará estructura con x i e y j , de la siguiente forma:
Donde: a ij Representa el elemento de consecuencia para la matriz de pagos.
Características de las estrategias mixtas
Si el jugador A escoge i y el jugador B escoge j, se genera una consecuencia a ij, donde el jugador A gana a ij, y el jugador B pierde a ij, con esta característica es estructurada la matriz de pagos. Las soluciones óptimas para los dos jugadores estarán descritas de la siguiente forma:
El jugador A, elige x i, quien maximiza el pago esperado de las columnas.
El jugador B, elige y j, quien minimiza el pago esperado de los reglones.
Matemáticamente el criterio minimaz y maximax para las estrategias mixtas esta dado por:
Situación del jugador A
El jugador A selecciona
(x i≥0 ,∑i=1
m
x i=1)para
![Page 5: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/5.jpg)
max x i{min(∑i=1m
ai1 x i ,∑i=1
m
ai2 x i ,…,∑i=1
m
a¿ x i)}……………(1)
Situación del jugador B
El jugador B selecciona
( y j≥0 ,∑j=1
n
y j=1)para
min y j {max(∑j=1n
a j1 y j ,∑j=1
n
a j2 y i ,…,∑j=1
m
aℑ y i)}……………(2)
La ecuación (1) y (2), serán maximin y minimax esperados, para las estrategias debe verificarse la relación.
Pagoesperadominimax≥ Pagoesperadomaximin……………(3)
Enla ecuación (3) si se cumple la igualdad entonces x i e y i corresponden a la solución optima del juego, por consiguiente el valor esperado optimo del juego es:
v¿=∑i=1
m
∑j=1
n
aij x i¿ y j
¿
Para los problemas de juego suma cero de los personas se recurren al análisis por medio de algunas técnicas o métodos de los cuales resuelven estos problemas, entre estas técnicas están:
Dominación Solución grafica Solución algebraica
i. Dominación
Esta técnica permite eliminar filas o columnas ( columnas estratégicas de los jugadores) bajo el concepto de dominación con las siguientes características.
Para el jugador B
Se busca MINIMIZAR LA MAXIMA PERDIDA.
Si la estrategia a ij<aikDonde i=1, 2, 3, …, mPara cualquier valor de j y k j≠k
EntoncesLa estrategia j domina a la estrategia K, por lo tanto puede eliminar toda la estrategia K (la columna).
Para el jugador A
![Page 6: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/6.jpg)
Ecuaciones
Se busca MAXIMIZAR LA MINIMA GANANCIA.
Si la estrategia a ij>a jkDonde j=1, 2, 3, …, nPara cualquier valor de i y k i≠k
EntoncesLa estrategia i domina a la estrategia K, por lo tanto puede eliminar toda la estrategia K (la fila).
La dominación permite reducir la matriz de pagos, eliminando filas y columnas, estrategias del jugador A y B respectivamente, a esta matriz reducida puede aplicarse el punto silla, caso contrario se debe recurrir a otras técnicas para la resolución del juego.
ii. Soluciones Graficas
Esta técnica grafica, se aplica en el caso cuando un jugador tiene 2 estrategias y el otro tiene mas de 2 estrategias es decir, 2xN O Mx2.
Procedimiento del método o técnica grafica para el caso 2 x N
Paso 1Establecer la matriz de pagos con las siguientes características:
Paso 2Establecer los pagos esperados del jugador A y las estrategias puras del jugador B de la siguiente forma.
Estrategias puras del Jugador B Pago esperado del Jugador A12...n
(a11−a21)x1+a21(a12−a22)x1+a22...(a1n−a2n)x1+a2n
Paso 3
![Page 7: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/7.jpg)
Graficas los pagos esperados del jugador A, con las siguientes características:
Paso 4De esta grafica establecer el punto MaxiMin, Maximizar las mínimas ganancias.
Paso 5De la intersección de las rectas MaxiMin (de la grafica) elegir dos ecuaciones y proceder a la resolución para hallar el valor X1.
Análogamente X2=1-X1Paso 6El valor del juego V*, se hallara reemplazando el valor de X1 en cualquiera de las ecuaciones de intersección del grafico.
Paso 7 Finalmente, la estrategia optima del jugador A, será seleccionado entre el valor de X1 y X2 (el de mayor probabilidad).
Procedimiento del método o técnica grafica para el caso M x 2
Análogamente se repite los 3 pasos anteriores.
Paso 4De esta grafica establecer el punto MiniMax, Minimizar las Maximas perdidas, este punto minimaz está debajo de la envolvente superior.
Paso5De la intersección de las rectas MiniMax (de la grafica) elegir dos ecuaciones y proceder a la resolución para hallar el valor de Y1.
Análogamente Y2=1-Y1
Paso 6El valor del juego V*, se hallara reemplazando el valor de Y1 en cualquiera de las ecuaciones de intersección del grafico.
Paso 7Finalmente, la estrategia optima del jugador B, será seleccionado entre el valor de Y1 e Y2 (el de mayor probabilidad)
iii. Soluciones Algebraicas
0 11
3
5
7
9
-3
-1
9
7
5
3
1
-1
-3
Valores de X2 Valores de X1
Valores Del Juego
![Page 8: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/8.jpg)
Estrategia Óptima
Esta técnica algebraica, resuelve juegos con las siguientes características:
No debe existir un punto silla en el juego Y Dos estrategias tanto para el jugador A como para el jugador B.
La matriz de pagos estará estructurada de la siguiente forma:
Para el jugador B, frente a las estrategias de A
(De la matriz de pagos)
Para las estrategias
y1: a11q1+a12q2…………(1)
y1: a21 q1+a22 q2…………(2)
De la igualdad de (1) y (2)
a11q1+a12q2=a21 q1+a22q2…………(3)
Donde
q i≥0 ∀ i=1 ,2
Como q i son probabilidades
Entonces
q1+q2=1………… ..(4)
Finalmente Resolviendo la ecuación (3) y (4) se encuentra los valores de las estrategias del jugador B. Elegir la mayor probabilidad encontrada entre q1 y q2 como estrategia optima para el jugador B
Para el jugador A, frente a las estrategias de B
(De la matriz de pagos)
Para las estrategias
![Page 9: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/9.jpg)
y1: a11 p1+a12 p2………… (1)
y1: a21 p1+a22 p2…………(2)
De la igualdad de (1) y (2)
a11 p1+a12 p2=a21 p1+a22 p2…………(3)
Donde
pi≥0 ∀ i=1 ,2
Como q i son probabilidades
Entonces
p1+ p2=1………… ..(4)
Finalmente Resolviendo la ecuación (3) y (4) se encuentra los valores de las estrategias del jugador A. Elegir la mayor probabilidad encontrada entre p1 y p2 como estrategia optima para el jugador A.
El valor del juego V*
V ¿=¿
4. Problema 1
Un jugador 1 escribe un entero entre 1 y 20 en un trozo de papel. Sin mostrar el trozo de papel al jugador 2. El jugador 1 dice al jugador 2 lo que escribió. El jugador 1 puede mentir o decir la verdad. El jugador 2 tiene que adivinar si el jugador 1 dice la verdad o no. Si lo atrapan en la mentira el jugador 1 debe pagar 10 dólares al jugador 2, si se le acusa falsamente de mentiroso, el jugador 1 recibe 5 dólares del jugador 2. Si el jugador 1 dice la verdad y el jugador 2 adivina que el jugador 1 dice la verdad, entonces el jugador 1 debe pagar un dólar al jugador 2, si el jugador 1 miente y el jugador 2 no lo adivina, el jugador 1 gana 5 dólares al jugador 2. Determine el valor de este juego y la estrategia óptima de cada uno de los jugadores.
Solución:
ReferenciasJugador 1
Escribe un numero entero entre 1 y 20 Puede mentir o decir la verdad
Jugador 2 Puede adivinar o no adivinar
Entonces la matriz de pagos será.
![Page 10: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/10.jpg)
El valor el juego es V*=-1 Existe un punto silla porque el :
MaxiMin=MiniMax
Respuesta:
EL jugador 1 debe jugar a decir la verdad. El jugador 2 debe jugar a adivinar
5. Problema 2Un total de 90000 clientes acuden a los supermercados EDEN Y GLOBAL. Para animar a los clientes a entrar, cada almacén regala un artículo. Cada semana, el artículo de regalo se anuncia en el periódico del lunes. Naturalmente, ninguno de los almacenes conoce que artículo va regalar el otro esa semana. Supermercado EDEN está pensando dar una caja de bebidas o 2 litros de lecha. El Supermercado GLOBAL está pensando regalar un paquete de mantequilla o 2 litros de zumo de naranja. Para cada elección de artículos, el número de clientes que entraran al Supermercado EDÉN durante esa semana aparece en la siguiente tabla. Cada supermercado desea elevar al máximo su número esperado de clientes durante esa semana. Determinar una estrategia optima para cada supermercado y el valor del juego
Solución:
90000 (clientes) asisten a los supermercados Supermercados
- Edén- Global
Calculo del valor del Juego
![Page 11: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/11.jpg)
Sea la matriz de juegos, expresado en número de clientes.
El valor del juego 40000 < V*< 50000
Utilizando en método de solución ALGEBRAICA:
Para el JUGADOR: Supermercado EDEN
a11 p1+a12 p2=a21 p1+a22 p2
40000 p1+60000 p2=50000 p1+30000 p2…………….(1)
p1+ p2=1………… ..(2)
Del sistema de ecuaciones se halla el valor de p1 y p2
p1=34=0.75 , p2=
14=0.25
El valor del juego, reemplazando p1 y p2 en la ecuación (1)
Donde V ¿=50000 p1+30000 p2
V ¿=500000.75+300000.25
V ¿=45000
Para el JUGADOR: Supermercado GLOBAL contra del Jugador: Supermercado EDEN
a11q1+a12q2=a21 q1+a22q2
40000 q1+50000q2=60000q1+30000q2…………..(1)
q1+q2=1……… (2)
Del sistema de ecuaciones se halla el valor de q1 y q2
q1=2000040000
=0.5 , p2=0.5
![Page 12: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/12.jpg)
El valor del juego, reemplazando q1 y q2 en la ecuación (1)
Donde V ¿=40000q1+50000q2
V ¿=400000.5+500000.5
V ¿=45000
Respuesta:
El jugador: Supermercado Edén, debe regalar las bebidas un 75% de las semanas y la leche un 25% de las semanas.
El jugador: Supermercado Global, debe regalar 50% de las semanas (mitad) mantequilla y 50% (la otra mitad) regala zumo de naranja.
Cada jugador espera lograr 45000 clientes, porque el valor del juego es de V*=45000.
6. Problema 3Encuentre la estrategia óptima de cada oponente y el valor del juego.
Solución:Cálculos del valor del juego
El valor del juego 3 <V*< 4
Como no existe un punto silla, se recurre a la técnica de dominación
![Page 13: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/13.jpg)
Aplicando a técnica grafica para el JUGADOR A
Matriz de pagos resultante
Los pagos esperados correspondientes a las estrategias puras de B
Estrategias puras del Jugador B Pagos esperados del Jugador Ay1
y2
y3
-x1 +4 ………..(1)
3x1 +2 ………..(2)
5x1 +1 ……..…(3)
Graficando las rectas Graficas los pagos esperados del jugador A, con las siguientes características:
Del grafico se establece el punto MaxiMin, Para hallar el valor de x1 y x2,se elige cualquiera de las combinaciones de la rectas 1, 2 y 5, porque las tres rectas forman el punto MaxiMin.
0 11
3
5
79
-3
-1
9
7
5
3
1
-1
-3
Valores de X2 Valores de X1
Valores Del Juego
-5-5
MaxiMin
Con la ecuación (1) y (3)
x1+4=5 x1+1
−6 x1=−3
x1=12
Por definición
x2=1−x1=12
El valor del Juego V*
V ¿={ x1+45x1+1
V ¿=x1+4
V ¿=−12
+4
V ¿=3.5
![Page 14: Teoria de Juegos TERMINADO](https://reader036.fdocuments.es/reader036/viewer/2022082408/5571f9e6497959916990b66b/html5/thumbnails/14.jpg)
Luego
Se establece las estrategias para el JUGADOR B
Estrategias puras del Jugador B Pagos esperados del Jugador Ay1
y2
-3y1 +6 ………..(1)
3y1 +1 ………...(2)
Con estos ecuaciones se establece el valor de y1 y y2
Respuesta: El JUGADOR A, debe jugar cualquiera de sus estrategias A(0.5, 0.5). El JUGADOR B, debe jugar la estrategia y1 por ser optima B(0.83, 0, 0.17) El valor del juego es V*=3.5
7. Conclusiones
8. Bibliografía
Con la ecuación (1) y (3)
−3 y1+6=3 y1+1
−6 y1=−5
y1=56
Por definición
y2=1− y1=16
El valor del Juego V*
V ¿={−3 y1+63 y1+1
V ¿=−3 y1+6
V ¿=−3( 56 )+6V ¿=3.5