Equilibrio de Nash

Equilibrio de Nash 1

Equilibrio de NashEl equilibrio de Nash o equilibrio de Cournot o equilibrio de Cournot y Nash o equilibrio del miedo es, en lateoría de los juegos,[1][2] un “concepto de solución” para juegos con dos o más jugadores,[3] el cual asume que:• Cada jugador conoce y ha adoptado su mejor estrategia, y•• Todos conocen las estrategias de los otros.Consecuentemente, cada jugador individual no gana nada modificando su estrategia mientras los otros mantengan lassuyas. Así, cada jugador está ejecutando el mejor "movimiento" que puede dados los movimientos de los demásjugadores.En otras palabras, un equilibrio de Nash es una situación en la cual todos los jugadores han puesto en práctica, ysaben que lo han hecho, una estrategia que maximiza sus ganancias dadas las estrategias de los otros.Consecuentemente, ningún jugador tiene ningún incentivo para modificar individualmente su estrategia.Es importante tener presente que un equilibrio de Nash no implica que se logre el mejor resultado conjunto para losparticipantes, sino sólo el mejor resultado para cada uno de ellos considerados individualmente. Es perfectamenteposible que el resultado fuera mejor para todos si, de alguna manera, los jugadores coordinaran su acción.En términos económicos, es un tipo de equilibrio de competencia imperfecta que describe la situación de variasempresas compitiendo por el mercado de un mismo bien y que pueden elegir cuánto producir para intentarmaximizar su ganancia.

EjemploQuizás el mejor ejemplo de un equilibrio de Nash es la variación del conocido “dilema del prisionero” modificado afin de resaltar los efectos descritos. En esta versión hay varios jugadores (más de tres). El resultado sería mejor paratodos si todos cooperaran entre ellos y no declararan, pero, dado que cada cual persigue su propio interés, y ningunopuede confiar en que nadie declarará, todos deben adoptar la estrategia de declarar, lo que termina en una situación(equilibrio) en la cual cada uno minimiza su posible pérdida.Modificaciones adicionales permiten repetir el juego de forma indefinida (por ejemplo, con los jugadores repartiendoun “botín”, etc.). En todas esas situaciones resulta que la estrategia de no cooperar es la que minimiza el riesgo depérdidas y otorga una ganancia media pero segura para cada jugador individual, pero la cooperación maximizaría laganancia tanto a nivel individual como de grupo.

HistoriaEl concepto de equilibrio de Nash comienza su desarrollo con Antoine Augustin Cournot y su trabajo sobreoligopolios (1838). En éste se plantea el modelo de varias empresas que compiten por el mercado de un mismo bieny que pueden elegir cuánto producir para intentar maximizar su ganancia en función de la producción de las otras. Seestablece un equilibrio de Cournot cuando la producción de cada empresa maximiza sus beneficios, dada laproducción de las otras empresas, lo que es una situación de estrategia pura en el equilibrio de Nash.Los equilibrios de Nash en estrategias puras son limitados en muchos aspectos y fue con el desarrollo de la teoríamoderna de juegos que surgen los equilibrios en estrategias mixtas (aquellas en las que los jugadores pueden elegiraleatoriamente entre varias estrategias). El concepto de equilibrio para este tipo de estrategias fue introducido porJohn von Neumann y Oskar Morgenstern en su libro Theory of Games and Economic Behavior (1944), aunque sólotrataron los equilibrios para el caso especial de juegos de suma cero.Fue John Forbes Nash quien en su tesis de doctorado (1951) define los equilibrios que hoy llevan su nombre, tratando de manera general las estrategias mixtas y demostrando que cualquier juego con un número finito de estrategias tiene al menos un equilibrio de Nash en estrategias mixtas. Nash ganaría posteriormente un premio Nobel

http://es.wikipedia.org/w/index.php?title=Teor%C3%ADa_de_los_juegos

http://es.wikipedia.org/w/index.php?title=Estrategia_%28juegos%29

http://es.wikipedia.org/w/index.php?title=Cooperaci%C3%B3n

http://es.wikipedia.org/w/index.php?title=Economia

http://es.wikipedia.org/w/index.php?title=Equilibrio_econ%C3%B3mico

http://es.wikipedia.org/w/index.php?title=Competencia_imperfecta

http://es.wikipedia.org/w/index.php?title=Mercado

http://es.wikipedia.org/w/index.php?title=Dilema_del_prisionero

http://es.wikipedia.org/w/index.php?title=Antoine_Augustin_Cournot

http://es.wikipedia.org/w/index.php?title=Oligopolio

http://es.wikipedia.org/w/index.php?title=Estrategia_pura

http://es.wikipedia.org/w/index.php?title=Estrategias_mixtas

http://es.wikipedia.org/w/index.php?title=John_von_Neumann

http://es.wikipedia.org/w/index.php?title=Oskar_Morgenstern

http://es.wikipedia.org/w/index.php?title=Theory_of_Games_and_Economic_Behavior

http://es.wikipedia.org/w/index.php?title=John_Forbes_Nash


por la amplia gama de aplicaciones que tuvo este concepto en diversas ramas de las ciencias.Posteriormente se encontraron algunos casos en los que los equilibrios de Nash no llevaban a prediccionestotalmente adecuadas para los comportamientos de los jugadores, o comportamientos estables que no se podíanencontrar como equilibrios de Nash, lo que dio paso a la búsqueda y desarrollo de nuevos equilibrios (muchas vecescomo refinamientos de los equilibrios de Nash) y conceptos de solución de un juego.

Definiciones formalesUn juego rectangular se define como una terna , donde N es el conjunto de jugadores, es elconjunto de estrategias para cada jugador j y

son las llamadas funciones de pago, que a cada conjunto de estrategias (una para cada jugador) le asocia unrespectivo pago al jugador j.

Denotaremos

Por otro lado dado un juego rectangular , decimos que es una estrategia mixta del jugador

j, si para toda , y . El entero denota el número de estrategias puras del

jugador j.Intuitivamente, una estrategia mixta es un vector que asocia cierta probabilidad a cada estrategia pura del jugador j,de ahí que cada entrada tenga que ser no negativa y la suma de todas ellas sea 1.

En una estrategia mixta del jugador j, se interpreta como el peso o probabilidad que el jugador j le asocia a

su estrategia pura .La letra denotará al conjunto de estrategias mixtas del jugador j y M al producto cartesiano de los conjuntos

. A cada elemento de M lo llamaremos un perfil de estrategias mixtas.

Equilibrios en estrategias puras

Dado un juego rectangular , se dice que es un equilibrio de Nash en estrategias puras (ep) sipara cada jugador en N se cumple:

y donde representa el pago para el jugador j cuando éste decide cambiar su estrategia por cualquier otra, mientras que los demás jugadores mantienen la estrategia dada por el perfil σ.

Equilibrios en estrategias mixtasDecimos que un perfil de estrategias mixtas X es un equilibrio de Nash en estrategias mixtas (em) si para cadajugador j∈N se cumple:

Donde es el pago esperado (o pago promedio) que obtendrá el jugador j al jugarse siempre el perfil deestrategias mixtas X.Intuitivamente, un perfil de estrategias mixtas es equilibrio de Nash si, en promedio, ningún jugador puede mejorarsu pago cambiando sus estrategias mixtas cuando el resto de los jugadores se mantenga con la estrategia actual.


Equilibrios de Nash para juegos extensivosA menudo no es posible modelar un problema de la teoría de juegos a través de un juego rectangular y se hacenecesario modelarlo como un juego extensivo. En estos casos pueden buscarse los equilibrios de Nash a través de laforma normal del juego o usando diversos algoritmos en el juego extensivo, como la inducción hacia atrás.

OcurrenciaEn la definición informal de equilibrios de Nash como estrategias estables que los jugadores terminan eligiendo hayfuertes supuestos de racionalidad. A menudo se pasa por alto el hecho de que en un juego los equilibrios de Nash seadoptarán solo bajo ciertas condiciones:1.1. Todos los jugadores buscan maximizar su pago esperado de acuerdo a los pagos que describen el juego.2.2. Los jugadores ejecutan sus estrategias sin errores.3.3. Los jugadores tienen inteligencia suficiente para deducir sus propios equilibrios y los de los demás.4.4. Los jugadores suponen que el hecho de cambiar su propia estrategia no provocará desviaciones en las estrategias

de otros.5.5. Existe un conocimiento común tanto de las reglas como de los supuestos de racionalidad.De este modo, el incumplimiento de alguna de las condiciones puede llevar a desviaciones que resulten enestrategias distintas a los equilibrios de Nash:1. La primera condición no se cumple si el juego no representa correctamente los pagos. Así, el dilema del

prisionero no es tal si uno de los jugadores, contrario a toda racionalidad, busca quedarse el mayor tiempo posibleen prisión.

2.2. Puede acontecer que a la hora de elegir una estrategia los jugadores se vean imposibilitados a llevarla a cabo ensu realización. Así, la segunda condición pide que un jugador sea capaz de implementar su estrategia una vez queha elegido su plan de acción.

3.3. Incluso en personas racionales e inteligentes existen juegos que, debido al poder de cómputo necesario paracalcular sus equilibrios, se ven imposibilitadas a saber qué estrategia deberían seguir. Así, el juego del ajedrez nopuede ser abordado para encontrar soluciones al juego y debido a esto los jugadores tienen que recurrir al ingeniopara intentar vencer al oponente.

4.4. En muchas ocasiones los jugadores no saben exactamente las verdaderas reglas del juego y tienen que deducirlasde la experiencia, en cuyo caso incluso siendo racionales pueden deducir equilibrios que no correspondencompletamente a los equilibrios reales.

Pruebas de existenciaMuchos juegos no tienen equilibrios en estrategias puras, ni siquiera los más sencillos, como por ejemplo el juego depiedra, papel o tijeras.En estrategias mixtas sin embargo se puede asegurar que siempre existen equilibrios. Fue Nash quien demostró quecualquier juego rectangular finito tiene al menos un equilibrio de Nash en estrategias mixtas (em). Inicialmente Nashse basa en la correspondencia de mejor respuesta y el teorema del punto fijo de Kakutani; posteriormente, en su tesisde doctorado dio una nueva demostración basada en la función de reajuste de Nash y el teorema del punto fijo deBrouwer; sin embargo ambas pruebas son de existencia y no constructivas, es decir, aseguran la existencia deequilibrios de Nash, pero no muestran como calcularlos.Fue a finales de los años sesenta que surgieron algoritmos (gracias al trabajo de matemáticos y economistas comoHerbert Scarf, Carlton Lemke y Emanuel Sperner) que permitían calcular eficientemente puntos fijos: el algoritmode Scarf y el lema de Sperner son los dos resultados más importantes que permitieron la prueba constructiva deexistencia de equilibrios de Nash (cabe destacar que ambos resultados son generales y han encontrado una ampliagama de aplicaciones además de la teoría de juegos).

http://es.wikipedia.org/w/index.php?title=Teor%C3%ADa_de_juegos%23Forma_extensiva_de_un_juego

http://es.wikipedia.org/w/index.php?title=Inducci%C3%B3n_hacia_atr%C3%A1s



http://es.wikipedia.org/w/index.php?title=Piedra%2C_papel_o_tijeras

http://es.wikipedia.org/w/index.php?title=Correspondencia_matem%C3%A1tica

http://es.wikipedia.org/w/index.php?title=Mejor_respuesta

http://es.wikipedia.org/w/index.php?title=Teorema_del_punto_fijo_de_Kakutani

http://es.wikipedia.org/w/index.php?title=Funci%C3%B3n_de_reajuste_de_Nash

http://es.wikipedia.org/w/index.php?title=Teorema_del_punto_fijo_de_Brouwer

http://es.wikipedia.org/w/index.php?title=Teorema_del_punto_fijo_de_Brouwer

http://es.wikipedia.org/w/index.php?title=Herbert_Scarf

http://es.wikipedia.org/w/index.php?title=Carlton_Lemke

http://es.wikipedia.org/w/index.php?title=Emanuel_Sperner

http://es.wikipedia.org/w/index.php?title=Algoritmo_de_Scarf

http://es.wikipedia.org/w/index.php?title=Algoritmo_de_Scarf

http://es.wikipedia.org/w/index.php?title=Lema_de_Sperner


Ejemplos

Juego competitivoConsideramos el siguiente juego de dos jugadores:"Los jugadores escogen simultáneamente un número entero entre cero (0) y diez (10). Los dos jugadores ganan elvalor menor en dólares, pero además, si los números son distintos, el que ha escogido el mayor le debe pagar $2 alotro."Este juego tiene un único equilibrio de Nash: ambos jugadores deben escoger cero (0). Cualquier otra estrategiapuede desfavorecer a un jugador si otro escoge un número menor.Si se modifica el juego de modo que los dos jugadores ganen el número escogido si ambos son iguales, y de otromodo no ganen nada, hay 11 equilibrios de Nash distintos.

Juego de coordinaciónEste juego es un juego de coordinación al conducir. Las opciones son: o conducir por la derecha o conducir por laizquierda: 100 significa que no se produce un choque y 0 significa que sí. El primer número en cada celda indica laganancia del primer jugador (cuyas opciones se muestran a la izquierda) y el segundo la ganancia del segundojugador (cuyas opciones se muestran encima).

Conducir por la izquierda: Conducir por la derecha:

Conducir por la izquierda: 100,100 0,0

Conducir por la derecha: 0,0 100,100

En este caso hay dos equilibrios de Nash con estrategias puras, cuando ambos conducen por la derecha o ambosconducen por la izquierda. Esto ayuda a explicar por qué en casi todo el mundo se conduce por el mismo lado (a laderecha) y como en Inglaterra, al ser una isla y no empeorar su pago por no coordinarse con los demás países, semantuvo la estrategia de conducir por la izquierda.

Dilema del prisioneroEl dilema del prisionero tiene un equilibrio de Nash en estrategias puras: se produce cuando ambos jugadoresconfiesan. A pesar de ello, "ambos confiesan" es peor que "ambos cooperan", en el sentido de que el tiempo total decárcel que deben cumplir es mayor. Sin embargo, la estrategia "ambos cooperan" es inestable, ya que un jugadorpuede mejorar su resultado desertando si su oponente mantiene la estrategia de cooperación. Así, "ambos cooperan"no es un equilibrio de Nash pero sí un óptimo paretiano. Una manera de llegar a ese resultado es logrando unacolusión y mediante la promesa de cada jugador de "castigar" al otro si rompe el acuerdo. También podría llegarse auna solución fuera del equilibrio de Nash si el juego se repitiese infinitas veces, cuando se logra la estrategia "ojo porojo".

La tragedia de los comunesLa tragedia de los comunes es una generalización del dilema del prisionero ideada por James Garrett Hardin y publicada por primera vez en su artículo "the tragedy of the commons" (1968). En este juego existen n jugadores que hacen uso de un bien común (como por ejemplo, un terreno comunal). Aunque cada jugador puede participar en el cuidado de este bien (lo que conlleva un costo para el que lo hace), todos los jugadores tienen derecho a usarlo, lo cuiden o no. De este modo tenemos un juego n-personal donde cada jugador tiene dos estrategias: egoísta o solidario, y donde la estrategia egoísta es dominante estricta, es decir, para cualquier perfil de estrategias puras el jugador j puede mejorar su pago si elige la estrategia egoísta en lugar de la solidaria. De este modo, el juego sólo tiene un equilibrio de Nash en estrategias puras y es (egoísta, egoísta,..., egoísta) a pesar de que, como en el dilema


http://es.wikipedia.org/w/index.php?title=Eficiencia_de_Pareto

http://es.wikipedia.org/w/index.php?title=Tragedia_de_los_comunes

http://es.wikipedia.org/w/index.php?title=Garrett_Hardin


del prisionero, el beneficio para cada jugador termina siendo mucho menor que si todos hubieran elegido sersolidarios.Este juego ha encontrado diversas aplicaciones en la vida diaria. Consideremos por ejemplo una ciudad, con caminoslibres de tránsito y contaminación baja como un bien común que todos debemos cuidar. Siempre existe la tentaciónde ser egoísta (usar automóvil particular para mejorar nuestro propio transporte por la ciudad, ignorar semáforos enrojo, etc) a pesar de que si todos siguen la misma estrategia los viales sufren congestionamientos extremos y surge elserio problema de la contaminación ambiental. Debido a que la ruina común es el único equilibrio de Nash, losgobiernos recurren a medidas externas para intentar cambiar los pagos por ser egoísta y llevar a nuevos equilibrios.Así el poner multas a los que no obedecen los reglamentos y encarecer el uso del transporte privado a la vez que semejora el transporte público es una forma de conseguir que la estrategia egoísta deje de ser dominante estricta y quetodas las personas puedan seguir una estrategia solidaria, es decir, como un contrato en un juego cooperativo.

Piedra, papel o tijera

Piedra, papel o tijeras.

Consideremos el juego piedra, papel o tijera con la matriz de pagosdada por:

Piedra Papel Tijera

Piedra 0 -1 +1

Papel +1 0 -1

Tijera -1 +1 0

Supongamos que el jugador 1 juega siempre en estrategias puras, por ejemplo piedra. Entonces el jugador 2 podríasacar ventaja de ello jugando siempre papel. Una mejor respuesta del jugador 1 sería entonces jugar con estrategiasmixtas, es decir, asignarle cierta probabilidad a cada estrategia y en cada jugada elegir aleatoriamente de acuerdo a ladistribución elegida.Puede demostrarse que siempre que haya sesgo en estas probabilidades (es decir, cuando se le asigne másprobabilidad a una estrategia que a otra), el otro jugador puede sacar ventaja de ello y mejorar su pago esperado. Deéste modo, el juego sólo tiene un equilibrio de Nash y es (1/3,1/3,1/3), es decir, jugar con igual probabilidad cadaestrategia (siempre y cuando se mantengan los pagos dados por la matriz).

http://es.wikipedia.org/w/index.php?title=Archivo%3APiedra_papel_tijeras.jpg

http://es.wikipedia.org/w/index.php?title=Piedra%2C_papel_o_tijera

http://es.wikipedia.org/w/index.php?title=Matriz_de_pagos


Referencias[1] Para la definición como "equilibrio de Cournot", véase, por ejemplo: Hermides Martínez A: Teoría de juegos (página 2) (http:/ / www.

monografias. com/ trabajos41/ equilibrio-nash/ equilibrio-nash2. shtml) sección “Equilibrio Nash y óptimo.”[2] Para la definición como "equilibrio de Cournot y Nash", véase, por ejemplo: Elvio Accinelli, Edgard Carrera (2006) : Unicidad del equilibrio

de Nash-Cournot con correspondencias de mejor respuesta contractivas (http:/ / decon. edu. uy/ publica/ 2006/ 1506. pdf)[3][3] Un concepto de solución es una regla formal que predice las estrategias que los participantes adoptarán a fin de obtener los mejores

resultados, prediciendo los resultados del juego.

Bibliografía•• H.S. Bierman, L. Fernández, "Game Theory with Economic Applications", Addison-Wesley, 1993.•• K. Binmore, "Teoría de Juegos", McGraw-Hill, 1994.•• R. Gibbons, "Un Primer Curso de Teoría de Juegos", Antoni Bosh, 1996.• Oskar Morgenstern y John von Neumann, "Theory of Games and Economic Behavior" Princeton University

Press, 1947.•• Zapata L. Paloma, "Economía, Política y Otros Juegos: Una Introducción a los Juegos No Cooperativos", las

prensas de ciencias, 2007.

Enlaces externos• Tesis doctoral de Nash (http:/ / www. princeton. edu/ mudd/ news/ faq/ topics/ Non-Cooperative_Games_Nash.

pdf)• Prueba de existencia de equilibrios de Nash (em) (https:/ / wiki. cc. gatech. edu/ theory/ index. php/

Nash_equilibrium)

http://www.monografias.com/trabajos41/equilibrio-nash/equilibrio-nash2.shtml

http://www.monografias.com/trabajos41/equilibrio-nash/equilibrio-nash2.shtml

http://decon.edu.uy/publica/2006/1506.pdf

http://es.wikipedia.org/w/index.php?title=Theory_of_Games_and_Economic_Behavior

http://www.princeton.edu/mudd/news/faq/topics/Non-Cooperative_Games_Nash.pdf

http://www.princeton.edu/mudd/news/faq/topics/Non-Cooperative_Games_Nash.pdf

https://wiki.cc.gatech.edu/theory/index.php/Nash_equilibrium

https://wiki.cc.gatech.edu/theory/index.php/Nash_equilibrium

Fuentes y contribuyentes del artículo 7

Fuentes y contribuyentes del artículoEquilibrio de Nash Fuente: http://es.wikipedia.org/w/index.php?oldid=74234034 Contribuyentes: .Sergio, Aracne, Arcdare, Armando.Mejia, Byerus, Chalsito, Danielba894, Dnu72, Dodo,Drake 81, Farisori, Grillitus, Guillermo-, Hortelano, Jafol, Jmonzo, Krysthyan, Lnegro, Manuel Valadez Sánchez, Marcmasmiquel, MaxiS123, Natrix, Netito777, Quintanar, Sebasweee, UA31,Urdangaray, Xatufan, 91 ediciones anónimas

Fuentes de imagen, Licencias y contribuyentesArchivo:Piedra papel tijeras.jpg Fuente: http://es.wikipedia.org/w/index.php?title=Archivo:Piedra_papel_tijeras.jpg Licencia: GNU Free Documentation License Contribuyentes:Orgullomoore, Palosirkka, 1 ediciones anónimas

LicenciaCreative Commons Attribution-Share Alike 3.0//creativecommons.org/licenses/by-sa/3.0/

Equilibrio de Nash

Documents

Transcript of Equilibrio de Nash