Gibbons, R. Un primer curso de teoría de juegos. España. Antoni Bosch. 1994

142
GO./lhJ.o 11trnt.f.vt! .s~~iD '. i e 11:1. O:J1J ROBERf GIBBONS Universidad de Cornell ,~- .i UN PRIMER CURSO DE TEORÍA DE JUEGOS TraducCión de Paloma Calvo. y Xavier ViJa Universidad de Northwestern Antoni Bosch O editor t I I & I .J

description

Gibbons, R. Un primer curso de teoría de juegos. España. Antoni Bosch. 1994

Transcript of Gibbons, R. Un primer curso de teoría de juegos. España. Antoni Bosch. 1994

GO./lhJ.o 11trnt.f.vt! .s~~iD '.i

e 11:1.O:J1J

ROBERf GIBBONSUniversidad de Cornell

,~-

. i

UN PRIMER CURSODE TEORÍA DE JUEGOS

TraducCión dePaloma Calvo.y Xavier ViJa

Universidad de Northwestern

Antoni Bosch O editor

tI

I&

I

.J

I,

¡:¡', 'lb'1'(

~/"" l.i5

CONTENIDO

Prefacio IX

"':',','":.

II

L

Publicado por Antoni Bosch, editor!vIanuel Cimna, 61 - 08034 BarcelonaT"i. (-134)93 206 0730 - Fax (+34) 93 206 0731E-mai1: [email protected]://www.antonibosch.com

Título original de la obra:A Primer in Game Theory

@ 1992 by Robert Gibbons<9de b edición en castellano: Antoni Bosch, editor, S.A

ISBN: 84-85855-69-8Depósito legal: B-13.841-2003

Diseño de la cubierta: Facing-bcn

Impresión y encuadernación: Liberdúplex

[mpreso en España / Prinled i/1 Sl'aill

No se permite la reproducción total o parcial de este libro, ni su incorporación a un:,st,ema Illformático, ni su transmisión en cualquier forma o por cualquier medio seaeste electn ' . ,_ " _ '. '

. l mco, mecaruco, reprogranco, gramofolllco u otro, sm el permiso previo ypor escn to del editor.

Juegos estáticos con información completa1.1 Teoría básica: Juegos en'forma normal y equilibrio de Nash

1.1.A Representación de los juegos en forma normally}:-U Eliminación iterativa de las estrategias

estrictamente dominadas2Jr,éFundamentación y definición del equilibrio de Nash

1.2 Aplicaciones1.2.A Modelo de duo polio de Coumot1.2.B Modelo de duo polio de Bertrand1.2.C Arbritraje de oferta final

/ 1.2.D El problema de los ejidos/3 Teoría avanzada: Estrategias mixtas y existencia de

equilibrio1.3.A Estrategias mixtas1.3.B Existencia del equilibrio de Nash

1.4 Lecturas adicionales1.5 é:jercicios1.6 Referencias

2 Juegos dinámicos con información completa2.1 Juegos dinámicos con información completa y perfecta

2.1.A Teoría: Inducción hacia atrás2.1.B El modelo de duopolio de Stackelberg2.1.C Salarios y nivel de empleo en una empresa con fuerte

implantación salarial2.1,D Negociación secuencial

2.2 Juegos en dos etapas con información completa peroimperfecta

12V2

48 v""

1515212327

29/2933/474851

5355';/ /55./59

6266

69

(.

(

"~:.

r;~

a.J

CONTENIDU / Vll

....•.~..

~, .."

VI I CONTENIDO

2.2.A Teoría: Perfección en subjuegos2.2.B Pánico bancario2.2.C Aranceles y competencia internacional imperfecta2.2.D Torneos

2.3 Juegos repetidos2.3.A Teoría: Juegos repetidos en dos etapas2.3.B Teoría: Juegos repetidos infinitamente2.3.C Colusión entre duopolistas de Cournot2.3.D Salarios de eficiencia2.3.E Política monetaria estable en el tiempo

2.4 Juegosdinámicos con información completa peroimperfecta

2.4.A Representación de losjuegos en forma extensiva2.4.B Equilibrio de Nash perfecto en subjuegos

2.5 Lecturas adicionales2.6 Ejercicios2.7 Referencias

3 Juegos estáticos con informacion incompleta3.1 Teoría: juegos bayesiános estáticos y equilibrio bayesiano

de Nash3.l.A Un ejemplo: Competencia a la Cournot bajo

información asimétrica'3.1.B Representación en forma normal de juegos

bayesianos estáticos3.l.C Definición del equilibrio ~~siaI1() <:leNas!Í.

3.2 Aplicaciones - - .--.----.-'3.2.A Revisión de las estrategias mixtas3.2.B Una subasta3.2.C Una subasta doble

3.3 El principio de revelación3.4 Lecturas adicionales3.5 Ejercicios3.6 Referencias

4 Juegos dinámicoscon información incompleta4.1 Introducción al equilibrio bayesiano perfecto4:2 Juegos de señalización,- 4.2.A EqUilibrio bayesiano perfecto en juegos de

señalización

tti

69 '717377808087101106112

11.5 /115122129:/130139

143

144

144

146150152152155159164169169172

175177185

185

4.2.B Señalización en el mercado de trabajo4.2.C Inversión empresarial y estructura de capital4.2.D Política monetaria

4.3 Otras aplicaciones del equilibrio bayesiano perfecto4.3.A Juegos con parloteo (cheap-talk games)4.3.B Negociación sucesiva bajo información asimétrica4.3.C La reputación en el dilema de los presos repetido

finitamente4.4 Refinamientos del equilibrio bayesiano perfecto4.5 Lecturas adicionales4.6 Ejercicios4.7 Referencias

Índice analítico

192

2072JO213213221

227236

248249257

261

j, •

PREFACIO

La teoría de juegos es el estudio de problemas de decisión multipersona-les. Tales problemas se plantean frecuentemente en economía. Como,esbien sabido, por ejemplo, en situaciones de oligopolio se dan típicamenteproblemas de este tipo (cada empresa debe tener en cuenta lo que haránlas demás). Pero muchas otras aplicaciones de teoría de juegos surgenen campos ajenos a la organización industrial. A nivel micro económico,. muchos modelos de intercambio (como los de negociación y de subasta)utilizan teoría de juegos. A un nivel de agregación intermedio, y en elcampo de la economía laboral o de la economía financiera se utiliza lélteoría de juegos en mode!os cJ.ecomportamiento de las empresas en losmercados de factores, o pai~' dilucidar problemas de decisión multiperso~nales dentro de ellas: varios trabajadores compitiendo por un ascenso,v~~rios departamentos compitiendo por unos mismos recursos. Finalmente,al nivel más alto de agregación, en el campo de la economía internacional,se utiliza en modelos en los que los países compiten (o coluden) en susdecisiones arancelarias y, en general, en una política económica exterior;o en macroeconomía, para analizar los resultados de la política monetari!lcuando el gobierno y los agentes que determinan los salaribs o los preciosse comportan estr,atégicamente.

Este libro está conc~bido para presentar la teoría de juegos a quienesmástarde construirán (o, al menos, consumirán) los modelos de la teoríade juegos en los ámbitos aplicados de la economía. Se han procuradoresaltar en él las aplicaciones de la teoría, tanto al menos .como la propiateoría, por tres razones. En primer lugar, porque las aplicaciones ayudana enseñar la teoría. En segundo lugar, porque las aplicaciones ilustran elproceso de construcción de modelos; es decir, el proceso de traducciónde la descripción informal de una determinada situación a un problemaformal de teoría de juegos para ser analizado. En tercer lugar, porquelas diversas aplicaciones permiten comprobar que problemas similaressurgen en áreas diferentes del análisis económico, y que los mismos ins~trumentos de teoría de juegos pueden apliCarse en cada sih¡ación."Para :..

,'.,

x / PREFACIO

subrayar el amplio alcance potencial delos juegos los ejemplos habitualesde organización industrial han sido sustituidos en gran medida por apli-caciones en el ámbito de la economia laboral, de la macroeconomía y deotros campos aplicados detanálisis económico]

Discutiremos cuatro tipos de juegos: juegos estáticos con informacióncompleta, juegos dinámicos con información completa, juegos estáticoscon información incompleta y juegos dinámicos con información incom-pleta. (Un juego tiene información incompleta si un jugador no conoce lasganancias de otro jugador, como ocurre en una subasta cuando uno de loslicitadores no sabe cuánto está dispuesto a pagar otro licitador por el biensubastado.) Correspondiendo a estas cuatro clases de juegos habrá cuatronociones de equilibrio: equilibrio de Nash, equilibrio de Nash perfecto ensubjuegos, equilibrio bayesiano de Nash y equilibrio bayesiano perfecto.

Existen dos maneras (relacionadas) de entender estos conceptos' deequilibrio. Primero, se puéden entender como sucesIones de conceptosde equilibrio cada vez más poderosos, donde las definiciones más podero-sas {es decir, más restrictiva.s) constituyen intentos de eliminar equilibriospoco plausibles permitida'spor nociones de equilibrio más débiles. Ve-remos, por ejemplo, que el equilibrio de Nash perfecto en subjuegos esmás poderoso que el equilibrio de Nash, y que 'el equilibrio bayesianoperfecto es a su vez más poderoso que el eqUilibrio de Nash perfecto ensubjuegos. Segundo, puede afirmarse que el concepto de equilibrio rele-vante es siempre el equilibrio bayesiano perfecto (o quizás un conceptode solución aún más poderoso), aunque éste es equivalente al equilibriode Nash en juegos estáticos con información completa, equivalente a laperfección en subjuegos ~n juegos dInámi~os con información completa (yperfecta) y equivalente al equilibrio bayesiano de Nash en juegos estáticoscon información incompleta ..

Este libro puede utilizarse de dos formas. A los estudiantes de eco-nomía de primer año de doctorado, muchas de las aplicaciones les seránya familiares, por lo que la parte de teoría de juegos se puede cubrir enmedio semestre, dejando muchas de las aplicaciones para ser estudiadasfuera de clase. A los estudiantes de lIcenciatura, conviene presentarlesla teoría un poco más despacio, y clibrir en clase virtualmente todas lasaplic1l;ciones. El prerrequisito matemático fundamental es el cálculo di-ferEáici!il"en"una variable; los rudimeJ1tos de probabilidad y análisis seintroéIucen'a.'medida que se necesitan."~';".~,:.'k:::~:t;;;::,~.::-::,:~:~;~~'~,-;" -

'c,,}' Un~,btÍena fuente de aplicaciones de leoría de juegos en el ámbito de la organizaciónindustrial,es TC9rfa.d~la. organización industrial, de Tirole (Ariel, 1990).';',J •.~;I.~, -~':. : •..~.¥>-.-'~;.~,-.~~."..:\~.~-

Prefacio / XI

Aprendí teoría de juegos con David Kreps, John Roberts y Bob Wilsondurante mis estudios de doctorado, y con Adam Brandemburger, DrewFudenberg y Jean Tirole más adelante. A ellos debo la parte. teórica el: e:telibro. El énfasis en las aplicaciones y otros aspectos del estIlo pedagoglcodel libro, en cambio, se los debo en gran parte a los estudiantes del de-partamento de economía del M.l.I. quienes, de 19~5 a 1990, inspiraron ymoldearon los cursos que han culminado en este lIbro. Estoy muy agra-decido a todos estos amigos por las ideas que han compartido conmigoy el estímulo que siempre me han otorgado, así com? ~or los numerososcomentarios útiles al borrador del libro que he reCIbIdo de Joe Farrell ,Milt Harris, George Mailath, Matthew Rabin, Andy Weiss y varios éríticosanónimos. Finalmente, me complace reconocer los consejos y apoyo quehe recibido de Jack Repcheck de Princeton University Press y la ayuda fi-nanciera de una beca Olin en economía del National Bureau of EconOlnicResearch.

\'

1. JUEGOS ESTÁTICOS

CON INFORMACIÓN COMPLETA

\

:";

"

;".En este capítulo consideramos juegos simples de la siguiente forma::pri-mero los jugadores forman decisiones simultáneamente; abjntfutiációñreciben sus ganancias, que depénden de la combinación de,ac.ciones'que ,acaban de elegir, Dentro de la clase de estos juegos estáticos (o'de(fecrsióhsimultánea), restringimos nuestra atención a los jueg~s 'ton :iri¡oi-mai:íó~ '".,' (completa. Es decir, la' ftrnciórr.de ganancias de cadajugá~bi";:~k).fiif¡cip~~'jt\~c~~~I¿t.rque determina la ganancia de cada jugador a partir déIaéoinbiíiáé:t:cr'Lc:. '.?(.,

de acciones elegidas por los jugadores) es corú)dd'áfp6í:'10s'íJg'aq , 'Estudiamos los juegos dinámicos (o de toma'de. dedsioIi.eS'~ticeSivlfJ,',los capítulos 2 y 4, Y los' j~egos con' informaci6riiriéOmpl~ti'(jt~gt~J'¡J¡:c"~.,los cuales aI~n' jugáaorno esta segUro' de la funCión,:de:g'aniiliCi~',"'... , ," ,;<"fLotr~ j~gador, como ocurre en ~I1asubasta en.la cual lo q~e ca~~Ii?t~~~~fo;:~fi:,,:.;:~:¡fi.;.esta dIspuesto a pagar por el bIen subastacl.oes desconoCldo'pOr:rbS:0tro.S,:.'7,;~':;,;;,::~::}.licitadores) en los capítulos 3 y 4. 'ú;~;:jJ1.j;:)1:;~i\i;<~\':~.':~.j.~t.

En la sección 1.1 entramos en las dos cuestiones básicas de la tebrí~~de':i:.\.;i:.t"~t'juegos: cómo describir un j~~g9,tsó,mo res~fYrE,~tR[?,bJ?~~4iJ~~~ttg£""de juegos resultante. Con este fin describimos los instrumentos que,t,ití::~::~\i..,;::ilizaremos para analizar los juegos estáticos con informacióncompletáJ;,y!<:'sentaremos las' bases de la teoría que utilizaremos para analizar jue'gosmás ricos en capítulos posteriores. Definimos tambiénJa repre.se:r¡tacÍljn,e11forma normal de un juego y la noción de estrategia estrictamerzteti9mi.~Demostramos ,que algunos juegos pueden resolverse mediq,nteja.; ªR1i;'cación de la idea de que los jugadores racionales no utiUzarlestr~te~ 'estrictamente dominadas, pero también que en otros 'juegos' est~',e&:~que da lugar a predicciones muy imprecisas sobre el desarrollode1jÍj~o '(algunas veces tan imprecisa como la afirmación de q\le,"cuaIquiercqsª,puede ocurrir"), Después, definimos el equilibrio de Nash,un concept2i.d~':",,~.,solución que da pie a predicciones mucho más precisas,en una clase:j:l~:'>';juegos muy amplia. - ",,:, .. " >::c~':~~'

2 I JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1) 7eoría básica: luegos en {arma/normal y equilibrio de Nas/¡ I 3

El dilema de los presos

-1,-1 -J,Q-(Ü,'--c

.',9 (6'-6".. "\ -~'-

serán sentenciados a seis meses de cárcel. Finalmente, si uno confiesa y elotro no, el que confiesa será puesto en libertad inmediatamente y el otroserá sentenciado a nueve meses en prisión, seis por el delito y tres máspor obstFUccióna la justicia.

El problema de los presos puede representarse mediante la siguientematriz binaria. (Como matriz, una matriz binaria puede tener un núrneroarbitrario de filas y columnas; binaria se refiere al hecho de que en unjuego de dos jugadores hay dos números en cada casilla, las ganancias delos dos jugadores).

Confesar

Preso 2Callarse Confesar

Preso 1Callárse

En este juego, cada jugador cuenta con dos estrategias posibles: confe~sar y no confesar. Las ganancias de los dos jugadores cuando eligen un parconcreto de estrategias aparecen en la casilla correspondiente-de la ma~triz binaria. Por convención, la ganancia del llamado jugador-fila (aquí el.

• preso,l) es la primera, ganancia, seguida, po~:la.gananciadeL jugador:,:columna (aquí el preso 2). Por eso, si por.ejemp~o;el pre~oJ elige caUar.y.el preso 2 elige confesar, el preso 1 recibe una ganancia de-9(que repre,senta nueve, meses en prisión) y el preso 2 recibe una gananCia de O (querepresenta la inmediata puesta en libertad),

Ahora abordamos el caso generaL .La representación en forma normalde un juego especifica: (1) los jugadores en el juego, (2) las estrategiasde que dispone cada jugador y (3) la ganancia de cada jugador en cadacombinación posible de estrategias. A menudo discutiremos juegos conun número n de jugadores, enlos cuales los jugadores están numerados de1 a n y ~ jugadºL~bitrari~~s denominad.o_p;.g;do:r-i:)SeGei~onjuntode estrategias con que cuenta el jugador i (llamado espacio de estrategia1de i), y sea Si un elemento arbitrario de este conjunto. (Ocasionahnetí'ieescribiremos si E Si rara indicar que la estrategia Si es uh elementodel conjunto Si.)Sea (sI,'" ,sn) una combin'ación de estrategias, una para;

¡< ,y.,

~. ,

1.1.ARepresentación de los juegos en forma normal

1.1Teoría básica: Juegos en forma normal y equilibrio de Nash

En la sección 1.2, utilizando los instrumentos desarrollados en lasección previa, analizamos cuatro aplicaciones: el modelo de competenciaimperfecta de Coumot (1838), el modelo de competencia imperfecta deBertrand (1883), el modelo de arbitraje de oferta final de Farber (1980)y el problema de los ejidos (discutido por Hume [1739] y otros). Encada aplicación, en primer lugar traducimos la descripción informal delproblema a una representación en la forma normal del juego y despuéshallamos su equilibrio de Nash. (Cada una de estas aplicaciones tiene unúnico equilibrio de Nash, pero discutimos ejemplos en los cuajes esto noocurre.)

En la sección 1.3 volvemos a la teoría. En primer lugar definimos lanoción de estrategia mixta, que interpretamos en términos d.-ela falta de cer-teza de un jugador con respecto a lo que otro jugador hará. Seguidamente,enunciamos y discutimos el teorema de Nash (1950),el cual garantiza queun equilibrio de Nash (que puede incluir estrategias mixtas) existe en unaamplia clase de juegos. Puesto que presentamos primero la teoría bá-sica en la sección 1.1, las aplicaciones en la sección 1.2 y, finalmente, másteoría en la sección 1.3, resulta evidente que el conocimiento de la teoríaincluida en la sección 1.3 no constituye un requisito para entender lasaplicaciones de la sección 1.2. Por otra parte, la idea de estrategia mixta yla exis'tencia de equilibrio aparecen (ocasionalmente) en capítulos poste-riores.

Cada capítulo concluye con ejercicios, sugerencias de ,lectura adicionaly referencias.

En la representación de un juego en forma normal cada jugador elige deforma simultánea una estrategia, y la combinación de las estrategias ele~gidas por los jugadores determina la ganancia de cada jugador. Vamosa ilustrar la representación en forma normal con un ejemplo clásico; eldel dilema de los presos. Dos sospechosos son arrestados y acusados deun: delltoo"rta policía no tiene evidencia suficiente para condenar a lossósp€éh:osOs,a menos que uno confiese.. La policía encierra a los sospe::';~osCJse!t"~~Idasseparadas y les explica las consecuencias derivadas de las. \Íedsionés" que formen. Sininguno confiesa, ambos serán condenados porun delito menor sentenciados a un mes de cárcel. Si ambos, confiesan~

,-.:.,'

<l/JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (c. 1)

cada jugador, y seaUi la función de ganancias del jugador i: '!ti(sl, ,sn) esla ganancia del jugador i si los jugadores eligen las estrategias (SI, ,sn)'Compilando toda esta información tenemos:

Teoría básica: Jllegos en formal normal y eqllilibrio de Nash I 5

siempre que T > R > P > I, para plasmar las ideas de ganancias detentación, recompensa, penalización e ingenuidad. De forma más general:

.."::':.'

1:::.-

1::::--

Los jugadores racionales no utilizan estrategias estrictamente domina-das, puesto que bajo ninguna conjetura que un jugador pudiera formarsesobre las estrategias que elegirán los demás jugadores sería óptimo utili-zar tales estrategias. 1.Así, en el dilema de los presos, un jugador racionalelegirá confesar, por lo que (confesar, confesar) será el resultado alque lle-:gan dos jugadores racionales, incluso cuando (confesar, confesar) suponeunas ganancias peores para ambos jugadores que (callar, callar). Comoel dilema de los presos tiene múltiples aplicaciones (que incluyen la ca-rrera de armamentos y el problema del polizón en la provisión de bienespúblicos) trataremos variantes del juego en los capítulos 2 y 4. Por ahoranos centraremos más bien en si la idea de que jugadores racionales no uti-lizan estrategias estrictamente dominadas puede conducir a la soluciónde otros juegos.

Consideremos el juego abstracto de la figura 1.1.1.2El jugador 1 tienedos estrategias y el jugador 2 tiene 3: Sr = {alta, baja} y S2 = {izquierda,centro, derecha}. Para el jugador 1, ni alta ni baja están estrictamente

Definición. En el juego en forma normal G = {SI, ... ,Sn;Ul, ... ,lln}, sean s;y s;' posibles estrategias del jugador i (por ejemplo, s; y s;' son elementos de Si).La estrategia s; está estrictamente dominada por la estrategia s;' si para cadacombinación posible de las estrategias de los restantes jugadores la ganancia de ipor utilizar si es estrictamente menor que la ganancia de i por utilizar s;':

para cada (sIr' .. ,Si-l,Si+l,' .. ,sn) que puede ser construida a partir de los espa-cios de estrategias de los otros jugadores SI,'" ,Si~l,Si+l, ... ,Sn'

1 Una cuestión complementaria también tiene interés: si no existe una conjetura que'eljugador i pueda formarse sobre las estrategias de los demás jugadores, que haga óptimo elegirla estrategia Si, ¿podemos concluir que debe existir otra estrategia que domine estrictamente as.;? L;'respuésta es afirmativa, siempre que adoptemos definidones adecuadas de "conj~tura';y de "otra estrategia", términos que incluyen la idea de estrategias mixtas que introduciremosen la secdón 1.3.A.

2 La mayor parte de este libro considera aplicaciones económicas más:que ejemplosabstractos, tanto porque las aplicaciones Son de interés por sí mismas como porque, pa~~..múchos lectores, las aplicaciones son a menudo un modo útil de explicar la teoría subyacente:;',Sin embargo, cuando introduzcamos algunas ideas teóricas básicas, recurriremos a.eJe~p]' .. ,abstractos sin una interpretación económica directa. ¡. ,".t,l"

Definición. La representación en forma nonnal de un juego con n jugadoresespecifica los espacios de estrategias de los jugadores SI,' .. ,Sn y sus funcionesde ganancias '!tI, ... ¡Un. Denotamos este juego con G = {SI, ... ,SIl;Ul, ... ¡Un}.

Después de describir un modo de representar un juego, ahora vamof? aesbozar una forma de resolver un problema de-teoríadejuegos. Empe-zamos con el dilemá de los presos, porque es fácil de resolver utilizandoúnicamente la idea de que un jugador racional no utilizará una estrategiaestrictamente dominada ..

En el dilema de los presos, si un sospechoso va a confesar, sería mejorpara el otro confesar y con ello ir a la cárcel seis meses, en lugar de callarsey pasar nueve meses en prisión. Del mismo modor'siun sospechoso va acallarse, para el otro sería mejor confesarycon el~os~r puesto en libertadinmediatamente en lugar de callarse y permanecer en prisión duranteun mes. Así, para el preso i, la estrategia de callarse está dominadapor la de confesar: para cada estrategia que el preso j puede elegir, laganancia del pnsionero i es menor si se calla que si cónfiesa. (Lo mismoocurriría en cualqUier matriz binaria en la cual las ganancias 0, "--:1; -6Y-9 fueran reemplazadas por las ganancias T,R,P ePiespectivamente,

Aunque hemos indicado que en un juego en forma norm~llos juga-dores eligen sus estrategias de forma simultánea, esto no significa que laspartes actúen necesariamente de fonna simultánea. Es suficiente que cadaparte elija la acción a seguir sin conocer las decisiones de los demás, comosería aquí el caso si los presos tomasen una decisión en momentos arbitra-TÍosen sus celdas separadas. Además, aunque en este capítulo utilizamosjuegos en forma normal para representar solamente juegos estáticos enlos cuales los jugadores actúan todos sin conocer las decisiones de losdemás jugadores, veremos en el capítulo 2 que las representaciones enforma normal pueden darse en juegos con tomas de decisión sucesivas,pero también que una alternativa, la representación en fonna extensiva deljuego, es a menudo un marco de trabajo más conveniente para analizarlos aspectos diná,IIri,cosde los juegos.

1.1.B EliminaciÓn iterativa de estrategias estrictamente dominadas tl '::~

6 / JUEGOS ESTÁTICOS CON INFOR.MAClÓN COMPLETA (e. 1) Teoría básica: fuegos en formal nonnal y equilibrio de Nas/¡ / 7

dominadas: alta es mejor que baja si 2 elige izquierda (porque 1 es mayorque O),pero baja es mejor que alta si 2 elige derecha (porque 2 es mayorque cero),

Jugador 2

Izquierda Centro

¡j

Alta 1__ 1_,0 1_,2_

Figura 1.1.3

Jugador 1

Este proceso se denomina eliminación iterativa de las estrategias estric-tamente dominadas. Aunque está basado en la atractiva idea de que losjugadores racionales no, utilizan estrategias estrictamente dominadas, elproceso presenta dos inconvenientes. En primer lugar, cada paso requiereun supuesto adicional sobre lo que los jugadores saben acerca de la ra-cionalidad del otro. Si queremos ser capaces de aplicar el proceso pataun ntÍmero arbitrario de pasos, neceSitamos suponer que es informació11del dominio público que los jugadores son racionales. Esto es, necesitamossuponer no sólo que todos los jugadores son racionales, sino también quetodos lbs jugadores saben que todos los jugadores son racionales, y quetodos los jugadores saben que todos los jugadores saben que todos I~sjugadores son racionales, y así ad infil1itUt1l (véase la defihición fomiaI deinformación del dominio público en Aumaim [1976]). ;

La segunda desventaja de la eliminación iterativa de estrategias estric-tamente dominadas es que el proceso conduce a menudo a una prediCdó'riimprecisa sobre el desarrollo del juego. Por ejemplo~ consideremos eljuego de la figura 1.1.4. En-estejuego no hay estrategias estrictamente do-minadas para ser eliminadas. (Puesto que no hemos fun'darnéltado estéjuego en absoluto, al lector puede parecerle' arbitrario 'oinclusopafokígico.Para una aplicación económica en el mismo sentido, véase el caso de treso más empresas en el modelo de Cournot incluido en la sección 1.2.A)Puesto que todas las estrategias en el juego sobreviven a la eliminacióniterativa de las estrategias estrictamente dominadas, el proceso no permiteninguna predicción sobre el desarrollo del juego.

Figura 1.1.4

,I (j D

'A 0.4. ,0 .~\3M .1!i) 0,.4',5,3

B. 3,5 3,5 6.6

..1l

,':.~'

, 1-

"1,0 12 , 0,1

0,3 0,1 20

Aita "'1,0 '1,2'!~gador 1

,"

Baja' 0,3 0,1

']iigadór2

Izquierda Centro

:¡AltaJugador1

Jugador 2

Izquierda' Centro Derecha

Figura Í.1.1

Sin embargo, para el jugador 2, derecha está estrictamente dominadapor centro (porque 2 es mayo~ que 1 y 1 es mayor que O),por laque unjugador racional 2 n{) elégiiá,:derecJ:¡.a. Así, si el jugador 1 sabe que eljugador 2 es racionatjjúedeeliminar derecha del espacio de estrategiasdel jugador 2., Esto. es, si el jugador 1 sabe que el jugador 2 es ~~cional,puede comportarse en eLjuegode la figura 1.1.1 como si estuviera ell eljuego de la figura 1.1.2.

Baja

Figura 1.1.2

En lafigur~ 1.1.2, baja está ahora estrictamente dominada: por altaBaJ;il,eljugadoiJ,.así que si el jugador 1 es rac,ional(y.eljugador lsabeque el jugador 2es racional, parlo que se aplica el juego de la figura 1:12)hóceIegfr~baja~ Por eso; si el jugador 2 sabe que el fugador1, es :aciortal;

:y~'~]ug~5t?Fisabe que el jugador 1 sabe qt]e. el jugador 2 es racional(pÓt'16~ueeí]tigador 2sabe que se aplica la figura 1.1.2),,el jugador 2

. p€eae:~~arl)aja delespacio de estrategias del jugador 1, quedando el.:.••...P.t~6"c8ffi'o'ii1dicálafigura 1.1:3:Péro ahora, izquüú\:la 'está estrictamente

'::;.;;" :~,r,.\~:,;,:"=t:_(dr"!'i-'~~d'tlt-;N~;t':-/:¡;..¡:-__. ,." : ,:',' , , .

"': .."";.;~£l~J?¿f¡;~~!Ip,.parael jugador 2, quedando (alta, centro) como el

,.ó"~';~;"~~V..:,f.~,•..J~~r~~#ft."'. . -'~;. x" ,l'"

",í'

\~,'

';":'~'. '

,~,"'.'

8/ jUECOS ESTATICOS CON INFORMACIÓN COMPLETA (e. 1)Teoría básica: Juegos en formal nonnai y equilibrio de Nash / 9

"', I

,\'

Para relacionar esta definición con su fundamerltación anterior, su-pongamos que la teoría de juegos ofrece las estrategias (s~, ,s~) comola solución al juego en forma normal G =: {SI, ... ,Sn; 'Ul, ,un}' Decirque (s~, ... ,s~) no constituyen un equilibrio de Nash de G es equivalentea decir que existe algún jugador 'i tal que si no es la mejor respuesta a( / / / /') E " 1 11 S ,.sl, ... ,si_l,si+I, ... ,sn' sto es, eXIstea guna S'i en ,italque,.,

Así, si la teoría ofrece las estrategias (s~, ... ,s~) como la solttdón pero estasestrategias no constituyen un equilibrio de Nash, al menos un jugadortendrá un incentivo para desviarse de la predicción de la teoría, con loque la teoría quedará desin~~tida por el desarrollo conCreto del juego.Otra fundamentación muy parecida del equilibrio de Nash incorpora laidea de convenio: si surge un acuerdo sobre cómo comportarse en undeterminado juego, las estrategias fijadas por el convenio deben formarun equil~bri~ de Nash;si no,-habrá al menos un jugador que no se regirápor ~l,i:onv~nio. '. ' .

Para concretar, vamos a resolver unos cuantos ejemplos. COrisider~moslos tr~-~eg~s en forma normal ya descritos: el dileIT;,adelos p~es~~y los de ia~j{iuras 1.1.1. y 1.1.4. Una forma torpe de hallar los équili~

f •.•.. , . , ""

brios de Nash en un juego consiste simplemente en comprobar si cadacombinación p~sible.de estTat~gias satisface la condición'(EN) en la defi~nicióI1}En un juego de dos jugadores, esta forma dehélllarlos eqtrilibriosco~~~ádel modo siguiente: para cada jugador y pa"rac~da estrate¡páposible ~onla que cuenta cada j"ugador se determina la mejo~resp~éstadel 'otro 'juga.dora-ésa estrategia. En la figura 1.1.5se representa esto enel caso del juego definido en 1.1.4, subrayando la ganancia de la mejorrespuesta del jugador j a cada una de las posibles estrategias del jugadori: Sj el jugador columna fuera a jugar 1, por ejemplo, la mejor respuestadel jugador fila sería M, puesto que 4 es mayor que 3 y que O; por eÚo,la gananCia q~e 4)é proporciona al jugador fila en la casilla (M,I) de lámatriz binaria está subrayada.

3 En la sección 1.3.A vamos a distinguir entre estrategias puras, y mixtas. Después vamosa ver que la definición dada aquí describe equilibrios de Nash en estrategias puras, peroque también puede haber equilibrios de Nash en estrategias mixtas. A menos que se.señale'explícitamente de otro modo. todas las referencias'a los equilibrios de Nash en esta secció~.,~~Crefieren a equilibrios de Nash en estrategias puras.

(EN)

Una manera de fundamentar la definición del equilibrio de Nas1:l.~~elargumento de q~e silateoría de juegos ofrece un~ solu<:iÓIlúrlica a undeterminado P\9plerna" esta solución debe ser,un equilibJ:i<;>9-c~._~a~!:u~nel,siguiel1te sellti4o:, Supongamos que la Jeona de jlleg~~h~~ ~,~!:lÍ,~~predicción sobre las estrategias elegidas por los jllgadores. Pilr<).que eStapredicción sea correcta es necesario que cadajug?!~oresté d~puesto aelegir la'estrat~g¡a.p~edicha por la teoría. Por ello, la estrategiapredi~cha de cada jugador, debe ser la mejor respuesta de cada jugador. a)asestrategias pre~ichas. de los otros jugadores. Tal predicc~ón puede d~~o-minarse estratégicame~teestable o self-enforcing, puesto que ningún jugadorva a qUeJ;erdesviarse de la estr¡itegi.apredicha paril é}. Llamaremosatalpredicción equilib.rio de Nash:

A continuación abordamos el equilibrio de Nash, un concepto de so-lución que da lugar a predicciones mucho más precisas en una clase dejuegos muy amplia. Demostramos que el equilibrio de Nash es un cOn-cepto ~iesoluc(ónmás poderoso que la_e.liminacióniterativa de las.estra~tegias estrictamente.dominadas, en el sentido 'de que las estrategias de losjugadores en un equilibrio de Nash siempre sobreviven a la eliminacióniterativa de las estrategias estrictamente domin<).das,~osa que no ocurrea la inversa. En los capítulos siguientes argmnentareinos que, en juegosmás dcos, incluso el equilibrio de Nash da lugar p. predicciones demasiadoimpn;cjsas sobre el desarrollo. del juego, por lo que definiIemos nocionesde equilibdo aún más poderosas, más adecuadas para estos casos. ,,"

", ..

1.1.CFundamentación y definición del equilibrio de Nash

para cada posible estrategia Si en Si; esto es, si es l/na solución de

Definición. En el juego en forma normal de n jugadores, G,=J SI,.~. ,Sn; Ul,

... ,un}, las fstrategías(;}, ... ,s;,) forman un equilibrio de Nasft si, para cadajllgadrri, sr~es.la mejor respuesta del jugador i (o al menos una di?:ell(ls) {dasestrategias de los otros n - 1jugadores, (si, ... ,S7_1,s7+1' '" ,s~):

L •

la/JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (el) TeorIa básica: Jllegos ell forma/Ilormal y equilibrio de Nas" / ]]

Figura 1.1.5

1 e D

s En inglés, los diminutivos Pat y Chris pueden referirse tanto a nombres masculinos(Patrick y Christopher) como femeninos (Patricia y Christinal. (N. de los T.)

equilibrio de Nash. Para ver esto último recordemos que en la figura 1.1.4,el equilibri.? de Nash ofrece una única predicción C8,D), mientrélS que laeliminación iterativa de las estrategias estrictamente dominadas ofreceuna predicción con el mayor grado de imprecisión posible: no se eliminaninguna.estrategia; puede ocurrir cUéllquiercosa.

Tras demostrar que el equilibrio de Nash es un concepto de soluciónmás poderoso que la eliminación iterativa de las estrategias estrictamentedominadas tenemos que preguntarnos si el equilibrio de Nash no es unconcepto de solución demasiado poderoso. Esto es ¿podemos estar se-guros de que el equilibrio de Nash existe? Nash (1950) dem\Jstiá que encualquier juego finito (por ejemplo, un juego en el cual el nun1ero n dejugadores y los conjuntos de estrategias SI,' .. ,Sn son todos finitos) existeal menos un equilibrio de Nash. (Este equilibrio puede~!1Cluirestréltegiasmixtas, que discutiremos en la sección 1.3.A. Paraun J~unciado precisodel teorema de Nash véase la sección 1.3.B.) COUlnot (1838) propuso lamisma noción de equilibrio en el contexto deÍlJ1 modelo particular deduo polio y demostró (por construcción) que existe un equilibrio en estemodelo; véase la sección 1.2.A. En cada aplicación anaÜzada en este libro,seguiremos el ejemplo de Cqumot: demostraremo~ q~e existe un equi-Jibrio de Nash (o más poderoso) mediante la construcéión de uno. En.algunas secciones teóricas, no obstante, utilizaremo~ el teorema de Nash(o su análogo para conceptos de equilibrio más poderosos) y simplementediremos que existe un equilibrio. .,

Conclullnos esta sección con otro ejemplo clásico, la bat~lla de los sexos.Este ejemplo muestra que un juego puede tener múltipl~~equl1i'GriosaeNásh, y también será útil en las discusiones sob~~~stTategias mixtas de lassecciones 1.3.B y 3.2.A. En la exposición tradicionáldel juego (que, quedeclaro, data de los años cincuenta), un hombre y una mujer están tratandode decidir qué harán esta noche; nosotros analizarnos uha versión deljuego que no tiene en cuenta el sexo de los participantes} En lugaresde trabajo sep¡:¡rados, Paty Chris deben elegir entre ir a.'la ópera' o éluncombate de boxeo.. Arn,bos(as) jugéldores(as) preferirían pasar la nochejuntos(as), pero Pat preferiría estar juntos(as) en el boxeo, mientras queChris preferiría estar juntos(as) en la ópera, tal como representamos en lamatriz binaria que sigue:

, .

0,1- 1-;0 5,3

1,0 0,1- 5,3

3,5 3,5 º'~

Un par de estrategias satisface la condición (EN) si la estrategia decada jugador es la mejor respuesta a la del otro, es decir, si ambas ganan-cias estáÍr subrayadas en la casilla correspondiente de la matriz binaria.

. Por ello C8,D) es el único par de estrategia~ que satisface (EN). Lo mismoocurre para (confesar, confesar) en el dilema de los presos y para (alta, cen-tro)en la figura'1.1.1. Estos pares de estratégias son los únicos equilibriosde Nash dé estos juegos.4

A continuación tratamos larel~dón entre el equili1:Jri2=c1..~l':fª-sh y la, eliminación iterativa de las estrategias estrictamente dominadas. Recor-

demos que las estrategias de equilibrio de Násh én el dilema de los presosyen1a figUra1.P -:-(col1fesar,confésar) y (álta, éentro)respectivamenfee-sorilas únicas estrategias 'que sobreviven a la eliminación iterativa de lasestrategias estrictamente dominadas. Este resultado puecl.egeneralizarse:si la ~lirniÍ1.aciónih;;rativa de las estrategias estrictamente dominadas eli-mina tbdas las estrategias ~'enos las estrategias' (si, ... ,<), estas esfrate-giasconstituyen el único equilibrio de Nash del juego. (Véase el apéndicepara'una demostració'n de esta aflnnación.) Sin embargo, puesto que laeliminación iterativa de las estrategias estrictamente dominadas éoÍl fre-cuencia no elimina más que una combinación de estrategias, es del máximoin~erés el hecho de que elequilibno déNáshsea un concepto de soluCiónmás poderoso que la eliminaCi6n iterativa de las estrategias estrictamentedominadas en el siguiente sentido: si las estrategias si, ... ,s~ constituyeniÚl"equilibrio de Nash, sobreviven a la eliminación iterativa de las estra-tegias,estrictamenté dominadas (véase apéndiee para una demostración),pero pueden existir estrategias que sobrevivan a la eliminación iterativa deelitrategi~s,estrictamente dominadas pero que no formen parte de ningún

"t;Ut~{'~,\~J~~~t.:h~~\1i'\~~;;-\:c:..', -, . :' " .

..;"",4:EstÍlafumadón es correcta incluso si no limitamos nuestra atendón al equilibrio de Nash,'en:estx:~tegiaspuras; puesto que en estOs juegos no existen equilibrios de Nash en estrategias

i>''''fuíXta&:Yéasee! ejercido 1.10. :. ','. .'-';)';".;' '.'

lA

M

B

:,.,,>'

. ,~'

'..:::;:;

12/ JUEGOS ESr,\rICOS CON INFOIUvlACJÓN COMPLETA (e. 1)

Pat

Ópera Boxeo

Ópera ?,l 0,0Chris

Boxeo 0,01,~

La batalla de los sexos

Ambos, (ópera, ópera) y (boxeo, boxeo) son equilibrios de Nash:Hemos argumentado antes que"si la teorladejuegos ofrece una única

solución a un juego, ésta debe ser un equilibiio de Nash. Este argumentoignora la posibilidad de juegos en los cuales la teoría de juegos no' ofreceuna solución única. También hemos argumentado que si se llega a unª<;:ut:!"¡jg._~º.º!~_~~mocomportarse en un juego, las éstrategias establecidos.t:!l tiªmergQ _d~~~~_se¡:-ú~.t:g~lliPJi~2=~~:~E!' I?~!~._e?t~.a~~~~~h>7alig~~!que eLª~t~r.i~!,ignoral~ p_~~i!?ili9.él~.~ejuegospara los cuaiés7~se-_a!cance un -élc.~~~'!.<:¡Eña[gÚnSJsj~~g~~~º~múItipl~s'éCiciiil)riós~~f~"'Ñasl1'.s()~~~sa!e_~~_~9,~~~Lb!2~.~o..mo)asol~.~iónmás atT'a5.~Yª.9~lj~o:l'C¥anparte de la teoría de los capítulos posterl.oresci:mstÜuye'u~ esfu';Z'opa;á .identificar este equilibrio más atractivo en diferentes clases de juegos.)Así, la existe.n.ciade múltiples equilibrios de Nash no es un problema ensí mismo. Sin embargo, en la batalla de los sexos, (ópera, ópera) y (boxeo,boxeo) parecen iguahnente atractivos, lo que indica quepuééien eXistirjuegos para los cuales la teoría de juegos no ofrece una"soluciÓr{única yen los que no se llegará a ningún acuerdo.6 En tales juegos, el equilibriode Nash pierde gran parte de su atractivo como predicción del juego.

6 E l .-. n a secaon 1.3.B describimos un tercer equilibrio de Nash (que incluye estrategiasnuxtas) en la batalla de los sexos. Al contrario que (ópera,ópera) y (boxeo,boxeo), este tercer.eqUlhbno ofrece ganandas simétricas, como se podria esperar de la solución única a un juegosunetnco. Por otro lado, el tercer equilibrio es también ineficiente, lo cual puede influir encontra de que se llegue a un acuerdo para alcanzarlo. Cualquiera que sea nuestro juicio sobrelos eqUllibnos de Nash en la batalla de los sexos, la cuestión sigue en pie: pueden existirJuegos para l~s cuales la teoría de juegos no ofrezca una soluciÓn única y para los que no sellegue a rungun acuerdo ..

Teoría básica: fuegos en jonnalnol'mal y equilibrio de Nash / 13

Apéndice

Este apéndice contiene d~ll1ostracionesde las dos proposiciones siguientes,que fueron enun<;:iadasde manera informal en la sección 1.1.C. Saltarseestas demostraciones )1.0 jmpedirá de forma sustancial la comprensióndel resto d~l libro. Sin embargo, para aquellos lectores no acostumbra~dos a la manipulación de definiciones formales y a la construcción dedemostraciones, el dominio de estas demostraciones constituye un va-lioso ejercicio.

Proposición A. En el juego en forma normal con njugadores G= {Sr. ... ,Sn; Ul,,; . ,UnL si la eliminación iterativa de las estrategias estrictamente domi-nadas elimina todas las estrategiqs menos las (s1'" . ;s~),estas últimas estrategiasconstituyen el único equilibrio de Nash del juego.

Proposición B. En el juego en forma normal con n jugadores G = {SI,' .. ,Sn;Ul, ... ,Un}, si las estrategias (S1' ... ,s~) forman un equilibrio de Nash; entoncessobreviven a la eliminación iterativa de las estrategias estrictamente dominadaS}'

,.• .'.::t. ;'~-~~::~'li;r"Puesto que la proposición B es más fácil de demostrar, comeriZalli~s

por ella para entrar en materia. El argumenta "es por<co¡{tradlédÓhíEsto es, vamos a suponer que una de las estrategias,en unequiIíbri~de Nash es eliminada por eliminación iterativa de las estrategias'~stri'c-'tamente dominadas, y después demostraremos que llegaríamos a urtaconqadicc~ón si este supuesto ocurriera, demostrando así que el ~U:pti~stodebe ser falso.' . .., -..i~.K•.,.... - ,.• ' ",.,L '"-

Supongamos que las estrategias (si,. e, e ,s;;') forman un equilibriCld~Nash del juego en forma normal G= {SI," "Sn;Ui~¿; ;,un}, pero sÜ:pon:gamos también que (tal vez después de que algunas estrategias distintasde (s1" .. ,s~) hayan sido eliminadas) si es la primera de las estrat~gias(s1' ... ,s~) en ser eliminada por ser estrictamente'dominada. Entonces,debe existir una estrategia S~' que no ha sido aún eliminada de Si quedomina estrictamente a si. Adaptando (DE) tenemos ., .'

(Li.l)

para cada (sI;' .. ,si-l,Si+l,' .. ,Sn) que puede ser construida a partir de lasestrategias que no han sido aún eliminadas de los espacios de estrategiasde losatros jugadores. Puesto que si es la primera delas estrategias de

,', .'~:'~ I

1.2.A Modelo de duopolio de Cournot

Como hemos indicado en la sección previa, Cournot (1838) se anticipóa la definición de equilibrio de Nash en más de un siglo (pero sólo enel contexto de un modelo concreto de duopolio). Por ello, no es sor-prendente que el trabajo de Cournot constituya uno de los clásicos deíateoría de juegos y una de las piedras angulares en organización industriaLConsideramos aquí una versión muy simple del modelo de Cournot ypresentaremos variaciones del modelo en los capítulos siguientes. En estasección utilizamos el modelo para ilustrar: (a) la traducción del enunciadoinformal de un problema a.la forma normal de un juego; (b) los cálculosnecesarios para hallar el equilibrio de Nash del juego y (c) la eliminacióniterativa de las estrategias estrictamente dominadas.

Sean q1 y q2 las cantidades (de un producto homogéneo) producid~~por las empresas 1 y 2 respectivamente. Sea P(Q) = a - Q el preciode equilibrio de mercado cuando la cantidad agregada en el mercado esQ = q1 + q2. (Más precisamente, P(Q) = a - Q para Q < a. y P(Q) = OparaQ 2: a.) Supongamos que el coste total de producción de la cantidad qipor la empresa i es Cí(qí) = eqí. Es decir, no existen costes fijos y el costemarginal es constante e igual a e, donde suponemos que e < D.. Siguiendoa Cournot, suponemos que las empresas eligen sus cantidades de formasimultánea?

AplicaciO/leE' / 15

1.2Aplicaciones

. 7 En la sección 1.2.B discutimos el modelo de Bertrand (1883), en el cual las empres"sehgen preaos en vez de cantidades, y en la sección 2.1.B el modelo de Stackelberg (J 934), enel cual las empresas eJ:gen cantidades, pero una empresa eHge antes que (y es observada por)la otra. Finalmente, discutimos en la sección 2.3.C el modelo de Friedman (1971). en el cual lainteracción descrita en el modelo de Coumot ocurre repetidamente en el tiempo .

Si s; = si (es decir, si si es la estrategia que domina estrictamente a s;)

(1.1.5) contradice a (1.1.3),en cuyo caso la demostración está completa. Sis; I si alguna otra estrategia s;' debe más tarde dominar estrictamente as;, ya que s; no sobrevive al proceso. Por eSO, las desigualdades análogasa (1.1.4) y (1.1.5) se cumplen para s; y s;', que sustituyen a Si y -< respec-. tivamente. Una vez más, si s;' = si la demostración está completa; si no,pueden construirse otras dos desigualdades análogas. Puesto que .< esla única estrategia de Sí que sobrevive al proceso, la repetición de esteargumento (en un juego finito) completa finalmente la demostración.

(1.1.5)

(1.1.4)

(1.1.3)

(1.1.2)

Pero (1.1.2) es contradicha por (EN): si debe ser una mejor respuesta a(si, ... ,s:~1,s:+l"" ,s~), por lo que no puede existir una estrategia <' quedomine estrictamente a si. Esta contradicción completa la demostración.

Después de haber demostrado la proposición Bhemos ya demostradoparte de la proposición A; lo único que nos queda demostrar es que sila eliminación iterativa de estrategias estrictamente dominadas eliminatodas las estrategias excepto (si, ... ,s~), estas estrategias forman un equi-librio de Nash. Por la proposición B cualesquiera otros equilibrios deNash habrían sobrevivido también, por lo que este equilibrio debe serúnico. Suponemos aquí que G es finito.

El argumento es nuevamente por contradicción. Supongamos quela eliminación iterativa de estrategias estrictamente dominadas eliminatodas las estrategias excepto (si, ... ,si'), pero estas estrategias no formanun equilibrio de Nash. Entonces debe existir un jugador i y alguna estra-tegia factible Si en Si tal que (EN) no se cumpla, pero Sí debe haber sidoestrictamente dominada por alguna otra estrategia s; en algún punto de]proceso. Los enunciados formales de estas dos observaciones son: existeSí en Si tal que

y existe s; en el conjunto de estrategias del jugador i que queda en algúnpunto del proceso tal que .

para cada (S1,", ,Sí-1,Si+1," . ,sn) que puede ser construida a partir de lasestrategias que quedan en los espacios de estrategias de los otros jugadoresen ese punto del proceso. Puesto que las estrategias de los otros jugadores(si, ... ,si_1,s:+1'" . ,s~) nunca son eliminadas, una de las implicaciones de(1.1.4) es

equilibrio en ser eliminada, las estrategias de equilibrio de otros jugadoresno han sido eliminadas, por lo que una de las consecuencias de (1.1.1) es

14/ JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1)

i~~.,

""

.,'i.:,.•

,'-,

y

* 1( • )ql = 2 a - q2 - e

Aplicaciones / 17

En el modelo de duopolio de Cournot, el enunciado análogo es que el parde cantidades (qj,qi) forma un equilibrio de Nash si, para cada empresai, q7 es una solución de

>1< ,.. 'a - eql = q2 = -3-'

que es ciertamente menor que a - e, como habíamos supuesto.La interpretación de este equilibrio es simple. Cada empresa quema

por supuesto tener el monopolio del mercado, en cuyo caso elegiría qi paramaximizar 1f'i(qi,O), produciría la cantidad de monopolio q';'= (a - e)/2 yalcanzaría un beneficio de monopolio 1f'i(qm,O) = (a - e)2 / 4. Dado que haydos empresas, los beneficios agregados del duopolio se verían maximiza-dos fijando una cantidad agregada ql +q2 igual a la cantidad de monopolioqm, como ocurrirla si qi = qm/2 para cada i, por ejemplo. El problema deeste arreglo es que cada empresa tiene un incentivo para desviarse de él,puesto que la cantidad de monopolio es baja, el precio correspondienteP(qm) es alto y, a este precio, cada empresa quema aumentar su cantidad,pese a que tal incremento en la producción bajaria el precio de equilibriode mercado. (Formalmente, utilícese (1.2.1) para comprobar que qm/2 noes la mejor respuesta de la empresa 2 a la elección de qm/2 por parte de laempresa 1.) En el equilibrio de Cournot, al contrario, la cantidad agregadaes más alta, por lo que el precio correspondiente es más bajo, con lo que la'

• 1( • )q2 = 2 a - ql - e .

Resolviendo este par de ecuaciones obtenemos

1qi = 2(a - qj - e).

Así, si él phrdecantidades (qj,qi) ha de formarun'equilibrlo de Nash,Jascanhdadeselegidas por las ettípresas deben cumplir ' "

Suponiengo que qj < (bc(<;:omo demostraremos que ocurre), la condiciónde primer orden del problema de optimización dela empresa i es necesariay suficiente, con lo que se obtiene

(EN)

16,' JUECOS EST.S.TICOS CON INFORMACIÓN COMPLETA' (e. 1)

max 'lLi(8i,8j)'',ES,

.lri(qi,qj) = q¡[P(q¡ + qj) - el = gira - (qi + qj) - c].

Para encontrar el equilibrio de Nash en el juego de Cournot, primerotraducimos el problema a un juego en forma normal. Recordemos dela sección anterior que la representación en forma normal de un juegoexige precisar: (1) los jugadores en el juego; (2) las estrategias de quedispone cada jugador y (3) las ganancias recibidas por cada jugador concada combinación de estrategias posibles. Hay dos jugadores en un juegode duopolio: las dos empresas. En el modelo de Cournot las estrategiasde que dispone cada empresa son las diferentes cantidades que puedeproducir, Vamos a suponer que el producto es continuamente divisible.Naturalmente, no puede haber producción negativa. Por ello, el espaciode estrategias de cada empresa puede ser representado com? Si ':"[O,OO)!los números reales no negativos, en cuyo caso una estrátegiaÍípica'~i esla elección de una cantidad q.¡ 2': O.Se podría argumentar que no se puededisponer de cantidades demasiado grandes, por 10 que éstas 'no debé'ríanincluirse en el espacio de estrategias de una empresa. No obstante, puestoque P(Q) = °para Q 2: a, ninguna empresa producirá una cantidad qi >a.

Quedan por concretar las ganancias de la empresa .í en función de lasestrategias elelsidas por dicha empresa y por la otra empresa, y definiry hallar el equilibrio. Suponemos que las ganancias de la empresa sonsimplemente su beneficio. Por ello, la ganancia lli(Si,Sj) en u:r'tjuego ge-neral en forma normal de dos jugadores puede expresarse de la sigÜienteforma:8

para cada posible estrategia S¡ en Si. De la misma forma, para cadajugador i, 87debe ser una solución del problema de optimización

Recordemos de la sección previa que, en un juego en forma normal dedos jugadores, el par de estrategias (si ,si) forn'1..a un equilibrio de Nash si,para cada jugador i,

8 Obsérvese que hemos cambiado ligeramente la notación al escribir Ui(Si,Sj) en vezde 'l/.¡(SI,s2)' Ambas expresiones representan las ganancias del'jugador i en función de lasestrategias elegidas por todos los jugadores, Vamosa utilizar estas expresiones (y sus análogascon 11 jugadores) indistintamente.

y

(o.-c ) [a-c ] [3(a-C) ]7fi -4- - x,qj = -4- - x ---4-- + x - qj

( ) [a. - e ]

='lri qm,qj - X -2- + x - qj -

Tras estos dos pasos, las cantidades que quedan en el espacio de estrategiasde cada empresa sonlas contenidas en el intervalo entre (0.-c)/4 y (a-c) /2 .La repetición de estos argumentos conduce a intervalos cada vez menores

y si Q = qm + X + qj ~ a, entonces P(q) = O,por lo que producir unacantidad menor aumenta el beneficio. En segundo lugar, puesto quelas cantidades mayores que qm han sido eliminadas, la cantielad (a -

c)/4 domina estrictamente a cualquier cantidad más baja. Esto es, paracualquier x entre cero y (a - c)/4,'lri [(a. - c)/4,qj] > 'lri[(o. - c)/4- x,qjJ paracualquier qj entre cero y (a - c)/2. Para comprobarlo, nótese que

y

Aplicaciones I 19

'Ir- (~ _) _ a - e [3(0_ - c) _ _], 4 ,q] - 4 4 q]

Como se muestra en la figura 1.2.1 estas dos funciones de mejor respuestase cortan sólo una vez, en el par de cantidades de equilibrio (qi ,q;).

Un tercer modo de hallar este equilibrio de Nash es aplicar el procesode eliminación iterativa de las estrategias estrictamente dominadas. Esteproceso ofrece una única solución que, por la proposición A del apéndicede la sección anterior, debe ser un equilibrio de Nash (qj',qi). El procesocompleto requiere un número infinito de pasos, cada uno de los cualeselimina una fracción de las cantidades que quedan en el espacio de es-trategias de cada empresa. Vamos a discutir solamente los dos primerospasos. En primer lugar, la cantidad de monopolio qm = (a. - c)/2 dominaestrictamente a cualquier cantidad más alta. Es decir, para cada :/;> 0,'lri(qm,qj) > 'lri(qm + x,qj) para toda qj ~ o. Para comprobarlo, nótese queQ = qm + X + qj < a, por lo que

(a e c, O)' q,

-; Figura 1.2.1

.• «a - c)/2, O)

(O, a - e)

(O, (a - e)/2)

',-

q,

del mismo modo, si q2 es menor que a. - c, la mejor respuesta de la empresales -

tentación de aumentar la producción queda reducida justo lo preciso paraque cada empresa decida no hacerlo, al darse cuenta de que con ello caeráel precio de equilibrio de mercado. Véase el ejercicio 1.4 para un análisisde cómo la presencia de un número n dé oligopolistas afecta al dilemaplanteado en equilibrio por la tentacióri de aumentar la producción y eltemor a reducir el precio de equilibrio de mercado.

En vez de hallar de forma algebraica el equilibrio de Nash del juegode Cournot, se podría hallar gráficamente del modo siguiente: la ecuación(1.2.1) proporciona la mejor respuesta de la empresa i a la estrá'tegia deequilibrio de la empresa j, q;. Un razonamiento análogo conduce a la mejorrespuesta de la empresa 2 a cUalquier estrategia arbitraria de la empresa1, y la mejor respuesta de la empresa 1 a cualquier estrategia arbitrariade la empresa 2. Suponiendo que la estrategia de la empresa 1 cumpleql < a - c, la mejor respuesta de la empresa 2 es

18 I JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (c. 1)

'..::;

"',",!

.•...¡)~.-

.,):

20/ JUECOS ESrÁrlCOS CON INfORMACIÓN COMPLETA (e. 1)

q,

9 Estos dos argumentos son ligeramente incompletos, puesto que no hemos analizadola mejor respuesta de la empresa i cuando no tiene la certeza de cuál sea la cantidad qj'

Supongamos que la empresai no está segura de qj pero cree que el valoresper<ldo,de qj

es E(q.i)' Puesto que 1ri(Qi,Qj) es lineal en qj,!a mejor respuesta de la empresa -tdentrodesu incertidumbre es igual a su mejor respüesta cuando tiene la certeza dé que la"empresa jelegirá E(qj), caso' que hemos desarrollado en el texto. .".. c....':~c.'""':'"

'," .

•,..:

,o,.

", ...

".

(

\ ..

,.•....:

Aplicaciones / 21

1.2.BModelo de duopolio de Bertrand

A continuación consideramos un modelo diferente de la relación quepuede ~xistir entre dos duopolistas, basado en la sugerencia de Bertrand(1883) de que, de hecho, las empresas eligen precios, y no cantidadescomo en el modelo de Coumot. Es importante observar que el modelo deBertrand constituye un juego difererite ¡¡(Ínódelo de Coumot: los espaciosde estrategias son diferentes, las funciones de ganancias son diferentesy (como se verá) el comportamiento de los equilibrios de Nash en losdos modelos es diferente.' Algunos autores resumen estas diferencias ha-blando de los equilibrios de Coumot y de Bertrand. Pero esto puede crear

Como en el caso anterior, la repetición de estos argumentos conduce a lacantidad qi = (a - c)/3.

Concluimos esta sección cambiando el modelo de Coumot, de formaque la eliminación iterativa de las estrategias estrictamente dominadas no

ofrezca una solución única. Para hacerlo, añadimos simplemente una omás empresas al duopolio existente, Vamos a comprobar que el primerode los dos pasos discutidos en el caso del duo polio continúa cumpliéndose,pero el proceso termina ahí. Por eso, cuando hay más de dos empresas,la eliminación iterativa de las estrategias estrictamente dominadas ofrecesólo la predicción imprecisa de que la cantidad de cada empresa no ex-'cederá a la cantidad de monopolio(como enla figura 1.1.4, donde no seeliminaba ninguna ~strategia durante el proceso).

Para ser más concretos, consideramos el caso de tres empresas. SeaQ-¡ la suma de las cantidades elegidas por las empresas distintas de i, ysea 1ri(qúQ -i) = q.¡(a - qi - Q -i - e) siempre que qi +Q -i < a (mientras que7fi(qi,Q-i) =-Cqi si qi + Q-i 2: a). Nuevamente es cierto que la cantidadde monopolio qm = (a - e)/2 domina estrictamente cualquier cantidadmás alta. Es decir, para cualquier x > 0, 1ri(qm,Q-i) > 1ri(qm + ;,Q-Dpara todo Q-i 2: 0, C0Il10 en el prime~ paso delcaso de duopolio.'sikembargo, puesto que hay dos empresas además de la empresa i, lo únicoque podemos decir acerca de Q_; es que está entre cero y(a - e), porque q/y qk están entre cero y (a - c)/2. Pero esto implica.que ninguna cantidadqi 2: °es estrictamente dominada en el caso de la empresa i, porque paracada qi entrecero y (a -c)/2 existe un valor de Q-i entre cero y (a ~ e)(concretamente;Q_i= a - e - 2qi), tal que qi es lamejor respuesta de laemp;esa i a Q~i. Poi- ello, en lo sucesivo ya no se puede eliminar rtingUIl~'estrategia. . .'.

R,(q)

Figura 1.2.2

((a - e) /2,0) (a - e, O)

(0, (a - e) /2)

(O, (a - e)/4)

de las cantidades que quedan. En el límite, estos intervalos convergen alúnico punto IJ.; = (a -c)/3.

La eliminación iterativa de las estrategias estrictamente dominadastambién se puede representar en forma gráfica utilizando la observación(incluida en la nota 1; véase también la discusión en la sección 1.3.A) deque una estrategia es estrictamente dominada si y sólo si no existe ningunaconjetura sobre las decisiones posibles de los demás jugadores para la cualsea la mejor respuesta. Puesto que sólo hay dos empresas en este modelo,podemos reformular esta observación del siguiente modo: una cantidadq¡ es estrictamente dominada si y sóJo si no hay ninguna conjetura sobreqj

tal que q¡ sea la mejor respuesta de la en1presa i. Nuevamente"discutimossólo los dos primeros pasos del pr,?ceso iterativo. En primer lugar,:n1¥1~aes una respuesta mejor para la empresa i producir más que la canti~~d demonopolio qm = (a - c)/2. Para comprobarlo, consideremos, por ejemplo,la función de mejor respuesta de laempresa 2: en la figura 1.2.1, R2(q¡)

es igual a qm cuando q¡ = 0, y disminuye cuando q] aumenta. AsÍ, paracualquier qj 2: 0, si la empresa i cree que la empresa j elegirá qj, la mejorrespuesta de la empresa .¡ es menor que o igual a qm. No existe qj tal quela mejor respuesta de la empresa i sea' mayor que qm. En segundo lugar,dada esta cota superior para la cantidad de la empresa j, podemos derivaruna cota más baja a la mejor respuest~ de la empresa i: si qj ::; (a - e)/2,entonces R;(qj) 2: (a - c)/4, como mostramos para la mejor respuesta dela empresa 2 en la figura 1.2.2.9

L

22/ JUEGOS ESTÁTICOS CON JNFORNIACJÓN COMPLETA (c. 1)

confusiones, puesto que existen diferencias entre los juegos de Bertrandy Cournot y en el comportamiento de equilibrio en estos juegos, pero /10

existe diferencia en el concepto de equilibrio utilizado en ambos juegos.En ambos el concepto de equilibrio utilizado es el equilibrio de Nash definido enla sección anterior.

Consideremos el caso de productos diferenciados. (Para el caso deproductos homogéneos véase el ejercicio 1.7.) Si las empresas 1 y 2 eligenlos precios PI y P2 respectivamente, la cantidad demandada a la empresai por los consumidores es

qi(PúPj) = a - Pi + bpj,

donde o > O refleja hasta qué punto el producto de la empresa i es unsustituto del producto de laempresaj.(Ésta esuilafuiH:ión de demandairreal, puesto que la cantidad demandada dei piodtict~ de la empresai es positiva incluso cuando la empresa i fija un preció arbitrariamentealto, siempre que la empresa j también fije un precio suficientementealto. Como se verá, el problema sólo tiene sentido si b < 2.) Como enla discusión del modelo de Cournot, suponemos que no existen costesfijos de producción y que los costes marginales son constantes e igualesa c, donde c < a y las empresas deciden (por ejemplo: eligen los precios)simultáneamente.

Como antes, la primera tarea en el procéso de hallar el equilibrio deNash es traducir el problema a un juego en forma norni.al. Tenemosdos jugadores nuevamente: Sin embargo, esta vez las estrategias de quedispone cada empre~ason los diferentes precios que' pueden fijar, envez de las diferentes cantidades que pueden producir. Vamos a suponerque los precios negativos no son factibles, pero que cualquier precio nonegativo lo es; por ejemplo, no existe ninguna restricCÍón a los preciosexpresados en céntimos. AsÍ, el espacio de estrategias de cada empresapuede ser nuevamente representado como Si.~[~ff,2),)?~ n.úmeros realesno negativos, y una estrategia típica Si es ahora Jil decisión de un precioPi ~ O. . ' ..

Vamos a suponer nuevamente que la fu~ci6n'dega;¡ariCÍas de cadaempresa es simplemente su beneficio. El berÍeficfc)de lÚIbprei>a i cuandoeli~~';l precio Pi y su rival elige el precio pI~ .,.,'~:'~!;"~',"rr;:.',,';'

<',;,;:'f:f'F~;(Pi,Pj)= qi(Pi,Pj)[Pi - c] =[a ~ ~i./b;j][;~~'fr' ,

Así;:el par depreaos (pi ,pi) constituye un equilibriddeN~~~sr'para cada,. :.::, -

, .,

Aplicaciones! 23

empresai, pi es una solución de

max "i(pi'));) = max [u, -]Ji + upj](Pi - eJ,O::;Pi <00 O::;Pi <00

La solución al problema de optimización de .ies

pi = ~(iJ, + bp*¡. + e).2 .Por 10 tanto, si el par de precios (pi ,pi) ha de ser un equilibrio de Nash,las decisiones de precios de las empresas deben cumplir

pi = ~(a + 0¡/2 + c)

y

pi = ~(a+opi +c)2

Resolviendo este par de ecuaciones obtenemos

* * a+cp} = P2 = 2 - b'

1.2.C Arbitraje de oferta final

A ciertos trabajadores del sector público no les está permitido declararseen huelga; en su lugar, las disputas salariales se resuelven mediante unadecisión arbitral vinculante. (La liga defú tbol es un ejemplo más llamativoque el del sector público, pero es sustancialmente menos importante desdeun punto de vista económico.) Otras muchas disputas, entre las quese encuentran los casos de negligencia médica y las denuncias de losinversores contra sus agentes de bolsa, también suelen resolverse pordecisión arbitral. Las dos formas principales de arbitraje son el arbilrajeconvencional y el de oferta final. En el arbitraje de oferta final las dos parteshacen ofertas salariales yel árbitro decide entre una de las ofertils. Porel contrario, en un arbitraje convencional el árbitro tiene libertad pnraimponer cualquier salario. A continuación, vamos a derivar las ofertilssalariales de equilibro de Nash, en un modelo de arbitraje de oferta finaldesarrollado por Farber (1980).10

10 Esta aplicación incluye algunos conceptos básicos de probabilidad: función de distri.bución de probabilidad, función de densidad de probabilidad y valor esperado. Daremosdefiniciones sucintas cuando sean necesarias; para más detalles, consúltese cualquier texto eleintroducción a la probabilidad.

24/ JUEGOS ESTÁTICOS CON INFOR,'vIACIÓN COMPLETA (e. 1)

11 Esto es, la probabilidad de que x sea menor que un valor arbitrario x' es F(x'),y la derivada de esta probabilidad con respecto a x" es ¡(x'). Puesto q\le F(x') es unaprobabilidad, tenemos que O ~ F(x') ~ 1 para cualquier x'. Además, si. "," >. x',F(xH

) 2: F(x'); entonces ¡Cc') 2: Opara cada x'.

\",

:.',

';-

e•

f:':.'

'.'

(....

(

(!:,

We . Prob{'Weelegido}+w •. Prob{wselegido} =

'We . F CUe;'Ws) +w•. [1 _ F (We; Ws)] .

. F(we+w;) ,[ F(we+w;)]~:nwe' --2-'-" +ws' 1- -'-2--

y

{. (1/Je+ws)Prob weelegldo} = 1- F --2- .

Así, el acuerdo salarial esperado es

Suponemos que la empresa quiere minimizar el salario esperado impuestopor el árbitro y el sindicato quiere maximizarlo.

Si el par de ofertas (w:,w';) ha de constituir un equilibrio deNash deljuego entre la empresa y el sindiéato, w: debe ser una 'solución dé~ .

y w;debe ser una~oluc~ól1 de

{ {1/Je +'W.} . (We +Ws)Prob weelegido} = Prob x < --2- = F --2-

Aplicaciones / 25

(w;' - w:) .~!(w: ; w;) = F (w; ; w;)

Así, el par de ofertas salariales (w:,w;) debe ser una solución de las con-dici~nes de primer orden de estos problemas de optimización:

y

(w; - w:).~! ('W:; W;). [1- F (w; ;w;)].(Posponemos la consideracióp..de si estas condiciones de primer orden sonsuficientes.) Puesto que los términos de la izquierda de estas condicionesde primer orden son iguales, los términos de la derecha deben asimismoser iguales, lo que implica que

12 Al formular los problemas de optimización de la empresa y el sindicato hemos supuestoque la oferta de la empresa es menor que la oferta del sindicato. Es inmediato demostrar queesta desigualdad se debe cumplir en equilibrio.

x

W, •

W, es elegida

(W,+W,) /2

Figura 1.2.3

IV, es elegida

Supongamos que las partes en disputa son una empresa y un sindicato,y que la disputa es acerca de los salarios. Supongamos que el juego sedesarrolla de la siguiente manera: primero, la empresa yel sindicato rea-lizan simultáneamente ofertas, denominadas 'We y w •. En segundo lugar,el árbitro elige una de las dos ofertas. (Como' en muchos de los llama-dos juegos estáticos, esto es en realidad un juego dinámico del tipo quediscutiremos en el capítulo 2, pero aquí lo reducimos a un juego estáticoenlre la empresa y el sindicato al suponer una determinada conducta delárbitro en la segunda etapa.) Supongamos que el árbitro tiene un acuerdoideal que le gustaría imponer, que denominamos x. Supongamos ademásque, tras observar las ofertas de las partes, 'We y 'W., el árbitro elige sim-plemente la oferta más cercana a x: siempre que 'We < 'W. (una intuiciónque demostraremos que se cumple) el árbitro elige 'We si x < ('We + 'W.)/2 Yelige 1/J. si]; > (-we + 'W.)/2, como vemos en la figura 1.2.3. (Lo que ocurresi 1; = (tue + 'W.)/2 es irrelevante; supongamos que el árbitro lanza unamoneda.)

El valor de x es conocido por el árbitro, pero no por las partes. Las par-les creen que x se distribuye aleatoriamente según una distribw,:ión de pro-babilidad F(x), con la correspondiente función de densidad !(x).l1Dadanuestra especificación acerca del comportamiento del árbitro, si las ofertasson UJe y w., las partes creen que las probabilidades Prob{we sea elegida}y Prob{'Wssea elegida} pueden ser expresadas de la siguiente forma:'

Y0.2.3) se convierte en

W: + 'w;--2--=m

esto es, la oferta media debe ser igual a la mediana del acuerdo preferidopor el árbitro. Sustituyendo (1.2.2) en cualquiera de las condiciones deprimer orden obtenemos

1.2.D El problema de los ejidos

Aplicacío/les / Z7

Al menos desde Hume (1739), los filósofos políticos Y los economistashan entendido que si los ciudadanos responden únicamente a incentivosprivados, habrá un déficit en la provisión de bienes públicos y los recursospúblicos estarán sobreutilizados. Hoy en día, basta con fijarse en el medioambiente para constatar la fuerza de esta idea. Fue el trabajo ampliamentecitado de Hardin (968) el que fijó la atención de los no economistas sobreel problema. A continuación analizam.os un ejemplo bucólico.

C.onsideremos los n habitantes de una aldea. Cada verano todos losaldeanos llevan sus cabras a pastar en el ejido de la aldea. Denominamosgi el número de cabras que el i-ésimo campesino posee y el número totalde cabras en la aldea G = .rJ] + ... + gn' El coste de comprar y cuidar unacabra es e, independientemente de cuántas cabras se posean. El valor decriar una cabra en el ejido cuando allí se concentra un total de G cabras esv(G) por cabra. Puesto que una cabra necesita al menos una cierta cantidadde pasto para sobrevivir, existe Ull número máximo de cabras que puedenpastar en el ejido, Gmax:v(G) > Opara G < Gmax, pero 11(G) = OparaG::: Gmax. Por otra parte, puesto que las primeras cabras disponen de unamplio espacio para pastar, añadir una más no afecta a las que ya está n alJi,pero cuando hay tantas cabras pastando que apenas pueden sobrevivir(es decir, G está justo por debajo de Gmor), añadir una cabra más afecta i1

las demás de forma dramática. Formillmente: para G < Gmor., 1)'«;') < IJ

La interpretación de este equilibrio es simple. Cada parte se enfrentaa un dilema. Una oferta más agresiva (es decir, una oferta más bajapor parte de la empresa o una oferta más alta por parte del sindicato)genera unas ganancias mayores si es elegida por el árbitro, pero es menosprobable que sea elegida. (Veremos en el capítulo 3 que un dilema similaraparece en una licitación a pliego cerrado y al precio más alto: una pujamás baja genera unas ganancias mayores si es la puja ganadora, peroreduce probabilidad de ganar.) Cuando hay más incertidumbre sobre elacuerdo preferido por el árbitro (es decir, (J2 es más alta), las partes puedenpermitirse ser más agresivas, puesto que una oferta agresiva tiene menosprobabilidades de ser muy diferente del acuerdo preferido por el árbitro.Por el contrario, cuando apenas hay incertidumbre, ninguna parte puedepermitirse hacer una oferta alejada de la media, porque es muy probableque el árbitro prefiera acuerdos cercanos a '/1];

(1.2.2)

(1.2.3)

F(W;+W;) =~.2 2'

26/ JUEGOS ESTÁTICOS CON INFOIUvlAClÓN COMPLETA (e ])

* * 1W -1)) = o

s e f C,,;;w; resto es, la distancia entre las ofertas debe serigual a la inversa del valorde la función de densidad evaluada en la mediana del acuerdo preferidopor el árbitro ..

Consideremos el siguiente ejemplo, que ofrece un resultado de estaticacomparativa que resulta intuitivamente atractivo. Supongamos que elacuerdo preferido por el árbitro se distribuye normalmente con media my varianza a2, en cuyo caso la función de densidad es

f(x) = _1_ exp { __ l_(x _ m)2}.V2rra2 2a2

(En este ejemplo, se puede demostrar que las condiciones de primer ordenanteriormente dadas son suficientes.) Puesto que una distribución normales simétrica con respecto a su media, la mediana de la distrjbuCÍón es iguala su media, m. Por lo tanto, (1.2.2) se convierte en

*_ * __ 1__ ~Ws we - f(m) - v2rraL

,

por lo que las ofertas de equilibrio de Nash son

'ff ff'w',= m +~, y w*=m '- rra2.'

s' 2 e 2 ,-

Así, en equilibrio, las ofertas de las partes se centran alrededor de laesperanza del acuerdo preferido por el árbitro (esdédr, m), y la distancia~~tre las .ofertas aumenta con la incertidumbre de ias partes acerca delacuerdo preferido por el árbitro (es decir, ~2).

',.:,.

(.

:::'~~.".'

<: "',

,':'. ~'.'

( ;.

(EN)

(1.2.7)v(C**) + G**v'(C**) - e = °para la cual la condición de primer orden es

para cada estrategia Sí en Si. Según esta definición no existe ningúnequilibrio de Nash en el siguiente juego conocido como el juego de lasmonedas (matchíng pennies). . .,

max Gv(G) - Ge, .O$G<oo

Teoría avanzada: Estrategias mixtas 1j existencia de equilibrio / 29

13Supongamos, a la inversa,que,q:"::$ C*~. ,Entoncesv(C*) ::::'v(C**), puesto que v' <O.Del mismo modo, O> v'(C~) ::::v'<O*~),pu~sto que v" <O. Finalmente, C* /n < C**. Así,elténnino de la izquierda de d.í.6) es~slridamente mayor que elténnin~ de la izquierda de(1.2.7), lo cual es imposible dado 'que ambos son iguales a cero.

En la sección 1.1.C hemos déinido Si como el conjunto de estrategias con-que cuenta el jugador i, y la combiriacion de estrategias (si, ... ,s~) coínoun equilibrio deNash si, para cada jugador i,'.s7es la mejor respuesta' détjugador i a las estrategias de los otros n - 1jugadores:

La comparación entre (1.2.6) y (1.2.7) muestra13 que G* > G**: en elequilibrio de Nash se crían demasiadas cabras comparado con el óptimosociaL La condición de primer orden (1.2.5) refleja los incentivos que tieneun aldeano que Y'il está criando 9i eabr<;ispero considera añadir una más(o, de fOnn.amás precisa, una pequeña fracción de una más). El valor dela cabra adicional es V(9i + 9~i) ysu coste es e. El daño a las cabras yaex.jstelltesdel aldeano es V'(9i +9"-;> por cabra, o 9iV'(9i + 9,,-Jén totaL Losrecursos comunales están sobreutilizados porque cada aldeano considerasólosu-propia situación, y no el efecto de sus decisiones sobre los otrosaldeanos; de aquíla presencia de G*v'(C*) In en (1.2.6), pero de G"*v'(G**)en (1.2.7).

1.3.A Estrategias mixtas

1.3Teoría avanzada: Estrategias mixtas y existencia de equilibrio

(1.2.5)

(1.2.4)

(1.2.6)

G

v(G*) + ~C'u'(G*) - e = 0,n

v(9'¡ + 9~¡) + 9(U'(9í + 9~) - e = 0,

9iV(91,'" ,9i-l,9i + 9i+],'" + 9,,) - e9i.

yul/(G) < 0, como muestra la figura 1.2.4.,

Figura 1.2.4

28/ JUEGOS ESTÁTICOS CON INFORMACiÓN COMPLETA (e. )),

v

Durante la primavera, los aldeanos eligen simultáneamente cuántascabras van a tener. Supongamos que las cabras son continuamente divisi-bles. Una estrategia del aldeano i es la decisión sobre el número de cabrasque llevará a pastar en el ejido, 9.¡.Suponer que el espacio de estrategiases [0,00) cubre todas las opciones' del aldeano; [O,Gmax) también bastaría.Las ganancias del aldeano oípor criar 9i cabras cuando el número de cabrascriadas por otros aldeanos es 91,' .. ,9';-1,9i+l .. o,9", es

donde 9"-i denota 9í + ... + 97-1 + 97+1+ ... + 9~. Sustituyendo 9i en0.2.5), sumando tod~s lascondicionesde primer orden de los n aldeanosy dividiendo luego por n se obtiene

Así, si (9í, ... ,g~) ha de constituir un equilibrio de Nash, para cada i,9idebe maximizar (1.2.4) dado que los otros aldeanos eligen (9í, ... ,97-1'97H'" .,9~)o La condición de primer orden de este problema de optimi-zación es

donde C* denota 91'+ o.. + 9~. Por el contrario, el óptimo social, denotadocon G**, es una solución de

"', ~'.

<~.•'

30/ JUEGOS ESTÁTICOS CON JNFORJYIAClÓN COMPLETA (c. 1)

Jugador 2

Cara Cruz

Cara -1,1 1,~1Jugador 1

Cruz 1, -1 -1,1

El juego de las mOlledas

En e~tej~ego el espacio~e estrategias de cada jugador es {cata, cruz}.~a hl~tona que explica las ganancias en la matriz binaria es lasiguiente:rmagmemos que cada jugador tiene una moneda y debe elegir ihostraruna cara de la moneda. Si las dos monedas (:t)mciden, esto es; ambasmuestran la misma célra,71 jugador 2 gana la moneda del jugador]. Si lascaras de las monedas no coinciden entonces el jugador 1 gana la monedadel jugador 2. No existe nihgún par de estrategias que pueda 'cumplir(EN), puesto que si las estrategias de los jugadóres coinciden (cara;cara)o (cruz, cruz), el jugador 1 prefiere cambiar su estrategia, mientras que silas e.strategias no coinciden (cara,cruz) o (cruz, cara), es el jugador 2 quienprefiere cambiar su estrategia. , .',. ~l rasg~ distintivo de este juego es que. a cada ju~ad~r le gustaría

adIvmar la Jugada del otro y que el otro no' adivinase la suya. Versionesde este juego también se dan en el póquer, el béisbol, en las;ba.taBasy en~tras situaciones. En el póquer, la cuestión análoga es con qué frecuenciatirarse un farol: si se sabe que el jugador i nunca; se tira,-fároles, susoponentes pasarán siempre que i apueste de formaagr~¥:i,j;~ci~~4oque a i le convenga tirarse un farol de cuando en cuando" ..Por;'otraparte, tirarse faroles con demasiada frecuencia cons~!Uye,~~';~~tr~t:egiaperdedora. En béisbol, supongamos que el lanzador puede lanzar la bolilo bien de forma rápida o bien describiendo una curva, y que 'el bateadorpuede darle a cualquiera de ellas si (y sólo si) la prevé CO~IIlente. Deforma similar, en una batalla, podemos suponer que los ,a,tac,~~e~puedenelegir entre dos objetivos (o dos rutas, como por tierrap;p!Jf}nár),yquela defensa puede rechazar cualquiera de los dos ataqué; si (Y;.l>61QLsijés.tees previsto de forma correcta. ' , ''':I;,¡¡~,toJü~1ié\B~;,'.',;¡¿;"

(En cualquier juego en el cual a cada jugador le co~;~gá)di~ l~jugada del otro y que el otro no adivine la~uya;l:liJ1~~f~)\:tii~¡:~~~brio de Nash (al menos tal como este conc~Pt\\g~," .11!-.-:::r,W;'ii<:'>'-''''.,.c~~

la sección l.1.C), porque la solución de tal juegó~1gªW .. :eñi:e'. 7.~';'\f,-:1~~>7 ~~~:;t~f~;,

Teoría avanzada: Estrategias mixtas y existencia de equililnio / 31

un elemento de incertidumbre sobre lo que harán los jugadores. A conti-nuación, introducimos la noción de estrategia mix/:a, que interpretamos entérminos de la incertidumbre de un jugador respecto a lo que otro jugadorhará. (Esta interpretación fue avanzada por Harsanyi [1973];la discutire-mos con más detalle en la sección 3.2.A,) En la próxima sección vamos aampliar la definición de equilibrio de Nash para que incluya estrategiasmixtas, incorporando con ello el elemento de incertidumbre inherente a lasolución de juegos como el juego de las monedas, del póquer, del béisboly de las batallas.

Formalmente, para el jugador i una estrategia mixta es una distri-bución de probabilidad sobre (algunas o todas) las estrategias en Si' Deaquí en adelante nos referiremos a las estrategias en Si como estrategiaspuras del jugador i. En los juegos con decisión simultánea e informacióncompleta analizados en este capítulo, las estrategias puras de un jugadorson las diferentes decisiones que el jugador puede tomar. En el juego delas monedas, por ejemplo, Si consiste en las dos estrategias puras cara ycruz, así que una estrategia mixta para el jugador i es la distribución deprobabilidad (q,1 - q), donde q es la probabilidad de elegir cara, 1 - q esla probabilidad de elegir cruz, y ° S q S 1. La estrategia mixta (0,1) essimplemente la estrategia pUra cruz; del mismo modo, la estrategia mixta(1,0) es la estrategia pura cara.

Como un segundo ejemplo de estrategia mixta, recordemos la figura1.1.1, en la que el jugador 2 cuenta con las estrategias puras izquierda,centro y derecha. En este caso, para el jugador 2 una estrategia mixta es ladistribución de probabilidad (q,r,l - q - r), en la que q es la probabilidadde elegir izquierda, r es la probabilidad de elegir centro y 1 - q - 7" es laprobabilidad de elegir derecha. Como antes, ° S q S 1, Y ahora también° S r S 1 Y O S q + r S 1. En este juego la ~strategia mixta 0/3,1/3,1/3)asigna la misma probabilidad a izquierda, centro y derecha, mientras que(1/2,1/2,0) asigna la misma 'probabilidad a izquierda y centro, pero noasigna ninguna probabilidad a derecha. Como siempre, las estrategiaspuras de un jugador son simplemente los casos límite de sus estrategiasmixtas (por ejemplo, aquí la estrategia pura izquierda del jugador 2 es laestrategia mixta (1, 0, O», ,á,'

De forma .más general, supongamosq~e el jugador i cuenta con [(estrategias puras: Si = {Sil,:" ,.me}. En este caso, para el jugadoriuna estrategia mixta es una distribución de probabilidad (Pi]" .. ,]J;f(), enla que Pik es la probabilidad,A~: <J~eél jugador i elija la estrategia 8;b

para k = 1, ... ,J(. Puesto que Pik'es una probabilidad, es necesi1rioque

Teoría avanzada: Estrategias mixtas y existencia de eqllil ¡brio / 33

e~\¿, ¡A_

i~ I

3,- 0,-

O~- 3,-

2,- 2~,

Figura 1.3.2

Jugador 2

1 D

En esta sección discutimos varios temas relacionados con la existencia delequilibrio de Nash. En primer lugar, ampliamos la definición de equili-brio de Na'sh dada en la sección 1.1.C para inéluir las estrategias mixtas.En segundo lugar, aplicamos esta definiCión ampliada al juego de las mo-nedas y a la batalla de los sexos. En tercer lugar, utilizamos un argumentográfico para deIl10strar que cualquier juego de dos jugadores en el cual

A

Jugador 1 !vI

B

La figura 1.3.2 muestra que una estrategia pura dada puede serunamejor respuesta a una estrategia IIÚxta,incluso si la estrategia pura no 'esuna mejor respuesta a ninguna otra estrategia pura. En este juego,'Bnoes una mejor respuesta para el jugador 1 a IoD deljugador 2, pero B E!s lámejor respuesta del jugador 1 a la estrategia mixta (q,1 - q) del jugador 2,siempre que 1/3 < q < 2/3. Este ejemplo ilustra el papel de las estrategiasmixtas en la "conjetura que se puede formar el jugador 'í".

La figura 1.3.1muestra que una estrategia pura dada puede estar es'-trictamente dominada por una estrategia mixta, incluso si la estrategiapura no está estrictamente dominada por ninguna otra estrategia pura.En este juego, para cualquier conjetura (q,l- q) que el jugador 1 pudieraformarse sobre el juego del jugador 2, la mejor respuesta de 1 es o A(si q ::::1/2) o !vI (si q ::; 1/2), pero nunca B. Sin embargo, B no estáestrictamente dOIIÚnada ni por A ni por 1'1'1. La clave es que B está es-trictamente dominada por una estrategia mixta: si el jugador 1 elige Acon probabilidad 1/2 y !vI con probabilidad 1/2, la ganancia esperada de1 es 3/2, independientemente de qué estrategia (pura o mixta) utilice 2,y3/2 es mayor que el pago a 1 que produce con certeza la elección de!?;Este ejemplo ilustra el papel de las estrategias mixtas para encontrar "otraestrategia que domine estrictamente a s/'.

1.3.BExistencia del equilibrio de NashFigura 1.3.1

Definición. En el juego en forma normal G '= {S], ... ,Sn; U], . , , /un} supon-gamos que Si = {Si], ... ,SiK }. En este caso para el jugador .í una estrategiamixta es lIna distribución de probabilidad Vi = (P'i1" .. ,PiK), dónde ° ::;Pi, ::; 1para k = 1, . , . ,K Y Pi] + . , , + Vil, = 1.

32 / JLECOS EST.ÜJCOS CON INFORtvJAClÓN COMPLETA (c. 1)

Jugador 2

1 D

. A 3,- 0,-

Jugador 1 !vI 0,- 3,-

B 1,- 1,-

o :S Pi, :S 1 para k = 1, ... ,Jo( Y ¡Ji] + ... + Pi!,' = 1. Vamos a utilizar¡Ji para denotar una estrategia mixta del conjunto de distribuciones deprobabilidad sobre Si, del mismo modo que utilizamos Si para denotaruna estrategia pura de Si.

Concluimos esta sección volviendo brevemente a la noción de es-trategias estrictamente dominadas que introdujimos en la sección 1.1.B,con objeto de ilustrar el papel potencial de las estrategias mixtas en losargumentos allí utilizados. Recordemosque si una estrategia Si es estric-tamente dominada, no existe ninguna conjetura que el jugador 'í puedaformarse (sobre las estrategias que elegirán los demás jugadores) tal quehiciera óptimo elegir S¡". El argumento inverso también se cumple, siem-pre que permitamos estrategias mixtas: si no existe ninguna conjetura queel jugador i pueda formarse (sobre las estrategias que elegirán los demásjugadores) tal que hiciera ,óptimo elegir Si, existe otra estrategia que do-mina estrictamente a S¡.]4 Los juegos de las figuras 1.3.1y 1.3.2 muestranque este argumento inverso sería falso si limitáramos nuestra atención aestrategias puras.

I~ Pearce (l984) demuestra este resultado en el caso de dos jugadores, e indica que secumple para el caso de n jugadores siempre que las estrategias mixtas de los jugadores puedanestar correlacionadas. Es decir, siempre que lo que suponga el jugador .¡ sobre lo que haráel jugador j pueda estar correlacionado con lo que suponga el jugador i sobre lo que hará eljugador k. Aurnann (1987)sugiere que tal correlación en los supuestos de i es completamentenatural, incluso si j, i Y k toman sus decisiones de fomla totalmente independiente: porejemplo, i puede saber que tanto j como k fueron a una escuela de dirección de empresas, oincluso a la misma escuela, pero puede no saber lo que se enseña en ella.

Teoría avanzada: Estmtegil1S mixtas y existencia de c'1,lÍlibrio / 3.5

Figura 1.3.3

La naturaleza de la mejor respuesta del jugador 1 a ('1,1 - '1) cambiacuando '1 = 1/2. Como indicamos anteriormente, cuando r¡ == 1/2 eljugador 1 es indiferente entre las estrategias puras cara y cruz. Además,puesto que la ganancia esperada del jugador 1 en (1.3.1)es independiente

'1. 1

(Cara)

1/2

,*('1)

(Cruz)

,

(Cara) 1

(Cruz)

;';"",1;',"1",: 1, ,.115 Los sucesos A y B son indepimdientes'si rrob{A y B} =Prob{A}.Prob{B). Así, ,1

escribir rq como la probabilidad de que r elijá cara y 2 elija cara, estamos suponiendo que1 y 2 toman sus decisiones de formá independjente, como corresponde a la deso"ipci611 quedimos de los juegos de decisión Sill:'.\!Jtá!\e.a.Consúltese Aumann (1974) para la d"finicióu deequilibrio correlacionado, que se'-!.tY~:;;T¡',it1:,gos en los cuales las decisiones de Jos jugadorespueden estar correlacionadas, puest?,;qtifó!js:rvan el resultado de un suceso ale"lorio. comoel lanzamiento de una moneda, antes de elegIr sus respectivas estrategias.

(cara, cruz), y así sucesivamente.iS Puesto que la ganancia esperada deljugador 1 es creciente en .,.si 2 - 4'1 > OYdecreciente en .,.si 2 - 41} < O,la mejor respuesta del jugador 1 es T = 1 (es decir, cara) si r¡ < 1/2 YT = O(es decir, cruz) si '1 > 1/2, como indican los dos segmentos horizontalesde ,*('1) en la figura 1.3.3. Esta afirmación es más poderosa que la afir-mación del párrafo anterior con la que está estrechamente relacionada:en aquélla considerábamos solamente estrategias puras y encontrábamosque si '1 < 1/2, cara era la mejor estrategia pura, y que si '1 > 1/2, cruzera la mejor estrategia pura. En ésta consideramos todas las estrategias,puras y mixtas, pero encontramos nuevamente que si r¡ < 1/2, cara es lamejor estrategia de todas (puras o mixtas), y que si '1 > 1/2, cruz es lamejor estrategia de todas.

34/ JUEGOS ESTÁTICOS CON [NFORMACIÓN COMPLETA (c. 1)

cada jugador cuenta con dos estrategias puras tiene un equilibrio de Nash(que posiblemente incluya estrategias mixtas). Finalmente; enunciamos ydiscutimos el teorema de Nash (1950),que garantiza que cualquier juegofinito (es decir, cualquier juego con un número finito de jugadores, cadauno de los cuales cuenta con unnúmero ñnito de estrategias puras) tieneun equilibrio de Nash (que posiblemente iricluya estrategias mixtas),

Recordemos que la definición de equilibrio de Nash dada en la sección1.1.Cgarantiza que la estrategia pura de cada jugadoI: consti,tuye unamejor respuesta a las estrategias puras dé los restantes jugaddres. Paraampliar la definición de modo que incluya estrategias mixtas, necesita-mos simplemente que la e"strateiPaI"nixtade cada jugador sea.una mejorrespuesta a las estrategias mixtas de los otros jugadores. Puesto que cUalequier estrategia pura puede ser representada <:'0#10 la estiit~gia que asigna~a probabilidad cero a todas sus otras estrategias puras, esta definiciónampliada incluye a la ari'terior.. La forma de hallar la mejor respuesta del jugador i a una estrategia

mIXtadel jugador j se basa en la interpretación de la estrategia mixta deljugador j como representación de la incertidumbre d~l Jugador i sobre loque hará el jugador j. Continuamos con el juego de las monedas comoejemplo. Supongamos que el jugador 1 cree que el jugador 2 elegirá caracon probabilidad '1 y cruz con probabilidad 1 - '1; esto es, 1 supone que2 elegirá la estrategia mixta ('1,1 - '1). Bajo,este supuesto, las gananciasesperadas del jugador 1 son '1. (-1) + O - '1) . 1 = 1 - 2'1eligiendo cara y'1' 1 +0- '1) . (-1) = 2'1 - 1 eligiendo cruz. Puesto que 1 - 2'1 > 2'1 -1 siYsólo si '1 < 1/2, la mejor respuesta en estrategias puras del jugador.1 escara si '1 < 1/2 Ycruz si '1 > 1/2, Yel jugador 1 será indiferente en.tre caray cruz si.'1 = 1/2. Nos quedan por considerar las estrategias mixtas deljugador 1. .

Sea (,,1 - ,) la estrategia mixta en la cual el j~gador 1 elige ~ara conprobabilidad ,. Para cada valor de '1 entre cero y uno, cakulamos.el(los)valor(es) de" denotado(s) por ,*('1) tal que (,,1-,) sea una mejor respuestadel jugador 1 a ('1,1 - '1) del jugador 2. Los resultados se r~cogen"~n lafigura 1.3.3. La ganancia esperada del jugador 1 al elegir (,,1-' ,) cuand~2 elige ('1,1 - '1)es

~_ .~,~ 'c~~'

donde ''1 es la probabilidad de (cara, cara), f(1 -'1} la probábil~daadé

''1.(-1)+,0- '1).1+(1-')'1,1 +(1-1')0 - '1).(-1) = (2'1-1)+,(2-4'1)" 0.3.1) .

'0.':

---- ~c •••~----------------------------

36/ JuEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1)

y la ganancia esperada del jugador 1 por utilizar la estrategia mixta PI :=

(Pll, ... ,Pu) es

";:,-

(1.3.4)

0.3.5)vhi,pi) ~ v2(pi,P2)

para cada distribución de probabilidad P2 sobre 52.

Definición. En el juego en forma normal de dos jugadores G := {S¡,S2; 'Ul/U2} lasestrategias mixtas (pi ,pi) fonnan un equilibrio de Nash si la estrategia r¡¡ixta

K [ J ]V2(Pl,PÚ:= f;P2k ~PljU2(S1j,S2k)

J K

:= L L Plj . P2k U2(Slj,S2k).j;1 k;l

Teoría avanzada: Estrategias mixtas y existencia de equilibrio / 37

para cada distribución de probabilidad PI sobre SI, y pi debe cumplir

Dadas VI (Pl,P2) YV2(Pl,PÚ podemos refommlar el requisito del equilibriode Nash de que la estrategia mixta de cada jugador tenga que ser unamejor respuesta a la estrategia mixta de los demás jugadores: para queel par de estrategias mixtas (pi ,pi) forme un equilibrio de Nash, pi debecumplir

K K

LP2k'Ul(Slj,S2k) ~ LP2kUl(S¡j~S2k)k;l k;1

para cada Slj' en SI' Esto es, para que una estrategia mixta sea una mejorrespuesta a P2 debe asignar una probabilidad positiva a una estrategiapura concreta sólo si ésta es una mejor respuesta a P2. De forma inversa,si el jugador 1tiene varias estrategias puras que son mejores respuestas aP21 cualquier estrategia mixta que asigna toda su probabilidad a algunaso ~ todas estas mejores respuestas en estrategias puras (y probabilidadcero al resto de las estrategias puras) es también una mejor respuesta deljugador 1 a P2.

Para dar un enunciado fonnal de la definición ampliada del equilibriode Nash necesitamos calcular'la ganancia esperada del jugador 2 cuandolos jugadores 1y 21;1tilizanlas estrategias mixtas PI y P2. Si el jugador 2 creeque el jugad m 1 utilizará las estrategias (Sl1,' .. ,S1]) con probabilidades(p11,' .. ,PIJ), la ganancia esperada del jugador 2 por utilizar las estrategias(S21,' .. ,S2K) con probabilidades (p21," . ,P2K) es

0,3.2)

(1.3.3)

K

L P2kUI (Slj,S2k),k;1

der cuando q := 1/2, el jugador 1 es también indiferente entre todas lasestrategias mixtas (,.,1 - r). Es decir, cuando q := 1/2 la estrategia mixta(r,1 - T) es la mejor respuesta a (q,1 - q) para cualquier valor de T entrecero y uno. Así, r* O /2) es todo el intervalo [O,1L como indica el segmentovertical de r*(q) en la figura 1.3.3. En el análisis del modelo de Coumoten la sección 1.2.A, llamamos a Ri(q) la función de mejor respuesta de laempresa i. AqUÍ, puesto que existe un valor de q tal que r*(q) tiene másde un valor, llamamos a r*(q) la correspondencia de mejor respuesta del~~dm1. J

Para derivar de forma más general la mejor respu~sta del jugadori a la estrategia mixta del jugador j, así como para dar un enunciadoformal de la definición ampliada del equilibrio de Nash, limitamos ahoranuestra atención al caso de dos jugadores, que permite presentar las ideasprincipales de modo más sencillo. Sea J el número de estrategias purasen .eh y J( el número de estrategias puras en S2. Vamos a escribir SI :=

{SI j, , , . ,S1] } y S2 := {S21, ... ,S2K }, y vamos a utilizar Slj y S2k para denotarlas estrategias puras arbitrarias de SI y S2 respectivamente.

Si el jugador 1 cree que el jugador 2 utilizará las estrategias (S21, ... ,S2K)

con probabilidades (p21,' .. ,P2K), la ganancia esperada del jugador 1 porutilizar la estrategia pura Slj es c

J [ K ]VI (Pl,P2) := L Plj c L P2kU¡ (Slj,S2k)j;l k;l

J K

:= L L Plj . P2k'Ul Cslj,S2k),j;l k;l

donde Plj . P2k es la probabilidad de que 1 utilice Slj y 2 utilice S2k. Laganancia esperada del jugador 1 con la estrategia mixta PI, dado en (1.3.3),es la Suma ponderada de las ganancias esperadas C con cada ~~a de lasestrategias puras {Sl1," . ,S1]} dada en (1.3.2), donde las ponderacionesson las probabilidades (Pll,'" ,PIJ)' AsÍ, para que la estratégia 'mixta(Pll, ... ,PI J) sea una mejor respuesta del jugador 1 a la estrategia mixta P2del jugador 2, debe cumplirse que Plj > Osólo si C c'

A continuación, aplicamos esta definición al juego de las monedas y ala batalla de los sexos. Para ello, utilizamos la representación gráfica de la

q1

(Cara)

1/2

q*(r)

---_._---j ..... _------------------'

Figura 1.3.6

(Cruz)

1/2

(Cruz)

La figura 1.3.6 es análoga a la figtira 1.2.1 del análisis de Cournotde la sección 1.2.A. Igual que la intersección de las funciones de mejorrespuesta R2(ql) y RI ('12) dio el equilibiio de.Nash del juego de Cournol,la intersección de las correspond~ncia,s d~ mejor respuesta r*(q) y q*(r)

nos da el equilibrio de Nash (ertestiategias mixtas) en el juego de lasmonedas: si un jugador i elige 0./2,1 /2), (1/2,1/2) es la mejor respuestadel jugador j, tal como lo exige eléquilibrio de Nash.

Teoría avanzada: Estrategias mixtas y existencia de eqllilil".jrJ / 39

(Cara) 1

r

Girando 90 grados la figura 1.3.4 y dándole la vuelta, obtenemos la. figura 1.3.5. Ésta es menos adecuada que la figura 1.3.4 como represen-tación de la mejor respuesta del jugador 2 a la estrategia mixta del jugador1, pero puede combinarse conla figura 1.3.3 para obtener la figura 1.3.6.

mejor respuesta del jugador.í a la estrategiamixla del jugador j presellt~Jaen la figura 1.3.3. Para complementar la figura 1.3.3 calculamos el(los)valor(es) de '1, denotado(s) por '1*(1'), tal(es) que ('1,1 - '1) es una mejor. respuesta del jugador 2 a (r,l - r) del jugador 1. Los resultados se recogenen la figura 1.3.4. Si r < 1/2, la mejor respuesta de 2 es cruz, de forma queq*(r) = O.Del mismo modo, si r > 1/2, la mejor respuesta de 2 es cara, deforma que q*(r) = 1. Si r = 1/2, el jugador es indiferente no sólo entre caray cruz sino también entre todas las estrategias mixtas ('1,1 - '1), de formaque '1*0/2) es todo el intervalo [O,1].

q(Cara)

q*(r)

1

. (Cara)

q*(r)

1/2

Figura 1.3.4

-------- ..-...'

Figura 1.3.5

q

1/2

r

(Cruz)

(Cruz)

(Cara) 1

(Cara) 1

(Cruz)

(Cruz)

de cada jugador es una mejor respuesta a la estrategia mixta del otro jugador:(1.3.4) y (1.3.5) deben cumplirse.

38/ JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. ])

:'~:,

(

l:, .

(

q*(r)

1/3

2/3

(Boxeo)'

Figura 1.3.7

(Ópera) 1

(Boxeo)

de las correspondencias de mejor respuesta de los jugadores, existen en lafigura 1.3.7 tres intersecciones de r*(q) y q*(r): (q = 0,1' = O), (q = 1,r = 1)Y (q = 1/3,1' = 2/3). Las dos primeras intersecciones representan losequilibrios de Nash en estrategias puras (boxeo, boxeo) y (ópera, ópera)descritos en la sección 1.1.c.

Teoría avanzada: Estrategias mixtas y existencia de equilibrio I 41

l'

r*(q)

_.:,'

En cualquier juego, un equilibrio de Nash (que incluya estrategias pu-ras o mixtas) aparece como una intersección:,dJUas:.c.QITespon.dencias,demejor respuesta de los jugadores, induso cuando:háymás de dosjugá-dores y también cuando algunos o todos lósjugadores tienen más de dosestrategias puras. Por desgracia, los únicos juegos en los que las co~es-pondencias de mejor respuesta de los jugadores tienen representaciones'gráficas sencillas son los juegos de dos jugadores en:lasque cada jugadorsólo tiene dos estrategias. Discutimos ahora con un argumento gráfico quecualquier juego de ese tipo tiene un equilibrio de Nash (que posiblementeincluya estrategias mixtas).

Consideremos las g¡mancias del jugador) representadas en la figura1.3.8. Hay dos comparacionesfu:1portantes:' x con z e y con w. Basándonosen estas comparaciones, podemosdefi.iur cuatro casos principales: (i)x > z e y > w; (ii) :É < z e y < w; (iii) x > z e y < w, y (iv) x < ze y > w. Discutimos primero estos cuatro casos y luego abordamos loscasos restantes en los qliex '= z' o y =w, '

,~.'i~i....---------------------------------------------------

40 I JUEGOS ESTÁTICOS CON INfORMACIÓN COMPLETA (c. 1)

Conviene resaltar que el equilibrio de Nash en estrategias mixtas no sebasa en que ningún jugador lance una moneda al aire, arroje unos dados oelija de forma aleatoria una estrategia. Más bien, interpretamos la estrate-gia mixta del jugador j como una representación de la incertidumbre deljugador i respecto a la decisión del jugador j sobre la estrategia (pura) queva a seguir. En béisbol, por ejemplo, el lanzador puede decidir si lanzaruna bola rápida o una curva basándose en cómo le salieron los lanzamien-tos durante el entrenainiento. Si el bateador conoce el razonamiento dellanzador pero no sabe qué ocurrió durante su entrenamienfo, puede serque crea que existen las mismas posibilidades de que el lanzador lanceuna bola rápida o Curva. Representaríamos entonces la conjetura del ba-teador como la estrategia mixta del lanzador (1/2,1/2), cuando en realidadel lanzador elige una estrategia pura basándose en la información que nodispone el bateador.

Enunciado de un modo más general, la idea consiste en dotar al juga-dor j de una cierta información privada de manera que, dependiendo decómo el jugador j entienda dicha información, se incline por una de lasestrategias puras posibles. Sin eh1bargo, puesto que el jugador i no dis-pone de la información privada de j,i continúa con la incertidumbre deno saber cuál será la decisión de j, y representamos dicha incertidumbrede i como una estrategia mixta de j.' Ofrecemos un enunciado más formalde esta interpretación de las estrategias mixtas en la sección 3.2.A.

Consideremos la batalla de los sexos, de la sección 1.1.c, como unsegundo ejemplo de equilibrio de Nash con estrategias mixtas. Sea (q,1- q)

la estrategia mixta en la cual Pat elige la ópera con probabilidad q y sea(1',1 - 1') la estrategia mixta en la cual Chris elige ópera con probabilidad 'r.SiPat elige (l},l-q), 'las ganancias esperadas de Chris son q.2+(1-q)'0 = 2q

al elegir ópera y q'O + (1 - q) . 1 = 1- q al elegir boxeo. AsÍ, si q > 1/3,la mejor respuesta de Chris es ópera (es decir, l' = 1); si q < 1/3 la mejorrespuesta de Chris es boxeo (es decir, l' = O) y, si q = 1/3, cualquier valorde l' es una mejor respuesta. De modo similar, si Chris elige (1',1 - 1')

las ganancias esperadas de Pat son l' . 1 + O - 'r) . O = l' al elegir ópera y1'.0+(1 -1').2 = 20-r) al elegir boxeo. AsÍ, si l' > 2/3, la mejor respuesta dePat es ópera (es decir, q = 1);si l' < 2/3 la mejor respuesta de Pat es boxeo(es decir, q = O) y, si r = 2/3 cualquier valor de q es una mejor respuesta.Como muestra la fig'ura 1.3.7, las estrategias mixtas (q,1 - q) = 0/3,2/3)de Pat y (-1',1 - 1') = (2/3,1/3) de Chris forman, por lo tanto, un equilibriode Nash.

Al contrario que en la figura 1.3.6,donde sólo existía una intersección

,-----,

42/ JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1)

Figura 1.3.9

Figura 13.8

r*( q)

._. __ .

q'l q(Izquierda) (Derecha)

Caso (iv)

(Baja)

Figura 1.3.10

(Alta)

1 q(Derecha)

r*( q)

Caso (iii)

q'(Izquierda)

(Baja)

(Alta)

Puesto que ql = 1 si x = Z y ql = Osi y = w, las correspondencias demejor respuesta en los casos en que ocurra x = Z o y = w tienen forma deL (es decir, dos caras adyacentes del cuadrado unitario), como ocurriríaen la figura 1.3.10si ql = Oo 1 en los casos (iij) y (iv).

Añadiendo ganancias arbitrarias del jugador 2 a la figura 1.3.8 y rea-lizando cálculos análogos obtenemos la mismas cuatro correspondenciasde mejor respuesta, con la salvedad de que en el eje horizontal se mider y en el vertical se mide q, como en la figura 1.3.4. Girando 90 gradosy dando la vuelta a esas cuatro figuras, como hicimos para obtener 1.3.5,obtenemos 1.3.11y 1.3.12. (En estas figuras r' se define de forma análogaa q' en la figura 1.3.10.)

La cuestión crucial es que, dada cualquiera de estas cuatro corres-pondencias de mejor respuesta del jugador 1, r'(q) de las figuras 1.3.9 o1.3.10,y cualquiera de las cuatro del jugador 2, q'(r) de las figuras 1.3.11o 1.3.12, el par de correspondencias de mejor respuesta tiene al menosuna intersección, por lo qtieel juego tiene al menos un equilibrio de Nash.Comprobarlo para los di~ciséis pares posibles de correspondencias de me-jor respuesta se deja como ejercicio. En lugar de ello, nosotros vamos a

Teoría avanzada: Estrategias. mixtas y existencia de equilibrio / 43

En los casos (iii) y (iv), ni alta ni baja son estrictamente dominadas.Así, alta debe ser óptima para algunos valores de q y baja óptima pilfa losdemás. Sea ql = (w - y) /(x - Z + w - y). En el caso (iii) alta es óptima paraq> q' y baja para g < ql, mientras que en el caso (iv) ocurre lo contrario.En ambos casos, cualquier valor de r es óptimo cuando q = q'. Estascorrespondencias de mejor respuesta se representan en la figura 1.3.10.

r*(q)

1 q(Izquierda) (Derecha)

Caso (ii)

-r(Alta) 1 f------~

(Baja)

x,--..:. y,-.-

Z,- 10,-

r*(q)

1 q(Izquierda) (Derecha)

Caso (i)

r(Alta) 1 f-c_=._=... 7::"".__=. __=.__=._~_._-_ -~.

<Baja)

Jugador 2

Izquierda Derecha

Jugador 1Baja

Alta

En el caso (i) para el jugador 1 alta,domi~a estrictamente a baja, y enel caso (ii) baja domina estrictamente a alta ...Recordemos de la secciónprevia que una estrategia es estrictamente dornin~da si y sólo si no existeuna conjetura que el jugador i pudiera ~onrtaise(sobre las estrategias queelegirán los demás jugadores) tal quehicierá óptimo elegir Si. ASÍ, si(g,l - g) es una estrategia mixta del jugador 2, donde g es la probabilidadde que 2 elija izquierda, en el caso (i) no existe un valor de g tal que bajasea óptima para el jugador 1, y en el caso (ii)no existe un valor de g talque alta sea óptima. Si (r,l- r) denota una estrategia mixta del jugador 1en la que r es la probabilidad de que 1 elija alta, podemos representar lascorrespondencias de mejor respuesta para los casos (i) y (ii) como en lafigura 1.3.9.(En estos dos casos las correspon<:ienciasde mejor respuestason de hecho funciones: de mejorrespuesta, puesto que no existe un valorde g tal que el jugador 1 tenga múltiples mejores respuestas.)

.,',,~..,'

.H I JUEGOS ESTÁTICOS CON INFORMACiÓN COMPLETA (e 1)

16 Los casos que incluyen x ~ z o y ~ w no contradicen la afirmación de que el par decorrespondencias de mejor respuesta tiene al menos una intersección. _Al contrario, ademásde las características cualitativas descritas en el texto, pueden ahora darse dos equilibrios deNash en estrategias puras sin un equilibrio de Nash en estrategias mixtas, y un continuo deequilibrios de Nash en estrategias mixtas.

1"',',.

¡(x)

x*

Teorla avanzada: Estrategias mixtas y existencia de equilibrio I 45

Figura 1.3.13

x* 1 x

Concluimos esta sección con una discusión sobre la existencia delequilibrio de Nash en juegos más generales. Si formularnos los argumen-tos anteriores para juegos de dos por dos en forma matemática en vez degráfica, podernos generalizarlos para aplicarlos a juegos con n jugadorescon espacios de estrategias finitos y arbitrarios.

L~ dem¿str~ciÓn del t~orema de Nash utiliza un teorema de p~ntofij~.Como ejemplo simple de un teorema de punto fijo,supongamos que f(x)es un~funciÓn c¿ñtirma con"dominio [O, 1] YrecOrTid6[O, ir. El teoremade punto fijo de Brouwer garantiza que existe al menos Un punto fijo, esdecir, existe al'~eno~' unv¡¡lot x* en [O, 1] tal que f(x*) = x*: Tenernos unejeiriplo 'de eIIcí' en l~figura}.3~ 13.' . . .

.-La apÍi~ación d.eU~.~r~~~de punto fijo p~ademosi:rar. el ~~.oJ:~m~~4~Nfl;~hs~,h~ceen dos~~ap?s: (1) mostJ:ando que, cualquier PJP1.to,fijo.,:,~,~una cierta corr~sponder:ciaes lll1 equilibrio,de Nash y (2}u~~aIlclp,l},I1teorema de punto fijo ildecuado para demostrar que esta corresponden~adebe tener un punto fijo. La correspondencia apropiada es la correspon-dencia de mejor respuesta de n jugadores, El teorema de punto fijo rele-vante se debe é\KaJ~utani"(194l),quien generé\lizó el teorema de Brom":erco~ '~'lfin déiÍlcIuir c'orr~sp~ndéncias (de bueIl comportamiento) adei1{ásde funciones. Lacprresp()ndénciade mejor'r~spuesta de n jugadores seobtiene a partir de laséorr~sponqencias individuales de mejor respuest~

Teorema. (Nash (1950): En el juego en forma normal de n jugadores G :o

{S1,'" ,Sn; 'U1,'" ,un}, si n es un número finito y 9ies finito para cada i,existeal menos un equilibrio de Nash, que posiblemente incluye estrategias mixtas.

q*(r)

1 q(Derecha)

Caso (iv)

-

q*(r)

1 q(Izquierda). (Derecha)

Caso (ii)

(Izquierda)

(Alta) 1 f-.--"--_-----~

(Baja)

q*(I)

1 q(Derecha)

Caso (i)

(Baja)

r

(Alta) 1

Figura 1.3.11

Figura 1.3.12

1 q(Derecha)

Caso (iii~

q*(r)

(Izquierda)

(Alta) 1 1-------"

(Baja)

(Izquierda)

r'

r

(Alta) 1

(Baja)

describir las características cualitativas que pueden resultar. Puede darse:(l) un único equilibrio de Nash en estrategias puras; (2)un único equilibriode Nash en estrategias mixtas; o (3) dos equilibrios en estrategias puras yun único equilibrio en estrategias mixtas. Recordemos el caso de la figura1.3.6, el juego de las monedas, que constituye un ejemplo del caso (2) yel de la figura 1.3.7, la batalla de los sexos, que constituye un ejemplo delcaso (3). El dilema de los presos es un ejemplo del caso (1); se obtiene dela combinación del caso (i) o (ii) de T*(q) con el caso (i) o (ii) de q*(r).16

L

Consúltese Brandenburger (1992) sobre los supuestos en que se fundamen-tan la eliminación iterativa de las estrategias estrictamente dominadils yel equilibrio de Nash, y también sobre la interpretación de las estré1tegiasmixtas en términos de las conjeturas de los jugadores. Sobre la relaciónentre los modelos (tipo Coumot),en los que las empresas eligen cantidil-des y los modelos (tipo Bertrand), en los que las empresas eligen precios,

1.4 Lecturas adicionales

Lecturas adicíol1alfs I 47

de la figura 1.3.10: para q == q', r*(q') incluye cero, uno y todo el intervé1loentre ellos. (De modo un poco más formal, r*(q') incluye el límite ele I"(q)

cuando q tiende a q' por la izquierda, el límite de r*(q) cuando q liende aq' por la derecha, y todos los valores de r entre ambos lúnites:) Si ¡(:¡;I)

en la figura 1.3.14 se comportara de forma análoga a la correspondenciade mejor respuesta del jugador 1, ¡(x') incluiría no sólo el círculo negro(como en la figura), sino también el círculo blanco y todo el intervillo entreellos, en cuyo caso ¡(x) tendría un punto fijo en x'.

La correspondencia de mejor respuesta de cada jugador se com.portilsiempre como r*(q') en la figura 1.3.14: siempre incluye (las generalizil-ciones adecuadas de) el límite por la izquierda, el límite por la derechay los valores intermedios. El motivo de esto es que, como demostramosanteriormente en el caso de dos jugadores, si el jugador i tiene varias es-trategias puras que son mejores respuestas a las estrategias mixtas de losdemás jugadores, cualquier estrategia mixta Pi que asigna toda su pro-babilidad a algunas o a todas las mejores respuestas en estrategias purasdeljugador i (y probabilidad cero al resto de las estrategias puras de i.) estambién una mejor respuesta del jugador i. Puesto que la corresponden-ci¡l.de mejor respuesta de cada jugador se comporta siempre delmisll10modo, io mismo ocurre con la correspondencia de mejor respuesta delos TI, jugadores. Estas propiedades cumplen las hipótesis del teoremil deKakutani, por lo que esta última correspondencia tiene un pu.nto fijo.

El teorema de Nash garantiza que existe un equilibrio en una ampliilclase de juegos, pero ninguna de las ilplicaciones analizadas en la sección1.2 pertenece a esta clase (porque cada aplicación tiene espacios de estrate-gias infinitos). Esto demuestra que lils hipótesis del teorema de NilSh soncondiciones suficientes pero no necesarias para que exista un equilibrio;existen muchos juegos que no cumplen las hipótesis del teorema pero, noobstante, tienen uno o más equilibrios de Nash.

x

¡(x)

x'

Figura 1.3.14

17 El valor de ¡(x') se indica conel círculo 'negro. El circulo blanco indica qué ¡(X') noincluye este valor. La línea discontinua se incluye únicamente para indicar que ambos círculosse dan cuando x = x'; no indica valores adicionales de ¡(x').

1

Para ilustrar las diferencias entre ¡(x) en la figura 1.3.14y la corres-pondencia de mejor respuesta de un jugador, consideremos el caso (iii)

46 I JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (e. 1)

de los n jugadores del modo siguiente: consideramos una combinaciónarbitraria de estrategias mixtas (Pl,' .. ,Pn)' Para cada jugador i derivamosla mejor respuesta(s) de i a las estrategias mixtas de los otros jugadores(Pl,'" ,Pi-l,P'i+l,' .. ,Pn)' Construimos a continuación el conjunto de todaslas combinaciones posibles de dicha mejor respuesta para cada jugador.(Formalmente derivamos la correspondencia de mejor respuesta de cadajugador y luego construimos el producto cartesiano de estas n correspon-dencias individuales.) Una combinación de estrategias mixtas (pi, ... ,p~)es un punto fijo de esta correspondencia si (pi, ... ,p~) pertenece al con-junto de todas las combinaciones posibles de las mejores respuestas de losjugadores a (pi, ... ,p~). Es decir, para cada i, pi debe ser la mejor (o unade las mejores) respuesta(s) del jugador i a (pi, ,Pi-l,pi+l' ... ,p~), peroesto es precisamente la afirmación de que (pi, ,p~) es un equilibrio de'Nash. Con ello, completamos la primera etapa. ; :

La segunda etapa utiliza el hecho de que la correspondencia de me-jor respuesta de cada jugador es continua, en un sentido adecuado deltérmino. El papel de la continuidad en el teorema de punto fijo de Brou-wer puede observarse modificando ¡(x) en la figura 1.3.13: si ¡(x) esdiscontinua, no tiene necesariamente un punto fijo. En la figura 1.3.14,por ejemplo, ¡(x) > x para toda x < x', pero ¡(x') < x' para x 2: x',17

(.e..

..,;.

1.5Consideremos las dos versiones finitas siguientes del modelo de duo-polio de Coumot. En primer lugar, supongamos que cada empresa debeelegir o la mitad de la cantidad de monopolio, qm/2= (a -c)j4,o la-can~tidad de equilibrio de Coumot, !Je = (a -c)/3. No pueden darse otrascantidades, Demuéstrese que este juego con dos alternativas es, equiva-lente. al dilellla de los preso;>: cada eIIlpresa tiene una estrategia estric-tamente dominada, y ambas están peor en equilibrio que si cooperasen.En segundo lugar, supongamos que cada empresa puede elegir o qm/2 oqe, () una tercera cantid\idq' .. Hállese un valor de q' tal que el juego seaequivél.1ehteal modelo de Coumot de la sección 1.2.A, en el sentidq'deque (qe,qe) sea un equilibrio de Nash único y ambas empresas estén .pem;en equilibrio de lo que estarían si cooperasen, pero ninguna de ellas tieneuna estrategia estrictamente dominada.

Ejercicios / 49

1.6 Considérese el modelo de duopolio de Coumot en el que la demandainversa es P(Q) = a - Q pero las empresas tienen costes marginalesasimétricos, Cl para la empresa 1 y C2para la empresa 2. ¿Cuál es elequiJibrio de Nash si O < e.; < a/2 para cada empresa? ¿Qué ocurre siel < C2< a pero 2C2 > a + Cl?

1.7 En la sección 1.2.Banalizamos el modelo de duopolio de Bertrand conproductos diferenciados. En el caso de productos homogéneos se obtieneun resultado poderoso. Supongamos que la cantidad que demandan losconsumidores a la empresa i esa - Pi cuando Pi < Pj, Ocuando Pi > Pj,y (a - Pi)/2 cuando Pi =Pj. Supongamos también que no hay costesfijos y que los costes marginales son constantes e iguales a c, donde c < a.Demuéstrese que si las empresas eligen precios simultáneamente, el únicoequilibrio de Nash consiste en que ambas empresas fijen un precio c.

1.8 Considérese una población votante uniformemente distribuida en elespectro ideológico que va de la izquierda (x = O)a la derecha (x = 1).Cada uno de los candidatos para un único puesto elige simultáneamente

por P(Q) = a - Q (suponiendo que Q < a; en el caso contrario P = O).Supongamos que para la empresa .i el coste total de producir la cantidad qies Ci(qi) = cqi. Esdecir, no hay costes fijosy el coste marginal es constante e. igual a c, donde suponernos que e < a. Siguiendo a Coumot, supongamosque¡as empresas eligen sus volúmenes de producción simultáneamente.¿(:uál es el equilibrio de Nash? ¿Qué ocurre cuando n tiende a infinito?

2,0 1,1 4,2

3,4 1,2 2,3

1,3 0,2 3,0

consúJtese Kreps y Scheinkman (1983),quienes demuestran que en algu-nas circunstancias el resultado de Cournot se da en un modelo de tipoBertrand en el cual las empresas se enfrentan a restricciones de capaci-dad (que escogen a un cierto coste antes de elegir los precios). Sobreel arbitraje, consúltese Gibbons (1988), quien demuestra que el acuerdopreferido por el árbitro puede depender del contenido informativo de lasofertas de las partes, tanto en el arbitraje convencional como en el de ofertafinal. Finalmente, consúltese Dasgupta y Maskin (1986) sobre la existen-cia del equilibrio de Nash en juegos con espacios de estrategias continuos,incluyendo equilibrios en estrategias puras.

1.1 ¿Qué es un juego en fonna normal? ¿Qué es una estrategia estricta-mente dominada en un juego en forma normal? ¿Qué es un equilibrio deNash con estrategias puras en un juego en forma normal?

1.5 Ejercicios

A

MB

~8 / JUEGOS ESTÁTICOS CON INFOIUVIACJÓN COMPLETA (c. 1)

[ C D

1.2 En el siguiente juego en fonna normal, ¿qué estrategias sobrevivena una elirnin'.lcián iterativa de las estrategias estrictamente dominadas?¿Cuáles son los equilibrios de Nash con estrategias puras?'

1.3 Los jugadores 1 y 2 están negociando cómo repartirse mí! pesetas.Ambos jugadores indican simultáneamente la parte de las mil pesetasque querrían conseguir, SI y s2,donde O ~ 81,S2 ~ 1. Si SI + S2 ~ 1,los jugadores ven cumplidos sus deseos; si SI + S2 > 1, ambos jugadoresreciben cero pesetas. ¿Cuáles son 105 equilibrios de Nash con estrategiaspuras de este juego?

1.4 Supongamos que existen n empresas en el modelo de oligopolio deCournot. Sea qi la cantidad producida por una empresa i, y sea Q =

!JI + ... + qn-la cantidad agregada .en el mercado. Sea P el precio deequilibrio de mercado"ysupongamos.que laderriandainversa viene dada

Fecha 2

] ]'UJl,W22:7/11'2:W]

1 1W2,1.v] 2: 'UJ2, 2: 'UJ2

Solicitar aempresa 1

Trabajador 1

Trabajador 2

Solicitar a Solicitar aempresa 1 empresa 2

AUMANN,R. 1974, "Subjectivity and Correlation in Randomized Strate-gies" Journal of Mathematical Ecol1omícs 1:67-96.-. 1976. "Agreeing to Disagree." Al1l1als of Statístics 4:1236-39.

-. 1987. "Correlated Equilibrium as an Expression of Bayesian Rationa-lity." Ecol1ometrica 55:1-18.

BERTRAND,T1883. "Théorie Mathématique de la Richesse SociaJe."]oumaldes Saval1ts 499-508.

BRANDENBURGER,A. 1992. "Knowledge and Equilibrium in Carnes." Depróxima aparición en Journal of Ecol1omic Perspectives.

Solicitar aempresa 2

Referellcins / 51

1.6 Referencias

1.14 Demuéstrese que la proposición B en el apéndice a la sección 1.l.Cse cumple tanto para equilibrios de Nash con estrategias puras como conestrategias mixtas: las estrategias utilizadas con probabilidad positiva enun equilibrio de Nash con estrategias mixtas sobreviven al proceso de€liminación iterativa de las estrategias estrictamente dominadas.

solicitar trabajo en una de las empresas. Los trabajadores deciden si-multáneamente si solicitar el trabajo de la empresa 1 o de la empresa 2.Si sólo un trabajador solicita trabajo en una de las empresas, dicho tra-bajador obtiene el trabajo. Si ambos trabajadores solicitan trabajo en lamisma empresa, la empresa contrata a uno de ellos aleatorialnente, y elotro queda desempleado (lo que significa una ganancia cero). Hállenselos equilibrios de Nash del juego en forma normal. (Para más informaciónsobre los salarios que fijarán las empresas, consúltese Montgomery [1991J.)

1.9¿Qué es una estrategia mixta en un juego enfórma normal? ¿Qué es Unequilibrio de Nash con estrategias mixtas en un juego en forma normal?

" ' f

1 D

A 2,1 0•.2

B 1,~10

. J':

SO/JUEGOS ESTÁTICOS CON INFORMACIÓN COMPLETA (c. 1)

un programa electoral (es decir, un punto eh la línea entre x = O Yx = 1).Los votantes observan el programa de los candidatos y luego cada votantevota por el candidato cuyo programa se acerque más a su posición en elespectro. Si, por ejemplo, hay dos cahdidatos y eligen programas x] = 0,3YX2 = 0,6, todos los votantes a la izquierda de x = 0,45votan al candidato1, y todos los que están a la derecha votan al candidato 2, y el candidato 2gana la elección con un 55 por ciento de los votos. Supongamos que a los~andidatos sólo les importa ser elegidos; en realidad, su progr?ma no lesmteresa para nada. Si hay dos candidatos, ¿cúaJ es el equilibrio de Nashcon estrategias puras? Si hay tres caIldidatos,indíquese un equilibrio deNash con estrategias puras. (Supongamos qué cuarido vanos candidatoseligen el mismo programa, los votos obtenidos por ese programa se divi-den apartes iguales, y quelos empates entré'l?sq¡je~onsiguen más votosse resuelven a cara o,cruz.) VéaseHotelling (1929)pa.ra un primer modelosimilar. ... " "~o " '1,;

1.10Demuéstrese que no existen equilibrios de Nash con estrategias mix-tas en los tres juegos en forma normal analizados en la sección 1.1: Eldilema de los presos, el de la figura 1.1.1 y,el de la figura 1.1.4.

1:11 ~állese el equilibrio de Nash con estrategias mixta~ del juego deleJerCICIO1.2.

1.12 Hállese el equilibrio de Nash con estrategias mixtas del siguientejuego en forma normal:

1.13 Dos empresas ofrecen un puesto de trabajo cada una. Supongamosque (por razones que no discutimos aquí, pero que se refieren al gradode importancia de que se ocupe el puesto) las empresas ofrecen salariosdife~ntes: la empresa i ofrece el salario Wi, donde (1/2)w] < 'UJ2 < 2w] ..

Imagmemos que hay dos trabajadores, cada uno de los cuales sólo puede

.'/}

52/ JUEGOS ESTÁTICOS CON INFORMACiÓN COMPLETA (e. 1)

COURNOT,A. 1838. l\echerches Sllr les Principes Mathématiques de la Théoriedes Richesses. Edición inglesa: Researches into the Mathematical Principies oftheon) of Wealth. Publicado por N. Bacon. New York: Macmillan, 1897.

DASGUPTA,P, y E. MASKIN,1986. "The Existence of Equilibrium in Discon-tinuous Economic Games, 1:Theory." ReviC'U!of Economic Studies 53:1-26.

FARBER,H., 1980, "An Analysis of Final-Offer Arbitration."Journal of Con-flict Resolution 35:683-705.

FRIEDMAN,J. 1971. "A Noncooperative Equilibrium for Supergames."Review of Economic Studies 28:1-12.

GIBBONS,R. 1988. "Learning in Equilibrium Models of Arbitration." Ame-rieclrlEconomic Review 78:896-912.

HARDIN,G. 19613."The Tragedyof the Commons." Science 162:1243-48.

HARSANYI,J. 1973. "Games with Randornly Disturbed Payoffs: A NewRationale for Mixed Strategy Equilibrium Points." International Journal ofCame Theory 2:1-23.

HOTELLING,H. 1929. ';Stability in Competition." Economic JournaI39:41-57.

HUME,D. 1739. A Treatise of Human Nature. Reedición. Londres: J. M.Dent. 1952.

KAKUTANl,S. 1941. "A Generalization of Brouwer' s Fixed Point Theorem."Dllke Mathematieal Joumal 8:457-59.

KREPS,D., y J. SCHElNKMAN.1983. "Quantity Precommitrnent and Ber-trand Competition Yield Cournot OutcolIles." Bell JOL/rnal of Economics4:326-37.

MONTGOMERY,J. 1991. "Equilibrium Wage Dispersion and InterindustryWage Differentials." Qllarterly JOl/mal of Economics 106:163-79.

NASH,J. 1950. "Equilibrium Points in n-Person Games." Proceedings of theNational Aeademy of Sciences 36:48-49.

PEARCE,O, 1984. "Rationalizable Strategic Behavior and the Problem ofPerfection." Econometrica 52:1029-50.

STACKELBERG,H. VON, 1934, Marktfonn L/nd Cleichgewicht. Viena: JuliusSpringer.

2. JUEGOS DINÁMICOS

CON INFORMACIÓN COMPLETA

Ijnestecapítulo presentamos los juegos dinámicos. De nuevo, limi~a-mas nue~tra atención a los juegos con información completa. (es dédr;juegos en los que las fundones de ganancias de los jugadores so~ Wor-maciónqel doriúnio público); véase una introducción a 10s'juégOs coninformación incompleta en el capítulo 3. En la sección 2.1 analiZarnoslos juegos dinámicos no sólo con información completa, sino tambiéÍi:co~información perfecta, lo que significa que en cada momentodeI'jí1ego;~1jugador a quien le corresponde decidir conoce la historia cómple'fá:detodas las decisiones tornadas hasta ese momento. En las seccióries'i;2'¡;2.4, considercunos los juegos con información completa pero imperfeét~:en algún momento ~~l juego el jugador a quien le corresponde decidirnoconoce toda lahistoria del juego. .

El tema central en todo juego dinámico es el de la credibilidad. Comoejemplo de una amenaza que no resulta creíble, consideremos el siguientejuego de dos tiradas. Primero, el jugador 1 escoge entre dar 1.000 pesetsal jugador 2 () no darle nada, Én segundo lugar, el jugado.r2 observa ladecisióridel jugador 1 y de~ide si hacer estallar o no una granada quelos matara a los dos. Supongamos que el jugador 2 amenaza' c;on hacerestallar la granada a no ser que el jugador 11e page las 1.000 pesetas. Siel jugador. 1 cree que puede cumplirse la amenaza, su mejor respuesta esla de pagar las 1.000 pesetas. Pero el jugador 1 no debería creerse unaamenaza semejante: si al jugador :2 s~ le diera la oportunidad de ejecutardicha amenaza, escogería no hacerlo., Por tanto, el jugador 1 no debería'pagar nada al jugador 2.1

En la sección 2.1 analizamos los siguientes casos de juegos dinámicoscon información completa y perfecta: el jugador 1 decide primero, actoseguido el jugador 2 observa la decisión dél jugador 1y finalmente el juga-

1.El jugador 1 podría preguntarse si un o?>n~nie que amenaza con hacer explotar una'granada está loco. Este tipo de dudas se modelali como información incompleta, porque eljugador 1 no está seguro de la función dé ganancias del jugador 2 (véase capítulo 3).

,','.'.'

c\'.','.

(,

1",'

:','..

54 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

dar 2 toma su decisión con lo que concluye el juego. Eljuego de la granadapertenece a esta clase, como el modelo de duopolio de Stackelberg (1934) y. el modelo de Leontief, (1946) de determinación de salarios y nivel de em-pleo en una empresa con fuerte implantación de un sindicato. Definimos

.' el resultado por inducción hacia atrás y consideramos brevemente su relación'" con el equilibrio de Nash (posponiendo la discusión de esta relación hastala sección 2.4). Resolvemos los modelos de Stackelberg y Leontief, uti-lizando este criterio. Derivamos también un resultado a~álogo para elmodelo de negociación de Rubinstein (1982), aun cuando ese juego tieneuna sucesión potencialmente infinita de tiradas y, por tanto, no perteneceala cl~se de juego,s considera~a, '.

. En la sección 2.2 ampliamos la clasé de juegos analizada en la secciónanterior: primero ambos jugadores 1 y2 deciden simultáneamente, actoseguido los jugadores 3 y 4 observanlas decisiones de 1 y 2y finalmente,los jugadores 3 y 4 deci~fensimultáneámente'c!Jn lo que concluye el juego.Como ya se explicará en la sección 2.4, la simultaneidad de las decisionessignifica en este contexto que estos juegos son de información imperfecta,Definimos el resultado perfecto en subjuegos dé tales juegos, que es la ex-tensión natural de la inducción hacia atrás. Resolvemos losmodelos deDiamond. y Dybvig (1983) de pánico bancario" un modelo de aranceles yde competencia internacional imperfecta y el modelo de los torneos deLazearyRosen (1981), utilizandoeste.criterio.

En la sección 2.3 estudiamos los juegos repetidoS"; en los cuales ungrupo determinado de participantes juegan repetidamente un determi-nado juego, habiendo observado los resultados de las anteriores rondasdel juego antes de iniciar la siguiente. El tema del análisis es que las ame-nazas y las promesas (creíbles) sobre el comportamiento futuro puedenafectar el comportamiento presente. Definimos el equilibrio de Nash perfectoen subjuegos para juegos repetidos y lo relacionamos con los resultados dela inducción hacia atrásy de la perfección en subjuegos definidos en lassecciones 2.1 y 2.2. Enunciamos y demostramos el teorema de tradiciónoral para juegos repetidos infinitamente y analizamos el modelo de Fried-man (1971) de colusión entre duopolistas de Coumot, el de Shapiro yStiglitz (1984) de salarios de eficiencia y el de política monetaria de Barroy Cardan (1983).

En la sección 2.4 presentamos las herramientas necesarias para anali-zar en general un juego dinámico con información completa, ya sea coninformaci9n. perfecta o imperfecta. Definimos la representacipn de unjuego enformaextensivaylárelacionamos con la representación en forma

Juegos dillámicos COI¡ ¡'¡formación completa y perfecta / 5.5

al presentada en el capítulo 1. Definimos también el equilibrio denorm ., ., 1Nash perfecto en subjuegos para juegos en general. La cuestlOn pnl~clpa

( to de esta sección como del capítulo en su cODjunto)es que un Juegotan h 'l'b' ddinámico con información completa puede tener muc os equt J nos eNash, pero algunos de ellos pueden incluir amenazas.o promesas que noson creíbles. Los equilibrios de Nash perfectos en subluegos son aquellosque pasan la prueba de credibilidad.

2.1Juegos dinámicos con información completa y perfecta

2.1.A Teoría: induccÍón hacia atrás

El juego de la granada es un representante de la siguiente clase de juegossencillos con información completa y perfecta:

1. El jugador 1 escoge una acción al del conjunto factible Al'2. El jugador 2 observa 0'1 y escoge una acción o,z del conjunto factible

Az.3. Las ganancias son 1J,1 (a1,o.z) y'Uz(al,o,z).

Muchos problemas económicos se ajustan a esta descripción.z Dos ejem-plos (que más adelante discutiremos con mayor detalle) so~ el mo~elo d,eduopolio de Stackelberg y el modelo de Leontief, de sal~~lO~y mv~l deempleo en una empresa con fuerte implantación ~~ un smdIcato .. ?lrosproblemas económicos pueden modelarse si permItimOSuna suce:J7n demovimientos más amplia, ya sea añadiendo más jugadores o penmllendoq~e los jugadores tiren más de una vez. (Elmodelo de negoci~ci.ónde Ru-binstein discutido en la sección 2.1.0 es un ejemplo de este ultImo caso.)Las característi~as clave de un juego dinámico con información completay perfecta son que (1) las decisones se toman de manera sucesiv~, .~2)todas las decisiones anteriores son conocidas antes de tomar la deOSlon

2 Se podría permitir que el conjunto fa~tH:'I~'del jugador 2, Az, dep:n~iera de la accióndel jugador 1, al' Tal dependencia podría d~notarse con AZ(aI) O podna Incorporarse en lafunción de ganancias del jugador 2 estableoendo que 11:z(a1'0,z) = -ex: para valores de a2

f ti'bl d do a Algunos movimientos del Jugador 1 podnan mcluso poner Anque no son ac es al'.' .al juego sin dar la oportunidad de move~ a~jugador 2; para tales valores de al, el conJ'.~ntode acciones factibles Az(o,J) contiene un umco elemento. de forma que el Jugador 2 no tieneelección posible.

-,1

56 / JUEGOS DINÁMICOS CON INFORMACiÓN COMPLETA (c. 2)

siguiente y (3) las ganancias de los jugadores para cada combinación po-sible de jugadas son información del dominio público.

Resolvemos un juego por inducción hacia atrás de la siguiente forma:cuando al jugador 2 le corresponda decidir en la segunda etapa del juego,se enfrentará al siguiente problema, dada la acción al previamente adop-tada por el jugador 1:

max 'u2(á.l,az).azEAz

Supongamos que para cada ajen Al, el problema de optimización deljugador 2 tiene una única solución que podemos denotar con Rz(al)' Éstaes la reacción (o mejor respuesta) a la acción del jugador 1. Dado queel jugador 1 puede resolver el problema de maximización del jugador 2tanto como el propio jugador 2, el jugador 1 debería prever la reacción deljugador 2 a cada acción al que 1 pudiera tomar, de forma que el"problemade 1 en la primera etapa se concreta en

max 'Ul (al,Rz(al»).alEA]

Supongamos que este problema de optimización del jugador 1 tienetambién una solución úlúca que podemos denominar aj. Llamaremosa (aj,Rz(aj» el resultado por inducción hacia atrás de este juego. El resultadopor inducción hacia atrás ignora las amenazas no creíbles: el jugador 1prevé que el jugador 2 responderá óptimamente a cualquier acción que 1pueda escoger jugando Rz(al); el jugador 1 ignora las amenazas por partedel jugador 2 que no favorezcan a 2 cuando el juego llegue a su segundaetapa.

Recordemos que en el capítulo 1 usamos la representación en forma. normal para estudiar juegos estáticos con información completa y hosconcentramos en la noción del equilibrio de Nash como concepto para so-lucionar tales juegos. Sin embargo, en la discusión sobre juegos dinámicosde esta sección no hemos hecho mención alguna ni de la representaciónen forma normal ni del equilibrio de Nash. Al contrario, hemos dado unadescripción verbal de un juego en (1)-(3) y hemos definido el resultadopor inducción hacia atrás como solución del juego. En la sección 2.4.Averemos que la descripción verbal en (1)-(3) es la representación en formaextensiva del juego. En esta sección estableceremos la relación entre lasrepresentaciones en forma extensiva y normal, y veremos que para juegosdinámicos la representación en forma extensiva es a menudo más con-veniente. En la sección 2.4.B definiremos el equilibrio perfecto de Nash

Juegos dinámicos con información completa y perfecta / 57

en subjuegos: un equilibrio de Nash es perfecto en subjuegos si ignoralas amenazas que no son creíbles en un sentido que definiremos con másprecisión. Veremos que pueden existir múltiples equilibrios de Nash enun juego de la clase definida por (1)-(3)" pero que el único equilibrio deNash perfecto en subjuegos es el equilibrio asociado con el resultado ob-tenido por inducción hacia atrás. Éste es un ejemplo de la observación,hecha en la sección 1.1.C, de que algunos juegos tienen múltiplesequili"brios de Nash pero tienen un equilibrio que destaca como la soluciónmásllamativa del juego.

Concluirnos esta sección explorando los supuestos de racionalidadinherentes en los argumentos de inducción hacia atrás. Considere~ospara ello elsiguiente juego de tres etapas en el que el jugador 1 decide dosveces:

1. El jugador 1 escoge J o D donde J finaliza el juego con ganancias de 2para el jugador 1 y Opara el jugador 2.

2. El jugador 2 observa la elección de 1. Si 1 escoge D entonces 2 escogeJ' o D', donde l' finaliza el juego con ganancias de 1 para ambosjugadores.

3. El jugador 1 observa la elección de 2(y recuerda su propia decis~~t:J:~la primera etapa). Si las deCisiones anteriores fueroniJ,y, pi enton2es1 escoge J" o D" finalizando ambas el juego, J" c0rtganane5.asde 3para el jugador 1 y Opara el jugador 2 y D" con ganancias ,de OY: 2respectiv~mente.,; ,

,_.; _~ : ....;,.:_a..;.:.:_:.:.:.l._.~:.,~. ;--:~.:. '~ ..<S- .., .: l:..:'::.~~¿'

Esta descripción verbal puede trélducirse al siguiente,juego en fempª.dgárbol. (Ésta es la representación en forma extensiva que definiremos. deforma más general en la sección 2.4.) La ganancia superior en el par .de ganancias que aparecen en el extremo de cada rama del árbol es laganancia del jugador 1; la inferior es la del jugador 2, ~;,'

Para calcular el resultado por inducc:ión hacia atrás de este' juegoempezamos por la tercera etapa (es dear,la segunda decisión deLjugador1). Aquí el jugador 1 se enfrenta a una elección entre una ,ganancia de.3por medio de 1" o una ganancia de Oa trayés de 'J)"; de forma que!" ~óptimo. Por tanto, en la segunda etapa, el jugador2 prevé que si él júegollega a su te;cera etapa el jugador 1 escogerá J", lo que le proporcionaríauna ganancia de O.Por tanto,~n la ¡¡egunda etapala decisión del jugador 2es entre una ganancia de 1por medio dé l' o una ganancia de Oa través deD', de forma que l' es óptimo. Consecuentemente, eh la primera etapa el

",.'.

c.

(, ,...

Juegos dil1tÍmicos COI1 il1formacióll completa y perfecta / 59

l. dor 2 lo sea: si 1piensa que 2 podría no ser racionill,ro no que e Juga 1" O'

pe . ger D en la primera etapa confiando en que 2 e 19wril, en1 podna esCO '. ' I" 1 tercerase nda, dando con ello la oportunida~.a 1 de Jug~r. ~n.8

la ; Otra osibilidad es quesea informaClon del dommlO ~ubhco q.ue el~taPd' 2 Pracional pero no que el jugador 1 sea racional: sIl es raClonalJuga or es. . /)

. que 2 cree que 1 podría no ser racional, 1 podna escoger enpero pIensa . l. ' tapa confiando en que 2 pensara que 1 no es raClona, y, por

la pnmera e "1 t El. DI con la esperanza de que 1jugara D en a tercera e ilpa._"

tanto, Jugara 1 '. d D r 'parteUSO de la inducción.hacia atrás presupone que la e eCClOn e po.

d leda explicarse siguiendo este razonamiento. Para algunos Juegos,, e pu . l' . D arque 1sin embargo, podría ser más razonable suponer que J~go ~.' .

. .' 1 En tales J'uegosel uso de la mducClon haclaes, efectivamente, lrraClOna . , . . • ..atrás pierd~ mucho de su atractivo como predlCclOn del J~ego,. tal comole a'sa al equilibrio de Nash en juegos en los que la teona de Juegos nop .' una solución única y no cabe esperar acuerdo alguno enbeproporclOna

los jugadores.

2.1.B El mod~lo de duopolio de Stackelberg

Stackelberg (1934) pr!Jpuso un modelo dinámico de duopolio en el cu~lunae'mpresa dominante (o líder) decide primero y una empresa subordI-nada (o seguidora) decide en segundo lugar. En al~nosmome~üos dela historia de la industria automovilística estadourudense: por ~Jel1lplo,General Motors parece haber jugado este papel de líder. Es mmedlat.o am-pliar esta des~ripción al caso en que haya más de una empresa segUidora,como Ford~ Chrysler y otras. Siguiendo a Stackelberg, de~arrollarelJlos elmodelo bajo el supuesto de que las empresas escogen cantidades, como enel modelo de Coumot (donde las empresas deciden simultáneamente en

d . ente como aqUlO DeJ'amos como ejercicio el desarrolloveZ e suceSlvam . ,de un modelo de tomas de decisiones sucesivas en el que las empresas

1 . s tal como lo hacen (simultáneamente) en el modelo eleescogen os preclO " ' ' .Bertrartd. ,

El desarrollo temporal del juego es el sig'uiente: (1) La empresa 1

t'd d > O. (2) la empresa 2 observa 11 y escoge entoncesescoge una can 1 a ql _ , , . .una cantidad q2 ? O;(3) las ganancias de la empresa ~Vlenen dadas pOI lafunción de beneficio

'7ri(q;,qj) = qi[P(Q) - el,a - Q es el precio de equilibrio de mercado cuando ladonde P(Q)

58 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

Este argumento establece que el resultado por inducción hacia atráses que el jugador 1escoge I en la primera etapa y séacaba el'juegb: Auncuando el uso de la inducción hacia atrás establece que el juego sé acabaen la primera etapa, UIlaparte importante del'afgUiriento ftáhl dé 10 queocurriría si el juego no se acabase en esta primera etapa. En la segundaetapa, por ejemplo, cuando el jugador 2 prevé que si el juego llega a laterc;era etapa el jugador 1 elegirá I"¡ 2 está suponiendo que 1es racional.Este supuesto puede parecer inconsistente coil el hecho de qué 2 tienela oportunidad de decidir en la segunda etapa sólo si 1 se desVÍa delresultado obtenido por inducción hacia atrás. Es decir, puede parecer quesi 1juega D en la primera etapa, 2 no puede suponer en la segunda etapaque 1 sea racional, pero 'esto no es, así: si 1 juega D, en la primera etapaestá claro que no puede ser información del dominio público que los dosjugadores sean racionales; pero existen razones para que 1escogietaDque no contradicen el supuesto de2 de que 1esracionaL3 Una posibilidades que sea información del dominio público que el jugador 1 es racional

3 Recordemos deI a discusión sobre l~elimiración itera tiva de las,.•"~tr~tegiasest:ric~~~entedominadas (eIlla sección 1.1.,B),que es Ílúormación del domirti9pÚblicó que Io~ jug-adoresson racionales si todos los jugadores son ráciomiiés, y si todos los jugadófes S¡¡Í5~ft'qUe'tódoslos jugadore,s son racionales y si todoS los jugadores saben que,todoslos jugadores sálJeñ quelodos los jugadores son racionales, etc; adinjiilÍtum. , . ':! ",'

jugador 1 prevé que si el juego llega a la segunda etapa el jugador 2 elegirá1', lo que le proporcionará una ganancia de 1. La elección del jugador 1en la primera etapa es, por tanto, entre una ganancia de 2 por medio de Io una ganancia de 1 a través de D, de forma que I es óptimo.

,::~::

,.'0

60 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

cantidad agregada es Q ==qI + q2, j e es el coste marginal constante deproducción (siendo cero los costes fijos).

Para hallar el resultado por inducción hacia atrás de este juego, calcu-lamos en primer lugar la reacción de la empresa 2 a una cantidad arbitra-riamente fijada por la empresa 1. R2(ql) es una solución de

maX7r2(ql,q2)==maxq2[a - ql - q2 - el,Q22:0 qz 2:0

lo que resulta en

a-ql-eR2(ql) ==" 2 '

siempre, queql < a-e .. La misma' ecuación pár_aR2(ql) apareCiÓ ennuestro aniilisisdél' juego de Coumot con' qecisiones sinlultáneas en lasección D.A. La diferencia' es que aquí R2(iJ.~)e~~eal~e~:lte la reacciónpor parte de la~mpresa 2:á la cailtidadobservad~ que fijala empresa i,mientras que en el análisis de Coumot R2(qI) es la mejor respuestacle h:iempresa 2 a una cantidad hipotética que'será sil!lultáneamenteescogidapor la empresa 1. '."

Dado q:r,e}a empresa l. p~ede resolver el p~?b~~made la. empresa2 tantoc0fi.lo,.l.a,propia e~p¡'~~a 2, I~,e0presá 1debería prever q~e iaelección:'del~éantidad ql coinCidirá co"nla reaéciónR2(ql)' Por tanto, elproblema d~ laen:,.pr~sa 1 en la primera etapa del juego se concreta en

"maX7fl (ql,R2(ql») ==maxqIfa - ql - R2(qi) -:- el'_Q¡2:0, ,.' ,.' Ql2:0 • . . '. .

.. a- ql.""'"C==maxql '2 . ,.

Q¡2:0 .

lo que resulta' en

a-c a-cqi == -. -2- Y R2(qi) ==-4-

que es el resultado por inducción hacia atrás del juego del duopolio deStackelberg.4 '.. '.

4 De la misma forma que el "equilibrio de Cournot" y el "equilibrio de Bertrand" serefieren típicamente al equilibrio de Nash de los juegos de Cournot y Bertrand, la mencióndel "equilibrio de Stackelberg" significa a menudo que el juego es de decisiones sucesivas envez de ~u:nultáneas. Sin embargo, como se ha constatado en la secciÓ'nanterior, los juegoscon deaslones sucesivas poseen a menudo múltiples equilibrios de Nash, de los cuales sólouno está asociado can el resultado obtenido por inducción hacia atrás del juego, Por tanto, el"equi1ib~o de Stackelherg" puede referirse tanto a la naturaleza secuencial del juego como aluso de unrnterio de solución más poderoso que el mero equilibrio de Nash.

Juegos dinámicos con información completa y perfecta I 61

Recordemos que en el equilibrio de Nash del juego de Cournot delcapítulo 1,cada empresa produce (a-"'e)/3. Por tanto, la cantidad agregadaobtenida por inducción hacia atrás en el juego de Stackelberg, 3(a - e)/4,es mayor que la cantidad agregada en el equilibrio de Nash del juego deCournot, 2(a - c)/3, de forma que, el precio de equilibrio de me;cado esinferior en el juego de Stackelberg. Sin embargo, en el juego de Stackelbergla empresa 1 podía haber escogido la cantidad correspondiente al juegode Coumot, (a - e)/3, en cuyo caso la empresa 2 habría respondido con sucantidad de Coumot. Por tanto, en el juego de Stackelberg, la empresa 1podría haber alcanzado el nivel de beneficios de Coumot, pero escogió nohacerlo, por lo que los beneficios de la empre~a 1en el juego de Stackelbergdeben'ser mayores que sus beneficios en el juego de Cournot. Pero elprecio de equilibrio es inferior e:';lel juego de Stackelberg, de forma que rosbeneficios agregados son menores. Por tanto, el hecho de que la empresa1 esté mejor implica que la empresa 2 está peor en el juego de Stackelbergqueen el jueg() de Coumot.

La observación de que la empresa 2 se encuentra en peor situación enel juego de Stackelberg que en el juego de Coumot ilustra una diferenciaimportante que existe entre los. problemas de decisión uni cimultiperLsonale~:. En la teoría de la decisión con un único agente, eltenermás .información nunca puede hacer que el agente decisor esté peor. En teorÍade juegos, sin embargo, tener más información (o más precisamente, queotros jugadores sepan que uno tiene más información) puede hacer que unjugador esté peor. '

Eil el juego de Stackelberg, la información en cuestión es la cantidadde la empresa 1: la empresa 2 conoce ql y (tan importante como' estb)la empresa 1 sabe que la empresa 2 conoce ºl' Para ver el efecto que'esta información tiene, consideremos un,juego de decisión suc~siva algodistinto, en el que la empresa 1 escoge qr, después de lo cual la empresa2 escoge q2, pero lo hace sin haber observado. 111. Si la empresa 2 creeque la empresa 1 ha escogido su cantidad de Stackelberg qi ==(a - e)/2, lamejor respuesta para la empresa 2 es de nuevo R2(qi) ==,(a-e)/4. Pero si laempresa 1prevé que la empresa 2 creerá que ello vaya a ser así y, por tanto,escoja esta cantidad, la empresa 1 prefiere escoger su mejor respuesta a(a - e)/4 (es decir, 3(a - c)/8) en lugar de su cantidad de Stackelberg(a - c)/2. Por todo ello, la empresa 2 no debe confiar en que la empresa 1escoja su cantidad de Stackelberg. Más bien, el único equilibrio de Nash deeste juego secuencial es que ambas empresas escojan la cantidad (a - e)/3,

precisamente el equilibrio de Nash del juego de Cournot, en el que las dos

'.. ,"

".

Juegos dinámicos con infonlwción completa y perfecta / 1\3

R(L)

L

Figura 2.1.1

/ Pendiente = w

R'(L) - w = O.

L* (w)

R

6 Esta última propiedad es simplemente otra manera~e decir que L*('UJ) maximiza 7f( ["w)

dado 'UJ. Si el sindicato pide 'UJ', por ejemplo, la elecoon de L por larte d~ l~ empresa seconcreta en la elección de un punto en la recta hOrizontal w = 'UJ. El maxnno nivel debeneficio posible se alcanza escogiendo L de forma que la curva de isobeneficio que posa por(L,u/) sea tangente a la restricción 'UJ = 1J)'.

Para garantizar que la condición de primer orden R'(L) -w =. O~engasolución, suponemos que R'(O) = 00 y que R'(oo) = O,tal como tndlCa la

figura 2.1.1.La figura 2.1.2 representa L * (w) en función de tu (pero ~tiliza l~s e!es

de forma que faciliten la comparación con gráficos postenores) e lnchcaque L*(w) corta cada una de las curvas de isobeneficio de la e~1presaen su punto máximo.6 Manteniendo L constante, ~a empr~s~ ~sta t.antomejor cuanto menor sea w, de forma que las curvas :sobenefIClo ¡Dfenoresrepresentan niveles de beneficio más altos. La fi.gura 2.1.3 representalas curvas de indiferencia del sindicato. Mantemendo L constante, elsindicato está tanto mejor cuanto más alto sea w, de forma que las curvasde indiferencia más altas corresponden a niveles de utilidad mayores del

sindicato.

cuya condición de primer orden es

62 I JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

empresas deciden simu1táneamente.5 Por lo tanto, que la empresa 1 sepaque la empresa 2 conoce q¡ va en contra' de la empresa 2.

2.1.C Salarios y nivel de empleo en una empresa con fuerteimplantación sindical

max7r(w,L) =maxR(L) - wL,L2:0 L2:0

En el modelo de Leontief, (1946) de relación entre una empresa y unúnico sindicato (es decir, un sindicato que tiene el poder de monopolio deofrecer la fuerza de trabajo a la empresa), el sindicato tiene poder exclusi vosobre los salarios, pero la empresa tiene el ¿Ónrrolexclusivo del nivel deempleo. (Conclusiones cualitativamente similares emergen en un modelomás realista en el cual la empresa y el sindicato negocian los salarios,pero la empresa retiene el poder exclusivo sobre el nivel de empleo.) Lafunción de utilidad del sindicato es U(7JJ,L), donde w es el salario que elsindicato pide a la empresa y L es el nivel de empleo. Supongamos queU(w,L) es creciente en los dos argumentos w y L. La función de beneficiosde la empresa eS7r(w,L) = R(L) :- wL, donde R(L) son los ingresos quela empresa obtiene si emplea L trabajadores (y toma de forma óptima lascorrespondientes decisiones de producción y de estrategia de mercado).Supongamos que R(L) es creciente y cóncava;

Supongamos que el desarrollo telT\pora1del juego es: (1) el sindicatoefectúa una demanda salarial, w; (2) la empresa observ.a (y acepta) lJ) yes-coge entonces el nivel de empleo, L;.(3) las ganancias son U(w,L) Y7r(w,L).

Podemos decir bastantes cosas sobre el resultado por inducción hacia atrásde este juego, aun sin haber supuesto ninguna forma funcional concretade U(w,L) y R(L), pero no podemos calcular el resultado explícitamente.. En primer lugar caracterizamos la mejor respuesta de la empresa en la

etapa (2),L*(w), a una demanda salarial arbitraria por parte del sindicatoen la etapa (1),w. Dado w, la empresa escoge el nivel L*(w) que soluciona

5 Esto es un ejemplo de la afirmación hecha en la sección 1.1.A:en';,n Juego en forma normallos jugadores escogen sus estrategias simultáneamente, pero ello no implica necesariamente'que actúen simultáneamente; es suficiente con que cada uno tome su decisión sin conocer lasdecisiones de los demás. Véase la sección 2.4.A para más discusión sobre esta cuestión.

',.,.,'

' ...'

"~o

,'.

'.: .'

L

L*(w)

Curva de indiferenciadel sindicato

L* (w*)

'Figura 2.1.4.

Juegos dinámicos con información completa y perfecta / 65

w*

w

En términos de las curvas de indiferencia representadas en la figura2.1.3, al sindicato le gustarla escoger la demanda salarial w que propor-cione un resultado (w,L* (w» que esté en la curva de indiferencia más altaposible; La soluciÓn al problema del sindicato es w*, la demanda salarialque hace que la curva de indiferencia del sindicato que pasa por el punto(w*,L*(w*» sea tangente a L*(w) en ese punto (véase la figura 2.1.4)'- Porlo tanto, (w* ,L*(w*» es el resultado por inducción hacia atrás de este juegode salarios y nivel de empleo.

Es fácil ver que (w* ,L * (w*» es ineficiente: tanto la utilidad del sindi-cato como los beneficios de la empresa aumentarían si w y L estuvieran enla región sombreada de la figura 2.1.5. Esta ineficiencia hace que resultedifícil de entender que en la práctica las empresas parezca que retienenel control exclusivo sobre el nivel de ocupación. (Si permitimos que laempresa y el sindicato negocien los salarios pero mantenemos el controlexclusivo de la empresa sobre el nivel de empleo obtenemos un resultadoigualmente ineficiente.) Espinosa y Rhee (1989)proponen una explicacióna este enigma basada en el hecho de que el sindicato yla empresa negocianrepetidamente a lo largo del tiempo (normalmente cada tres años en Esta-dos Unidos). En ese juego repetido, siempre que la elección de.w por partedel sindicato y la elección de L por parte de la empresa caigan en la regiónsombreada de la figura 2.1.5 puede existir un equilibrio, aun cuando esosvalores de w y L no pueden ser el resultado por inducción hacia atrás deun~ única negociación. Consúltese la sección 2.3 sobre juegos repetidos yel ejercicio 2.16 sobre el modelo de Espinosa-Rhee.

L

Figura 2.1.3

Figura 2.1.2

L*(w)

maxU (w,L*(w»).lU~O

LCurvas de isobeneficio de la empresa

Curvas de indiferencia del sindicato

w

w

64 / JUEGOS DfNAMICOS CON INFORÑ1ACIÓN COMPLETA (c. 2)

Consideremos ahora el problema del sindicato en la etapa (1). Dadoque el sindicato puede resolver el problema de la.empresa en la segundaetapa, tanto como la propia empresa, el sindicato deberla prever que lareacción por parte de la empresa a su demanda salarial w será escoger elnivel de empleo L*(w). Por tanto, el problema del sindicato en la primeraetapa se concreta en

luegos dilllím.icos con información completa y I",rleeta i 67

Una descripción más detallada de la secuencia temporal del juego detres periodos es la siguiente:

(la) Al principio del primer periodo el jugador 1 propone quedarse conuna fracción SI de una peseta, dejando 1 - SI para el jugador 2.

(lb) El jugador 2 puede aceptar la oferta (en cuyo caso el juego finalizay los jugadores reciben las ganancias SI y 1 - 81 inmediatamente) orechazarla (en cuyo caso el juego pasa al segundo periodo).

(2a) Al principio del segundo periodo el jugador 2 propone que el juga-dor) se quede con una fracción 82 de una peseta, dejando 1~ 82 parael jtÍgador 2. (Nótese la convención de que 8t corresponde s_iempreal jugádor 1, sea quien sea quien hace la oferta.)

(2b) El jugador 1 puede aceptar la oferta (en cuyo caso el juego finalizay los jugadores reciben las ganancias 82 y 1 - 82 inmediatamente) orechazarla (en cuyo caso el juego pasa al tercerperiodo).

(3) Al principio del tercer periodo el jugador 1 recibe una fracción 8 deuna peseta, dejando 1 - S para el jugador 2, donde O< s < 1.

En este modelo de tres periOdos, el acuerdo a:Lque se llega en el tercerperiodo (s,1 - s) está fijado exógenamente. En el modelo con horizonteinfinito que consideraremos más tarde, la ganancia 8 del tercer periodorepresenta la ganancia del jugador 1 en lo que queda del juego si se llegaal tercer periodo (esto es, si las dos primeras ofertas son rechazadas).

Para calcular el resultado por inducción hacia atrás de este juego detres periodos, calculamos en primer lugar la oferta óptima por parte deljugador 2 si se llega al segundo periodo. El jugador 1 puede recibir .5en eltercer periodo rechazando la oferta S2 del jugador 2 en este periodo, peroel valor en este periodo de recibir s en el periodo siguiente es sólo 8s. Portanto, el jugador 1 aceptará S2 si y sólo si 82 :::::ós: (Suponemos gue cadajugador aceptará una oferta si es indiferente entre aceptarla o rechazarla.)El problema de decisión del jugadOr 2 en el segundo periodo, por tanto,se concreta en escoger entre 1 - ós en este periodo (ofreciendo 82 = ós aljugador 1) o recibir 1 - s en el siguiente periodo (ofreciendo al jugador 1cualquier S2 < ós). El valor descontado de la última opción es ó(l - s),

que- es menor que 1 -Os obtenible por medio de la primera opción, deforma quela oferta óptima del jugador 2 en el segundo periodo es 8i = ,)8.

Por tanto, si el juego llega al segundo periodo, el jugador 2 ofrecerá si yel jugador 1 aceptará .

Dado que el jugador 1 puede resolver el problema del jugador 2 enel segundo periodo tan bien como el propio jugador 2, el jugador 1 sabe

L

Curva de beneficiode la empresa

Figura 2.1.5

L* (w*)

w

w*

2.1.D Negociación secuencial

7 El factor de descuento Ó reflejá el' valór temporal del dinero. Una peseta: recibida alprincipio deun periodopúede ingresarse en un bancoy proporcionar intereses, digamos-quea-un tipo r por periodó y, por tanto, tendrá ún válor de 1+ r pesetas al principio deÍ periodosiguiente, De forma equivalente, una peseta que se reciba al principio del periodo siguientetiene ahora un valor de sólo 1/0 + r) pesetas. Sea Ó =' 1/0 + r); entonces úna ganancia.".obterlida en el próximo periodo tiene ahora ahora un valor de sólo 6.".; una ganancia 7f

obtenida dentro de dos periodos tiene ahora un valor de s6lo 62."., yasísucesivaI'nente. Elvalor actual de una ganancia futura recibe el nombre de valor futuro de esa ganancia._

66 1 JUEGOS OlNÁMIC05 CON INFORMACIÓN COMPLETA (e. 2)

Empezamos con un modelo de negociación de tres periodos pertenecientea la clase de juegos estudiada en la sección 2.1.A. Pasamos luego a dis-cutir el modelo de Rubinstein (1982), en el que. él número de periodos.es (potencialmente) infinito. En ambos modelos se llega a un acuerdoinmediatamente, no hay negociaciones prolongadas (como huelgas). Enel modelo de Sobel y Takahashi (1983) de negociación secuencial coninformación asimétrica, en cambio, pueden ocurrir huelgas en el únicoequilibrio (bayesiano perfecto) con probabilidad positiva (véase la sección4.3.B).

Los jugadores 1 y 2 negocian el reparto de una peseta. Hacen ofertasalternativamente: primero el jugador 1 hace una propuesta que el jugador2 puede aceptar o rechazar; si 2la rechaza, hace una propuesta que 1puedeaceptar o rechazar, y así sucesivamente. Una vezqúe una oferta ha sidorechazada, deja de ser vinculante y es irrelevante en las siguientes rondasdel juego. Cada oferta corresponde a UIÍ. periodo y los jugadores sonimpacientes: desCuentan las ganancias obtenidas en periodos posterioresde acuerdo con el factor Ó, donde O <ó < 1.7 -

68/ JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

que el jugador 2 puede recibir 1 - 8i en el segundo periodo rechazandola oferta S] del jugador 1 en este periodo, pero el valor en este periodo derecibir 1 - si el periodo siguiente es sólo de 50 - si). Por tanto, el jugador2 aceptará 1 - s] si y sólo si 1 - s] 2: 50 - si) o s] ::; 1 - 50 - si). Elproblema de la decisión del jugador 1 en el primer periodo, por tanto, seconcreta en escoger entre recibir 1 - 50 - si) en este periodo (ofreciendo1- SI = 50-si) al jugador 2) o recibir si en el próximo periodo (ofreciendocualquier 1 - S1 ::; 50- si) al jugador 2). El valor descontado de la últimaopción es 5si = 52s, que es menor que 1 - $0- si) = 1- 5(1"':5s) obteniblepor medio de la primera opción, de forma que la oferta óptima del jugador1 en el primer periodo es si = 1 - 50 - si) == 1 ::,.'5(1- 58). 'Por tanto, enel resultado por inducción hacia atrás de este juego de tres periodos, eljugador 1 ofrece el reparto (si ,1 - si) al jugador 2, quien acepta.

Consideremos ahora el caso en que el horizonte es infinito. El desarro-llo temporal es elmismo que hemos descrito anterio~ente, excepto que elacuerdo exógeno del paso (3) esreemplazado por una sucesión infinita depasos (3a), (3b), (4á), (4b) yasísuéesivamerite. El jugador 1 hacela"ofertaen los peripdiJsÍII1par~s, el jugador 2 en 10s.pares;1~!1egQ<;iii<,:ióncon~tinúa hasta que un9 elelos dos jugadore~ acepta,un¡t9f~rta. Nos gustaríahallar el resultado PO! inducción pacia atrás de esteJuego pe horizonteinfinito moviél}-dcmoshacia atrás, tal como lo hemos hecho en los casosanalizados hasta ahora. Sin embargo, co~oel jueg~podría continuarhasta el infinito, no existe un último momento a partir del cual iniciar talanálisis. Afo~nadamente, la,siguiente idea (aplicada.()riginalmente porShaked y Sutton [1~84])nos permité truncar el juego de horizonte infinitoy aplicar la lógica del Giso'en el que ell10rizonte ~. fuíi:to:el juego q~eempieza en el,tercer periopo (si se alcanza) es idéntico al jueg~ completo(empezando desde el primer periodo); en ambos cas~s el jugador 1 hacela primera oferta, los jugadores se alternan haciendo las siguientes ofertasy la .negociación continúa hasta que un jugador acepta una oferta.

Dado que no hemos definido formalmente el resultado por inducciónhacia atrás de este juego 'de negociación con horizonte infinito, nuestrosargumentos serán informales (pero pueden formalizarse). Supongamosque existe un resultado por inducción hacia atrás del juego completo enel que los jugadores- 1 y 2 reciben las ganancias s y 1 - s respectivamente.Podemos utilizar estas ganancias en el juego que empieza en el tercerperiodo, si se alcanza, y proceder entonces hacia atrás hasta el priíner pe-nodo (como en el juego de tres periodos) para calcular un nuevo resultadopor inducción hacia atrás del juego completo. En este nuevo resultado

Juegos en dos etapas de información / 69

por inducción hacia atrás, el jugador 1 ofrecerá el acuerdo (j(s),l- f(s»en el primer periodo y el jugador 2 aceptará, donde fes) = 1 - 50 - os)es la fracción del jugador 1 en el primer periodo del juego anterior de tresperiodos cuando el acuerdo (s,1 - s) se imponía exógenamente en el tercerperiodo.

Sea sA la ganancia más alta que el jugador 1puede recibir en cualquierresultado por inducción hacia atrás del juego completo. Consideremos eluso de SA como la ganancia del jugador1 en el tercer periodo, tal comolo hemos descrito anteriormente; esto producirá un nuevo resultado porinducción hacia atrás en el que" la ganancia en el primer penado deljugador 1 es fCsA).Dado que fes) = 1- 5 + 02Ses creciente'en s; f(sA)es la ganancia en el primer periodo más alta posible; ya quesA es laganancia más alta posible en el tercer periodo. Pero SA es también laganancia más alta posible en el primer periodo; de forma que!(sA) =SAo Argumentos similares demuestran que f(sB) = SB, donde SB es laganancia más baja posible que el jugador 1 puede obtener en cualquierresultado por inducción hacia atrás del juego completo. El único valor des que satisface fes) = s, es"1/(1 + o), que denotaremos con s*.Por tanto;sA = SE 0= s. de forma que, existe un único resultado por inducción haciaatrás d~l juego completo: en el primer periodo el jugador 1 ofrece unacuerdo (s' = 1/(1+0),1- s'" = 5/0 + o» al jugador 2, quien acepta.

2.2Juegos en dos etapas con información completa.pero imperfecta :, -

2.2.A.Teoña: Perfección en subjuegos .

Enriquecemos ahora la clase de juegos analizacia eIlla sección anterior:Como en los juegos dinámIcos con información completa y perfecta, conti-nuamos suponiendo que el jUego sigue una sucesión de etapas, habiendolos jugadores observado las decisiones formadás~én las etapas previas an-tes del comienzo de una nueva etapa. Sin embargo, a diferencia de losjuegos analizados en la sección anterior, peImit:iritos qúe haya decisionessimultáneas en cada etapa ..¡ t:omo explicaremos ,en la sección 2.4; estasimultaneidad de decisiones significa que los juegos analizados en estasección tienen información imperfecta. Noobstante, estos juegos compar-"ten características importantes con los"juegos con irLformación perfectaconsiderados en la secclónanterior.

'"1',

\.'

,é'" ,

~",

-•.. ,:'

'70 I JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

Analizaremos el siguiente juego sencillo, al cual (sin mucha inspi-ración) llamaremos juego en dos etapas con información perfecta peroincompleta:

1. Los jugadores 1 y 2 escogen simultáneamente las acciones al y az delos conjuntos factibles Aly Az respectivamente.

2. Losjugadores 3 y 4 observan el resultado de la primera etapa, (al,az), yescogen entonces simultáneamente las acciones 0.3y 0.4de los conjuntosfactibles A3 y A4 respectivamente. . ~

3. Las ganancias sonui(al,az,a3,a4) para i = 1,2,3,4.

Muchos problemas económicos se ajustan a esta descripción.8 Tres ejem-plos (que discutiremos más adelante con mayor detalle) son los pánicosbancarios, los aranceles y la competencia internacional imperfecta y lostorneos (por ejemplo, la lucha entre varios vicepresidentes de una empresapor ser el próxüno presidente). Otros problemas e~xJl1ómicospueden mo-delarse si permitimos una mayor complejidad, ya sea añadiendo másjugadores o permitiendo que los jugadores jueguen en más de una etapa.Podría incluso hab~r~enos jugadores: en algunas aplicaciones.los juga-dores 3 y 4 son los jugadores 1 y 2; en otras, bien el jugador 2 o el 4 noaparece.

Resolvemos un juego de esta clase utiÍizando un enfoque parecido~!_qela inducción haci~ atrás, pero est~ vez, el primer paso quedamoscuando nos movemos hacia atrás desde el final del juego exige la reso-lución de un juego real(el juego siinultáneoentre los jugadores 3 y 4 enla segUnda etapa, dado el resultado de la primera etapa) en vez de re-solver un problema de optünización para un único individuo como en lasección anterior. P.arano complicar las cosas; supondremos en esta secciónque para cada resultado factible de la primera etapa, (0.1,0.2), el juego quequeda pendiente enla segunda etapa entrylos jugadores 3 y 4 tiene unúnico equilibrio de Nash que denominam()s (a;(al,az),a¡(al,az». É~ lasección 2.3.A (sobre juegos repetidos) consideramos las consecuencias deprescindir de este supuesto.

Si los jugadores 1 y 2 prevén que el comportamiento en la, segundaetapa de los jugadores 3 y 4 vendrá dado por (a;(al,a2~,-a¡(al,az», la in-teracción entre los jugadores 1 y 2 en la primera etapa se concreta en elsiguiente juego de decisiones simultáneas:

8 Como en la sección anterior, los conjuntos de ~ccioIies factibles de los jugadores 3 y 4 enla segunda etap~, A:>! A4, podrían depender del resultado de la primera etapa (al,a2)' Enparticular, podnan eX1stirvalores (al,a2) que finalizaran el juego.

Juegos elldos etapas de illfomwciólI I TI

1. Los jugadores 1 y 2escogen simultáneamente las acciones 1/,1 y "-z delos conjuntos factibles Al YAz respectivamente.

2. Las ganancias son Hi(al,az,0,;(o.L(1,Z),o'4(al,l/,z» parai = 1,2.

Supongamos que (0.1,0.2) es el único equilibrio de Nash de este juego dedecisiones simultáneas. Llamaremos a (o,i,0,2'0.; (al' 0.2),0,4 (al ,(1,2» resultadoperfecto en subjuegos de este juego en dos etapas. Este resultado es elánalogo natural del resultado por inducción hacia atrás en los juegos coninformación completa y perfecta, y esta analogía se refiere tanto a suscanieterísticas atractivas como a las que no lo son tanto. Los jugadores 1 y2no deberían creer ninguna amenaza por parte de los jugadores 3 y 4 quecorrespondiera a acciones que no fueran el equilibro de Nash del juegoque queda en la segunda etapa, ya que cuando el juego llegue realmente ala segunda etapa, al menos uno de los jugadores 3 o 4 no querrá cumplir suamenaza (precisamente porque no es un equilibrio de Nash del juego quequeda en la segunda etápa).Por otra parte, supongamos que el jugador1 es también el jugador 3, y que el jugador 1 no juega 0'1 en la primeraetapa: el jugador 4 puede querer entonces reconsiderar el supuesto de queel jugador 3 (es decir, el jugador 1) jugará a;(0,1,o.Z) en la segunda etapa.

2.2.B Pánico bancario

Dos inversores han depositado cada uno de ellos una cantidad D en unbanco. El banco ha invertido estos depósitos en un proyecto a largo plazo.Si el banco se ve obligado a liquidar su inversión antes de que el proyectovenza, puede recuperar un total de 2r, donde D > r > D /2. Sin embargo,si el banco deja que la inversión llege a su vencimiento, el proyecto rendiráun total de 2R, donde R > D.

Existen dos fechas en las cuales los iiwersores pueden sacar dinero delbanco: la fecha 1 es anterior al vencimiento de la inversión del banco, lafecha 2 es posterior. Para simplificar, supondremos que no hay descuento.Si ambos inversores sacan dinero en la fecha 1, cada uno recibe r y el juegose acaba. Si sólo un inversor saca dinero en la fecha 1, ese inversor recibeD, el otro recibe 2r - D Yel juego se acaba. Finalmente, si ninguno delos inversores saca dinero en la fecha 1, el proyecto JJegaa su vencimientoy los inversores deciden si sacar el dinero o no en la fecha 2. Si los dosinversores sacan el dinero en la fecha 2, cada rula de ellos recibe R y eljuego se acaba.' Si sólo un inversor saca el dinero en la fecha 2, ese inversorrecibe 2R - D, el otro recibe D y el juego se acaba. Finalmente, si ninguno

Fecha 2

72 / JUEGOS DINÁMICOS CON INFOJ<MAClÓN COMPLETA (c. 2)

/, -,

D,2r - Dr,r

Sacar No sacar

Sacar

JlIegos en dos etapas de infonnación / 73

Figura 2.2.1

Nos ocupamos ahora de una aplicación de economía internacional. Con-sideremos dos países idénticos, que denominamos con i = 1,2. Cada paístiene un gobierno que escoge un arancel, una empresa que produce tantopara el consumo interno como para la exportación y unos consumidoresque compran en el mercado interno, ya sea de la empresa nacional o efela extranjera. Si la cantidad total en el mercado del país i es Qir el preciode equilibrio del mercado es Pi(Qi) = a - Q.¡. La empresa del país i (queen adelante llamaremos empresa ~)produce hi para el consumo interiory ei para la exportación. Por tanto, Qí = hí + ej. Las empresas tienenun coste marginal constante e y no tienen costes fijos. Por tanto, el costetotal de producción de la empresa i es Cí(hí,ei) = c(hí + eí). Las empresastambién incurren en un coste arancelario sobre las exportaciones: si la

ganancias de (r,r); (2) ninguno de los inversores saca el dinero en la fecha1 pero lo hacen en la fecha 2, lo que conduce a unas ganancias de (R,R) enla fecha 2.

2.2.C Aranceles y competencia internacional imperfecta

No Sacar 2r - D,D R,R

El primero de estos resultados puede interpretarse. como el de unpánico bancario. Si el inversor 1 cree que el inversor 2 sacará su dineroen la fecha 1, su mejor respuesta es sacar también el dinero, aun cuandoa ambos les iría mejor si esperasen a la fecha 2 para sacar el dinero. Estejuego del pánico bancario difiere del dilema de los presos discutido en el. capítulo 1en un aspecto importante: ambos juegos poseen un equilibrio de:Nash que conduce a unas ganancias socialmente ineficientes; en el dilem.ade los presos éste es el único equilibrio (y loes en estrategias dominantes),mientras que en este juego existe también un segundo eqUilibrio qúees eficiente. Por tanto, este modelo no predíce cuándo va a ocurrir unpánico bancario, pero muestra que es un fenómeno que'p~~de ocurrir enequilibrio. Véase un modelo más rico en Diamond y DybVig (1983):.

No sacar

2R- D,D

R,R

No sacar

D,2r-'--D

siguiente etapa

Sacar

Fecha 1

T,T

Sacar

2r - D,D

Sacar R,R

NoSacar D,2R - D,

Sacar

No Sacar

de los inversores saca el dinero en la fecha 2, el banco devuelve R a cadainversor y el juego se acaba.

En la sección 2.4 discutiremos cómo representar formalmente estejuego. Sin embargo, por ahora procederemos de modo informal. Repre-sentemos las ganancias de los dos inversores en las fechas 1y 2 (en funciónde sus decisiones sobre sacar dinero en esas fechas) con el siguiente parde juegos en forma normal. Nótese que el juego en forma normal co-rrespondiente a la fecha 1 no es típico: si ambos inversores escogen nosacar dinero en la fecha 1, no se especifica ninguna ganancia, sino que losinversores pasan al juego en forma normal correspondiente a la fecha 2.

Para analizar este juego procedemos hacia atrás. Considérese el juegoen forma normal correspondiente a la fecha 2. Como R > D (y portanto 2R - D > R), "sacar" domina estrictamente a "no sacar", de formaque existe un único equilibrio de Nash de este juego: ambos inversoressacan el dinero, lo que conduce a unas ganancias de (R,R). Como no haydescuento, podemos simplemeI1te sustituir estas ganancias en el juego enforma normal correspondiente a la fecha 1, tal como indica la figura 2.2.1.Dado que r < D (y por tanto 2r - D < 1'), esta versión de un periodo deljuego de dos periodos tiene dos equilibrios de Nash en estrategias puras:(l) ambos inversores sacan el dinero, lo que conduce a unas gananciasde (,.,.,.);(2) ninguno de los dos inversores saca el dinero, lo que lleva aunas ganancias de (R,R). Por tanto, el juego original del pánico bancariode dos periodos tiene dos resültados perfectos en subjuegos (y, por tanto,no se ajusta totalmente a la clase de juegos definida en la sección2.2.A):(1) ambos inversores sacan el dinero en la fecha 1, lo que conduce a unas

.,

fllegos eH dos etapas de ill{omlOcíó/I I 75

(Los resultados que derivamos son coherentes con ambos supuestos,) Lasdos funciones de mejor respuesta (2.2.1) y (2.2.2) deben cumplirse paracada i = 1,2. Por tanto, tenemos cuatro ecuaciones con cuatro incógnitas(hi,ei,hi,ei). Afortunadamente, este sistema de ecuaciones puede simpli-ficarse dividiéndose en dos grupos de dos ecuaciones con dos incógnitas,Las soluciones son

(2,23)

(2.22)

(22,1)

• 0.- C - 2tjei = 3y

• 1( ,,)11,; = '2 a - ej - e ,

• 1(' 1* )ei = '2 o, - tj - e - tj .

h~ = 0.- C + ti, '3

Recordemos (en la sección 1.2.A) que la cantidad de equilibrio escogidapor las dos'empresas en el juego de Cournot es (a - c)/3, pero que esteresultado se obtuvo bajo el supuesto de costes marginales simétricos. Enel equilibrio descrito en (2.2.3),por el contrario, las decisiones arancelariasde los gobiernos hacen que los costes marginales sean asimétricos (comoen el ejercicio 1.6). En el mercado i, por ejemplo, el coste marginal elela empresa i .es c, pero el delaempresa j es c + ti. Como el coste de laempresa j es más alto, ésta quiere producir menos .. Pero si la empresa jva a producir menos, el precio de ,equilibrio será'.Il~J~al~~,deforma que laempresai querrá producir más, en cuyo caso la empresa j querrá producirmenos todavía. Por tanto, en equilibrio, hi crece con ti y e; decrece (a unritIno más rápido) con ti, como indica (2.2.3).

Una vez resuelto el juego entre las dos empresas que queda en lasegunda etapa, cuandolos gobiernos han escogido las tasas arancelarias,podemos ahora representar la interacción entre los dos gobiernos en laprimera etapa con el siguiente juego de decisiones simultáneas. Primero,los gobiernos escogen las tasas aran,celarias tI y t2 simultáneamente. Ensegundo lugar, las ganan9j=ls;spr,~i(t;,t'j,hj,ei,hi,ei) para el gobiernoi = 1,2, donde hi y ei.son funciones de ti y tj, tal como se indica en (2.2.3),Hallamos 'ahora el equilibrio d~ Nash de este juego entre los gobiemos.

Para simplificar la notación, suprimiremos la dependencia de 11.; de f'i

y de ei de tj: con W;(ti,tj)genotamos a Wi(ti,tj,hi,ei,hi,ei), la gananciadel gobierno i cuando eS.<;9ge1atasa arancelaria ti, el gobierno .i escoge tj

y suponiendo que 11,; :::; a - e - tj, tenemos que

Suponiendo que e; :::;a - c, tenemos que

74 I JUEGOS DINÁMICOS CON INFORMACiÓN COMPLETA Ce. 2)

, max hi[a - (hi + eJ~)- cLh,::::O ' ,

maxei[a - (ei + 11,*) - el - te'.<,::::0 J J '

1r'i(tútj,hi,eúhj,ej) =[0. - (hi+ ej)Jhi + [a - (ei + hj)Jei

- c(hi + e;) - tjeú", 1

Wi(tútj,h"e"hJ,ej) ='2Qf + 1r'i(ti¡tj¡hi,ei,hj,ej) + tiej,

Supongamos que losgobie~os hanestogido los aranceles tI y t2. Si(hj,ej,hi,ei) es un equilibrio de Nash del juego (de dos mercados) restanteentrelas empresas 1 y2 entonces, para cada i, (hi,ei> debe solucionar

empresa iexporta ei al país ,7 cuando el gobierno j ha establecido una tasaarancelaria de tj, la empresa i debe pagar tjei al gobierno j,, El desarrollo temporal del juego es el siguiente: Primero, ambos go-

bIernos escogen simultáneamente las tasas arancelarias tI y t2. En se-gundo lugar, las empresas observan las tasas arancelarias y escogen si-m~:áneamente las cantidades para el consumo interno y para la expor-tacIOn, (hI,eI) y (h2,e2). En tercer lugar, las ganancias son los beneficiosde la empresa i y el bienestar total del gobie.r:noi, donde el bienestar totaldel país i es la suma de los excedentes de los consumidor~s9 del país i,los ~eneficios recibidos por la empresa i y el ingreso arancelario que elgobIerno ~recauda de la empresa j:

'!'~

Como 1r'i(t"tj,h"e"h;,e;) puede escribi~e como la sum~ de los benefi-~io,sde la empresa i en ~l.mercado i (los cuales son función de hi y e;Ullicamente) y lm~beneficIOSde la empresa i en el mercado j (los cua-les son función, de ei, h;.y tj. únicamente), el problema de optimizaciónen los dos mercados para la empresa i se simplifica al separarse en dosproblemas, uno para cada mercado: hi debe solucionar

y ei debe solucionar

9 S' .1 un consUffildor compra un bien a un, precio,p cua~dohab'ríá estado dispuesto a

pagar un valor v, se beneficiade un excedente de v '-' p. Dada la i:ufV~de deináilcla inversaPi(Qi) ~a - Q" si la cantidad vendida en ei mercado i es Qi, puede demostrarSe que elexcedente agregado del consumidor es (l/2)Qr

.-~

.....,...,.'

76/ JUEGOS DINÁJVlICOS CON INFORMACIÓN COMPLETA Ce. 2)

y las empresas i y jse comportan según el equilibrio de Nash dado por(2.2.3). Si (ti Ji) es un equilibrio de Nash de este juego entre los gobiernos,entonces, para cada i, ti debe solucionar

max W;*(ti,t*).ti~O )

Pero W;*(t¡,tiJ es igual a

(2(a - e) - ti? (a - e + ti)2 (a - e - 2t~? t(a - e - 2t)+ + 1 + t 1

18 9 9 3'por tanto

a-et~=--, 3

para cada i, independientemente de tj. En consecuencia, en este modeloescoger una .tasa arancelaria de (a - e)j3 es una estrategia dominantede cada gobIerno. (En otros modelos, por ejemplo cuando los costesmargInal.es son crecientes, las estrategias,.de equilibrio de los gobiernos noson domInantes.) Sustituye~do ti = t; = (a - e)j3 en (2.2.3)obtenemos

hi = 4(a -:-e) e~ = a - e9 y , 9

como las cantidades escogidas por las empresas en la segunda etapa. Portanto, el resultado perfecto en subjuegos de este juego -de aranceles es(ti =5 = (a - e)j3,hj=hi= 4(u-:- e)j9,ej = ei = (a --' e)j9)~ '

En el resultado perfecto en subjuegos, la cantidad agregada en cadamercado es S(a - e)j9. Sin embargo, si los gobiernos hubieran escogidounas tasas,ar~ncelarias iguales a cero, la cantidad agregada en cada mer-cado habna SIdo 2(a - e)/3, exactamente igual que en el modelo de Cour-not. Por tanto, el excedente de los consumidores en el mercado i (el cual,como hemos visto anteriormente, es simplemente la mitad del cuadradode la cantidad agregada en el mercado i) es menor, cuando los gobiernosesc?ge.n l~s tasas arancelarias que son estrategias dominantes, de lo que~ena SIelIgieran unos aranceles iguales a cero. De hecho, unos arancelesIguales a cero son socialmente óptimos en el sentido de

max W¡(t],t2) + Wi(t2,tl),tl,t2~O

de fOlIDaque existe unincentivo para que los gobiernos firmen un acuerdoen el que se comprometan a eliminar los aranceles (es decir, en favor

Juegos en dos etapas de información / 77

del libre comercio). (Si es factible tener aranceles negativos, es decir,subsidios, el óptimo social consiste en que los gobiernos escojan tI =t2 = -(a - e), lo que hace que la empresa nacional no, produzca nadapara el consumo interior y exporte la cantidad de competencia perfectaal otro país.) Por lo tanto, dado que las empresas i y j se comportansegún el equilibrio de Nash caracterizado en (2.2.3) en la segunda etapa,la interacción entre los gobiernos en la primera etapa es un dilema de lospresos: el único equilibrio de Nash lo es en estrategias dominantes, y essocialmente ineficiente.

2.2.0 Torneos

Consideremos a dos trabajadores y su capataz. El producto del trabaja-dor i (i = 1 o 2) es Yi = ei + Eú donde ei es esfuerzo y Ei es ruido. Elproceso de producción es el siguiente: Primero, los trabajadores escogensimultáneamente sus niveles no negativos de esfuerzo: ei ?: O. En se--'gundo lugar, los valores de ruido E] y 1'2 se obtienen independientemente,de acuerdo con una función dedensidad f(E) con media cero. Entercerlugar, el producto de los trabajadores es obsen:ado pe~ono su e~fu~i~o~Los salarios de los trabajadores,' por tanto, pueden depender de lo quehan producido, pero no (directamente) de su esfuerzo.

Supongamos que el capataz decide inducir a los trabajadores a esfor-zarse más y para ello les hace competir en un torneo;.tal y como origi-nalmente analizaron Lazear y Rosen (1981).10 El salario recibido 'por elvencedor del torneo (es decir, el trabajador quemás:produica)eswA;"elsalario recibido por el perdedor es WB. La ganancia:deun trabajador quereciba un salario W y realice un esfuerzO e es u(w,e) = w - g(e), donde ladesutilidad del esfuerzo, g(e), es creciente y convexa (es decir; g'(e) > O Yg"(e) > O). La ganancia del capataz es Yl + YF-WA - WB.

Transcribimos ahora esta aplicación'a lostérininos de la clase de juegosdiscutida en la sección 2.2.A. El capat~~'~"eIRíg~dor 1~cuya acción al esescoger lbs salarios W A y W B que se pagarán en el torneo. No hay jugador2. Los trabajadores son los jugadores 3 y4;quienes observan los salarios .escogidos en la primera etapa y deci~e,!-1~n.t,?~cessünultáneamente susacciones a3 Ya4, es decir los esfuér~o~'~l'y'é~:(Consideraremos más áde-

lO Para no complicar la exposición de esta aplicación; ignoramos varios detalles técnicos,tales como las condiciones bajo las cuales la 'condición de primer orden del trabajador essuficiente. No obstante, el análisis eXige illI mayor cálculo de probabilidades que en los casosanteriores. Esta aplicación puede saltarse sin pérdida de continuidad. '

/,-.

... ".

78 / ]VEGaS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

Es decir, el trabajador i escoge ei de forma que la desutilidad marginal deun esfuerzo extra, g'(e;), sea igual al beneficio marginal de ese esfuerzoadicional, que es el producto de lo que se gana en salario por venCer en eltorneo, WA '-w B, y el aumento marginal de la probabilidad de ganar.

Por la regla de Bayes,12

(2.26)

que decrece en a, de forma que E' efectivamer:te decrece en a..Procedemos ahora hacia atrás, hasta la pnmera etapa del Juego. Su-

. 1 s trabaJ'adores acuerdan participar en el torneo (enpongamos que SI, o ' ' ' , .d t mpleo alternativo) responderan a los salanos ',I! Avez e acep ar un e, , .

. d 1 'libn'o de Nash simétrico caractenzado por (2.2.6).y W B lugan ,o e eqw, .. ' . .,.(1 t nto la posibilidad de equihbn, os asrmetncos y,de ungnoramos, por a , ,equilibrio en el que la elección de los es~erzos por parte de los trabaJa-dores venga dada por la solución de esquma el = e2 = ?: en vez de por lacondición de primer orden (2.2.5).) Supon~amos t~~bIen que la oporlu-'d d d 1 lternativo proporcionan a una utilIdad Un' Como en elnI a e emp ea a ' , ' .

equilibrio de Nash simétrico cada jugador gana el tor~eo con probal:lh-dad un medio (es decir, Prob{Yi(e') > Yj(e')} = 1/2), SI :1capataz qUJ~reinducir a los trabajadores a participar en el torneo debera escoger salanos

que satisfagan

Prob{Yi(e;) > Yj(ej)} =Prob{Ei > ej + éj - e;}

, ' =1 Prob{Ei>e;+Ej-e,IEj}f(Ej)dEj. €j

= /[1 - F(ej - ei + Ej)JJ(Ej)dEj,J

Juegos el1 das etapas de ¡,¡[anuacirÍu !79

1 2 - '(')(WA - WB) J(Ej) dEj - 9 e .. €j

Como g(e) es ~onvexa, un premio mayor por ganar (es d~cir, .U.Jl valord ) I'nduce a un mayor esfuerzo, cosa harto mtU.lliva.Pormayor eWA-WB ' ,

tra parte con un mismo premio, no vale tanto la pena esforzarse cuando:1 ruido e~muy fuerte, porque es probable que elresultado del to:neo sedetermine aleatoriamente, y no de acuerdo con elesfuerzo. Por ejemplo,si Ese distribuye normalmente con varianza a2

, entonces

de forma que la condición de primer orden de (2.2.5) se convierte en

(WA - WB) L J(e; - ei + Ej)f(Ej)dEj = g'(ei)'J

En un equilibrio de Nash simétrico (es decir, ei = ei = e') tenemos que

(2.2.4)

(2.2.5)( _ )8Prob{Yi(ei) > Yj(e;)} _ '( ,)WA WB 8 - 9 e,.

ei

max WA Prob{Yi(ei)> Yj(e;)} + 1)1B Prob{Yi(ei) ::;YjCe;)} -' g(ei)e,,,=O ,,',, = (WA - WB) Prob{Yi(ei) > Yj(e;)} + WB ~ g(ei),

donde Yi(ei) = ei + Ei',La condición de primer orden de (2.2.4) es'

lante la posibilidad de que, dados los salarios elegidos por el capataz, lostrabajadores prefieran no participar en el torneo y acepten en cambio unaoferta de empleo alternativo.) Finalmente, las ganancias de los jugadoresson las establecidas anteriormente. Dado que lo que se produce (y portanto también los salarios) es función no sólo de las decisiones de los ju-gadores sino también de los términos de ruido El y (.2,operaremos con lasganancias esperadas de los jugadores.

Supongamos que el capataz ha elegido los salarios WA y WB. Si elpar de esfuerzos (ei,ei) es un equilibrio de Nash del juego festante entrelos trabajadores, para cada i, ei ha de maximizar el salario esperado deltrabajador imenos la desutilidad del esfuerzo: ei debe ser una solucióndell

11 Al escribir (2.2.4),supusimos que la función de densidad del ruido ¡(e) es tal que elsuceso en el qU€lostrabaj~dores producen exactamente lo mismo OCurr€con probabilidadcero y, por tanto;no es necesario considerarlo en la función de utilidad esperada del trabajadori. (Más formalmente, suponemos que la función de densidad ¡(E) es no atómica) En unadescripción completa del torneo, sería natural (pero innecesario) especificar que el ganador sedetermina a cara o cruz, o (lo que en este modeio resulta eqttivalente) que ambos trabajadoresreciben(wA +wB)/2 .

l2La regla de Bayes proporciona una fórmula para P(AIB), la probabilidad (condicional)de que un suceso A ocurra dado que el suceso B ha ocurrido. Sean P(A), P(B) Y P(A,B)las probabilidades (a priori) (es decir, las probabilidades antes de que tanto A como B hayantenido la oportunidad de ocurrir) de que A ocurra, B ocurra y de que ambos A y B ocurranrespectivamente. La regla de Bayes establece que P(AIB) = P(A,B)/ P(B). Esto es, laprobabilidad condicional de A dado B es igual a la probabilidad de que ambos 'A y B ocurrandividida por la probabilidad a priori de que B ocurra.

,','-_:;,'

::."',1::'"

"-,,):

;:\,-,~~tl

~~~, .'.,:¡:- ..'

~:',.",.!:.'

--");"__,~i

:;~~','

"o,}',)~

.~}

,",.l~

'. '-,'

' ..../

~_l.>t'

2.3Juegos repetidos

2.3.A Teoría: Juegos repetidos en dos etapas

(

(

(

.~'.

('.

(

Figura 2.3.2

1,6 5,5Jugador 1

2,2 6,1

0,5 4,4

Figura 2.3.1

Jugador 2

Iz D2

h 1,1 5,0

Jugador 2

Iz D2

Jugador 1

Juegos repetidos / 81

Llamaremos a este juego repetido el dilema de los presos en:dos etapas.Este juego pertenece a la clase de los juegos analizada en la sección 2.2.A.Aquí los jugadores 3 y 4 son idénticos a los jugadores 1 y 2, los espaCiosde acciones A3 y A4 son idénticos a Al y AZ Y las ganancias ui(al,a2,a3,a1lson simplemente la suma de las ganancias en la'pnmera etapa (ái.;a2)y en la segunda etapa (a3,a4)' Además, el dilema de los presos en d.ósetapas satisface el supuesto que hicimos en la sección 2.2.A: para cadaresultado factible de la primera etapa del juego, (al,a21, el juego restant.een la segunda etapa entre los jugadores 3 y 4 tiene un único equilibriode Nash, que denotamos por (a3(al,a21,a,i(al,a2»' De hecho, el dilemade los presos en dos etapas satisface este supuesto de forma clara, comoseguidamente indicamos. En la sección 2.2.ApeTInitini.osla posibilidad deque el equilibrio de Nash del juego restante en la segunda etapa dependadel resultado de la primera etapa -de aquí la notación (a; (al ,a2) ,a¡ (al ,a2»en vez de simplemente (aj,a¡). (En el juego de los aranceles, por ejemplo;las cantidades de equilibrio escogidas por las empresas en la segundaetapa dependían de los aranceles escogidos por los gobiernos en la primeraetapa.) Sin embargo, en el dilema de los presos en dos étapas, el único

ganancias del juego completo son simplemente la suma de las gananciasde cada etapa (es decir, no hay descuento).(2.2.7)

(2.2.8)WB = 2Ua + 2g(e*) - WA.

1 1-w, + -wB - g(e*) > U2 ,~ 2 - a.

80 / JUEGOS DlNAMICOS CON INFORMACIÓN COMPLETA (c. 2)

Suponiendo que Ua sea lo suficientemente pequeña corno para que elcapataz quiera inducir a los trabajadores a participar en el torneo, ésteescogerá los salarios que maximicen el beneficio esperado, 2e* -"illA - WB,

sujeto a (2.2.7). En el óptimo, (2.2.7) se satisface con igualdad:

El beneficio esperado es entonces 2e* - 2Ua - 2g(e*), de forma que elcapataz quiere escoger unos salarios tales que el esfuerzo inducido, e*,maximice e* - g(e*). El esfuerzo inducido óptimo, por tanto, satisfacela condición de primer orden l(e') = 1. Sustituyendo esto en (2.2.6) seobtiene que el premio óptimo, WA - WB, es una solución de

(WA - WB) l f(Ój)2dój = 1,J

Y(2.2.8)determina entonces WA Y"illB.

En esta sección analizarnos si las amenazas y promesas sobre el comporta-miento futuro pueden influir en el comportamiento presente en situacio-nes que se repiten en el tiempo. Buena parte de lo que hay que entenderen estas situaciones se ha visto ya en el caso de dos periodos; pocas ideasnuevas se requieren para entender los juegos con un horizonte infinito.Hemos definido también el equilibrio de Nash perfecto en subjuegos. Estadefirüción tiene una expresión más sencilla para el caso especial de los jue-gos repetidos que en el general de los juegos dinámicos con információncompleta que considerarnos en la sección 2.4.B. La introducirnos aquí paratacilitar la exposición posterior. . '.

Consideremos el dilema de los presos dado en forma normal de la figura2.3.1. Supongamos que hay dos participantes en este juego que decidensimultáneamente en dos ocasiones, habiendo observado el resultad"ode li,'lprimera decisión antes de decidir por segunda vez, y supongamos que las

1,1 5,0 0,0

0,5 4,4 0,0

0,0 0,0 3,3

Supongamos que el juego de etapa de la figura 2.3.3 s.ejuega dos veces,d 1 lt d de la pnmera etapa antesh b' do los J'ugadores observa o e resu a o .

a len . l d Demostraremos que existe. un único resultadode que empIece a segun a. . (c c)erfecto en subjuegos de este juego, en el que el par de estrategIas 1, 2

P . l' etapa 14 Corno en la sección 2.2.A, supongamos quese Juega en a pnmera .

. . .. 22 A Si G tiene un único resultado perfecto endos etapas de la clase defin~da en Ia.s~cClon~lt~d'o perfecto en subjuegos: en cada etapa sesubjuegos, entonces G(T) hene un unlCOres

juega .elresultado perfecto en subjuegOdsfide.~. la nodón de resultado perfecto en subjuegos14E '-' tamente hablando hemos e ni o

S'HC ' '. 'd l .. 22 A El dilema de los presos en dos etapasól 1 1 se de juegos defim a en a seccJOn . . . .s o para a e a da resultado factible del juego de la primera etapa eXlstepertenece a esta clase, porque para ca d l gunda etapa Sin embarg0. el

Tb' d N sh en el juego que que a en a se .un único eqU11 no e ~ . n el . e o de e~apa de la figura 2.3.3 no pertenece ajuego en dos etapas Tepehdo, basadh.oe u'~pfes equilibrios de Nash. No vamos a extendertIque el ¡U.ego de etapa ene m. . 11es a c ase, por b' os de forma que sea apiJea ) e a

formalmente la definición del resultado perfecto en su Jueg

• [IleSOS repef idos / 83

lora al caso de dos periodos, pero consideramos la posi-.. vodlvdemqo:::1 J'uego de etapa G tenga múltiples equilibrios :le ..NilSh,¡

blhda e . d . d [y C ll1utan é1l fi 2 3 3 1as estrateglils enOillma as ./. /en a gura .., ~ d . 1

como d l fi 23 I pero las estrategias enOJ1UnalilS. de los presos e a gura .. , . 'b .dIlem; sido añadidas al juego de forma que ahora existen dos eqUlh nosDi ha '. (1 J) como en el dilema de los presos, y

N h en estrategIas puras. ¡,2 . "1' Ide as 1 t artl' f)' cial añadir un eqUllt mo ad ' (D D) Natura men e, esa~ora a de~as pr~~os2de esta manera, pero nuestro interés en este juegodIlema e os h' En la próxima sección veremos que, 't'vo que sustan va.es mas exposll , 'h d uilibrios. tidos infinitamente comparten este espm I e eq ..los Juegos ~epe '1' d etapa que se repiten infinitamente tienen'Iti les mc1uso SI os Juegos e . "mu. ~ 'uilibrio de Nash, como en el dilema de los presos. Por tal~to, en

un UNCOeq. . de etapa artificial en el contexto Sl1nple. , n analIZamos un Juegoest~::cC1:riodos, y nos preparamos con ello para el análisis poster~or dede p ..' 'co en un contexto con honzonteun juego de etapa con mteres economl ,infinito.

Figura 2.3.3

Definición. Dado un juego de etapa G, G(T) denota el juego r.epetido fini-tamente en el que G se juega T veces, habiendo los jugadores observado losresultados de todas las jugadas anteriores antes de que empiece la siguiente. Lasganancias de G(T) son simplemente la suma de las ganancias de los T juegos de .etapa.

82 / JuEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

equilibrio del juego de la segunda etapa es (I¡,h), independientementedel resultado de la primera etapa.

Siguiendo el procedimiento descrito en la sección 2.2.A para calcular elresultado perfecto en subjuegos de tal juego, analizamos la primera etapadel dilema de los presos en dos etapas teniendo en cuenta que el resultadodel juego restante en la segunda etapa será el equilibrio de Nash de esejuego, es decir, (IIJú con ganancias de (1,1). Por tanto, la interacción enla primera etapa entre los jugadores en el dilema de los p~esos en dosetapas se concreta en el juego de una jugada de la figura 2.3.2, en el quelas ganancias 0,1) de la segunda etapa se han sumado á' cada par deganancias de la primera etapa. El juego de la figura 23.2 tiene también unúnico equilibrio de Nash: (IIJZ). Por tanto, el único resultado perfecto ensubjuegos del dilema de los presos en dos etapas es (¡¡Jz) en la primeraetapa, seguidC? de (I¡Jz) en ¡la segunda etapa. No se puede conseguircooperación, es decir, (DI,Dz) en ninguna etapa del resultado perfecto ensubjuegos.

Este argumento continúa siendo válido en situaciones más generales.(Aquí nos apartamos momentáneamente del caso de dos periodos parapermitir cualquier número finito de repeticiones, T.) Denotemos conG = {A¡, ... , An; Ul; ... ,un} un juego estático con información completaen el que los jugadores 1 a n escogen simultáneamente las acciones a¡ a ande los espacios de acciones A¡ a An respeftivamente, siendo las gananciasU¡(al;', . ,an) a un(a¡, ... ,an). Llamaremos al juego G, juego deetapadeljuego repetido.

Proposición. Si el juego de etapa G .tiene un únicQequilibrio de Nash, entonces,para cualquier T finito, el juego repetido G(T) tiene un ú~ico resultado perfectoen subjuegos: en cada etapa se juega el equilibrio de Nash de G.i3

13 Se ~btienen resUltados análogos si el juego de etapa G es un júego dinámicó con in-formadón completa. Supongamos que G es un juego dinámico con inJonnádón completa yperfecta de la clase definida en la secdón 21.A. Si G tiene un úr¡jco resultado por inducdónhada atrás, G(T) tiene un único resultado perfecto en subjuegos: en cada etapa se juega elresultado por inducdón hacia atrás de G. Sinillarmente, supongamos que G es un juego en

...}:

84 / JUEGOS DlNÁ,vllCOS CON INFORfvIAC¡ÓN COMPLETA (e. 2)

en la primera etapa los jugadores prevén que el resultado de la segundaetapa será un equilibrio de Nash del juego de etapa. Puesto que esteJuego de etapa tiene más de un equi.librio de Nash, ahora es posible quelos Jugadores prevean que a resultados diferentes en la primera etapales sIguen equilibrios diferentes del juego de etapa en la segunda etapa.Supongamos, por ejemplo, que los jugadores prevén que (Dl,Dz) será elresultado de la segunda etapa si el de la primera etapa es (Cl,C

Z), pero

que (II,1z) será el resultado de la segunda etapa si el resultado de laprimera etapa es cualquiera de los ocho restantes. La interacción entrelos jugadores en la primera etapa se concreta entonces en el juego de unaetapa de la figura 2.3.4, donde (3,3) se ha sumado a la casilla (C],Cz) y 0,1)se ha sumado a las otras ocho casillas.

2,2 g,1 1,1! 1-:'" --

1,6 ]1 1,1

1,1 1,1 ~''!.

Figura 2.3.4

Existen tres equilibrios de Nash con estrategias puras en el juegode la figura 2.3.4: (1],1z), (Cl,CZ) y (D],Dz). Como i'l1 la figura 2.3.2,los equilibrios de Nash de este juego de una etapa corresponden a losresultados perfectos en subjuegos del juego repetido original. Denotemoscon «w,x),(y,z) un resultado del juego repetido: (w,x) en la primera etapay (!J,z) en la segunda. El equilibrio de Nash (1],1z) de la figura 2.3.4corresponde al resultado perfecto en subjuegos «(1],[Z),(1],[2» del juegorepetlLio,puesto que el resultado previsto en la segunda etapa es (11,!z)como consecuencia de cualquier resultado en la primera etapa excepto de(C'],C'2). De la misma forma, el equilibrio de Nash (D],Dz) de la figura~.3.4 corresponde al resultado perfecto en subjuegos «Dl,Dz),(11'!Z» delJuego repetido. Estos dos resultados perfectos en subjuegos del juegorepehdo simplemente enlazan los resultados de los equilibrios de Nashde los juegos de etapa, pero el tercer equilibrio de Nash de la figura2.3.4 genera un resultado cualitativamente diferente: (Cl,Cz) de la figura

todo.juego en dos etapas repetido, en primer lugar porque el cambio el) las definidones esnunuscnlo y, en segundo lugar, porque en las secciones Z.3.B y 2.4.B aparecen definidonesmduso mas generales.

Juegos rq;elidos / 85

2.3.4 corresponde al resultado perfecto en subjuegos «Cl,Cz),(D],D2») deljuego repetido, puesto que el resultado previsto en la segunda etapa es(Dl,Dz) como consecuencia de (Cl,C2). Por lo tanto, como hemos afirmado'anteriormente, se puede alcanzar la cooperación en la primera etapa deun resultado perfecto en subjuegos del juego repetido. Esto es un ejemplode un resultado más general: si G = {Al,'" ,An; uI- ... ,un} es un juegoestático con información completa que tiene múltiples equilibrios, puedenexistir resultados perfectos en subjuegos del juego repetido G(T) en losque, para cualquier t < T, el resultado de la etapa t no es un equilibriode Nash de G. Volveremos sobre esta idea en el análisis de un juego conhorizonte infinito en la próxima sección.

La conclusión principal que debemos sacar de este ejemplo es quelas amenazas o las promesas creíbles sobre el comportamiento futuropueden influir en el c~mportamiento presente. Sin emba'rgo, desde otraperspectiva, puede que quizás el concepto de perfección en subjuegosno utilice una definición de credibilidad lo suficientemente fuerte. Alderivar el resultado perfecto en subjuegos «C],CZ),(D1,Dz», por ejemplo,hemos supuesto que Jos'jugadores prevén q~e (DI,Dz) s~rá el resultaclü,de la segunda ronda si el resitltado en la primera etapa es (C],Cz), y q~~(I¡'!z) será el resultado en la segunda etapa si eIde la primera ronda escualquiera de los ()chorestantes. Pero jugar (11,!2)enléi.se~da etapa, conunas ganancias de 0, 1), puede parecer poco atractivo~a:hdo (DI,Dz),con una ganancia de (3, 3), está también disp¿nible cci~oe'luilibrio deNash del juego de etapa que queda. Dicho en términos poco preciSos.parecería natural que los jugadores renegociiü-an:15.SiJC1,cz) no es'~iresultado de la primera etap~ del-juego, e~d~'~{~e~u'p'~~equ~~~'j~g~á(I¡'!z) en la segu~cl,~~ta,pa, cada jugadorp_~t;4-;;"p~TIs~que_lo p~sadQ;pasado está, y que se debe jugar el eqüilibriodel juegbdeetapa (Dl,D~)unánimemente preferido. Pero si (DI,Dz)va a serelr~sÚltado de lasegunda etapa independientemente de cuál sea el rescltadoenla primeraronda, el incentivo para jugar (Cl,Cz) en ia prirñ~~áet~p.a_desaparece: lainteracción entre los dos jugadores en la p'riill~;a~tapa' s~~~~.duceal juegode una etapa en el que la gánancia (3, 3Yse'ha~stÜÍ1adóacada casilla deljuego de etapa de la figura 2.3.3; d'e'fo~a que Ji e~ la mejor respuesta aCj del jugador i. ' '. . ."._.. '.

15 Decimos que es impreciso p~rq~~"renegociar" sugiere que hay comunicadón (o inclusonegodadón) entre la primera y la"Segunda e,tapa. Si esto fuera posible, debería añadirse ala descripdón y análisis del jue¡;¡m.'Aquí súpimemos que no es así, de forma que lo queentendemos por "renegodar" no-esotra cosa que un ejerddo de introspección.

','

Para acercamos a la solución de este problema de renegociación,-con~sideremos el juego de la figura 2.3.5,que es aún más artificial qué él j\.tegode la figura 2.3.3. Una vez más, huestro interés en este juego' ~s másexpositivo que económico. Las lciJ~ásquééstamosdesarrollándó pái~-tTa:tar él tema de la renegociación en esté juego artificial se pueden aplicartambién a la renegociación en juegos infinitamente repetidos; véase FairellyMaskin (1989),por ejemplo. "

Eneste juego de etapa se añaden las estrategi~s Pi y Qia1juego deetapa de la figUra2.:5.3.Existen cuatro equilibrios de Nash con estrategiaspurasdeljuego de etapa: (IJ,h)' (Dr,1J2) Y ahora también (Pl,P2) y (Ql,Q2)'Como antes, los)ugadores prefieren unánimemente\D1,D2) a (h,h). Másimportante aún, no hay ningún equilibrio de Nash (x,y) en lélfigUra 2.3.5t~l que los jugadores prefieran unánimemente (x,y) a (Pl,P2); (Q1;Q2) o(Dl;D2). Decimos entonces que (Dl,D2) domina en el sentidO de PÚeto' a(IJ,h), y que (P1,P2),(Ql,Q2) y (Dl,D2) están en Ía fronterade Paretode lasganancias de los equilibrios de Nash del juego de etapa de la figtira2.3.5.

Supongamos que el juego de etapa de la figura 2.3.5 se'juega dosveces, habiendo los jugadores observado el resultado de la prirnéfa\511daantes de que empiece la segunda. Supongamos adicion~J~erit~gue losjugadores prevén' que el resultado de la segundaétapa será el sigUi~nte:(DJ,D2) si el resultado dela primera etapa es (Cl,C2); (PI ,P2)sieiiés'U1tadüde la primera etápa es (Cj,w), donde 1JJ puede ser cualquierco~amE:ÍlosC2; (Ql,Q2) si el resultado de la primera etapa eS(x,C2), donde x puede sercualquier cosa menos Cl y (DJ,D2) si el resultado de la primera etapa es(y,z), donde y puede ser cualquier cosa menos el y zpuedes~;, ctialquiercosa menos C2. Entonces «Cl,C2),(Dl,D2» es un result<l:dópeaésto'ensubjuegosdeljuego repetido porque cada jugador obtiene 4+3ál jugare;

86 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e 2)Juegos repetidos / 87

2.3.B Teoría:Juegos repetidos infinitamente

Pasamos ahora a los juegos repetidos' infinitamente. Como en el casode un horizonte finito, el tema principal es el de que las amenazas o laspromesas, creíbles sobre el comportamiento futuro pueden influir en elcomportamieritopresente\ En el caso de un horizonte finito vimos que siexisten equilibrios de Nash múltiples del juego de etapa G, pueden existirresultados perfedos en subjuegos del juego repetido G(T) en los que, para,rualquier t < T, el resultado de la etapa t no es un equilibrio de Nash de G.Untesultado más poderoso se da en los juegos repetidos infinitamente:~.;intruso si el juego de etapa tiene un único equilibrio de Nash, pueden

','e3dstir muchos resultados perfectos en subjuegos en los que ning'uno delos resultados en cada etapa sea un equilibrio de Nash de G,_ Empezamos con el estudio del dilemá de los presos repetido inrinita-mente. Consideramos a continuación la clase de juegos repetidos infini-

, tamente análoga a la clase de juegos repetidos finitamente definida en lao" :,'sécción anterior:' un juego estático con información completa, G, se repi te

t:r;~LIfullutamente, habiendo los jugadores observado 10s'resultados de todas, las rondas anteriores antes de que empiece la etapa siguiente. Para esta

. "cIase de juegos repetidos finita e infinitamente, definimos los conceptosde estrategia de un jugador, de subjuego y de equilibrio dé Nash perfectoel).,"súbjuegos.(En la sección 2.4.Bdefinimos estos conceptos para juegos,dinámicos con información completa en general, no sólo para esta clasede juegos repetidos.) Utilizamos después estas definiciones para enuncia r

seguido de Di peros~lo 5 +1/~ a.ljugar Ji en :a primera ~tapa (e i.nclusomenoscon otras deCISIOnes).Mas Importante aun, el problema del eJemplo, terior no aparece aquí. En el juego repetido en dos etapas basado en laanfigura 2.3.3, la única forma de castigar a un jugador por desviarse en la

, primera etapa era jugar ~n equilibrio .~ominado en :1 sentido de Par,etoen la segunda etapa, cashgandotamblen con ello al Jugador que casllga,Aquí, en cambio, existen tres equilibrios en la frontera de Pareto -unopara recompensar el buen comportamiento de ambos jugadores en laprimera etapa y los otros dos para ser utilizados no sólo para castigar al

~Ti;;~):Jugador que se desvía en la primera etapa, sino también para recompensar'."'2E::.aiillgádor que castiga. Por tanto, si se requiere una penalización en laY';~">Segunda ronda, no existe otro equilibrio del juego de etapa preferido por!-F ' ., .eljugador que castiga, de forma que no se puede persuadir al jugador que

castiga de que renegocie la penalización.

1,1 5,0 0,0 0,0 0,0

0,5 4,4 0,0 0,0 0,0

0,0 0,0 3,3 0,0 0,0

0,0 0,0 0,0 4,! 0,0

0,0 0,0 0,0 0,0 !,4

Figura 2.3.5

JI

ClDI

/:;~ PI

Ql

~8 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

y demostrar el teorema de Friedman (1971) (también llamado teorema detradición oral o teorema folk).I6

Jugador 2

h D2

1,1 5,0Jugador 1

0,5 4,4

Figura 2.3.6

Supongamos que el dilema de los presos de la figura 2.3.6 se repiteinfinitamente y que, para cada t, los resultados de las t - 1 jugadas ante-riores del juego de etapa se han observado antes de que la t-ésima etapaempiece. Sumar simplemente las ganancias de esta sucesión infinita dejuegos de etapa no proporciona una medida útil de la ganancia de unjugador en el juego repetido infinitamente. Recibir una ganancia de 4 encada periodo es mejor que recibir una ganancia de 1 en cada periodo, porejemplo, pero la suma de ganancias es infinita en ambos casos. , Recor-demos (en el modelo de negociación de Rubinstein <;lela sección 2.1.D)que el factor de descuento 5 = l/O + 1')es el valor actual de lila pesetaque se vaya a recibir en el periodo siguiente, donde l' es el tipo de interéspor periodo. Dados un factor de descuento y las ganancias de un jugadorobtenidos de una sucesión infinita de juegos de etapa, podemos calcular

16 El teorema de tradición oral original se referia a las ganancias en todos los equilibriosde Nash de un,juego repetido infinitamente. A este resultado se le llamó teorema de tradiciónoral por ser ampliamente conocido entre los teóricos de juegos de íos "años cincuenia, aunsin que nadie lo hubiera publicado. El teorema de Friedman (1971) se refiere a lasgánanciasen ciertos equilibrios de Nash perfectos en subjuegos de un juego repebdo infinitamente y,por tanto, refuerza el teorema de tradición oral original al utilizar un criterio de solución másfuerte, el equilibrio de Nash perfecto en subjuegos en vez del equilibrio de Nash. Sin embargo,el antiguo nombre ha prevalecido: al teore;na de Friedman (y a otros resultados posteriores)se les llama a veces teoremas ele tradición oral, aun cuando' no hayan sido ampliamenteconocidos entre los teóricos de juegos antes de ser publicados.

]¡¡egos repetidos /89

el valor presente de las ganancias, es decir, la ganancia total que podríaingresarse en un banco ahora de forma que produjera el mismo saldo alfinal de la sucesión.

Definición. Dado un factor de descuento 5, el valor presente de la sucesióninfinita de pagos 7f¡,7f2,7f3,'.. es

00

7fi+ 57f2+ 527f3+ ... =L 5t-l7ft.t=I

También podemos utilizar 5 para reinterpretar lo que l~amamos unjuego repetido infinitamente como un juego repetido que se acaba despuésde un número aleatorio de repeticiones. Supongamos que al finalizar cadaetapa se lanza una moneda (trucada) para determinar si el juego se acaba~ no. Si la probabilidad de que el juego se acabe inmediatamente es p y,por tanto, 1 - p es la probabilidad de que el juego continue al menos unaetapa más, una ganancia de,7f a recibir en la siguiente etapa (si se juega)tiene un valor de sólo O-p)7f /0 +1')antes de efectuar el lanzamiento del~moneda correspondiente a esta etapa. Del mismo modo, una gan~cia de7fa recibir dentro en dos etapas (si ambas etapas se juegan) tiene un:valorde sólo 0- p)27f/0+ 1')2antes de efectuar el lanzamiento de la monedacorrespondiente a esta etapa. Sea 5 = O - p)/O + 1'). Entonces el valorpresente 7f1+ 57f2+527f3+ ... refleja tanto el valor temporal del dinero comola posibilidad de que el juego se acabe.

Consideremos el dilema de los presos repetido infinitalIlente en elqueel factor de descuento de cada jugador es 5"y la ganancia de cq9,aj:ugadoren el juego repetido es el valor presente de las ganan.ciasdel jugad()f,eplos juegos de etapa. Demostraremos que la cooperación, es decir,(D1,D2),puede ocurrir en cada etapa de un resultado perfecto en subjuegos deljuego repetido infinitamente, aun cuando el único equilibrio de Nashdel juego de etapa es la no cooperación, es decir, (1},h) El argumerltoes del mismo estilo que nuestro análisis del juego repetido en dos etapasbasado en la figura 2.3.3 (el juego de etapa en el que añadimos un segundoequilibrio de Nash al dilem,! de los presos): si los jugadores cooperanhoy entonces juegan un equilibrio con ganancias altas mañana; en casocontrario juegan un equilibrio Con ganancias bajas mañana. La diferenciaentre el juego repetido en dos etapas y el juego repetido infinitamente esque aquí el equilibrio con gananciéls áltasquepodría jugarse mañana nose ha añadido artificialmente, sirlOque representa continuar cooperandoa partir de mañana y en lo Sucesivo.

(''-.-

(,1'.~..~, .'

c..';-',

"'~'-

,,",

'.'

.::..,'

90 I JUEGOS Dú'\JÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

Supongamos que el jugadori empieza el juego repetido infinitamentecooperando y sigue cooperando en cada juego de etapa siguiente si y sólosi ambos jugadores han cooperado en cada ronda previa. Formalmente,.Ia estrategia, del jugador i es:

Jugar Di en la primera etapa. En la t-ésima etapa, siel resultado de todas las t - 1 etapas anteriores ha sido(Dl,D2) entonces jugar Di; en caso contrario, jugar h

Estaes~~~t~i?aesun, ei,:fi,lplod:l~/~t.rategiadel disparador(trigger strategy);.'llamadaasÍ p'orque el jugadÓ~i coopera hastaquealguieridefa de Cooperar,lo qu~Aesencadena' la;décislón'de. rtovóivéi '~'.'cooperairí.Utlcaffiás: Siambos jugadores adoptánla, estrat~gia derdlsparador, el resUltado d~l"juegorepeti~o inffuitamertte será (Dl,D~)enCádaetapa.' Yerembs pnmeioque si o está' lo suficientemente Cerca de uno, el hecho de que los dosjugadores adopten esta estr~tegia cortstituyeun equilibrio de Nash deljuegorepetidó infinitamente. Veremos a contiriu~ción que este equilibriode Nash es'perfecto en subjuegos, en un sentido que se precisará másadelante.

Para demostrar que la adopción de la estrategia del disparador porparte de los dos jUi?adores es un equilibrio de Nash del juego repetidoinfinitamente, supondremos que el jugador i ha adoptado la estrategiadel disparador ydemostraremos a'continuación, siempre que o esté losuficientemente cerca de uno, que adoptar esta estrategia es también lamejor respuesta del jugador j. Dado que el jugador i jugará I¡ parasiempreeuandó el resultado de alguna ronda difiera de (Dl~D2),lafuejorrespuesta del jugador j es efectivamente jugar Ij para siempre ruando elresultado de alguna etapa difiera de (Dl,D2)' Queda: por determinar lamejor respuesta del jugador ien la primera etapa yen cualquier etapa talque los resultados anteriores hayan sido (Dl,D2). Jugar Ij proporcionaríauna ganancia de 5 en esta etapa, pero desencadenaría la riocooperacióndel jugador"i (y, por tanto, también del jugador j) enio sucesivo, de formaque la ganancia en cada etapa futUra sería 1: Comd'1+ó+ó2+:. /=1/(1-0),el valor presente de esta:sucesión de ganancias es

2 . .05 + 0.1 + o .1 + ... = 5 + -"-.1-0Alternativamente, jugarD j proporcionaría una gananCiade 4 enéitá'etapay conduciría a exactamente lafuis~a elecciórtentre Ijy Dj en lasigtiienteetapa. Llamemos V al val,orptesert!e de la sucesión infinIta degahán¿ia's

. _. . _ '. . . . "'.~ •. ~,.~- ;.0 . < - ,"

Juegos repetidos ! 91

ue el jugador j recibe por realizar esta elección de forma óptima (ahoraq cada vez que aparezca). Si jugar Dj es óptimo entoncesy ,

V=4+ól/,

o V = 4/(1- ó), ya que jugar Dj conduce a la misma decisión en la sig"uienteetapa. Si jugar Ij es óptimo entonces

. óV = 5 + 1 _ o'

coma obtuvimos antes. Por tanto, jugar Dj es óptimo si y sólo si

4 o1 _ o ~ 5 + 1 _ ó' (2.3.1)

o ó ~ 1/4. Por tanto, en la primera etapa, y en cualquier ronda tal quetodos los resultados anteriores hayan sidoCDl,D2), la decisión óptima deljugador j (dado que el jugador i ha adoptado láestrategia del disparador)es Dj si y sólo si ó ~ 1/4. Combinando esta observación con el hechode que la m~jor respuesta de j es jugar siempre Ij cuando el resultadode alguna etapa difiera de (Dl,D2), tenemos que el que los dos jugadoresjueguen la estrategia del disparador es un equilibrio de Nash si y sólo siÓ ~ 1/4.

Vamos a ver ahora que este equilibrio de Nash es perfecto en sub-.juegos. Para hacerlo, definimos el concepto de estrategia en un juegorepetido, de subjuego en un juego repetido y de equilibrio de Nash per-fecto en subjuegos en un juego repetido. Para ilustrar estos conceptoscon ejemplos sencillos de las secciones anteriores, los definiremos parajuegos repetidos tanto finita como infinitamente. En la sección anteriordefinimos el juego repetido finitamente G(T) basado en un juego de etapaG = {Al,'" ,An; 'ul,' .. ,un), un juego estático con informaéión completaen el que los jugadores 1 a n eligen simultáneamente las acciones al a (1."

de los espacios de acciones Al a An respectivamente, y las ganancias sonUl (al, ... ,an) a Un (al, ... ,O'n)' Definimos ahora el juego análogo repetidoinfinitamente.17

Definición. Dado un juego de etapa G, denominamos G(co,o) al juego repetido.infinitamente en el que G se repite por siempre y los jugadores tienen el mismo

17 Naturalmente se puede definir también un juego repetido basado en un juego de etapadiháInico, En esta sección limitamos nuestra atención a juegos de etapa estáticos para poderpresentar las ideas principales de. forma sencilla. Las aplicaciones en las secciones 2.3.0 y2.3.E son juegos repetidos basados en juegos de etapa dinámicos.

92 I JUEGOS DfNÁMICOS CON INFORMACiÓN COMPLETA (e. 2)

¡áclor de desCllento 6. Para cada t, los resultados de las t - 1 jugadas anteriores deljllego de etapa son conocidos antes de que empiece la t-ésima etapa. La gananciade cada jugador en G(co,o) es el valor presente de las ganancias que el jugadoroutiene en la sucesión infinita de juegos de etapa.

En cualquier juego (repetido o no), la estrategia de un jugador es unplan completo de acción, es decir, especifica una acción factible del jugadoren cada contingencia en la que le pudiera corresponder actuar. Dicho deforma algo más frívola, si un j~ga_dordejara una estrateg!a a su abogadoanles de que el juego empezase, el abogado podría sustituir al jugadoren el juego, sin necesitar en ningún caso de instrucciones adicionalessobre cómo jugar. En un juego estático con información completa, porejemplo, una estrategia es simplemente una acción. (Por esto describimoslal juego como G = {S¡,,,,,Sn;'U¡, ... ,un} en el capitulo t pero aquípu:de describirse también como G = {A], ... ,An; U¡, '" ,un}: en un juegoestallco con información 120mpletael ~spacio de estrategias del jugador i,Si, es simplemente el espacio de acciones Ai.) Sin embargo, en un juegodinámico, una estrategia es más complicada.

Consideremos el dilema de los presos en dos etapas analizado en lasección anterior. Cada jugador acruados veces, de forma que podríapensarse que una estrategia es simplemente un par dé irIstrucciones (b,c),

donde b es la decisión en la primera etapa y e es la decisión en la segundaelapa. Pero existen cuatro resultados posibles de la prÍ11leraetapa, (1¡,1z),U¡,Dz),(D1,1ú y (D¡,Dú, que representan cuatro contingencias diferentesen las que al jugador l~podría corresponder actuar. Por tanto, la estrategiade cada jugador consta de cinco instrucciones, que indicamos mediante(V¡W,x,y,z), donde v es la decisión en la primera etapa y w,x,y y zson''!asdecisiones en la segunda etapa correspondientes a (11,h), (11,Dz), (D¡Jz) y(D¡,Dz) respectivamente. Usando esta notación, las instrucciones "jugar ben la primera etapa y jugar e en la segunda pase lo que pase enla primera"se describen como (b,c,c,c,c), pero esta notación también puede expresarestrategias en las que la decisión de la segunda etapa es contingente delresultado de la primera etapa, tal como (b,c,c,c,b), que significa "jugar b enla pnmera etapa y jugar e en la segunda ronda a menos que el resultadode la primera sea (D1,D:J, en cuyo caso jugar b". Del mismo modo, enel juego. repetido en dos etapas basado en la figura 2.3.3, la estrategiade cada Jugador consta de diez instrucciones, una decisión en la primeraetapa y nueve decisiones contingentes en la segunda etapa, una para cadaresultado posible de la primera etapa. Recordemos que al analizar el

Juegos repetidos I 93

juego repetido en dos etapas consideramos una estrategia en la que ladecisión del jugador .¡ en la segunda etapa era contingente del resultadode la primera etapa: jugar Ci en la primera etapa y jugar li en la segundaa menos que el resultado de la primera sea (C¡,Cz), en cuyo caso jugar Dien la segunda etapa.

En el juego repetido finitamente G(T) o en el repetido infinitamenteG(co/i), la historia de! juego hasta la etapa t es el registro de las decisionesde los jugadores desde la etapa 1 hasta la t. Los jugadores podrían ha-ber escogido (un, ... ,un¡) en la etapa 1, (un, ... ,unz) en la etapa 2,. .. , y(U¡u ... /lnt) en la etapa t por ejemplo, donde para cada jugador i y etapas la acción Uis pertenece al espacio de acciones Ai.

Definición. En e! juego repetido finitamente G(T) o en el juego' repetido infini-tamente G(co,8), la estrategia de un jugador determina la acción que el jugadorrealizará en cada etapa para cada posible historia de/juego hasta la etapa anterior.

Pasemos ahora a los subjuegos. Un subjuego es una parte de un juego,la parte que queda por jugar empezando en cualquier momento en el quela historia completa del juego hasta entonces sea información deI'doIÍúrÜopúblico entre los jugadores. (Más adelante en esta sección damos unadefinición precisa en el caso de los juegos repetidos G(T) y G(co,8);en l(isección 2.4.B damos una definición precisa para juegos dinámicos con in-formación completa en general.) En el dilema de los presos en dos etapas,por ejemplo, hay cuatro subjuegos que corresponden a los juegos de lasegunda etapa que siguen a los cuatro resultados posibles de la primeraetapa. Del mismo modo, en el juego repetido en dos etapas basado enla figura 2.3.3, hay nueve subjuegos que corresponden a los nueve re-sultados posibles en el juego de la primera etapa. En el juego repetidofinitamente G(T) yen el juego repetido infinitamente G(co,8)la definiciónde estrategia está íntimamente ligada a la definición de subjuego: la es-trategia de un jugador determina las acciones que el jugador realizará enla primera etapa del juego repetido y enla primera etapa de cada uno desus subjuegos.

Definición. En e/juego repetido finitamente G(T), un sllbjllego que empieza enla etapa t + 1es e! juego repetido en e! que G se juega T - t veces y que designamospor G(T - t). Exist~ muchos subjuegos que empiezan en la etapa t +1, uno paracada una de las posibles historias de! juego hasta la etapa t. En e! juego repetidoinfinitamente G(co,8), cada subjuegoque empieza en la etapa t + 1 es idéntico

Ganancia al jugador 2

Ganancia aljugador 1

(5,0)

Figura 2.3.7

(0,5)

¡liegos "e¡'e/idos / qs

Aplicamos seguidamente argumentos análogos al juego repetí.do infi-'nitamente G(oo,o). Estos argumentos conducen al teorema. de Fnedman(1971) para juegos repetidos infinitamente. Para enunciar' el teorema, ne-cesitarnos dos últimas definiciones. Primero, llamamos factIbles a las ga-

. ( x ) en ell'uego de etapa G si son una combinación convexananCIas Xl,"" n .(es decir, una media ponderada donde las ponderaciones son no-negativasy suman uno) de las ganancias a las estrategias puras de.G. El conju.lltode ganancias factibles en el dilema de los pres~s de la figura 2..3.6 es laregión sombreada de la figura 2.3.7. Las gananCIas alas .estra~eglas puras(1, 1), (0,5), (4, 4) Y (5, O) son factibles. Otros pagos factIbles mcluyen los

(, ) para 1 < x < 4 que resultan de las medias ponderadas de (1,pares X,X .,

1) Y (4, 4), Y los pares (y,z) para y + z = 5 YO < Y < 5, que resl1.ltan.delas medias ponderadas de (O, 5) Y (5, O). Los otro~ pares en (el mtenorde) la región sombreada de la figura 2.3.7 son medIas ponderadas de las

(Dl,Dz). Si el jugador adopta la estrategi~ del disparador p~ra el juegoleto entonces (i) las estrategias del Jugador en un subluego de lacomp , 1

. era clase son de nuevo la estrategia del disparador, que ya 1e11l0SPd

nmstrado que es un equilibrio de Nash del juego completo, y (H) la,s

emo . 1 testrategias del jugador en un juego de la segunda clase son slmp eme:1.erepetir en lo sucesivo el equilibrio del juego de etapa (1¡,1z), que e: ~a,~blenun equilibrio de Nash del juego completo. Por tanto, un eqmhbllo. deNash en las estrategias del disparador del dilema de los presos repetidoinfinitamente es perfecto en subjuegos.

Obsérvese que la t-ésima etapa de un juego repetido no es por sí mismaun subjuego del juego repetido (suponiendo que t < T en el caso finito).Un subjuego es una parte del juego original que no sólo empieza en unmomento en que la historia del juego hasta entonces es información deldomino público entre todos los jugadores, sino que también incluye todaslas decisiones posteriores a ese rnome~toen el juego original. Analizar lat-ésima etapa aisladamente sería equivaierit~a considerar la t-ésima etapacorno la etapa final del juego repetido ..Tal análisis podría llevarse a cabopero no sería relevante para el juego repetido original.

Estamos ahora preparados para la definición de equilibrio de Nashperfecto en subjuegos, la cual depende a su vez de la definición de equili-brio de Nash. Esta última no 11acambiado desde el capítulo 1, pero ahoraapreciamos la complejidad potencial de la estrategia de un jugador enun juego dinámico: en cualquier juego, un equilibrio de Nash es una co-lección de estrategias, una para cada jugador, tal que la estrategia de cadajugador es la mejor respuesta a las estrategias de los demás jugadores.

, '

El equilibrio de Nash perfecto en subjuegos es un refinamiento delequilibrio deNash. Es decir, para ser perfecto en subjuegos, las estrategiasde los jugadores deben ser primero un equilibrio de Nash y pasar luegouna prueba adicionaL

Para demostrar que el equilibrio de Nash en las estrategias del dis-parador deLdilema de los presos repetido infinitamente es perfecto ensubjuegos, debernos demostra'r que las estrategias del disparador cons-tituyen un equilibrio de Nash en cada subjuego de este juego repetidoinfinitamente. Recordemos que cada subjuego de un juego repetido infi-nitamente es idéntico al juego completo. En el equilibrio de Nash en lasestrategias del disparador del dilema de los presos repetido infinitamente,estos subjuegos pueden agruparse en dos clases: (i) subjuegos en los quetodos los resultados de las etapas anteriores han sido (D¡,D2), y (ii) sub-juegos en los que el resultado de al menos una etapa anterior difiere de

Definición. ,(Selten 1965): Un equilibrio de Nash es perfecto en subjuegossi las estrategias de los jugadores constituyen un equilibrio de Nash en cadasubjuego. ' ,

al juego original G(oo,o). Como en el caso con horizonte finito, existen tantossubjuegos que empiezan en la etapa t + 1 de G(oo,o) como posibles historias deljuego hasta la etapa t.

94 / JUEGOS DINÁMICOS CON INFOI~MAClÓN COMPLETA (e. 2)

Juegos repetidos / 97

<,'

(.

, ., :.

Ganancia-aljugador 1

(5,0)

Figura 2.3.8

(0,5)

Pago al jugador 2

La demostración de este teorema repite los argumentos ya dados parael dilema de los presos repetido infinitamente, de forma que la relegamosal apéndice, Es conceptualmente inmediato pero algo complicado de no-tación extender el teorema a los juegos de etapa de buen comportamientoque'~~ ~~~ni,finitosni ~iáticos (veremos algunos ejemplos ~n las apli7caciones dé las tres próximas secciones). En el contexto del dilema delo~p~sos de la fiísuril2.3.6.- el teorema de Friedman garantiza que puedealcanzarse cualquier punto en la región más oscura de la figura 2.3.8comoganancia media en Un equilibrio de Nash perfecto en subjuegos del juegorep~tido, siempre y cuando el factor de descuento esté lo suficientementecerca de uno.

, Concluimos esta sección esbozando dos derivaciones adicionales de lateoría de juegos repetidos infinitamente, que se complican al añadírselesla siguiente característica especial del dilema de los presos. En el dilemade los presos (de una etapa) de la figura 2.3.6, el jugador i puede estarseguro de recibir,como mínimo la ganancia de 1 del equilibrio de Nash,jugando 1;. En un juego de duopolio de Cournot de una etapa (comoel descrito en la sección 1.2.A), por el contrario, una empresa no puedeestar segura de obtener los beneficios del equilibrio de Nash produciendo

cada jugador 'í y si (j está lo suficientemente cerca de uno, existe UI1 equilibrio deNash perfecto en subjuegos del juego repetido infinitamente G(oo,ti) que alcanza(X], ... ,xn) como ganancia media. '

ganancias de más de dos estrategias puras. Para conseguir una mediaponderada de las ganancias de estrategias puras, los jugadores podríanulilizar un mecanismo aleatorio público: jugando U],D2) o (D],h) de-pendiendo del lanzamiento de una moneda (no trucada), por ejemplo,consiguen ganancias esperadas de (2,5,2,5).

La segunda definición que necesitamos para poder enunciar el teo-rema de Friedman es un reajuste de las ganancias a los jugadores: Con-tinuamos definiendo las ganancias de cada jugador en el juego repetidoinfinitamente G(oo,ti) como el valor presente de la sucesión infinita deganancias del jugador en el juego de etapa, pero es más conveniente ex-presar este v.alor en términos de la ganancia media de la'misma sucesióninfinita de juegos de etapa, la ganancia que se tendría que recibir en cadaetapa de forma que resultara en el mismo valor presente. Sea 8 el factor dedescuento. Supongamos que la sucesión infinita de ganancias 7f¡'1f2,1f3, ...

tiene un valor presente de V. Si se recibiese una ganancia 7f en cada etapa,el valor presente sería 1fjO - 8). Para que, 1f sea la ganancia media dela sucesión infinita 7f1,1f2,7f3, ... con un factor de descuento 8, estos dosvalores presentes han de ser iguales, por tanto 1f = VO - 8). Es decir, laganancia media es O - 8) veces elv~lOr presente:

96 / JUEGOS DfNÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

Definición. Dado el factor de descuento 8, la ganancia media de la sucesióninfinita de ganancias 1f],1f2,1f3,' .. es

00

O - 8)¿8t-]7ft._

t=1

La ventaja de la ganancia media con respecto del valor presente es queel primero es directamente comparable con las ganancias del juego deetapa. En el dilema de los presos de la figura 2.3.6, por ejemplo, ambosjugadores podrían recibir una ganancia de 4 en cada periodo. Talsucesióninfinita 0e ganancias tiene una ganancia media de 4 pero un valor presentede .4/0 - 8). Sin embargo, como la ganancia media no esmás que unreajuste del valor presente, maximizar la ganancia media es equivalente amaximizar el valor presente.

Estamos finalmente preparados para enunciar el resultado principalen nuestra discusión sobre juegos repetidos infinitamente.

leorema. (Friedman 1971): Sea G un juego finito, estátic~y con informacióncompleta. Denominemos (e], ... ,en) a las ganancias en un equilibrio de Nash deG, y (x 1, ... ,xn) a otras ganancias factibles cualesquiera de G. Si Xi > ei para

, .~t~;'b:

~t::

,',... ,-,' .. ' "

98 I JUEGOS DlNMIICOS CON INFORMACIÓN COMPLETA (e. 2)

la cantidad del equilibrio de Nash; más bien, el único beneficio que unaempresa puede estar segura de recibir es cero, produciendo cero, Dadoun juego de etapa arbitario G, denotamos con Ti la ganancia de reserva deljugador 'Í -la ganancia más alta que el jugador 'Í puede estar seguro derecibir, hagan lo que hagan el resto de los jugadores, Debe ser el caso queTi :::; ei (donde eí es la ganancia del jugador 'Í en el equilibrio de Nashutilizado en el teorema de Friedman), ya que si Ti fuera mayor que eú nosería la mejor respuesta del jugador 'Í jugar su estrategia dl:iJ equilibrio deNash, En el dilema de los presos, Ti = ei, pero en el juego del duopolio deCo1irnot (y típicamente), Ti < ei. " '-"")': .

Fudenberg yMaskin (1986) demuestt~Il,qyeenjuegos con dos Jugado~res, las ganancias de reserva (Tl,T2)'pi.led~~réerripla'zaia las gananCias deequilibrio (q,éú'en el enunciado del te¿terna.deFriedman. Es decir, si(Xl,X2) es una ganancia factible deO, C011Xi' > Ti para cada 'Í, para 5 losuficIentemente cerca de uno, existe un equilibrio de Nash perfecto ensubjuegos de 0(00,5) que al~ania (Xl,X2) como ganancia media, incluso siXi < ei para alguno de los jugadores, En juegos con más de dos jugadores,Fudenberg yMaskin ofrecen una condición débil bajo la cual las gananciasde reserva (TI," "Tn) pueden reemplazar a I",sganancias de equilibrio enel enunciado del teorema.

También tiene interés la siguiente pregunta complementaria: ¿quéganancias medias pueden alcanzarsetoh un equilibrio de Nash perfectoen subjuegos cuando el factor de descuénto no está 10 "suficientementecerca de Uno"? Una manera de abordar esta cuestión es considerar unvalor fijode5 y determinar las gánaitciás medias que pueden alcanzarsesi los jugadores usan las estrategias del dísparador qué se desplazan parasiempre al equilibrio'de Nashdel juego de'etapa despuéS de cualquierdesviación. Valoresmenores de 5hacen queuna penalización que empieceen el próximo periodo sea menos efectiva para evitar una desviación eneste periodo ..'No obstante;lós jugadores pueden tlpicamernte hacer algomejor que simplemente jugar un equilibrio de Nash del juego de etapa.Un segundo enfoque, iniciado por Abreu (1988), se basa en la idea deque la forma más: efectiva de evitar que jm jugador- se desVÍe de unaestrategia propuesta es amenazarlo con administrar la penalización creíblemás dura en el caso que se desVÍe (es decir, amenazar con responder auna desviación jugando el equilIbrio de Nash perfecto en subjuegos deljuego repetido infinitamente que proporciona la ganancia menor entretodos esos equilibrios al jugador que se desvía). En la mayoría de juegos,desplazarse para siempre al equilibrio de Násh del juego de etapa no es

Juegos I'qJef idos I 99

1, 'o'n creíble más fuerte' por tanto, utilizando el enfoque dela pena IzaCI ' ", '.,den alca!1Zarse ganancias medIas que no podnan alcanzill seAbreu pue ' ,

'l' do el enfoque de la estrategia del disparador. En el ddema deutl Izan " , .. os SI'n embargo el equilibrio de Nash del Juego de etapa generalos pies , 'anancias de reserva (esto es, ei = T;) tales que los dos enfoques sonunas g , ,

equivalentes, En la próxima sección damos ejemplos de los dos enfoques.

Apéndice

Este apéndice demostramos el teorema de Friedman, Sea (ael,'" ,o'e,,)ne d 'l'b'el equilibrio de Nash de G que proporciona las ganancias e equJ 1 no( e) Del mismo modo, sea (0.",1,' .. ,0,,,,,,) la colección de accionesel,-'"' TI. •

que proporciona las ganancias factibles,(xl, ... ,xn), ,(La:U~a ~o.tación essólo indicativa porque ignora el mecamsmo aleatono publIco l1plCamentenecesario para alcanzar cualquier ganancia factible.) Consideremos lasiguiente estrategia del disparador en el caso del jugador 'Í:

Jugar axi en la primera etapa. En la t-ésima etapa, siel resultado de todas las t - 1 etapas anteriores ha sido(O.xl" .. ,0.",,,) jugar an; en caso contrario jugar o.ei'

Siambos jugadores adoptan esta estrategia, el resultado en cada etar,Jé1deljuego repetido infinitamente será (0,,,,1,' .. ,0,,,,,,). Argu~1entaJllOs pnmeroque si ti está lo suficientemente cerca de uno, el que lo~Jugadores ~d()ptenesta estrategia constituye un equilibrio de Nash del Jueg~ re~eltdo, Ar-gumentamos a continuación que esta estrategia es un equillbno de Nashperfecto en subjuegos. , '

Supongamos que todos los jugadores excepto el J~g~dor ¡,han, adop-tado la estrategia del disparador. Dado que los demas Jugaran Stempl.e(o.el,'" ,o.e i-l,ae i+l, ... ,aen) siempre si el resultado de alguna etapa dI-fiere de (a~l,' .. ,~xn), la mejor respuesta del jugador 'Í esjugar siempre (J'e;

si el resultado en alguna ronda difiere de (a"l,' .. ,o.xn)' Queda por deter-minar la mejor respuesta del jugador 'Í en la primera ronda yen cualquieretapa en la que todos los resultados anteriores hayan sido (a",l, . ' . ,().",,,),

Sea adi la mejor desviación de (0.",1, ... ,0.",") que puede adoptar el jugador'Í. Esto es, adi es una solución de

max lLi(o.xl, - -' ,o,x,i_l,ai,o..T:¡i+l,'" ,o.xn).a,EA,

Sea di la ganancia a -i con esta desviación: di = v,;(axl,' , . ,o,,,,,i-l ,0.di,0'x,;+1

-------- •.

100/ JUECOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

.. , el",.,.,). (Ignoramos de nuevo el papel del' .. . 'i - . " mecamsmo aleatorlO'la me-JOIl eSVlaClOny su ", ~ .ganancIa puellen depender de que' estr t .hay l . d a egIa puraa se eCClOna° el mecanismo aleatorio) .,..."/L(a. a. . lenemos que di ?: x.; =, .eL ... , x '-1 a . a . 1 a) > (

I I XlI X¡'l+ I ... I xn e,¡ = Ui (le]" ... ,aen).Jugar adi proporcionará una ganancia de di en esta etapa pe d

cadena (ael,' .. ,a. a. . ro esen-. e,,-I, e,-.+L ... ,ae.,.,)en lo sucesIvo por parte de los d 'Jugadores, ante lo cual la mejor respuesta del J' d' emasl' uga or z es ae;, de forma

Sque a,gadnanClaen. cada etapa futura será e'i. El valor presente de estauceSlOn e gananCIas es

d" ,2 o.,+ u . e.,' + u . e. + = d. +. ' '" , 1 _ oei.

(Dad~ ~ue cualquier desviación desencadena la mismarespuest. d 1demas Jugad 1" d . '.' , a e os

. ores, a umca esviación que necesitamos considerar es la 'ventaJosa) Alt ti .' mas" . ema vamente, Jugar axi proporcionará una ganancia de x.en esta et~pa y conducirá a exactamente la misma elección entre a. a',~I:/~sIguIente ronda. Lla~emos con Vi al valor presente d~ las ga::~ci:~(e Juego de etapa que el Jugador i recibe por elegir óptimament (hYcada vez t . e a ora

que enga que hacerlo en lo sucesivo). Si J'ugar a . es o' ti'entonces " X> P mo,

Vi = Xi + oVi,o V - x ,/0 ,) S" .,-, - u. 1Jugar adi es óptimo, entonces

oVi = di + --e.1-0'"como obtuvimos p' ( .rio no está co 1 ~eVl~ment~. Supongamos que el mecanismo aleato-

l ' . rre aClOna o senalmente. Es suficiente entonces que d. seaa ganancIa mayor a la . d . ., d '. '. . meJor. eSVlaClOn el jugador i entre las difere _:~:a~:~:;n~clOnes de es~at~gias puras seleccionadas por el mecanismno

. n consecuencIa, Jugar axi es óptimo si y sólo si

Xi {¡-->d+-- .1 - {¡ - " 1 _ o e,,,

o

o> d; - Xi

- di - ei'

Por tanto, en la pri.. ' .t :l. . m.ra etapa, y en cualqwer etapa tal que todos los resul-al os antenores hayan 'd ( '" , .. SI o ax] .... ,ax.,.,), la declslOn ophma del jugador i

Juegos repetidos / 101

(dado que los demás jugadores han adoptado la estrategia del disparador)es axi si y sólo si {¡ ?: (di - xi)/(di - ei).

Combinando esta observación con el hecho de que la mejor respuestade 'i es jugar aei para siempre si el resultado de alguna etapa difiere de(axIJ' .. ,axn), conc'¡uimos que jugar la estrategia del disparador por partede todos los jugadores es un equilibrio de Nash si y sólo si

, d,; - Xiu ?: max -d--'

1 i - ei

Como di ?: Xi > ei, debe ocurrir que (di - xi)/(di - ei) < lpara cada i,de foimá que eI~valormáximo de esta fracción para cualquier jugador seatambién estrictamente menor que 1.

Queda por demostrar que este equilibrio de Nash es perfecto en sub-juegos. Es deCir,'que las estrategias del disparador deben constituir unequilibrio de Nash en cada subjuego de G(oo,o). Recordemos -que cadasubjuegode 0(00,0) es idéntico al propio G(oo,o). En el equilibrio de Nashcon estrategias del disparador estos subjuegos pueden agruparse en dosclases: (i) subjuegos en los que los resultados de las etapas anteriores hansido (axl, .. -: ;a~n), y (ji) subjuegos'en los qué el resultado de al menoSú.ri¡{etapa difiere de (axl,' .. ,axn)' Si los jugadores adoptan la estrategia 'deldisparador en el juego completo, (i) las estrategias'dé los jugadores ériun'subjuego de la primera etapa son de nuevo las estrategias del disparadorque, tal como acabamos de demostrar, constituyen un equilibrio de Nashdel juego completo, y (ii) las estrategias de los jugadores emin subjuegdcle .la segunda das e consisten simplemente en repetir el eqcilibno~a~IJiiegÓde etapa (ael,' .. ,aen), lo que también es un equilibrio de Nash d~l jrieg;;~"completo. Por tanto, el equilibrio de Nash conestrategiasciel cfu;Paradordel juego repetido infinitamente es perfecto en subjuegOs.

2.3.C Colusión entre duopolistas de Coumot

Friedman (971) fue el primero en demostrar que podria alcanzarse lacooperación en un juego repetido infinitamente utilizando estrategias queconsistieran en elegir para siempre el equilibrio de Nash del juego de etapadespués de cualquier desviación. Originalinente se aplicó a los casos decolusión en un oligopolio de Cmimot, del siguiente modo:

Recordemos el juego deCoumot estático de la sección 1.2.A: Si lacantidad agregada es Q =; ql + q2, el precio de equilibrio es P(Q) = a - Q,suponiendo que Q < a. Cada empresa tiene un,coste marginal ey no tiene

':,.,

....... '

':.." ,

"",',

',':.'

102 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

costes fijos. Las empresas escogen sus cantidades simultáneamente, En elúnico equilibrio de Nash, cada empresa produce una cantidad (a - c)/3;

a la que llamaremos la cantidad de Cournot y,denotaremos por qc. Dadoque en equilibrio la cantidad agregada, 2(0. - e)/3 es mayor que lacantidadde monopolio, qm == (a- c)/2, ambas empresas estarían mejor si cada unaprodujera la mitad de la cantidad de monopolio, q¡ = qm/2.

Consideremos el juego repetido infinitamente basado en este juegode etapa de Cournot, cuando las dos empresas tienen el mismo factor dedescuento 6. Calculemos ahora los valores de 6 para los <fue,cuando lasdos empresas juegan la siguiente estrategia;. llegamos aun equilibrio de 'Nash perfecto en subjuegos de este juego repetido infinitamente: '

Prog,!ciT la mitad de la cantidad de monopolio, q;'/2, ~ne! primer periodo. En el t-ésim,o periúdo~producir qm/"ZSI ambas empresas han producido qm/2 en cada uno d~los t- 1 periodos anteriores; en caso éúntnirio¡ producir,la cantidad de Cournot, qc. ,

Puesto,qu~ e,!argumento e~paralelo al dado para eldilem~de los pres;sde la sección anterior, seremos breves en la discusión. '"

Elbeneficio qu~ obtiene ~na e~presa cua~doambas producenqm/2 es(a - c)2/8,.que denotaremos por 1rm/2. ~l beneficio deuna empresa cuandoambas producen qc es (a - c)2/9, que denotaremos por 11"c. Finalmente, sila empresa i vaa producir qm/2 en este periodo, la cantidad que maximizalos beneficios de la empresa j en este periodo es uria sohición de '

max (a - q' _l,q ~ c)q,qj J 2' m - J

La solución es qj = 3(0. - c)/8, con un beneficio de 9(0. - c)2/64, quedenotamo~ mediante 11"d ("d" por desviaciÓn). ' Por tanto, que las dos!empresas Jueguen la estrategia del disparador expuesta anteriormente esun equilibrio de Nash siempre que ' ,

1161- 6 ' 2"11"m ::: 7rd + 1_ 6 . 11"c, '(2.3.2)

análoga a (2.3.1)en el análisis del dilema de los pr~~9S;S~stitu~e~do losvalores de11"m, -rrd y 11"cen (2.3.2)obtenemos que 6::: 9/1'1. Poi-Ías mi;masrazones que en la sección anterior, este equilibrio d~ Nash es perfecto ensubjuegos. "..,' ' "

Jllegos repel idos / 103

También podemos preguntarnos qué pueden conseguir las empresas si6< 9/17. Exploraremos los dos enfoques descritos en la sección ante.rior.Determinamos en primer lugar, para un valor dado de ó, la cantIdadmás rentable que las empresas pueden producir si ambas siguen unatrategia del disparador que transforman para siempre en la cantidad de~ .

Cournot después de cualquier desviación. Sabemos que estas estrategIasno pueden seguirse con una cantidad tan baja como la mitad ~e la cant~dadde monopolio, mientras que para cualquier valor de 6, repetIr la cantIdadde Coumot para siempre es un equilibrio de Nash perfecto en subjuegos.Por tanto, la cantidad más rentable que puede darse con las estrategias delclispáradoresfáentre q;,{/2 y qc. Para calcular esta cantidad, consideramosla estrategia del disparador siguiente:

Producir q* en el primer periodo. En el t-ésimo periodo,producir q* si ambas empresas han producido q* en cadauno de los t ~,1 periodos anteriores; en caso contrario,producir la cantidad de Coumot, k

El beneficio de una empresa si ambas juegan q* es (a - 2q* - c)q*, quedenotaremos mediante 11"*. Si la empresa iva a producir q* en este periodo,la cantidad que maximiza los beneficios de la empresa j en este periodoes una solución de

max (a, - qj - q* - c)qj._. qj

La solución es qj = (a. - q* - e)/2, con un beneficio de (a - q* - c)2/4, quede nuevo denotamos por 11"d. Que las dos empresas jueguen las estrategiasdel disparador dadas anteriormente es un eql,tilibriode Nash siempré que

1 8-- '11"* > 7rd + --' 7rc,1-8 - 1-6

Despejando q* en la ecuación de segundo grado resultante se obtiene queel valor menor de q* para el que las estrategias del disparador dadasant~riormente son un equilibrio de Nash perfecto en subjuegos es

9 - 56q* = 3(9 _ ó) (a - e),

que decrece monótonamente con Ó, tiende a qm/2 cuando ó tiende a 9/17y tiende a qc cuando 6 tiende a cero.

(2.3.3)

(2.3.4)

..',

-":

V(x) ?: 7rdp(X) + 5V(x).

Sustituyendo V(x) en (2.3.3)obtenemos

5 G7rm -7r(X») ?: 7rd - ~7fm.

Es decir, lo que se gana en este periodo por desviarse no debe ser mayorque el valor descontado de la pérdida en el periodo siguiente debida ala penalización. (Siempre y cuando ninguna de las empresas .se desviéde la fase de penalización, no hay ninguna pérdida a parlii dél si~enteperiodo, ya que la fase de penalización termina y las empresas vüelvenal resultado de monopolio, como si no hubiera habido desviación.) Délmismo modo, (2.3.4)puede reescribirse como .

1 1-- . -7r > 7rd + 8V(x).1-5 2 m_

En los subjuegos de penalización, cada empresa debe preferir administrarel castigo a recibir 71"dp este periodo y empezar de nuevo la penalizaciónen el siguiente periodo:

J !legos repetidos / 105

5 G7fm - 7r(x») ?: 7rdP ~ 7f(x?:: .

con una interpretación análoga. Para 5 = 1/2, (2.3.3)se cumple siémp~e ycuando x/(a - e) no esté entre 1/8 y3/8, Y (2.3.4)se'C{unplesix/(a - e)está entre 3/10 y 1/2. Por tanto, pa~a 5 = 1/2, la,estrafégia del palo y lazanahoria consigue que el resultado de mOÍ1.<)polio"sea un equilibrio deNash perfecto en subjuegos, siempre y cuando 3/Ss x/(a - e) S 1/2.

Existen otros muchos modelos de oligopolio dinámico que enriquecenel modelo simple desarrollado aquÍ. Concluirnós esta sección discutiendobrevemente dos clases de estos modelos: los modelos con variables de es-tado y los modelos con supervisión imperfecta. Las dos clases de modelostienen muchas aplicaciones que trascienden el ámbito del oligopolio;porejemplo, el modelo de salaribs de eficiencia de la próxima sección es uncaso de supervisión imperfecta. ','

perfecto en subjuegos, esta estrategia debe ser un equilibrio de Nash encada clase de subjuegos. En los subjuegos de colusión, cada empresadebe preferir recibir la mitad del beneficio de monopolio en losucesivo arecibir 7f d este periodo y el valor presente por penalización en el periodosiguiente:

10'1.1 JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

Exploramos ahora el segundo enfoque, que incluye la amenaza dehacer efectiva la penalización más fuerte creíble. Abreu (1986)aplica estaIdea a unos modelos de Cournot más generales que el nuestro, utilizandoun factor de descuento arbitrario; nosotros simplemel1te demostramosque el enfoque de Abreu permite que en nuestro modelo se obtenga elresultado de monopolio cuando f¡ = 1/2 (que es menor que 9/17). Consi-deremos la siguiente estrategia del "palo y la zanahoria"):

Producir la mitad de la cantidad de monopolio, qm/2, enel primer periodo. En el t-ésimo periodo, producir qm/2si ambas empresas produjeron qm/2 en el periodo t - 1,qm/2 si ambas empresas produjeron x en el periodo t - 1,Yx en cualquier otro caso.

Esta estrategia incluye una fase de penalización (de un periodo) en la quela empresa produce x y una fase de colusión (potencialmerite infinita) en laque la empresa produce qm/2. Si cualquiera de las dos empresas se desvíade la fase de colusión, empieza la fase de penalización. Si cualquiera de lasd~)sempresas se desvía de la fase de penalización, ésta vuelve a empezar.SInmguna empresa se desvía de la fase de penalización, empieza de nuevola fase de colusión.

El beneficio de una empresa si ambas producen x es (a - 2x - e)x, quedenotaremos mediante 7f(x). Sea V(x) el valor presente de recibir 7f(x) eneste periodo y la mitad del beneficio de monopolio en 16 sucesivo:

f¡ 1V(x) = 7f(x) + -- . -7f1 - f¡ 2 m.

Si la empresa 'i va a producir x en este periodo, la cantidad que maximizael beneficio de la empresa j este periodo es la solúción de

max (a - qj - x - e)qj.qj

Esta solución es qj = (a - x - e)/2, con un beneficio de (a - x - c)2/4, quedeno~amos por 7rdp(X), donde dp significa desviarse de la penalización.

SI arr:ba.s .empresas juegan esta estrategia, los subjuegos del juegorepet~~o mfulltamente pueden agruparse en dos clases: (i) subjuegos decoluslon:.en los que el resultado del periodo anterior fue (qm/2,qm/2) o(x,x),y (n) subjuegos de penalización, en los que el resultado del periodo~ntenor no fue ni (qm/2,qm/2) ni (x,x). Para que el que las dos empresasjueguen la estrategia del palo y la zanahoria sea un equilibrio de Nash

106 / JuEGOS DINÁMICOS CON INFORMAcrÓN COMPLETA (c. 2)

Rotemberg y Saloner (1986 y ejercicio 2.14) estudian la colusión en elciclo económico, permitiendo que la intersección con el eje de abci~as dela función de demanda fluctúe aleatoriamente de un periodo al otro. Encada periodo, todas las empresas observan la intersección con el eje de ab-cisas de la función de demanda en ese periodo antes de tornar decisiones;en otras aplicaciones,los jugadores observan otras variables de estadoal principio de cada periodo. El incentivo a desviarse de una estrategiapactada depende tanto del valor de la demanda en este periodo cornode los posibles valores de la demanda en periodos futuros. (Rotembergy Salonersuponen que la demanda no está correlacionada serialmentede forma que esta última consideración ,es independiente del valor pre~sente de la demanda, pero otros autores posteriormente han relajado estesupuesto.)

Green y Porter (1984) estudian la colusión cuando las desviacionesno se pueden detectar perfectamente: en vez de observar las cantidadesescogi~~s ~or la otra empresa, cada empresa observa tan sólo el preciode eqwlibno del mercado, que cada periodo recibe sacudidas debidas auna perturbación aleatoria inobservable. En este contexto, las empresasno puede,n distinguir cuándo un precio de equilibrio bajo se debe a queuna ~ ,mas empresas se han desviado de la estrategia pactada o a queoc:un0 una perturbación adversa. Green y Porter examinan los equili-bnos con estrategias del disparador tales que c~alquier precio por debajode un nivel crítico dispara un periodo de penalización durante el cuallas empresas juegan sus cantidades de Coumot. En equilibrio, ningunaempresa se desvía. No obstante, una perturbación especialmente malapuede hacer que el precio caiga por debajo del nivel crítico, desencade-na~do un periodo de penalización. Como algunas penalizaciones ocurrenacc,l~~ntalrnente, las penalizaciones infinitas del, tipo considerado en elanahSls de las estrategias del disparador no son óptimas. Estrategias dedos ~ases del tipo ,analizado por, Abreu podrían parecer prometedoras;efec?v~mente, Abreu, Pearce y Stacchetti (1986) demuestran que puedenser optimas.

2.3.D Salarios de eficiencia

En los modelos de salariOsde eficiencia, lo que producen los trabajadoresde una empresa depende del salario que la empresa paga. En el con-texto.de lo: países en vías de desarrollo, esto se explicaría porque unossalan os mas altos podrían conducir a una mejor nutrición; en los países

Jllegos repel ido< / 107

11dos W10S salarios más altos podrían inducir a que los trilbajado-desarro il , , . ..' preparados solicitasen empleo en la empresa que los ofrecIelil,res mejor . ,.

o podrían inducir a los trabajadores ya empleados a trabajar mas mtensa-

mente.Shapiro y Stiglitz (1984) desarrollan un mo.delo ~inámico en el q.ue

l empresas inducen a los trabajadores a trabajar mas pagando salanos:r:os y amenazando con despedir a los que sean descubiertos trabajandopoco. Como consecuencia de estos salarios altos, las empresas reducen sudemanda de trabajo, de forma que a1g1.mostrabajadores tendrán empleon salarios altos mientras que otros estarán (involuntariamente) parados.

ca d ,. 1Cuanto mayor sea el número de trabajadores para os, mas tIempo ellevará a un trabajador que haya sido despedido encontrar un nuevoempleo, de forma que la amenaza de despido resulta más. efectiva. Enel equilibrio competitivo, el salario 'w y la tasa de paro 1J, mduc.en a lostrabajadores a esforzarse, de tal forma que la demanda de trabajO de lasempresas al salario lJ) hace que la tasa de desempleo ~ea exactamente 'U,.

Vamos a estudiar los aspectos de este modelo que tienen que ver co~los juegos repetidos (pero ignoraremos los relacionados co~ el equilibriq'competitivo) analizando el caso de una empresa y un trabajador.

, Consideremos el siguiente juego de etapa. En primer lugar, la empresaofrece al trabajador unsalario,vJ. En segundo lugar, el trabajador a.ceptaorechaza la oferta de la empresa. Si el trabajador rechaza w, se conVIerteenun trabajador independiente con un salario Wo. Si el trabajador acepta UI,

escoge entre realizar un esfuerzo (lo que le produce una desutilidad e~o no(lo que no le produce desutilidad). La decisión tornada por el traba~adorsobre su esfuerzo no es observada por la empresa, pero lo que el traba)'Jdorproduce es observado tanto por la empresa como por el.!!abajador. Laproducción puede ser alta o baja; para simplificar, suponemos que elnivel bajo de producción es cero y escribimos, eLnivel~1to como y > O.Supongamos que si el trabajador realiza un esfuerzo, la producción es ~J,tacon probabilidad 1, pero que si el trabajador no se esfuerza, la producClones alta con probabilidad p y baja con probabilidad 1 - p. Por tanto, eneste modelo, un nivel bajo de producción es signo inequívoco de falta deesfuerzo. .tI

Si la empresa emplea al trabajador con un salario w, las gananciils albs jugado~es si el trabajador realiza un esfuerzo ~ la pro~ucción e: altason y - w para la empresa y w -'- e para el trabajador. SI el trabaJildorno se esfuerza, e es cero; si la producción es baja, y es cero. Suponemosque y - e > lIJO> py, de forma que al trabajador le resulta eficiente estilr

108/ JUEGOSDINÁMICOS CON INFOI~lyIACIÓNCOMPLETA (c. 2)

empleado en la empresa y realizar un esfuerzo, aunque también le resultam~jor ponerse de independiente a estar empleado en la empresa y noestorzarse.

El resultado perfecto en subjuegos de este juego de etapa es másbien poco prometedor: dado que la empresa pagaw por adelantado, eltrabajador no tiene ningún incentivo para esforzarse, de forma que laempresa ofrece w = O(o cualquier w ~ 'Wo) y el trabajador escoge trabajarcomo independiente. Sin embargo, en el juego repetido infinitamente, laempresa puede inducir un esfuerzo pagando un salario wsupérior a Wo yamenazando con despedir al trabajador en cuanto la producción sea baja.Demostramos que para algunos valores de los parámetros, la empresaencuentra que vale la pena inducir un esfuerzo pagando ese salario.

Uno podría preguntarse por qué la empresa y el trabajador no puedenfirmar un contrato c-6mpensatorio que dependa de la producción, deformaque induzca al esfuerzo. Una razón por la que estos contratos podríanno ser viables es que a un tribunal le resulta muy dificil. hacer que secumplan, quizás porque una medida adecuada de la producción incluyela calidad, las dificultades inesperadas en las condiciones de producción,etc. De un-aforrÍ1.amás general, es probable que loscontf?tos contingen~tes a determinadOs volú.menes de producción sean imperfectos (más quecompletamente inviables), aunque los incentivos todavía pueden jugar unpapel en el juego repetido estudiado aquí.

Consideremos las siguientes estrategias en el juego r~petido infinita-mente, que incluyen el salario 'W. >wo que se determinará más adelante.Diremos que la historia del juego es de salarió álto y prod~c2ión alta si todaslas ofertas anteriores han sido 'W., todas las ofertas anteriores han sidoaceptadas y todos los niveles de producción anteriores han sido altos. Laestrategia de la empresa es ofrecer w = 'W. en el primer periOdo, y ofrecerw = 'W. en cada periodo siguiente siempre y cuando la historia del juegosea de salario alto, producción alta, pero ofrecer w = Oen caso contrario.La estrategia del trabajador es aceptar la oferta de la empresa si w ~_Wo(decidiendo trabajar como independiente en caso contrario) y realizar unesfuerzo si la historia del juego, incluyendo la oferta presente, es de salarioalto y producción alta (no esforzándose en caso contrario).

La ~trategia de la empresa es análoga a las estrategias del dispara-dor analIzadas en las dos secciones anteriores: jugar cooperativamentesiempre y cuando todas las jugadas anteriores hayan sido cooperativas,pero escoger en lo sucesivo el resultado perfecto en subjuegos del juegode etapa si alguna vez se rompe la cooperación. La estrategia del jugador

Jllegos repetidos / 109

es también análoga a estas estrategias del disparador, pero es ligeramentemás sutil ya que el trabajador decide en segundo lugar en el juego de etapade decisión sucesiva. En un juego repetido basado en un juego de etapa dedecisión simultánea, las desviaciones se detectan sólo al final de la ronda;sin embargo, cuando el juego de etapa es de decisión sucesiva, una des-viación del primer jugador se detecta (y debería ser contestada) durantela misma ronda. La estrategia del trabajador es jugar cooperativamentesiempre y cuando todas las jugadas anteriores hayan sido cooperativas,pero responder de forma óptima a cualquier desviación de la empresa,sabiendo que el resultado perfecto en subjuegos del juego de etapa sejugará en todas las etapas futuras. En particular, si w 1- w. pero w ~ wo,el trabajador acepta la oferta de la empresa pero no se esfuerza.

Derivamos ahora las cond,iciones bajo las cuales estas estrategias sonun equilibrio de Nash perfecto en subjuegos. Como en las dos seccionesanteriOres, el argumento consta de dos partes: (i) la derivación de lascondiciones bajo las cuales estas estrategias son un equilibrio de Nash, y(ü) la demostración de que es perfecto en subjuegos.

Supongamos que la empresa ofrece w. en el primer periodo. Dadala estrategia de la empresa, es óptimo para el trabajador aceptar. Si eltrabajador realiza un esfuerzo, está seguro que producirá al nivel alto,de forma que la empresa volverá a ofrecer w' yel trabajador volverá aenfrentarse en el periodo siguiente a la misma decisión sobre el esfuerzoa realizar. Por tanto, si la decisión óptima dél trabajador es esforzarse, elvalor presente de las ganancias del trabajador es

Y.: = (w' - e) + 8y':,

o V. = (w' - e)/O - 8). Sin embargo, si el trabajador no se esfuerza,producirá al nivel alto con probabilidad p, en cuyo caso la misma decisióncon respecto al esfuerzo se dará en el próximo periodo, pero el trabajadorproducirá el nivel bajo con probabilidad 1- p,en cuyo caso la empresaofrecerá w = Oen lo sucesivo, de forma que en adelante el trabajadorserá independiente. Por tanto, si no esforzarse es la decisión óptima deltrabajador, el valor presente (esperado) de las ganancias del trabajador es

{. wa }V. = w' + {j pV.+ O -p\ _{j'

o V. = [0- 8)'W' + {jO - p)71Jo]/(l - {jp)O - 8). Realizar un esfuerzo esóptimo para el trabajador si Ve ~ V., O

'\."

110 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

1-/5Y-e> 'tilo + ---e- 60 - p) ,

Juegos repelidos / 111

que puede interpretarse como la restricción f~~liar de que fj debe ser losuficientemente alta para lograr una cooperaclOn sostenIda.

Hemos demostrado hasta ahora que si (2.3.5) y (2.3.7) se cumplen, las.estrategias que estamos considerando son un equilibrio de Nash: .Parademostrar que estas estrategias son perfectas en subjuegos, defJmmosprimero los subjuegos del juego repetido. Recordemos que cuan~'¡o eljuego de etapa obliga a decisiones simultáneas, lo~ subJuegos ~el Juegorepetido empiezan entre las etapas del juego repetido. Para el Jue1?odeetapa de decisiones sucesivas considerado aquí, los subjuegos empIezanno sólo entre etapas sino también dentro de cada etapa, después de que eltrabajador observa el salario que la empresa ofrece. Dadas las estrategiasde los jugadores, podemos agrupar los subjuegos en dos clases: los queempiezan después de una historia de salario alto y producción alta, y losque empiezan después de todas las demás historias. Hemos demosb'adoya que las estrategias de los jugadores son un equilibrio de Nash dadauna historia de la primera clase. Queda por hacer lo mismo cor~unahistoria del segundo tipo: como el trabajador no se esforzará l1\1nca,esuna decisión óptima de la empresa inducir al trabajador a trabajar comoindependiente; dado que la empresa ofrecerá V) == O en la siguiente etapa yen lo sucesivo, el trabajador no debería esforzarse en esta etapa y deberíaaceptar lá oferta presente sólo si 'w 2: O.

En este equilibrio, trabajar como independiente es permanente: si sedescubre al trabajador no esforzándose, la empresa ofrece 1J) == O en losucesivo; si la empresa se desvía alguna vez de ofrecer w ==. w*, el t.ra-bajador nunca volverá a esforzarse, de fiJrma quela empresa no puedepermitirse emplear al trabajador. Hay varias razC?naspara preguntarsesi es razonable que el trabajo como independiente sea permanente. Ennuestro modelo de una empresa y un trabajador, ambos jugadores pre-ferirían volver al equilibrio de salario alto y producción alta del juegorepetido infinitamente, antes que jugar para siempre el resultado perfectoen subjuegos del juego de etapa. Éste es el problema de la renegociaciónpresentado en la sección 2.3.A.Recordemos que si los jugadores saben queno se podrán hacer cumplir las penalizaciones, la cooperación inducidapor la amenaza de estas penalizaciones ya no es un equilibrio.

En el contexto del mercado de trabajo, la empresa puede preferir norenegociar si emplea muchos trabajadores, ya que renegociar con un tra-bajador puede estropear el equilibrio de salario alto y producción alta quese está todavía jugando (o aún sé ha de empezar a jugar) con los otrostrabajadores. Si hay muchas empresas, la cuestión es si ~aempresa .i con-

(2.3.5)

(2.3.6)

(2.3.7)y - w* 2: O.

1 (* ) .,. fj1 _ 6 w - e 2:w + 1- 6wo,

* 1- p{j (1 - (j )w 2: Wo + '(1 ) e == Wo + 1 + --- e. (j - p . [jO - p)

Por tanto, para inducir un esfuerzo, la empresa debe pagar no sólo Wo + epara compensar al trabajador por renunciar a la oportunidad de trabajarcomo independiente y por la desutilidaddel esfuerzo, sino también porla prima salarial O - {j)e/ [jO - p):NaturaImente, si p está cerca de uno (esdecir, si no esforzarse es difícilmente detectable), la prima salarial debeser extremadamente alta para inducir un esfuerzo. Sip == O, por otra parte,esforzarse es la decisión óptima del trabajador si

análogamente a (2.3.1) y (2.3.2) en los casos con supervisión perfecta delas dos secciones anteriores, (2.3.6) es equivalente a

* > '(1 1- 6)W _wo+ .+-/5-. e,

queefectivamenfe es (2.3.5) con p == O.

Incluso si (2.3.5) se cumple, de forma que la estrategia del trabajadorsea la mejor respuesta a la estrategia de la empresa, a la empresa tienetambién que merecerle la pena pagar w:: Dada la estrategia del trabajador,el problema de la empresa en el primer periodo se c(;mcreta en escogerentre: (1) pagar w == w*, induciendo con ello al esfuerzo y amenazandoco~ ~espedir al trabajador si en algún momento la producción es baja, y~eclbl~ndopor tanto la ganancia y - w* en cada periodo; y (2)pagar w == O,mdu~l~ndo con ello al trabajador a escoger trabajar como independiente,y reCIbiendo de esta forma una ganancia igual a cero en cada periodo. Portanto, la estrategia de la empresa es una mejor respuesta a la del traba-jador si

Recordemos que supusimos que y - e > Wo (es decir, que para el trabajadores eficiente estar empleado por la empresa y esforzarse). Necesitamos unacondición más fuerte si estas estrategias han de formar un equilibrio deNash perfecto en subjuegos: (2.3.5) y (2.3.7) implican

',1'

'112 í JUEGOS DlNÁMJCOS CON INFORMACJÓN COMPLETA (c. 2)

tratará a trabajadores empleados anteriormente en la empresa .¡. Pudieraser que la empresa j no lo hiciera, por miedo a estropear el equilibrio desalario alto y producción alta logrado con sus trabajadores, como en elcaso de una única empresa. Algo así puede explicar la falta de movilidadde los administrativos jóvenes y varones entre las grandes empresas enJapón.

Alternativamente,si los trabajadores despedidos pueden siempre en-contrar nuevos empleos que sean preferibles a trabajar como independien-tes, el salario en esos nuevos empleos (neto de cualquier desutilidad delesfuerzo) es el que aquí juega el papel del salario en el trabajo por librelUo. En el caso extremo en el que un trabajador despedido no sufra nin-guna pérdida, no existirán penaliza'ciones por no esforzarse en el juegorepetido infinitamente y, por consiguiente, no existirá ningún equilibriode Nash perfecto en subjuegos en el que el trabajador se esfuerce. Existeuna aplicación elegante de estas ideas en el contexto de la deuda públicaexterna en Bulow y Rogoff (1989): si un país endeudado puede conseguirel importe de los créditos a largo plazo que recibe de los paíSes acreedoresmediante transacciones a corto plazo por adelantado en el mercado inter-nacional de capitales, no hay posibilidad de penaliZ~r eliricumplimientode los términos de la deuda en el juego repetido infinitamente entre paíSesdeudores y acreedores.

2.3.E Política monetaria estable en el tiempo

Consideremos un juego de decisiones sucesivas en el que empresarios ytrabajadores renegocian los salarios nominales, después de lo rualla auto-ridad monetaria escoge la oferta monetaria que, a su vez, determina la tas'ade inflación. Si los contratos salariales no pueden' ser automáticamenteachlalizables, empresarios y trabajadores tratarán de prever la inflaCiónantes de fijar los salarios. Sin embargo, una vez se ha fijado el sala-rio nominal, un nivel real de inflación superior al previsto erosionará elsalario real, haciendo que los empresarios aumenten el empleo y la pro-ducción. La autoridad monetaria, por tanto, se enfrenta aun dilema altener que escoger entre los costes de la inflación y las ventajas de reducirel paro y aumentar la producción ante una evolución impreVista del nivelde inflación.

Como en Barro y Cardan (1983), analiZamos una versión en formareducida de este modelo en el siguiente juego de etapa. Primero, losempresarios forman sus expectativas de inflación, -¡re.En segundo lugar,

fllegos repetidos / 113

la autoridad monetaria observa esta expectativa y escoge el nivel real deinflación, -¡r. La ganancia de los empresarios es - (7[- 7[e)2. Es decir,los empresarios quieren simplemente prever correctamente el nivel deinflación; alcanzan su ganancia máxima (que es cero) cuando -¡r= 7[e. A laautoridad monetaria, por su parte, le gustaría que la inflación fuera cero. pero que la producción estuviera en su ruvel de eficiencia (y*). Escribimosla ganancia de la autoridad monetaria como

U(-¡r,y),= ::-C'Tr2 _ (y _y*)2,

donde el pªiá,meti-o c > O refleja el dilema de laaú,-t?I1d~dITl();l1~;~ria~n~,~S115 dos ~lJjeti~os'?llPo!;ga.mos q';le el verdad~!(): !ÚyeId~ pr,c)~}lc.ciónes i~sigule;tefuIíd¿n del ~velde producción deseado'y de la in£l.ac.i~~

' iIDpfevista'; " , , ,

y =by* + d(-¡r - -¡re),

donde b <1refleja ,la presencia de un poder de monopolio en los mer~cados de productos (de forma. que si no hubiera inflación imprevista; seproduCiría a un nivel por debajOdel de eficiencia) y d >'Omide el efecto dela iriflaciQrlin1prevista sobre.la producción a través de los salarios reales;tal ycomo se describió en el párrafo anterior. Podemos entonces reescribrrla ganancia de la autoridad monetaria como. .

W(-¡r,7[e) = _c-¡r2 - [(b - l)y* +d(-¡r - 7[e)]2.

Para h~llar el resultadop;d~to en subjuego~A~:'~!~'jt;~~9.d~¿~~tp.J~calculambs primero la elección óptima de-n: por Bme~ela,aut0!fd~9monetari~¡-a.adas l~s exp~étativas de los einpresarib~ -¡re.MaximiZandoW(-¡r,-¡re) obtenemos

d '1l'*(-¡re)= --:J?[(l - b)y* + d-¡re]. (2.3.8)

c+ u-

Dado qJle.los empresarios prevén que la autoridad monetaria escogerá-¡r*(-¡re),i~$'empresarios escogerán la -¡reque maximice _[-¡r*(7[e)- -¡re]2,loque da1r*(-¡re)=-¡re,o,.,

e d(1 - b) *'-¡r = ---y = ,-¡r.,c

donde el subíndice s denota, "juego de etapa". De forma similar, podríadeCirse que la expectativa' niCiomilque los empresarios deben mantener

,'.

.'~:;,,

~, ;:~;~~\:i!~W;Ú.;,~,\ ••~r,.lol~J~:~:.i~;~\"1'~'.\I'.I';,;¡,,:,;1;'r,,,,l..l.'~I'.••.,,.:.,,••;"" ••.:.:"'J.._~' ~-...:..!...~...:..-'~~L~,I...•.•.•...•._ •.~I;.l...;.'--:'<'~. ---.---------

(2,39)<...

".-,:

. ,~.;.

'.":.'

114 / JUEGOS DINÁMICOS CON TNFORMAClÓN COMPLETA (c. 2)

es la que será confirmada en lo sucesivo por la autoridad monetaria, deform~ que "*("e) =: ".e, y por tanto ".e = "'s' Cuando los empresariosmantIenen esta expectativa ".e =: "'s, el coste marginal en que incurre laautoridad monetaria al fijar". ligeramente por encima de ".s compensaexactamente el beneficio marginal de la inflación imprevista. En esteresultado perfecto en subjuegos, se espera que la autoridad monetariacree inflación y así lo hace, pero estaría mejor si pudiera comprometerse ano ~rear inflación. Efectivamente, si los empresarios tuvieran expectativasracIOnales (esdecir, rr =: ".e), una inflación cero maximiza la ganancia de laautoridad monetaric:.(es;decir, W(". ,'" e) = _c".2 - (b - 1)2y*2 cuando". = ".e,defonna que"..==O~só1'5tiroo)., ... .. ... . C6risi~~r~n10sah~ra!erjüeg() rer'etidO infinitam,ente en el que ambos

. Jugadores tienen el rmsmo factor de descuento Ó. Derivaremos condicio-nes bajo las cuales". = ".e.=: Oen cada periodo de un equilibrio de Nashper~ecto en subjuegos que incluya las siguientes estrategias. En el primerpenado, los empresarios mantienen la expectativa ".e =: O. En periodossucesivos.mantienen1a expectativane =;'Osiempre y cuandó todas lasexpectativas anteriores hayan sido ne=: ó.}' todos los niveles de inflacióna~teriores.hayan sido e0ctivamente ". =: O;en caso contrario, los empresa-nos.mantienenJa'exp'ectativaie =:".. (la expectativa racional en el juegode etapa), De forma similar, la autoridad monetaria fija". = Osiemprey cuando la expectativa presente sea ne,.", O;todas las expectativas ante-~ores hay.an sido ".e = OYtodos los niveles de inflación anteriores hayansIdo efectIvamente". = O;en caso contrario, laautorid'ad monetaria fija".=: ".*(nC}(sumejor respuesta a las expectativas de l()s empresarios, talcomo se indica en (23.8». .. ',.' "; . . .

Supongamo~que los empresarios mantienen la eXpectativa ".e = Oen el primer periodo. Dada la estrategia de los empresarios (es decir,la forma en que los empresarios actualizan sus expectativas después deobse~a~ el nivel verdadero de inflación), la autoridad monet~riapuederestrmg¡r su atención a dos decisiones: (1)". =: O, lo que conducirá ane = Oe~periodo siguiente y, por tanto, a la misma decisión por. parte dela autondad monetaria en el siguiente periodo; y (2) n = ".*(0)utilizando(2.3.8),10 que conducirá a".e =".. en lo su~esi~o,'en cuyo caso la autoridadmonetaria encontrará que es óptimo en lo sucesivo escoger n =: ". •. Encon~ecuen~ia, fijar". =: Oen este periodo resulta en la ganancia W(O,O) porp~n~do, mIentras que fijar" =: ".*(0)eneste periodo resulta en la gananciaW (". (O),O)eneste periodo, pero W(". .,".) en lo sucesivo. Parlo tanto, laest:rategia de la autoridad monetaria es la mejor respuesta

Juegos dil1ámicos COll il1fOI'llWÓÓI1 completa pero illlpe,.[eda / 115

_l_W(O O) > w (".+(0),0) + _rS_vV("',""'s),1-b '- 1-15

que es análoga a (2.3.6).Simplificando (2.3.9) obtenemos b 2: c/(2e + d2

). Cada u~o de los pa-rámetros c Y d tiene dos efectos. Un aumento en d, por ejemplo, haceque la inflación imprevista sea más efectiva de cara al aumento de ~aproducción, y resulta por tanto más tentador para la autondad mon:tanaser indulgente con la inflación imprevista, aunque por la mIsma razon, unaumento en d también aumenta el resultado del juego de etapa"" lo quehace que la penalización sea más dolorosa para la autoridad monetária,Dél mismo modo, un aumento de c hace que la inflación sea más dolorosa,por lo que la inflación imprevista resulta m~n~s tentadora, pero ~ambiénhace que".. disminuya. En ambos casoS, el ultImo efecto pesa mas que :1primero, de forma que el valor crítico del factor de descuento necesarIOpara mantener este e.quilibrio, c/(2c + d2

), decrece c~n d y crece c.onc.Hasta ahora hemos demostrado que la estrategIa de la autondad mo-

netaria es una mejor respuesta a la estrategia de los empresarios si (2.3.9)s~cumple. Para demostrar que éstas estrategias son un equilibrio ~e Nash,queda por demostrar que la última es una mejor resp.uesta ~ la pnmera,.locual se deriva de la observación de que los empresanos obtIenen su mejorganancia posible (que es cero) e.\lcada periodo. Demostrar q~e :stas es-trategias son perfectas en subjuegos requiere argumentos analogos a los

de la sección anterior.

2.4 Juegos dinámicos con infoIDlación completa pero imperfecta

2.4.A Representación de los juegos en fonna extensiva

En el capítulo 1 estudiamos juegos estáticos representándolos en formanormaL Analizamos ahora juegos dinámicos representándolos en formaextensiva.19 Este enfoque expositivo puede hacer que parezca que losjuegos ~státicos tienen que representarse en fo~a nom:al y los juegosdinámicos en forma extensiva, pero esto no es asI. CualqUJer Juego puederepresentarse tanto en forma normal como extensiva, aunque para algu-

19 Damos una descripción ü;'formaJ de la forma extensiva; p'ara un tratamienTo preciso

consúltese Kreps y Wilson (1982).

116/ JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

l'-.'

Este árbol empieza con un nodo de decisión correspondiente al jugador1, donde 1 escoge entre 1y D. Si el jugador 1 escoge 1,se llega a un nodode decisión del jugador 2, donde 2 escoge entre l' y D'. Del mismo modo,si el jugador 1 escoge D, se llega a otro nodo de decisión del jugador 2,donde 2 escoge entre l' y D'. Después de cada una de las decisiones de2 se llega a un nodo terminal (es decir, el juego termina) y se reciben lasgan¡mc;iasindicadas ..

Es inmediato extender el árbol de la figura 2.4.1 para representarcualquier juego dinámiCo con información completa y perfecta, es decir,cualquier juego en el queros jugadores toman sus decisiones uno despuésdel otro, todas las decisiones previas son información del dominio públicoantes de realizar el siguiente movirnientoy las ganancias a los jugadorescon cada combinación factible ,de decisiones son información del domi-nio público. (Los espacios. de-acciones continuos, como en el modelo de5tackelberg, Olos horizontes infinitos, como en el modelo de Rubinstein,presentan dificultades gráficas pero no conceptuales) Deriva~os segui-d¡mWl1teJareprese~tfición.en forma ,normal del juego:de la figura 2.4.1.C:0l1clpimospOI\últiIIÍ.9esta ~ec;c!9ndt=mostrang,()que los jueglJ,s~~!á~coscPlledel1represerÚarse enfofI!la extensiva y descnbiend() cómo represen~ .tar en formaext~nsiva l()s juegos dinámicos con información ~9rnpletapero imperfecta.

Tal como parecen indicar las convenciones sobre nmneración ~l~)asdefiniciones de las-formas no,rmaly extensiva, existe una íntiIna relaC;iónentre las estrategias f¡;ldiblesde un jugador (apartad02)dad.a.s en}a forP:t~nornal y la descripcipl1 de cu'ándo dec.ide un jugadorrcqu~'p:ll.~doe'):¡a<;£úqp.ésabe(apartados 2ª,?b, 2c) eril? fOI1llaextensiva.;~ani.rep:~~~tar.tiñjuego dinámico en forma normal, necesitamos.h"aducirJ~Wof!!laciónen:forma e?'tensiva en términos de la descripción del espacio de estrategías'de cada jugador en la fórma~normal. Para hacer esto, recordemos ladefinición de estrategia dada (formalmente) en la sección 2.3.B:

Juegos dinámicos con información completa pero imperfecta / 117

Definición. Una estrategia de un jugador es un plan de acción completo, esdecir, e~pecifica una acción factible de/jugador en cada contingenCia en la que aljugador le pudiera corresponder actuar.

. Puede parecer innecesario exigir que la estrategia de un jugador es--p~tmque una acción factible, para cada contingencia en la que al juga-db~'I)l~diera<;orrespQnderle decidir~;Resulta claro, sin embargo, que no

. ,poarí¡¡qlOs aplicar lanocióri de equilibrio de Nash a los juegos dinámicos

oO

21

<.. 2,')

Figura 2.4.1

Ganancia al jugador 1:Ganancia al jugador 2:

Definición. La representación en fanna extensiva de un juego exige preci~ar:(1) los jugadores, (2a) cuándo tiene que jugar cada jtigador,(2b) lo qt{e cadajugador puede hacer cada vez que tiene la oportunidad de jugar, (2c) lo que cadajugador sabe cada vez que tiene la oportunidad de jugar y (3) la ganancia recibidapor cada jugador para cada combinación posible de jugadas.

ALmqueno lo dijimos en su momento, eillas secciones 2.1 a 2.3 hemosanalizado varios j~egos representados en forma extensiva. La contri-bución de esta sección consi~te elldescribir estos juegos en forma deárbolen vez de utiliZár' palabr~s, porqtie el uso deárbo~es,.~ menudo'facilitatanto la explicaci6n co~o el análisis. ' .. , .> .,. - ' ..

Como ejemplo de un juego en formaextensiva, consideremóseI si-glliente representante dé la clase de juegos en dos etapas 'con informacióncompleta y perfecta presentada en la sección 2.1.A:

1. El jugador 1 escoge una acción al del conjunto factible Al = {J,D}.2. El jugador 2 observa al y escoge entonces una acción a2 del conjunto

,42 = {J',D'}.3. Las ganancias son Ul(al,az) y -uz(al,a2), como se indica en el árbol de

la figura 2.4.1.

nos juegos una de las dos formas es más apropiada que la otra. Vamos aver cómo los juegos estáticos pueden representarse utilizando la forma ex-tensiva y cómo los juegos dinámicos pueden ser representados utilizandola forma normal.

Recordemos de la sección l.1.A que la representación en forma normalde un juego requiere precisar: (1) los jugadores, (2) las estrategias posiblesde cada jugador y (3) las ganancias recibidas por cada jugador para cadacombinación de estrategias posibles.

Figura 2.4.2

Juegos dinámicos COI! informaciá,¡ comFleta Fero imFerfecta / 119

1. El jugador 1 escoge una acción al del conjunto factible Al'2. El jugador 2 no observa la decisión del jugador 1, pero escoge una

acción az del conjunto factible Az-

3. Las ganancias son tI'l (aj,az) y uz(al,az).

Alternativamente, el jugador 2 podría jugar primero y el jugador 1 podríadecidir sin obervar la acción de 2. Recordemos que en la sección 2.1.Bdemostramos que un juego consiste en escoger cantidades con esta f.or111atemporal y estructUra informativa difiere significativa,mente del J~Jegode Stackelberg, que tiene la misma forma temporal pero, una estructurainformativa taLquedacempresa 2 observa la decisión de la empresa ?_Hemos visto que el juego de decisiones sucesivas y ac~ón del contranono observada tiene el mismo equilibrio de Nash que el Juego de COUlnotde decisión simultánea.

Para represen:tar este tipo de ignorancia sobre los mo~i~ientos ante-riores en un juego en forma extensiva, introducimos la nOC1Onde conjuntode información de un jugador.

Defuliciónó Un conju~to de itlfonnación de un jugador es una colección denodos de decisió~ que satisface:

W al jugador le corresponde jugar ett-cada nodo del conjunto de informacióny.(ii) cuarido en el transcu'rso del juego se llega a 11/1 nodo del conjunto de 111fOl-

¿

, ., forma extensiva. Denominemos las filas de la forma normalentaClonen . I ds d on las estrategias factibles del Jugador 1 y las ca umnas ed aCuer oce d con las estrategias factibles del jugador 2, y calculemos las gana 11-euer o ..a. 1 J'ugadores en cada combinación posIble de estrategIas, como se~aoo ' ". dica en la figura 2.4.2.111 Una vez mostrado que un juego dinámico puede rep~esentars: .en

rmal pasemos seguidamente a demostrar cómo un Juego estatIcoformano, , ,d' . de decisiones simultáneas) puede representarse en forma exten-(es eClr, , ' . , '. ,

siva. Para ello, nos basamos len la observaoon hecha en la sec~IOn] .l.A¡'o'ncon el dilema de los presos) de que no es necesano que los(en conex , .

, 'dores actúen simultáneamente: es suficiente con que cada uno escoJa¡ugaestrateoia sin conocer la decisión del otro, como sería el caso en eluna o~ d .. Iddilema de los presos silos presos tomaran sus eC¡SlO~eSen cea: :epa-radas. Por tanto, podemos representar un juego de (d¡gamos) deosJOnessimultáneas entre los jugadores 1 y 2 como sigue:

3,1 3,1 1,2 1,2" /',---.../

2,1 0,0 2,1 ') 0,0D

1Jugador 1

118/ JUEGOS DINÁMICOS CON INFORMACfÓN COMPLETA (c. 2)

Jugador 2

(JI,!') (J';DI) (DI,!') (DI,DI)

,!strategial: Si el jugador 1 juega [,entonces jugar!'; si el jugado~lJuega D, entonces jugar !', 10que denotamos por (JI,!'). ,

,!strategia 2: Si el jugador 1 juega 1,entonces jugar 11; si el jugador 1, Juega D, entonces jugar DI, 1() que denotamos por (JI,DI).

o ,!strategiíl3: Si el jugador 1juega!, entonces jugar DI; si el jugador TJuega D, entoncesjugar !', lo que denotamos por (DI,!I). ,

''!strategía 4: Si elJugador 1 juegaI, Emtonce~jugar DI; si el jugador 1Juega D,entonces jugar DI; lo que denotamos por (DI,DI).

con información completa si permitiéramos que las estrategias de un ju-gador ~epran sin especificar sus acciones en algunas contingencias. Paraque el Jugador j calcule una mejor respuesta a la estrategia del jugador i,puede que j necesite considerar cómo,actuaría i en todas y cada una de las, 'contingencias, no sólo en las contingencias que i o j creen que es posible'~~~.

En el juego de la figura 2.4.1, el jugador 2 puede tomar dos acciones, ,'c:pero ppsee cuatro estrategias, puesto que hay dos contingencias diferentes'(concretamente, después de observar que el jugador 1 ~scoge Iy despuésde observar que el jugador 1 escoge D) en las que podría corresponderactuar al jugador 2. ,_. -.e., . '" ", ,

~l jugad~r 1, sin embargo, tiene dos acciones pero sólo dos estrategias:Jugar 1 yJugar D. La razó~ por la cual el jugador 1sólo tiene dos estrategias:s que solo hay una contingencia en la que pudiera torresponder jugar alJugador 1 (concretamente, la primera jugada, que corresponde al jugador1), de.forma que el espacio de estrategias del jugador1 es equivalente alespacIOde acciones Al == {1,D}. ,. .

.Dados estos espacios dl7estrategias de los dos jugadores, eSÍnil1ediatódenvar la representación ,en forma normal del juego a partir de surepre-",.,'

'. ~'

.., o.'.

"",.;

i-1

. i

1

1 D

':."'

3

Figura 2.4.4

Juegos dinámicos con información completa pero imperfecta / 121

1. El jugador 1 escoge una acción al del conjunto factible Al = {l,D}.,

2. El jugador 2 observa al y escoge a continuación una acción a2 delconjunto factible A2 = {J',D'}.

3. El jugador 3 observa si (alA!) = {D,DI} O no y escoge a continuación

una acción a3 del conjunto factible A3 = {I",D"}.

Ahora que hemos definido la noción de conjunto de información, po-demos ofrecer una definición alternativa de la distinción entre informaciónperfecta e imperfecta. Definimos previamente la información perfecta di-ciendo que en cada jugada, el jugador al que le corresponde jugar conocetoda la historia del juego hasta ese momento. Una definición equivalentees que cada conjunto de información contiene un único elemento: Porel contrario, la información imperfecta significa que existe al menos un'

La representación en forma extensiva de este juego (ignoramos las ganan-cias para simplificar) aparece en la figura 2:4.4. En esta forma extensiva;el jugador 3 tiene dos conjuntos de información: uno con un único ele-mento que sigue a D por parte del jugador 1 y DI por parte del jugador2 y otro con más de un elemento que incluye los demás nodos en los quele corresponde decidir al jugador 3.. Por tanto/todo lo que el jugador 3observa es si (al,a2) = {D,D'} o no ..

Como segundo ejemplo del uso de un conjunto de información pararepresentar la ignorancia de las jugadas anteriores, consideremos el si-guiente juego dinámico con información completa pero imperfecta:

11

5O

Preso 1

Figura 2.4.3

o5

44

mación, el jugador al que le corresponde decidir no sabe a qué nodo dentro delconjunto de infonnación se ha (o no se ha) llegado.

Laparte (ii) de esta definición significa que, en un conjunto de información,el jugador debe tener el mismo conjunto de acciones factibles en cada nodode decisión; en caso contrario el jugador seria capaz de inferir a partir delconjunto de acciones disponibles si ha llegado o no ha llegado a cierto(s)nodo(s).

120/ JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

En un juego el! forma extensiva, indicaremos que una colección denodos de decisióneonstituye un-conjunto de información con una líneadiscontinua, como en la representación en forma extensiva del dilema delos presos de la figura 2.4.3. Indicaremos a veces a qué jugador- le corres-ponde mover en los nodos del conjunto de información por medio de unaleyenda, como en la figura 2.4.3; alternativamente, podemos simplementedar nombre a la línea discontinua que une esos'nodos, como en la figura2.4.4. La interpretación del conjunto de información del preso 2 en la fi-gura 2.4.3 es que cuando al preso 21ecorresponde decidir, todo lo que sabees que se ha llegado al conjunto de información (es decir, que el preso 1ha decidido), pero no a qué nodo se ha llegado (es decir, lo que ha hecho).Veremos en el capítulo 4 que el preso 2 puede tener una opinión de lo queel preso 1 ha hecho, incluso sin haberlo observado, pero ignoraremos estacuestión hasta entonces.

122 / JUEGOS DINÁMICOS CON INFORMAcrÓN COMPLETA (c. 2)

--~1

Debido al comentario entre paréntesis de la parte (a), no contamos eljuego completo como un subjuego, pero esto es sólo una cuestión deestiló: eliirtinar ese comentario entre paréntesis de la definición no tendríaningúri efecto.

Podemos utilizar el juego de la figura 2.4.1 y el dilema de los presosde la figura 2.4.3 para ilustrar las partes (a) y (b) de esta definición. En lafigura 2:4.1 hay dos subjuegos, que empiezan en cada uno de los nodos dedecisión del jugador 2. En el dilema de los presos (o cualquier otro juegode decisión simultánea) no hay subjuegos. Para ilustrar la parte (c) de ladefinición', consideremos el juego de la figura 2.4.4. Sólo hay un subjuego,el que empieza en el nodo de decisión del jugador 3 que sigue a D porparte del jugador 1 y D' por parte del jugador 2. Debido a la parte (c), eneste juego ningún subjuego empieza en ninguno de los nodos de decisióndel jugador 2, aun cuando estos dos nodos son conjuntos de informaciónde un único elemento.. ."Vná trtanera de motivar la parte (c) consiste en áfumar que queremospoder ari~liiar ili1subju~gcipor sí mismo y que qti~rem6s que el a'náiisi'ssearei~vaiít~pai~el juego completo. En la figura 2.4.4, si intentáramosdefinir un:'subjuego que empezara en el nodo de decisión del jugador 2qué sigue a la decisión I del jugador 1, estaríamos creando un subjuego enel que el jugador 3 ignora la decisión del jugador 2 pero conoce la deeislóndel jugador.1. Tal subjuego no sería relevante para el juego completoporque en ~ste lÍltimó el jugador 3 no conoce la jugadade 1, sino que tansólo observa si (0.1,0.2) = {D,D/} o no. Recordemos el argumento parecidoporelqlleEÚ-fsimojuego de etapa de 1.111 juego repetido no es en sí mismoun stihjUegodeljuego repetido, suponiendo en el caso finito que t < T.

Otra m'anerade motivar la parte (c) es dándonos cuenta de que laparte (a) sólo garantiza que el jugador al que le corresponde jugar en elnodo n conoce la historia completa del juego hasta ese momento, no quelos demás jugadores también conozcan la historia. La parte (c) garantiza

Juegos dinlÍmicos COI1infonl1nóón completa pero imperfecto / 123

(a) empieza en un nodo de decisión n que sea un conjunto de información con 1111

único elemento (pero que no sea el primer nodo de decisión del juego),(b) incluye todos los nodos de decisión y terminales que siguen a n en el árbol

(pero no los nodos que no siguen a n) y(e) no intersecta a ningún conjunto de información (es decir, si 1m nodo de

decisión n' sigue a n en el árbol, todos los otros nodos en el conjunto deinformación que contiene a n' deben también seguir a -n y, por tanto, debenincluirse en el subjuego).

" .: '. -- ". - ~.

2.4.B Equilibrio de Nash perfecto e~ ~ubjueg~~"

cO~j~ntode informaci~n con má~de un elemento,19Por tanto, la represen-t~ClQnen forma extensiva de un Juego de decisiones simultáneas (como el~lle~a de l~s presos) es un juego con información imperfecta. De forma~lml1ar, l~: J~egos en dos etapas estudiados en la sección 2.2.A poseen.l~orm~clOn Imperfecta porque las decisiones. de los jugadores Iy 2 sonslmultaneas~ como también lo son las decisiones de los jug~dofes 3 y 4..?e forma mas general, un juego dinámico con información co'mpleta perolm~erfecta~~ede repr,esentarse en forma extensiva utilizandbconjuntosde mformaclOn con mas de un elemento para indicar lo que cada jugadorsabe (y no sabe) cuando le corresponde jugar, tal como hemos hecho en lafigura 2.4.4. ." .... ,_. ..", .... ", "

~'-..:.

En la secció~ 2.3.Bdi~ós la définición generalder'eqtiilibriOdé~~shper: ~.".fecto .en subJuegos. ~l~ embargo, aplicamos ladefinici6í:lsóloa jueg(Js' .repetido~ porque defimmos' los conceptos de estrategia' ysubjuego sólo' .para los Juego~repetidos. En la secCión2AA dimos la.definición gene"ral de ,estrategIa. Presentamos ahora la definieióngeneral de subjuego,despues de lo cual podremos aplicar la definición de equilibrio de Nashperfecto en subjuegos a los juegos dinahúcos con inforinación completaen general.

, Recordemos que en la sección 2.3.Bdefinimos inforinalmertte un sub-jue.go como la parte del ju~g,?que'q\teda'pórjugatecipeZáIldbeit cual- .qUl~rmomento en el que lá.~~storia éOrripletadeljuego has~a eritoncessea mfo~~.c!6n deldoiriinióp~b~C~ entretbdosiosjugádor~tydiinósun~ defimclOn formal en el caso de los juegos répetidos,que"eht6nces~stabam~s, co~sideran.do',Ofrecemos ahora una. definicióh fdrmál' paraJuegos dmarrucos con mformación completa en genera], en téI111iri6sdé larepresentación e.nforma extensiva del juego.

Definición. Un subjuego en un juego énforina extensiva-~.--:':

19 . '. ":.~:;C >0 ••••••••

, Est~ ~aracterización de la informaaón perfecta e imperfecta en términos de 20njuntos deinformaaon con ~o o más elementos está restringida a los juegos cón info~ació" complet;~~~te, com~.veremos en el c~pítulo,4, la ,repre~:,n;a,~ón.."n fonTlae.x.\é~~~~<'l'd{~ ju~i¿.

formaclOn perfecta pero Incompleta tiene un conjunto de informaciÓn cóf(inái; dé' uti .elemento. En este capítulo, sin embargo, restringimos nuestra atención a la infbrmacióhcompleta. . ,

'<.;'

".....

"1',.,

.'~.'. '

i"

.C;.,

(donde un subjuego es un subjuego menor si na contiene más subjuegos). Sustituyamosentonces cada t¡no de estos ~up¡I.l~¡;'?~,!??rl~~g~~S~!ls.de. uno d~7~ equilibrios de Nash.Pensemos ahora en los nodos iniciales de estos ~?:bJ1:'ego~como los nodos temunales enuna versión truncada del juego Oligfua'I."Tctentiffquerriostodos los subjuegos menores deeste juego truncado que contengan estas nadas' ~e~es Y: sustituyamos cada uno de estossubjuegos con las ganancias de.uno _~~~us equilib~os de Nash. ProcedIendo de esta formahacia atrás a lo largo del árbol, s<;9~tje,'!t¡ur ~qUlli~~o~e Nash perfecto en sub¡uegos,porquelas estrategias de los jugadores con~tit;uY~)l,uneqllilibno de Nash (de hecho, un eqUlhbno deNash perfecto en subjuegosl en cada subjuego.- .

JlIegos dinámicos con información completa pero imperfecta / 125

Hemos encontrado ya dos ideas íntimamente ligadas al equilibrio deNash perfecto en subjuegos: el resultado por inducción hacia atrás defi-nido en la sección 2.1.A y el resultado perfecto en subjuegos definido enla sección 2.2.A. En términos informales, la diferencia es que un equili-brio es una colección de estrategias (y una estrategia es un plan completode acción), mientras que un resultado describe lo que pasará sólo en lascontingencias que se espera que se den, no en cada posible contingencia.Para ser más precisos sobre esta diferencia entre equilibrio y resultado,y para ilustrar.la noción de equilibrio de Nash perfecto en subjuegos,!econs~deramos ahora los.juegos definidos en las secciones2.1.A y 2.2~A.

Definición. En el juego en dos etapas con información completa y perfectadefinido en la sección 2.1.A, el resultado por inducción hacia atrás es (aj',R2(aj'»pero el equilibrio de Naslz perfecto en subjuegos es (aj',R2(al».

En este juego, la acción aj' es una estrategia del jugador 1 porque sólo-hay una contingencia en la que le puede corresponder actuar, el principiodel juego. Sin embargo, del jugador 2,R2 (aj') es una acción (concretamentela mejor respuesta de 2 a aj') pero no una estrategia; porque unaestrate~gia para el jugador 2 debe especificar la acción que 2 tomará después' decualquier posible decisión de 1 en la primera ronda. La función de mejorrespuesta R2(al), por otro lado, es una estrategia del jugador 2. En estejuego, los subjuegos empiezan (y terminan) con el moVimiento del juga-dor 2 en la segunda etapa. Hay un subjuego para cada acciónfactible,'alen Al, del jugador L Para demostrar que (aj',R2(al» esUILequilibrio deNash perfecto en subjuegos, debemos por tantodemostraI,que (aj' ;R2(at»"

es un equilibrio de Nash y que las estrategias de losjugadoresconstitu~yen un equilibrio de Nash en cada uno de estos subjuegos ... Como lossubjuegos no son más que problemas de decisión unipersonales, se tratade exigir que la decisión del jugador 2 sea óptima en cada subjuego, quees exactamente el problema que la función de mejor respuesta, R2(al),

12~ / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

Definición. (Selten 1965):Un equilibrio de Nash es perfecto en subjuegos si lasestrategias de los jugadores constituyen un equilibrio de Nash en cada subjuego.

Es inmediato demostrar que cualquier juego dinárrlicü:finito con.infor-mación completa (es decir, cualquier juego dinámico en él q~~ iffi ~&nerofinito de jugadores tiene un conjunto de estrategias fac~:I:>.!eSftriit~ri:jénéun equilibrio de Nash perfecto en subjuegos"posiblemenh~ co~ e'stnltegiasmixtas. El argumento procede por: construcción, utilizando un procedi-miento parecido a la inducción hacia atrás, y está basad~. en dos o~stTrva-ciones. Primero, aunque presentamos el teorema de Nash en el contextode juegos estáticos con información completa, éste se extiend~ a'todojuego finito en forma normal con informaciÓn complef~, y hemos vistoque estos juegos pueden ser estáticos o dinámicos. En segundo lugar, unjuego dinámico finito con información completa tiene llÍl nÓínerq)lnitode subjuegos, cada uno de los cuales cumple las hipótesisdelte~r~riía déNash.20 . -. - '.

20 Para construir un equilibrio de Nash perfecto en ~ubjuego's,identifiquemos primerot"dos los subjuegos menores que contienen nodos terminales en el árbol del. juego original

que la historia completa del juego hasta ese momento sea información deldominio público en el siguiente sentido: en cualquier nodo que sigue a/1, digamos ni, el jugador al que le corresponde decidir,en ni sabe que eljuego llegó al nadan. Por tanto, incluso si ni pertenece a un conjunto deinformación con más de un elemento, todos los nodos en ese conjunto deinformación siguen a n, de forma que el jugador al que le correspondedecidir en ese conjunto de información sabe que el juego ha llegado a unnodo que sigue a n. (Si las dos últimas afirmaciones parecen difíciles es enparte porque la representación en forma extensiva de un juego especificalo que el jugadori sabe en cada uno de sus nodos de, decisión, pero nohace explícito lo que el jugador i sabe en los nodoséfe decisión de j,)Como se ha descrito anteriormente, la figura 2.4.4 ofrece un ejemplo decómo podría no cumplirse la parte (c). Podemos ahora reinterpretar esteejemplo: si caracterizásemos (informalmente)1o que el jugador 3 sabeen el nodo de decisión del jugador 2 que sigue a la decisión 1 por partedel jugador 1, diríamos que 3 no conoce la:historia del juego .hast~ esemomento, ya que 3 tiene otros nodos de decisión en lasque 3no sabe siljugó 1 o D. ~;.

Dada la definición general de subjuego, podemos;ahora aplicar ladefinición de equilibrio de Nash perfecto en subjuegosde la sección 2,3.B.

:~.------------------------------------------------------------------------------------

JlIegos di17ál17icos C017 i17forl17aeió17 completa pero imf,,:rfeela /127

oO

21

Figura 2.4.5

12

31

Recordemos que la representación en forma normal de este juego sedio en la figura 2.4.2. Si hubiéramos encontrado este juego en formanormal en la sección 1.1.C, habríamos hallado sus equilibrios de Nash(con estrategias puras). Éstos son (D/D',!'» e (!,(D',D')). Podemosahora comparar estos equilibrios de Nash en el juego en forma norIllal dela figura 2.4.2 con los resultados del procedimiento por inducción haciaatrás en el juego en forma extensiva de la figura 2.4.5: el equilibrio de Nash(D,(D',J')) en la representación en forma normal corresponde a todas lastrayectorias en negrita de la figura 2.4.5. En la sección 2.1.A llamamosa (D,J') el resultado por inducción hacia atrás del juego. Sería naturalllamar a (D,(D',1') el equilibrio de Nash por inducción hacia atrás deljuego, pero utilizaremos una terminología más general y lo lJamaretnos elequilibrio de Nash perfecto en subjuegos. La diferencia entre e1resultadoy el equilibrio es que el resultado sólo especifica la trayectoria en negritaque empieza en el primer nodo de decisión del juego y acaba en un nodo

y D (que conduce a una ganancia de 2 por parte del jugador] despuésde que 2 juege 1'). Por tanto, la mejor respuesta de. 1 al comportamientoprevisto del jugador 2 es jugar D en la primera etapa, de forma que elresultado por inducción hacia atrás del juego es (D,1'), como se indica conla trayectoria en negrita que empieza en el nodo de decisión del jugador1 en la figura 2.4.5. Hay una trayectoria en negrita adicional que emanadel nodo de decisión del jugador 2 que sigue a la de~isión 1 del jugildor 1.Esta trayectoria parcial a lo largo del árbol indica que el jugador '2 habríaescogido D' sise hubiera llegado a ese nocla de decisión.

En este juego, el par de acciones (a3(ai,a2),o,4:(a1,0.2» es el equili-brio de Nash del subjuego que juegan por separado los jugadores 3 y4 (concretamente, el juego que queda después de que los jugadores 1 y~.escogen (ai,ai)), mientras que (aj(aJ,a2},a4:(al,0.i)) es una estrategia deljugador 3 y una estrategia para el jugador 4, es decir unos planes de.acción2ompletos que describen una respuesta a cada par de movimientos fac-Fblesde los jugadores 1 y 2. En este juego, los subjuegos consisten enla interacción en la segunda etapa entre los jugadores 3 y 4, dadas lasacciones tomadas por los jugadores 1 y 2 en la primera ronda. Tal y comoexige.el equilibrio de Nash perfectO'en subjuegos, el par de estrategias(a;(al,aú,a'¡(al,aú) especifica un equilibrio de Nash,en cada uno de estosubjuegos.'Coriduim~sesta sección (y esté:~apítulo) con un ejemplo que ilustra

el tema~principal del capítulo: la perfección en los subjuegos eliminalos equilibrios de Nashque.sé basan en'promesas o amenazas que noson creíbles. Recordemos el juego en forma extensiva de lá figura 2.4.1.Si hubiéramos encontrado este juego en la sección 2.1.A, lo habríamosresuelto poririducción hacia atrás del siguíente;nodo: si el jugador 2alcanza el riada de decisión que sigue a la decisión 1 del jugador 1, lamejor respuesta de 2 es jugar D' (lo que proporciona una ganancia de 2)en vez de jugar l' (que proporciona tina ganancia de 1). Si 2alcanza el nodode decisió.nque sigue alá decisí~nD..del jugador 1, la mejor respuesta de 2es jugar l' (lo qué proporciotui\ciéi gahancia de l)'en vez de jugar Di (queproporciona una ganancia de O). Dado que el jugador 1 puede resolverel problema del jugador 2 tanto como el propio jugador 2, el problemade 1 ,~I11aprírn~ra nmdas~ c~~Cre.taen eséoger entré r (que conduce auna gananCia. de 1 por parte del jugador 1 después de que 2 juege D')

126 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

Definición. En el juego en dos etapas con infonnación'completa pero imperfectadefinido en la sección 2.2.A, el resultado perfecto en subjuegos es {o.i ,o.i,0.3 (0.1' o.i),

0.4:(a1,ai)), pero el equilibrio de Nnshperfeeto en subjuegos es (o.i,0.2;0.; (al ,0.2),

'a4:(aT~0.2)).

soluciona. Finalmente, (ai,R:z(al)) es un equilibrio de Nash porque lasestrategias de los jugadores son mejor respuesta la una a la otra: o.i es unamejor respuesta a R2(al), es decir, o.i maximiza 1J,1 (0.1,R2(0.1)), y R2(0.1) es,',una mejor respuesta a ai, es d~dr,R2(ap maximiza ¡do.i ,0.2)'

Los argumentos son análogos' para los juegos considerados en lasección 2.2.A, de forma que nos ahorramos los detalles.,/,'

"'-:,'

128 / JUEGOS DIN.Á.MICOS CON INFORMACIÓN COMPLETA (e. 2)

terminal, mientras que el equilibrio también especifica la trayectoria ennegrita adicional que emana del nodo de decisión del jugador 2 que sigue ala decisión 1del jugador 1. Es decir, el equilibrio especifica una estrategiacompleta del jugador 2.

Pero, ¿qué pasa con el otro equilibrio de Nash, (/(D',D'»? En esteequilibrio, la estrategia del jugador 2 es jugar D' no sólo si el jugador 1escoge I (como también ocurría en el primer equilibrio) sino también si eljugador 1 escoge D. Dado que D' (si sigue a D) conduce a una gananciade Odel Jugador 1, la mejor respuesta de 1 a esta estrategia por parte delJugador 2 es jugar I,consiguiendo con ello una ganancia de 1(después deque el jugador 2 escoja D'), que es mejor que O. Utilizando un lenguajevago pero sugerente, podría decirse que el jugador 2 está amenazandocon jugar D' si el jugilPor 1 juega D. (Estrictamente hablando, 2 no tienela ~~ortu~idad de llevar a cabo esta amenaza antes de que 1 escoja unaacclOn. SI la tuviera, estaría incluida en la forma extensiva.) Si esta ame-naza funciona (es decir, si 1 escoge jugar I), 2 no tiene la oportunidad dellevar a cabo su amenaza. Sin embargo, la amenaza no debería funcionarya que no es creíble: si al jugador 2 se le diera la oportunidad de llevarl~a cabo (es decir, si el jugador 1 jugara D), 2 decidiría jugar I' antes que D'.De un modo más formal, el equilibrio de Nash U,(D',D'» no es perfectoen su.bjuegos, porque las estrategias de los jugadores no constituyen uneqUlhbno de Nash en uno de los subjuegos. En particular, la elección deD' por parte del jugador 2 no es óptima en el subjuego'que empieza (yacaba) en el nodo de decisión del jugador 2 que sigue a la decisión D deljugador 1.

En un juego con información completa y perfecta, la inducción haciaatr~s elimina las amenazas que no son creíbles. I?ado que cada conjuntode mformación contiene un único elemento, cada nodo de decisión delárbol representa una contingencia posible en la que podría corresponderleactuar a un jugador. El proceso de moverse hacia atrás a lo largo de laforma extensiva, nodo a nodo, se concreta por tanto en forzar a cadajugador a considerar llevar a cabo todas y cada una de las amenazas queel Jugador pudiera hacer. En un juego con información imperfecta, sinembargo, las cosas no son tan sencillas, ya que tales juegos co'ntienenalmen~s ~n conjunto de información con más de un elem'ento. Aquí sepodna mtentar el mismo enfoque: proceder hacia atrás a lo largo de laforma extensiva y alcanzar eventualmente un nodo de decisión contenidoen un conjunto de información con más de un elemento. Pero forzar aljugador a considerar lo que haría si se llegase a ese nodo de decisión no

Lecturas adicionales / 129

es equivalente a forzar al jugador a considerar una posible con~ngenciaen la que le correspondería jugar, ya que si en el transcurso del Juego sellega a ese conjunto de información, el jugador no sabe si se ha ~~~ado ~ese nodo de decisión o no, precisamente porque el nodo de deClslOnestacontenido eh un conjunto de información con más de un elemento.

Una forma de tratar él problema de los conjuntos de información co~más de un elemento cuando se utiliza inducción hacia atrás, es proce'-der hacia atrás a lo largo de la forma extensiva hasta que se encuentreun conjunto de información con más de un elemento, pero saltándoseloy siguiendo haóh arriba"en el árbblha~ta ~~~~nt;:ar~S~~!~t6'~e,,~r;:,.formación con unúniw elemento. Uegados ahíhabra que consIdera::'.no sólo lo que el jugador al que le corresponde jugar en é~ecónjUrit'ó"de información con unúnicQ elemento haría'si sealCanzase:ésé itodó"dedecisión, sino también la acción que tomaría el í~ga:dár al que le'córres~ponde jugar en cada ~o de los conjuntos de informacióIl.c'o~.'~~~~e.~elemento que se han saltadO."En térininospoco foIirlálés, este procedi~miento proporciona un ~qiiilibrio de NashI'erféctd'en~subjuego~::}:J-:iíásegunda manera de tratar el problema 'es proceder' haCi~atrás:<¡Íiló"Ya:rIfóde la forma extensiva hasta 'encontrar un conjÜrito'dé-infomúiéioIi:'conmás de un elemento; Forzar entcmces al jugador'alqüe're"corrésp6fiCI~jugar en ese conjunto' de illforma'cióna considerarlo qiieha'riiaellegarsi~a ese conjunto de inforinádón:(Hacer esto requiere que eljugadot.tengá:una valoración probabilisticá'con reSpecto a:que'nodoseha;lle'g~d~e~:elconjunto de información.,Tal~ valoración dependerá Il.a~~eri~é~é,rá~posibles decisiones de lo~ jugadores 'queestán pór~Círiia'~J:l!.:ékªf:tt~Y.,';g~'~forma que una pasada de abajo arriba a.la lárgo deláTbol1ÍtiliZáhá:(l~st~:é.; "método no puede proporcionar una solución-),~n.t~os'inf()iin~~Ieste procedimiento proporciona un equilibrio bayesiano perfedo.{véáse

capítulo 4).

2.5 Lecturas adicionales

Sección 2.1: Sobre los salarios y el empleo en empresas con fuerte ~pl~~:tación sindical, véase ~ m~d~k, de negociación repetida en.Espinosa yRhee (1989; ejercicio 2,lO}yun'modelo de tina única negociación en el quelas empresas pueden escoger negociar sobre salarios y empleo o sólo sobresalarios, en Staiger (199¡), Sobre la negociación sucesiva, véase un modeloal estilo de Rubinstein de negóciación entre una empresa y un sindicato en

::.:',,,

','.'

(: '

.;:'

,•....

,,'" -,

.•..-•.,

",.',.-.

130 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

Fernández y Glazer (1991),con la característica nueva de que el sindicatodebe decidir si convocar o no una huelga después de que el sindicato ola empresa rechacen una oferta. Existen múltiples equilibrios perfectosen subjuegos efi~ientes que incorporan, ~ su vez, equilibrios perfectos ensubjuegos ineficientes (es decir, que incluyen huelgas), aun cuañdohaya "información completa. El libro de Osborney Rubinstein (1990) examina'muchos modelos de negociación en teoría de juegos, los relaciona con elenfoque axiomático de Nash sobre la negociaci6n y utiliza los modelos denegociación como base de la teoría del mercad~. ',~

Sección 2.2: Sobr~ los pánicos. bancarios, véa~e JaCkJiny ,Bhattacharyá(1988). El libro de, McJ\.1illan(1986)e.xámina lé;ls.prjmeré;lsapliciK~Qries-'-dé teoría de juegos a la economíainternaciolv~i;:véaseuntrabajo'thásrec~ente sobre la deuda exterior en Bu19W..y Rogóff(1989) .. Sobre lostorneos, consúltese un modelo en el qué lbs trabajadores pueden tantoaumentar su producción como sabotear la de los demás, en Lazéar (1989;ejerc~cio2.8). Véaseen Rosen (1986) el tem.ade los premios necesariosparaIT)antener los incentivos en Una,sucesi8n de torneos en los' que losperdedores en una etapa no pasan a la siguiente. .

Sección 2.3: Benoit y Krishna (1985)analizan juegos repetidos finitos,Sobre larenegociación en los juegos repetidos finitos, consúltese Benoity Krishna (1989),y en los juegos repetidos infinitos véase el artículo pa-norámico de Farrell y Maskin (1989). :Tirole(1988, capítulo 6) examinamodelos dinámicos de oligopolio. El libro de Akerlof y Yellen (1986) re-coge algunos de los tra~ajos más importantes sobre salarios de eficienciay ófrece una introducción integradora. Sobre política monetaria, véaseen Ball (1990) un resumen de los hechos estilizados, una revisión de losmodelos existentes y un modelo que explica la trayectoria temporal de lainflación.

Sección 2.4: Véase un tratamiento formal de los juegos en forma exten-siva en Kreps y Wilson (1982), y un enfoque más verbal en Kreps (1990,capítulo 11).

2.6 Ejercicios

2.1 S.upongamos que un padre y un hijo participan en el siguiente juego,anahzado originalmente por Becker (1974). Primero el hijo toma unaacción, A, que.resulta en un ingreso para él, IR (A), yen un ingreso parael padre;Jp(A). (Pensemos en I H(A) corno el ingreso dél hijo, neto decualquier coste de, la acciÓnA.) En segundo lugar, el padre óbservá los

Ejercicios / 131

ingresOs [A e Ip y escoge una herencia,B, que dejar al hijo. La gananciéldel hijo es UUR + B); la del padre es VUp - 13)+ /,;UUR + B), donde /,;> Orefleja la preocupación del padre por el bienestar del hijo. Supongamosque la acción es un número no negativo, A ::::0, que las funciones deingreso I H(A) e Ip(A) son estrictamente cóncavas Y tienen un Imíximoen AH > ° Y Ap > ° respectivamente, que la herencia B puede serpositiva o negativa y que las funciones de utilidad U y V son crecientesy estrictamente cóncavas. Demuéstrese el teorema del "nif1omimado":en el resultado por inducción hacia atrás, el hijo escoge la acción LJuemaximiza elingreso agregado de la familia fH(A) + Ip(A), a pesilr de quesólo la función de ganancias del padre es de alguna forma altruista,

2.2 Supongamos ahora que padre e hijo juegan un juego diferente, ana-lizado originalmente por Buchanan (1975). Los ingresos IH e Ip estánfijados exógenamente. Primero, el hijo decide qué parte del ingreso If{

ahorrará (S) para el futuro, consumiendo el resto UR - S) hoy. En se-gundo lugar, el padre observa la elección de S por parte del hijo y es-coge una herencia, B. La ganancia del hijo es la suma de las utilidadespresente y futura: Ul UR - S) + U2(S + B). La ganancia del padre esV(Ip - B) + k[U1 (IR - S) + U2(S + B)]. Supongamos que las funciones deutilidad Ul, U2, y V son crecientes yestrictamente cóncavas. Demuéstreseque hay un "dilema del samaritano": en el resultado por inducción haciaatrás, el hijo ahorra demasiado poco, para inducir al padre a dejarle unaherencia mayor (es decir, tanto las ganancias del padre corno las del hijopodrían aumentar si S fuera convenientemente más alto y B convenien-temente más bajo).

2.3 Supongamos que los jugadores en el juego de la negociación con ho-rizonte infinito de Rubinsteintienen factores de descuento diferentes: 81corresponde al jugador 1 y {j2 al jugador 2. Adóptese el argumento dadoen el texto para demostrar que en el resultado por inducción hacia atrás,el jugador 1 ofrece el acuerdo

al jugador 2, quien lo acepta.

2.4 A dos socios les gustaría completar un proyecto. Cada socio recibe laganancia V una vez el proyecto ha sido completado, pero ninguno de ellos

¡ti:! I•

Ejercicios I 133

2.6 Tres oligopolistas operan en un mercado con una demanda inversadada por P(Q) = a - Q, donde Q = ql + q2 + q3 Yqj es la cantidad producida:.por la empresa j. Cada empresa tiene un coste margipal de producciónconstante, e, sin costes fijos. Las empresas escogen sus cantidades de lasiguiente manera: (1) la empresa 1 escoge ql ~. O; (2)las empresas 2y3observanql y escogen entonces simultáneamente q2 y q3 respectivamente.¿Cuál es el resultado perfecto en subjuegos?

!.:::' .0'- .~.

2.7 Supo~gamos que un sindicato representa en su totalidad a la fuerzade trabajo de todas las empresas de un oligopolio, comO el. Sindicato.Unido de Trabajadores del Automóvil en el caso de la General Motors,Ford, Chrysler y otras. Sea la sucesión temporal de las jugadas análog~ almodelo de la sección 2.1.C: (1) el sindicato realiza una demanda salanal,"", en todas las empresas; (2) las empresas observan (y aceptan) 'W y las

otro difícil (D), y que la preparación es útil en los dos empleos, pero más.en el difícil: YDO < YEO < YES < YDS, donde Yij es lo que el trabajadorproduce en el trabajo 'i (= E o D) cuando el trabajador tiene un nivel depreparación de j (~ O o S). Supongamos que la empresa puede compro-meterse a pagar salarios diferentes en los dos empleos, 'WE y 'WD; peroningl,J.n9de estos dos salarios puede ser menor que el salario alternativodel trabajador, que normalizamos a cero.

El desarrollo temporal del juego es el siguiente: En el momento O laempresa escoge 'WE y 'WD Yel trabajador observa estos salarios. En el ~~-mento 1 el trabajador entra a formar parte de la empresa y puede adqumrel nivel de preparación S a un coste C. (Ignoramos laproducción'y lossalarios en el primer periodo. Puesto que el trabajador no ha adqUiridoaún la preparación, lo eficiente es que se le asigne el trabajo E.) Suponga-mos que YDS - YEO > e, de forma que al trabajador leconyiene adquirirla preparación. En el momento 2 la empresa observa si el trabajador haadquirido o no la preparación y decide entonces si concederle el ascensoal trabajo D o no durante el segundo (y último) periodo de empleo qeltrabajador.. "".':-

Los beneficios de la eID:presaen el segundo periodo son Yij- 'W;,donde el trabajador realiza el trabajo 'i y tiene un nivel de preparación j.La ganancia del trabajador por realizar eltrabajo i en el segundo periodoes 'Wi o 'Wi - e, dep.endiendo de si el trabajador se ha preparado o no en elprimer periodo. Hállese el resultado por inducción hacia atrás, Véase unmodelo más complejo en Prendergast (1992).

132/ JUEGOSDINÁMICOS CON I~JFOR¡\'IACIÓNCOMPLETA (c. 2)

recibe ganancia alguna antes de que el proyecto se haya podido terminar.El coste que queda hasta que el proyecto se complete es R. Ninguno delos socios puede comprometerse a hacer aportaciones futuras de cara acompletar el proyecto, de forma que deciden establecer el siguiente juegode dos periodos: En el periodo 1 el socio 1 escoge contribuir con el de caraa completar el proyecto. Si esta contribución es suficiente para completarel proyecto, el juego se acaba y cada socio recibe V. Si esta contribución noes suficiente para completar el proyecto (es decir, Cl < R), en el periodo2 el socio 2 escoge contribuir con C2con el fin de completar el proyecto.Si la suma (sin descontar) de las dos contribuciones es suficiente paracompletar el proyecto, el juego acaba y cada socio recibe V. Si la sumaes insuficiente para completar el juego, éste termina y ningún socio recibenada.

Cada socio debe obtener el dinero con el que contribuye a financiarel proyecto de otras actividades lucrativas. La forma óptima de hacerloes sacar primero dinero de las alternativas menos rentables. El coste (deoportunidad) que resulta de una contribución es, por tanto, convexo conrespecto al tamaño de la contribución. Supongamos que el coste de unacontribución ees e2para cada socio. Supongamos que el socio 1 descuentalos beneficios del segundo periodo de acuerdo con el factor de descuento5. Calcúlese el único resultado por inducción hacia atrás de este juegode contribuciones de dos periodos para cada trío de parámetros (V,R,5);véase el caso con horizonte infinito en Admati y Perry (1991).

2.5 Supongamos que una empresa quiere que un trabajador adquierala preparación necesaria para desarrollar una determinada tarea, perodicha tarea eS tan inconcreta que ningún tribunal podría verificar si eltrabajador ha adquirido o no la preparación necesaria. (Por ejemplo,la empresa podría pedir al trabajador que se familiarizase con "nuestraforma de h¡lCerlas cosas", o se hiciera un experto en "este nuevo mercadoen el que podríamos entrar".) La empresa,. por tanto, no puede firmarun contrato para reembolsar al trabajador el coste de esta preparación:incluso si el trabajador adquiere esta preparación, la empresa puede decirque el trabajador no lo ha hecho, y ningún tribunal podría decidir quiéntiene razón. Del mismo modo, el trabajador no puede firmar un contratopara adquirir esta preparación si se le ha pagado por adelantado.

La empresa podría utilizar, como incentivo para que el trabajadoradquiera la preparación, promesas (creíbles) de ascenso de la siguienteforma. Supongamos que hay dos trabajos en la empresa, uno fácil (E) y

3,1 0,0 5,0

2,1 1,2 3,1

1,2 0,1 4,4

2,2 x,O -1,0 0,0

O,x 4,4 -1,0 0,0

0,0 0,0 0,2 0,0

0, -1 0, -1 -1, -1 2,0

Eje,.cici()~ / 135

resultado perfecto en subjuegos. Demuéstrese que los salarios, nivel deempleo y beneficios (y, por tanto, también la utilidad del sindicalo y elexcedente del consumidor) aumentan cuando los aranceles desapilrecen.Véase otros ejemplos en la misma línea, en Huizinga (1989).

1 e D

2.11 El juego de decisión simultánea que a continuación se describe sejuega dos veces, habiéndose observado el resultado de la primera etapaantes de que empiece la segunda. No hay descuento. ¿Puede alcanzarseen la primera etapa la ganancia (4,4) en un equilibrio de Nash perfecto ensubjuegos con estrategias puras? En caso afirmativo, especifíquense lasestrategias que lo pem1Íten. En caso negativo, demuéstrese por qué no.

A

lvI

B

2.10 El juego de decisión simultánea que a continuación se describe sejuega dos veces, habiéndose observado el resultado de la primera etapaantes de que empiece la segunda. No hay descuento. La variable T

es mayor que 4, de forma que (4, 4) no es una ganancia de equilibriodel juego jugado una sola vez. ¿Para qué valores de x es la siguienteestrategia (jugada por ambos jugadores) un equilibrio de Nash perfectoensubjuegos?

Jugar Qí en la primera etapa. Si el resultado de la primera etapa es(Ql,Q2), jugar Pí en la segunda etapa. Si el resultado de la primeraetapa es (y,Q2) donde y =1 Q], jugar R~ en la segunda etapa. Si elresultado de la primera etapa es (Q],z) donde z =1 Q2, jugar Si enla segunda etapa. Si el resultado de la primera etapa es (y,z)dondey =1 Q] y z =1 Q2, jugar Pi en la segunda etapa.

2.9Consideremos dos países. En la fec;l1a1, ambos países tienen aranceles.tan altos que no hay comercio entre ellos. Dentro de cada país, los salariosy el nivel de empleo se determinan como en el modelo de monopolio ysindicato de la sección 2.l.C. En la fecha 2, todos los aranceles desaparecen,ahora cada sindicato fija el salario en su país, pero cada empresa producepara los dos mercados.

Supongamos que en cada país la demanda inversa es P(Q) = Q, - Q,donde Q es la cantidad agregada en el mercado de ese país. Sea q = L lafunción de producción de cada empresa, de forma que los sálariosson elúnico coste dela empresa, y sea U(w,L) = (w -wo)L la funci6n de utilidaddel sindicato, donde 71Jo es un salario alternativo para los trabajadores.Calcúlese el resultado por inducción hacia atrás en la fecha l.

Considérese ahora el siguiente juego en la fecha 2. Primero, los dossindicatos escogen simultáneamente los salarios, 1J)] y 1J)2. Las empresasobservan los salarios y escogen los niveles de producción para los mer-cados interior y exterior, que denotamos mediante hí y eí en el caso dela empresa del país i. Toda la producción de la empresa se realiza ensu propio país, de fo.rma que el coste total es Vií(hí + eí). Calcúlese el

2.8 Modifiquemos el modelo de torneos dé la sección 2.2.D de forma.que la producción del trabajadori sea Yí == eí -'- (1/2)8j +Eí, donde Sj 2':°representa el sabotaje por parte del jugador j, y la desutilidad del esfuerzo(productivo y destructivo) del jugador i es g(eí) + g(8í), como en Lazear(1989).Demúéstrese que elpremio óptimo WA -W13 es menor que cuandono hay posibilidad de sabotaje (como en el texto).

134 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

ganancias del sindicato escogen simultáneamente los niveles de empleo,.Li de la empresa i; (3) las ganancias del sindicato son CIJJ - 71Ja)L, donde 1IJa

es el salario que los miembros del sindicato podrían ganar en un empleoalternativo, L = L] + ... + Ln es el nivel total de empleo en las empresas,y los beneficios de la empresa i son i(w,Lí). A continuación se describen. losdeterminantes de los beneficios de dicha empresa: todas las empresas..tienen la siguiente función de producción: el nivel de producción es igualal nivel de empleo; qí = Lí. El precio de equilibrio es P(Q) = Q, - Qcuando la cantidad agregada en el mercado es Q = q] + ... '+ qn. Para nocomplicar las cosas, supongamos que las empresas no tienen más costesque los salariales. ¿Cuál es el resultado petfeéto en subjuegos de estejuego? ¿Cómo (y por qué) afecta el mimero de empresas a la utilidad delsindicato en el resultado perfectb ..en subjuegos?

.".,;.,'

136 I JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA Ce. 2)

2.12 ¿Qué es una estrategia en un juego repetido? ¿Qué es un subjuego enun juego repetido? ¿Qu¿ es un equilibrio de Nash perfecto en subjuegos?

2.13 Recuérdese el modelo de duopolio de Bertrand estático (con pro-duetos homogéneos) del ejercicio 1.7: las empresas fijan los precios si-multáneamente; la demanda del producto de la empresa i es a - Pi siPi < Pj, es Osi Pi > Pj y es (a - p¡)/2 si Pi = Pj; los costes marginales sone < a:-Considérese el juego repetido infinitamente basado en este juegode etapa. Demuéstrese que las empresas pueden utilizar estrategias deldisparador (que significan jugar para siempre el equilibrio de Nash deljuego de etapa después de cualquier desviación) para mantener--~lnivelde precios de monopolio de un equilibrio de Nashperfecto en subjuegos'si ys~lo si O ~ 1/2.' _

2.14 Supongamos que léldemanda fluctúa de formélaleatoria en el juegode Bertrand repetido infinitamente, descrito en el ejercicio 2.13: en cada.periodo, el punto de interacción de la fu~ciónde dema;nda con el eje deabcisas es aA. con probabilidad 'Ir.y aB « aA) co~ probabilidad 1 -::'Ir; lasdemandas en los diferentes perlados son indep~nciientes. Supongamosque en cada periodo el nivel de demanda es revelado a ambas empresasantes de que éstas escojan los precios de ese periodo. ¿Cuáles son losniveles de precios de monopolio (P.4 y PB) para los dos niveles de de-manda? Calcúlese 0*, el fi1enor valorde 8 tal que las empresas puedenutilizar estrategias del disparador para mantener estos niveles de preciosde monopolio (es decir, jugar Pi cuando la demanda es aú para i = A,E)

en un equilibrio de Nash perfecto en subjuegos .. Para cada valor de Oentre 1í2 y 0* hállese el precio máximo p(o) tal que las empresas puedanutilizar estrategias del disparador para mantener el precio p(o) cuando lademanda es alta y el precio P B cuando la demanda es baja en lln equilibriode Nash perfecto en subjuegos. (Véase Rotemburg y Saloner 1986.)

2.15 Supongamos que hay 11 empresas en un oligopolio de Cournot. Lademanda inversa viene dada por P(Q) = a - Q, donde Q = q} + ... + q,..

Consideremos el juego repetido infinitamente basado en este juego deetapa. ¿Cuál es el valor menor de -O tal que las empresas pueden utilizarestrategias del disparador para mantener el nivel de producción de mo-nopolio en un equilibrio de Nash perfecto en subjuegos? ¿Cómo varía larespuesta al cambiar -n? ¿Por qué? Si (j es demasiado pequeño para quelas empresas utilicen estrategias del disparador para mantener el nivel de

Ejercicios I 137

producción de monopolio, ¿cuál es el equilibrio de Nash perfecto en sub-juegos simétrico más rentable al que puede llegarse utilizando estrategiasdel disparador?

2.16 En el modelo de salarios y nivel de empleo analizado en la sección2.1.C, el resultado por inducción hacia atrás no es socialmente eficiente.En la práctica, sin embargo, una empresa y un sindicato negocian hoy lostérminos de un contrato por tres años, renegocian al cabo de tres añoslos términos de un segundo contrato y así sucesivamente. Por tanto, esta. relación se puede caracterizar con más o menos exactitud como un juegorepetido, como en Espinosa y Rhee (989)..,-'-"

En este problem~ se denvan condiciones bajo las cuales un eqUilibriode Nash perfecto en subjUegosdél juego repetido infinitamente es superior:en el,sentido de Paretoal resultado por inducción hacia atrás del juegojugado una sola vez. Denotemos por U* y 'Ir * , respectivamente, la utilidaddel sindicato y los beneficios de la empresa en el resultado por inducciónhacia atrás del juego jugado una sola vez. Consideremos un par utilidad"-, ,beneficio alternativo (U,'Ir) asociado con un par salariá-empleo alteíriatlvó :(w,L). Supongamos que ambas partes tienen elmisinofador de descu~ií.to:O (para cada periodo de tres años). Derívense condiciones sobre (w,L)

tales que: O) (U,'Ir) domine en el sentido de Pareto a (U* ,'Ir:) y(2) (U,'Ir)

sea el resultado de un equilibrio de Nash perfecto en subjuegos del juegorepetido infinitamente, donde se juega (U* ,'Ir*) para siempre después decualquier desviación. '.- -~

'':'''. ":/."

2.17 Consideremos el siguiente juego con horizonte infinIto entre unaúnica empresa y una sucesión de trabajadores, cada uno de los cuales vivedurante un periodo del juego. En cada periodo, el trabajador decide. síesforzarse y producir por tanto a un nivel y con un coste por elesfuerzode c, o no esforzarse, no producir nada y no incurrir en ningún coste. Loque se produzca es propiedad de la empresa, peto ésta puede compartirlocon el trabajador pagándole un salario como se describe a continuación:supongamos que al principio del periodo el trabajador dispone de unaoportunidad alternativa con un valor de cero (neto del coste por el es-fuerzo) y que no se puede obligar al trabajador a aceptar un salario pordebajo de cero. Supongamos también que y > c de forma que esforzarsees eficiente.

Dentro de cada periodo, el desarrollo temporal es el siguiente: pri-mero el trabajador escoge un nivel de esfuerzo, a continuación tanto la

j'.'

(;::-:-'

:~

".Ij"'",'

138 / JUEGOS OlNÁMICOS CON INFORMACIÓN COMPLETA (c. 2)

empresa corno el trabajador observan el nivel de producción y finalmentela empresa escoge un salario para pagar al trabajador. Supongamos queno existe manera de hacer cumplIr los contratos salariales: no hay nin-guna restricción sobre la elección del salario por parte de la empresa.En el juego de un periodo, sin embargo, perfección en subjuegos implicaque la empresa ofrecerá un salario de cero produzca lo que produzca e!trabajador, de forma que el trabajador no se esforzará.

Consideremos ahora el problema con horizonte infinito. Recordemosque cada trabajador vive sólo por un periodo. Supongamos, sin embargo,que al principio del periodo t, la historia del juego hasta el periodo t - 1 esconocida por el trabajador que trabajará eh el periodo t. (Pensemos como'si esta información.setransrnitiese de generación a generación entre lostrabajadores.) S)lpongamosque)a empresa descuenta el futuro de acuerdocon el factor de 'descuento 5 por periodo; Descnoanse las estrategias de:la empresa y de cada trabajador en un equilibrio perfecto en subjuegosdel juego cOllhorizonte infinito en las que en equilibrio cada trabajadorse esfuerza y produce por tanto a un niyely, siempre y cuando el factorde descuento sea lo suficientemente alto. Dése una condición necesaria ysuficiente para ,que su equilibrio exista.

2.18 ¿Qué es una estrategia (en un juego arbitrario)? ¿Qué es un conjuntode información? ¿Qué es unsubjuego (eh un juego arbitrario)?

2.19En la versión de tres periodos del modelo de la negociación de Rubins-tein analizada en la sección 2.1.D, calculamos el resultado por inducciónhacia atrás. ¿Cuál es el equilibrio de Nash perfecto en subjuegos?

2.20 Consideremos las siguientes estrategias.en la versión de horizonteinfinito del modelo de la negociación de Rubinstein. (Recordemos laconvención notacional de que la oferta (s,1 - s) significa que 'el jugador 1obtendrá s y el jugador 2 obtendrá 1 - s, independientemente de quienhaga la oferta.) Sea s. = 1/(1 + ó). El jugador 1 siempre ofrece (s" ,1 - s.)y acepta una oferta (s,l - s) sólo si s ~ ós •. El jugador 2 siempre ofrece(1 - s. ,s*) y acepta una oferta (.s,l - s) sólo si 1 - s ~ 5s.: Demuéstreseque estas estrategias son un equilibrio de Nash. Demuéstrese que esteequilibrio es perfecto en subjuegos.

2.21Proporciónense las representaciones en forma extensiva y normal deljuego de la granada descrito en la sección 2.1. ¿Cuáles son los equilibrios

Refrrencias /\39

de Nash en estrategias puras? ¿Cuál es el resultado por inducción hacia, 7 'Cuál es el equilibrio deNash perfecto en subJuegos?atraso ¿

2.22Proporciónense las representaciones en for~~ae;xtensiva y,nonnal del. d 1pánico bancario discutido en la seCCIOn2.2.B. ¿Cuales son JosJuego e .. 7equilibrios de Nash perfectos en subjuegos en estrategIas puras.

2.23Un comprador y un vendedor desearían realizar un intercambio. An-tes de hacerlo, el comprador puede efectuar una inversión que aumentael valor que asigna al objeto a intercanlbiar. Esta inversión no pued: serobservada por el comprador y no afecta el valor que el vendedor aSIgnaal objeto; que normalizamos a cero. (Como ejemplo, pensel~~osen una.empresa que compra otra. En algún momento antes de la [uslon, el com-prador podría haber actuado en el sentido de cambiar los productos quesu empresa planea introducir en el mercado de forma que se complemen~ten después de la fusión con los productos de la ~mpr~sa comprada. SIel desarrollo de un producto lleva tiempo y el CIclovItal del productoes corto, no hay tiempo suficiente para que el comprador lleve ~ ~a~oesta inversión después de la fusión.) Para el comprador el valor IIllClaldel objeto es v > O; una inversión de 1 aumenta est~ v~lor a '/)+ 1, ?erocuesta 12. El desarrollo temporal del juego es el SIguIente: en pnmerlugar, el comprador escoge un nivel de inversión 1e incurre en el cosle12, En segundo lugar, el comprador no observa 1pero ofrece vender elobjeto por un precio p. En tercer lugar, el comprador a~epta o rechaza laoferta del vendedor: si el comprador acepta, la ganancIa del compradores v + 1- p - 12Y la del vendedor es p; si el comprador rechaza, é~tasganancias son _12 y cero respectivamente. Demuéstrese que .no eXIsteningún equilibrio de Nash perfecto en subjuegos con estrate?las purasen este juego. Calcúlese el equilibrio de Nash perfecto en SUbJ1,legos.conestrategias mixtas en el que la estrategia mixta del comprador. solo.aSIgna. probabilidad positiva a dos niveles de inversión y la e~trategla mIxta delvendedor sólo asigna probabilidad positiva a dos precIOS.

2.7 Referencias

ABREU, D. 1986. "Extremal Equilibria of Oligopolistic Supergames." JOlll'1wl

of Economic Theory 39:191-225.

140/ JUEGOS DfNÁMICOS CON INFORMACiÓN COMPLETA (e. 2)

-. 1988. "On the Theory of lnfinitely Repeated Carnes with Discounting."Ecollometrica 56:383-96.

ABJ~EU,D., D. PEARCE, y E. STACCHETTI. 1986. "Optimal Cartel Equilipriawith Imperfect Monitoring." ¡oumal o/ Economic Theonj 39:251-69.

ADMATI, A., Y M. PERRY. 1991. "JointProjects without Commitment."Review o/ Economic 5tudies 58:259-76.

AKE1~LOF,C., Y J. YELLEN, eds. 1986. Efficiency Wage Models 'o/ the LaborMarket. Cambridge, Inglaterra: Cambridge University Press.

BALL, L. 1990. "Tirne-Consistent Policyand Persistent Changes in In-Hation." National Bureau of Econornic R.esearch Working Paper #3529(Decernber). -

BARRO, E., Y D. CORDON. 1983. "Rules, Discretion, and Reputation in aModel of Monetary.Policy." ¡oumal of Monetanj Economics 12:101-21.

BECKER, G. 1974. "A Theory of Social Interactions." ¡oumal of PoliticalEconomy 82:1063-93.

BENOIT, J-P., y V Krishna. 1985. "Finitely Repeated Carnes." Econometrica53:905-22.

-. 1989. "Renegotiation in Finitely Repeated Carnes." Harvard BusinessSchool Working Paper #89-004. .

BUCHANAN, J. 1975. "The Sarnaritan'sDilernrna." In Altruism, Morality,and Economic Theonj, E. Phelps, ed. New York: Russell Sage Foundation.

BULOW, J., y K. ROGOFF. 1989. "Sovereign Debt: Is to Forgive to Forget?"American Economic Review 79:43- 50.

D[AMOND, D., Y P. DYBVIG. 1983. "Bank Runs, Deposit Insurance, andLiquidity." ¡oumal of Political Economy 91:401~19.

ESPJNOSA,M., y C. RHEE. 1989. "Efficient Wage Bargaining as a RepeatedCame." Quarterly ¡oumal o/ Economics104:565-88.

FARRELL,J., y E. MAsKIN. 1989. "Renegotiation in Repeated Carnes." Carnes¡¡lid t'conomic Behavior 1:327-60.

FERNÁNDEZ, R., Y J. CLAZER. 1991. "Striking for a Bargain Between TwoCompletely Informed Agents." American Economic Review 81:240-52.

Referencias / 141

FRIEDMAN, J. 1971. "A Non-cooperative Equilibrium for Supergames."Review o/ Economic Studies 38:1-12.

FUDENBERG,D., YE. MASKIN. 1986. 'The Folk Theorem in Repeated Carneswith Discounting and Incomplete Inforrnation." Econometrica 54:533c54.

CREEN, E., YR. PORTER. 1984. "Noncooperative Collusion Under IrnperfectPricelnformation," Econometrica 52:87-100.

HUIZINGA, H. 1989. "Union Wage Bargaining and Industry Structure."Stanford University, Mirneo.

JACKLIN, c., y S. BHATTACHARYA.1988. "DistinguishingPanics and In':formation~based Bank Runs: yYelfare and Policy Implications." ¡oumal of .Political Economy 96:568~92.

KREPS,D. 1990. A Course in Microeconomie Theory. Princeton, NJ: PrincetonUniversity Press.

KREPS, D., Y R. WILSON. 1982. "Sequential Equilibrium:." Eeonometne~. .' ~; :L'.iC,;

50:863-94.. .:/

LAZEAR,E. i989. "Pay Equality and Industrial Politics." ¡oumal of PolitiealEeonomy 97:561-80.

LAZEAR, E., Y S. ROSEN. 1981. "Rank-Order Tournarnents as Optimum:Labor Contracts." ¡oumal of Politieal Eeonomy 89:841-64.

LEONTIEF, W. 1946. "The Pure Theory of the Cuaranteed Annual WageContract." ¡oumal of Political Eeonomy 54:76-79.

McMn:.LAN, J. 1986. Carne Theory in International Economies. ChUT, Suiza:Harwood Acadernic Publishers.

OsBORNE, M., Y A. RUBINSTEIN. 1990. Bargaining and Markets. San Diego:Acadernic Press.

PRENDERGAST,e 1992. "The Role of Prornotíon in Inducing Specific Hu-man Capital Acquisition." De próxima aparición en Quarterly ¡oumal o/Eeonomies.

ROSEN, 5.1986. "Prizes and Incentives in Elimination Tournaments.'~ Ame-rican Economie Review 76:701-15.

1;;. ~,.

,..,' .~,~:;

.{,;',

142 / JUEGOS DINÁMICOS CON INFORMACIÓN COMPLETA (e. 2)

ROTEMBERG,J., y G. SALONER.1986. "A Supergame-Theoretic Model ofBusmess Cycles and Price Wars during Booms."American Economic Review76:390-407.

RUB~STEJ.¡'\I,A. 1982. "Perfect Equilibrium in a Bargaining Model." Econo-metrzca 50:97-109.

~i~TEN,R. 1965. "S~i~~~he~retis.che.Behandlung eines Oligopolmodells24. Nachfragetraghelt. Zeltslzcrift für Gesamte Staatswissenschaft 121:301-

SHA~~D,.A., ~ J. SurrON. 1984. "Involuntary Unemployment as a PerfectEquzh?numm ~Bargaining Model." Econometrica 52:1351-64.

S~IRO,C., yJ.'STIGLITZ.1984. "Equilibrium Unemployrnent as a D' '-plme Device." American Economic Review 74:433-44. ISCl

SOB7_L,L y J. T~HASHI. 1983. "A MultistageModel of Bargainin ."Remew of Economlc Studies 50:411-26. g

STA~:I<ELBERG,H. VON. 1934.. Marktform und Gleú:hgewicht. Viena: JuliusSpnnger.

STAIGER~D. 1991. "Why Do Union Contracts Exclude Employment?" Stan-ford Uruversity, Mimeo.

TIROLE,J. 1988. The Theory o/ Industrial Organization. CPress. ambridge: MIT

3. JUEGOS ESTÁTICOSCON INFORMACIÓN INCOMPLETA

Con este capítulo comienza nuestro estudio de los juegos con ill!0r1110ÓÓIl

incompleta, también llamados juegos bayesianos .. Recordemos que en unjuego con infoIDlación completa las funciones de ganancias de. los juga~dores son información del dominio público. Por el contrario, en un juegocon información incompleta, al menos un jugador no está'seguro de lafunción de ganancias de otro jugador. Un ejemplo común de un juegoestático con información incompleta es una subasta de sobre cerrado:cada participante conoce su propia valoración del bien subastado, pero noconoce las valoraciones de los otros participantes, y las pujas se entreg¡men sobres cerrados, por lo que las decisiones de los jugadores pueden con-siderarse simultáneas. Sin embargo, la mayoría de los juegos bayesianoscon interés económico son dinámicos. Como veremos en el capítuJo,4,la existencia de información privada conduce de forma natural a que laspartes informadas intenten comunicar (o a confundirlos), y que las par-tes no informadas intenten conseguir información. Estas cuestiones sonintrínsecamente dinámicas.

. '

En la sección 3.1, definimos la representación en forma normal deun juego bayesiano estático y el equ.i1ib'nóbayesiano de Nash en dicil~juego. Puesto que estas definiciones son abstractas y algo complejas,introduciremos las ideas principales con un ejemplo sencillo, el de l~competencia a la Cournot bajo información asimétrica.

En la sección 3.2 consideramos tres aplicaciones. En priiller lugar,ofrecemos una discusión formal de la interpretación de las estrategiasmixtas dada en el capítulo 1: la estrategia mixta del jugador .i representala incertidumbre del jugador i con respecto a la estrategia pura que eligiráj, y la elección de j depende de una cierta información privada. Ensegundo lugar, analizamos una suba sta "de sobre cerrado en la que lasvaloraciones de los participantes son información privada, mientras quela valoración del vendedor es conocida. Finalmente, consideramos elcaso en el que un comprador y un vendedor tienen, cada UIlO de ellos,información privada sobre sus valoraciones (como cuando una empresa

14.1/ JUEGOS EST..\TICOS CON INFOR,"IACláN INCOMPLETA (e. 3)

conoce el producto marginal de un trabajador y el trabajador conoce lasoporl1midades alternativas de que dispone). Analizamos un juego deintercambio llamado subasta doble: el vendedor anuncia un precio deventa y el comprador anuncia simultáneamente un precio de compra;el intercambio tiene lugar al precio medio si el último es mayor que elprimero.

En la sección 3.3 enunciamos y demostramos el Principio de revelación,e indicamos brevemente cómo puede aplicarse al diseño de juegos cuandolos jugadores tienen información privada.

3.1Teoría: Juegos bayesianos estáticos y equilibrio bayesianode Nash

3.1.A Un ejemplo:

Competencia a la Cournot bajo información asimétrica

Consideremos un modelo de duopolio de COlirnot con demanda inversadada por P(Q) = a - Q, donde Q = ql + q2 es la cantidad agregada enel mercado. La función de costes de la empresa 1 es CI(ql) = cql. Sinembargo, la función de costes de la empresa 2 es C2(q2) = crlq2 con proba-bilidad f) y C2(q2) = CM2 con probabilidad 1- B, donde CB < CA. Además,la información es asimétrica: la empresa 2 conoce su función de costes yla de la empresa 1, pero la empresa 1 sólo conoce su función de costes yque el coste marginal de la empresa 2 es CA con probabilidad e y CB conprobabilidad 1-e. (La empresa 2 podría ser nueva en el sector o haber de-sarrolJado una nueva tecnología.) Todo esto es información del dominiopúblico: la empresa 1sabe que la empresa 2 cuenta con mejoiinformación,y la empresa 2 sabe que la empresa 110 sabe, y así sucesivamente.

Naturalmente, la empresa 2 querrá elegir una cantidad diferente (ypresumiblemente menor) si su coste marginal es alto que si es bajo. Porsu parte, la empresa 1 debería prever que la empresa 2 puede ajustarsu cantidad al coste de la manera indicada. Sean qi(CA) y qi(CB) lascantidades elegidas en función de sus costes, y sea qi la cantidad elegidapor la empresa 1. Si el coste de la empresa 2 es alto, ésta elegirá qi(cA) talque sea una solución de

max[(a - qi - q2) - cAlq2-q2

Teorla: ¡llegas bayesianos estáticos y equilibrio bayesimlO de Nash / 145

Demodo similar, si el coste de la empresa 2 es bajo, q';(cB) será la soluciónde

max[(a - qi - q2) - cBlq2'q2

Finalmente, la empresa 1 sabe que el coste de la empresa 2 es alto conprobabilidad B y debería prever que la cantidad elegida por la empresa 2será qi(CA) o qi(CB), dependiendo del coste de esta empresa. Por taJ;lto,laempresa 1 elige qi que resuelve

maxB [(a -, ql - qi(cA») ~ 'cJ ql + (l - B) [(a -ql - qi(CB») - c] qlq¡

para maximizar el beneficio esperado. . , .,Las condiciones de primer orden de estos problemas de optinuzaclOn

son

• a - qi - CAq2(CA) - 2

- a - qi - CBqi(c~) - 2

y

• B [a - qi(cA) - c] + (l - B)-[a - qi(CB) ~c]ql = - 2 '

Supongamos que estas condiciones de primeror.den caracteriz~i~iso-luciones de los problemas de 'optimización anterióres, '\Recotdem:~s.~elejercicio 1.6 que, en un duopolio de Coumot .C?-!1 ~oI1llación.co.~gl~ta,si los costes de las empresásson lo'suficientemente diferentes entre sí, laempresa con el coste alto no produce nada en-equilibÍio. Corno ejeicíoo,hállese una condición suficiente para excluir aquí problemas análogos.)Las soluciones a las tres condiciones de primer orden son

y

a - 2c +BCA + (l - B)cBqi =- 3

"L.,•...

"1• .:.::-

("-'.-

(..,

""-

146/ JUEGOS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (c. 3)

Comparemos q2:(CA), q2:(CB) y qj con el equilibrio de Cournot coninformación completa y costes el y ez, Suponiendo que los valores de et yCz son tales que ambas cantidades de equilibrio son positivas, la empresai produce q¡ = (a - 2Ci + cj)/3, en este caso con información completa, Porel contrario, en el caso con información incompleta, q2:(cA) es mayor gue(a - 2CA + c)/3 y qi(CE) es menor que (a - 2CB + c)/3, Esto ocurre porque laempresa 2 no sólo ajusta su cantidada su coste, sino que también respohdeal hecho de que la empresa 1 no puede hacerlo. Por ejemplo, si el costede la empresa 2 es alto, ésta produce menos porque su costE4'esalto, peropor otro lado produce más porque sabe que la empresa 1 producirá unacantidad que maximice su beneficio esperado y qué, por ello, es menordelo que produciría sisupierá que ~l cbstede la empresa 2 es alto, (Unacaraé:terísticade este ejemplo que puede prestarse a confusión, es que qi esexactamenteigliala las cantidades deC:ournot espetadas que la empresa 1produciría en los'dos juegos correspondientes con información completa.Esto no es cierto normalmente; consideremos por ejemplo el caso en elcual el coste total de la empresa i es cíq'f)

. , - .

3.1.BRepresentación en forma nlirmal de los juegos bayesianosestáticos

Recordemos que la representación en fOI1Jlanormal de un juego con infor-mación completa de n jugadores es G = {SI' , , . ,S~; u], ' , .•11,n}, donde Sí esel espacio de estrategias del jugador i y 11,í(Sl, ,., ,sn) es laganancia al juga-dor i cuando los jugadores éligen ras estrategias (S], ~.: ,~~),'SÚ~e~~~rgo,como discutimos en la sección 2,3,13" en un juego dé decisión siíriúitáneacon información completa, para un jugador una estra~egia~~s{mplementeuna acción, por laque podemos escribir G'; {Al .... ~,A~;11,],... 'Un}'donde Ai es el espacio de acciones dei y 1Li(a], .. , ,an) es la gananciadel jugador i cuando lo,sjugadores eligen las acciones (a]" , "an), Parapreparar nuestra descripción del desarrollo temporal de un juego estáticocon información incompleta,describimos la secuencia temporal de un juegoestático con información completa del siguiente'modo: (1) ios jugadorestoman simultáneam:ente sus decisiones (el jugador i elige a; del conjuntofactible Aí), y luego (2) reciben las ganancias 11,i(a], ' , . ,an).

Ahora queremos representar en forma normal un juego dé decisión si-multánea con información incompleta, también llamado juego bayesianoestático, El primer paso consiste en representar la Idea de que cadajuga-dar conoce su función de ganancias, pero puede no conocer las de otros

b . s estlÍticos y eqllilib,'io bayesiallo de Nosl, ! 147Teoria: Juegos ayesw,lO

'bl fu dones de ganancias de .¡, /),;(0.], ... ,0,,,; /,,),d Sean la POSI es n., '

¡uga ores. , 'd' pertenece a un conjunto de tlPOSPOS1-. !ttpO del Juga or 1" que . .donde tí es e '1 esponde a una de las fUllcJOlles. es aGiode tipos) 7';. Célda tIpO 'i corr ,bies (o PI' ador i podna tener.de ganancias diferente que e Jug ~os que el J'ugador i tiene dos posi-

, plo abstracto, supongar. . ,Como eJem 'D" s en este caso que el jugador'/. tlenef 'ones de gananCIas. ]namo . . J }

bies unCI l' de tipos del J'ugador '1 es Ti = l.til,liz. 's t. Yh que e espaCIO . )dos hpO, ,1 '~d ias del jugador i son 11,i(al,' .. ,0,,,, til YYque las dos funcpIOndesoesgua:::r la idea de que cada uno de los tipo.s

( a 't-z) o em " . d'f ttii al,' , ., "", ' d 1 f nciones de gananCIas J 'eren e1 ' dar corresponde a una e as u

d.e Juga . , 1fin de representar laposibilidad de que1, ador podna tener, con e . '. .que e ¡ug . d'f tes conJ'untos de acciones factibles, como. d' ador puede tener 1eren 1ca a Jug , " . S s por eJ'emplo, que el conjunto e e. os a contmuaCIOn, upongamo, }vereID , d . {b} con probabilidad q y {o"b,c con. factibles del Juga ar t es a, (aCCIOnes d afirmar que i tiene dos tipos ti1bTd dI - Entonces po emos ,proba 11 a a r~babi1idad de til es q) y podemos decir que el conjunto~:i~C:i:~: ~ac~bles de i es {a,b,c} para amb~s tipos, pero hacer que la

. d d 1 gir c sea -00 para el tlpO til'ganancia de,nva l~ :á: ;oncreto consideremos el juego de Cournot de la

Como e¡emp. 'd' 1 s empresas son sus decisiones sobre, , nterior Las aCCIones e a

secclOna 'L 2 tiene dos posibles funciones de costeslas cantidades ql y qZ' a empresa .y, por ello, dos posibles funciones de beneficios o gananCIas:

'1rZ('1l,'1Z; cn) = [(a - '11 - qz) - CE) qZ

y

1rZ(ql,qZ; CA) = [(a, - '11 - '1z) - CA) '12

La empresa 1 sólo tie~e una función de ganancias posible:

'1rl(ql,Qz;C) = [(a - ql - '1z) - e) ql

. 1 'de tipos de la empresa 2 es Tz = {CB,CA} yPodemos deCIr que e espaCIO . "qué el espacio de tipos de la empresa 1 es 7] = {c}', l' d

d d fi '" del tipo de un jugador, decrr que e Juga orDa a esta e mCIOn .' '1 ' ~', . .-' .-';, d" 'es equivalente a deCIr que e Jugalor /.1 conoce su fuhcIOn e gananCIas "

" '. , d ..decir que el Jugador '1, puede no estarconoce su tIpo, Del rmsmo mo o, , I t .d l fuh' d ganancI'as de otros J'ugadores es equwa eneseguro e as CIonese . . d

' de los tipos de otros Jugadores, e-a decir que puede no estar seguro. , r, I. t ). Utilizamos T-i para mucar enotados por t-í = (t],., . ,/i_l,t,+l" .. , 'n

Teoría: Juegos bayesianos estáticos y equilibrio bayesiano de Nash / 149

p(L;,ti)¿: p(L;,ti) .

t_iET_i

Ip(L;,ti)

Pi(Li ti) = P(ti)

con información imperfecta queremos decir (como en el capítulo 2) que enalguna ronda del juego el jugador al que le corresponde decidir no conocela historia completa del desarrollo anterior del juego. Aquí, como el azarrevela el tipo del jugador i al jugadori pero no al jugador j en el paso(2),el jugador j no conoce la historia completa del juego cuando toma susdecisiones en el paso (3).

Necesitamos tratar otras dos cuestiones algo más técnicas para com-pletar la discusión sobre la representación en forma normal de los juegosbayesianos estáticos. En primer lugar, existen juegos en los cuales el ju-gador i tiene información privada no sólo sobre su propia función degananci¡¡.s,sino también sobre la función de ganancias de otro jugador.Por ejemplo, en el ejercicio 3.2, cambiamos la información asimétrica delmodelo de Coumot de lasecéión, 3.1.A de manera que los costes sonsimétricos y del dominio público, pero una empresa conoce el nivel dedemanda y la otra no. Puesto que el nivel de demanda afecta lasfun~ciones de ganancias de ambos jugadores, el tipo de la empresa informadaaparece en la función de ganancias de la empresa no informada. En el casode 1'1 jugadores, capturamos esta posibilidad permitiendo que la gananciadel jugador i dependa no sólo de las acciones (al,'.' ,an), sino

también de todos los tipos (tl, ... ,tn). Escribimos esta ganancia comoui(at, ... ,an;tl, o ••• ,tn).

La segunda cuestión técnica se refiere a las conjeturas Pi(Ltlti). Su-pOl\emos que es del dominio público que en el paso (1) del desarrollotemporal del juego estático bayesiano, el azar escoge un vector de, ,tipost = (tI, ... ,tn) de acuerdo con la distribución a priori de probabilidad p(t\Cuando el azar revela ti al jugador i, éste puede calcular laconjel:tii-a, "Pi(Lilti) utilizando la regla de Bayes:2'

Además, los otros jugadores pueden calcular las distintas conjeturas quepodría, formarse el jugador -i, dependiendo del tipo de i, concretame,nte

2 La regla de Bayes es una fórmula para calcular P(AiB), la probablIidad (condidomida)de ql.\e un suceso A ocurra dado que un suceso B ha ocurrido ya. Sean peA), P(B) y P(A,Ellas prob,abilidaqes (a priori, es decir, las probabilidades antes de que A o B hayan podidoocurri~) de qu~ A ocurTa, de que B ocurra y de'que ambos A y B ocurran respectivamente. Laregla de Bay",s establece que'P(AIB) ; P(A,B)/ P(B). Es decir, la probabilidad condicionald", que se dé /1es igual a la probabilidad de que se den tanto A como B, dividida por. lapr~babilida'd a pri9ri de que ocurra B.

148/ JUEGOS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (c. 3)

conjunto de todos los posibles valores de Lú y utilizamos la distribuciónde probabilidad Pi(LtlU para designar la conjetura sobre los tipos de losotros jugadores, L¡, dado el conocimiento del jugador i de su tipo ti. Encada aplicación analizada en la sección 3.2 (yen la mayor parte de laliteratura), los tipos de los jugadores son independientes, en cuyo casop¡(LtlU no depende de t'i, por lo que podemos escribir la conjetura del.jugador i como Pi(Li). Sin embargo, hay contextos en los que los tiposde los jugadores están correlacionados, por lo que deberemos tenerlo encuenta en nuestra definición de juego bayesiano estático, escribiendo laconjetura del jugador i como Pi(Ltlt;).1

Uniendo los nuevos conceptos de tipos y conjeturas con los elementosya familiares de la representación en forma normal de un juego estáticocon información completa, obtenemos la representación en forma normalde un juego estático bayesiano.

Definición. La representación ell ¡onll a 110m/al deun juego bayesiano estáticode JI jugadores exige concretar los espacios de acciones de los jugadores Al, ... ,An,sus espacios de tipos T1, ... ,Tn, sus conjeturas PI/"',Pn y sus fUnciones deganancias ul, ... ,un. El tipo del jugador i, tú es collocido sólo por el jugadori, detennina la función de ganancias del jugador i, 'U¡(al, ... ,an; ti), y es unelemento del conjunto de tipos posibles T;. La cOlljetura del jugador i, Pi(L¡ Iti),

describe la incertidumbre de i respecto a los posibles tipos de 'los otros 1'1 - 1jugadores, Lú dado el propio tipo de i, ti. Denotamos este juego como G{Al,'" ,An;TI, ... ,Tn;PI,'" ,p,,;lL], ... ¡Un}.

Siguiendo a Harsanyi (1967), suponemos que el desarrollo temporalde un juego bayesiano estático es la siguiente: (1) el azar determina unvector de tipos t = (tI,' .. ,tn), donde ti se obtiene del conjunto de tiposposibles Ti; (2) el azar revela ti al jugador i, pero a ningún otro jugador; (3)los jugadores toman sus decisiones simultáneamente; el jugador i elige ai

del conjunto factible A¡, y (4)se recibt;.nlas ganancias 'ui(a¡, ... ,an; ti). Conla introducción ficticia del azar en (1) y (2), hemos descrito un juego coninformación incompleta como un juego con información imperfecta, donde

'1 Imaginemos que dos empresas están compitiendo por desarrollar una nueva'tecnologia.La posibilidad de éxito de cada empresa depende en parte de la dificultad en desarrollar la 'tecnología, dificultad que es desconocida, Cada empresa sólo sabe si lo ha logrado o no, perono si la otra Jo ha conseguido. Sin embargo, si la empresa 1 ha tenido éxito; es más probableque la tecnologia sea fádl de desarrollar y, por ello, también más probable que la' empresa 2la haya desarrollado. Por lo tanto, la conjetura de la empresa 1 sobre el tipo de la empresa 2depende del conocimiento por parte de la empresa 1 de su propio tipo.

".,

,'.'. '

150/ JUEGOS ESTt\TICOS CON INFORMACiÓN INCOMPLETA (c. 3)

Pi(Lilti) para cada ti en Ti' Como ya indicamos, vamos a suponer amenudo que los tipos de los jugadores son independientes, en cuyo caso.p;(Li) no depende de ti, pero se obtiene a partir de la distribución a priorip(t). En este caso, los otros jugadores conocen la conjetura de i sobre sustipos.

3.1.CDefinición del equilibrio bayesiano deNash

Ahora queremos definir el concepto de equilibrio de los juegos bayesiano~,estáticos. Para ello, necesitarí1osd~finir primero los espacios de estrategias,de los jugadores en dicho juegó.~Retordemos de las setciones2.3.By:'2AB qtle la estrategia de unjtigadot'esun pÍartde acción completo, que; 1establece una accióh factible para cadá contihgenciaenla que el jugadót ¡".'~

podría tener que actuar: Dada la sécuencia temporal del juego estático ,¡

, ~ayesiáno<en ehual el azar comienza el juego eligiendo los tipos ¥~los>':Jugadores, una estrategi'a (pura)deljugadór i debe establecer una acci6i{ ,posible para cadáunO de los tipos posibles del jugador i. ", i.

-.-"{' ..~: . ,t '~' .. ,' .' :~ ' -DefinidÓri:Enet¡'uegobayesÍlm.iJestáticoG=={AI,:.A'TI T 'PI .".,'_ . , I nI ' .. "' nI 1°."/

P":; Ul~' .. ,U,;}, una'estrategia del jugador i es una funciÓn Si(t;) donde, paracada tipo ti en Ti, Si(ti)'determiha la acciÓn del conjunto factible Ai que el tipo tielegiría si el azar determinara que el jugador es de este tipo.

Al contrario que en lós juégos (tahto estáticos como dinámicos) coninformación completa, en 'un juego bayesiano; los espacios de estrategiasno se dan en la representaCión 'en forma normal del juego; sino que séconstruyen a partir de los espacios de tipos y acCiones. El conjunto' deposibles estrategias (puras) del jugador i, Sir es el conjunto de toda,s lasfunciones posibles con dominio T; y recorrido Ai. Por ejemplo, en unaestrategia de separaciÓn, cada tipo ti en Ti elige una acción diferente aid~ Ai. Por el contrario, en una estrategia de agrupaciÓn, todos los tiposelIgen la misma acción. Esta distinei6h entre estrategias de separación yde agrupación es importante para la discusión de los juegos dinámicos conir;£0rmación incompleta del capítulo 4. Introducimos la distinción aquísolo para ayudar a describir la'grart variedad de estrategias que'puedenconstruirse a partir de un determinado par de espacios de tipos y acciones;TiyAi. _ ",' .

I)u,~deparecer innecesari~ exigir que la estrategia dél jugador i deter-mine una acción factible para eada uno de los tipos posibles del jugado~

Teoria: Juegos bayesimws estáticos y eq¡lÍlibrio bayesúllIo de Nasl¡ / 151

/. Después de todo, una vez el azar ha elegido un tipo particular y selo ha revelado a un jugador, puede parecer que el jugador no necesitapreocuparse por las acciones que podría haber tomado de haber salidoelegido otro tipo. Sin embargo, el jugadori necesita tener en cuenta lo queharán los otros jugadores, y lo que harán depende de lo que piensen quehará el jugador 'i para cada ti en Ti. Por 10 tanto, para decidir qué haceruna v~i que un tipo ha sido elegido, el jugador i tendrá que pensar quéhabría hecho vara cada otro tipo de Ti que podría haber sido elegido.

Consideremos, por ejemplo, el juego de Coumot con informaciónasimétrica de la sección 3.1.A.Argumentamos allí que la solución del juegotonsiSté enlaelección de tres cantidades: qi(CA), qi(cs) y qj .En términosdél;:¡ defiJ:lidÓnde estrategia q~e acabani.ós de dar;ét'par (q~(cA),qi(cB»esla estrategia de la empresa 2 y qj es la estrategia dedá,'empresa 1. Esfácil imagihar que la empresa2 elegirá dif~rentes c~tidaél~s' dependietlqÓde su coste. Sin embargo, es igualmel1te importante darse c~enta de qDeli elecdón de la cantidad de la emp~és~í debería tener en cuenta quej~. cantidad de la empresa 2 dependerá "üel coste de la empresa 2. PoP 16tanto, si nuestro concepto de equilibrio es requerir que la estrategiá"J~la empresa 1 sea tma mejor respuesta a la estrategia de la empresa;2;.Iaestrategia de la empresa 2 debe ser un par de cantidéldes, una para ca9aposible coste tipo, o si no, la empresa 1 no podría calCUlarsi su estrategiaes efectivamente una mejor respuesta a la estrategia dela empresa 2., .

De forma más general, no podríamos apJicar la noción de equilibrio deNash a juegos bayesianos si permitiéramos que la estrategia de un jugadf?rnóespedficara lo que el jugador haría si algunos tipós're~ultarap. el~gi40¡;por el azar. Este ~rgumento es análogo .~ ~no 'delcapífUl~ 2:' 'pll'ªdkhaber parecido Innecesario 'exigir que laestrateiíá derjtig:ádor i el1.t[;4juego dinámico con informaciÓn completa especlfic';;;seuna acciÓnf<lctibiepara cada contingencia en la cual el jugador i podría haber tenido qúéjugar, pero no podríamos haber aplic<ldola noción de equilibrio de Nasha juegos dinámicos con información completa si hubiéramos permitidoque alguna estrategia dejara sin determinar las acciones del jugador enalguna contingencia.. Una vez dada la definición de estrategia en un juego bayesiano, abor-damosahora la definición del equilibrio bayesiano de Nash, A pesar d~la.complejidad notacibrial de la definición; la idea central es simple y fa-miliar: la estrategia de cada jDgador debe ser una mejor respuesta a lasestrategias de los restantes jugadores. Es decir, un equilibrio bayesiaJio,.. 'de Nash es simplemente un equilibrio de Nash en un juego bayesiano.'¡'

Aplicaciones / 153

""';.','.","

0,02,1

0,0 1,2

Pat

Ópera Boxeo

Boxeo

Ópera

La batalla de los sexos

Chris

Pat

Ópera Boxeo

Ópera 2 + te,l 0,0Chris

Boxeo 0,0 1,2+ tp

Vamos a construir un equilibrio bayesiano de Nash con estrategiaspuras de la versión c()n i,nforrnación incompleta de la batalla de l~~sexosen el cual Chris elige la ópera si te es mayor que un valor cntico e -yelige el boxeo en cualquier otro caso, y Pat elige el boxeo si tp es mayor.

La batalla de los sexos con información incompleta

Ahora supongamos que, aunque se conocen desde hace mucho tiempo,Chris y Pat no están seguros ele las ganancias del otro. En particular.' su-pongamos que: -la ganancia de Chris si ambos van a la óp.eraes 2+te, dondete es información privada de Chris; la ganancia de Pat SI ambos van al bo-xeo es 2 + tp, donde tp es información privada de Pat, y te y tp se obtienenindependientemente de una distribución uniforme en [O,;:¡;]. (La elec~ó~.de una distribución uniforme en [O,x] no es importante; la idea que quere-mos recoger es que los valores te y tp sólo afectan ligeramente a las ganan-cias en el juego original, para lo cual podernos pensar que x es pequeña.)El resto de las ganancias son las mismas. En términos del juego bayesianoestático abstracto en forma normal G = {Ae,Ap; Te,Tp; Pe,Pp; ue,up} los es-pacios de acciones son Ae = Ap = {ópera, boxeo}, los espacios de tiposson Te = Tp = [O,x], lasconjeturas son Pe(tp) = )Jp(te) = l/~.para cada t~,Ytp, Ylas ganancias son las siguientes:

3.2.A Revisión de las estrategias mixtas

Es decir, ningún jugador quiere cambiar su estrategia, incluso si el cambio suponecambiar sólo una acción para un tipo.

3.2 Aplicaciones

Es inmediato dem'ostrar que en un juego bayesiano estático finito (esdecir, un juego en el cual TI es finito y (Al, ... ,A,,) Y (Tl, ... ,T,.) son todosconjuntos finitos) existe un equilibrio bayesiano de Nash, tal vez conestrategias mixtas. La demostración es muy similar a la de la existenciade un equilibrio de Nash con estrategias mixtas en juegos finitos coninformación completa, por lo que la omitimos.

Definición. En el juego bayesiano estático G = {Al,' .. ,:1n; TI, ... ,T,,; PI, .)J" ;(¿I, ... ,1¿,,} las estrategias ,,* = (.~1',... ,"~) forman un equilibrio bayesianode Nash (con estrategias puras) si para cada jugador i y para cada uno" de sustipos ti en Ti, si (ti) es una solución de

152/ JUEGOS EST..i.TICOS CON INFORMACiÓN INCOMPLETA (e 3)

Como mencionamos en la sección 1.3.A, Harsanyi (1973) interpretó laestrategia mixta del jugador j como la incertidumbre deTjugador i sobrela estrategia pura elegida 'por el jugador j y que, a su vez; la elección de jdepende de cierta información privada. Ahora damos"i.m\~rúlI1ciádo'máspreciso de esta idea: un equilibrio de Nash con~str~tegi~~ 'mixtas en u~juego con información completa puede (casi siempre) interpretarse comoun equilibrio bayesiano de Nash con estrategias puras en un juego muysimilar con algo de información incompleta. (No tendrem9sen cuenta loscasos raros en los cuales tal interpretación no es posible.) De un modo másevocador, la característica crucial de un equilibrio de Nashcori estrategiasmixtas no es que el jugador j elija una estrategia al azar, sirio'que el jugadóri no sabe con certeza la elección del jugador j. Esta falta de certeza puedeprovenir de algún suceso aleatorio o (más probablemente) de tin poco deinformación incompleta, como en el siguiente ejemplo. --

Recordemos que en la batalla de los sexos existen dos equilibrios deNash con estrategias puras, (ópera, ópera) y (boxeo, boxeo), y uno conestrategias mixtas, en el que Chris elige la ópera con probabilidad 2/3 yPat elige el boxeo con probabilidad 2/3.

154/ ]VEGaS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (c. 3)

"

si bi > bj,

si bi = bj,si bi < bj.

Para obtener un equilib~io bayesiano de Nash de este juego comen-zarnos construyendo los espacios de estrategias de los jugadores. Recor-demos que en un juego bayesiano estático, una estrategia es una funciónque va de tipos a acciones. Por lo tanto, para el jugador i una estrategia

Aplicaciones / 155

3.2.B Una subasta

-3 +)9 +4:¡;1------

2:1;

que tiende a 2/3 cuando :¡; tiende a cero. Por lo tanto, cuando la infor-mación incompleta desaparece, el comportamiento de los jugadores eneste equilibrio bayesiano de Nash con eslrategias puras del juego coninformación incompleta tiende a su comportamiento en el equilibrio deNash con estrategias mixtas en el juego original con información completa,

Consideremos la siguiente subasta de sobre cerrado al primer precio. Hay.d.osparticipantes qué denóminamos i = 1,2. El participante i tiene unav~Íorad6n Vi del bien, es decir, si i consigue el bien y paga el preciop;la gaiianCia'de i'es v; ~. 'p. Las valoraciones de los dos participantesiistáfiurtiforÍnementedistribUidas de fotina independiente en [O,1]. Laspujas no pUEidenséfnegativas .. Los participantes entregan sus pujassimultáneamente. La puja más alta gana la subastay el ganador paga elprecio de su puja, mientras que el otro participante no obtiene nada ni paganada. En caso de empate, el ganador se determina lanzando una moneda.Los participantes son neutrales al riesgo. Todo esto es información deldominio público.

Para formular este problema como un juego bayesiano estático, debe~mas identificar los espacios de acciones, los espacios de tipos, las conje-turas y las funciones de ganancias. La acción del jugador i es entregaruna puja bi (no negativa) y su tipo es su váloraciónvi' (En términos deljuego abstraclo G = {A1,A2;T},1'z;Pl,P2;Ul,U2}' el espacio de acciones esAi ~ [0,00) y el espacio de tipos es Ti = [0,1].) Como las valoraciones son. independientes, el jugador i cree que Vj está uniformemente dislribuidoen [0,1], independientemente del 'valor de '1)i' Finalmen.te, la función deganancias del jugador i es

(3.2.1)

E. . ° + [1 '- E.] . 1 = 1 - E.. 'x '. x x

respectivamente. Por lo tanto, elegir la óperaes óptiII1;~.si y sólo ?i

- . . ,

E.(2+tc)+ [1- E... ] .0=~(2:i-.t.c.)j; " . X" x' ',< :'

De forma similar, dada la estrategia de Chris,lasg~~ancias~spera1a,s dePat por elegir. el boxeo y la ópera son '. '

y

[ C] ee1-- .1+-.0=1--,x x x

respectivamente. Parlo tanto, elegir el boxeo es óptimo si y sólo si

xtp .;::: ..- :- 3 = p. (3.2,2)e

Resolviendo (3.2.1) y (3.2.2) simultáneamente obtenemos p = e y p2 + 3p-x= O.'Reiolvlendo la ecuaCión de segundo gradase demuestra que laprobabilidad:deque Chris elija la ópera; concretamente (x ::..c)/x, y la deque Patel1ja ei boxeo, concretamente (x- p)/x, son'ambas iguales a.

[C]. e e., .'

1-- .O+ -(2 + tp) = -(2 + tp)x x x

que un valor crítico p y elige la ópera en cualquier otro caso. En talequilibrio, Chris elige la ópera con probabilidad (x - el/x y Pat elige elboxeo con probabilidad (x - p)/x. Vamos a demostrar que, cuando lainformación incompleta desaparece (es decir, cuando x tiende a cero), elcomportamiento de los jugadores en este equilibrio bayesiano de Nash enestrategias puras tiende a su comportamiento en el equilibrio de Nash conestrategias mixtas del juego original con información completa. Es decir,tanto (x - el/x y (x - p)/xtienden a 2/3 cuando x tiende a cero.

Supongamos que Chris y Pat eligen las e;trategias qu~' acabamos dedescribir. Para un valor dado de x vamos a determinar los valores de c yp tales que las~str:ategiasf~rm~!} c~~qt4.l,ilJp9 J?~ye~ia,it2,.~eI::fa,~!t,9adala estrategia dé Pat, las gammcias esperadas de Clilis'"á(el~gir la6pera yel boxeo son' ," ! .,

y

,'. 1

\.~}

156/ JUEGOS ESTÁTlCOSCON INFORMACIÓN INCOMPLETA Ce. 3)

es una hmción bJv¡) que determina la puja que elegiría cada uno de lostipos (es decir, valoraciones) de i . En un equilibrio bayesiano de Nash, laestrategia bl (VI) del jugador 1 es una mejor respuesta a la estrategia b2(V2)

del jugador 2 y viceversa. Formalmente, el par de estrategias (b1 (VI ),b2 (V2»

constituye un equilibrio bayesiano de Nash si, para cada V¡ en [0,1], b;(vi)es una solución de

1max(v.¡- b¡) Prob{b¡ > bj(vj)} + -(v.¡ - bi) Prob{bi = bj(uj)}.~ 2

Simplificamos la exposición buscando un equilibrio lineal: bl (VI) =al + clvl y ~(V2) = a2 + C2V2. Nótese que no estarnos limitando los espaciosde estrategias delos jugadores para incluir sólo estrategias lineales, sinoque estamos permitiendo que los jugadores elijan estrategias arbitrariasy nos preguntamos si existe un equilibrio lineal. Resulté!;que, puesto quelas valoraciones de los jugadores están uniformemente distribuidas, nosólo existe un equilibrio lineal sino que éste es único (en un sentido queprecisaremos). Veremos que b;(vi) = v;/2. Es decir, cada jugador,entregauna puja igual a la mitad de su. valoración ...Tal puja refleja el dilemafundamental al que se enfrenta cualquier participante en una subasta deeste tipo: cuanto más alta sea la puja más posibilidades tiene de ganar;cuanto niás baja sea la puja, mayor será la ganancia si gana.

Supongamos que el jugador j adopta la estrategia Qj(Vj) = aj + CjVj.

Para un valor dado Vi la mejor respuesta del jugador i es una solución de

n¡,ax(Vi - b¡) Prob{bi > aj + CjVj},

donde hemos utilizado el hecho de que Prob{bi = bj(vj)} =0 (puesto quebj(v;) = aj + CjVj y Vj está uniformemente distribuida; también lo está bj).

Puesto que no ttene sentido que el jugador .i puje por debajo de la pujamínima del jugador j y sería tonto por parte de ipujar por encima delmáximo del jugador j, tenemos que aj ::; bi ::; aj + Cj, por lo que

P b{b } - p. b { bi - aj } bi - aj. ro .i > aj +Cjv] - 10 Vj < --- = ---oCj Cj

Por lo tanto, la mejor respuesta del jugador i es

si v. > a.l _ JI

si Vi <aj.

Aplicaciones / 157

5(0 < aj < 1, existen varios valores de Vi tales que Vi < aj, en cuyo casobi (V¡) no es lineal, sino plana al principio y con pendiente positiva después.Como estamos buscando un equilibrio lineal, excluimos O < aj < 1,centrándonos en aj 2: 1 Y aj ::; O. Pero el primero no puede darse enequilibrio: puesto que es óptimo para un tipo más alto pujar tanto almenos corno la puja óptima del tipo más bajo, tenemos que Cj 2: O, peroentonces aj 2: 1 implicaría que bj(Vj) 2: Vj, lo que no puede ser óptimo.Por lo tanto, si b;(vi) tiene que ser lineal, debemos tener aj ::; O, en cuyo'caso b;(v.¡) = (Vi + aj)/2, por lo que ai = aj/2 y Ci= 1/2.

R9\:h~f\19s.reRe!ir el D.1ÍSmoanálisis para el jugador j suponiendo que eljugac!9i'iadOpta Iaéstrate&'ab;(vi) ~Q-i +civi,'con lo qu~ obtenernos ai::; O,aj = a;/2 y Cj = 1/2:' Combinando estos dos conjuntos de resultadostenemos que ai = aj = O Y c.-= Cj = 1/2, es decir, bi(Vi) = v;/2, como.dijimos antes.

Podríamos preguntarnos si hay otros equilibrios bayesianos de Nashen este juego, y también cómo las pujas en equilibrio cambian cuandola distribución de las valoraciones de los jugadores cambia. Ningunacieestas cuestiones puede resólverse utilG:ando la técnicaque acabaiTIosdiaplicar (proponer estrategias .lineales y después derivar los coeficientesque l~s cOnvierten enequllibrio). No conduce a niI:guna part~ inte~~..taradivinar todas las formas funcionales que podrían tener otros egi1i-librios de este j~ego, y no existe equilibrio lineal para ninguna otra dis-tribución de valoraciones. En el apéndice, derivamos un equilibrio baye-siano simétrico}. nuevamente para el caso de valoraciones uniformementedistribuida¡;, Suponiendo _qu~.lasestrategias de los jugadores son estric~tamentecrecientes y diferenciables, demostrarnos que el únic,?equilibi;i,~bay~sianode NashsjII1~tIjcQ.e_s el equilibrio lineal que yaÍ1errÍos' deri~vadO. La técnica que utilizarnos puede extenderse fácilmente a una clasemás amplia.de distribuciones de las valoraciones, y también al caso de nparticipil;ntes.4

3Un equilibrio bayesiano de Nash se denomina simétrico si las estrategias de los jugadoresson idénticas. Es decir, en un equilibrio bayesiano de Nash simétrico existe una sola funciónb(Vi) tal que la estrategia b¡(v¡) del jugador 1 es b(v¡) y la estrategia bz(vz) del jugador 2 esb(vz), y esta única estrategia es una mejor respuesta a sí misma. Por supuesto, puesto quelas valoraciones de los jugadores serán normalmente diferentes, sus pujas también lo serán,incluso si ambos utilizan la misma estrategia.

4 La omisión de este apéndice no impedirá la comprensión del resto del libro.

AplicacirJlles / 159

3.2.CUna subasta doble

donde k es una constante de,integración. Para eliminar k necesitamos unacondición de frontera. Afortunadamente, un razonamiento económicosimple nos ofrece una: ningún jugador debería pujar por encima de supropia valoración. Por tanto, debe cumplirse que b(Vi) ::; Vi para cadaVi. En particular, debe ocurrir que b(O) ::; O. Puesto que las pujas estánrestringidas a ser no negativas, esto implica que b(O) = O,Yentonces k = ()

y b(Vi) = v¡f2, como dijimos.

(3.2.3)max [v - Pb+E[P,(v,)IPb>¡,,(U,)J] Prob{p > p (7) )}Pb b 2 . 1) - S S ,

A continuación consideramos el caso en el cual un comprador y un ven-dedor tienen cada uno información privada sobre sus valoraciones, comoen Chatterjee y Samuelson (1983). (En Hall y Lazear [1984] el compra-dor es una empresa y el vendedor un trabajador. La empresa conoce elproducto marginal del trabajador, y el trabajador conoce sus olras opor-tunidades. Véase el ejercicio 3.8.) Analizamos un juego de intercambiollamado subasta doble. El vendedor anuncia un precio de venta p." y elcompradorsimuItáneamente anuncia un precio de compra p". Si Pb 2: P.,

el intercambio tiene lugar a un precio Ji = (Pb + Ji,) /2. Si Pb < ]J, no se dael intercambio.

La valoración por parte del comprador del bien del vendedor es /JI,;

la del vendedor es v.•. Estas valoraciones son información privada y seobtienen independientemente de distribuciones uniformes en [O,JI. Si elcomprador obtiene el bien por el precio p, su utilidad es v" - p; si no hélYintercambio la utilidad del comprador es cero. Si el ,:,:endedorvende elbien por el precio p, su utilidad es Ji - v.; si no hay intercambio su utilidades cero. (Cada. una de estas funciones de utilidad mide el cambio en lautilidad de cada parte. Si no hay intercambio, no hay cambio en utilidad.No cambiaría nada definir, digamos, la utilidad del vendedor como Ji sihay intercambio a till precio P y v .•si no hay intercambio.)

En este juego bayesiano estático, Í1naestrategia del comprador es unafunciónp/,(vb) que determina el precio que el comprador ofrecerá para cadauna de sus posibles valoraciones. Del mismo modo, una estrategia delvendedor es una función p,(v,) que especifique el precio que el vendedorpedirá para cada una de sus posibles valoraciones. Un par de estrategias{Pb(Vb),p,(V,)} constituye un equilibrio bayesiano de Nash si se cumplenlas dos condiciones siguientes. Para cada Vb en [O,1], Pb(Vb) es una soluciónde

Apéndice

1b(v)v' = -'Il + k7. t 2 1_ ,

maX(Vi - bi) Prob{bi > b(vj)}.bi

Sea b-1 (bj) la valoración-que el participante j debe tener para pujar bj; estoes, b-1(bj) = Vj sibj = b(vjtP.4esto que.vj está uniformemente clistribuidaen [O,ll,Prob{bi > b(1jÚt= Prob{b:2-I(b»> vü= b-1(bi). La condición deprimer orden.para la opti~zación del probletriadél jugador ies

. d'-b-1(bi) + (Vi ~ bi) db. b-¡(bi) = O.

'1 .; •

Esta condi<:ió~es unaecÍlaciÓri iJ1pIícita d~ia m~jor~~sp'uesta del jugadorta .la estrategIa b(.) jugada por j dádoqil~ la Véiloracióndei es Vi. Si la ..estrategia bO tiene que ser un equilibrio bayesiano de Nash simétrico, esnecesario que la soluc_iónalacondición de primer orden seab(vi). Es decir,para cada una de las posibles valoraciones del pujador 7" éste no quieredesvIarse de laestrategia bOdado que el jugador j utiliza esta est;ate~a.Para imponer este requisito, sustituimos bi b(Vi) en la condición" deprimer orden, obtenielldo

-b-l(b(~i» +(Vi - b(Vi» d:ib-1(b(Vi» = O.

Por supuesto;b-1(b(vi»)'es simplemente v;. Además, d{b-1(/j(Vi»}/dbi =

l/b'(vi). Es decir, d{b-1(bi)}/dbi mide cuánto debe cambiar la valoraCióndel jugador i para producü: un cambio de una unidad en lapuja, mIentrasque b'(Vi) mide cuánto cambia Ía puja en respuesta a un cambio de u~aunidad en la valoración .. Por lo tanto, bO debe satisfacer la ecuacióndiferencial de primer orden

Supongam.os queel jugador j adopta la estrategia bO y supongamos queN.) es estnctamente creciente y diferenciable. Entonces', para un valordado de Vi la puja óptima del jugador ies una solución de

1-Vi + (Vi - b(Vi»-b'( ) = O,. t'i

la cual~e expresa de un modo más conveniente como b' (Vi)Vi +b( Vi) = Vi. Laparte izquierda de esta ecuación diferencial es precisamente d{ b(Vi )Vi} /dVi.Integrando ambas partes de la ecuación obtenemos

.158 I JUEGOS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (e. 3)

.'.'.'

,','

<:.

;';:....

(

(3.2.5)

[1 { as + Pb}] Pb - asmax Vb - - Pb + .--- ---,

Pb 2 2 Cs

cuya condición de primer orden consiste en

Aplicaciones! 161

del vendedor es una mejor respuesta a la del comprador, ya que para lostipos del vendedor que hacen que el intercambio se prefiera a la ausenciade intercambio éste ocurre, y viceversa. El argumento análogo demuestraque la estrategia del comprador es una mejor respuesta a la del vendedor,por lo que estas estrategias forman un equilibrio bayesiano de Nash. Eneste equilibrio el intercambio se da para los pares (Vs¡Ub) indicados en lafigura 3.2.1; el intercambio sería eficiente para todos los pares (V"Vb) talesque Vb ~. Vs, pero no se da en las dos regiones sombreadas de la figura.

Ahora derivamos un equilibrio bayesiano de Nash lineal de la subastadoble. Como en la sección anterior, no restringimos los espacios de estrate-giasdelos jugadores de nianera que se incluyan solamenre las estrategiaslin~ales, sino que pennitimos que los jugadores elijan estrategias arbitra-rias pero nos preguntamos si existe un equilibrio que sea lineal. Existenmuchos otros equilibrios además de los equilibrios de precio único y elequilibrio lineal, pero el equilibrio lineal tiene propiedades de eficienciainteresantes que describiremos más adelante.

Supongamos que la estrategia del vendedor es Ps(vs) = as + CsVs'Entonces Ps está uniformemente distribuido en [as,as + cs], por lo que(3.2.3) se convierte en

[1 { Ps + ab + Cb } ]max -2 Ps + 2 - Vs

. p,

cuy? condición de primer orden es

P. = ~vs + ~(ab + Cb). (3.2:6)"

Por lo tanto, si el comprador utiliza una estrategia lineal, la mejor respuestadel vendedor también es lineal. Si las estrategias lineales de los jugadoreshan de ser mejores respuestas la una a la otra, (3.2.5) implica que Cb = 2/3

2 1Pb = 3"Vb + 3"as.

"-; .:r.,:,,,: •.,;_._~_

Por lo tanto, si el vendedor utiliza una estrategia lineal, la mejor respueSt'á'del comprador también es lineal. Análogamente, supongamos. qtieJa.estrategia del comprador es Pb(Vb) = ab + CbVb. Entonces, P~ está üiUforrne.:-mente distribuido en [ab,ab + Cb], por lo que (3.2.4) se convierte en

(3.2.4)

V.x

Figura 3.2.1

x

16Ll ! JUEGOS ESTÁTICOS CON INFOI{,'"IAClÓN INCOMPLETA (e. 3)

Vb

Intercamqio

donde E[psCuJlpb 2':f'JuJJ es el precio esperado que pedirá el vendedor,condicionado a que lo que pida sea menor que el precio ]lb ofrecido por elcumprador. Para cada Vs en [0,1], J!s(Vs)es una solución de

donde E[Pb(Vb)lpb(Vb) 2':PsJ es el precio esperado que ofrecerá el compra-dor condicionado a que lo que ofrezca sea mayor que el precio Ps que pideel vendedor.

Existen muchísimos equilibrios bayesianos de Nash de este juego.Consideremos, por ejemplo, el siguiente equilibrio de precio único enel cual el intercambio ocurre a U!l único precio si es que ocurre. Paracualquier valor de x en [0,1], sea la estrategia del comprador ofrecer xsi Vb 2': x y ofrecer cero en cualquier otro caso, y sea la estrategia delvendedor pedir x si Vs ::; x y pedir uno en cualquier otro caso. Dada laestrategia del comprador, las posibilidades del vendedor se concretan enun intercambio a x o en que no haya intercambio, por loque la estrategia

------------------------------------------------------_ .•

v,

Apl icnCÍollcs / 163

V,= v,v, = v, + 0/4)

Figura 3.2.3

Intercambio

v,

Comparemos las figuras 3.2.1 y 3.2.3 (las descripciones de los paresde valoraciones para los cuales el intercambio aCUITeen los equilibriosde precio único y simétrico respectivamente). En ambos casos se da elintercambio posible más valioso (concretamentev. =OYVh.,= 1), Pero alequilibrio de precio únicó le faltanalgunos intercambiosyaliosos (cornov. == O Y Vh = X - E, dónde E, es pequeño, y logra ,algunos intercambiosque casi no valen nada (como v. = x - E Y Vh = X +.E). Por el contra~io,al equilibrio lineal le faltan todos los intercambios que casi no valen riadapero logra todos los intercambios de valor al menos 1/4. Esto sugiereque el equilibrio lineal puede dominar los equilibrios de precio únicoen términos de las ganancias esperadas de los jugadores, pero tambiénplantea la posibilidad de que los jugadores pudieran estar incluso mejoren un equilibrio alternativo.

Myerson y Satterthwaite (1983) demuestran que, para distribucionesuniformes de las valoraciones como las consideradas aquí, el equilibriolineal consigue ganancias esperadas mayores que ningún otro equilibriobayesiano de Nash en subasta doble (incluyendo equilibrios múltiples).Esto significa que no existe un equilibrio bayesiano de Nash en subastadoble tal que el intercambio ocurra si y sólo si es eficiente (es'decir, si y.sólo

(3.2.7)

V" Vb

3/4

3/4

Figura 3.2.2

1/4

p"p,

Recordemos que el intercambio en ia subasta doble se da si y sólo siPh ~ P •. Manipulando (3.2.7)y (3.2.8) se demuestra que el intercambioocurre en el equilibrio lineal si y sólo si Vh ~ V. + (1/4), como muestral~ figura 3.2.3. (De acuerdo con esto, la figura 3.2.2 revela que, para lostIpos del vendedor por encima de 3/4, se realizan demandas por encimade la oferta más alta del comprador Pb(l) = 3/4, Yque para los tipos delvendedor por debajo de 1/4 se realizan ofertas por debajo de la oferta másbaja del vendedor, P. (O) = 1/4.)

1

2 1p,,(v.) = 3v., + "4

como muestra la figura 3.2.2.

y

y CLb = CLs /3, y (3.2.6) implica que Cs = 2/3 Yas = (ab + Ch) /3. Por lo tanto,las estrategias de equilibrio lineal son

162/ JUEGOS ESTÁTlCOS CON INFORMACIÓN INCOMPLETA (c. 3)

".'

";.¡.J' ,

lb4 / JUEGOS ESTÁTICOS CON INFOI<iVIACIÓN INCOMPLETA (e. 3)

si /lb 2: ti..). También demuestran que este último resultado es muy general:SiUb está distribuida de forma continua en [Xb,YbJ y 'u" está distribuida deforma continua en [:l:s,ys], donde Ys > Xb e Yb > x" no existe ningún juegode negociación al que quisieran jugar el comprador y el vendedor quetenga un equilibrio bayesiano de Nash en el que el intercambio ocurra siy sólo si es eficiente. En la próxima sección vamos a indicar cómo puedeutilizarse el principio de revelación para demostrar este resultado general.Concluimos esta sección aplicando este resultado al modelo de empleo deHall y Lazear: si la empresa tiene información privada sobre el productomarginal m del trabajador y el trabajador tiene información privada sobreuna oportunidad alternativa ti, no existe ningún jÚe'gode negociación quela empresa y el trabajador quisieran jugar que 'produZca empleo si y sólosi es eficiente (es decir, si y sólo si m2: v).

3.3 El principio de revelación

El principio de revelación, debido a Myerson (1979) en el contexto delos juegos bayesianos (yen otros en contextos relacionados), es Un ins~trumento importante para diseñar juegos cuando los jugadores tieneninformación privada. Puede aplicarse a los problemas de las subastasy del intercambio bilateral descritos en las dos secciones anteriores, asícomo a una amplia gama de problemas. En esta sec~ión enunciamos ydemostramos. el principio de revelación para juegos bayesianos estáticos.(La extensión de la demostración' a juegos bayesianos dinámicos es in"mediata.) No obstante, antes de hacerlo, vamos a indicar cómo se utilizael principio de revelación en los problemas de subastas y de intercambiobilateral. '

Consideremos un vendedor que quiere diseñar una subasta que ma-ximice sus ingresos. Sería una ardua tarea detallar todas y cada una de lasdiferentes subastas posibles. En la subasta dela sección ;3,2.B, por ejemplo,el participante que puja más alto paga al vendedor y consigue el biensubastado, pero existen muchas otras posibilidades. Los participantes,por ejemplo, pueden tener que pagar una entrada, De forma más general,algunos de los participantes que pierden pudieran tener que pagar dinero,tal vez en cantidades que dependan de sus pujas y de las de los demás.También podría el vendedor establecer un precio de reserva, un preciomínimo por debajo del cual no se aceptaran pujas. De forma más general,puede existir cierta probabilidad de que el vendedor se quede con el bien

El principio de revelación / 165

o de que éste no siempre vaya a quien puje más alto. Afortunadamente,el vendedor puede utilizar el principio de revelación para simplificarconsiderablemente este problema de dos maneras. En primer lugar, elvendedor puede limitar su atención a la siguiente clase de juegos:

1. Los participantes hacen declaraciones (posiblemente falsas) sobre sustipos (es decir, sus valoraciones). El jugador ipuede declarar ser cual-quier tipo Ti del conjunto Ti de posibles tipos de i, independientementede cuál sea el verdadero tipo i, k

2; Dadas las declaraciones de los participantes (TI,' .. ,Tn), el jugadoriofrece Xi(Tlt .. "Tn) y recibe el bien subastado con probabilidad qih,. .. ,Tn). Para cada posible¡;ombinación de declaraciones h,...,Tn),lasuma de las probabjlidades ql (TI,' , . ,Tn) + ". + qn(Tl," .,Tn) debe sermenor o igual a uno.

Los juegos de esta clase (es decir, los juegos estáticos bayesianos en loscuales la única acción del jugador es hacer una declaración sobre su tipo)se llaman mecanismos directos.

La segunda manera en la que el vendedor puede utilizar el princi-pio de revelación es limitando su atención a los mecanismos directos, enlos cuales decir la verdad constituye un equilibrio bayesiano de Nashpara cada participante, es decir, a l¡¡s funciones de oferta y de proba-bilidad {Xl (TI", . ,Tn),. ,. ,Xn(Tl,' .. , Tn); ql (TI,' .. ,Tn), ... ,qn(Tl,'", taun)}

tales que la estrategia de equilibrio de cada jugador isea declarar Ti (t;) =ti

para cada ti en n.Un mecanismo directo en el cual decir la verdad cons-tituye un equilibrio bayesiano de Nash se llama de incentivos compatibles.

Fuera del contexto del diseño de una subasta, el principio de reve-lación puede seguir siendo utilizado de estas dos maneras. Cu~lquierequilibrio bayesiano de Nash de un juego bayesiano puede representarse<;:onun nuevo equilibrio bayesiano de Nash en un nuevo juego bayesianoadecuadamente escogido, en el cual por "representado" queremos decirque para cada posible combinación de tipos de los jugadores (tit ... ,tn),

las acciones y las ganancias de los jugadores en el nuevo equilibrio sonidénticos a los del equilibrio original. IÍtdependientemente de cuál sea eljuego original, el nuevo juego bayesiano es siempre un mecanismo directo;independientemente del equilibrio original, el nuevo equilibrio siempreconsiste en decir la verdad. De manera más formal:

r,:".'.

',':

,".

.. :..

.'

166/ JuEGOS ESTÁTICOS CON INFORMACIÓN INCOMPLETA (c. 3)

Teorema. (El principio de revelación). Cualquier equilibrio bayesiano deNash en un juego bayesiano puede representarse mediante un mecanismo directode incentivos compatibles.

En la subast~ analizada en la sección 3.2.B supusimos que las valótació-' .. 'nes de los párticipantes eran independientes entre sÍ. Tambiénsupusitnos ;;(de forma implícita en la definición de las valoraciones de los partiCipan-tes) que conocerla-valoraCión del jugador j no éambiaria la valoracÍóiÍ.deljugador i (aunque tal con~chniento cart1biarianormalment~ la puja de i).Caracterizamos estos dos supuestos diciendo que los participantes tienenvalores privadóseindep~ndientes. Eh'este caso, Myerson (1981)deter-'mina quémecaÍüsmos directús"HénehUh ecjirilibrio de decirlaveidadycuáles de estos equilibrios maximizan la ganancia esperada del vendedor.El principio de revelación garantiza entonces qué no hay otra subasta conun equilibrio bayesiano de Nash que proporcione al vendedor una ga-. nancia esperada más alta, puesto que el equilibrio de tal subasta habríasido representado por un equilibrio de decir la verdad de un mecanismodirecto; y ya consideramos todos los mecartisr'nq~directos de incentivoscompátibles. TambIén déinuestra'Mye~son que el equilibrio bayesia~o d~Nash simétrico de la subasta analizada en la sección 3.2.B es equivalentea este equilibrio de decir la verdad maximizador de la ganancia (como losequilibrios simétricos de otras conocidas subastas).

tomo seglindoejemplo derprin~ipio derevelació.n, consideremos elproblema del ii1tercambiobilateral descrito en la sección 3.2.C. Allí ana~lizamos Unjuego 'de 'intercambio entre un comprador y un vehdJdor, hísubasta doble. En ese juego; si había iiüercarnbio; el comprador pagaba alvendedor,'mientras CJuesino; no había pagó; sin embargo existehmuchasotras posibilidádes.Podriá. haber pagos (del comprador al vendedor oviceversa) incluso sin intercambio, y la probabilidad de un intercambiopodriaestar estrictamente entre cero,yuno. También, la regla para deter-minar si va haber intercambio podría exigir que la oferta del compradorfuera mayor que la demanda del vendedor en una cierta cantidad (posi-tiva o negativa); dicha cantidad podría incluso variar dependiendo de losprecios anunciados por las partes.

Podemos capturar estas posibilidades considerando la siguiente clasede mecanismos directos: el comprador y el vendedor realizan simultánea-mente declaraciones sobre sus tipos, Tb y T.., tras lo cual el comprador pagaal vendedor x(Tb,TB), que puede ser positivo o negativo, y el compradorrecibe el bien coh probabilidad q(Tb,Ts)' Myerson y Satterthwaite deter-

El principio de revelació" / 167

minan qué mecanismos directos tienen un equilibrio de decir la verdild.Luego imponen la restricción de que cada tipo de cada parte quiera juga.r(esdecir, que cada tipo de cada parte tenga una ganancia esperada en eqUl-librio no inferior a la ganancia que ese tipo podría conseguir negándosea jugar, concretamente cero para cada tipo de compra~or y is para eltipo de vendedor tB). Finalmente, demuestran qu~ en n1l1gl1l10de estosmecanismos directos de incentivos compatibles, el mtercambJO se da conprobabilidad uno si y sólo si el intercambio es eficiente .. El.~rincipio ~erevelación garantiza entonces que no hay juego de negOClaClonque qUJe-ranseguir el comprador y el vendedor que tenga un equilibrio bayesianode Nash en el cual se dé el intercambio si y sólo si es eficiente.

Para dar un enunciado formal y una demostración del principio de re-velación, consideremos el equilibrio bayesiano de Nash s' = (si, ... ,s;,) enel juego bayesianoestático G = {Al,'" ,An; TI,' .. ,Tn;Pl,'" ,Pn;nI, ... ,un}'Vamos a construir un mecanismo directo con un equilibrio de decir laverdad que represente s*. El mecanismo directo adecuado es un juegobayesiano estático con los mismos espacios de tipos y de conjeturas queG,pero con nuevos ~spacios de acciones y nuevas funciones de ganancias.Los nuevos espacios de acciones son simples. Las acciones. factibles deljugador i en el mecal1ismo directo son declaraciones (posiblemente falsas)sobre sus posibles tipos. Es decir, el espacio de acciones del jugador i esTi. Las nuevas funciones de ganancias son más complicadas. Dependenno sólo del juego original G, sino también del equilibrio original en dichojuego, s". La idea crucial es utilizar el hecho de que s" es un equilibrioen G para garantizar que de<:irla verdad es un equilibrio del mecanismodirecto, como vemos a continuación.

Decir que s" es un equilibrio bayesiano de Nash de G, significaque para cada jugador i, s; es la mejor respuesta de i a las estrate-mas (s" s" s~ s") de los demás ]'ugadores. Más concretamente,0& '1""/ t-1' 'l+l,""'npara cada uno de los tipos ti en Ti de i, S;(ti) es la mejor acción de A¡que puede elegir i, dado que las estrategias de los otros jugadores son(si, ... ,s:_l ,s:+l' ... ,s~). Por tanto, si el tipo de i es tú y permitimos ai ele-gir una acción de un subgrupo Ai que incluye .5; (ti), entonces la elecciónóptima de i sigue siendo 3;(ti), suponiendo de nuevo que las estrategiasde los otros jugadores son (si, ... ,.5;_1,3;+" ... ,s~). Las funciones de ga-nancias en el mecanismo directo se eligen para confrontar a cada jugadorcon una elección exactamente de esta clase.

Definimos las ganancias en el mecan.isIl1odirecto sustituyendo lasdeclaraciones de tipos de Jos jugadores en el nuevo juego T = (TI, ... ,Tn)

Ejercicios I 169

3.4 Lecturas adicionales

Myerson (1985)ofrece una introducción más detallada a los juegos baye-sianos, el equilibrio bayesiano de Nash y al principio de revelación.Consúltese McAfee y McMillan (1987) para un examen de la literaturasobre subastas, incluyendo una introducción a la maldición del ganador.Bulow y J(lemperer (1991)extienden el modelo de subastas de la sección3.2.Bpara dar una interesante explicación de los pánicos y de los hundi-mientos racionales en los (digamos) mercados de valores. Sobre el em-pl~opajo información asimétrica consúltese Deere (1988),quien analiza unmodelo dinámico en el cual el trabajador va encontrándose con distintaseIIlpresa,s~ lo largod~l tiempo, cada una con su propio productonÍ.argmalconocido de fOrmé:lprivada. Para aplicaciones del principio de revelaciónc~nsúltese Baron:y Myerson (1982) sobre la regulación de un monópoliocon costes desconocidos, H¡¡rt (1983) sobre los contratos implícitos y elparo inyolunté:lrioySappington (1983) sobre la teoría de la agencia.

',.o',

"1',

".,/

\

\ ..

3.3Consideremos el siguiente modelo de duopolio de Bertrand con infor-mación asimétrica y productos diferenciados. La demanda que se dirigea la empresa 'í es qi(P'¡,Pj) = a - Pi - bi . Pj. Los costes son cero para ambas

3.2 Consideremos un duo polio de Cournot que opera en un mercado condemanda inv~rsa P(Q) = a - Q, donde Q = qI + q2 es la cantidad agregadaen el mercado. Ambas empresas tienen unos costes totales de Ci(qi) = Cqi,

pero la demanda es incierta: es alta (a = aA) con probabilidad O y baja(a. = aB) con probabilidad 1-0. Además, la información es asimétrica. Laempresa 1 sabe si la demanda es alta o baja, pero la empresa 2 no lo sube.Todo esto es información del dominio público. Las dos empresas eligenc~tidades,simultáneamente. ¿Cuáles son los espacios de estrategias delé:l~.g:ps'empresas? Háganse supuestos sobre aA, aB, e y C de manera quetodas las cantidades de equilibrio sean positivas. ¿Cuál es el equilibriobayesiano cieeste juego?

3.1 ¿Qué es un juego bayesiano estático? ¿Qué es una estrategia (pura)en tal juego? ¿Qué es un equilibrio bayesiano de Nash (con estrategiaspuras) en dicho juego?

35 Ejercicios

W3 / JUEGOS EST..\'"ICOS CON INFORMACiÓN INCOMPLETA (e. 3)

Concluirnos esta sección (y la demostración del principio de reve-'lación) demostrando que decir la verdad es un equilibrio bayesiano deNash de este mecanismo directo. Al declarar ser del tipo Ti de T¡, el juga~dar i está en efecto escogiendo tornar la acción si'(Ti)deA¡. Si todos los,demás jugadoresdicen la verdad, están efectivamente jugando las estr¡¡te-'gias (si" .. ,s:_¡,s~+I'" . ,si)' Pero discutirnos anteriormente que si jueganesas estrategias, cuando el tipo de ies ti la mejor acción que puede elegir .¡-.es ,st(t¡), 'Por tanto, si los otros jugadores dicen la verdad, cuando el tipo dei sea t, elmejor tipo del que se puede declarar seres ti. Esdecir, decir laver~dad es un equilibrio. De un modo más formal, jugar la estrategia de decir laverdad T¡(ti) = ti para cada t.¡ en T¡ es un equilibrio bayesianode Nash del."juego bayesiano estático {TI," .,Tn;11, ... , Tn;PI," ',Pn;v¡, ... ,vn} paracada jugador i.

Sé que ustedes ya conocen sus tipos y que van a jugar elequilibno s' del juego G. Pero perIl1ítanme que lespre-sente un nuevo juego, un mecanismo directo: En primerlugar, cada uno de ustedes fírn;.ará un contrato que mepermita a mí dictar la acción que tornarán ruando jugUe-mos e.En segundo lugar, cada uno de ustédes escribirá-' .una declaración sobre su tipo Ti y me la entregará~ Segui'-.damente utilizaré la declaración del tipo de cada uno déustedes en el nuevo juego, Ti, junto consúestfategia 'de ,;equilibno en el juego original, si, para ca1culiir-;'l~acciónque habrían elegido en el equilibrio s' si su tipo fueraverdaderamente Ti, concretamente si (T¡). Finalmente, de-terminaré que cada uno de ustedes torne la acción quehe calculado, y recibirán las ganancias resultantes (quedependerán de estas acciones y de sus tipos verdaderos).

en las estrategias deequilibrio del juego original, 8*, Yluego sustituyendolas acciones resultantes en el juego original 8*(T) = (sih), ... ,:5~(Tn» enlas funciones de ganancias del juego original. Formalmente, la función deganancias de .í es

donde t = (t¡, ... ,tn). Se podría pensar que estas ganancias se dan porqueun observador imparcial se acerca a los jugadores y pronuncia el siguientediscurso:

cara 1,-1 -1,1

cruz -1,1 1,-1

170/ JUEGOS ESTÁTICOS CON INFORMACIÓN INCOMPLETA (c. 3) Ejercicios /171

~;'j:SCónsidérese al comprador y al vendedor de la subasta doble analizada. en la sección 3.2.C como una empresa que conoce el producto marginal 111.

'del trabajador y un trabajador que conoce su oportunidad alternativa 7),

como en Hall y Lazear (1984), En este contexto, un intercambio significaq~El~l.tralJaj<\~orestá empleado por la empresa, y el precio al cual las;part~' negoCian es el salario del trabajador w. Si se da el intercambio,.,la ganancia de la empresa es m ~ w, y la del trabajador es w; si no hay\,4itercambio, la ganancia de la empresa es cero y la del trabajador v.. Supongamos que m y v son obtenidos independientemente segú n Ulla, distribución uniforme en [0,1] como en el texto. Con fines comparativos,ii;tálCúlense las ganancias esperadas de los jugadores en el equilibrio lineal

:'',de la subasta doble. Ahora consideremos los dos juegos de intercambio'siguientes como alternativas a la subasta doble.

""r"l,'.; . ¡liega 1: Antes de que las partes conozcan su información privada,\:fitman un contrato aceptando que si el trabajador es empleado por laempresa, su salario será w, pero también que cualquiera de las partes

:':puede romper la relación de empleo sin coste alguno. Después de quelas partes conocen los respectivos valores de su información privada,

,~núncian simultáneamente si aceptan el salario 1)) o si lo rechazall, Sih':'áI;ól:5osanunCian que 10 aceptan, hay intercambio; si no, no, Dado 1.111

\ valor de v arbitrario en [0,1], ¿cuál es el eqtlilibrio bayesiano de Nash de

HáIlese un equilibrio bayesiano de Nash con estrategias puras del juego.':',::.' correspondiente con información incompleta tal ql~e, conforme la 111[0:-

;;i,;o,lIlación incompleta desaparece, la conducta de los Jugadores el: :1 ~qU1-";"',',:•.'UbriObayesiano de Nash tienda a su comportamIento en eJ.~qu¡Jlbno ele;¡(:"Nash con estrategias mixtas del juego original con mformaclOn completa,

3.6Consideremos una subasta de sobre cerrado al primer precio en la cuallas valoraciones de los participantes están distribuidas de forma indepen-. diente y uniforme en [0,1]. Demuéstrese que si hay n participantes, la""'¡<tr"t~giade Plljar (n - l)/n veces la propia valoración es un equilibrio•.~"yesiano de Nash simétrico..~; . - ,

..tl~'f;'.~"

r$.7Cbnsideremos una subasta de sobre cerrado al primer precio en la cual'.ias:va10iacionesde los participantes están distribuidas indénticamente y':deJorma independiente según la densidad estrictamente positiva !(-u;) en;10;11~Calcúlese un equilibrio bayesiano de Nash simétrico para el caso de"'dos partiCipantes ."\ ..: .

ID'-

A 0,0 á,oB 0,0 2,2

Juega2 ....

1 j)

A 1,1 0,0

B 0,0 0,0

Juega 1

3.5 Recordemos de la Sección 1.3 que el juegode las monedas (un juegó'.estático con información completa) no tiene equilibrios de Nash cori'és~..trategias puras; pero' tiene un 'equilibrIo de Nash con estrategias' 'Iílixhis;':';cada jugador elige cara con probabilidad 1/2 ..

Jugador 1

3.4 Hállense todosJos. equilibrios bayesianos de Nash con esrrategiaspras en el siguiente juego bayesiano estático: .

Jugador 2cara cruz

empresas. La sensibilidad de la demanda de la empresa 'i al precio de laempresa j es o alta o baja. Es decir, bi es o bA o bB, donde b,4. > bE > O.Para cada empresa, bi = bAcon probabilidad IJ y b¡ '" bB con probabilidad. -'1 - IJ, independientemente de bj• Cada empresa conoce su propio biPe!6.,.no el de su competidora. Todo esto es información del dominio públiF '¿Cuáles son los espacios de acciones, espacios de tipos, conjeturas y fUn~ciones de utilidad en este juego? ¿Cuáles son los espacios de estrategias!.¿Qué condiciones definen un equilibrio bayesiano de Nash simétncú'é'8Restrategias puras de este juego? Hállese dicho equilibrio .. "

1. El azar determina si las gananCias son Comoen' el juego 1 o como, 'erjuego 2, siendo cada juego igttalmenfeprobable.,

2. El jugador lse entera de si el ázarhaescógidoel jUego! o el 2, per.el jugador 2';0. ,. '" . .

. 3. El jugador. 1 elige A oB; simultáneamente el jugador 2 elige Do 1.4. Las ganancias son las que se dan en el jueg¿<lu~.deterrhiná'éiaár:;.'¡

','

172/ JUEGOS ESTÁTICOS CON INFORMACiÓN INCOMPLETA (c. 3)

este juego? Dibújese un diagrama análogo a la figura 3.2.3 mostrando lospares de tipos para los que hay intercambio. Hállese el valor de 'lO quemaximiza la suma de las ganancias esperadas de los jugadores y calcúleseesta Suma.

[llego 2: Antes de que las partes conozcan su información privada,firman un contrato aceptando que el siguiente juego dinámico se utilizarápara determinar si el trabajador se une a la empresa y, si lo hace, conqué salario. (Estrictamente hablando, este juego pertenece al capítulo4. Vamos a adelantamos al capítulo 4 aduciendo que este juego puederesolverse combinando las lecciones de este capítulo con las del capítulo 2.)Una vez que las partes conocen los respectivos valores de su información.privada, la empresa elige un salario 'lO que ofrece al trabajador, salarioque el trabajador acepta o rechaza. Analícese este juego utilizando elprocedimiento de inducción hacia atrás, tal como hicimos en la sección2.1.A con los juegos análogos de información completa. Dados 'lO yv, ¿quéhará el trabajador? Si la empresa prevé lo que hará el trabajador, dado m¿qué hará la empresa? ¿Cuál es la suma de las ganancias esperadas de losjugadores?

3.6 Referencias

BA1<ON,D., Y R. MYERSON.1982. "Regulating a Monopolist with UnknownCosts." Econometrica 50:911-30.

BULOW,J., y P. KLEMPERER.1991. "Rational Frenzies and Crashes." Stan-ford University Craduate School of Business Research Paper #1150.

CHATTERjEE,K., Y W. SAMUELSON.1983. "Bargaining under IncompleteInformabon." Operations Research 31:835-51.

DEmE, D. 1988. "Bilateral Trading as an Efficient Auction over Times."[ol/rIlal of Political Economy 96:100-15. .

HALL,R., Y E. LAZEAR.1984. "The Excess Sensitivity of Layoffs and Quitslu Demand." [ournal of Labor Econ01nics 2:233-57.

HARSANYI,J. 1967. "Cames with Incomplete Information Played by Ba-yesian Players Parts 1 II and I1I."Management Science 14:159-82, 320-34~486-502.

Referencias / 173

_. 1973. "Carnes with Randomly Disturbed Payoffs: ANew Rationale forMixed Strategy Equilibrium Points." International ¡oumal of Game TheonJ2:1-23.

HART,O. 1983. "Optimal Labour Contracts under Asymmetric Informa-tion." Review of Economic Studies 50:3-35.

McAFEE, P. y J. McMILLAN. 1987. "Auctions and Bidding." ¡oumal ofEconomic Uterature 25:699-738.

MYERSON,R. 1979. "Incentive Compatability and the Bargaining Problem."Econometrica 47:61-73.

-. 1981. "Optimal Auction Design." Mathematics of Operations Research6:58-73~

-. 1985. "Bayesian Equilibrium and Incentive Compatibility: An I.ntro-duction." In Social Goals and Social Organization. L.Hurwicz, D. Schmeldler,y H. Sonnenschein, eds. Cambridge: Cambridge University Press.

MYE~N, R., Y M. SATTERHWAlTE.1983. "Efficient Mechanisms for Bila-teral Trading." ¡oumal of Economic Theory 28:265-81.

SAPPINGTON,D. 1983. "Limited Liability Contracts between Principal andAgent." ¡oumal o/ Economic Theory 21:1-21.

~3•

4. JUEGOS DINÁMICOS

CON INFORMACIÓN INCOMPLETA

En este capítulo presentamos un concepto más de equilibrio, el equilibriobayesiano perfecto, con lo que tenemos cuatro conceptos de equilibrio encuatro capítulos: el equilibrio de Nash en los juegos estáticos con infor-mación completa, el equilibrio de Nash perfecto en subjuegos enlos juegosdinámicos con información completa, el equilibrio bayesiano de Nash enlos juegos estáticos con información incompleta y el equilibrio bayesianoperfecto en los juegos dinámicos con información incompleta. Podría pa-recer que nos inventamos un nuevo concepto de equilibrio para cada clasede juegos que estudiamos pero, de hecho, estos conceptos de equilibrioestán estrechamente relacionados. A medida que vamos considerandojuegos más completos, vamos reforzando el concepto de equilibrio paraexcluir los equilibrios poco verosímiles que sobrevivirían en los juegosmás ricos si aplicáramos los conceptos de equilibrio adecuados a los jue-gos más simples. En cada caso, el concepto de equilibrio más poderosodifiere del más débil sólo en los juegos más ricos, no en los más simples;

En particular, el equilibrio bayesiano perfecto es equivalente al equili-brio bayesiano de Nash en ios juegos estáticos con ,información completa,equivalente al equilibrio de Nash perfecto en subjuegos en los juegosdinámicos con información perfecta y completa (yen muchos juegosdinámicos con información perfecta pero incompleta, entre los que seincluyen los que hemos discutido en las secciones 2.2 y 2.3) y equivalenteal equilibrio de Nash en los juegos estáticos con información completa.

El equilibrio bayesiano perfecto se inventó para refinar (es decir, parareforzar los requisitos de) el equilibrio bayesiano de Nash, del mismomodo que elequilibrio de Nash perfecto en subjuegos refina el equilibriode Nash. Igual que introdujimos la perfección en subjuegos en juegosdinámicos con información completa porque el equilibrio de Nash nocapturaba la idea de que las amenazas y promesas debían ser creíbles,ahora limitamos nuestra atención al equilibrio bayesiano perfecto en jue-

176 I J¡;ECOS OINÁ,\IICOS CON I.\iFOR,\'/ACláN L\iCOMPLETA (e. 4)

gas dinámicos con información incompleta porque el equilibrio bayesianode Nash presenta el mismo inconveniente. Recordemos que si las estra-tegias de los jugadores han de formar un equilibrio de Nash perfectoen Subjuegos, no sólo deben formar un equilibrio de Nash en el juegocompleto, sino también constituir un equilibrio de Nash en cada sub-juego. En este capítulo reemplazamos la idea de Subjuego por la ideamás general de juego de continuación, que puede comenzar en cualquierconjunto de información (ya sea de un único elemento o no), y no sólo enconjuntos de información con un único elemento. A continuación proce-demos por analogía: si las estrategias de los jugadores tienen que formarun equilibrio bayesiano perfecto, no sólo deben Constituir un equilibriobayesiano de Nash para el juego completo, sino también constituir unequilibrio bayesiano de Nash en cada juego de continuación.

En la sección 4.1 presentamos de modo informal las principales ca-racterísticas de un equilibrio bayesiano perfecto. Para ello, adoptamostemporalmente una segunda perspectiva (complementaria) que cambiael énfasis anterior: el equilibrio bayesiano perfecto refuerza los requisitosdel equilibrio de Nash perfecto en Subjuegos analizando explícitamentelas conjeturas de los jugadores, Comoen un equilibrio bayesiano de Nash.Esta segunda perspectiva surge porque, siguiendo a Harsanyi (1967),des-cribimos un juego con información incompleta como si fuera un juego Coninformación imperfecta; el azar revela el tipo del jugador i a i pero no a i,por 10que j no conoce la historia completa del juego. Por lo tanto, un Con-cepto de equilibrio diseñado para reforzar el equilibri~ bayesiano de Nashen los juegos dinámicos con información incompleta puede también re-forzar el equilibrio de Nash perfecto en subjuegos en los juegos dinámicoscon información completa pero imperfecta.

En la sección 4.2 analizaremos la cla?e de juegos Con información in-completa aplicada con más frecuencia: los juegos de seiialización. Enunciadode un modo abstracto, un juego de señalización consta de dos jugadores(uno Con información privada, el otro sin ella) y dos rondas (primero unaseñal enviada por el jugador informado y después una respuestaadop_tadapor el jugador desinformado). La idea clave es que la comunicaciónpuede darse si un tipo de jugador informado quiere enviar una señal quesería demasiado cara de enviar por parte de otro tipo. En primer lugardefiniremos el equilibrio bayesiano perfecto en juegos de señalización ydescribiremos los distintos tipos de equilibrios (que corresponden a dis-tintos grados de comunicación, entre cero y completa) que pueden existir.A continuación consideraremos el modelo original de señalización en el

__ eM@_!.O!' ~!i!!!E'!!!!!'!'!!'!' :t,"""'~ ..""__.••••••••.••••• •._. ."_

Introducción al equilibrio bayesúl/lO pertixto I 177

do de trabaJ'ode Spence (1973) el modelo de inversión empresarialmerca , '.de Myers y Majluf (1984) y el modelo de política monetana de Vlckers(1986).

En la sección 4.3 describiremos otras aplicaciones del equilibrio ba-yesiano perfecto. Comenzaremos c0r:. el. an~~isis de juegos con parloteo(cheap-talk games) (es decir, juegos de sena1JZacJOnen los cuales los mensa-jes no cuestan nada), entre cuyas aplicac.ion~sse incluyen 1.asamenazas d~to Presidencial a las decisiones del legIslativo norteamencano, los anunve . .

cios de política por parte de la autoridad monetaria y las comurucaclOnes(o "voz") en las organizaciones. En los juegos con parloteo, el ~cance dela comunicación se determina por los intereses comu~es de los Ju~adoresmás que por los costes de las señales de los diferentes tipos. EstudIaremo~a continuación el modelo de negociación sucesiva de Sobel y Takahashi(1983), en el cual una empresa debe tolerar una huelga para den:ostrarque no puede permitirse pagar salarios más .altos.(cfr. el.mo~elo ge ne-gociación con información completa de Rubmstem que mclwmos en la

" 2 1 D en el cual las huelgas no se dan en equilibrio). Finalmente,secclOn . . , . .. .exploraremos la explicación clásica de Kreps, Milgrom, ~~bert~ y WIlson(1982)del papel de la reputación en el logro de la coopera~~~ raCJOnale~,eldilema de los presos repetido finitamente (cfr. la proposlclon en ~asecCloIl2.3.A concerniente al único equilibrio de Nash perfecto en subJueg~s .deun juego repetido finitamente basado en un juego de etapa con un m:1COequilibrio de Nash). .:,

En la sección 4.4 volveremos a la teoría. Aunque es la sección finaldel libro, sirve para indicar lo que podría venir a continuacióIl.~~ql.!~como culminación de los temas analizados. Allí describireII10se¥ustra-remos dos refinamientos (sucesivos) del equilibrio bayesiano perfecto, elsegundo de los cuales es el criterio intuitivo de Cho y Kreps (1987).

4.1 Introducción al equilibrio bayesiano perfecto

Consideremos el siguiente juego dinámico con información :ompleta peroimperfecta. En primer lugar, el jugador 1 elige en~e tres acclO~es,~,CyD.Si el jugador 1 elige D, se acaba el juego sin que Juegue el 2. 51el Jugador1 elige 1 o C, el jugador 2 se da cuenta de que D no ha sido .elegida,(per?no de si ha sido elegida lo C) y entonces elige entre dos aCCIOnes,1 y D ,tras lo cual se termina el juego. Las ganancias se muestran en la formaextensiva de la figura 4.1.1.

Una manera de reforzar el concepto de equilibrio para excluir el equi-. d Nash perfecto en subJ'uegos (D D') de la figura 4.1.1 es imponerlibno e ' ,

los dos requisitos siguientes:

. Introducción ,,1 c'1'lÍliIJl'io bayesiallo perjó)" I liCJ

"t 1 En cada conj'unto de inFormación el j'ugador que decide debeRequISl o . ' J' ' .formarse una conjetura sobre el nodo del conjunta ~te injorm,aclón al que se 1mllegado en el juego. Para un conjunto de 111f~,:maclOncon mas de un ele1l1:/lfO,una conjetura es una distribución de probabl11dad sobre los nodos del conju/ltode infonnación; para un conjunto de información con un único. el:mento, laconjetura del jugador asigna probabilidad uno al único nodo de declslO11.

Requisito 2. Dadas sus conjeturas, las estrategias de los jugado~~s deben ~~,.sucesivamente racionales. Es decir, en cada conjunto de mformaclOn, la aCClO1l

tomada por el jugador al que le toca tirar y su estrategia subsiguie~te debense.róptimas, dada la c01fjetura del jugador en ese conjunto d~ informaclOn y las :llbSl,~guientes estrategias de los demás jugadores (donde una estra.tegla subslg,Ulentees un plan de acción completo que cubre cada contmgencla que podna darsedespués de haberse alcanzado el conjunto de información).

. En la figura 4.1.1, el requisito 1 significa que si el juego alcanza elconjunto de información con más de un elemento del jugador 2, éste debeformarse una conjetura sobre el nodo que se ha alcanzado (o, de formaequivalente, sobre si el jugador 1ha jugado 1 o C).Esta conjetura serepresenta con las probabilidades p y 1 - p ligadas a los nodos relevilntesen el árbol, como muestra la figura 4.1.3.

.Dada la conjetura del jugador 2, la ganancia esperada porjugar D' esp. 0+(1 - p).l = 1 - p, mientras que la ganancia esperada por jugar j' esp.1 + (1- p) .2 = 2 - p. Puesto que 2 - p > 1 - p para cualquier valor

". de p, el requisito 2 hace que el jugador 2 no elija D'. AsÍ, basta con exigir_. que cada jugador tenga una conjetura y actúe óptimamente de acuerdo

con ella para eliminar el equilibrio inverosímil (J],D') eneste ejemplo., Lo~requisitos 1 y 2 insisten en que los jugadores se formen conjeturas

:y,actú~n de forma óptima según éstas, pero no que estas conjeturas sean'tazonables,.Para imponer requisitos adicionales a las conjeturas de losjt1gadót~s; distinguimos entre conjuntos de información que están en latrayectoria de equilibrio y los que están fuera de la trayectoria de equili-brio. ,.

.,:'1:';'

.."í.

13

O1

.:.:J:"

O2

2,1 0,0

0,2 0,1

1,3 1,3

o'O

1

Jugadorl' C

D

21

Jug~dor 2

l' D'

'o

178 I JUEGOS, PINA1v[jCO~ CON INFORMACIÓN INCOMPLETA (C 4)

"Figura 4.1.1

UtiÍiza~d¿ la rep!esent~ci6n'enfonnan9pnal de este juego4ad~~la figura 4.1.2, observ~mq~ que existen~().seqüi1ibrios deNash con estra:;:tegias puras, (1,1') y (D,D'), r~rá(ieterminat SI estos equiiibri~;'dé ],{f;hson perfectos en subjuegos utiHz!Ull0slarepresentación en {antia e~t~ri~

'. ' "",' ,'" , , ", 'jl'!'siva para definir los subjuegos del juego. Puesto que un' juego ,esdefÍr{j~9.,de modo que comienza en, un nodo de decisión, que no es ~ás que~~:conjunto deinformación cbn un único elemento (aunque no es eipri~EJ-,n~do de decisión del jueg()), el juego'delafigura Ü.l no tiene subjuég~~~"SI un juego no tiene subjuegos, el r~q,uisitode perfección en subjuegos(~o~cretamenteque las estrategias dé' los jugadores c~mstituyan un equi~hbno de Nash en cada subjuego) se cumple de forma trivia( Por tan£o:encualquierjuego que no tenga subjuegos la definición de equilibrio de.Nash perfec~á en subjuegosles equivalenté a la definición de equilibriocl~Nash, por lo que en la figura 4.1.1 tanto (1,!') como (D,D') son equilibrios'de Nash perfectos en subjuegos. No obstante, (D,D') depende claramented,euna amen,aza que nó resultacreíble: si llega el tumo del jugador 2,jugar1 domma a Jugar D', por 10que el jugador 1 no debería verse inducido ajugar D por la amenaza d;l jugador 2 de jugar Di si llega a mover.

,;~~

Ii"

o

180 ! JUECOS DINÁ,VIICOS CON INFORMACIÓN INCOMPLETA (c. 4)

\~ ..'

'.' .

,'.

,,''-.'

Introducción al equilibrio bayesiano perfecto / 181

1 Kreps y Wilson formalizan esta perspectiva de equilibrio definiendo el equililJrio secuencial,un concepto de equilibrio equivalente al equilibrio bayesiano perfecto en muchas aplicacioneseconómicas, pero en algunos casos algo más restrictivo, El equilibrio secuencial es máscomplicado de definir y aplicar que el equilibrio bayesiano perfecto, por lo que la mayoría delos autores ahora utilizan este último. Algunos se refieren (de modo impreciso) al concepto deequilibrio que aplican corno equilibrio secuencial. Kreps y Wilson muestran que en cualquierjuego finito (es decir, cualquier juego con un número finito de jugadores, tipos y jugadasposibles) existe un equilibrio secuencial. Esto significa que en cualquier juego finito existe unequilibrio bayesiano perfecto.

2 Para dar una idea de las cuestiones que no son tratadas por los requisitos 1 a 4, supon-gamos que los jugadores 2 y 3 han observado los mismos acontecimientos y a continuaciónambos observan una desviación del equilibrio por parte del jugador 1. En un juego con infor-mación incompleta en el cual el jugador 1 tiene información privada, ¿deberían los jugadores2 y 3 formarse la misma conjetura sobre el tipo del jugador 1? En un juego con informacióncompleta, ¿deberían los jugadores 2 y 3 formarse la misma conjetura sobre las decisiones pre-vias no observadas del jugador 1? De modo similar, si los jugadores 2 y 3 han observado losmismos acontecimientos y entonces el jugador 2 se desvia del equilibrio, ¿debería el jugador3 cambiar su conjetura sobre el tipo del jugador 1 o sobre las decisiones no observadas deljugador 1?

3 Fudenberg y TIrole (1991) dan una definición formal del equilibrio bayesiano perfectopara una amplia clase de juegos dinámicos con información incompleta. Su definición tratacuestiones como las que hemos planteado en la nota 2. Sin embargo, en los juegos simplesanalizados en este capítulo. estas cuestiones no se plantean, por lo que su definición es equiva-lente a los requisitos 1 a 4; Fudenberg y TIrole ofrecen condiciones bajo las cuales su equilibriobayesiano perfecto es equivalente al equilibrio sucesivo de Kreps y Wilson.

sino que ahora también incluye una conjetura para cada jugador en cadaconjunto de informaciÓn en el que el jugador tenga que jugar.1 La ventajade hacer explícitas las conjeturas de los jugadores de esta manera es que,igual que en capítulos anteriores insistimos en que los jugadores eligenestrategias creíbles, ahora podemos insistir en que se forman conjeturasrazonables, tanto dentro de la trayectoria de equilibrio (en el requisito 3)como fuera de ésta (en el requisito 4 que sigue y en otros de la sección 4.4).

En aplicaciones económicas simples, que incluyen el juego de seña-lización de la sección 4.2.A y el juego con parloteo de la sección 4.3.A,los tres requisitos no sólo capturan el espíritu del equilibrio bayesianoperfecto, sino que también constituyen su definición. Sin embargo, enaplicaciones económicas más complejas, se necesita imponer másrequisi-tos con objeto de eliminar equilibrios inverosímiles. Distintos autores hanutilizado. diferentes definiciones del equilibrio bayesiano perfecto. Todaslas definiciones incluyen los tres requisitos; algunas también incluyen elrequisito 4 y algunas imponen requisitos adicionales.2 En este capítulotomamos los requisitos 1 a 4 como definición del equilibrio bayesianoperfecto.3

13

o1

o2

Figura 4.1.3

R "equl~Ito 3. En conjuntos de infonnación sobre la trayectoria de equilibriolas conJ~turas se determinan de acuerdo con la regla de Bayes y las estrategias d;eqllllzbrzo de los jugadores.

Definición. Para un equilibrio dado en un cierto juego en fionna extensivc' t d . fi ',. , . . a, unollJun o e In onnaclOn esta en la trayectoria de equilibrio si' se . 1, '. b b Td d . . a canzaLOI/.pro.a 1 I a positiva cuando .el juego se desarrolla según las estrategias de~qullzbrlO, ~ fuera de la trayectorza de equilibrio si es seguro que no se alcanzaLlllmdo el Juego se desarrolla según las estrateO"Ías de equilibrio (donde u .•11' " " . . ó' ,equI-1mo. puede significar equilibrio de Nash, perfecto en subjuegos, bayesiano olmyeslano perfecto).

'. Por ejemplo, e~ el equilibrio de Nash perfecto en subjuegos (1,1') de lafigur~ 4.?.3, la conjetura del jugador 2 debe ser p = 1: dada la estrategia deeqUIhbno del jugador 1(concretamente 1),el jugador 2 sabe qué nodo se haal~anz~~o en el conjunto de información. Como una segunda ilustración(lupotetica) del requisito 3, supongamos que en la figura 41 3 . t'u Tb . . . eXls leran eqUl I no en estrategias mixtas en el cual el J'ugador 1 ele£in'a 1

Pr b bT d d . o. cono ~. I 1 a ql, e con probabilidad q2 y D con probabilidad 1- q -' El

requisito 3 obligaria a que la conjetura del jugador 2 fuera p = q /~q ~. ).Los tr . '. 1 1 q2

es reqUlsItos capturan el espíritu de un equilibrio bayesianoperfecto. La nueva característica crucial de este concepto de eqw'll'b .debe Kr . no se

a eps y Wllson (1982): en la definición de equilibrio las conJ'etur~& )'1 u.. va.n a 11lve de importancia de las estrategias. FormalmenteeqUIlIbno ya no consiste simplemente en una estrategia para cada jugad:

L'

L

2

A

1

Figura 4.1.5

Introducción ni equilibrio bnycsinno perfccto / 183

Ahora consideremos las estrategias (L,!,!') junto con la conjetura p =O. Estas estrategias constituyen un equilibrio de Nash; ningún jugadorquiere desviarse unilateralmente. Estas estrategias Yla conjetura tambiénsatisfacen los requisitos 1 a 3; el jugador 3 tiene una conjetura y actúade forma óptima con respecto a ésta, y los jugadores 1 y 2 actúan deforma óptima dadas las estrategias subsiguientes de los otros jugadores.Pero este equilibrio de Nash no es perfecto en subjuegos, porque el únicoequilibrio de Nash del único subjuego del juego es U,D'). Por tanto,los requisitos 1 a 3 no garantizan que las estrategias de los jugadoresconstituyan un equilibrio de Nash perfecto en subjuegos. El problema esque la conjetura del jugador 3 (p = O) es inconsistente con la estrategiadel jugador 2 (l), pero los requisitos 1 a 3 no imponen restricciones ala conjetura de 3 porque el conjunto de información de 3 no se alcanzasi el juego se desarrolla según las estrategias indicadas. No obstante, elrequisito 4 fuerza a que la conjetura del jugador 3 esté determinada porla estrategia del jugador 2: si la estrategia de 2 es I, la conjetura debe ser

l a 3, También satisfacen de forma trivial el requisito 4, puesto queno existe ningún conjunto de información fuera de esta trayectoria deequilibrio, por lo que constituye un equilibrio bayesiano perfecto.

2OO

O11

L

O12

A

2

-,,} .. _---

Figura 4.1.4

121

, Sería por supuesto útil enunciar el requisito 4de un modo má 'eVItando la vaga instrucción "donde sea posible" L h s preCISO,una d 1 r ' . o aremos en cada

Peas ap lCaClOneseconómicas analizadas en las siguientes se 'or ahora utir l'" CClOnes.. Izaremos os Juegos de tres jugadores de las ti ras 4 1 4~~.5 para Ilustra: y fundamentar el requisito 4. (Dearriba abafc:se indi~a~pagos de los Jugadores 1, 2 Y3 respectivamente.)

182 / JUEGO ' ' -5 DINA.\IICOS CON INFOR,\IACláN INCO~II'LET,\ re .•)

Requisito 4. En conjuntos de información f/lera de la tral/eeto' t '¡'b 'las eOn¡dl d na [e eqru 1 no, Iras se eterminan según ¡a regla de Bll1¡es y ¡as ' t' t ' d 'Jugadores donde sea posible, - es la egzas e los

Definición U '¡'b . b¡duras que s'at n¡, equl¡1 no .ayesiano perfecto consiste en estrategias y eon-

lS aeen os requIsItos 1a 4.

Este juego ti b' ,con un ún' tne un su Ju~go: comIenza en el conjunto de informacióneste sub' ICOe emento ~el Jugador 2. El único equilibrio de Nash en

Juego entre los Jugadores 2 3 (1 D'equilibrio de Nash e . y es , ), por lo que el únicoEstas estrate 'as 1p rfe:to en subJuegos del juego completo es (A,!,D').

g¡ Y a conJetura p = 1 del jugador 3 satisfacen los requisitos

,

,••)•••1

••)

184/ JUEGOS DlNÁ,\;lICOS CON INFORMACIÓN INCOMPLETA (e. 4)

p = 1; si la estrategia de 2 es D, la conjetura de 3 debe ser p = O. Pero sila conjetura de 3 es p = 1, el requisito 2 fuerza a que la estrategia de 3 seaD', con lo que las estrategias (L,1,1') y la conjetura p = Ono satisfacen losrequisitos 1 a 4.

Como segunda ilustración del requisito 4, supongamos que la figura4.1.4 se modifica como muestra la figura 4.1.5. El jugador 2 dispone ahorade una tercera acción po~ible, L' que termina el juego. (Para simplificarignoramos las ganancias' en este juego.) Como antes, si la estrategia deequilibrio del jugador 1 es L, el conjunto de información del jugador 3 estáfuera de la trayectoria de equilibrio, pero ahora el requisito 4 puede nodeterminar la conjetura de 3 a partir de la estrategia de 2. Si la estrategiade 2 es L', el requisito 4 no pone restricciones en la conjetura de 3, pero sila estrategia de 2 es jugar 1 con probabilidad q¡, D con probabilidad q2 y£' con probabilidad 1 - ql - q2, donde ql + q2 > O,el requisito 4 dicta quela conjetura de 3 sea p = q¡j(q¡ + q2).

Para concluir esta sección, relacionamos de modo informal el equili-brio bayesiano perfecto con los conceptos de equilibrio presentados en loscapítulos anteriores. En un equilibrio de Nash, la estrategia de cada juga-dor debe ser una mejor respuesta a las estrategias de los otros jugadores,por lo que ningún jugador elige una estrategia estrictamente dominada.En un equilibrio bayesiano perfecto, los requisitos 1 y 2 equivalen a exigirque la estrategia de ningún jugador esté estrictamente dominada comen-zando en cualquier conjunto de información. (Véase la :;ección 4.4 parauna definición formal de dominancia estricta comenzando en un conjuntode información.) El equilibrio de Nash y el equilibrio bayesiano de Nashno comparten esta característica en conjuntos de información situadosfuera de la trayectoria de equilibrio, como los conjuntos de informaciónque no están contenidos en ningún subjuego. El equilibrio bayesiano per-fecto tapa estos agujeros: los jugadores no pueden amenazar con jugarestrategias estrictamente dominadas al comienzo de cualquier conjuntode información fuera de la trayectoria de equilibrio.

Como indicamos anteriormente, una de las virtudes del concepto deequilibrio bayesiano perfecto es que hace explícitas las conjeturas de losjugadores para imponer no sólo los requisitos 3 y 4, sino también otrosrequisitos (sobre conjeturas fuera de la trayectoria de equilibrio). Puestoque el equilibrio bayesiano perfecto no permite que el jugador'í juegue unaestrategia estrictamente dominada comenzandQ en un conjunto de infor-mación fuera de la trayectoria de equilibrio, tal vez no sea razonable queel jugador j crea que el jugador 'Í jugará tal estrategia. Sin embargo, puesto

Jllegos de señalización / 185

que el equilibrio bayesiano perfecto hace que las conjeturas de los juga-dores sean explícitas, este equilibrio no puede reconstruirse procediendohacia atrás en el árbol del juego, como hicimos para construir el equilibriode Nash perfecto en subjuegos. El requisito 2 determina la acción de unjugador en un conjunto de información.dado basado en parte en la con-jetura del jugador sobre dicho conjunto de información. Si el requisito 3o el requisito 4 se aplican a este conjunto de información, determinan laconjetura del jugador a partir de las acciones de los jugadores situadosmás arriba en el árbol. Pero el requisito 2 determina las acciones situadasmás arriba en el árbol, basándose en parte en las estrategias subsiguientesde los jugadores, incluyendo la decisión en el conjunto de informaciónoriginal. Esta circularidad implica que una sola pasada ha~a atrás a lolargo del árbol (normalmente) no es suficiente para calcular un equilibriobayesiano perfecto.

4.2 Juegos de señalización

4.2.A Equilibrio bayesiano perfecto en juegos de señalización

Un juego de señalización es un juego dinámico con información completay dos jugadores: un emisor (E) y un receptor (R). El desarrollo del juegoes el siguiente:

1. El azar escoge un tipo ti del conjunto de tipos factibles T = {tI,' .. ,tI}

que asigna al siguiente emisor según una distribución de probabilidadp(t;), donde p(ti) > Opara cada i y p(tl) + ... + p(tI) = 1.

2. El emisor observa ti y elige un mensaje mj del conjunto de mensajesfactibleslv! = {mI,' .. ,m}}.

3. El receptor observa mj (pero no ti) y elige a continuación una acciónUk de un conjunto de acciones factibles A = {al" .. ,aK}.

4. Las ganancias vienen dadas por UE(ti,mj,ak) y UR(ti,mj,ak).

En muchas aplicaciones, los conjuntos T, M Y A son intervalos de larecta real, en lugar de conjuntos finitos como los considerados aquí. Esinmediato permitir que el conjunto de mensajes factibles dependa del tipoque determina el azar, y que el conjunto de acciones factibles dependa delmensaje que envía el emisor.

, '!li.r'

, 'Jt(_rJ

\

(

\((

J'

";',

'. ,1: .~.

:- - .:.'

186 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)

Los modelos de señalizacion han sido aplicados extensamente en elanálisis económico, Para indicar la diversidad de posibles aplicacionesmterpretamos brevemente la estructura formal en 1-4 en términos de lastres aplicaciones que serán analizadas en las secciones 4.2.B,4.2.C y 4.2.0.

En el modelo de señalización en el mercado de trabajo deSpence (1973)elemisor esun trabajador, el receptor es elmercado de posibles empresarios, el tipo es la capacidadproductiva del trabajador, el mensaje es la elección' delnivel de educaci9n.c;leltrabajador yla acción es el salario

,pagado Eorel mercado. '" ".

En el modelo deinversiórtempresarial y estruc~radecapital de Myers y Majluf (1984),el emisor es una empresaque necesita capital para financiar WInuevo proyecto, elreceptor es un inversor potencial; el tipo es la rentabilidadde los activos existentes de la empresa, el mensaje es laoferta de una participación en él beneficio de la empresaa cambio de financiación y lélacción es la decisión de siinvertir ano por parte del inversor.

E~ algunas aplicaciones, un juego de señaliza~ió~.f9rm~parte de un juegomas complejo. Por ejemplo, el receptor pódría tóÍri~r~udé'cisióll antes deque el emisor eligiese el mensaje en la segunda ~f~pa y~'elemisor podríatornar su decisión después de que el receptor tomase la suya en la etap~ 3(o simultáneamente). ,

En el modelo de política monetaria de Vickers (1986), laautoridad monetaria posee información privada sobre suvoluntad' de aceptar inflación para aumentar el nivel deempleo pero, por lo demás, el modelo es una versión en ,',dos etapas del juego 'repetido con información completadel modelo analizado en la sección 2.3.E.Así, el emisor esla autoridad monetaria'. el receptor es la patronal, el tipo lavoluntad deja autoridad monetaria de aceptar una ciertainflación para aumentar el nivel de empleó, el mensaje laelección deja inflación en elprimer periodo por parte delaautoridad monetaria y la acción la expectativa de inflaciónen el segundo periodo' por parte de los empresarios. La

Juegos de SeJllllizIlCi,ill / 187

expectativa de inflación por parte de los empresarios pre-cede al juego de seii.alización, y la elección de la autoridadmonetaria de inflación en el segundo periodo la sigue,

En el resto de esta sección analizarnos el juego de seii.alización abs-tracto dado en 1 a 4, más que estas aplicaciones. La figura 4.2.1 ofreceuna representación en forma extensiva (sin ganancias) de un caso simple:T == {tlh}, NI == {ml,m2}, A. == {o.l,o.2}YProb{t] } == p. Nótese que el juegono se desarrolla desde el nodo inicial en la parte superior del árbol hastalos nodos terminales en la parte inferior, sino desde una jugada inicialéiéterminada por el azar en mitad del árbol hasta los nodos terminales enlos extremos izquierdo y derecho.

Emisora, a,

m, t, m,

:a, ¡J a, ~

'•.,,

Receptor Azar Receptor,,

1 - ¡J, a,a,

m, t, m,ai

a,

Emisor

Figura 4.2.1

Recordemos que (en cualquier juego) la estrategia de un jugador es unplan de acción completo; una estrategia detalla una acción factible paracada contingencia en la cual el jugador pudiera tener que actuar. Por lotanto, en un juego de seii.alización, una estrategia pura del emisor es unafunción m(ti) que especifica qué mensaje elegirá para cada tipo que elazar pueda detemIinar, y una estrategia pura del receptor es una funcióno.(mj) que especifica qué acción elegirá ante cada mensaje que .el emisorpueda enviar. En el juego simple de la figura 4.2.1, tanto el emIsor comoel receptor cuentan con cuatro estrategias puras.

188/ JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)

Estrategia 1 del emisor: Jugar mI si el azar determina t] y jugar m] si elazar determina t2.

Estrategia 2 del emisor: Jugar m] si el azar determina t] y jugar m2 si elazar determina t2.

Estrategia 3 del emisor: Jugar TI12si el azar determina t] y jugar m] si elazar determina t2' '

Estrategia 4 del emisor: Jugar m2 si el azar determina t] y jugar m2 si elazar determina t2.Estrategia 1 del receptor: Jugar a] si el emisor elige m] y jugar a] si elemisor elige m2.

Estrategia 2 del receptor: Jugar a] si el emisor elige m] y jugár ai si elemisor elige m2. . ,

Estrategia 3 del receptor: Jugar a2 si el emisor elige m] y jugar a] si elemisor elige m2.

Estrategia 4 del receptor: Jugar a2 si el emisor elige m] y jugar a2 si elemisor elige m2.

Llamamos a las estrategias primera y cuarta del emisor de agrupación,porque cada tipo envía el mismo mensaje, y a la segunda y a la tercera deseparacióll, porque cada tipo envía un mensaje diferente. En un modelocon más de dos tipos también existen estrategias de agrupación parcial (o desemi-separación) en las cuales todos los tipos en un determinado conjuntode tipos envían el mismo mensaje, pero diferentes conjuntos de tiposenvían mensajes diferentes. En el juego con dos tipos de la figura 4.2.1existen estrategias mixtas análogas llamadas estrategias hfbridas, en lascuales (digamos) t] juega m] pero t2 escoge aleatoriamente entre m] Y'1112.

Ahora traducimos los enunciados informales de los requisitos 1, 2 Y3de la sección 4.1 a una definición fOfilal del equilibrio bayesiano perfectoen un juego de señalización. (La discusión sobre la figura 4.1.5 implica queel requisito 4 es vacuo en un juego de señalización.) Para simplificar lascosas, limitamos nuestra atención a las estrategias puras; las estrategiashn)ridas se discutirán brevemente en el análisis de la señalización en elmercado de trabajo de la próxima sección, Dejamos como ejercicio ladefinición del equilibrio bayesiano de Nash en un juego de señalización(véase el ejercicio 4.6).

Puesto que el emisor conoce la historia completa del juego cuandoelige un mensaje, esta elección se da en un conjunto de información conun lÍnico elemento. (Existe un conjunto de información de esa clase paracada tipo que el azar pudiera determinar.) Por tanto, el requisito 1es trivial

Juegos de selialización / 189

cuando se aplica al emisor. El receptor, por el contrario, elige una accióndespués de observar el mensaje del emisor pero sin conocer el tipo de éste,por lo que la elección del receptor se da en un conjunto de información conmás de un elemento. (Existe un conjunto de información de esa clase paracada mensaje que pudiera elegir el emisor y cada uno de estos conjuntos deinformación tieneun nodo para cada tipo que pudiera haber determinadoel azar.) Aplicando el requisito 1 al receptor obtenemos:

Requisito 1 de. señalización. Después de observar cualquier mensajemj d~M, el receptor der~formarseuna conjetura sobre,qué tipos. podrían haberenVÚld~rn. Denotelrios'esta conNttira con la distribucióii de probabilidad¡¡(tilmjt d¡j~4e, .

J .' .' ... ' ....•. ... .' . .. . ....' , .,' '.'¡¡.(t;lmj)~Opara"cádati'im T y'" "

L ¡¡.(t¡jmj) = 1.tiET

Dados el mensaje del emisor y la conjetura del receptor, es inme~iat?caracterizar la acción óptirrúl del receptor. "Aplicando el requisito','f::il:!-

,.' "T'-, '.,;--:;,'.~t 'receptor obtenemos: ", /~:

Requisito fR de señalización. Para cada mj en NI, la acción del receP-!tor a*(mj) debe maximizar la utilidad esperada del receptor dada la conjetura¡¡.(tdmj) sobre qué tipos podrían haber enviado "mj. Es decir, a*(mj) es unasolución de

El requisito 2 también se élplica al emisor, pero éste tieneinf0:mac;:ióncompleta (y por tanto una conjetura trivial), y además decide sorament~al principio del juego, por lo que el requisito 2,e~ simplemen~e que laestrategia del emisor sea óptima dadala estrategia dé! receptor:

Requisito2E <leseñalización. Para cada ti enT: elmensaje del emisor m* (ti)debe maximizar la utilidqd del emisor d,qda la estrategia del receptor a*(mj). Esdecir, m~(ti) es una solución de

,'.'.','

Juegos de se¡1alízaóólf / IlJ 1

Si la estrategia del emisor es de agrupación o de separación, llamamosal equilibrio de agrupación o de separación, respectivamente.

Concluimos esta sección hallando los equilibrios bayesianos perfectosen estrategias puras en el ejemplo con dos tipos de la figura 4.2.2. Nóteseque cada tipo tiene las mismas posibilidades de ser elegido al azar; utíli-zam<?s(p,l _ p) y (q,1 - q) para denotar las conjeturas del receptor en sus

dos conjuntos de información.Los cuatro posibles equilibrios bayesianos perfectos con estrategias

puras de este juego con dos mensajes Ydos tipos son: (1) Agrupación enIi (2) AgrUpación en Di (3) Separación con tl eligiendo J Y t2 eligiendoD,y (4) Separaclón con tl eligiendo D Y t2 eligiendo J. A continuación

analizamOs estas posibilidades.1. Agrupación en J. Supongamos que hay un equilibrio en el cual

la estrategia del emisor es U,!), donde (mi ,-m") significa que el tipo 1.1elige m' Yel tipo t2 elige mil. Entonces, el conjunto de información delreceptor que corresponde a J está en la trayectoria de equilibrio, por lo quela conjetura del receptor (p,l - p) en este conjunto de información vienedeterminada por la regla de Bayes y la estrategia del emisor: p = 0,5, quees la distribución a priori. Dada esta conjel1.lra(o cualquier otra conjetura),la mejor respuesta del receptor que sigue a J es elegir a, de manera que105 tipos del emisor tl y t2 alcanzan ganancias de 1y 2respectivanlPnte.Para determinar si ambos tipos del emisor quieren elegir J, necesitamosestablecer cómo reaccionaría el receptor a D. Si la r~spuesta del receptora D es a,el pago al tipo ti por elegir D es 2, 10 que es mayor que el pagode 1que recibe por elegir J. Pero si la respuesta del receptór a D es b,h Y t2 alcanúm unas ganancias de ° y 1 respectivamente por elegir D,mientras queson de 1y 2 respectivamente por elegir J. Por lo tanto, siexiste Ufl equilibrio en el cual la estrategia deleÍnisor es U,I), la respuestadel receptor a D debe ser b, de manera. que la estrategia del receptor debeser (o.,b), donde (e' ,e") significa que el receptor elige c' después de r ye" después de D. Queda por considerar la conjetura del receptor en elconjunto de información correspondiente a D y la optimalidad de elegirb dada esta conjetura. Puesto que elegir 1) es óptimo para el receptorpara cualquier q S 2/3, tenemos que [U,J),(o.,b),p == 0,5,q] es un equilibriobayesiano perfecto de agrupación para cada q S 2/3.

2. Agrupación en D. A continuación supongamos que la estrategiadel emisor es (D,D). Entonces q = 0,5, de manera que la mejm respuestadel receptor a D esb, obteniéndose unas ganancias de ° para l., y 1 pnrat2. Pero ti puede conseguir 1 eligiendo J, puesto que la mejor respuesta

P(ti)

E.p(ti) .t,ET,

190 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

~inalmente, dada la estrategia del emisor m*( , 'tipos que envían el mensaje m Es de' t t.), sea Tj el conjunto deT

jsi m*(l) = m. S' T 'J' , ,Clr, .i es un elemento del conjunto

, J' 1 j no esta vaclO, el con' t d . .,rrespon,diente al mensaJ'e t' 1 Jun o e mformaclOn co-

mj es a en a trayect 'd '"contrario ningu'n tl'PO' , ona e eqUIlIbno; en caso, enVla m. por lo qu 1 .correspondiente está fu d' 1 J' , e e conjunto de información

era e atrayectona de e Tb'en la trayectoria deequI'll'b' 1 l' . , qUI1 no, Para mensajesno¡ a ap IcaClondel .. 3del receptor resulta en: reqUISIto a las conjeturas

Requisito 3 de seíialización. Para cada m.' " ' .n:*(t

i) .~ mj, la c01"ijetu;adel re¿;'ton;n el'cé/: en M, s~ eXIste t~/n Ttal que

dIente a mj debe derivarsed . l P¡, d' . yunto de tnformaclOn correspon-e a reg a é B~yes y la estrategia del emisor: '

, ' -

Definición, Un equilibrio bayesiano erfi t .'. .juego de señalización consiste en ," dP ec o ,CO~l estrategIas puras en un

con' t unpar eestrategzasm*(t')ya*(m)je ura ¡At 1m ) . fi 'j ,yen una

(3). ' 'J que satls acen los requisitos de señalización (1), (2R), (2E) Y

/.'

".

'.\

":, >

;': "

'\.

",

i','

':.

",

,',,'-,

4 La presencia de dos empresas en el papel del receptor deja este juego ligeramente fuerade la clase de juegos analizada en la sección previa; pero véase la discusión que precede a la

ecuación (4.2.1).5 Formalmente, suponemos que trabajadores con alta capacidad sbn más productivos (es

decir, y(A,e) > 'y(I3,e) para toda e), y que la educación no reduce la productividad (es decir,Ye(TI,e) ~ Opara cada 'TIy cada e, donde ye('r¡,e) es la productividad marginal de la educaciónpara un trabajador de capacid"d TI con una educación e).

3. Dos empresas observan la educación del trabajador (pero no su capa-cidad) y entonces le hacen ofertas salariales de forma simultánea.

4

4. El trabajador acepta la oferta salarial más alta, lanzando una monedaen caso de empate. Sea -w el salario que acepta el trabajador.

Las ganancias son las siguientes: -w - c('I),e) es la del trabajador, dondec(r¡,e) es el coste en el que incurre un trabajador con capacidad '1) paraobtener una educación e; y(r¡,e) - -w es la de la empresa que emplea altrabajador, donde y(r¡,e) es la producción de un trabajador con capacidadr¡ qu~ ha ot>!enido una educación e; y cero es la de la empresa que noempleaal trabajador.

Vamos a centramos (aquí en cierto modo y más en la sección4.4) en unequilibrio bayesiano perfecto en el cual las empresas interpretan la edu-cación como una señal de capacidad y, en consecuencia, ofrecen un mayorsalario al trabajador con más educación. La ironía del trabajo de Spence(1973) es que los salarios pueden aumentar con la educación incluso si laeducación no tiene efecto alguno sobre la productividad (es decir,irIclusosi la producción del trabajador con habilidad r¡ es y(r¡), independiente-mente de e). El trabajo de Spence (1974) generaliza el argumento al irIcluirla posibilidad de que la producción aumente no sólo con la. capacidad,sino también con la educación; la conclusión análoga es entonces que lossalarios aumentan con la educación más de lo que puede explicarse porel efecto de la educación en la productividad. Seguimos este enfoque más

general.sEs un hecho bien establecido que los salarios son mayores (en pro-

medio) para los trabajadores con más años de escolaridad (por ejemplo,véase Mincer [1974]). Este hecho invita a irIterpretar la variable- e comolos años de escolaridad. En un equilibrio de separación podríamos pen-sar que un trabajador con capacidad baja tiene una educación de gradomedio y que un trabajador con capacidad alta tiene una educación uni-versitaria. Desgraciadamente, interpretar e como los años de escolaridadplantea cuestiones dinámicas que no tratamos en el juego simple en 1--4,como la posibilidad de que una empresa haga una oferta salarial después

¡Liegos de señalización / 1931)12¡JUEGOS DINÁMICOS CON INFOI~IVI~C10'N I';CO -'- "tvIPLETA (e. 4)

del receptor a [, es a para cualquier valor de ) l 'equilibrio en el cual el " j y, por o tanto, no eXIsteun

emISOrJuegue (D,D).

3. Separación con elección de I or a '.la estrategia de separación U D) l Pd P rte de tI' SI.el emIsor eligereceptor están en la tra t ~ :1' os os conjuntos de información del

yec ona l e equilib . lse delenl1inan por la regl d BIno, por o que las conjeturasy I} '" O Las' a e ayes y a estrategia del emisor: p '" 1a y b res~ectiva::~;:s drespuestas del receptor a dichas conjeturas _son

, ' ,e manera que ambos tipos del' .ganancias de 1 Qued . emIsor,conSIguendada la estrat~gia de~por compr(obar sIla estrategia del emisor es óptima

receptor a b) No lo es' si - l tieligiendo I en lugar de DI' . . e po t2 se desvía,e receptor responde con 1una ganancia de 2 ' , a, con o que t2 recibeelegir D. ' que es mayor que la ganancia de 1 que recibe t2 al

4. Separación con elección de D or d .estrategia de separació (D I) 1 ~ parte e tI' SI el emisor elige la(/ _ 1 d ' n, ,as conjeturas del receptor deben ser p - O- , e manera que la mejo dI' - y

consiguen unas ganancias d: r;s~~esta e re~eptor .e~(a,a) y ambos tiposreaccionaría con a'la g . ci tI s~ deSVIaraelrgIendo 1, el receptorincentivo para qu~ 1 s:r;nCl~ de t

D]sena ent~nces de 1,c,on lo que no hay

eSVIe e Del rrusmo mod . t d 'de D, el receptor reaccio' . 1 ' o, SI 2 se esviaranana con a' a ganancia de t '1, con lo que no existe' .' 2 sena entonces de[(D,I),Ca,a),p = O _ 1] mcent1vo p.ar~ que t2 'se desvíe de l. Por lo tanto,

,q - es un eqUIlIbno bayesiano perfecto de se ' .,paraclOn.

4.2.B Señalización en el mercado de trabajo

La enorme literatura sobre' d _. . ,de S ' Juegos e senalrzaclOn comienza con el model

fpence (1973), que precedIÓ tanto ala amplia utilización dI' o

orma extensiva para des 'b' bl e os Juegos encn Ir pro emas económic lde conceptos de equilib . 1d '" os como a a definición

no como e e eqUIlrbno bayesiano perfectoEn esta s " ._ eCClOnreplanteamos el modelo d S '.

lorma extensiva y luego d 'b' l e pence como un Juego enescn IrnOSa gunos de sus 'l'b' b -perfectos' en la s . , .- ,eqm 1 nos ayesianosba .' _ eCClOn4,.4aplrcaremos un refinamiento del eq 'I'b .'yesIano perlecto a est' El m 1 noe Juego. desarrollo temporal es el siguiet:lte:

1. El azar determin 1 .puede ser o alta ~; ~?~Cl~)d rOdUCtiv~ ~e un trabajador, 1), la cual

2. El' aja . a probabIlIdad de que 1) = A es q.trabajador averigua 'd d 'cación e ~ O.' su capacI a y entonces elige un nivel de edu-

(:;:"____________________ ..J••.•

w,:""r

194 I JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

del primer aúo de universidad de un trabajador (es decir, después deque un trabajador de baja capacidad haya terminado sus estudios peroantes de que uno de alta capacidad lo haya hecho). En un juego máscomplejo el trabajador podría elegir cada aúo si aceptar la mejor ofertadel momento o volver a estudiar otro aúo. Noldeke y Van Damme (1990)analizan un juego más rico en esta línea demostrando que: (i) hay muchos .equilibrios bayesianos perfectos; (ji) después de aplicar un refinamientoestrechamente relacionado cbn el que aplicaremos en la sección 4.4, sólouno de estos equilibrios sobrevive, y (iii) este equilibrio que 'sobrevive esidéntico al único.equilibrio del juegosimple en 1,-4 quesobrevive despuésde aplicar el refinamiento de la sección. 4.4, ..Por lo tanto, podriamos in-terpretar vagamente e como los años deescoiaridad enel juego simple en1,-4, porque los resultados son lbs mismos. en el juego más rico.

En su lugar; vamos a evitar estas cuestiones dinámicas interpretandolas diferencias en e como diferencias en la calidad del rendimiento de unestudiante, 110 como diferencias én la d~ración de la escolaridad de dichoestudiante. Por tanto, ei juego en t-4 podría aplicarse a un grupo deestudiantes que han. terminado los estudios mediO,s~esdecir, trabajadorescon doce años.de educación exaCtamente) o.a tUl grupo de Íicenciadosuniversitarios, o a un grupo de estudiantes con un máster en dirección deempresas. Bajo esta interpretación, e mide el número y el tipo de asigna-:.turas estudiadas y las notas y premios conseguidos durante un programaacadémico de duración fija. Los costes de la enseñanza (si existen) son en-tonces independientes de e, de manera que la función de costes c(7],e) midelos costes no monetarios (o psíquicos): estudiantes cón una capacidadmás baja encuentran más difícil conseguir notas altas en una institucióndeterminada, y tainbién más difícil conseguir las mismas notas en unainstitución más competitiva. Así, la utilización de la educación por partede la empresa como señal, refleja el hecho de que las empresas contratany pagan m~s a los mejores estudiantes de una institución determinada ya los estudiantes de las mejores instituciones.

El supuesto crucial en el modelo de Spence es que los trabajadoresconpoca capacidad encuentran la señalización más cara que los trabajadorescon capacidad más alta. De un modo más preciso, el coste marginal dela educación es más alto para trabajadores de baja capacidad que para losde capacidad alta: para cada e,

fuegos de sClia/ización /195

donde Ce (''I,e) denota el coste marginal de la educación de un trabajador decapacidad 7] y educación e.Para interpretar este supuesto consideremosun trabajador con educación el al que se le paga un salano 11J], comomuestra la figura 4.2.3,y calculemos el aumento salarial que sería necesariopara compensar a este trabajador por un aument~ eneducac~ónde el ae2. La respuesta depende de la capacidad del trabajador: tra~~Jado:'~sconcapacidad baja encuentran más difícil adquirir una educaClon adlCJonal,or lo que requieren un aumento salarial más alto (hasta IJ)B en lugar de~ólo hasta WA) para compensarles por ello. La interpretación gráfica deeste supu.esto e~q}le}s~ trabajadores con capacidad baja tienen c:Jrvas deindiferencia '~óii.'mayorpendiente que los trabajadores con capaCIdad alta(compáresej~ co~ IAenlafigura). .

IRlA

::.••••••••••••••••••••••••••.v~.

Figura 4.2.3

También supone Spence que la competencia entre las empresas haráque los beneficios esperados sean cero. Una forma de incorporar estesupuesto a nuestro modelo sería sustituyendo las dos empresas en laetapa (3) por un único jugador llamado mercado que hace una oferta .s~-larial únic'a w y que recibe la ganancia -[Y(T7,e) - w]2 (Esto cOl1vertmael modelo en uno de la clase de juegos de señalización con un receptordefinidos en la sección anterior.) Para maximizar la ganancia esperadil,

, "

'".'

'-:

,',

,,':,:,e')

(';,; },

y(A,e)

y(B,e)

e

y(n,e)

Juegos de señalización / 197

Curvas deindiferenciapara capacidad n

e*(iz)

Figura 4.2.4

e*(B) e'(A) e

Figura 4.2.5

w

w

w*(B)

w*(A)

Ahora volvemos (deforma permanente) al supuesto de que la capaci-dad del trabajador es información privada. Esto abre la posibilidad d~que.un trabajador con capacidad baja pueda tratar de pasar por un trabaJa~orde capacidad alta. Pueden plantearse dos casos. La ~gura 4.2.5des~nbeel caso en el que le resulta demasiado caro a un trabajador con capacIdadbaja adquirir una educación e*(A), incluso si esto permitier~ engaña~ a lasempresas y hacer que le pagaran el salario w*(A). Es deCIr,en la figura4.2.5, w*(B) - c[B,e*(B)] > w*(A) - c[E,e*(A)].

lA

(4.2.1)w(e) = ¡.L(Ale) . y(A,e) + [1 - ¡.L(Ale)] . y(E,e),

donde ¡.(.4Ie) es la probabilidad que el mercado asigna a que la capacidaddel trabajador sea A. El propósito de tener dos empresas compitiendoentre ellas en la etapa (3) es conseguir el mismo resúlta.dosm '~t::~mr a.un jugador ficticio llamado mercado. Sin embargo, pará g.arimftzar quelas empresas siempre ofrezcan un salario igual al produétoesperado deltrabajador, necesitamos imponer otro supuesto: tras observar la elecciónde educación e, ambas empresas se forman la misma conjetura sobre lacapacidad del trabajador, nuevamente denotada por ¡.L(Ale). Puesto quee! requisito 3 de señalización determina la conjetura que ambas empre-sas deben formarse después de observar la elección de e que está en latrayectoria de equilibrio, nuestro supuesto es realmente que las empresastambién comparten una misma conjetura tras observar la elección de e queestá fuera de la trayectoria de eqlúlibrio. Dado este supuesto, ~e deduceque en cualquier equilibrio bayesiano perfecto ambas empresas ofrecene! salario w(e) dado en (4.2.1), tal como en el modelo de Bertrand de lasección 1.2.Blas empresas ofrecen ambas un precio igual al coste marginalde producción. Por tanto, (4.2.1) sustituye al requisito 2R de señal.izaciónen el modelo con dos receptores de esta sección.

Para preparamos para el análisis de los equilibrios bayesianos perfec-tos eleeste juego de señalización, consideramos primero el juego análogocon información completa. Es decir, suponemos temporalmente que lacapacidad del trabajador es información del dominio público entre losjugadores, en vez de infoffi1ación privada del trabajador. En este caso, lacompetencia entre las dos empresas en la etapa (3) implica que un traba-jador con capacidad TI y educación e recibe el salario w(e) = Y(TI,e)~ Parlotanto, un tTabajador con capacidad TI elige e, que soluciona

como pide el requisito 2R de señalización, el mercado ofrecería un salarioib'lJalal producto esperado de un trabajador con educación e, dada laconjetura de! mercado acerca de la capacidad del trabajador después deobservar e:

max y(-r¡,e) - c(-r¡,e).e

196/ JUEGOS DINÁMICOS CON INFORMACJÓN INCOMPLETA (e. 4)

Denotamos la solución con e*ü¡), como muestra la figura 4.2.4, siendow*(-,¡) = Y['¡,e*Cr¡)].

(4.2.5)

(4.2.4)

(4.2.3)

max'w(e) - c(7/,e).

_ {Y(E ,e) para e =1 epw(e) - para e - ewp ,. - -p'

Un trabajador con capacidad 7] escoge por lo tanto e como solución de

{apara e =1 ep

~L(Ale) = q para e = ep

entonces (4.2.1) implica que la estrategia de las empresas es

Juegos de se>lalizacíóll / '199

La solución de (4.2.5) es simple: un trabajador con capacidad 7] elige oepa el nivel de educación que maximiza 'y(13,e) - c(T/,e). (Este último esprecisamente e'(E) en el caso del trabajador de capacidad baja.) E.nelejemplo descrito en la figura 4.2.7, lo primero es óptimo para .ambos t.lpOSdel trabajador: la curva de indiferencia del trabajador de baja capaCldadque pasa por el punto [e'(B),w'(B») queda por debajo de la curva deindiferencia del mismo tipo que pasa por el punto (ep,wp), y la curva

Para completar la descripción de equilibrio bayesiano perfecto ele agru-pación nos falta (i) determinar la conjetura ele la~ empresas p,(A le) paralas elecciones de educación e =1 ep fuera del eqUlltbno, que entonces de-termina el resto de la estrategia de las empresas ll)(e) por medio de (4.2.1),y (ii) demostrar que la mejor respuesta d: ambos tipos de trabajador ala estrategia w(e) de las empresas es elegIr e = ep' Est~s dos pasos 1e-presentan los requisitos 1 y 2E de señalización respechvame~te: CO~l~O

apuntamos anteriormente (4.2.1) sustituye al reqUlsJto2Rde senaltzaclonen este modelo con dos receptores.

Una posibilidad es que las empresas crean que cualquier niv.elde ed~l-cación distinto de ep indica que el trabajador tiene Wla capaCIdad baja:p,(A!e) = O para todo e =1 ep' Aunque esta conjetura ,podría parecer ex-traña, nada en la definición de equilibrio bayesiano perfecto la e~c1L1ye,porque los requisitos del 1al 3 no imponen restricci~~es a las conjeturassituadas fuera de la trayectoria de equilibrio y el reqwsJto 4 es vacuo en unjuego de señalización. El refinamiento que aplicamos en la sección 4.4 res-tringe la conjetura del receptor fuera de la trayecto~ia de equilibri~ en unjuego de señalización; en particular excluye la conJ::ura que anahzamosaquí. En este análisis de los equilibrios de agrupaclOn ~~s cent:3mos enesta conjetura para simplificar la exposición, pero tamblen conSIderamosbrevemente conjeturas distintas.

Si la conjetura de la empresa es

(4.2)

e*(B} e*(A)

Figura 4.2.6

w*(B} __,_,__.

198/ JUEGOS DINÁMICOS CON [NFORMAClÓN INCOMPLETA (c. 4)

La figura 4.2.6 describe el caso contrario, en el cual podría decirseque el trabajador con capaCidad baja envidia el salario y nivel de edu~cación del trabajador con capacidad alta (es decir, ?U'(E) - dE,e'(E)] <?U'(A) - dE,e'(A)]). Este último caso es más realista y (como veremos)más interesante. En un modelo en el que la capacidad del trabajador tienemás de dos valores, el primer caso se plantea sólo si cada valor posible decapacidad es suficientemente diferente de l~s valores posibles adyacentes.Si la capacidad es una variable continua, por' ejemplo, entonces se da elúltimo caso.

Como describimos en la sección anterior, en este modelo pueden exis-tir tres casos de equilibrios bayesianos petf~i:tos: de'~i;rupación, de sepa-ración e híbrido. Normalmente existen numerososdsos de cada clase deequilibrio; aquí l~mitamos nuestra atertci6riáiirios cüant~s ejemplos. Enun equilibrio de agrupación, los dos tipos del trabajador eligen un nivel deeducación único, digamos ep' Elrequisit03'de señéiliúción impli<;aquela conjetura de las empresas después de observar ep debe ser lac'onjeturaa priori p,(Alep) = q, que, a su vez, exige que el salario ofrecido después deobservarep sea

;:..'.:.",'

-.':: .

.'

",<

,'.'.',',','

1'.>.,

"0'

(,',

"1.:.;.

para e :S el! excepto cuando e = el'

para e = el'para e> el!.

. {Y(B,e)w(e) = wq

Wq

{

O para e :S el! excepto cuando e = el'

¡L(Ale) = q para e = el'q para e > el!;

donde el! en la figura 4.2.7 es el nivel de educación en el cual la curvade indiferencia del trabajador con capacidad alta que pasa por el punto(ep'wp) corta la función de salarios w = q . y(A,e) + (l - q) . y(B,e). Laestrategia de las empresas es entonces

trab~jador constituyen otro equilibrio bayesiano de agrupación. Comoejemplo de lo último, supongamos que la conjetura de las empresas escOffi9 en (4.;2.3), con la excepción de que cualquier nivel de educación porencima de el! se interpreta como que el trabajador se escoge al azar de ladistribu.ciónde capacidades:

Juegos de seiializnción / 201

-,.Esta conjetura y esta estrategia de las empresas, y la estrategia (e(B) =-e;,e(A) = el') deltrabajádor constituyen un tercer equilibrio bayesianoperfecto de agrupación.

Ahora vamos a tratar equilibrios de separación. En la figura 4.2.5;(el caso donde no hay envidia) el equilibrio natural bayesiano perfecto

~-d~separación incluye la estrategia [e(B) = e'(B),e(A) = e'(A)] del tTab'¡i.j'ldor. El requisito 3 de señalización determina entonces la conje~ de

---lasempresas después de observar cualquiera de estos dos niveles deedu-cación (concretamente ¡L[Ale'CB)] = OY ¡L[A\e'CA)] = 1), por lo que C4.2.1)implica que w[e'CB)] = w'(B) y w[e'(A)l = w'CA). Corno enla discusiónde los equilibrios de agrupación, para completar la discusión de estos_.equilibriosbayesianos perfectos de separación nos queda: (i)establecer laconjetura ¡L(A[e) de las empresas para elecciones deniveles de educaciónf}1eradel equilibrio (es decir, valores de e Pistíntos de e'CB) o e'CA)), la

- ~ c~al determina entonces el resto de las estrategias wCe) de las empresas a_.. partir de (4.2.1), y (ii) demostrar que la mejor respuesta de un trabajadorde capacidad r¡ a la estrategia w(e) de las empresas es elegir e = e'Cr¡).

Una conjetura que cumple estas condiciones es que el trabajador tengacapacidad alta si e es al menos e'CA), y capacidad baja en cualquier otrocaso:

y (A,e)

q y(A,e)+ ( 1 - q) y(R,e)

y (R,e)

eUe'

Figura 4.2.7

e*(B)

2(JO !JUEGOS DINÁMICOS CON INfORMACiÓN INCOMPLETA (c. 4)

En resumen, dadas las curvas de indiferencia, las funciones de pro-ducción y el valor de el' en la figura 4.2.7,la estrategia [efE) = ep,e(A) = el']

del trabajador, y la conjetura ¡L(Ale) en (4.2.3)y la estrategia w(e) en (4.2.4)de las empresas constituyen un equilibrio bayesiano perfecto de agru-pación.

de indiferencia del trabajador con capacidad alta que pasa por el punto(ep'll)p) está por encima de la función de salario tu = y(B,e).

"________ .:..-- 1::'•••

Existen muchos otros equilibrios bayesianos perfectos de agrupaciónen el ejemplo definido por las curvas de indiferencia y las funciones deproducción de la figura 4.2.7. Algunos de estos equilibrios incluyen unaelección de un nivel de educación diferente por parte del trabajador (esdecir, un valor de el' distinto del de la figura); otros incluyen la mismaelección de un nivel de educación pero difieren fuera de la trayectoria deequilibrio. Como ejemplo de lo primero, sea e un nivel de educación entreep y el, donde el en la figura 4.2.7es el nivel de educación en el eualla curvade indiferencia del trabajador de baja capacidad que pasa por el punto(e'(B)¡w'(B») corta la función de salario w = q . y(A,e) + (l - q) . y(B,e).C" '.01 sustItUImos el' en (4.2.3) y (4.2.4) por e, la conjetura y la estrategiaresultantes de las empresas, junto con la estrategia [e(B) = e,e(A) = e] del

y(A,e)

y(B,e)

La estrategia de las empresas es entonces

Figura 4.2.8

e*(B) e'(A) es

., de e uilibrio, de las conjeturas de las emjJr~sasUna expreslOn, fuera . q ., . Itrabajador tIene

que sustenta este comportamiento de e~Ulhbno es que ~o'capacidad alta si e 2: e., y capacidad baja en caso contra .

{O para e < es

p,(Aje) = 1 para e 2: e.,.

w'(A)

10

Juegos de se¡laliznció" / 2m

w' (L)

y(A,e,J

{y(E ,e) para e < es

-- w(e) = y(A,e) para e 2: es.

. cidad baja tiene dosDada esta función de salarios, el trabaJado.r con capa. ar' (A,e,).". .. . l . '(E) ganar 1}! (B) y elegIr es y gan.l/ .

mejores respuestas: e eglr e y . f d p'(JJ)' al.ue esta indiferencia se resuelve en avor e ~ ,

Vamos a suponer q .' f dad arbitrariamente. '" d 'amos aumentar es en una can 1 .temativamente po n .. 'd d b J'aprefiriera estnc-- d ue el trabajador con capaCl a apequena e manera q ,... 'd d alta las eleccionestamente e'(E), En cuanto al trabajador con capan a , .' d

. . > e'(A). Puesto que las LUlvas e. de e > e son lnfenores a e" ya que e.,. : , 'j's . 'dad baJ'a llenen mas pem lente queindiferencia del trabaJador con capacI . 1 '1 .

.d d lta la curva de indiferenCla de u t11110las del trabajador con capacl a a , . , 1 .'( . (A »está por encima de la funclOn de s.a allosque pasa por el punto e"y ,es b"

. 1 que las elecciones de e < es son tam lenw = y(B,e) para e < e" por o .

(4.2.6)

para e < e'(A)para e 2: e'(A).

( ) _ { y(E,e)we - y(A,e)

{O para e < e'(A)

p,(Afe) = 1 para e.2: e'(A).

202 / JUEGOS DlNÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)

La estrategia de las empresas es entonces

Puesto que e'(A) es la mejor respuesta del trabajador con capacidad alta.a la función de salariosw = y(A,e), también es la mejor respuesta aquí.Con respecto al trabajador de baja capacidad, e7(B) es la mejor respuestade dicho trabajador cuando la función de salarios eSw == y(E,e), de ma-nera que w'(E) -e[B,e'(E)] es la mayor ganancia.que el trabajador puedelograr de entre todas las elecciones de e < e'(A), Puesto que las cur~.vas de indiferencia del trabajador de baja capacidad tienen mayor pen.:diente que las del trabajador de alta capacidad; w~(A) - e[E,e'(A)] esla mayor ganancia que puede conseguir; aquí un trabajador de baja ca-pacidad de entre todas las elecciones de e 2: e'(A). Por tanto, e'(E)es la mejor respuesta de un trabajador de baja capacidad, puest? qu~w'(E) - dE,e'(E)] > w'(A) - dE,e'(A)] en el caso en que no hay envidia_

A partir de aquí ignoramos el caso en el que no hay envidia. Comosugerimos anteriormente, la figura 4.2.6 (el caso con envidia) es más inte"'resante. Ahora el trabajador con capacidad alta no puede ganar el salarioalto roCe) = y(A,e) simplemente eligiendo la educación e'(A) queelegiñabajo información completa. En su lugar, para señalizar su capacidad, eltrabajador con capacidad alta debe elegir e., > e'(A), .como muestra lafigura 4.2.8, puesto que el trabajador con capacidad baja imitará cualquiervalor de e entre e'(A) y es si hacerlo lleva a las empresas a creer que tienecapacidad alta. Formalmente, el equilibrio natural bayesiano perfecto de'separación incluye ahora la estrategia [e(E) = e'(E),e(A) = es] del trabaja-dor y las conjeturas de equilibrio p[Ale'(E)] = O Y{t[Ales] = 1 Ylos salariosde equilibrio w[e'(E)] = w'(E) y w(es) = y(A,es) de las empresas. Éste esel único comportamiento en equilibrio que sobrevive al refinamiento queaplicaremos en la sección 4.4.

Juegos de señaliznción / 205

, ....

" ,"

\:.'

'.' ;;'

¡ "

(4.2.9)

(4.2.10}

w*(B) - c[B,e*(E)] = 'Wh - c(E,eh).

q . (1 - q)7fWh = ---~. y(A,e¡.) + (1 ). y(E,eh).

q + (l - q)7f q + - q 7f

.Sin embargo, p?U'aque 'Whseaun salario de equilibrio para las empresas,(4.2.1) y (4.2.8) implican que

y la inferencia usual tras la separación da M(.4.leB) = O.Tres observacionespueden ayudamos a interpretar (4.2.8): en primer lugar, puesto que eltrabajador con capacidad alta siempre elige eh, pero el trabajador concapacidad baja sólo lo hace con probabilidad 7f, observar eh indica que esmás probable que el trabajador tenga capacidad alta, con lo que M(Aleh) >q. En segundo lugar, cuando 7f tiende a cero, el trabajador con capacidadbaja nunca se agrupa con el de capacidad alta, por lo que ¡L(Aleh) tiende aurio. En tercer lugar, cuando 7f tiende a uno, el trabajador con capacidadbaja casi siempre se agrupa con el de capacidad alta, por lo que M(Aleh)

tiende a la conjetura a priori q.Cuando el trabajador con capacidad baja se separa del que tiene ca-

pacidad alta eligiendo eB, la conjetura M(AleB) = O implica el salariow(eB) = y(B,eB)' Se deduce entonces que eB debe ser igual a e*(B): laúnica elección del nivel de educación en la cual el trabajador con capaci-dad baja puede ser inducido a separarse (probabilísticamente corno aquío con certeza, corno en los equilibrios de separación discutidos anterior-mente) es la elección de educación con información completa e*(B) dedicho trabajador. Pa~a ve'r esto, supongamos que el trabajador con capa-ddad baja se separa eligiendo algún eB '1 e*(B). Tal separación alcanza laganancia y(13,eB) - c(B,eB), pero de elegir e*(E) obtendría una gananciade al menos y[E,e*(B)] - c[E,e*(B)]Ca de más si la conjetura de lasem-presas M[Aie* (E)] es mayor que cero) y la definición de e*(B) implica quey[E,e*(E)] - c[E,e*(E)] es mayor que y(E,e) - c(E,e) para cada e '1e*CB).Por lo tanto, no existe una elección de nivel de educación eB '1 e*CE)

tal que el trabajador con capacidad baja pueda ser~inl:l1J:ci~?_<l. separarseeligiendo eB.

Para que el trabajador con capaqgad baja esté dispuesto. aescoger ~ea-toriamenteentre separarse en e*(E) y agruparse en eh, el salario w(eh) = Wh

cl~behacer que el trabajador sea indiferente entre ambo~:

(4.2.8)

20-1 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

inferiores. Por lo tanto, la mejor respuesta del trabajador con capacidadalta a la estrategia de las empresas w(e) es e•.

Como en el caso de los equilibrios de agrupación, existen otros equi-librios de separación que incluyen diferentes elecciones de niveles deeducación del trabajador con capacidad alta (el trabajador con capacidadbaja siempre se separa en e*(B); véase lo que sigue) y otros equilibrios deseparación que incluyen las elecciones de educación e*(E) y es pero di-fieren fuera de la trayectoria de equilibrio. Como ejemplo de lo primero,sea e un nivel de educación mayor que es pero lo suficient~mente pe-queño como para que el trabajador con alta capacidad prefiera señalizarsu capacidad eligiendo e en lugar de inducir a pensar que tiene capaci-dad baja: y(A,e) - c(A,e) es mayor que y(B,e) - c(A,e) para cada e. Sisustituirnos es por e en ¡L(Ale) y w(e) que acompañan a la figura 4.2.8, laconjetura y la estrategia resultantes para las empresas, junto con la es-trategia re(E) = e*(E),e(A) = e] del trabajador constituyen otro equilibrioperfecto de Nash de separación. Corno ejemplo de lo último, sea la conje-tura de las empresas sobre niveles de educación que están estrictamenteentre e*(A) y es estrictamente positiva pero lo suficientemente pequeña,de manera que la estrategia resultante w(e) esté estrictamente por debajode la curva de indiferencia del trabajador con baja capacidad que pasa porel punto (e* (B),w* (B».

Concluirnos esta sección con una breve discusión sobre los equilibrioshíbridos, en los cuales un tipo elige unnivel de educa<;ión con certeza,pero el otro tipo elige aleatoriamente entre la agrupación con el primertipo (eligiendo el nivel de educación del primer tipo) y la separación delprimer tipo (eligiendo un nivel de educación diferente). Analizarnos elcaso en el cual el trabajador con baja capacidad escoge aleatoriamente; elejercicio 4.7 trata el caso complementario. Supongamos que el trabajadorcon capacidad alta elige un nivel de educación eh (donde h quiere decirhíbrido), pero el trabajador con capacidad baja elige aleatoriamente entreeh (con probabilidad 7f) y eH (con probabilidad 1 - 7f). El requisito 3de señalización (convenientemente extendido para incluirlas estrategiasmIxtas) determina entonces la conjetura de las empresas tras observar eh

() ea. Con la regla de Bayes se obtiené

6 Recordemos de la nota 2 ele! capítulo 3 que la regla de Rayes establece que P(AIB) =p(A.m/ P(8). Para derivar (4.2.8), reformulemos la regla de Bayes como P(A,E) = P(BIA).1-'(04), por lo que P(AIE) = P(BIA). 1-'(04)/ P(B).

206 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

4.2.C Inversión empresarial y estructura de capital

JlIegos de sel1alizIlciríll / 207

Consideremos un empresario que ha formado una empresa pero necesitafinanciación exterior para llevar a cabo un nuevo y atractivo proyecto. Elempresario tiene información privada sobre la rentabilidad actual de laempresa, pero la ganancia del nuevo proyecto no se puede separar d: ~aganancia de la empresa; lo único que se puede observa¡:..es el benefJC~oagregado de la empresa. (Podríamos permitir también que el empresanotuviera información privada sobre la rentabilidad del nuevo proyecto,pero sería una complicacióÍl innecesaria.) Supongamos que el e~l~resarioofrece a un inversionista potencial una participación en los benefiCJosde laempresa a cambio de la financiación necesaria. ¿Bajo qué circunstanciasse llevará a cabo el nuevo proyecto y cuál será la participaciél11"enlos

beneficios de la empresa?Para transcribir este problema a un juego de señalización, suponga IDOS

que los beneficios de la empresa antes del proyecto pueden ser altos obajos: 7[" = A b E, donde A > B > O. Para capturar la idea de que elnuevo proyecto es atractivo, supongamos que la inversión requerida es 1,la ganancia será R, la rentabilidad alternativa para el inversor potencial r

{O para e < eh

/.L(A\e) = r para e 2': e".

{y(E,e) para e < eh

w(e) = r . y(A,e) + (l - r) . y(B,e) para e 2': eh.

Sólo queda por comprobar que la estrategia del trabajador (e(B) = e" conprobabilidad 7[",e(B) = e*(E) con probabilidad 1- 7[";e(A) = eh) es unamejor respuesta a la estrategia de las empresas. Para'el trabajador concapacidad baja,la e < eh óptima es e*(B) y la e 2': eh óptima es el~' Para eltrabajador con capacidad alta, eh es superior a todas las alternatlvas.

La estrategia de las empresas es entonces

de la figura 4.2.8. Ciertamente, cuando eh tiende a es, r tiende al, :iemanera que rrtiende a cero. Por tanto, el equilibrio de separación descnt~en la figura 4.2.8es el límite de los equilibrios híbridos conSIderados a~ul.

Para completar la descripción del equilibrio bayesiano perfe:to híb:ldOde la figura 4.2.9, sea la conjetura de las empresas que el trabajador t1enecapacidad baja si e < eh yen cualquier otro caso, que tiene capacidad altacon probabilidad r y baja con probabilidad 1- r:

r y(A,e) .+ O - r) y(B,e)

e

q y(A,e)+,0- q) y(B,é)

y(A,e)

y(B,e)

,,,,

'~

. 1:,

Figura 4.2.9

e*(B)

w*(B)

w~

w

Para un valor determinado de eh, si (4.2.9)da que '/1)h< y(A,eh), entonces(4.2.10) determina el valor único de 7[" que constituye un equilibrio híbridoen el cual el trabajador con capacidad baja escoge aleatoriamente entree*(E) y eh, mientras que si '/1)h > y(A,eh), no existe ningún equilibriohíbrido que incluya eh.

La figura 4.2.9 ilustra de forma implícita el valor 7[" consistente con elvalor indicado de eh. Dado eh, el salario 11Ihes una solución de (4.2.9); porlo que el punto (eh/wh) está en la curva de indiferencia del trabajador conbaja capacidad que pasa por el punto [e*(E),11I*(E)]. Dado 11Ih< y(A,eh),

la probabilidad r es una solución de r . y(A,eh) + (l - r) . y(E,eh) = 11Ih.

Esta pr~ba~~lidad es la conjetura en equilibrio de las empresas, por lo que(4.2.~)s~~fica que 7[" = q(l-r)/r(l - q). La figura también muestra que larestrlCclOn11Ih-< y(A,eh) es equivalente a eh < es, donde es es la educaciónelegida por el trabajador con capacidad alta en el equilibrio de separación

'..''.'

.....

o.'

::'08;' JUEGOS DINÁMICOS CON INfORMACiÓN INCOMPLETA (c. 4)

)' n > JO + 1'). Describimos a continuación el desarrollo temporal y lasganancias:

En cuanto al empresario, supongamos que los beneficios de la compañíaant.es del proyecto son 1f, y consideremos si el empresario prefiere recibirla financiación a cambio de la participación en los beneficios de la empresao renunClar al proyecto. Lo primero es superior si y sólo si

1(1 + r)AR - 1(1 + 1') 2: R - B. (4.2.14)

Intuitivamente, la dificultad de un equilibrio de agrupación es que el tipode beneficio alto debe subvencionar al tipo de beneficio bajo: haciendoqueq == pen (4.2.11) obtenemos s 2: 1(1+1')/[pB+(1-p)A+RJ, mientras quesi el inversor supiera con seguridad que 7r == A (es decir, q == O),. entoncesaceptaría una participación menor en los beneficios s 2: 1(1+1')/(A+R). Lamayor participación en la empresa exigida por un equilibrio de agrupaciónes muy cara para la empresa con beneficios altos, tal vez tan cara como parahacer que la empresa con beneficios altos prefiera renunciar al proyecto.Nuestro análisis muestra que existe un equilibrio de agrupación si pestácerca de cero, por lo que el coste de la subvención es pequeño, o si (4.2.14)se cumple, de manera que el beneficio del nuevo proyecto sobrepasa alcoste de la subvención.

Si (4.2.13) no se cumple, no existe equilibrio de agrupación. Sinembargo, siempre existe uno de separación. El tipo de beneficio bajoofrece s == 1(1 + 1')/(B + R), que el inversor acepta y el tipo de beneficioalto ofrece s < 1(1 + 1')/(A + R), queel inversor rechaza. En tal equilibriola inversión es ineficientemente baja: el nuevo proyec~o es rentable contoda seguridad, pero el tipo de aÚobeneficio renuncia a la inversión. Esteequilibrio ilustra en qué sentido el conjunto de señales factibles del emi-sor es poco efectivo; el tipo de alto beneficio no tiene forma de sobresalir;unos términos de financiación que son atractivos para el tipo de beneficioalto son aún más atractivos para el de beneficio bajo. Como observanMyers y Majluf, en este modelo las empresas se ven empujadas hacia elendeudamiento o hacia fuentes de financiación interna.

Concluimos considerando brevemente la posibilidad de que el em-presario pueda tanto endeudarse como ofrecer participaciones en los be-neficios. Supongamos que el inversor acepta ofrecer un crédito D. Si elempresario no quiebra, la ganancia del inversor es D y la del empresario1f + R - D; si el empresario quiebra, la ganancia del inversor es 1f + RY la del empresario es cero. Como B > O, siempre existe un equilibriode agrupación: los dos tipos de beneficios ofrecen el contrato de deuda

Juegos de sel1aliZJlcián !209

1(1+1') R. < --o (4.2.13)pB + (1 - p)A + R - A + R

Si p está lo suficientemente cerca de cero, (4.2.13) se cumple porque R >1(1 + 1'). Sin embargo, si p está lo suficientemente cerca de uno, (4.2.13) secumple sólo si

---------------_ ....•.•_--------..

(4.2.11)

(4.2.12)Rs<--

-1f+R

s[qB+ (l - q)A + R] 2: 1(1 + r).

1. El azar determina el beneficio de la empresa antes del proyecto. Laprobabilidad de que 1f == B es p.

2. El empresario conoce 1f y ofrece al inversor potencial una participación .'en los beneficios de la empresa, s, donde O::; s ::; 1. .,

3. E~inversor observa s (pero no 1f) y decide si aceptar o rechazar laoterta.

4. Sí el inversor rechaza la oferta, su ganancia es lO + r) y la del empre-sano es 1f. Si el inversor acepta s, su ganancia es de s(1f + R) Yla delempresario O - s)(1f + R).

Myers y Majluf (984) analizan un modelo como éste, aunque conside-ran una empresa grande (con accionistas y un consejo de administración).en lugar de un empresario (que es a la vez el director y el único accionista).Discuten diferentes supuestos sobre cómo lós intereses de los accionistas'podrían afectar la utilidad de los directivos; Dybvig y Zender (991) deri~.van ~l contrato óptimo que los accionistas pueden ofrecer a los directiv~s ..

Este es un juego de señalización muy simple en dos aspectos: elconjunto de acciones factibles del receptor es muy limitado, y el del emisores mayor pero poco influyente (cOri10veremos). Supongamos que trasreCIbir la oferta .5 el inversor cree que la probabilidad de que 1f == B es q.Entonces el inve,!sor aceptará s si y sólo si

. En un equilibrio bayesiano perfecto de agrupación, la conjetura delInversor debe ser q == p después de recibir la oferta de equilibrio. Comola reslTÍcción en la participación (4.2.12) es más difícil de satisfacer paraIr == A q~e ~ara 1f == B, la combinación de (4.2.11) y (4.2.12) significa queun equlhbno de agrupacióÍ1 sólo existe si

210 I JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

(42.15)

1r*(1re) = ~2[(l - b)y* + d1re].c+d

El mismo argumento indica que si el tipo de la autoridad monetaria es c,su elección óptima de 1r2dada la expectativa 1r2es

1. El azar determina el tipo e de la autoridad monetaria. La probabilidadde que e =Des p.

2. Los empresarios forman sus expectativas de inflación para el primerperiodo, 1rj.

3. La autoridad monetaria observa 1rj y escoge el nivel real de inflacióndel primer periodo, 1rI.

4. Los empresarios observan 1rI(pero no e) y forman sus expectativas deinflación para el segundo periodo, 1r2.

5. La autoridad monetaria observa 1r2y escoge el nivel real de inflacióndel segundo periodo, 1r2.

J¡¡egos de sáializnci')/1 I 211

~[O- b)y' + d1r21 =. 1r:i.(1r2'c).c+d

Previéndolo, si los empresarios empiezan el segundo periodo creyendoque la probabilidad de que e = D es ,!,se formarán la expectativan2(q) deforma que maximice

Como indicamos en la sección 4.2.A, hay un juego de señalización de unperiodo incluido en este juego de política monetaria con dos periodos. Elmensaje del emisor es la elección de la inflación por parte de la autoridadmonetaria en elprimer periodo, 1rI-y la acción del receptor es la expectativade inflación' de los empresarios en el segundo periodo, 1r2. La expectativadélos empresarios en el primer periodo y la elección del nivel de inflaciónde la autoridad monetaria en el segundo preceden y siguen al juego deseñalización respectivamente.

Recordemos que en el problema con un periodo (es decir, en el juegode etapa del juego repetido analizado en la sección 2.3.E) la elecciónóptima de. 7r por parte de la autoridad monetaria dada la expectativade los empresarios, 1re, es '

modelo con dos periodos es, por tanto, el siguiente:

4.2.D Política monetaria

~n esta sección añadimos información pTivada ~ unaver~ión condospe~,nodos del juego repetido de polítical)1onetaria analizado. en la sétdóif2.3.E.Como en el modelo de Spence, eXistenmucho~ equilibrios baye~ia~'nosperfectosdé agrupación,lubridos yde s~parac!ór( Como ya discúti'Gmas estos' equilibrios con detalle enJa sección4.2.S; aquí sólo esb~zéillio~>los teínasmás'importantes.VéaseVlckers (986) péiriFlos detálle~de~un análisis similar con dos periodos yBarro (986) para un modelo de,.reputación con muchos periodos.

Recordemos, de la sección 2.3.E, que la ganancia por periodo de laautoridad' monetaria es .

D = JO + r), que el inversor; acepta. Sin embargo, si B fuera lo suficien-temente negativo como para queR +B < JO + 7"), el tipo de beneficiobajo no podría devolver su deuda, por lo que el inversor no aceptaría elcontrato. Aplicaríamos un argumehto'similar siH y A fueran benefiCiti;:'esperados (y no beneficios seguros). Supongamos que el tipo 7f Sil;nifit~ .que los beneficios actuales de !él empresa serán 1r+ J{ con probabilidad1/2 y 1r- J{ con probabilidad 1/2. Ahora, si B - J{ + R < JO + r), hayuna probabilidad de 1/2 de qué el tipo de beneficio bajo no sea capazde devolver la deuda D = J(1 + r), por 10 que el inverSOftlo aceptará elcontrato. .

'"t

donde 1res elnivelreal de inflación, 1reesJa expectativa de inflación d~Jo~empresarios e y* es el nivel eficiente de producción. Para los empresarios,:la ganancia por periodo eS~(1r-1re)2; En nuestro modelo con dos periodos,la ganancia de cada jugador es simplemente la suma de sus ganancias ehcada periodO('vV(1rI,1rj)+ W(1r2,1r2) y -(1rI _1rj)2 - (1r2 - 1r2)2, donde1rt esel nivel.real de inflación en el periodo t y 1ri es la expectativa (al priricipiodel penado t) de inflación en el periodo~ por parte de los empresarios.

El parámetro e en la función de ganancias W(1r¡rre) refleja el dilema dela autoridad monetaria entre los objetivos de inflación cero y produccióneficiente. En la sección 2.3.E, este parámetro era inlonnación del dominiopúblico. Suponemos ahora, en cambio, que esteparámetroes inlonnaciónprivada de la autoridad monetaria: e = Fa D (por "fuerte" y "débil'~ enla lucha contra la inflación); donde F > D > O. El desarrollo temporal del

~ 12 ! JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)

En un equilibrio de agrupación, ambos tipos escogen la misma in-flación para el primer periodo, digamos 7r*,por lo que la expectativa de ,los empresarios en el primer periodo es 7rj = 7r*. En la trayectoria deequilibrio, los empresarios empiezan el segundo periodo creyendo que laprobabilidad de que e = D es Ji, por lo que se forman la expectativa 7r2(p).La autoridad monetaria de tipo c escoge entonces su inflación óptima para'el segundo periodo dada esta expectativa, concretamente 7ri[7r2(P),c],fina-lizando con ello el juego. Para completar la descripción de este equilibrio,queda (como siempre) definir las conjeturas del receptor fu~~a del equi-.Iibrio para calcular las correspondientes decisiones fuera del equilibrioutilizando (4.2.15), y comprobar que estas decisiones no crean ningúnincentivo a desviarse del equilibrio para ningún tipo del emisor.

En un equilibrio de separación, los dos tipos escogen niveles de in-flación diferentes en el primer periodo, digamos 7[D y 7rF,por lo que laexpectativa de los empresarios en el primer periodo es 7rí= P7[D+(1-phF.Después de observar 7[D, los empresarios empiezan el segundo periodq'creyendo que e = Dy se forman por ello la expectativa 7[2(1);delmi~IJ;l9modo, observar 7[F cOJ;lducea7[2(0).En equilibrio, el tipo débil e~coge ei1~tonces 7[i[7[2(1),D] y el tipo fuerte 7[i[7r2(O),F], finalizandoel juego. Par~completar la descripción de este equilibrio,. no. 'sólo queda, corno antes~detallar las conjeturas y acciones fuera del equilibrio del receptoricorii~probar que ningún tipo del emisor tiene incentivos para desviarse, sinotambién comprobar que ningún tipo tiene incentivos pala imitar el cmn-,pOltamiento en equilibrio del otro. Aquí, por ejemplo, el tipo débil podríapensar en escoger 7[F en el primer periodo, induciend() co!,ell.o a qtle !ªexpectativa de los empresarios en el segurido periodo fuera 7[2(0),peroescoger 7[i[7[2(0),D], finalizando el juego. EscL~jr, incluso si 7[F fuerademasiado baja para el tipo débil, la expectativa consiguiente 7[2(0)podríaser tan baja que el tipo débil recibiera una ganancia enorme debido a lainflación inesperada 7[i[7[2(O),D] - 7r2(O)en el segundo periodo. En unequilibrio de separación, la inflación escogida en el primer periodo por eltipo fuerte debe ser lo suficientemente baja corno para que el tipo d~bilno sienta la tentación de imitarle, a pesar del ben~ficio que obtendría porla inflación inesperada en el segundo periodo. Para muchos valores delos parámetros, esta restricción hace que 7[F sea menor que ei nivel d~inflación que el tipo fuerte elegiría bajo información completa, delrrJsmomodo que el trabajador con capacidad alta invierte más de la cuenta eneducación en un equilibrio de separación del modelo de Spence.

Otras aplicaciones del equilibrio bayesiano perfecto! 213

4.3 Otras aplicaciones del equilibrio bayesiano perfecto

4.3.A Juegos con parloteo (cheap-talk games)

Los juegos con parloteo son análogos a los juegos de señalización, pero enaquellos juegos los mensajes del emisor consisten en un mero parloteo (ca-rente de coste alguno, que no es vinculante, y cuyo contenido son declara-ciones no verificables), Tal parloteo no puede ser informativo en el juegode senalizacióh' de 'Spence: un trabajador que simplemente anuIlciara"mi capacidades ?Ita" nI?sería creído. Sin embargo, eIl otros c:ontéxfos:este tipo de comiúücacióri previa puede ser informativo. Como ejemplosencillo, consideremos las posibles interpretaciones de la frase "sube labolsa"? En aplicaciones conrrf1iyor interés económico; Stein' (1989)'dec-muestra que las meras declaraciones de la autoridad monetaria puedenser informativas aunque no puedan ser demasiado precisas, y Matthews(1989)estudia cómo una amenaza de veto por parte del presidente de losEstados Unidos puede influir en la forma corno se aprueba el presupuesto,en el Congreso norteamericano. Además de analizar elefecto,delparl6~teo en:un contexto determinado, uno también puede preguntarse cómodiseñar contextos para' aprovechar esta forma de comunicación~ En 'estesentido, Austen-Smith (1990) demuestra que, en algunos casos, debatesentre legisladores que actúan según su propio inh;rés acaban mejorando elvalor social de la legislación que se aprueba, y Farrelly Gibbons (1991)de-muestran que, en algunos casos, la implantación sindical en uIla empresamejora el bienestar social' (a pesar de la distorsión que crea:n el nivel .deempleo descrita en la sección2.1.C) porque facilita la coIIÍünicaciónentréla fuerza de trabajo y la dirección." ,c, ..

El parloteo no puede ser informativo en el modelo de Spence por-que todos los tipos del emisor tienen las mismas preferencias en relacióncon las posibles acciones del receptor: 'todos los trabajadores prefierensalarios altos, independientemente de su capacidad. ~ara ver por qué taluniformidad de preferencias entre los tipos del emisor vicia el parloteo(en el modelo de Spence y más en general), supongamos que existiera unequilibrio con estrategias puras en el cual uri subconjunto de los tipos del

7 En la versión en inglés del libro, la frase que originalmente aparece es "Hey, look out for thatbus!", que puede traducirse como "¡Cuidado con ese autobús!" o como "¡Espera ese autobús!",de endiendo del contexto. La fraseqúe nosotros incluimos aquí es una de las muchas frases enca~ellano que puede tener signifiéadosc?mpl"tamente diferentes dependiendo del contexto. 'Ésta es la idea que el autor quiere eXpresar. (N. de los T.).

(i.

,~.'."

':

,r.

',.'

,,/

214 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

emisor, TI, envía un mensaje mI, mientras que otro subconjunto de tipos;T2, envía o.tromensaje, m2. (Cada Ti podría contener sólo un tipo, comoen un equilibrio de separación, o muchos tipos, como en un equilibrio deseparación parcial.) En equilibrio, el receptor interpretará que mi viene deTi y tomará por tanto la decisión óptima, aú dada su conjetura. Come:,to"dos los tipos del emisor tienen las mismas preferencias sobre las accionesa tomar, si un tipo prefiere (digamos) al a 0.2, todos los tipos tienen estapreferencia y enviarán el mensaje mI en lugar de m2, destruyendo con elloel equilibrio putativo. Por ejemplo, en el m~dei~' deSpence; 'si elpaii~teoresultara. en un mensaje indicativo <leun saJaria,alto, mientras que otrotipo de parloteo indicaraunsalario b~jo,lo~ trai:>aJ?dores'de'"~~lqúier ni-vel d~ capacidad enviarían.el primer ni.ensaje~porlo que nópuede' existir,un equilibrio en el que.el parloteo afecte los salari()s., Por 10 tanto, para que el parloteo sea informativo, una condición nece-saria es que diferentes tipos del emisor tengan preferencias diferentes enrelación con:las acciOliesdeLreceptor, Una segunda condición necesaria,por supuesto, es que el.receptor prefiera acciones¡,giferentesdependiendodel ti'pó:del emisor .. (Tanto la señálizacióncomQ;ja.comurucaciónp~yiason inútiles si las preferencias del receptor sobre sus acciones' son inde~pendientes del tipo del emisor.).Una terceracondicióitnecesaria para queel parloteo sea 'informativo es que las preferencias del receptór sobre susacciones nlJ sean completamente opuestás alasd~emisor. Para adelantarun último. ejemplo,supongamos que elr~~epto{prefiere.acciones bajascuando el tipo deLemisor es bajo y acciones altastuando es.alto; Siemi-sores de tipos bajos prefieren acciones baja~ y los de tipos altos accionesaltas, puede haber comunicación, pero si efemisor tiene ias preferenciasopuestas no puede existir comunicación, ya que al emisorle gustaría conefundir al receptor. Crawford y Sobel (1982)élIlalizanunmodelc5 abstractoque satisface estas tres condiciones necesarias y establecen d()s resultadosintuitivos: en términos informales, puede existir más comunicación pormedio del parloteo cuando las preferencias. de las jugadores están másíntimamente relacionadas, pero no puede existir comunicación perfecta ano ser que las preferencias de los jugadores estén perfectamente alineadas ..

Cada una de .las aplicaciones económicas que acabamos de. describir(parloteo por parte de la autoridad monetaria, amenazas de veto, debatesparlamentarios y presencia sindical) incluyen no sólo un juego sencillocon parloteo sino también una modelizacion más completade un entornoeconómico. Analizar una de estas apii<:acionesexigiría describir no s<$loeljuego sino también el modelo completo, lo que desviaría núestr<iatención

Otras aplicaciones del equilibrio bayesinno prr!,'cfo / 215

de las fuerzas básicas que operan en los juegos con parloteo. En estasección, por lo tanto, nos apartamos de nuestro estilo anterior y.analizamossólo juegos abstractos con parloteo, dejando las aplicaciones como lecturaadicional.

El desarrollo temporal del juego con parloteo más sencillo es idénticoal del juego de señalización más sencillo; sólo cambian las ganancias.

1. El azar escoge un tipo ti del emisor, de un conjunto de tipos factiblesT = {tlJ ... ,tI}, de acuerdo con una distribución de probabilidad pe!,;),

donde p(ti) > O para cada í y p(tl) + ... + ]J(t[) = 1.2. El emisor observa ti y escoge Ul1 mensaje mj de un conjunto de lnen-

sajes factibles M = {mI,' .. ,mj}.3. El receptor observa mj (pero no ti) y escoge entonces una acción (J.k de

un conjunto de acciones factibles A = {al,' .. ,al(}.4. Las ganancias vienen dadas por UE(tiak) y UR(tiak).

La característica clave de este juego es que el mensaje no tiene efecto di-recto rusobre la ganancia del emisor ni sobre la del receptor. La únicamanera en la que el mensaje puede importar es a través de su contenidoinformativo: cambiando la conjetura del receptor sobre el tipo del emisor,un mensaje puede cambiar la decisión del receptor y, por tanto, afectarindirectamente a las ganancias de los dos jugadores. Como la misma infor-mación puede ser comurucada en diferentes lenguajes, diferentes espaciosde mensajes pueden alcanzar los mismos resultados. El espíritu del parlo-teo es que puede decirse cualquier cosa; en consecuencia, formalizar esteconcepto exigiría que M fuera un conjunto muy grande. Por el contrario,suponemos que M es lo suficientemente rico para decir lo que haga faltadecir; es decir, M = T. Para los propósitos de esta sección, este supuestoes equivalente a permitir que se diga cualquier cosa; sin embargo, paralos propósitos de la sección 4.4 (refinamientos del equilibrio bayesianoperfecto), este supuesto debe ser reconsiderado.

Puesto que los juegos con parloteo y de señalización más sencillostienen el mismo desarrollo temporal, las definiciones de equilibrio ba-yesiano perfecto en los dos juegos son también idénticas: un equilibriobayesianó perfecto con estrategias puras en un juego con parlol<;:oes unpar de estrategias m'(ti) y a'(mj), y una conjetura ¡.t(tdm) que satisfacenlos requisitos (1), (2R), (2E) Y (3) de señalización, aunque las funcionesde ganancias UR(túmj,o,k) Y UECtú111.j,G.k)en los requisitos (2F,)y (2E) de

216/ JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)

señalizac.ión son ahora equivalentes a URUi,a¡J y Udt."rtk) respectiva-mente. Sm embargo, una diferencia entre los juegos de señalización y losJuegos con parloteo es que en estos últimos siempre existe un equilibriode agrupación. Puesto que los mensajes no tienen un efecto directo sobrelas' . dI' .

> gana~l.C1ase emI~or, SIel receptor va a ignorar todos los mensajes, laatírupaclOn es una.mejor respuesta del emisor. Puesto que los mensajes notIenen un efecto dIrecto sobre las ganancias del receptor, si el emisor estájugando agrupación, ignorar todos los mensajes es una mejor respuestadel receptor. Formalmente, sea a* la acción óptima del.receptor en unequIlIbno de agrupación; es decir, a* es una solución de

Es.un equilibrio b.ayesiano perfecto de agrupación que el emisor jueguecu::.qL1lerestrategI~ de agrupac~ón, que el receptor mantenga la conjeturaa F¡IOn pU') despues de cualqUler mensaje (en la trayectoria de equilibrio~ fuer~ de ella) y ~~e.~l receptor tome la acción a* después de cualquierlen~aje. La cuestion mteresante en un juego con parloteo, por tanto, esSI eXIsten equilibrios de no agrupación. Los dos juegos abstractos con~arloteo 5ue discutimos a continuación ilustran sobre los equilibrios deseparaclOn y de agrupación parcial respectivamente. .

Em,pezamos con un ejemplo con dos tipos y dos acciones' T = {t t }P l ( ) " B, A ,ro) tB ~ p, y A = {aB,a.,!}. Podríamos utilizar un juego de señalización

COl~dos tIpO.S,dos mensajes y dos acciones, análogo al de la figura 4.2,1pal a descnblr las ?anancias en este juego con parloteo, pero las gananciasdel par .(t¡,ak) son mdependientes de qué mensaje fue escogido, por lo quedescnblmos los pagos utilizando la figura 4.3.1. La primera ganancia encada caSIllaes la del emisor, y la segunda la del receptor, pero esta figura//0 es un juego en forma normal, simplemente recoge las ganancias de losjugadores para cada par tipo-acción.

tB tA

aB 1:,1 y,O

(LA Z,O "W,1

Figura 4.3.1

Otras aplicaciones del equilibrio bayesimlO perfecto / 217

Como en nuestra discusión anterior sobre las condiciones necesariaspara que el parloteo sea informativo, hemos escogido las ganancias delreceptor de forma que prefiera la acción baja (aB) cuando el tipo delemisor es bajo (tB) y la acción alta mando el tipo es alto. Para ilustrarla primera condición necesaria, supongamos que los dos tipos del emisortienen las mismas preferencias respecto de las acciones: x > Z e y > "w,por ejemplo, de forma que los dos tipos prefieren aB a aA' Entonces,a los dos tipos les gustaría que el receptor creyera que t = tB, por loque el recepto~ no puede creer tal afirmación. Para ilustrar la terceraconciición necesaria, supongamos que las preferencias de los jugadoresson totalmente opuestas; z > x e y > w, .deforma que eltipo bajo:del emisor prefiere laacción alta y el tipo alto la. baja, Ep.t()nces,aJBle gustaría que el receptor <;reyera que t = tA, Y a tA le gustaría quecreyera que t. = tB, por lo que el receptor no puede creer ninguna deestas afirmaciones. En este juego con dos tipos y dos acciones, el únicocaso que cumple la primera y la tercera condiciones necesariasesx. ~~.ze y ~ 'W (los intereses ci~los jugadores están perfectamente alineados enel sentido de que, dado el tipo del emisor,jos jugCl~~rescoincideIl~l1Jaacción que debería tomarse) .. 'Formalmente, en un equilibrio bayesianoperfecto de separación de este juego COI1 parloteo, la estrategia del emisor:es [mUB) = tB,m(tA) ~ tAL las conjeturas deLreceptor son¡.t(tB!tB)."")y¡.t(tB\tA) = 0, y la estrategia del receptor. es [a{tB)= aB,aUA) ,= aA]'

Para que estas estrategias y conjeturas formen un equilibrio, cada tiPe>delemisor, tú debe preferir de~iI:la verdad, induciendo con ello la accióI.\ui'a mentir, induciendo con ello aj. Por lo tanto, un equilibrio cieseparaciónexistesiysólosix;:::iey~w.' .. ~ . ,';.,

Nuestro segundo ejemplo es un caso eSpecial del model~ de Craw-ford y Sobe!' Ahóra, lás espacios de tipos; mensajes y acciones son con-tinuos: el tipo del emisor se distribuye unifórni.emente entre cero y uno(formalmente, T = [0,1] Yp(t) = 1 para todo.terrT);,e1'espacio de men-sajes es el espacio de tipos (M = T); y el espacio de acciones es el inter-valo de cero a uno (A = [0,1]). La furiCión de ganancias del receptor esUR(t,a) = -(a - t)2, Yla del emisor es UB(t,a) :"':"-[a ~ (t+ b)]2, de formaque cuando el tipo del emisores t, la acción óptima del receptor es a ';"t,pero .1i:i acdón óptiina' del' e-mi'sores a. =- t + b. Por 10 tanto, diferentestipos dei emisor tienen diferentes preferencias respecto de las accionesdel receptor (más precisam~nte, tipos altos prefieren acciones altas), ylas preferencias de los jugadores no son completamente opuestas (másprecisamente, el parámetro b'> o mide la similitud de las preferencias de

', .... '

\',"

.•.

a=l

t + b

Otras aplicaciolles del equilibrio bayesiallo pa/écfo !219

Figura 4.3.2

Punto medio

U,(t,a)

Para completar la discusión de este equilibrio de dos escalones, trata-mos el tema de los mensajes que están fuera de la trayectoria de equilibrio.Crawford y Sobel establecen la estrategia (mixta) del emisor de (orn:a ~l~eestos mensajes no existan: todos los tipos t < X] escogen un mensajealeatoriamente de acuerdo con una dish'ibución uniforme en [O,X]); todoslos tipos t :?: X] escogen un mensaje ale'atoriamente de acuerdo con unadistribución uniforme en [xI,l]. Como hemos supuesto que M = '1', nohay ningún mensaje del que podamos estar seguros que no se enviará enequilibrio, por lo que el requisito 3 de señalización detemüna la conjeturadel receptor después de cualquier mensaje posible: la conjetu.ra del recep-tor después de observar cualquier mensaje de [O,X]) es que t se distribuyeuniformemente en [O,XI),y la conjetura del receptor después de observarcualquier mensaje de [xI,l] es que t se distribuye wUformemente en [:1;1,11.(El uso de distribuciones uniformes en la estrategia mixta del emisor notiene nada que ver con el supuesto de una distribución uniforme del tipodel emisor; la estrategia mixta del emisor podría utilizar también cualquierotra densidad de probabilidad estrictamente positiva sobre los intervalos

o Xl = 0/2) - 2&, Como el espacio de tipos es T = [0,1], T] debe serpositivo, por lo que un equilibrio de dos escalones existe sólo si .') < 1/4;para &:?: 1/4 las preferencias de los jugadores son demasIado cl1ferentespara permitir incluso esta comunicación tan limitada.

1 [X] X] + 1]Xl + b = 2: 2 + -2- ,

218 !JUEGOS DlNÁMICOS CON INFORMAClÓN'lrKOMPLETA (c. 4)

los jugadores, cuando b está cerca de tero los intereses de los jugadoresestán más alineados),

Crawford y Sobel demuestran que todos los equilibrios bayesianosperfectos en este modelo (yen una amplia clase de modelos relacionados) ,son equivalentes a un equilibrio de agrupación parcial dé la siguienteforma: el espacio de tipos está dividido en n intervalos [O,.');I),[XI,X2),'. "[xn_l,l]; todos los tipos en un mismo intervalo envían el mismo mensaje,pero tipos en intervalos diferentes envían mensajes diferentes, Comoindicamos anteriormente, un equilibrio de agrupación (n = U'siempreexiste, Demostraremos que, dado el valor del parámetro de similitud depreferencias b, ,existe uh número máximo de intervalos (o "escalones")que pueden darse en equilibrio, denotado poi n*(b), y existen equilibriosde agrupación parcial para cada n = 1,2,. , . ,n*(b), Una disminución de baumenta n*(b) (en este sentido, puede haber más comunicación a travésdel parloteo cuando las preferencias de los jugadores están más alineadas),Además, n*(b) es finito para todo b > 0, pero tiende a' ihfimto cuando btiende a cero (no puede existir comunicaciónperfect<:i a:no ser que laspreferencias de los jugadores estén perfecti¥llénte'alineadas),

Concluimos esta sección caracterizando este equilibrio de agrupaciónparcial, empezando con un equilibrio de dos escalones (n = 2) comoilustración. Supongamos que todos los tipos en el escalón [O,XI)envíanun mensaje mientras los que están en [xI,l] enví~n otro., Después derecibir el mensaje de los tipos [O,XI),el receptor creE;;ráque el emisor estádistribuido uniformemente en [O,XI),poi 10 que su'.acción óptima seráxJ/2;del mismo modo, 'después de recibir el mensaje de los tipos [Xi,l],la acción óptima del receptor será (Xl + 1)/2. Para que los tipos en [O/Xl)quieran enviar su mensaje, debe pasar que todos estos tipos prefieran laacción xJ/2 a (Xl+ 1)/2; del mismo modo, todos los tipos por encima deXl deben preferir (Xl+ 1)/2 a X] /2.

Puesto que las preferencias del emisor son simétricas con respecto asu óptima acción, el tipo t del emisor prefiere xJ/2 a (Xl+ 1)/2si el puntomedio entre estas dos acciones es mayor que la acción óptima de ese tipo,t + b (como en la figura 4.3.2),pero prefiere (x] + 1)/2 a Xl/2 si t + b es mayorque el punto medio. Por lo tanto, para que exista un equilibrio de dosescalones, Xl debe ser el tipo t cuya acción óptima t + b sea exactamenteigual al punto medio entre las dos acciones:

.tl

,",,'",:,"

:'".;.'

Olras aplicaciones del equilibrio bayesimlO pelfeclo ! 221

4.3.B Negociación sucesiva bajo información asimétrica

~. d + (d + 4b) + ... + [d + (n - 1)4b] = 1.

Utilizando el hecho de que 1 + 2 ~ ... + (n - 1) = n(n - 1)/2, tenemos que

(,

,\~.

(4.3.1)n . d + n(n - 1) . 2.b= 1.

Consideremos una empresa y un sindicato negociando sobre salarios.Para simplificar, supongamos que el nivel de empleo es fijo. El salario dereserva del sindicato (es decir, la cantidad que los miembros del sindicatoganan si no son empleados por la empresa) es wr. Los beneficios de laempresa, que <;ienotamos mediante 'Ir, se distribuyen uniformemente enhB,KA], pero el valor real de K es conocido sólo por la empresa. Estainfom1ación privada podría, por ejemplo, reflejar un mejor conocimiento

~. [1 + JI + (2/b)}.

Consistente con la derivación del equilibrio de dos escalones, n*(b) = 1para b ~. 1/4: no hay comunicación posible si las. preferencias de J<)Sjugadores son demasiado diferentes. Así mismo, corno hemos dicho aI\!~.s~n*(b) es decreciente en b pero tiende a infinito sólo cuandob tiende.acero: puede haber más comunicación a trav~s del parloteo cuand() l~spreferencias de los jugadores están más alineadas, pero no puede existircomunicación perfecta a no ser que las preferencias de los jugadores esténperfectamente alineadas.

Dado c~aiquiern tal que n(n -1). 2b < 1,existe' un vaJor de d c¡ue~óluci0I1a(4.3.1). Es decir, para cualquier n talque n(n-l).2b <1, existeunequilibrióde agrupació~parcial de n escalones, y la longitud del primer escalón esel valor de d que soluciona (4.3.1). Corno la longitud del primer escalóndebe ser positiva, el número máximo de escalones en este equilibri?, n *(b);es el valor másaIto den tal que n(n - 1) .2b < 1. Utilizando la fórmulade la ecu"ación "de segundo grado, se obtiene que n*(b) es el mayor enter?por debajo de

En un equilibrio de n escalones, si el primer escalón tiene una longi-tud ti,el segundo debe tener una longitud d + 4b, el tercero d + 8b Y asísucesivamente. El n-ésimo escalón debe acabar exactamente en 1, por loque de~emosterer

220/ JUEGOS DINÁM1COS CON INFORMACiÓN INCOMPLETA (e. 4)

Xk+l + :1;k ( b) C b2 - Xk + = 2: + ,

indicados.) Como alternativa al enfoque de Crawford y Sobel, podríamosdeterminar una estrategia pura del emisor pero escoger conjeturas del re-ceptor ['uera de la trayectoria de equilibrio. Por ejemplo, sea la estrategiadel emisor que todos los tipos t < Xl envíen el mensaje Oy que todos lostipos t ~ :1:1 envíen el mensaje Xl, y sea la conjetura del receptor fuerade la trayectoria de equilibrio después de observar cualquier mensaje de(0,:1:1) que t se distri~uye uniformemente en [O,XI), y después de observarcualquier mensaje de (Xl)] que t se distribuye uniformemente en [XI,1].

Para caracterizar un equilibrio de n escalones, aplicamos repetida-mente la siguiente observación sobre el equilibrio de dos escalones: elescalón superior, [Xbl], es 4b más grande que el inferior, [O,XI)' Esta ob-servación se deriva del hecho que, dado el tipo del emisor (t), su acciónóptima (t + b) es mayor que la acción óptima del receptor (t) en b. Porlo tanto, si dos escalones adyacentes tuvieran la misma longitud, el tipofrontera entre los escalones (Xl en el equilibrio de dos escalones) pre-feriría estrictamente enviar .el mensaje asociado con el escalón superior;efectivamente, los tipos ligeramente por debajo del tipo frontera tambiénlo preferirían. La única forma de hacer que el tipo frontera sea indiferenteentre los dos escalones (y conseguir con ello que los tipos por encima y pordebajo de la frontera prefieran estrictamente sus respectivos escalones) eshacer que el escalón superior sea convenientemente más grande que elinferior, de la siguiente forma.

Si el escalón [Xk-I,Xk) tiene una longitud de c (es decir, X* - Xk-l = c),

la acción óptima del receptor correspondiente a este escalón (concretamente, h;k + Xk_I)/2) está (c/2) + b. por debajo de la acción óptima del tipo.frontera Xk (concretamente, Xk + b). Para hacer que el tipo frontera seaindiferente entre los escalones [Xk-I,Xk) Y [Xk,Xk+I), la acción del receptorcorrespondiente al último escalón debe estar (c/2) + b por encima de laacción óptima para :¡;k:

o

Por lo tanto, cada escalón debe ser 4b más largo que el anterior.

};~

222 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

por parte de la empresa de los nuevos productos en fase de planificación.Simplificarnos el análisis suponiendo que wr = 1rB = O.

El juego de negociación dura dos periodos corno máximo. En el pri-mer periodo, el sindicato realiza una oferta salarial, Wl' Si la empresaacepta esta oferta el juego concluye: la ganancia del sindicato es Wl y lade la empresa 1r - Wl' (Estas ganancias son los valores presentes de lassucesiones de salarios y beneficios [netos] que los jugadores acumulan alo largo de la duración del contrato que se está negociando, normalmentetres años en Estados Unidos.) Si la empresa rechaza esta ofe~ta, enton-ces el juego pasa al segundo periodo. El sindicato realiza una segundaoferta salarial, W2. Si la empresa acepta la oferta, los valores presentes delas ganancias de los jugádores (medidas tm el primer periodo) so~ 8w~pa.:a el sindicato y 8('Ir- W2) para la empresa, dond~ 8 refleja tanto eldescuento corno la corta vida de lo que queda de contrato después deiprimer periodo. Si la empresa rechaza la segunda ofertadel sindicato,el juego finaliza y las ganancias son cera pÚa ambos jugado~es: Un mo-delo J!1ásrealista podría permitir que la I).egbci~cióneontinuara hasta queuna oferta fuéraaceptada, o podría obligar á las 'partes a someterse a unadecisión arbitral vinculante después de una huélga prolongada. AqtÚ sa-crificamos realismo para ganar claridad. (Véase Sobel y Takahashi [1983], y el ejercicio 4.12 para un análisis con horizonte infinito.)

Definir y hallar un equilibrio bayesiano perf~cto es algo eomplicado enestemodelo; pero la solución eventual es simpl'~;eintuitiva, Empezarnos,por lo tanto, esbozando el único equilibrio b!yesiano perfecto de estejuego. ' "'

• La oferta salarial del sindicato en el primer periodo es

• (2 - 8)2'11)1 = 2(4-38) 'Ir A.

• Si el beneficio de la empresa es mayor que

• 2w¡ 2 - 81rl = 2-8 = 4-"381rA

J~ empresa acepta wj; encaso contrario, la empresa rechaza wj.• SI su oferta es rechazada en el primer periodo, el sindicato actualizasu conjetura sobre los beneficios de la empresa: el sindicato cree que1r sedistribuye uniformemente en [O,irjJ. '

• La oferta salarial del sindicato en el segundo periodo (condicionada aque wj sea rechazada) es

Otras aplicaciol1es del equilibrio bayesial10 perfeclo ! 223

1rj 2 - Ó /' *UJ2 = 2 = -2-(4---3-Ó-) KA ,ltJ],

• Si el beneficio de la empresa, 1r, es mayor que 1))2' ésta acepta la oferta;en Caso contrario, la rechaza.

d . do las empresas con beneficios altos aceptanPor lo tanto, en ca a peno ,la oferta del sindicato, mientras que las de beneficios bajos la rechazan, yla oferta del sindicato en el segundo periodo refleja el hec~10de q~e lasempresas con beneficios altos aceptaron la oferta en e~pnme: p:n~do.(Nótese el ligero cambio en la terminología: n~s .refenr:mos l1llhstmta-mente a una empresa con muchos tipos de beneficlOs pOSIbleso.a.m~lchasempresas cada una con su propio nivel de beneficios.) En .eqUlhbno, lasempresas con beneficios bajos toleran una huelga de.un p:nodo para can-

al Sindicato de que tienen beneficios bajos e mduClr con ello a unavencer . d S'oferta salarial menor por parte del sindicato en el segundo pe~o o.. 111embargo, las empresas con beneficios muy bajos encuentran que mclus~;aoferta del segundo periodo es intolerablemente alta y, por tanto, tambIen

la rechazan.Empezamos nuestro análisis describiendo las estrategia~ y conjeturas

de los jugadores, tras lo cual definimos un equilibrio b~yesIano perfe:l:o.La figura 4.3.3ofrece una representación en forma extenSIVade una.ver.slonsimplificada del juego: sólo hay dos valores de 'Ir(1r B Y1rA), Yel smdlCatosólo tiene dos ofertas salariales posibles (lUB y WA)'

En este juego simplificado, al sindicato le co~espo~de decidir en tresconjuntos de información, por lo que su estrategIa conSIste en tres ofertassalariales: la oferta del primer periodo, WJ, y dos ofertas en el ,segundoperiodo, W2 después de que Wl = WA sea rechazada y W2 despues ~e queWl = WB sea rechazada. Estas tres decisiones tienen lugar en tres conjuntosde información con más de un elemento, en los que las conjetura.s delsindicato son (p,1 - p), (q,l - q) y (r,1 - r) respectivamente. En el J:legocompleto (a diferencia de lo que pasa en el juego simplicad~ de la fJ~ura4.3.3), una estrategia del sindicato es una oferta w~ en el pnmer pe:l0doy una función de oferta W2(Wl) en el segundo penado que deternuna laoferta lU2 a realizar después de que cada oferta Wl sea recha~:da. Cac~auna de estas decisiones tiene lugar en un conjunto de informaCll111COll.milsde un elemento. Hay un conjunto de in.formación en el seguJldo per~odopara cada oferta salarial que el sindicato podrí~ hacer e~:l pruner perto::lo(por lo que hay un continuo de conjuntos de mformaClon en vez de solo

•donde Prob{la empresa acepta w} = (íTI-'w) /íTl para los valores relevantes

maxUJ' Prob{la empresa acepta lO} + O. Prob{la empresa no acepta lO},w .' ;.

Otras aplicaciones del equilibrio bayesillno perfecto / 225

juego completo, denotamos la conjetura del sindicato en el primer periodo,mediante ¡¿l(íT), y la del segundo (después de que la oferta lOldel primerperiodo haya sido rechazada) con JL2(íTlwl).

Una estrategia de la empresa incluye dos decisiones (tanto en el juegosimplificado como en el completo). Sea Al (wll'lr) igual a uno si la empresaaceptase la oferta Wldel primerperiodo cuando su beneficio es íT;y cero sila empresa rechazase Wl cuando su beneficio es íT.Del mismo modo, seaA2(W2IíT/Wl)igual a uno si la empresa aceptase la oferta 'W2 del segundoperiodo cuando su beneficio es 'Iry la oferta del primer periodo fue lOl,Ycero si la empresa rechazase '!U2 en tales circunstancias. Una estrategia dela empresa es un par de funciones [Al(lOll-ir),A2(102iíT,lOl)J.Puesto que laempresa tiene informa~ióncorripleta durante iodo el juego, sus có~jehIiasson triviales.

Las estrategias ['Wl/W2(lOl>fy [Al(WllíT),A2(W2IíT,Wl)],y las conjetur~s[JL 1(íT), J.l2(íTIWl)] constituyen un equilibrio bayesiano perfecto si satisfacen'los requisitos 2,}, y4 dy las.ección 4.1. (El requisito 1 se satisfac~:p~Ila simple existencia de las~onjeturas del sindicato.) Vamos aªe~?straEque existe un único equilibrio bayesiano, perfe00, L(1parte ITI~j'~~Hlfdel arguplentoes aplicar el reqllisito 2 ala decisiónd~la empr~:;;aen.elsegundo periodo A2(102IíT/Wl): puesto q~~ é~te. es ei, liltimo'Il}?~iirri:i~\~.del juego, la d,ecisión óptima de la empresa es aceptar lO2 sLY:.,~ólo.~~íT~ lO2; lOl es irrelevante. Dada ~sta parte de la estrategia dela e~p're~~:es inmediato aplicar el requisito 2 a la elec~ión' de' ~na ~ferta:sai~íiÍ;por parte del sindicato en el segundo periodo:.102 deb~rí~ ffi'~t'/:i~:,,'

• ,. ,,- •• - • -,>. - -' - ".!"'''''~-'''''~'''''''!~h~t:};..:~~::-

ganancia esperada pore~ sindic~to, dada la contetura d~~~~~ J:?-L7rJ'W~r,x:;:.',' , ;'"la consiguiente estrategia de la empresa A2(10217l:,lOl)' :L,apart;e WáE¡.iPHPI;~;",;t;¡"1:;,:,..1.".,,,

- '_. - _. o'" - .,..>.',~_ ...•,..•.'-'>.":".~,.":'~~~;:~~~~:.;-._~.~~::.,.~..~:.~-',.:.-.-~'

del argumento es deterIninar la c;onjetura JL2(:r1'UJ1)d~f_Il1od(),.~igpf~I1t.~;J]~:t'?,¿~?~~)Comenzamos considerando momentáneamen,t~ el siguiel.'\te,P¿ll~lZ~:""" , ...

de negociación de un periodo, (Utilizaremos IJ;lástarsIe l?s~e.~~t~~P~,ªtr'este problema como la solución en el segundo periodo del juegomndosperiodos.) En el problema con un periodo/supo~garnos que.~_s~~~~i?cree que el beneficio de la empresa se distribuY~UI;iformement.é en [9~1[Adonde íTl es por el momento arbitrario. Si el sindicato ofrece ,w, la mej?Xrespuesta de la empresa, es clara: aceptar lO~iys910 si íT~ 'w. Por lotapt9'el problema del sindicato puede formularse co~o:; ",,' ..

'.....

OO

,WE}

7tH '- wB

OO

OO

s

O. lO"

O IT, - lO,

lO,1t.~- IVg

lO,lC,1 - wa

Figura 4.3.3

Azar

oO

OO

E

224/ JUeCOS DIN;íMICOS CON INFOI<,\IACláN INCOMPLETA (c. 4)

dos com.o en la figura 4.3.3). En cada conjunto de información, la conjeturadel sIndIcato es una distribución de probabilidad sobre estos nodos. En el

.......

,',', ,~,',

....}

226 / JUEGOS DINÁMICOS CON lJ'JFORMAClÓN INCOMPLETA (e. 4)

de las ofertas salariales (concretamente, O ~ W ~ 7fl)' La oferta salarialóptima es, por lo tanto, W*(7fl) = 7f1l2.

Volvemos ahora (definitivamente) al problema con dos periodos. De-mostramos en primer lugar que, para valores arbitrarios de Wl y W2, si elsindicato ofrece Wl en el primer periodo y la empresa espera que ofrezcaW2 en el segundo periodo, todas las empresas con beneficios lo suficien-temente altos aceptarán Wl y todas las demás lo rechazarán. Las posiblesganancias de la empresa son 7f-Wl por aceptar '11)1, Ó(7f- W2) por rechazarWl y aceptar W2, y cero si rechaza ambas ofertas. Por lo tanto, la empresaprefiere aceptar Wl a aceptar W2 si 7f- Wl > ó(7f - W2), o

: ;- ~y la empresa prefiere aceptar W1a rechazarlas do~oferta~ si 7f-W1 >O.porlo tanto, para valores arbitrarios dewl y W2, empresas con 1i" >máx{ 7f*(Wl,W2), Wl} aceptarán Wl y empresas con 7f <1l].!,\x{7r*(Wl,Wi),W1} lo recha-zarán. Como elrequisito 2 establece que la éinpresa actúa óptimamentedadas las subsiguientes estrategias de los jugadores, podemos obtenerAl (wll7f)para un valor arbitrário de '11)1: empresas con 'Ir>max{ 7f*(-Wl,'U)2),wt} aceptarán Wl y empresas-con 7f <~ax {7f*(Wl, W2),wt} lo rechazarán,donde W2 es la oferta salarial del sindicato,en el segundo periodo W2(Wl).

Podemos ahora obtener f-l2(?rlwl);la éonjetura del sinc;licatoen el se-gundo periodo en el conjunto de iÍ1.formaciónal que se llega si la oferta Wldel primer periodo es rechilza-dir. El requisito 4 implica que la conjeturacorrecta es qué ?rosedistribuya uniformemente en [O,7f(Wl»),donde 7f(Wl)

es el valor de 7fque hace que la empresa sea indiferente entre aceptarWl y rechazarlo para aceptar f;;ierta ópti~a del sindicato en el segundoperiodo dada esta conjetura (concretamente, W"(7f(Wl» = 7f(wl)/2, comoobtuvimos en el problema de un periodo), Para ver esto, recordemosque el requisito 4 establece que la conjetura del sindicato debe obt~nersea partir de la regla de Bayes'y de la estrategia de la empr~sa. Por lotanto, dada la primera parte-de la estrategia de la empresa A1(WII7f)queacabamos de hallar, la conjetura del sindicato debe ser que los tipos quequedan en el segundoperiode;se distribuyen uniformemente eiJ.[O,7fl],donde?rl =max{7f*(W},W2),Wt} y W2 es la oferta salarial del sindicato enel se~do periodo W2(Wl).Dáda esta conjetura, la oferta óptima del sin-dicato en el segundo periodo debe ser W"(7fl) = 7ft/2, lo que proporcionauna ecua,q.ón implícita de 7flen,función de Wl:

Otras aplicacio'l1es del equilibrio bayesiano perfecto / 227

7fl= max{7f"(w¡,7f,j2),Wl}'

Para resolver esta ecuación implícita, supongamos que Wl ~ 7f"('U],irtl2).

E t - lo que contradice Wl > 7f*(Wl,7fl/2). Por lo tanto,nances 7fl - Wl, -

Wl < 7f"(W},7fl/2),de manera que 7fl= 7f*(1JJl:¡r¡j2),o

21JJl Wl7fl(Wl)=2_ó Y W2(w1)=2_ó'

Hemos reducido el juego a un problema de optimización en un pe-riodo para el sindicato: dada la oferta salarial del sindicato en el prime.rperiodo, 1JJl,hemos hallado la respuesta óp~m~ ~e la empresa en e~pn-mer periodo, la conjetura del sindicato al pnnc~plO del segundo p:n~do,la oferta óptima del sindicato en el segundo penado y la respuesta 0.pt1ll1ade la empresa en el segundo periodo. Por lo tanto,.l,a oferta salanal delsindicato en el primer periodo debería ser una soluclOn de

max. Prob{la empresa acepta 1IJ¡}w¡

+ ÓW2(Wl) . Prob{la empresa no acepta Wl pero acepta 1JJ2}.

+ Ó . O. Prob{la empresa no acepta 71Jlni W2}'

Nótese que Prob{la empresa acepta IUl}no es simplemente la probabilidadde que 7fsea mayor que Wl, sino la probabilidad de que 7fsea mayor que

7fl('11)1):

7fA - 7fl(Wl)Prob{la empresa acepta w¡} =7fA

La solución de este problema de optimización es wi, dado al principio delanálisis, y ~i ywi, dados por 7f¡(llJÍ)YW2(Wi> respectivamente,

4.3.C La reputación en el dilema de los presos repetido finitamenle

En el análisis de los juegos con información completa repetid~s finitaJ~el.'tede la sección 2.3.A, demostramos que si un juego de etapa tIene un UnJcoequilibrio de Nash, cualquier juego repetido finitamente basa~o en estejuego de etapa tiene un único equilibrio de Nash perfecto el~~u~Juegos: encada etapa, después de cualquier historia, se juega el eqUIlIbno de Nashdel juego de etapa. En contraste con este resultado teórico, buena parte. ~ela evidencia experimental sugiere que frecuentemente se da cooperacJOl1

228/ JUEGOS DIN'>'MICOS CON INFOllMACIÓN INCOlvlPLETA (e. 4)

en dilemas de los presos repetidos finitamente, especialmente en etapasque no están demasiado cerca del final. (Véase algunas referencias enAxelrod [1981].) Kreps, Milgrom, Roberts y Wilson (1982) demuestranque un modelo de reputación ofrece una explicación de estos hechos.8

La explicación más simple de un equilibrio de reputación en el dilemade los presos repetido finitamente incluye una manera nueva de modelarla información asimétrica. En lugar de suponer q\le un jugador tieneinformación privada sobre sus ganancias, supondremos que el jugadortiene información privada sobre sus estrategias factibles. En particular,supondremos que con probabilidad p, el jugad~)Tfilapuede jug~sqlo l?estrategia del Talión(tit-fot-tat) (qll~empieza el juego repetido cooperandoe imita en lo sucesivo la jugada q~lterior de su oponente), rnjent:rasquecon probabilidad 1 - pel jugadqr fila puede utilizar cualquit:~rade lasestrategias disponibles en eljuego rep~tido infinitamente (incluida la delTalión). De acuerdo con la terminología habitual, llamaremos "racional"al jugador fila. La ventaja expositiva de esta fommlaciónse debe al hechode que si el jugador fila se desvía alguna vez de la estrategia del Talión,pasa a ser información del dominio público que el jugador fila es radonal.

La estrategia del Tali9n es simple y atractiva, y fue además la ganadoraen el torneo del dilema de los' presos de Axelrod. No obstante, se podríacuestionar el supuesto de que un jugador tiene sólo una estrategia, inclusosi ésta es atractiva. A costa de perder algo de simplicidad expositiva, sepodría suponer que ambos tipos del jugador fila pueden jugar cualquierestrategia, pero con probabilidad p las ganancias del jugador son talesque la estrategia del Talión domina a cualquier otra estrategia del juegorepetido. (La exposición se complica bajo este supuesto, porque una des-viación de la estrategia del Talión no hace que sea información del dominiopúblico que el jugador es racional.) Estas ganancias difieren de las que sesuponen nomlalmente en los juegos repetidos: para que la inütación de ladecisión previa del jugador columna sea un óptimo, las ganancias en esteperiodo del jugador fila deben depender de la jugada del jugador columnaen el periodo anterior. Como tercera posibilidad (de nuevo a costa de sa-crificar simplicidad expositiva), se podría permitir que un jugador tuvief~información privada sobre sus ganancias en el juego de etapa, per()i~istir

8 Demo>tramos en la sección 2.3.Bque puede existir cooperación en el dilema de ló~pre'sosrepetido infinitamente. Algunos autores se refieren a tal equilibrio como un equilibrio de"reputación", aun cuando las ganancias y oportUnidades de ambos jugadores son informacióndel dominio público. Por claridad, se podría describir ese equilibrio cómoun:~qciIibri~basado en "amenazas y promesas", reservando el término "reputación" a los jt¡egb~ 'en'losque al menos un jugador tiene algo que aprender sobre otro, como ocurre en esta sección: .,

Otras aplicaciones del equilibrio bayesiano perfecto / 229

en que la ganancia en una etapa dependa sólo de las jugadas de esa etapa,y que la ganancia total del juego repetido sea la suma de las ganancias encada una de las etapas del juego. En particular, se podría suponer quecon probabilidadp la mejor respuesta del jugador fila a la cooperaciónes la cooperación. Kreps, Milgrom, Roberts y Wilson (KMRW en lo su-cesivo) demuestran que la existencia de información asimétrica unilateralde este tipo no es suficiente para producir la cooperación en el equilibrio;al contrario, no cooperar (confesar) es lo que ocurre en cada etapa, al igualque bajo información completa. Sin embargo, también demuestran que sila asimetría informativa es bilateral (es decir, existe también una proba-bilidad q de qli.e'la mejor respu~sta del jugador columna a la cooperaciónsea la cooperación) puede existir entonces un equilibrio en el que los dosjugadores cooperen hasta que¡;¡uede muy poco para que el juego se acabe.

Para repetirlo otra vez, supondremos que con probabilidad p el juga-dor fila sólo puede jugar la estrategia del Talión. El espíritu del análisisde KMRW' es que' incluso si p es muy pequeña (es decir, incluso si eljugador' coÚlrnna tiene sólo una ligera sospecha de que el jugador filapodría no ser racional) ,ésta incertidumbre puede tener un gran 'efecto"e:nel siguiente sentido. KMRW demuestran que existe una cofa superior,.alnúmero de etapas en las que algún jugador no coopera en equilibrio. Estacoti;lsuperior depende de p y de las ganancias en el juego de etapa, perono del número de etapas en el juego repetido. Por lo tanto, en cualquierequilibrio de un juego repetido lo suficientemente largo, la fracción deeta-pas en las que ambos jugadores cooperan es grande. (KMRWestablecensu resultado para el equilibrio sucesivo, pero sus argumentos tamb~~~~epueden aplicar al eq\lilibrio bayesiano perfecto.) Dos pasos claveel1 ~largumento de KMRW son: (Osi el jugador fila se desvía de la estrategiadel Talión,.pasa a ser información del dominio público que el jugador esracional, por lo que ningún jugador' cooperará en lo sucesivo, de maneraque el jugador fila racional tiene un incentivo para imitar la estrategia delTalión, y (ii) dado un supuesto que i.I;npondreJI,t,osmás,adelante sobre lasganancias del juego de etapa, la mejor respuest¡¡ del jugador columna a la~stategia del Talión sería coope~ar hasta. la última etapa del juego. .

Para entendeú:uálésson los elementos básicos del modelo de KMWR,con~iderarem~s eicompieII1ertt?riricie su ~áliSis:.en lugar de suponer q~ep es baja y analizar los juegos rep,etldc,>sdelarga duración, supondremosqlle p es lo suficientemente alta ~oIl1oyara que exista un equilibrio de.un juego repetido corto en el qud9!i dos jugadores cooperen en todas lasetapas menos en las dos úl9~Ilél.~,Empezamoscon el caso de dos periodos.. . .

(.

1\

,(

230 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

Figura 4.3.4

(4.32)

X

NCNC

1=2

Figura 4.3.5

1=1

p + (1 - p)b ¿ O.

Estrategia del Talión C

Jugador racional fila NC

Jugador columna X

1=1 1=2 1=3

Estrategia del Talión C C C

Jugador racional fila C NC NC

Jugador columna C C NC

Figura 4.3.6

Supondremos en lo sucesivo que (43.2) se cumple.

Escogiendo X = O, el jugador columna recibe la ganancia esperadap . 1 + (1 - p) . b en el primer periodo, y p . a. en el segundo. (Cmno laestrategia del Talión y el jugador fila racional eligen jugadas diferentesen el primer periodo, el jugador columna empezará el segundo periodosabiendo si el jugador fila es racional o juega la estrategia del Talión. Laganancia esperada en el segundo periodo p . a refl~ja la incertidumbredel jugador columna sobre el tipo del jugador fila a la hora de decidir sicooperar o no en el primer periodo.) Escogiendo X = NO, en cambio, eljugador columna recibe p . a en el primer periodo y cero en el segundo.Por lo tanto, el jugador columna cooperará en el primer periodo siempreque

Olras aplicaciones riel equilibrio bayesillllO perfecto / 231

íinitada por la estrategia del Talión en el segundo periodo, como se ve enla trayectoria de equilibrio en la figura 4.3.5.

-, .,:

1,1 b,a

a,b 0,0

Cooperar

ColumnaCooperar,No coop~rar

Fila

1. El azar determina un tipo para el jugador fila. Con probabilidad p, eljugador fila sólo dispone de la estrategia del Talión; con probabilidad1 - p, puede jugar cualquier estrategia. El jugador fiJase entera de sutipo, pero el jugador columna no se entera del tipo del jugador fila.

2. Los jugadores fila y columna juegan al dilema de los presos. Susdecisiones en esta etapa pasan a ser información del dornini.o público.

3. Los jugadores fiJa y columna juegan al dilema de los presos por se-gunda y última vez.

4. Se reciben las ganancias. Para el jugador fila racional y el jugadorcolumna éstas son la suma (sin descuento) de sus ganancias enJas dosetapas. El juego de etapa se presenta en la figura 4.3:4.

No cooperar

Al igual que en el último periodo de un dilema de los presos rejJetidofinitamente coninformación completa, no cooperar (NO) dórñiliaestriéctamente a cooperar (O) en l~última etapa de este juegod~ dos'peii6doscon información incompleta; tanto para el jugador fila r.;tcionalc?mo parael jugador columná. Dado que el jugador columna no coopetaráen"laúltima etapa, no existe ninguna razÓn para que el jug~dorfila r~éional10hagaen larrimera etapa. Ahora bien, la estrategia delTaliÓn empiezael juego con cooperación. Por lo tanto, la única decisi6n que hace faltadeterminar es la del jugador columna en el primer periodo, (X), 'que será

Para hacer de este juego de etapa un dilema de los presos, suponemos quea > 1 yb < O.KMRWtambién suponen que a + b< 2,de forma que (comoindicamos anteriormente en (ii» la mejor respuesta del jugador columnaa la estrategia del Talión es cooperar hasta la últíini'etápa del juego; enlugar de ir alternando entre cooperar y no cooperar.

El desarrollo temporal es:

")

"o ";

Otras aplicaciones del equilibrio bayesiano pe/feelo / 233

1+ p + (1 - p)b + pa ~, a + b + pa.

Dada (4.3.2), una condición suficiente para que el jugador columIla no sedesvíe 'es ' , ';!

(,

,,','o',,-;.",

(4.3.3)

'(4.3.4)

1+ pa ~ a.

a+b:::;1.

1= 1 1= 2 1= 3¡-.

Estrategia del Tali6n e NC eJugador raCional fila C NC NC

Jugador columna' NC C NC"---'

Figura 4.3.8

Dada (4.3.2), una condición suficiente para que el jugador columna no sedesvíe es

Alternativamente, el jugador columna podría desviarse no cooperandoen el primer periodo pero cooperando en el segundo, en cuyo caso laestrategia del Talión cooperaría en el tercer periodo, por lo que el desarrollodel juego sería como se indica en la figura 4.3.8. La ganancia esperada deljugador columnap?r esta desviación es a + b + pa, que es menor que sugélnanciaesperada en' equilibrig siempre que

Hemos demostrado que si (4.3.2), (4.3.3)y (4.3.4) se cumplen, el desarrollodel juego descrito en la figura 4.3.6 es la trayectoria de equilibrio de unequilibrio bayesiano perfecto del dilema de los presos con tres periodos.Dado un valor dep, las ganancias ay b satisfacen estas tres d'esigualdadessi pertenecen a la región sombreada' d&la;figura 4.3.9. A medida que ptiende a cero, la regtónsombreadaq,esapare.ce,consistentemente con laobservación anterior de queeri~stasecci6nanalli:amos la cooperación enel equilibrio en juegos cort~s con valores altos de p, mientras que KMRW~e centran en juegos de larga duración con valores bajos de p. Por otraparte, si p es lo suficieht~mentealta. como para sustentar la cooperaciónen un juego corto, es suficientemente' alta para hacerlo en un juego largo.

1= 1 1= 2 1=3

Estrategia del Talión C NC

Jugador racional fila C NC NCJugador columna NC NC NC

Figura 4.3.7

Consideremos ahora el caso con tres periodos. Dado (4.3.2), si eljugador columna y el jugador fila racional cooperan en el primer periodo,la trayectoria de equilibrio en el segundo y tercer periodos vendrá dadapor la figura 4.3.5, con x= e y los números de los periodos cambiados.Derivaremos condiciones suficientes para que el jugador columna' y elJugador fila racional cooperen en el primer periodo, como se indica en latrayectoria de equilibrio de tres periodos en la figura 4.3.6.

En este equilibrio, la ganancia del jugador fila racional es 1 + a y la8.anancia esperada del jugador columna es 1+p+ (1- p)b+pa. Si el jugadortila racional no coopera en el primer periodo, pasa a ser información deldominio público que el jugador fila es racional. Por lo tanto, la 'gananciadel jugador fila racional por no cooperar en el primer periodo es a~'quees menor que la ganancia 1 + a de equilibrio, por lo que el jugador filaracional no tiene incentivos para desviarse de la estrategia implícita en lafigura 4.3.6.

1 + p + (l - p)b + pa ~ a.

232/ JUECOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

Nos ocupamos ahora de si el jugador columna tiene algún inéentivopara desviarse. Si el jugador columna no coopera en el primer periodo;la estrategia del Talión tampoco lo hará en el segundo, y el jugador fila~'acional no cooperará en el segundo periodo, porque es' seguro que' elJugador columna no lo hará en el último periodo. No habiendo cooperado,en el primer periodo, el jugador columna debe decidir si cooperar o noen ~l segundo periodo. Si el jugador columna no coopera en el segundÓ?enodo, la estrategia del Talión tampoco lo hará en el tercero, por lo queelJuego se desarrollará corno indica la figura 4.3.7. La ganancia deljugadorcolumna por esta desviación es a, que es menor que su ganancia esperadaen equilibrio siempre que

(43.5)2 + [T.- (t + 2) - 11+ p + (1 - p)b + pu.

a + b + [T - (t + 2) - 1] + 11 + (1 - p)b + pa,

Otras aplicaciol1es del equilibrio bayesiano perfecto / 235

que es menor que la ganancia de equilibrio del jugador columna en losperiodos t a T,

en el periodo T - 1, o (T - t - 1) + u, por lo que no cooperar no resultarentable para ningún t < T - 1. El argumento referente a.la figura 4.3.5implica que el jugador fila racional no tiene incentivos para desviarse enlos periodos T - 1 o T.

Demostramos a continuación que el jugador columna no tiene incenti-vos para desviarse. El argumento referente a la figura 4.3.5 significa que eljugador columna no tiene incentivos para desviarse cooperando hasta elperiodo T - 2 Ydejando de cooperar en el periodo T -1; el argumento re-ferente a la figura 4.3.6 implica que el jugador columna no tiene incentivospara desviarse cooperando hasta el periodo T - 3 Ydejando de cooperaren el periodo T - 2. Por lo tanto, necesitamos demostrar que el jugadorcolumna ha tiene incentivos para desviarse cooperando hasta el periodot - 1 Ydejando de cooperar en el periodo t, donde 1 ::; t ::; T - 3.

Si el jugador columna no coopera en el periodo t, la estrategia delTalión tampoco lo l~ará en el periodo t+ 1, por 10 que el jugador fija racionaltampoco lo hará (ya que no cooperar domina estrictamente a cooperar enla (t + 1)-ésima etapa del juego, después de lo cual no cooperar de t + 2a T proporciona una ganancia cero como mínimo, mientras que cooperaren t + 1 haría que fuera información del dominio público que el jugadorfila es racional, resultando en una ganancia de exactamente cero a partirde t.+ 2 hasta T). Dado que tanto la estrategia del Talión como el jugadorfila racional cooperan hasta elperiodo t y dejan de cooperar en el periodot + 1, la conjetura del jugador columna al principio del periodo f; + 2 esque la probabilidad de que el jugador fija sea la estrategia del Talión esp. Por lo tanto, si el jugador columna coopera en el periodo t + 1, el juegode continuación que etnpiezaen el periodo t + 2 será. idéntico a un juegode T periodos con T = T - (t + 2) + l. Por la hipótesis de inducción; existeun equilibrio cooperativo en este juego de continuación de T periodos;supongamos que se juega este equilibrio. Entonces1a ganancia del jugadorcolumna en los periodos t a T por no cooperar en el periodot y.cooperaren el periodo t + 1 es

a

. ~

a=l/(l-p)

Figura 4.3.9

a=lb

b = -p/(l-p)

Apéndice"'c ",

Por razón de brevedad, nos referiremos a un e4u¡libri~~1yeSianoperfedOdel dilema de los presos repetido T periodos, como un equilíbrio cooperativosi el jugador fila racional y el jugador columna cooperan hasta el periodoT - 2, tras lo cual los periodos T - 1 Y T se describen en la figura 4.3.5.Vamos a demostrar que si Ct, by p satisfacen (4.3,2),.(4.3.3) y (4.3.4), existe~nequilibrio cooperativo para cada T.;> :3 finito. Argumentamos pormducción: dado que para cada T = 2, 3, ... ,T ~ 1 existe un equilibrio coo-perativo en el juego con T periodos, demostramos que existe un equilibriocooperativo en el juégo con T periodos.;. .... ..'

Demostramos primero que el jugador fila raCio~~l no tiene incentivospara desviarse del equilibrio cooperativo en el juego con T periodos, Siel jugador fila no fuera a cooperar en ningún periodó t < T'- 1, llegaría aser del dominio público que el jugador fila esracional, por ló que recibiríauna ganancia a en el periodo t y cero en cada periodo siguiente. Pero laganancia en equilibrio del jugador fila es 1 en los periodos t a T - 2, Y a

234 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

Formalmente, si a, by p satisfacen (4.3.2), (4.3.3) Y (4.3.4), para cualquierT > 3 finita existe un equilibrio bayesiano perfecto en el juego repetido Tperiodos, en el cual el jugador fila racional y el jugador columna cooperanhasta el periodo T - 2, tras el cual los periodos T - 1 YT son tal como sedescriben en la figura 4.3.5. (Véase el apéndice para una demostración deesta afirmación.)

22

o1

1O

Figura 4.4.1

oO

---------------2 ------731

extensiva, ambos equilibrios de Nash sOn perfectos en subjuegos. En u,1') el conjunto deinformación del jugador 2 está en la trayectpri", de equilibrio, por lo que el requisito 3 estableceque p = L En (D,D') este conjunto d~ infqrm,!.ción está fuera de la trayectoria de. equilibrio,pero el requisito 4 no impone ningúna restricción a p. Por lo tanto, sólo requerimos que laconjetura p de 2 haga que la acción D' sea óptima, es decir, p ~ 1/2.

D

Otras dos características de este ejemplo merecen una breve mención.En primer lugar, aunque C está estrictamente dominada, 1 no. SiEestu~viera estrictamente dominada (corno ocurriría si la ganancia de 3por partedel jugador 1 fuera, por ejemplo, 3/2) el mismo argumento implicaría queno es razonable que p sea positiva, lo que implica que p debe ser cero, peroesto contradiría el resultado anterior de que p debe ser uno.,.En tal caso,este requisito no restringiríé! lqs conj~turas fuera del equilibrio d~i jugador2. (Véase la definición formal'que damos más adelante) , .

,. .í .. 1 .,_,' o. •

En segundo lugar, el ejemplo no ilustra el requisito .~escrito inicial-mente, porque C no sólo está estrictamente dC;IDinadaa partir de algúnconjunto de info~ación, sino estrjctarr;f~t~~ominada en el sentido más

Refinamientos del equilibrio bayesimlO perfecto / 237

. "~.

el jugador 1 C es una estrategia estrictamente dominada: la ganancia de 2por utilizar D es mayor que cualquiera de las ganancias que el jugador 1recibiría por utilizar C, Oy 1. Por tanto, no es razonable que el jugador 2crea que el jugador 1puede haber elegido C; formalmente, no es razonableque 1 - p sea positivo, por lo que p debe ser igual a 1. Si la conjetura1 - p > O no es razonable, tampoco lo es el equilibrio bayesiano perfecto(D,D',p ::;1/2), quedando (I,I',p = 1) como el único equilibrio bayesianoperfecto que satisface este requisito.

D6 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA Ce. 4)

a + b + [1' - (t + s + 2) - 1] + p + (1 -p)b+ pg,

que es, de nuevo, menor que (4.3.5).

Hasta ahora hemos demostrado que el jugador columna no tiene in-centivos para desviarse cooperando hasta el periodo t - 1 Ydejando decooperar en el periodo t, dado que se jugará el equilibrio cooperativo enel juego de continuación que empieza en el periodo t + 2. Más en general,el jugador columna podría cooperar hasta el periodo t - 1, no cooperaren los periodos t a t + s y volver a cooperar en el periodo t + s + 1. Haytres casos que son triviales: (1) si t + s = T (es decir, si el jugador columnanunca coopera después de no haberlo hecho en el periodo t), la gananciaes a en el periodo t y cero en lo sucesivo, que es menor que (4.3.5); (2) sit + s -1- 1 = T, la ganancia del jugador colunma de t a T es a + b, peor queen (l), y (3) si t + s + 1 = T - 1, la ganancia del jugador colunma de t a l'es a + b + pa, que es menor que (4.3.5). Quedan por considerar los valoresde ~ para los que t + s + 1 < l' - 1. Al igual que en elcaso anterior cons = O, existe un equilibrio cooperativo. en el juego de. continuación queempieza en el periodo t + s + 2; supongamos que se juega este equilibrio.Entonces, la ganancia del jugador columna en los periodos ta T por jugaresta desviación es

. 9Derivar la representación en forma nonnal revela que existen en este juego dos equili-bnos de Nash con estrategias puras: ([,JI) y (D,D/). Puesto que no hay subjuegos en la forma

4.4 Refinamientos del equilibrio bayesiano perfecto

En la sección 4.1 definimos un equilibrio bayesiano perfecto como las es-trategias y las conjeturas que satisfacen los requisitos 1 a4, y'observamosque en tal equilibrio ninguna estrategia de ningún jugador puede estar es-trictamente dominada a partir de ningún conjunto de información. Ahoraconsideramos dos requisitos adicionales (sobre conjeturas fuera de la tra-yectoria de equilibrio), el primero de los cuales formaliza la idea siguiente:puesto que un equilibrio bayesiano perfecto impide que el jugador i jue-glIe una estategia estrictamente dominada a partir de algún conjunto deinformación, no es razonable que el jugador j crea que i utilizará esaestrategia.

Para concretar más esta idea, consideremos el juego de la figura 4.4.1.Existen dos equilibrios bayesianos perfectos en estrategias puras: (I,I',p =

1) y (D,D',p ::; 1/2).9 La característica clave de este ejemplo es que para

Refil1amiel1lus riel equilibrio bayesial10 perfecto / 239

1,

1,

3,2a

[pI

b2,0

Receptor

1,0

[}- pI 1

1,1

Figura 4.4.2

Corno segunda ilustración del requisito 5 consideremos el juego eleseñalizacion de la figura 4.4.2. Al igual que en la sección 4.2.A, la estrate-gia del emisor (m',m") significa' que el tipo t1 elige el mensaje m' y el tipot2 elige m",y la esti:ategiá elel receptor (a' ,a") significa que el receptor eligela acción a' siguiendo a J y a" siguiendo a D. Es inmediato comprobar quelas estrategias y conjeturas [(I,I),(7J"d),p = O,5,q] constituyen un equilibriobayesiano perfecto eleagrupación para cualquier q ~ 1/2. Sin embargo, lacaracterística esencial de este juego de señalización es que no tiene sentidoque t1 elija D. Formalmente, las estratégias del emisor (D,I) y (D,D) (esdecir, las estrategias en las cuales tI elige D) están estrictamente domj-

La expresión "si es posible" en el requisito 5 incluye el caso que podríaplantearse en la figura 4.4.1 si D dominara tanto a e corno a J, comoocurnría si la ganancia de 3 del jugador 1 fuera 3/2. En tal caso, elrequisito 1 precisa que el jugador 2 tenga una conjetura, pero no es posibleque esta conjetura asigne una probabilidad cero a los nodos que siguen ae y a J, por lo que el requisito 5 no se aplicaría en este caso.

Requisito 5. Si es posible, cada una de las conjetllras del jugador fuem de Intrayectoria de equilibrio debería asignar una probabilidad cero a los nodos quese alcanzan sólo si otro jugador utiliza una estrategia que está estrictamentedominada a partir de algún conjunto de información.

pleno. Para ver la diferencia, recordemos de la sección 1.1.B que unaestrategia .5; es estrictamente dominada si existe otra estrategia Si tal quepara cada posible combinación de estrategias de los demás jugadores, laganancia de 'i por jugar Si es estrictamente mayor que la ganancia porjugar s;. Ahora consideremos una versión expandida del juego en lafigura 4.4.1, en la cual el jugador 2 tiene que jugar antes que el jugador 1,y cuenta con dos opciones en esta jugada ihÍcial: acabar el juego o pasarel control de éste a 1 en el conjunto de información de 1 tal como apareceen la figura. En este juego expandido, e está aún estrictamente ltominadaa partir de algún conjunto de información, pero no está estrictamentedominada, puesto que si 2 termina el juego en el nodo inicial, J, e y Dobtienen la misma ganancia.

Puesto que e está estrictamente dominada en la figura 4.4.1, no esrazonable que el jugador 2 crea que 1 puede haber elegido e, pero la do-minancia estricta es una condición demasiado fuerte y, por lo tanto, haceque este requisito sea demasiado débiL (Puesto que hay más estrategiasestrictamente dominadas a partir de algún conjlmto de información queestrategias estrictamente dominadas,. requerir, qÍié, jno !=reaque. i puedehaber elegido una de las primeras pone más restricciones sobre las con-jeturas de j de las que habría si j no creyera que i pueda haber utilizadouna de las últimas.) Seguidamente, nos quedarnos con el requisito talcorno lo enunciamos originalmente: el j';lgador j no debería creer queel jugador i ha elegido una estrategia estrictamente domÍ1;ada a partir dealgún conjunto de información. A continuación enunciamos este requisitoformalmente.

Definición. Consideremos un conjunto de información en el cual le toca deci-dir al jugador i:" La estrategia s; está estrictamente dominada a partir deeste conjunto de. información s(existe otra estrategia Si tal que, para cadaconjetura que pudiera fonnarse i 'e-n el conjunto de información' dado, y paracada posible combinación' de las esttaiegiils subsiguientes de .los otros jugadores(donde una "estrategia subsiguiente" es un plan completo de acción que cubrecada contingencia que pudiera presentarse una vez se ha alcanzado el conjuntode inforrr;zacióridado) la ganancia esperada de i al tomar la acción indicada por Si

en el conjunto de información dado 'y al jugar la estrategia subsiguiente indicadapor Si és :estr,ictamente ;nayor que la ganancia esperada al tomar la acción y jugarla estrategia subsiguiente especificadas por s;.

238 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

",

Refinamientos del equilibrio bayesiano perfecto / 241

En el juego de señalización "cerveza y quiche", elemisor es uno de losdos tipos: t¡ ="cobardica" (con probabilidad 0,1) Y t2 = "malas pulgas"(con probabilidad 0,9). El mensaje del emisor es su elección de cerveza

~:...

....

""::'"

c .•

2,0

3,0

0,1

Réeeptor

1,-1Duelo

Duelo

[ql

[1 - qINo

0,5

Azar

0,5

1, Cerveza

t, Cerveza

Cobardica

Malas pulgas

Figura 4.4.3

[pI Quiche

[l - pI QuicheNo

,..,No :

,.,,,,,,,,,,,,Duelo: ,,

,

Duelo

Receptor

2,0

1,1

3,0

0,-1

en lugar de Oy 1 como en la figura 4.4.2. Ahora [(I,I),(u,d),p = 0,5,q] esun equilibrio bayesiano perfecto de agrupación para cualquier valor deq, por lo que [(I,I),(u,d),p = O,5,q = O]es un equilibrio bayesiano perfectoque satisface el requisito 5 de señalización.

En algunos juegos, existen equilibrios bayesianos perfectos que pare-cen poco razonables y sin embargo satisfacen el requisito 5. Una de lasáreas de investigación más activas en teoría de juegos se ha preocupadode las dos siguientes cuestiones: (i) cuándo es un equilibrio bayesianoperfecto poco razonable y (ii) qué requisito adicional puede añadirse ala definición de equilibrio para eliminar estos equilibrios que no son ra-zonables~ Cho y Kreps (1987) hicieron una contribución original y muyinfluyente en está área. Vamos él concluir esta sección discutiendo tresaspectos de su trabajo: (1) el ju~go de señalización "cerveza y quiche",que ilustra cómo ciertos equilibrios bayesianos perfectos quena son ra-zonablespueden satisfacer el requisito 5 de señalización; (2) una versiónmás fuerte (pero de ninguna manera la más fuerte posible) del requisito 5de señalización, llamada el criterio intuitivo; y (3) la aplicación del criteriointuitivo al juego de señalización en el mercado de trabajo de Spence....

min UE(ti¡m j' ,CLk)> max UE(túmj,ak)'akEA ukEA

En el juego de la figura 4.4.2, el equilibrio bayesiano perfecto de separaciónrU,D),(u,n),p = 1,q= O]satisface el requisito 5 de señalización trivialmente(porque no hay conjuntos de información fuera de esta trayectoria deequilibrio). Como ejemplo de un equilibrio que satisface el requisito5 de señalización de forma no trivial, supongamos que se invierten lasganancias del receptor cuando el tipo t2 juega D: 1 por jugar d y Opor'u,

Definición. En un juego de señalización, el mensaje mj de lvI está dominadopara el tipo ti de T si existe otro mensaje mj de M tal quela menor gananciaposible de ti por utilizar mj es mlÍs alta que la mayor ganancia posible de ti porutilizar mj:

2-10/ jGEGOS DIN;Í;¡;IICOS CON INFOR¡;.L..•.CIÓN INCOMPLETA (e. 4)

nadas a partir del conjunto de información del emisor correspondiente ati .10 Por lo tanto, el nodo t¡ en el conjunto de información del receptor quesigue a O se alcanza sólo si el emisor utiliza una estrategia que esté estric-tamente dominada a partir de algún conjunto de información. Además,el nodo t2 en el conjunto de información del receptor que sigue a D puedealcanzarse por medio de una estrategia que no está estrictamente domi-nada a partir de algún conjunto de información, concretamente U,D). PorIn tanto, el requisito 5 establece que q = O. Como [U,I),(n,d),p = 0,5,q] esun equilibrio bayesiano perfecto sólo si q 2 1/2, tal equilibrio'no puedecumplir el requisito 5.

Un modo equivalente de imponer el requisito Sal equilibrio baye-siano perfecto del juego de señalización definido en la sección 4.2.A es elsiguiente.

10 Como el conjunto de infonnadón del emisor COITespo~diente a tI sólo tiene un elemento,las conjeturas del emisor no juegan ningún papel en la definidón de dominancia estricta apartir de este conjunto de inforrnadón. Demostrar que (D,n y (D.D) están estrictamenteduminadas a partir de este conjunto de información se reduce a ofrecer una estrategia alter-nativa al emisor que proporcione la ganancia mayor a tI para cada estrategia que el receptorpudiera jugar. (l,D) es esa estrategia: proporciona 2 a tI en el peor de los casos, mientras que(D,)) y (D,D) propordonan 1 en el mejor de los casos.

Req uisito 5 de señalización. Si el conjunto de información que sigue a 'mj estáfllera de la trayectoria de equilibrio y mj está dominado para el tipo ti, entonces(si es posible) la conjetura del receptor j1.(t.; Imj) debería asignar ~robabilidad ceroal tipo ti. (Esto es posible siempre que m] no esté dominado para todos los tiposen T.)

.. ','" ..:.;

242 / JUEGOS DINÁMICOS CON lNFORMAClÓN INCOMPLETA Ce. 4)

o quiche para desayunar; la acción del receptor es decidir si batirse enduelo o no con el emisor. Las características cualitativas de las gananciasson que el tipo cobardica preferiría tomar quiche para desayunar, el malaspulgas preferiría cerveza, ambos preferirían no tener que batirse con elemisor (y esto les importa más que sus desayunos), y el receptor preferiríabatirse con el cobardica antes que con el malas pulgas. (Por lo tanto,utilizando la terminología más convencional para los tipos, mensajes; yacciones, este juego podría ser un modelo de barreras de entrada, comoel de Milgrom y Roberts [1982].) En la representación en foÍmaeextensivade la figura 4.4.3, la ganancia por desayunar lo que se prefiere es 1 paraambos tipos del emisor, la ganancia adicional potevitar un duelo. es.de 2para los dos tipos, Y las ganancias del receptor por, batirse en duelo conel cobardica o con el malas pulgas son 1 o -1 respectivamente;. todas lasdemás ganancias son cero.

En este juego, [(qui~he, quiche), (no~duel65, p''; Ó,9;q] es unequilibri¿bayesiano perfecto de agrupación para q 2: 1tt~~dé.más, este equilibriosatisface elrequisit05de señalización,yaqu,é J~~lhYet~no estádominad~para ningiln tipo del emisor. En particular, nad¿' gár'ahtiza que el cobardicavaya a estar mejor por tomar quiche (una ganancia de 1 en el peor de loscasos) que portorriar cerveza (una ganariciade 2 en el mejor de los casos).Por otra parte, la conjeturadel receptor fuera de léltraye~toria de equilibrioparece sospechosa: si el receptor obserVa:inesp~}~dán;\ente que el emisorelige cerveza, concluye que es al menos tan próbable 'Itieel em~sor seacobardica como que sea malas pulgas (es decir, q 2:1/2), aun cuando (a)el cobar~icano puede mejorar de ninguna manenl su ganancia de 3 enequilibrio tomando cerveza en vez de quiche, mientras que (b) el malaspulgas podría méjorar su ganancia de 2 en equilibrio y recibir una gananciade 3 si el receptor mantuviera la conjetura de que q < 1/2. Dados (a) y(b), cabría esperar que el malas pulgas escogiera cerveza y pronunciara elsiguiente discurso:

Verme escoger cerveza debería convencerte de que soy deltipo malas pulgas: escoger cerveza no podri'a de ningunamanera haber mejorado la ganancia del tipo cobardica, por(a); y si escoger cerveza te convenciera de que soy del tipo.malas pulgas, e~tonces hacerlo mejoraría mi ganancia, por(b).

Refinamientos del equilibrio bayesimlO perjec/o / 24:1

Si este discurso fuera creído, establecería que q = 0, lo que es incom-patible con este equilibrio bayesiano perfecto de agrupación.

Podemos ahora generalizar este argumento a la clase de juegos deseñalización definida en la sección 4.2.A; con ello obtenemos el requisito6 de señalización.

Definición. Dado un equilibrio bayesiano perfecto en un juego de serlalizaciól1,el mensaje mj está dominado en equilibrio para el tipo ti de T si la gl7J1I1nciaen equilibrio de tú que denotamos mediante U'(t;), es más alta que la mayorganancia posible para ti por utilizar 7)Ij:

Requisito 6 de señalización. ("El criterio intuitivo", Cho y Kreps 198'7):Si el conjunto de información que sigue a mj está fuera de la trayectoria deequilibrio y mj está dominado en equilibrio para el tipo tú entonces (si es lJOsilJle)la conjetura del receptor IJ,(ti 1m) debería asignar probabilidad cero al tipa 1:;.

(Esto es posible siempre que mj no esté dominado eH equilibrio para torios lostipos de T.)

Cerveza y quiche muestra que un mensaje mj puede estar dominado enequilibrio para ti sin estar dominado para t;. Sin embargo, si mj está do-minado para tú mj debe estar dominado en equilibrio para tú por lo queimponer el requisito 6 de señalización hace que el requisito 5 sea redun-dante. Cho y Kreps utilizan un resultado más poderoso debido a Kohlbergy Mertens(1986) para demostrar que cualqüier juego deseñalización dela dase definida en la sección 4.2.A tiene un equilibrio bayesiano perfeetcJque satisface el requisito 6 de señalización. Se dice a veces que los argu-mentos de este tipo utilizan la inducción hacia delante, porque al interpretaruna desviación (esto es, al formarse la conjetura p,(t; ¡mj» el receptor se pre-gunta si el comportamiento pasado del emisor podría haber sido racional,mientras que en inducción hacia atrás se supone que el comportamientofuturo será racional,

Para ilustrar sobre el requisito 6 de señalizaCión, lo aplicamos al casocon envidia del modelo de señalización en el mercado de trabajo, analizadoen la sección 4.2.B.

Recordemos que existe una enorme cantidad de equilibrios bayesia-nos perfectos de agrupación, de separación e luoridos en este modelo.Sorprendentemente, uno de estos equilibrios es consistente con el rec¡ui-

2,1-1 / JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

w(e) = ¡.t(Ale) . y(A,e) + [1 - J.l(Ale)] . y(B,e).

.~,

••

(,,1,','1,'.

/, ~-'

;;', ,

Refinamientos del eqllilibrio bayesial10 perfecto / 245

cual el trabajador con capacidad alta escoge un nivel de educación e> esno puede satisfacer el requisito 5 de señalización, ya que en tal equilibriolas empresas deben creer que J.l(Ale) < 1 para niveles de educación entrees y e. (Un enunciado preciso es: el requisito 5 de señalización implicaque J.l(Ale) = 1para e > es siempre que e no esté dominado para el tipocon capacidad alta, pero si existe un equilibrio de separación en el que eltrabajador con capacidad alta escoge un nivel de educación e > es enton-ces los niveles de educación entre es y e no están dominados para el tipocon capacidad alta, de forma que el argumento es válido.) Por lo tanto, elúnico equilibrio de separación que satisface el requisito 5 de señalizaciónes el equilibrio que se muestra en la figura 4.4.4.

Una segunda conclusión se deriva también de este argumento: encualquier equilibrio que satisfaga el requisito 5 de señalización, la utilidaddel trabajador con capacidad alta debe ser como mínimo y(A,es) - c(A,e.).

A continuación demostramos que esta <;¡onclusiónsignifica que algunosequilibrios lubridos y de agrupación no-pueden satisfacer el requisito 5de señalización_ Existen dos casos, dependiendo de si la probabilidad deque el trabajador tenga capacidad alta (q) es lo suficientemente baja paraque la función de salario w = q . y(A,e) + (1- q) . y(B,e) esté por debajo dela curva de indiferencia del trabajador con alta capacidad que pasa por elpunto [e.,y(A,es)]'

Suponemos en primer l,ugar que q es baja, como semuestra en la figura4.4.5. En este caso, :ningún equilibrio de agrupación satisface el requisito 5de señalización, porque el trabajador con capacidad alta no puede alcanzarla ~tilidad y(A,es) - c(A,es) en este equilibrio. Del mismo modo, ningúneq~ilibrio lubrido en el que el trabajador con capacidadalta se comportealeat9riaIl1ente ?ª,tisface el requisito 5 de señalización, porque el punto(educación, salario) en el que hay agrupación en este equilibrio está pordebajo de la función de salario w = q. y(A,e) + (1 - q). y(B,e). Finalmente,:ningún equilibrio lubrido en el cual el trabajador con capacidad baja secomporte aleatoriamente satisface el requisito 5 de señalización, porqueel punto (educación! salario) en el que hay agrupación en este equilibriodebe estar en la curva de indiferencia del trabajador con capacidad bajaque pasa por el punto [e*(B),w*(B)], como en la figura 4.2.9, y está portanto por debajo de la curva de indiferencia del trabajador con capacidadalta que pasa por el punto[es;y(A,es)]' Por lo tanto, en el caso de la figura4.4.5, el único equilibrio bayesiano perfecto que satisface el requisito 6 deseñalización es el equilibrio de separación que muestra la figura 4.4.4.

y (A,e)

e

1,

e.

~Y(Bre)

Figura 4.4.4

e*(B)

w

y(A, e,)----.-.-----

w*(B)

Por lo tanto, la utilidad para el trabajador con capacidad baja al esco-ger e'(B) es corno mínimo yfB,e*(B)] - c[B,e*(B»), que es mayor que suutilidad al escoger cualquier e > e., independientemente de lo que laempresa crea después de observar e. Es decir, en términos del requisito 5de señalización, cualquier nivel de educación e > es estádom:inado parael tipo de capacidad baja_ Utilizando lID lenguaje informal, el requisito 5de señalización implica que la conjehlra de la empresa debe ser ¡.t(Ale) = 1para e > e., lo que a su vez implica que un equilibrio de separación en el

sito 6 de señalización, el equilibrio de separación en el cual el trabajadorcon baja capacidad escoge el nivel de educación de información completay el trabajador con capacidad alta escoge la educación mínima necesa-ria para hacer que el trabajador con capacidad baja sea indiferente entreimitarle o no, como ilustra la figura 4.4.4.

En cualquier equilibrio bayesiano, si el trabajador escoge un nivel deeducación e y las empresas creen en consecuencia que la probabilidad deque el trabajador tenga capacidad alta es ¡.t(Ale), el salario del trabajadorserá

y U3,e)

q y (A,e)

y (A,e)

e,

Figura 4.4.6

e*(B)

w

w*(B)

y (A ,e, )

Re!ill11111ielllos del equilibrio bayesiallo parcelo / 247

si e' < e < e", el requisito 6 de señalización implica que la conjetura dela empresa debe ser ¡L(Ale) = 1, lo que a su vez significa que el equilibriode agrupación indicado no puede satisfacer el requisito 6 de seña lización,ya que en tal equilibrio las empresas deben creer que ¡L(Ale) < 1 para laselecciones de educación entre e' ye". Este argumento puede repetirse par8todos los equilibrios de agrupación e híbridos en la región sombreada dela figura, por lo que el único equilibrio bayesiano perfecto que satisface elrequisito 6 de señalización es el equilibrio de separación mostrado en lafigura 4.4.4.

e '

y (B,e)

q y (A,e)

y (A,e)

e,

Figura 4.4.5

e*(B)

w

w*(B)

y (A,e,)

Suponemos ahora que q es alta, como se indica en la ñgura 4.4.6. Comoantes, los equilibrios híbridos en los que el tipO ~on capacidad baja se com-porta aleatoriamente no pueden satisfacer el requisito 5 de señalización,pero ahora los equilibrios de agrupación y eqtiilibriÓs lubri<¿losen los queel tipo con capacidad alta se éorripOrta aleatoriamente pueden satisfacereste requisito si la agrupáéióiúie da en un ptirito (educación, salario) de laregión sombreada de la figura. Sin embargo, estos equilibrios no puedensatisfacer el requisito 6 de señalización.

Consideremos el equilibrio de agrupación en ea mostrado en la figura4.4.7. Las elecciones de nivel de educación e > e' están dominadas en equi-librio para el tipo con baja capacidad porque incluso el salario más altoque podría pagarse a un trabajador con educación e, concretamente y(A,e),

da un punto (educación, salario) por debajo de la curva de indiferencia deltrabajador con baja capacidad que pasa por el punto de equilibrio (ea,11Ja).

Las elecciones de nivel de educación entre e' y e" no están dominadas enequilibrio pa~a el tipo con capacidad alta. Sin embargo, si esta elecciónconvence a las empresas de queel trabajador tiene capacidad alta, éstasofrecerán el salariO y(A,e), lo que hará que el trabajador con capacidadalta esté mejor que en el equilibrio de agrupación indicado. Por lo tanto,

246 / JUEGOS DlNÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)

",:.,

.-;,":

24

22

33

O1

D

4O

3O

4O

oO

12

13

41

b.

Da.

,-.. .-;:"

4.6 Ejercicios

Ejercicios / 249

4.1 En los siguientes juegos en forma extensiva, derívese el juego en formanormal y hállense todos los equilibrios de Nash con estrategias puras, losperfectos en subjuegos y los bayesianos perfectos.

nes" se dan frecuentemente y que su modelo puede explicar muchos delos datos empíricos sobre huelgas. Sobre reputación, véase la "teoría dela credibilidad" de Sobel (1985), en la cual una parte informada puede serun "amigo" o un "enemigo" de un agente decisor desinformado en unasucesión de juegos con parloteo. Finalmente, véase Cho y Sobel (1990)para más información sobre refinamientos en los juegos de señalización,incluyendo un refinamiento que selecciona el equilibrio de separacióneficiente del modelo de Spence cuando hay más de dos tipos.

e

y (B,e)

q y (A,e)

y (A,e)

e,

Figura 4.4.7

e* (L) ep e' e"

MilgTOny Roberts (1982) ofrecen una aplicación clásica de los juegos deseñalización en temas de organización industrial. En economía financiera,Bhaltacharya (1979)y Leland y Pyle (1977)analizan la política de dividen-dos y de propiedad empresarial (respectivamente) utilizando modelos deseñalización. Sobre política monetaria, Rogoff (1989) pasa revista a losjuegos repelidos, los de señalización y los modelos de reputación, y Ball(1990)utiliza cambios (inobservables) en el tipo de la autoridad monetariapara explicar la trayectoria temporal de la inflación. Para aplicaciones dejuegos con parloteo, véanse los trabajos de Austen-Smith (1990), Farrelly Gibbons (1991), Matthews (1989), y Stein (1989) descritos en el texto.Kennan y Wilson (1992) examinan la literatura sobre los modelos teóricosy empíricos de negociación bajo información asimétrica, subrayando susaplicaciones a huelgas y pleitos. Cramton y Tracy (1992) permiten queun sindicato escoja entre ir a la huelga y continuar trabajando al salariovigente; muestran que, de acuerdo con los datos, estas "últimas sihlacio-

4.5 Lecturas adicionales

24¿j / J llEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (c. 4)

• 1,1

Ejercicios / 251

2,1

1,0

Receptor•• 0,0

Receptor

a

b

b

<0': b 0,0

,,

, a

D

D

D

Azar

1,

1,

(1/3)

(1/3)

(1/3)

1

1

Receptor

a

b

a

Receptor

0,0

0,0

2,1

1")b :

1,0 :

a.1,1 2,2

a a1 t, D

b 0,5 b2,0 O,n

Receptor Azar Receptor

0,00,5

.1,0a a

1 t, D

b b0,1 • 1,1

4.4 Descnbanse todos los equilibrios bayesianos perfectos de agrupación yde separación con estrategias puras de los siguientes juegos de señalización.

22

3 O O k'\$. ;t ¡

O 1 1 O

1,2 0,1

a a1 1, D

b 0,5 b2,0 3,0

Receptor Azar Receptor

0,0 1,0a 0,5 a

1 1, Db

3,1 2,2

b. El siguiente juego de señalización con tres tipos empieza con unajugada del azar, que no aparece' en el árbol y que determina uno de los trestipos con igual probabilidad. Descnbase un equilibrio bayesiano perfectode agrupación en el que los tres tipos del emisor juegan J.

D

4.3 a. Descnbase un equilibrio bayesiano perfecto de agrupáci6n en el quelos dos tipos del emisor juegan D en el siguiente juego de señalización.

4.2 Demuéstrese que no existe ningún equilibrio bayesiano perfecto conestrategias puras en el siguiente juego en forma extensiva. ¿Cuál es elequilibrio bayesiano perfecto con estrategias mixtas?

250 / JUEGOS DlNÁMfCOS CON INFORMACIÓN lNCOMPLETA (c. 4)

".,'

, ",."','.'~4':.'

252 / J UECOSI)INÁ,vllCOS CON INFORMACiÓN INCOMPLETA (e. 4)

b,0,030) a

IJ O

0,5 b1,1 , 4,1

Receptor Azar Receptor

3,3. 1,2a 0,5 a

1 1, O

b b0,1 2,0

4.5 Hállense todos los equilibrios bayesianos perfectos con estrategiaspuras del ejercicio 4.3 (a) y (b).

4.6 El siguiente juego de señalización es análogo al juego dinámico coninfon11ación completa pero imperfecta de la figura 4.1.1. (Los tipos t¡ yt2 son análogos a las jugadas 1 y e del jugador 1 en la figura 4.1.1; siel emisor escoge D en el juego de señalización, el juego se acaba, igualque cuando el jugador 1 escoge D en la figura 4.1.1.) Hállense (i) losequilibrios bayesianos de Nash con estrategias puras y (ti) los equilibriosbayesianos perfectos con estrategias puras de este juego de señalización.Relaciónense (i) con el equilibrio de Nash y (ii) con el equilibrio bayesianoperfecto de la figura 4.1.1.

Ejercicios / 253

4.7 Dibújense las curvas de indiferencia y las funciones de producciónpara un modelo de señalización en el mercado de trabajo con dos tipos.Descríbase un equilibrio bayesiano perfecto hfbrido en el cual el trabajadorcon capacidad alta se comporta aleatoriamente.

4.8 Hállese el equilibrio bayesiano perfecto con estrategias puras en elsiguiente juego con parloteo. Cada tipo tiene la misma posibilidad de serescogido por el azar. Como en la figura 4.3.1, la primera ganancia de cadacasilla es la del emisor, y la segunda la del receptor, pero la figura no esun juego en forma normal, sino que simplemente expresa las gananciasde los jugadores para cada par tipo-acción.

0,1 0,0 0,0

1,0 1,2 1,0

0,0 0,0 2,1

4.9 Considérese el ejemplo del modelo con parloteo de Crawford y?obeIdiscutido en la sección 4.3.A: el tipo del emisor se distribuye uniforri1e~mente entre cero y uno (formalmente, T = [0,1] Yp(t) = 1 paratodo ten T);el espacio de acciones es el intervalo de cero a uno (A = [0;1]); la furiciónde ganancias del receptor es UR(t,a) = - (a - t)2, Yla función de gananciasdel emisor es UE(t,a) = -[a - (t + b)]2. ¿Para qué v<ilóresdéb éxÍste:unequilibrio de tres escalones? ¿Es la ganancia esperada/del recepto~;máralta en un equilibrio de tres escalones que en uno de dos escalónes?'¿QUetipos del emisor están mejor en un equilibrio de tres escalones que' eIi"t.mode dos escalones?

4.10 Dos socios deben disolver su sociedad. El socio 1 posee una par-ticipación s en la sociedad, el socio 2 posee 1 - s.' Los socios están deacuerdo en jugar el siguiente juego: el socio 1anuncia un precio para lasociedad, p, y el soci02 escoge entonces si comprar la participación de 1por ps o vender la suya por pO - s). Supongamos que es información deldominio público que las valoraciones de los socios de ser propietarios détoda la sociedad son independientes y se distribuyen uniformemente en.[0,1], pero que la valoración deeada socio es información privada. ¿Cuáles el equilibrio bayesiano perfecto?

\:,.'

\.

'.'.

',',

.'I\'.~J••

..•,,)

254/ JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)

4.11 Un comprador y un vendedor tienen valoraciones 'Ve y Vv respec-tivamente, Es informa,ción del dominio público que el intercambio esrentable (es decir, que Ve > vv), pero la magnitud de esta rentabilidad esinformación privada de la siguiente manera: la valoración del vendedor sedistribuye uniformemente en [0,1];la valoración del comprador Ve = k '1)",

donde k > 1 es información del dominio público; el vendedor conoce Vv

(y por tanto ve) pero el comprador no conoce Ve (o vv)' Supongamos queel comprador realiza una única oferta p que el vendedor acepta o rechaza.¿Cuál es el equilibrio bayesiano perfecto cuando k < 2? ¿Ycuando k> 2?(Véase Samuelson 1984.)

4.12 Este problema considera la versión con horizonte infinito del juegode la negociación con dos periodos analizado en la sección 4.3.B.Comoantes, la empresa tieneinformación privada sobre sus beneficios' (1r),queestán uniformemente distribuidos en [O,1ro],y elsindicafo realiza todas lasofertas salariales y tiene un s~Jariode. rese~.va JJr ":::O. ,l

En el juego candas periodos, la ~ínpre~Kacepta la, primera oferta delsindicato (Wl) si 1r'> 71'1,donde el tipo con:beneficlos,.1rl es indiferenteentre (i)aceptar Wl y (ii) rechazar Wl pero aceptar la oferta del sindicato enel segundo. periodo (W2), y W2 es la oferta óptima del sindicato dado quelos bem~ficiosde la empresa están uniformemente distribuidos en [O,1rl]y que sólo queda un periodo de negociación. En cambio, en el juegocon horizonte infinito, W2 será la oferta óptima del sindicato 4ado que elbeneficio deja emprésaestá uniformemente distribuido en [O,1rl]y quequeda un n~er6infi.nito,de periodos de negociación (potencial). Aunqueel tipo con beneficlos 1rlseráotra vezÍndiferente entre las opciones (i) y(ii), el cambio en W2 haráq~e cambie el válor de 1rl.

El juego de continuación que empieza en el segundo periodo deljuego de horizonte infinito es una versión a escala del juego completo:existe un número infinito de periodos de negociación (potencial), y losbeneficios de la empresa están otra vez uniformemente distribuidos entreOy una cota superior; la única diferencia es que la cota superior es ahora1rl en lugar de1ro. Sobel y Takahashi (1983)demuestran que el juegocon horizonte infinito tiene un equilibrio bayesiano perfecto estacionario.En este equilibrio, si los beneficios de la empresa están uniformementedistribuidos entre Oy 1r*,elsindicato realiza una oferta salarial w(7r*) = b1r*,por lo que la:primera oferta es b1ro, la segunda b1rl' etc. Siel sindicato utilizaesta estrategia estacionaria, la mejor respuesta de la empresa proporciona1rl = C7ro,7r2= C7rl,etc., y el valor presente esperado de las ganancias

Ejercicius / 255

del sindicato, cuando los beneficios de la empresa están uniformemenledistribuidos entre cero y 1r*,es V(7r') = d7r', Demuéstrese que b = 2d,c= 1/[1 +~] yqued= [~- (1- 6»)/25.

4.13 Una empresa y un sindicato juegan el siguiente juego de la nego-ciación con dos periodos. Es información del dominio público que elbeneficio de la empresa, 1r,está uniformemente distribuido entre cero yuno, que el salario de reserva del sindicato es 1JJr y que sólo la empresaconoce el verdadero valor de 1r.Supongamos que O< Wr < 1/2. Hálleseel equilibrio bayesiano perfecto del siguiente juego:

1. Al comienzo del primer periodo, el sindicato realiza una oferta salariala la empresa, Wl'

2. La empresa o acepta o rechaza 1JJI' Si acepta, hay producción enlos dos periodos, por lo que las ganancias son 2WIpara el sindicaloy 2(1r- Wl) para la empresa. (No hay descuento.) Si la empresa noacepta 1))1,no hay producción en el primer periodo, y las ganancias delprimer periodo son cero tanto para la empresa como para el sindicato,

3. Al comienzo del segundo periodo (suponiendo que la empresa re-chazó Wl) la empresa realiza una oferta salarial al sindicato, W2. (Alcontrario que en elmodelo de Sobel y Takahashi, el sindica to no realizala oferta.)

4. El sindicato o acepta o rechaza W2. Si lo acepta hay producción enel segundo periodo, con lo que las ganancias del segun<:ioperiodo (ytotales) son W2 para el sindicato y 7r- W2 para la empresa. (Recordemosque las ganancias del primer periodo fueron cero.) Si el sindicatorechaza W2 no hay producción, por lo que el sindicato gana un salarioalternativo Wr en el segundo periodo y la empresa cierra y gana cero.

4.14 Nalebuff (1987) analiza el siguiente modelo de la negociación previoa un posible pleito entre un demandante y un demandado. Si el casova a juicio, el demandado se verá obligado a pagar al demandante unacantidad d por daños. Es información del dominio público que d estáuniformemente distribuida en [0,1] y que sólo el demandado conoce elverdadero valor de d. Ir a juicio le cuesta al demandante C < 1';2, pero(por simplicidad) no le cuesta nada al demandado.

El desarrollo temporal es el siguiente: (1) El demandante proponeun acuerdo, s. (2) El demandado o acepta el acuerdo (en cuyo caso laganancia del demandante es s y la del demandado es -s) o lo rechaza. (3)

256 / JUECOS DlNÁivllCOS CON lNFORivlACláN INCOMPLETA (e. 4)

Si el demandado rechaza 8, el demandante decide si ir a juicio, donde laganancia del demandante será d - e y la del demandado -d, o retirar loscargos, en cuyo caso la gananéia cie ambos jugadores es cero.

En la etapa (3) si el demandante cree que existe una d* tal que eldemandad o aceptaría el acuerdo si y sólo si d > d*, ¿cuál es la decisiónóptima del demandante con respecto al pleito? En la etapa 2, dada lapropuesta de acuerdo 8, si el demandado cree que la probabilidad de queel demandante vaya a juicio si 8 es rechazada es p, ¿cuál es la decisiónóptima para llegar a un acuerdo por parte del demandado de tipo d?Dada una oferta s > 2c, ¿cuál es el equilibrio bayesiano perfecto del juegode continuación que comienza en la etapa 2? ¿Ydada una oferta s < 2c?¿Cuál es el equilibrio bayesiano perfecto del juego eompleto si e < J/3?¿Y si 1/3 < e < 1/2?

4.15 Consideremos un proceso legislativo en el que las decisiones factiblesvarían continuamente desde p = Ohasta p = 1. La decisión ideal desde elpunto de vista del Congreso es e;pero el status quoes s, _dondeO< e < s <1; es decir, la decisió;' ideal está a la izquierda del status quo. La deci¡;iónideal para el Presidente es ti que se distribuye uniformemente en [O,llperoes información privada del Presidente. El desarrollo temporal es simple:el Congreso propone tma decisión p, que el presidente puede -ratificaro vetar. Si p es ratificada las ganancias son -(e - p)2 para el congresoy -(t - p)2 para el Presidente; si es vetada las ganancias son -(c - s)2

y ~(t - sf. ¿Cuál es el equilibrio bayesiano perfecto? Veriliquese quee < ji < s en equilibrio.

Supongamos ahora que el Presidente puede comunicarse (en el sentidode enviar un mensaje del tipo que hemos llamado de parloteo).antes deque el Congreso proponga una decisión. Consideremos un equilibriobayesiano perfecto de dos escalones en el que el Congreso propone PB oP.-I, dependiendo del mensaje que el Presidente envíe. Demuéstrese que talequilibrio no puede tener e < pa < PA < s. Explíquese por qué se deduceque no puede haber equilibrios que incluyan tres o más propuestas porparte del Congreso. Derívense los detalles del equilibrio de d(?sescalonesen el que e = PB < PA < s: ¿qué tipos envían qué mensajes?, y ¿cuál es elvalor de PA.? (Véase Matthews, 1989.)_

4.16 Considérese los equilibrios de agrupación descritos en el ejercicio 4.3(a) y (b). Para cada equilibrio: (1)determínese si el equilibrio p~ecie sersustentado por conjeturas que satisfagan el requisito 5 de señalización;

Referencias / 257

(ii) determínese si el equilibrio puede ser sustentado por conjeturas quesatisfagan el requisito 6 de señalización (el criterio intuitivo).

4.7 Referencias

AUSTEN-SMITH,D. 1990. "Information Transrnission in Debate." American¡oumal o/ Political Science 34:124-52.

AxELROO,R. 1981. "The Emergence of Cooperation Among Egoists." Ame-rican Political Science Review 75:306-18.

BALL!L. 1990. "Tune~Consistent Poliey and Persistent" Changes in lll-fl~tion." National Bureau of13conornic Researeh Working Paper #3529(December). .

BARRO,R. 1986. "Reputation in a Model ofM~metary Policy with Incom-plete Information." ¡oumal o/Monetary Economics 17:3-20.

BHAITACHARYA;S. 1979. "Imperfect Information, Dividend Pólicy: ancÍthe 'Bird in the Hand' Fallacy'" Bell ¡oumal of Economics 10:259-70: .. ,.. ~

CHO,J.-K., y D. KREPS.1987. "Signaling Carnes and Stable Equilibria."Quarterly ¡oumal of Economics 102:179-222.

CHO,l.-K., y J. SoBEL.1990. "Strategie Stabilit}r and Uniqueness in Signa-ling Carnes." ¡oumal o/ Economic Theory 50:381-413.

CRAMTON,E, y J. TRAcy. 1992. "Strikes and Holdouts in Wage BargainirÍg:Theory and Data." American Economic Review 82:100-21.

CRAWFORO,v., y J. SOBEL. 1982. "Strategie Infornation Transrnission."Econometrica 50:1431-51.

DYBVIG,E, Y J. ZENOER.1991. "Capital Structure and Dividend Irrelevancewith Asymmetric Information." Review o/Financial Stlldies 4:201-19.

FARRELL,L y R. CIBBONS.1991. "Union Voice."Mimeo, Comell University.

FuDENBERG,D., Y J. TIROLE. 1991. "Perfeet Bayesian Equilibrium andSequential Equilibrium." ¡oumal o/ Economic Theory 53:236-60.

HARSANYI,J. 1967. "Carnes with Incornplete Information Played by Ba-yesian Players, Parts 1,n, and III." Management Science 14:159-82,320-34,486-502.

<.-l"' ..

-.''.''-:. ~.

.':¡:-',.

'"'i,;.

RefercI1cil15 I 259

,VICKERS,J. 1986. "Signalling in a Model of Monetary Policy with Incol1l-plete Information." Oxford Economic Papers 38:443-55.

STEIN,J. 1989. "Cheap Talk and the Fed: A Theory of 1mprecise PolicyAnnouncements." American Ecol1omic Review 79:32-42.

5PENCE,A. M. 197+. "Competitive and Optimal Responses to Signaling:An Analysis of Efficiency and Distribution." Joumal of ECOllomic T11eory8:296-332.

50BEL, J., Y 1. TAKAHASHI.1983. "A mullistage Model of Bargaining,"Review of Economic StLuties 50:411- 26.

SPENCE,A. M. 1973. "Job Market Signaling." Quarterly ¡oumal of EcollúlIlics87:355-74.

NOLDEKE,G., Y E. VANDAMME. 1990. "5ignalling in a Dynamic LabourMarket." Review of Econ01nic 5tudies 57:1- 23.

ROGOFF,K. 1989. "Reputation, Coordination, and Monetary Policy." EnModem Business Cycle Theory. R. Barro, ed. Cambridge: Harvard Univer-sity Press.

5AMUELSON,W.1984. "Bargaining Under Asyrnmetric Information." £co-nometrica 52:995-1005.'

SOBEL,J. 1985. "A Theory of Credibility." Review of Economic 5tudies 52:557-n '

1<REPS,D., P. MILGROM,J. ROBERTS,y R. WILSON.1982. "Rational Coope-ration in the Finitely Repeated Prisioners' Dilernma." Joumal of EconomicTheory 27:245-52. . ..,

LELAND,H., y' [). PYLE.. 1977. "Ihf~rmatior\.~l Asymmetries, Financial5tructure, and Financial intermedi~tión." Jouma/of Finance 32:371-87.; •

MATIHEWS,S. 1989. "VetoTI1reats: Rhetoric in a Bargaining Game." Quar-terly Joumal of Econoinics 104:347-69. '

MILGROM,P.i YJ. ROBERTS.1982., "Limit Pricing and Entry under Incom-plete Information: AnEquilibrium Analysis." EconomeÚica40:443-59. ,

MINSER,J, 1974: E)chooling; Experience, and Eamings. New York: CoiumbiaUniversity Press for the NBER. .. . .'.

MYERS,S., Y N. MAJLUF. 1984. "Corporate Financing and InvestmentDecisions When Firms Have lnformation that Iilvestors Do Not Have;"Joumal of Financial Economics 13:187-221.

NALEBUFF,B. 1987. "Credible Pretrial Negotiation." Rnnd Joumal of Econo~mics 18;198-210.

KOHLBERG,E., YJ.-F. MERTENS.1986. "On the 5trategic 5tability of Equili-bria." Econometrica. 54:1003-38.

1<REPS,D., Y R. WILSON. 1982. "5equential Equilibrium." Econometrica50:863-94.

KENNAN,J., y R. WILSON. 1992. "Bargaining with Priva te Information."De próxima aparición en Joumal of Economic Literature.

258 I JUEGOS DINÁMICOS CON INFORMACIÓN INCOMPLETA (e. 4)

.:-'.

.,INDICE ANALÍTICO

Abreu, D., 98, 104,106acuerdo, sobre ,ómo jugar un juego

posibilidad d;q~e no haya acuerdo,12n6,59relación con el equilibrio de Nash,9,12

Admati, A., 132agrupación, equilibrio de, véase

agrupación parcial, eq~ilibrio de;bayesian~ perfecto,' equilibri~;agrupación estrategia de

agrupación, estrategia de, 150~188véase también bayesiano ~rfecto,equilibrio; agrupación, equilibrio de

agrupación parcial, equilibrio deen el juego de Crawford y Sobel, 28juegos con parloteo~ 216'véase también bayesiano perfecto,equilibrio

Akerlo£, G., 130amenazas y promesas, credibilidad de

las, 53, 55, 85, 87, 126aranceles, juego de los, 73-77

ejercido 2.9,134-35arbitraje

convencional, 23contenido informativo de las ofertas,48 .~ .;-~ofertas salariales de equilibrio deNash en oferta final, 23-27

árbol del juego, 56, 116-17,véase tambiénforma extensiva, juego en

Aumann, R., 7, 32n14, 35n15Austen-Smith, D., 213, 248

Axelrod, R., 228Ball, L., 130, 248BaCon, 0.,169Barro, R., 54, 112, 210batalla de los sexos, la:

con información incompleta, 153-54ejemplo de juego con múltiplesequilibrios de Nash, 11-12ejemplo de equilibrio de Nash conestrategias mixtas, 12116,40-45, 152

batallas, estrategias mixtas en, 31bayesiano, juego, 143,véase también

información in-completa, juego con;"\ información incompleta

bayesiano de Nash,'equilibriocompatibilidad de incentivos, 161 -.definido, 148-52ejercicios 3.1-3.8,1690172ejercicio 4.6,.249en el principo de revelación, 165en la batalla de los sexos coninformación incompleta, 153-55en subasta doble, 159en subastas, 155limitaciones del, 174lineal, en subasta, 155-57lineal, en subasta doble, 159-61precio único, en subasta doble, 160relación con el equilibrio bayesianoperfecto, 175-76simétrico, en subasta, 157-58, 166-67,157n3,

.,''".'

":'.

262 / ÍNDICE ANALÍT1CO

véase también bayesiano, juego;información incompleta;bayesiano perfecto, equilibrio

bayesiano dinámico, juego, véasenegociación, juego de; comunicaciónprevia, juego con; bayesianoperfecto, equilibrio; reputación;señalización, juego de

bayesiano estático, juegoejercicios 3.1-3.8,169-172mecanismo directo;165representación en forma normal de,146-50subasta, 155-57subasta doble, 159-64véase también bayesiano de Nash,equilibrio; principio de revelación

bayesiano perfecto, equilibrioconstrucción informal del, 129definición del, 182definición del, en juegos conparloteo, 215definición del, en juegos deseñalización, 190ejercicios 4.1, 4.5, 4.6, 4.8, 4.10-4.15,48,249,252,253,253-56en el dilema de los presos repetidofinitamentecon informadónasimétrica, 227-36en juegos dinámicos con .información completa peroimperfecta, 177-85en juegos dinámicos coninformación incompleta, 175-76en negociación sucesiva coninformación asimétrica, 221-27refinamientos del, 236-48véase tambié/l negociación; juego dela; conjeturas; parloteo, juegos con;híbrido; equilibrio; agrupación ..parcial, equilibrio de; agrupación,equilibrio de; refinamiento;requisitos1-4; separación, equilibno de;sucesivo, equilibrio; señalización,juego de la; perfecto en subjuegos,equilibrio de Nash

bayesiano perfecto híbrido, equilibrioejercicio 4.7, 253en señalización en el mercado detrabajo, 205-207

bayesiano perfecto con estrategiasmixtas, equilibrioejercicio 4.2, 250

bayesiano perfecto de agrupación,equilibriodefinición de, en juegos deseñalización, 190ejercicios 4.3, 4.4, 4.16,250, 251, 256ejemplo de, 191en juegos cOh p~r1oteo; 215~16en un juego de señalización deestructura de capital, 208-10en un juego de señalización enpolítica inonetaria, 210en señalización en el mercado detrabajo, 189.~201

bayesiano perfecto de separación,equilibriodefinición de~ en juegos deseñalización, 190ejemplo de,192ejercicio 4.4, 251en juegos con parloteo, 217en un juego de señalizaciónen el m~rcado de trabajo, 199-204en un juego de señalización enestructura de capital, 208en un juego de señalización enpolítica monetaria, 211-12

Becker, G., 130béisbol, estrategias mixtas en el, 30, 40Benoit, J.-P., 130Bertrand, J., 2, 15n1Bertrand, equilibrio de, 60n4Bertrand, juegode duopolio de, 21, 23;59

con información asimétrica: ejercicio

3.3,169-70con productos homogéneos: ejercicio

1.7,49en juegos repetidos: ejercicios 2.13,

2.14,136vease también duopolio, juego de

Bhattacharya, S., 130, 248Brandenburger, A., 47Brouwer, teorema de punto fijo de, 45Buchanan, J., 131Bulow, L 112, 130, 169

colusiónen el duopolio de Coumotdinámico, 101-106en modelos dinámicos de duopolio,105-10.véase también repetido, juego

compatibilidad de incentivos, 164-65competencia internacional, 70conjeturas.

en conjuntos de información con unoy más de un elemento, 179en equilibrio bayesianoperfecto,181,185en juegos bayesianos estáticos, 148en refinamientos del equilibriobayesiano perfecto, 236-47véase también información imperfecta;información incompleta

conjunto deinformacióncon más de un elemento,l22, 129,176,178,189definido, con ejemplos, 222-23en la definición deinformaciónimperfectar.121en la definición de informaciónperfecta, 121véase también conjeturas; nodo dedecisión; trayectoria de equilibrio;información imperfecta; informaciónincompleta

continuación, juego de, 176, 235ejercicios 4.12, 4.14, 254, 256

cooperaciónen el dilema de los presos repetidoinfinitainénte con informaciónasimétrica, 227-36en el modelo de salarios deeficiencia,l07-108en juegos repetidos infinitamente,

ÍNDICE AN,\J.ÍTICO /263

89-90,101-102,228n6en juegos repetidos finilamente coninformación completa, 82-86véase también repetido, juego

correlacionado, equilibrio, 35n 15correspondencia de mejor respuest~

como función de mejor respuesl~,42-43definida, 36de n jug~dores, 47intersecciones de, 39, 41representaciones gráfic~s de, 35, 38,42-44

Cournot, A., 2, 11Coumot, juego de duopoli%ligopolio

decon información asimétrica, 143,144-146,147,151con información complet~, 15-21,59-62,75-76,145-146ejercicio 3.2, 169ejercicios 1.4-1.6, 48-49ejercicio 2.15, 176en juegos repetidos, 101-106véase también juego de duopolio

Cournot, equilibrio de, 60n4Cr~mton, P., 248Crawford, V., 177, 214,253credibilidad en los juegos dinámicos, 53

véase también amenazas y promesasCriterio intuitivo, véase requisito 6 de

señalización

Chatterjee, K., 159Cho, l.-K., 177, 241, 243, 249

lJ~sgupta, P. 48decisión, teoría de In, uni- frenle ~multi-personal, 61

Deere, D., 169Diamond, D., 54, 73dilema de los presos, el

cooperación en, 89-91, 227-236equilibrio de Nash en, 10

l

26-1 / íNDICE ANALÍTICO

estrategia dd disparador en, 90estrategia del Talión en, 228estrategias dominadas en, -1ganancia de reserva en,81-82repetido finilamente, 80-82repdido finilamente con informaciónasimétrica, 227-36repetido infinitamente, 87-90, 90.95representación en forma extensivade, 120representación en forma normal de,213

dilema del samaritano, 131dinámico, juego

con información completa peroimperfecta, 70, 120-121con información completa y perfecta,55

con información incompleta, 176estrategia en, 91,117véase tamuíé" inducción hacia atTás;fDrma extensiva, juego en; bayesianoperfécto, équilibrio; repetido¡ juego;perféCto en subjuegos, equilibrio deNash

disparad(¡r (/rigger), estrategia del, 90,95,99, 103,106, véase tambiénrepetido, juego

dmninada, estrategia, véaseestriclalllt.~nte donúnada, estrategia

duopolio, juego de,véase Bertrand,jUégn de duo polio de; Coumot, juegode duopoli%ligopolio de;supervisión imperfecta, juegos con;Stackelberg, juego de duopolio de;variables de estado, juego con

Dybvig, 1'.5-1,73, 208

ejid'ls, el prublema de los, 27-28elilninación iterativa de estrategias

estrictamente dominadas; 4-8, 13-15en juegos de aligo polio de Coumot,19.21

véase tamuíé" estrictamentedominada, estrategia

equilibrio, véase bayesiano de Nash,equilibrio; bayesiano perfecto,equilibrio; de agrupación, equilibrio;de separación, equilibrio; hlbrido,equilibrio; lineal, equilibrio; Nash,equilibrio de; perfecto en subjuegos,equilibrio de Nash; agrupaciónparcial, equilibrio de

espado de estrategiasejercicios 3.2,3.3,169en equilibrio lineal, 155-56, 160en el juego de duopolio de Bertrand,21 "en el juego de duo polio deCoumot,15en j~egos con información completa,3en juegos dinámicos con informacióncompleta, 118en juegos estáticos con informacióncompleta, 92en juegos estáticos con informaciónincompleta; 150-51en subastas, 155véase también forma extensiva, juegoen; forma normal, juego en

espacio de tiposen el juego de Coumot cdninfomlación asinlétrica, 147en juegos bayesianos estáticos, 147-48en la batalla de los sexos coninformación incompleta, 153

Espinosa, M., 67,129,137estático, juego

con información completa, 1-2con información incompleta, 143véase tambié" ba yesiano deNash, equilibrio; Nash, equilibrio de;fonna normal, juego en; etapa, juegode

estrategia, véase conjetura; el palo y lazanahoria, estrategia de; equilibrio;mixta, estrategia; pura, estrategia;estrictamente dominada, estrategia;disparador, estrategia de

estrictamente dominada, estrategia

definición de, 5véase también eliminación iterativa deestrategias estrictamente dominadas

etapa, juego decon múltiples equilibrios de Nash,82-87de decisiones sucesivas, 109, 111en el teorema de Friedman, 92en juegos repetidos infinitamente, 86,91-92en juegos repetidos infinitamente coninformación completa, 82en juegosrep~tid()s io'!fulitan,erüe coninformación incomple,\a,;2,27véase también repetido, ju~go

expectativas ..en un juego repetido de políticamonetaria, 112-115véase también expectativas racionales

expectativas racionales, 3

factor de pescuento, 66, 16n7efecto de valores bajos del, 99,102-106,en juegos repetidos infinitamente, 93,97

Farber, H., 2, 23farol, en póquer, 30Farrell, J., 86,120,213,248Fenlández,Fl,129finito,juego: 34,45, 181n1. Véas~ tambiénrepetido finita mente, juegoforma extensiva, juego en, 4, 115-117

ejercicios 2.21, 2.22, 138-39relación con la forma normal,119véase también nodo de decisión;conjunto de info,rmación; formanomlal, juego en

forma normal, juego en:definición de, par,! ti!' juego coninformación completa, 3, 4definición de, para un juegoestático con información incompleta,146-150ejercicios 2.21,2.22, 138-39

ÍNDICE ANALÍTICO / 265 .

ejercicio 4.1,249relación con juegos en formaextensiva, 118-19transcripción del enunciado informalde un problema a un, 15-16,21-22,153, 155véase también forma extensiva, juegoen

Friedrnan, L 15n1, 54, 96,101Friedman, teorema de, 88

demostración del, 97, 99-101enunciado del, 96

frontera, de Pareto, 87 .Fudenberg, D., 98, 181n3función de mejor respuesta, 35-37,

como correspondencia de mejorrespuesta, 42-43como estrategia, 125en el juego de duopolio de Coumot,17-21,39en el juego delos aranceles,. 75

funciones de ganancias, en jue~s"bayesianos estáticos"146,1.49en juegos estáticos con informacióncompleta, 4

ganancia factible, 95ganancia medio, 96ganancia de reserva, 97, 98,.. ."

ganancias, información del dominio~"público sob;e Ías, 117,143 ".determinados por estrategias, 2esperados a partir deestrategias mixtas, 36:incertidumbre sobre los, 143, 146-147véase también ganancia factible;ganancia meclia; ganancia de reserva

Gibbons, El,48, 213, 248Glazer, J., 129Gordon, D., 54, 112granada, juego de la "

amenazas no crelbles en el, 53-54como juego con informacióncompleta y perfecta, 55ejercicio 2.21, 138-39

;,.

,(;"

--266 I ÍNDICE ANALÍTICO

véase también amenazas y promesasCreen, E.,106

Hall, R., 159, 171Hardin, C"V., 27Harsanyi, J., 31, 148, 152, 176Hart, O., 168hfbrida, estrategia, 188morida, equilibrio., véase bayesiana

perfecta, equilibrio.; hfbrida,estrategia

hipótesis de racianalidad; en inducciónhacia atrás, 57-59

Hatelling, H., 50Huizinga, H., 135Hume, D., 2, 27

ignarancia de jugadas anteriares, izO-21véase también infarmación imperfecta

inducción hacia atrásen equilibrio. bayesiana perfecta, 185en equilibrio. de Nashperfecta ensubjuegas, 124, 129en juegas dinámicas can infarmacióncampleta y perfecta, 56en juegas dinámicas can infarmaciónincampleta, ejercicio. 3.8; 171-72hipótesis subyacentes de, 57-59véase también resultada par inducciónhacia atrás

inducción hacia adelante, 243infarmación

en tearía de la decisión uni- frente amultipersanal,61véase también infarmación asimétrica;infarmación campleta; infarmaciónimperfecta; infarmación incampleta;infarmación perfecta; infarmaciónprivada

infarmación asimétricaejercicias 3.2, 3.3, 169ejercicio. 4.12, 254en el dilema de las presas repetidafinitamente,227,236

en el madela de duapalia deCaumat, 144-146en el madela de negaciaciónsucesiva, :221-27véase también infarmación incampleta;infarmación privada

infarmación campleta, 1, 143, véasetambién información incampleta

información campleta y perfecta, juegacan, 55, véase también inducción hacia

atrás; repetida, juega; perfecta en ~subjuegas, equilibrio. dé Nash

infarmación campleta.pero irriperféda,juega can, 70, 120-121 .en das etapas, 92, 117 .véase tainbién infarmaaónimpeTf~da; bayesiand pérfeCta,.equillbda; repetida, juega; perfectaen subjuegas, eijúilibria de Nash

infarmación del daminio pública, 7en el juega de dúopalia de Caumatcon información asimétrica, 144en juegas can infúrmati6n corhpletay perfécta; 11i,143sabre la racianalidad de lasjugadares, 7, 56-59sabre,las fvncianes de ganancias delas juga49'res, 1

infarmación iÍl'iperfecta .definida, 53en el juega de las aranceles, 73-77en el juego de las pánicas bancarias,71-73en el juega de tameo, 77-80en juegas repetidas finitamente, 80'87en juegas repetidas infinitamente,87-105juegas dinámicas con; 10véase también infamación completapera imperfecta, juego can;información incompleta; canjunta deinfarmación; bayesiana perfecta,equilibrio.; infarmación perfecta/o ; .perfecta en subjuegas, equilibrio. déNash

infarmación incampleta

dudas sabre la racianalidad cama,53nlen juegas can parla tea, 213-21en la reinterpretación del equilibrio.de Nash can estrategias mixtas, 40,152-55en las juegas de señalización,185-213,236-47en un juega estática, 146-150véase también infarmación asimétrica;bayesiana de Nash, equilibrid;infarmación campleta; infarmaciónimperfecta; bayesiana perfecta,equilibrio.; infarmación privada;reputación; principia de revelación

infarmación incampleta, juega can, 143,176, véase también bayesiana, juega;bayesiana de Nash, equilibrio.;parlatea, juegas con; infarmaciónincampleta; bayesiana perfecta,equilibrio.; señalización, juega de

infarmación perfectadefinida, 53, 121juega dinámico can, 54véase también inducción hacia atrás;dinámica can infarmación campletay perfecta, juega; Infarmaciónimperfecta; perfecta en subjuegas,equilibrio. de Nash

infarmación privadadiseñando. juegas can, 164ejercicias 3.6-3.8, 171en subastas, 155-58en subastas dables, 159-64véase también infarmaciónasimétrica; bayesiana de Nash,equilibrio.; infarmación incompleta;bayesiana perfecta, equilibrio.;principia de revelación

Jacklin, C. 130jugadares racianales, 4-7

Kakutani, S., 45

ÍNDICE ANALÍTICO I 267

Kakutani, tearema de, 45, 47Kennan, J., 248Klemperer, P., 169K!vfRW (Kreps, Milgram, Raberts,

Wilsan) madela de, 229-34Kahlberg, E., 243Kreps, D., 48, 115n117, 130, 177, 180,

228,241,243KrisllOa, V., 130

Lazear, E., 54, 77,130,134,159,171Leland, H., 248Leontief, W., 54,55,62

McAfee, P., 169McMillan, L 130, 169Majluf, N., 177, 186,208Maskin, E., 48, 86, 98, 130matriz binaria, 3Matthews, S., 213, 248mecanismo. directa;-165

campatibilidad de incentivas, 165decir la verdad en, 166-68para subasta dable, 166véase también principia de revelación

mensaje daminada, véase requisita 5de señalización

mensaje daminado en equilibrio,véaserequisita 6 de señalización

Mertens, J.-F., 243Milgrom, P., 177, 228, 241,248Mincer, J., 193 .mixta, estrategia

definición de, 32ejercicjo 2.23, 139ejercicio. 3.5, 170-71ejercicio. 4.2,250ejercicias 1.9-1.14, 50-51reinterpretación de, 40véase también Nash, equilibrio. de;Nash, tearema de; pura, estrategia;estrategia

manedas, juega de las (matcJ¡i/¡g pe,mies), 29carrespandencia de mejar respuesta

2bí:i 1 ÍNDICE ANALÍTICO

en el, 35equilibrio de Nash con estrategiasmixtas en el, 37-39eSlra legias mixtas en el, 39ganan.:ias esperadas en el, 33siendo más listo en el, 30

Mont¿;omery, J., 51Myers, S., 177, 186,208l'vIyerson, R., 163, 164, 166, 169

Nash, J., 2,11,45Nash, equilibrio de

con amenazas o promesasincreíbles, 53, 126-129con estrategias mixtas, 10n4, 37-45definición de, con estrategiasmixtas, 37definición de, con estrategias puras, 8ejemplos de, 9-10ejercicio 2.21, 138-39ejercicios 1.4-1.8,48-49en el juego de arbitraje de oferta final,23-26en el juego de duopolio de.Berlrand, 21en el juego de duopolio deCmrnot, 16-19en el juego de la moneda, 37-39en el juego de los pánicos bancarios,72-73en juegos en dos etapas ceninformación completa peroimperfecta, 70-71, 72,74,76,78-79en juegos repetidos en dos etapas, 81,83-8~en juegos repetidos infinitamente,90-91,99,102,109-111,114-15existencia de, en juegos finitos, 33-45fundamentación del, 8-9limitaciones del, 177múlliples, 11,na existencia con estra tegias puras,29

reinterpretación con estrategiasmixtas, 40, 152-155

relación con eliminacióniterativa de estrategias estrictamentedominadas, 10-11, 12-15,19-21véase tambié" bayesiano de Nash,equilibrio; convenio; eliminacióniterativa de estrategias estrictamentedominadas; bayesiano perfecto,equilibrio; perfecto en subjuegos,equilibrio de Nash

Nash, teorema de, 33, 45, 124demostración del, 45-47extensión del, 47

negociación con horizonte finito, juego delacon información asimétrica, 221-27ejercicio 2.19,138ejercicios 4.10-4.14, 253-56resultado por inducción hacia atrásdel,66-68

negociación con horiionte infinito, juegodelaejercicios 2.3, 2.20, 131, 138resultado por inducción haciaatrás de Rubinstein, 68-69

negociación de Rubinstein, juego de la,54,55,66,88,117ejercicios 2.3, 2.19, 2.20, 131, 138

niño mimado, teorema del, 130nodo de decisión

en juegos en forma extensiva, 117,119-21. Véase también conjeturas;información imperfecta; conjunto deinformación; nodo terminal

nodo terminalen juegos en forma extensiva, 117en subjuegos, 125n19véase también nodo de decisión; formaextensiva, juego en

Noldeke, G., 194

Osbome, M., 130

palo y la zanahoria, estrategia del, 105,106

pánicos bancarios, juego de los, 70, 71-73ejercicio 2.22, 139

parloteo, juego con (cheap-talk game),177,213-21desarrollo temporal de, 215ejercicios 4.8,4.9,4.15,253,256equilíbrio de agrupación parcial en,213-21,equilibrio bayesiano perfecto en, 177,215véase también bayesiano, juego;bayesiano perfecto, lC'luilibrio;señalízación, juego de.

Pearce, D., 321114,16.penalización, 87

desencadenamiento accidental deuna, 106más fuerte creíble, 98, 104-105véase también palo y la zanahoria,estrategia del; supervisiónimperfecta, juego~~on; disparador,estrategia pe! ., é ••

perfecto en subjuegos, equilibrio deNash, 57, 89:91, 99, 124-126definición de, 94;ejercicios 2.10-2.13, 2.19-2.23,135-36, 138-39véase también inducción hacia atrás,resultado por inducción hacia atrás;Nash, equilibrio de; resultadoperfectoen subjuegos; bayesiano perfecto,equilibrio

Perry, M., 132póquer, 30Porter, R., 106predicción

en teoría de juegos, 8, 9equilibrio de Nash como, 7, 8por inducción hacia atrás, 56-59

Prendergast, c., 133principio de revelación

en el diseño de subastas, 164-165;enunciado.fomlal del, 166véase también mecanismo directo,compatibilídad de incentivos;información privada

ÍNDICE ANALÍTICO 1269

probabilidadde que se acabe un juego repetido, 90distribución, 24nllen estrategias mixtas, 31función de densidad, 23n10véase también regla de Bayes conjetura

problema de teoría de juegos, 4punto fijo, teorema del, 45-47pura, estrategia:

definición de, 93, 117ejercicio 2.18, 138ejercicios 3.1, 3.3,169-70en juegos bayesianos estáticos, 151-52en juegos de señalízación, 188en juegos dinámicos con informacióncompleta, 93en juegos repetidos con informacióncompleta, 93véase también estrategia; mixta,estrategia

Pyle, D., 248

racionalídad.sucesiva, 179.refinamiento

del equilibrio bayesianoperfecto,177,194,199,202,236,248del equilibrio de Nash, 84ejercicio 4.16, 256

regla de Bayes, 149112,180,204n6renegociación, 86-86, 11 ...repetido finitamente, juego:

con información completa, 80-87definición, 82dilema de los presos con iriformaciónincompleta, 227-36renegociación en un, 86-87repetido infinitamente, juego: 87-101definido, 92estrategia del disparador en, 90estrategia en, 93ganancias ené 95subjuego en, 94véase también ganancia mediacooperación; colusión; factor dedescuento; ganancia factible;

(

"\

te::. I.....a't.

';,

.L/

270 / ÍNDICE ANALÍTICO

tradición orat teorema de; gananciade reserva; perfecto en subjuegos,equilibrio de Nash; disparador,estrategia del

representación de un juegorepresentación en formaextensiva, 115-116representación en forma normat 34,146-150véase también forma extensiva, juegoen; forma normal, juego en

reputacióncomparación con el teoremade tradición oral, 228-30en el dilema de los presos repetidofinitamente, 227-36véase también información incompleta;repetido finitamente, juego; repetidoinfinitamente, juego

requisito 5 de señalización (pararefinamiento del equilibrio bayesianoperfecto), 240, 243, 245-46ejercicio 4.16, 256

requisito 5, para refinamiento delequilibrio bayesiano perfecto, 239

requisito 6 de señalización (pararefinamiento del equilibrio ba yesianoperfecto), 243-44, 246-47ejercicio 4.16,256

requisitos 1, 2R, 2E,3 de señalización(para equilibrio bayesiano perfectoen juegos de señalización), 188-90,237n6aplicaciones de, 196, 198-99, 201-204en juegos con parloteo, 215

requisitos 1-4, para equilibrio bayesianoperfecto, 178-85, 188-90, 199, 225-26,236

resultado, comparado con equilibrio, 126véase también resultado por inducciónhacia atrás; resultado perfecto ensubjuegos

resultado perfecto en subjuegosejercicios 2.6-2.9, 133-134en el juego de etapa de políticamonetaria, 113

en el juego de los pánicos bancarios, 72en el juego de los aranceles, 76en el juego de salarios de eficiencia, 108en juegos dinámicos con informacióncompleta pero imperfecta, 71en juegos repetidos en dos etapas, 82,83-84relación con el equilibrio de Nashperfecto en subjuegos, 126-127véase también resultado porinducción hacia atrás; perfecto ensubjuegos, equilibrio de Nash

resultado por inducción hacia atrás, 54ejercicios 2.1-2.5, 130-132en el juego de duopolio deStackelberg, 60en el juego de negociación con tresperiodos, 67en el juego de salarios y nivel deempleo,.65en juegos de etapa, 83n 113en juegos de negociación conhorizonte infinito, 68-69en juegos dinámicos con informaciónperfecta y completa, 56véase también equilibrio de Nash

péi-fecto en subjuegosRhee, c., 65, 129, 137Roberts, L 177, 228, 241, 248Rogoff, K, 112, 130, 248Rosen, S., 54, 77, 130Rotemberg, J., 106, 136Rubinstein, A., 130Rubinstein, juego de negociación de la,

54,55,66,88,117ejercicios 2.3, 2.19, 2.20, 131, 138

salarios de eficiencia, juego de los,106-112ejercicio 2.17, 136

salarios y nivel de empleo en unaempresa con fuente implantaciónsindical, 62con muchas empresas, ejercicio 2.7,133-34

en un juego repetido, ejercicio 2.16,137

Saloner, G., 106, 136Samuelson, W., 159,254Sappington, D., 169Satterthwaite, M., 163Scheinkman¡ J., 48secuencial, equilibrio, 181n1, véase

también bayesiano perfecto, equilibrioSelten, R, 94,124señalización, juegos de: 176-77, 181

definición de, 185-92ejercicios 4.3-4.7, 250-53juego de estructura de capital,207-210juego de mercado de trabajo, 192-207juego de política monetaria, 210-213refinamientos del equilibriobayesiano perfecto en, 239-248véase también bayesiano, juego;comunicación previa, juego con;bayesiano perfecto, equilibrio

separación, equilibrio de, véasebayesiano perfecto, equilibrio

Shaked, A., 68Shapiro, c., 54, 107Sobet J., 66, 177, 214, 222, 248, 249, 253Spence, A.M., 177, 186, 192, 193-95Stacchetti, E.¡ 106Stackelberg, H. van, 15nlStackelberg, equilibrio de, 60, 61n4Stackelberg, juego de duopolio de, 54,

55,59-62,117ejercicio 2.6, 133véase también duopolio, juego de

Staiger, D., 129Stein, L 213, 248Stiglitz, J., 54,107subasta

de sobre cerrado, 155-159doble, 159-164reinterpretación en el mercado detrabajo: ejercicio 3.8,171-72

subjuegodefinición en juegos en formaextensiva, 123-24definición en juegos repetidos finita e

ÍNDICE ANM.íII(,() /2'71

infinitamente, 93en el dilema de los presos rel,elicioinfinitamente, 94en el duopolio de Cournot repetid"infinitamente, 105en el juego de política mone!"ria, n5en el modelo de salarios de eficiencia,111en el teorema de tradición oral, 101véase también inducción hacia atd,continuación, juego de; perfecto ensubjuegos, equilibrio de Nash

supervisión imperfecta, juegos can,105-106,106-112

Sutton, J., 68

Takahashi, L, 66, 177, 222, 254Talión (Tit Jor Tat), estrategia del, en

el dilema de los presos repetido,228-32

tipoen el juego de señalización deestnlclura de capital, 186en el juego de señalización de políticamonetaria, 186en el juego de señalización en elmercado de trabajo, 186en juegos bayesianos estáticos, 147,148en juegos con parloteo, 214en juegos de señalización, 185en subastas, 155véase también información incompleta

Tirole, J., x, 130, 181n3torneo, 70, 77-80

ejercicio 2.8,134Tracy, L 248tradición oral, teorema de, 5'1, 88nl6

véase también Friedman, teorema eletrayectoria de equilibrio

definición de, 210-13conjeturas en conjuntos deinformación en la, 180conjeturas en conjuntos eleinformación fuera de la, 1S2véase tambiérl bayesiano perfecto,

~.) --------------------_---.:...-_~---

equilibrio; refinamiento; perfecto ensubjuegos, equilibrio de Nash

valor próente, 89Van Damme, E., 194variables de estado, juego con, 105-106Vicker" J., 177, 186,210

Wilson, R., 115n17, 130, 177, 180, 228, 248

Ydlen, J., 130

Zender, r., 208

I

U 1'1~¡,il S IVIFacultad de Cielic;;¡s ECélr1Ómicils

D£CANi\TOI ,fBRO CO;\lPR,\DO

l. SE"'JESTRE 2006 1

'-;-~;:C"l"#;"

¡

(;~----~-----------