Por Juan Bravo Raspeño
Índice
- Juegos en forma de árbol
- Juegos en forma estratégica
- El equilibrio de Nash
- Estrategia maximin
- Juegos en forma gráfica
- Juegos en forma coalicional
Teoría de juegos y el teorema del punto fijo
El teorema del punto fijo fue establecido en 1910 por el matemático Jan Brower, y establece que toda función continua y acotada que solo toma valores finitos, admite al menos un punto fijo.
Teorema 1: Sea F una función continua en [a,b] tal que entonces la ecuación x = F(x) tiene al menos una solución en el intervalo [a,b]. A esta solución se le denomina punto fijo.
Von Newmann fue el primero que estableció un nexo entre la noción de equilibrio y la de punto fijo de una función, tal como se emplea en matemáticas; realmente de la misma manera que un punto fijo x de una función f permanece constante mientras se le aplica la función (el punto fijo es tal que (f(x)=x)); un equilibrio “no se mueve”, es fijo, cuando está sometido a distintas “fuerzas” de las cuales él es la resultante. De tal manera en una situación de “juego” dónde los individuos toman decisiones, anticipándose a las de otros agentes, hay equilibrio si sus anticipaciones son confirmadas en el momento en el cual las decisiones de cada uno las conocen todos; ahora este equilibrio puede ser considerado como un punto fijo de la función que hace corresponder las selecciones antes que las decisiones “de los otros” sean conocidas a las selecciones -eventuales- después de que estas han sido anunciadas.
Mediante el empleo de esta especie de analogía John Nash prueba en 1950, que todo juego no cooperativo, es decir, aquél en el cual cada uno sólo se preocupa por sus propias ganancias, admite al menos un equilibrio. Además, su demostración se apoya de manera decisiva en el teorema del punto fijo
El procedimiento de Nash fue retomado y adaptado por los microeconomistas que se preguntaban sobre los equilibrios de sus modelos; en la medida en que el teorema del punto fijo permite generalmente responder a una cuestión como aquella, se puede decir que la microeconomía actual se construye de tal manera que se cumplan las hipótesis de aquel teorema y se asegure en consecuencia la existencia de equilibrios. Esta explicación vale particularmente para el modelo de Arrow-Debreu, que es el modelo básico para la microeconomía.
Tipos de juegos
Los juegos se clasifican en muchas categorías que determinan qué métodos particulares se pueden aplicar para resolverlos (y, de hecho también cómo se define “resolución” en una categoría particular). En general, se pueden considerar cuatro clases de juegos:
- Juegos en forma extensiva (árbol)
- Juegos en forma estratégica (normal)
- Juegos en forma gráfica
- Juegos en forma coalicional
Las tres primeras clases de juegos se analizan en la teoría de juegos no cooperativos y la cuarta corresponde a los juegos cooperativos.
Juegos en forma de árbol
En la figura 1, tenemos dos jugadores 1 y 2, que participan en el siguiente juego. En primer lugar, el jugador 1 decide ir a la izquierda (I) o a la derecha (D). Entonces, el jugador 2 decide ir a la derecha o a la izquierda. Los pagos que corresponden al primer (segundo) jugador son la primera (segunda) componente del vector que tiene asignada cada situación.
Analicemos como deben jugar 1 y 2. El jugador 2, teniendo en cuenta los pagos que recibiría al terminar el juego, debe elegir la siguiente estrategia: si el jugador 1 elige I, ir a la derecha eligiendo d 1 ; y si 1 elige D; elegir i 2 : Esta estrategia se denotará d 1 i 2 : El jugador 1 conoce el árbol y los pagos, luego puede anticipar la conducta del jugador 2 y debe elegir D:
El par de estrategias (D; d 1 i 2 ) da lugar a un escenario en el que el jugador 1 recibe 4 y el jugador 2 recibe 8.
¿Puede alguno de los jugadores mejorar sus pagos?
Juegos en forma estratégica
En el ejemplo que estamos analizando, el jugador 1 tiene dos estrategias I y D; mientras que el jugador 2 tiene cuatro estrategias dadas por
i 1 i 2 , i 1 d 2, d 1 i 2 , d 1 d 2
Podemos representar los pagos en la siguiente matriz, cuyas entradas son los vectores de pagos,
Notemos que las matrices de pagos para los jugadores 1 y 2 son, respectivamente,
El par de estrategias (D; d 1 i 2 ) es un equilibrio de Nash porque ninguna desviación unilateral de los jugadores les permite mejorar sus pagos, dados por (4; 8).
Definición 1: Sea N = {1,2,…., n} un conjunto de jugadores. Un juego estratégico de n personas se representa por , donde X i es el espacio de las estrategias del jugador i, y es la función de pagos del jugador i.
Cada combinación estratégica se denomina un escenario o resultado del juego. Dados un escenario x = (x 1 ; : : : ; x n ) y una estrategia del jugador i; denotamos mediante (x -i ; y) el escenario que obtenemos de x; reemplazando su i-ésima componente x i por y: Usando esta notación, vamos a definir el concepto más importante de la teoría de juegos no cooperativos.
El Equilibrio de Nash
A cada conjunto de estrategias denominado con frecuencia combinación de estrategias , que es una por jugador, se le asocia una salida del juego, caracterizada por las ganancias expresadas en forma de números que le toca a cada uno. Entre estas salidas puede haber unas más “interesantes” que otras, por ejemplo las que “reportan más”. Sin embargo, como regla general, la mayoría de las salidas, si no la totalidad, no son comparables entre ellas en el sentido que el paso de una a otra se traduce en un aumento de ganancias para unos y una baja para otros.
Frente a la ausencia de una clasificación de las salidas que logre la unanimidad de los participantes, los teóricos de juegos adoptan un punto de vista mas limitado, que se puede calificar de “local” en el sentido de estudiar separadamente cada una de las salidas y las combinaciones de estrategias de las cuales ellas son el resultado; se le acuerda un estatuto privilegiado a las que son de “equilibrio”, esto es a las que los individuos, tomados uno a uno no tienen interés en desechar. El matemático John Nash estableció un importante resultado en 1950 sobre la existencia de situaciones de este tipo, se habla entonces de la existencia de equilibrios de Nash .
Así, por definición, se dice de una combinación de estrategias (una por jugador) que está en equilibrio de Nash si ningún jugador puede aumentar sus ganancias por un cambio unilateral de estrategia . Con frecuencia se identifica, por abuso del lenguaje y sin que ello tenga consecuencias, un equilibrio de Nash con la salida que le corresponde.
En la definición del equilibrio de Nash el adjetivo “unilateral” ocupa un lugar esencial, en tanto ello traduce el carácter no cooperativo de las elecciones individuales (el “cada cual para sí mismo”). Así es bastante posible que en un equilibrio de Nash la situación se puede mejorar para todos por medio de un cambio simultáneo de estrategia por parte de varios jugadores.
El equilibrio de Nash ocupa un lugar central en la teoría de juegos; constituye de alguna manera una condición mínima de racionalidad individual ya que, si una combinación de estrategias no es un equilibrio de Nash, existe al menos un jugador que puede aumentar sus ganancias cambiando de estrategia, y en consecuencia, ésta se puede considerar difícilmente como una “solución” del modelo en la medida en que el jugador interesado en cambiar descarta su elección, después de conocer la de los otros.
Ahora, el recíproco de esta proposición no es generalmente verdad: si un juego admite un equilibrio de Nash no existe una razón a priori para que éste aparezca como la “solución” evidente, que se impone a los ojos de todos los jugadores. Ello al menos por una razón: con frecuencia los juegos admiten varios equilibrios de Nash.
Definición 2: Un escenario es un equilibrio de Nash del juego si para todo jugador ; y para toda estrategia ; se verifica .
Estrategia Maximin
En el concepto de equilibrio de Nash es fundamental es supuesto de racionalidad de los agentes. Si un agente sospechara que su adversario no se comporta racionalmente, podría tener sentido que adoptara una estrategia maximin , esto es, aquella en la que se maximiza la ganancia mínima que puede obtenerse.
Vamos a considerar un juego de suma cero. Cada jugador dispone de tres estrategias posibles a las que designaremos como A, B, y C (supongamos que son tres tarjetas con dichas letras impresas). Los premios o pagos consisten en la distribución de diez monedas que se repartirán según las estrategias elegidas por ambos jugadores y se muestran en la siguiente tabla llamada matriz de pagos, en la que p ara cualquier combinación de estrategias, los pagos de ambos jugadores suman diez
Matriz de Pagos
Las estrategias del otro jugador | ||||
A | B | C | ||
Mi estrategia | A | 9 | 1 | 1 | 9 | 2 | 8 |
B | 6 | 4 | 5 | 5 | 4 | 6 | |
C | 7 | 3 | 8 | 2 | 3 | 7 |
Por ejemplo. Si yo juego la tarjeta C y el otro jugador elige su tarjeta B entonces yo recibiré ocho monedas y el otro jugador recibirá dos.
Para descubrir qué estrategia me conviene más vamos a analizar la matriz que indica mis pagos. Ignoro cuál es la estrategia (la tarjeta) que va a ser elegida por el otro jugador. Una forma de analizar el juego para tomar mi decisión consiste en mirar cuál es el mínimo resultado que puedo obtener con cada una de mis cartas. En la siguiente tabla se ha añadido una columna indicando mis resultados mínimos.
Matriz de Pagos
La estrategia del otro jugador | |||||
A | B | C | mínimos | ||
Mi estrategia | A | 9 | 1 | 2 | 1 |
B | 6 | 5 | 4 | 4 | |
C | 7 | 8 | 3 | 3 |
En efecto,
Si yo elijo la tarjeta A, puedo obtener 9, 1 o 2, luego como mínimo obtendré un resultado de 1.
Si elijo la tarjeta B, puedo obtener 6, 5 o 4, luego como mínimo obtendré 4.
Si elijo la tarjeta C, puedo obtener 7, 8 o 3, luego como mínimo obtendré 3.
De todos esos posibles resultados mínimos, el que prefiero es 4 ya que es el máximo de los mínimos . La estrategia MAXIMIN consiste en elegir la tarjeta B ya que esa estrategia me garantiza que, como mínimo, obtendré 4.
Juegos en forma gráfica
Fang, Hipel y Kilgour proponen el siguiente modelo gráfico para un juego no cooperativo. Este consiste en un conjunto N = {1; 2;:::; n} de jugadores, un conjunto U = {1; 2;:::;u} de escenarios, una familia de grafos dirigidos D i = (U;A i ) para cada jugador , y una familia de funciones de pago .
El modelo se completa definiendo el conjunto de movimientos que un jugador puede realizar para cambiar (unilateralmente) de escenario y así obtener los grafos dirigidos D i . Dado que en el juego el objetivo es aumentar los pagos que recibe el jugador, tenemos las siguientes definiciones:
Dado un escenario g y un jugador i, el conjunto de los escenarios que el jugador puede alcanzar unilateralmente desde g se denota por S i (g). Si además, i recibe un pago estrictamente mayor, los escenarios de mejora unilateral para i son:
Introducimos los siguientes conceptos de estabilidad y equilibrio.
Definición 3: Un escenario es estable Nash para el jugador i si . Un escenario es secuencialmente estable para el jugador i si para cualquier existe al menos un escenario con .
Definición 4: Un equilibrio de Nash es un escenario que es estable Nash para todos los jugadores. Un equilibrio secuencial es un escenario que es secuencialmente estable para todos los jugadores.
Juegos en forma coalicional
Un juego coalicional o cooperativo se caracteriza por un contrato que puede hacerse cumplir. La teoría de los juegos cooperativos da justificaciones de contratos plausibles. La plausibilidad de un contrato está muy relacionada con la estabilidad.
Si los jugadores pueden comunicarse entre sí y negociar un acuerdo antes de los pagos, la problemática que surge es completamente diferente. Se trata ahora de analizar la posibilidad de formar una coalición de parte de los jugadores, de que esa coalición sea estable y de cómo se deben repartir las ganancias entre los miembros de la coalición para que ninguno de ellos esté interesado en romper la coalición.
Juego 1 .- Empecemos con el ejemplo más sencillo. Supongamos que tres jugadores, Ana, Benito y Carmen, tienen que repartirse entre sí cien euros. El sistema de reparto tiene que ser adoptado democráticamente, por mayoría simple, una persona un voto. Hay cuatro posibles coaliciones vencedoras: ABC, AB, BC y AC, pero hay infinitas formas de repartir los pagos entre los tres jugadores.
Supongamos que Ana propone un reparto de la forma A=34, B=33 y C=33.
Benito puede proponer un reparto alternativo de la forma A=0, B=50 y C=50
Carmen estará más interesada en la propuesta de Benito que en la de Ana. Pero puede proponer una alternativa aún mejor para ella: A=34, B=0 y C=66.
A Benito es posible que se le ocurra alguna propuesta mejor para atraer a Ana.
El juego puede continuar indefinidamente. No tiene solución. No hay ninguna coalición estable. Sea cual sea la propuesta que se haga siempre habrá una propuesta alternativa que mejore los pagos recibidos por cada jugador de una nueva mayoría.
Definición: En los juegos con transferencia de utilidad se llama solución a una propuesta de coalición y de reparto de los pagos que garantice estabilidad, es decir, en la que ninguno de los participantes de una coalición vencedora pueda estar interesado en romper el acuerdo.
Juego 2 .- Modifiquemos ahora el ejemplo. En vez de "un hombre un voto" consideremos que hay voto ponderado. Ana tiene derecho a seis votos, Benito a tres y Carmen a uno. Las posibles mayorías son las siguientes: ABC, AB, AC, A.
En esta situación Ana propondrá un reparto de la siguiente forma: A=100, B=0 y C=0. Ese reparto se corresponde con una coalición estable en la que los seis votos de Ana estarán a favor. Es una solución única. Ana no aceptará ningún reparto en el que ella obtenga menos de 100 euros y sin la participación de Ana no hay ninguna coalición vencedora.
Definición 5 : Se llama "valor del juego" al pago que un jugador tiene garantizado que puede recibir de un juego si toma una decisión racional, independientemente de las decisiones de los demás jugadores. Ningún jugador aceptará formar parte de una coalición si no recibe como pago al menos el valor del juego.
En el juego 1, el valor del juego es cero para los tres jugadores. En el juego 2 el valor del juego para Ana es cien y para Benito y Carmen es cero.
Juego 3 .- Pongamos un ejemplo algo más realista y, por tanto, un poco más complejo. Supongamos un municipio en el que cinco partidos políticos se han presentado a las elecciones: el Partido Austero (PA), el Partido Benefactor (PB), el Partido Comunal (PC), el Partido Democrático (PD) y el Partido de la Esperanza (PE). En las elecciones, han obtenido el siguiente número de concejales:
PA=11
PB=8
PC=5
PD=2
PE=1
Como ningún partido ha conseguido la mayoría absoluta, es necesario que se forme una coalición para gobernar el municipio. El presupuesto anual del municipio es de 520 millones de euros. La coalición gobernante debe asignar los cargos y las responsabilidades del ayuntamiento a los diferentes partidos. En las negociaciones se debe acordar el reparto del presupuesto, cargos y responsabilidades entre los partidos. Suponemos que no hay simpatías ni antipatías ideológicas y que los cargos y responsabilidades son valorados exclusivamente según el presupuesto económico que controlan. Supondremos, para simplificar, que hay disciplina de voto y que no son posibles las traiciones internas.
Análisis del juego 3. Como el número total de concejales es 27, la coalición vencedora debe disponer al menos de 14 votos. A diferencia del juego 2, no hay ningún jugador imprescindible para ganar. Si utilizamos la definición que dimos arriba, el valor del juego para todos los jugadores es cero ya que ninguno tiene garantizada su pertenencia a la coalición vencedora.
Definición 6: Se llama "valor de Shapley" a la asignación que recibe cada jugador en una propuesta de reparto según un criterio de arbitraje diseñado por Lloyd S. Shapley. El criterio consiste en asignar un pago a cada jugador en proporción al número de coaliciones potencialmente vencedoras en las que el jugador participa de forma no redundante.
Un jugador es redundante en una coalición si no es imprescindible para que esa coalición resulte vencedora.
Juegos bipersonales de suma nula
En los juegos de suma nula o cero el beneficio total para todos los jugadores, en cada combinación de estrategias, siempre suma cero, es decir, un jugador se beneficia solamente a expensas de otros. El póker o el ajedrez son ejemplos de juegos de suma cero, porque un jugador gana exactamente la cantidad que pierde su oponente. Por tanto, un juego en forma estratégica es un juego de suma cero si .
Un juego de dos personas se denota con (X, Y, K, L) ; donde las estrategias son X={1;2;:::m} e Y = {1; 2; : : :n} : Entonces este juego bipersonal se puede representar mediante una matriz cuyas entradas son vectores de ,
Las filas (columnas) corresponden a las m (n) estrategias del jugador 1 (2). En el caso de que el juego bipersonal sea de suma nula, tenemos que L = -K; y se representa con la matriz .
Veamos un ejemplo de juego bipersonal de suma nula para introducir los principales conceptos.
El jugador I elige una carta de un mazo de tres cartas numeradas 1, 2, 3. El jugador II intenta adivinar la carta que ha elegido I. Después de cada conjetura el jugador I informa al II diciéndole alto, bajo o correcto, dependiendo de la conjetura de I. El juego termina cuando el jugador II acierta la carta y paga al jugador I una cantidad igual al número de tentativas que ha hecho. En el siguiente juego, I y II intercambian sus papeles.
Las estrategias del jugador I son , donde ? es elegir la carta 1, ? la carta 2 y ? la carta 3. Las estrategias del jugador II (excluyendo algunas tontas) son Y = {a; b; c; d; e}; dadas por:
a : Decir 1, si el oponente dice bajo, decir 2 en la siguiente ronda. Si de nuevo dice bajo, decir 3.
b : Decir 1, si el oponente dice bajo, decir 3 en la siguiente ronda. Si dice alto, decir 2.
c : Decir 2, si el oponente dice bajo, decir 3; si dice alto, decir 1.
d : Decir 3, si el oponente dice alto, decir 1 en la siguiente ronda. Si después dice bajo, decir 2.
e : Decir 3, si el oponente dice alto, decir 2 en la siguiente ronda. Si de nuevo dice alto, decir 1.
La matriz de pagos de este juego es
Definición 5: Un par de estrategias (i * ; j * ) para una matriz de pagos K = (K(i; j)) es un punto de silla si
Si existe, un punto de silla K (i * ; j * ) es el pago seguro que tiene el jugador I contra la elección racional del jugador II (que busca minimizar el pago a I). En general, una matriz no tiene puntos de silla y si existe alguno, no necesariamente es único. Si K(i * ; j * ) es un punto de silla, entonces se verifica:
El juego de adivinar la carta numerada no tiene punto de silla porque
Cuando un juego no tenga puntos de silla, es posible elegir estrategias mixtas, obteniendo un nuevo juego, denominado extensión mixta. Las estrategias mixtas consisten en una combinación de varias estrategias escogidas al azar, una cada vez, según determinadas probabilidades.
Para un juego matricial A = (a ij ); el conjunto de estrategias mixtas para el jugador I es:
Cada estrategia mixta consiste en jugar la estrategia de la fila i con probabilidad x i : De manera análoga, las estrategias mixtas para el jugador II son:
Definición 6: Sea A un juego matricial . Entonces, la extensión mixta de A es el juego infinito ; definido mediante:
Teorema 2 (von Neumann): Sea A un juego matricial . Entonces, existen un par de estrategias mixtas tales que
La existencia de estrategias mixtas óptimas no nos da un método para calcularlas. El teorema minimax también puede probarse usando programación lineal, lo que permite obtener un algoritmo eficiente mediante el método del simplex.
UN EJEMPLO POLITICO
Con la estrategia maximin podemos calcular equilibrios de Nash, para ello vamos a ver un ejemplo:
En un año electoral, dos partidos políticos A; B deben pronunciarse sobre una disputa entre dos comunidades X; Y relativa a ciertos derechos de aguas, y cada partido debe decidir si favorece a una de las dos o soslaya la cuestión.
En la siguiente tabla se representan por filas las estrategias del programa de A, y por columnas las estrategias del programa de B. Los pagos al partido A, en porcentaje de votos, se dan en las entradas de la tabla, y la suma de porcentajes de A y B es 100.
Favorecer X | Favorecer Y | Soslayar | |
Favorecer X | 35 | 10 | 60 |
Favorecer Y | 45 | 55 | 50 |
Soslayar | 40 | 10 | 65 |
El método para encontrar los equilibrios de Nash es el siguiente. Supongamos que B conoce la decisión de A: Entonces, B elige la columna donde se hace mínimo el pago de A, con lo que A elegiría la fila que la proporcione el máximo de dichos mínimos. Este valor, denominado maximin es la cantidad que con seguridad puede obtener A y en este juego es
Si cambiamos los papeles de A y B; siendo A el que conoce la estrategia de B; tenemos que A elige la fila que maximiza su pago, con lo que B se decidiría por la columna que minimice dichos máximos. El valor minimax de este juego es
En este juego, hemos obtenido un par de estrategias (Y;X) con pago a 21 = 45; que constituye el único equilibrio de Nash de este juego.
Juegos bipersonales de suma no nula
En los juegos de suma no cero la ganancia de un jugador no necesariamente se corresponde con la perdida del otro. La mayoría de ejemplos reales en negocios y política corresponden a este tipo. Por ejemplo, un contrato de negocios involucra un desenlace de suma positiva, donde cada oponente termina en una posición mejor a laque tendría si no se hubiera dado el negocio.
El dilema del prisionero es un claro ejemplo de juego de suma no cero
El teorema de Von Neumann se generaliza a los juegos bipersonales de suma no nula, que denominamos juegos bimatriciales, considerando la extensión mixta de un juego bimatricial (A;B) ; que denotamos ; dada por K(x; y) := x T Ay; L(x; y) := x T By; donde : El resultado fundamental que garantiza la existencia de equilibrios de Nash es:
Teorema 3 (Nash): La extensión mixta de un juego bimatricial tiene al menos un equilibrio de Nash.
EJEMPLO DE LA DECISÓN DE INVERTIR
Dos empresas compiten por la venta de un programa para codificar ficheros. Las dos utilizan el mismo procedimiento de codificación, por lo que los ficheros codificados por el programa de una de ellas pueden ser leídos por el de la otra, lo que constituye una ventaja para los consumidores. Además la empresa 1 tiene una cuota de mercado mucho mayor que la empresa 2. Ambas empresas están planeando invertir en un nuevo procedimiento de codificación.
Empresa 2 | |||
No invertir | Invertir | ||
Empresa 1 | No invertir | 0 \ 0 | -10 \ 10 |
Invertir | -100 \ 0 | 20 \ 10 |
La estrategia dominante de la empresa 2 es invertir. Si la empresa 2 no invierte la empresa 1 contraería pérdidas considerables, por tanto si las dos empresas actúan racionalmente decidirán invertir, y entonces se producirá un equilibrio de Nash. Si la empresa 2 no actúa de esta manera la estrategia maximin de la empresa 1 es no invertir. Si 1 sabe que 2 está utilizando una estrategia maximin, entonces 1 decidirá invertir.
Modelos importantes de juegos
El Dilema del Prisionero
Dos delincuentes son detenidos y encerrados en celdas de aislamiento de forma que no pueden comunicarse entre ellos. El alguacil sospecha que han participado en el robo del banco, delito cuya pena es diez años de cárcel, pero no tiene pruebas. Sólo tiene pruebas y puede culparles de un delito menor, tenencia ilícita de armas, cuyo castigo es de dos años de cárcel. Promete a cada uno de ellos que reducirá su condena a la mitad si proporciona las pruebas para culpar al otro del robo del banco, pero ellos han prometido no delatarse. Las alternativas para cada prisionero pueden representarse en forma de matriz de pagos. La estrategia "lealtad" consiste en permanecer en silencio y no proporcionar pruebas para acusar al compañero. Llamaremos "traición" a la estrategia alternativa.
Los pagos a la izquierda o a la derecha de la barra indican los años de cárcel a los que es condenado el preso X o Y respectivamente según las estrategias que hayan elegido cada uno de ellos.
Preso Y | |||
lealtad | traición | ||
Preso X | lealtad | 2 \ 2 | 10 \ 1 |
traición | 1 \ 10 | 5 \ 5 |
Para que una matriz de pagos represente un “dilema del prisionero” deben concurrir las siguientes circunstancias:
Confesar uno sólo debe ser mejor para él que no confesar mutuamente.
No confesar mutuamente debe ser e su vez mejor que confesar ambos.
Cuando cada uno elige una estrategia diferente, confesar y no confesar, la ganancia media entre estas dos estrategias no puede ser mejor que las estrategias de confesar ambos.
Consideremos al prisionero X. Supongamos que cree que el prisionero Y respeta sus promesas anteriores y no confiesa. Si el prisionero X confiesa, se reduciría su pena a un año, lo que es preferible a la opción de no confesar, que acarrea un de condena (dado que el otro prisionero no confiesa). Si por el contrario, cree que el prisionero Y va a confesar, no importando sus promesas anteriores, confesar le da 5 años de cárcel, lo que es mejor que cargar con todas las culpas y 10 años de cárcel al no confesar.
Por lo tanto, no importando lo que haga el prisionero Y, el prisionero X está mejor confesando: es su estrategia dominante. Lo mismo ocurre con el prisionero Y, por lo que el único equilibrio en estrategias dominantes es aquel en que ambos prisioneros confiesan. Es notable que a pesar que cooperando les habría ido mejor, ambos confiesan y terminan peor.
El dilema del prisionero es un juego de enorme importancia. Proporciona una explicación para las dificultades para establecer la cooperación entre agentes económicos. Tiene aplicaciones en pesquería, donde la falta de respeto a los compromisos de restringir la pesca puede llevar a sobreexplotación del recurso, como ocurre actualmente en las pesquerías en Chile. El dilema del prisionero también es relevante en la formación de carteles (acuerdos entre firmas) para subir los precios, ya que las firmas se ven tentadas a vender más de lo acordado a los altos precios que resultan de los carteles, lo que reduce los precios. El dilema del prisionero muestra las dificultades para establecer la colaboración en cualquier situación en la que hacer trampa beneficia a las partes.
Modelo Halcón Paloma
En el lenguaje ordinario entendemos por "halcón" a los políticos partidarios de estrategias más agresivas mientras que identificamos como "paloma" a los más pacifistas. El modelo Halcón-Paloma sirve para analizar situaciones de conflicto entre estrategias agresivas y conciliadoras. Este modelo es conocido en la literatura anglosajona como el " hawk-dove " o el " chicken " y en español es conocido también como "gallina".
Dos vehículos se dirigen uno contra otro en la misma línea recta y a gran velocidad. El que frene o se desvíe ha perdido. Pero si ninguno de los dos frena o se desvía...Este sería un modelo halcón paloma
También se ha utilizado este modelo abundantemente para representar una guerra fría entre dos superpotencias. La estrategia Halcón consiste en este caso en proceder a una escalada armamentística y bélica. Si un jugador mantiene la estrategia Halcón y el otro elige la estrategia Paloma, el Halcón gana y la Paloma pierde. Pero la situación peor para ambos es cuando los dos jugadores se aferran a la estrategia Halcón. El resultado puede modelizarse con la siguiente matriz de pagos.
Jugador Y | |||
Paloma | Halcón | ||
Jugador X | Paloma | 2º \ 2º | 3º \ 1º |
Halcón | 1º \ 3º | 4º \ 4º |
Podemos observar las sutiles pero importantes diferencias de este modelo con el Dilema del Prisionero. En principio la matriz es muy parecida, simplemente se han trocado las posiciones de los pagos 3º y 4º, pero la solución y el análisis son ahora muy diferentes.
Aquí hay dos resultados que son equilibrios de Nash: cuando las estrategias elegidas por cada jugador son diferentes; es decir, cuando uno elige halcón y el otro paloma. Por el contrario, en el Dilema del Prisionero el equilibrio de Nash está en el punto en que ambos jugadores traicionan.
Otra notable diferencia de este juego con otros es la importancia que aquí adquiere el orden en que los jugadores eligen sus estrategias. Como tantas veces en la vida real, el primero que juega, gana. El primero elegirá y manifestará la estrategia Halcón con lo que el segundo en elegir se verá obligado a elegir la estrategia Paloma, la menos mala.
La Guerra de los Sexos
El modelo de "La guerra de los sexos" es un ejemplo muy sencillo de utilización de la teoría de juegos para analizar un problema frecuente en la vida cotidiana. Hay dos jugadores: "ÉL" y "ELLA". Cada uno de ellos puede elegir entre dos posibles estrategias a las que llamaremos "Fútbol" y "Discoteca".
Supongamos que el orden de preferencias de ÉL es el siguiente:
(Lo más preferido) EL y ELLA eligen Fútbol.
EL y ELLA eligen Discoteca.
EL elige Fútbol y ELLA elige Discoteca.
(Lo menos preferido) El elige Discoteca y ELLA elige Fútbol.
Supongamos que el orden de preferencias de ELLA es el siguiente:
(Lo más preferido) ÉL y ELLA eligen Discoteca.
EL y ELLA eligen Fútbol.
EL elige Fútbol y ELLA elige Discoteca.
(Lo menos preferido) Él elige Discoteca y ELLA elige Fútbol.
La matriz de pagos es la siguiente, donde los pagos representan el orden de preferncias:
Guerra de los Sexos: Matriz de Pagos
Ella | ||||
Fútbol | Discoteca | |||
Él | Fútbol | 1º \ 2º | 3º \ 4º | |
Discoteca | 4º \ 4º | 2º \ 1º |
Este juego, tal como lo hemos descrito, es un juego sin repetición y sin transferencia de utilidad. Sin repetición significa que sólo se juega una vez por lo que no es posible tomar decisiones en función de la elección que haya hecho el otro jugador en juegos anteriores. Sin transferencia de utilidad significa que no hay comunicación previa por lo que no es posible ponerse de acuerdo, negociar ni acordar pagos secundarios ("Si vienes al fútbol te pago la entrada").
El problema que se plantea es simplemente un problema de coordinación. Se trata de coincidir en la elección. Al no haber comunicación previa, es posible que el resultado no sea óptimo. Si cada uno de los jugadores elige su estrategia maximín el pago que recibirán (3\3) es subóptimo. Esa solución, no es un punto de equilibrio de Nash ya que los jugadores están tentados de cambiar su elección: cuando ELLA llegue a la discoteca y observe que ÉL se ha ido al fútbol, sentirá el deseo de cambiar de estrategia para obtener un pago mayor.
El modelo que hemos visto es un juego simétrico ya que jugadores o estrategias son intercambiables sin que los resultados varíen. Podemos introducir una interesante modificación en el juego convirtiéndolo en asimétrico a la vez que nos aproximamos más al mundo real. Supongamos que las posiciones 2ª y 3ª en el orden de preferencias de ÉL se invierten. EL prefiere ir solo al Fútbol más que ir con ELLA a la Discoteca. La matriz de pagos queda como sigue:
Guerra de los Sexos: Matriz de Pagos
Ella | ||||
Fútbol | Discoteca | |||
Él | Fútbol | 1º \ 2º | 2º \ 3º | |
Discoteca | 4º \ 4º | 3º \ 1º |
Si ELLA conoce la matriz de pagos, es decir, las preferencias de ÉL, el problema de coordinación desaparece. Está muy claro que ÉL elegirá siembre la estrategia Fútbol, sea cual sea la elección de ELLA. Sabiendo esto ELLA elegirá siempre la estrategia Fútbol también, ya que prefiere estar con ÉL aunque sea en el Fútbol que estar sola aunque sea en la Discoteca. La estrategia maximín de ambos jugadores coincide. El resultado, marcado con un asterisco, es un óptimo, un punto de silla, una solución estable, un punto de equilibrio de Nash. Obsérvese que esta solución conduce a una situación estable de dominación social del jugador que podríamos calificar como el más egoísta.
Bibliografía
Binmore, K (1994) “Teoría de Juegos” McGraw-Hill, Madrid.
Federico "Teoría de Juegos y Tipos de Juegos" [en linea]
Dirección URL: https://www.zonaeconomica.com/teoriadejuegos/tiposdejuego (Consultado el 04 de Nov de 2024)