Teoría de juegos







Historia de la Teoría de Juegos

La teoría de juegos como tal fue creada por Oskar Morgenstern (1902-1976) y el matemático  John Von Neumann (1903-1957) en 1944 gracias a la publicación de su libro “The Theory of Games Behavior”. Anteriormente los economistas Cournot y Edgeworth habían anticipado ya ciertas ideas, a las que se sumaron otras posteriores de los matemáticos Borel y Zermelo que en uno de sus trabajos (1913) muestra que juegos como el ajedrez son resolubles. Sin embargo, no fue hasta la aparición del libro de Von Neumann y Morgenstern cuando se comprendió la importancia de la teoría de juegos para estudiar las relaciones humanas.

Von Neumann y Morgenstern investigaron dos planteamientos distintos de la Teoría de Juegos. El primero de ellos el planteamiento estratégico o no cooperativo. Este planteamiento requiere especificar detalladamente lo que los jugadores pueden y no pueden hacer durante el juego, y después buscar cada jugador una estrategia óptima.



En la segunda parte de su libro, Von Neumann y Morgenstern desarrollaron el planteamiento coalicional o cooperativo, en el que buscaron describir la conducta óptima en juegos con muchos jugadores. Puesto que éste es un problema mucho más difícil, sus resultados fueran mucho menos precisos que los alcanzados para el caso de suma cero y dos jugadores.

En los años 50 hubo un desarrollo importante de estas ideas en Princeton, con Luce and Raiffa (1957), difundiendo los resultados en su libro introductoria, Kuhn (1953) que permitió establecer una forma de atacar los juegos cooperativos, y por fin Nash (1950) quien definió el equilibrio que lleva su nombre, lo que permitió extender la teoría de juegos nocooperativos más generales que los de suma cero. Durante esa época, el Departamento de Defensa de los EE.UU. fue el que financió las investigaciones en el tema, debido a que la mayor parte de las aplicaciones de los juegos de tipo suma-cero se concentraban en temas de estrategia militar.
John Forbes Nash (1928- ) otro de los nombres más destacados relacionado con la teoría de juegos. A los 21 años escribió una tesina de menos de treinta páginas en la que expuso por primera vez su solución para juegos estratégicos no cooperativos, lo que desde entonces se llamó "el equilibrio de Nash", que tuvo un inmediato reconocimiento entre todos los especialistas.


El punto de equilibrio de Nash es una situación en la que ninguno de los jugadores siente la tentación de cambiar de estrategia ya que cualquier cambio implicaría una disminución en sus pagos. Von Neumann y Oskar Morgenstern habían ya ofrecido una solución similar pero sólo para los juegos de suma cero. Para la solución formal del problema, Nash utilizó funciones de mejor respuesta y el teorema del punto fijo de los matemáticos Brouwer y Kakutani.

En los años siguientes publicó nuevos escritos con originales soluciones para algunos problemas matemáticos y de la teoría de juegos, destacando la "solución de regateo de Nash" para juegos bipersonales cooperativos. Propuso también lo que se ha dado en llamar "el programa de Nash" para la reducción de todos los juegos cooperativos a un marco no cooperativo. A los veintinueve años se le diagnosticó una esquizofrenia paranoica que lo dejó prácticamente marginado de la sociedad e inútil para el trabajo científico durante dos décadas. Pasado ese lapsus, en los años setenta, recuperó su salud mental y pudo volver a la docencia y la investigación con nuevas geniales aportaciones, consiguiendo en 1994 el Premio Nóbel de Economía compartido con John C. Harsanyi y Reinhart Selten por sus pioneros análisis del equilibrio en la teoría de los juegos no cooperativos.

En los 60 y 70 Harsany (1967) extendió la teoría de juegos de información incompleta, es decir, aquellos en que los jugadores no conocen todas las características del juego: por ejemplo, no saben lo que obtienen los otros jugadores como recompensa. Ante la multiplicidad de equilibrios de Nash, muchos de los cuales no eran soluciones razonables a juegos, Selten (1975) definió el concepto de equilibrio perfecto en el subjuego para juegos de información completa y una generalización para el caso de juegos de información imperfecta.


La última aportación importante a la teoría de juegos es de Robert J. Aumann y Thomas C. Schelling, por la que han obtenido el premio Nóbel de economía en el año 2005.

En The Strategy of Conflict, Schelling, aplica la teoría del juego a las ciencias sociales. Sus estudios explican de qué forma un partido puede sacar provecho del empeoramiento de sus propias opciones de decisión y cómo la capacidad de represalia puede ser más útil que la habilidad para resistir un ataque Aumann fue pionero en realizar un amplio análisis formal de los juegos con sucesos repetidos. La teoría de los juegos repetidos es útil para entender los requisitos para una cooperación eficiente y explica por qué es más difícil la cooperación cuando hay muchos participantes y cuándo hay más probabilidad de que se rompa la interacción. La profundización en estos asuntos ayuda a explicar algunos conflictos, como la guerra de precios y las guerras comerciales.



Aplicaciones

La teoría de juego es de ayuda para tomar decisiones en situaciones de conflicto sobre la base de la construcción de una matriz formal que permite comprender el conflicto y sus posibles soluciones. Su aplicación es apropiada para problemas donde quienes toman las decisiones no poseen un control completo de los factores que influyen en el resultado, pero dónde se presentan influencias y determinaciones mutuas en las actuaciones reciprocas de los individuos u organizaciones sociales involucrados. La teoría de juegos tiene una relación muy lejana con la estadística. Su objetivo no es el análisis del azar o de los elementos aleatorios sino de los comportamientos estratégicos de los jugadores.


El principal objetivo de la teoría de los juegos es determinar los papeles de conducta racional en situaciones de "juego" en las que los resultados son condicionales a las acciones de jugadores interdependientes.

Un juego es cualquier situación en la cual compiten dos o más jugadores. El Ajedrez y el Póker son buenos ejemplos, pero también lo son el duopolio y el oligopolio en los negocios. La extensión con que un jugador alcanza sus objetivos en un juego depende del azar, de sus recursos físicos y mentales y de los de sus rivales, de las reglas del juego y de los cursos de acciones que siguen los jugadores individuales, es decir, sus estrategias.

Una estrategia es una especificación de la acción que ha de emprender un jugador en cada contingencia posible del juego.Se supone que, en un juego, todos los jugadores son racionales, inteligentes y están bien informados. 

Pero sin duda, su principal aplicación la encontramos en las ciencias económicas porque intenta encontrar estrategias racionales en situaciones donde el resultado depende no solamente de la estrategia de un participante y de las condiciones del mercado, sino también de las estrategias elegidas por otros jugadores, con objetivos distintos o coincidentes.


JUEGOS NO COOPERATIVOS DE SUMA CERO PARA 2 JUGADORES


En esta situación, se especifica detalladamente lo que los jugadores pueden y no pueden hacer durante el juego, para así buscar cada jugador una estrategia óptima y no es posible cooperación alguna. En los juegos de suma nula o cero el beneficio total para todos los jugadores, en cada combinación de estrategias, siempre suma cero, es decir, un jugador se beneficia solamente a expensas de otros.   El póker o el ajedrez son ejemplos de juegos de suma cero, porque un jugador gana exactamente la cantidad que pierde su oponente. 

La matriz rectangular de pago es en donde se establece cuánto pierde y cuánto gana cada jugador, señala también las estrategias. Una estrategia es la descripción completa de una forma determinada de jugar, dependiente de lo que hacen los demás jugadores y de la duración del juego. Para cualquier juego entre dos personas, se puede representar cada secuencia posible del juego como una casilla en una tabla (también se indican en matriz). La tabla deberá poseer tantas filas como estrategias tenga un jugador, y una columna por cada estrategia del otro jugador. Si se estructura un juego de esta manera, se dice que está en forma normal.


Juego estrictamente determinado

Veamos el siguiente ejemplo: Se establece un juego en el cual hay dos contrincantes (Ay B) y cada uno debe mostrar 1 o 2 de sus dedos al mismo tiempo. Se establece la siguiente matriz de pagos para el juego: 




Jugador renglón (A)
Jugador columna (B)

I
II
I
3
1
II
4
-8


Se tiene entonces que cuando el jugador renglón muestra 1 dedo y el jugador columna muestra 1, el jugador renglón gana 3, pero si el jugador B elige mostrar 2, el jugador A recibirá 1. Cuando el jugador A decide mostrar 2, y el jugador B muestra 1, el jugador A recibe 4; pero si el jugador B elige mostrar 2, este último gana 8.


Aunque este es un juego de suma 0, no es justo ya que el jugador renglón domina el juego, su estrategia dominante es elegir 1 dedo en cada turno para asegurar ganar siempre.

Se desea establecer que estrategia tomará cada jugador y en caso de que sea posible el valor del juego, es decir, cuanto ganará uno y cuanto perderá otro. Para esto se maximiza la ganancia mínima que puede obtenerse y se minimiza la pérdida máxima que puede resultar, de la siguiente manera:

Se determina el peor resultado que puede obtener cada jugador:
Lo peor que puede pasarle al jugador renglón (ganancia mínima) es ganar 1 o perder 8 y lo peor que puede pasarle al jugador columna (perdida máxima) es perder 4 o perder 1, así:

Jugador renglón(A)
Jugador columna (B)


I
II

I
3
1
1
II
4
-8
-8


4
1

Como al jugador renglón le interesa maximizar su ganancia, él elige el máximo de los mínimos, el valor que se elige es 1.


Al jugador Columna le interesa minimizar su pérdida, él elige el mínimo de los máximos, el valor que se elige es 1.

Ahora se procede a trazar líneas sobre los valores elegidos anteriormente, la intersección de estas dos líneas es el valor esperado del juego:

El valor esperado del juego es de 1, a los juegos en donde se puede establecer su valor esperado se les conoce como estrictamente determinado. De acuerdo al valor, el jugador renglón (A) debe usar la estrategia 1 (mostrar 1 dedo) y el jugador columna (B) debe usar la estrategia 2 (mostrar 2 dedos).

Punto de silla 


Un punto de silla es un pago que es al mismo tiempo un mínimo de su renglón y un máximo de su columna.  
Un juego es estrictamente determinado si tiene por lo menos un punto de silla. Lo siguiente se aplica a los juegos estrictamente determinados:

1) Todos los puntos de silla en un juego tienen los mismos valores de pago.
2) Elegir el renglón y la columna que pasan por cualquier punto de silla de estrategias minimax-maxmini para ambos jugadores. Es decir, el juego es solucionado por el uso de estas estrategias puras.
3) El valor de un juego estrictamente determinado es el valor del punto de silla. 
4) Recibe el nombre de punto de silla porque gráficamente representa un paraboloide hiperbólico, el cual tiene forma de silla de montar.





Cuando el juego no es estrictamente determinado

Los juegos en los que  no se puede encontrar el valor esperado del mismo con el procedimiento mostrado anteriormente, se conocen como no determinados estrictamente, y para hallar el valor esperado de dichos juegos se determinan estrategias aleatorizadas.


Se presenta una combinación de dos estrategias escogidas a azar, una cada vez, según determinadas probabilidades, en contraste con una estrategia pura que no contiene tales elementos de azar.

Se tiene la siguiente matriz de pagos, en donde los términos Ei denotan las diferentes estrategias para cada jugador:


E1
E2
E3
E4
E5
E6
E1

1
2
3
4
5
6

E2

-1
2
4
5
5
5

E3

0
1
1
1
1
1

E4

3
0
0
1
1
0



Se dice que un jugador posee una estrategia dominante si una estrategia particular es preferida a cualquier otra estrategia a disposición de él. Es posible que cada uno de los dos jugadores tenga estrategia dominante.

Esta matriz se puede reducir por estrategia dominante, eliminando las estrategias recesivas, las cuales no serán  elegidas ni por el jugador renglón, ni por el jugador columna:

Realizando el procedimiento mostrado en la sección anterior tenemos que:

E1
E2
E1

1
2
1
E4

3
0
0


3
2



No se puede hallar el valor esperado ya que no coinciden los valores para el jugador columna y para el jugador renglón. 


Para encontrar el valor esperado en un juego no estrictamente determinado, se deben establecer ademas de los jugadores y sus estrategias, la probabidad asociada a cada una de ellas, para realizar el siguiente desarrollo:

Para ilustrar el procedimiento, se tiene la siguiente matriz de pago:


E1
E2
E1

3
-2

E4

-1
5



Se tiene que la estrategia 1 para el jugador columna se presenta con una probabilidad conocida de 1/3 y que para el jugador renglón, con una probabilidad de 3/4; por lo tanto, las probabilidades de la segunda estrategia para el jugador columna y el jugador renglón son de 2/3 y 1/4, respectivamente.


Con esta información es posible hallar las sumas de las probabilidades individuales y mutuamente excluyentes de cada resultado del juego y obtener los siguientes valores esperados condicionados a la estrategia de uno de los jugadores:


Valor esperado del juego del jugador renglón cuando el jugador columna elige la estrategia 1= 3(3/4)-1(1/4)=2.
Valor esperado del juego del jugador renglón cuando el jugador columna elige la estrategia 2= -2(3/4)+5(1/4)=2.
Valor esperado del juego del jugador columna cuando el jugador renglón elige la estrategia 1= 3(1/3)-2(2/3)=-0.3.
Valor esperado del juego del jugador columna cuando el jugador renglón elige la estrategia 2= -1(1/3)-5(2/3)=3.

Es difícil establecer cuánta parte del tiempo el adversario jugará con una estrategia determinada, en otras palabras, determinar la probabilidad de ocurrencia de cada estrategia en el juego del contrincante. Este problema se puede resolver determinando el comportamiento de cada estrategia, y estableciendo un punto de   equilibrio, de la siguiente forma:

Para el jugador renglón, cuando el jugador columna elige la estrategia 1, se tiene que:
VE= 3p1 - 1p2
Dado que:
p1+p2= 1 entonces,  p2= 1-p1.
Para establecer el comportamiento del valor esperado con respecto a la probabilidad de ocurrencia de la estrategia 1, se calcula VE para p1= 0 y p1=1.
Reemplazando p1:
Cuando p1= 0, VE= 3p1 - 1(1-p1)= 3(0) - 1(1-0)=-1
Cuando p1= 1, VE= 3p1 - 1(1-p1)= 3(1) - 1(1-1)= 3


Y con respecto a la elección de la estrategia 2 por parte del jugador columna, se tiene que:


VE= -2p1 + 5p2
Para establecer el comportamiento del valor esperado con respecto a la probabilidad de ocurrencia de la estrategia 2, se calcula VE para p1= 0 y p1=1.
Reemplazando p1:
Cuando p1= 0, VE= -2p1 + 5p2= -2(0) + 5(1-0)=5
Cuando p1= 1, VE= 3p1 - 1(1-p1)= -2(1) + 5(1-1)= -2

Se realiza la gráfica para cara cada estrategia del jugador columna y se obtiene:


La ecuación que describe al valor esperado para el jugador renglón, cuando el jugador columna usa la estrategia 1 es: VE= 4p1-1.






La ecuación que describe al valor esperado para el jugador renglón, cuando el jugador columna usa la estrategia 2 es: VE= -7p1+5.


Igualando las ecuaciones: 4p1-1=-7p1+5
Despejando: p1=6/11
Reemplazando en VE= 4p1-1, se tiene: VE= 4(6/11)-1=13/11


El valor esperado del juego es de 13/11. Este valor del juego  es el pago que el jugador tiene garantizado  si toma una decisión racional, independientemente de las decisiones de los demás jugadores.