Investigacion de Operaciones Blog

55
INTRODUCCION A LA INVESTIGACION DE OPERACIONES En la actualidad se necesita del mejoramiento y de la calidad en las organizaciones de todo el mundo, pero nosotros no podemos quedarnos fuera de esta globalización, es así que el éxito o el fracaso de una empresa depende de las decisiones que tome el ejecutivo. Para una adecuada toma de decisiones es necesario tener un conocimiento de aspectos económicos, sociales, técnicos, financieros, administrativos, etc., de la empresa y de los efectos positivos y negativos que lleven a cumplir con su misión y visión, de acuerdo al acierto o desacierto con que se tomen esas decisiones. La Investigación de Operaciones ha tenido un impacto impresionante en el mejoramiento de la eficacia y eficiencia de numerosas organizaciones. En el proceso, la investigación de operaciones ha hecho contribuciones significativas al incremento de la productividad dentro de la economía de varios países. Sin duda, el impacto de la investigación de operaciones continuará aumentando. Por ejemplo, al inicio de la década de los 90 el U.S. Laboratorio de Estadísticas de Bureau predijo que la I.O. sería el área profesional clasificada como la tercera de más rápido crecimiento para los estudiantes universitarios en Estados Unidos, graduados entre 1990 y 2005. Pronosticó también que, para el año 2005, habría 100.000 personas trabajando como analistas de investigación de operaciones, estos pronósticos han sido certeros hasta la fecha. La asignatura Investigación de Operaciones está orientada a proporcionar al estudiante algunos de los diferentes modelos matemáticos que le permitan coadyuvar en la toma de decisiones con el objeto de optimizar la función administrativa. Como su nombre lo indica, la investigación de operaciones (IO) o Ciencia de la administración (CA) significa “hacer investigación sobre las operaciones”. Es una manera de abordar la toma de decisiones en la administración, que se basa en el método científico y que utiliza ampliamente el análisis cuantitativo. El análisis cuantitativo se basa en datos cuantitativos asociados al problema y desarrolla expresiones matemáticas que describen el objetivo, las restricciones y las relaciones existentes en el problema, que se conoce como Modelo.

description

Este es un documento de recopilación de mis clases recibidas de investigación de operaciones II, en él se podrán encontrar la información básica referente al manejo de los modelos de inventarios, la clasificación ABC, las cadenas de Markov, teoría de juego y de decisiones. Estas clases fueron impartidas en la Universidad del Atlántico, Colombia por el profesor y sensei Medardo Gonzales, quien nos guió en los caminos de estos conocimientos. ''El conocimiento es para todos, yo no soy quien para privarlos de ese privilegio'', esta información se encuentra también publicada en mi blog: http://InvOperacionesid2.blogspot.com, que fue ideado por mi profesor como una forma de distribuir el conocimiento.

Transcript of Investigacion de Operaciones Blog

Page 1: Investigacion de Operaciones Blog

INTRODUCCION A LA INVESTIGACION DE OPERACIONES

En la actualidad se necesita del mejoramiento y de la calidad en las organizaciones de todo el mundo, pero nosotros no podemos quedarnos fuera de esta globalización, es así que el éxito o el fracaso de una empresa depende de las decisiones que tome el ejecutivo. Para una adecuada toma de decisiones es necesario tener un conocimiento de aspectos económicos, sociales, técnicos, financieros, administrativos, etc., de la empresa y de los efectos positivos y negativos que lleven a cumplir con su misión y visión, de acuerdo al acierto o desacierto con que se tomen esas decisiones.

La Investigación de Operaciones ha tenido un impacto impresionante en el mejoramiento de la eficacia y eficiencia de numerosas organizaciones. En el proceso, la investigación de operaciones ha hecho contribuciones significativas al incremento de la productividad dentro de la economía de varios países.

Sin duda, el impacto de la investigación de operaciones continuará aumentando. Por ejemplo, al inicio de la década de los 90 el U.S. Laboratorio de Estadísticas de Bureau predijo que la I.O. sería el área profesional clasificada como la tercera de más rápido crecimiento para los estudiantes universitarios en Estados Unidos, graduados entre 1990 y 2005. Pronosticó también que, para el año 2005, habría 100.000 personas trabajando como analistas de investigación de operaciones, estos pronósticos han sido certeros hasta la fecha.

La asignatura Investigación de Operaciones está orientada a proporcionar al estudiante algunos de los diferentes modelos matemáticos que le permitan coadyuvar en la toma de decisiones con el objeto de optimizar la función administrativa.

Como su nombre lo indica, la investigación de operaciones (IO) o Ciencia de la administración (CA) significa “hacer investigación sobre las operaciones”. Es una manera de abordar la toma de decisiones en la administración, que se basa en el método científico y que utiliza ampliamente el análisis cuantitativo. El análisis cuantitativo se basa en datos cuantitativos asociados al problema y desarrolla expresiones matemáticas que describen el objetivo, las restricciones y las relaciones existentes en el problema, que se conoce como Modelo.

La investigación de operaciones se aplica a problemas que se refieren a la conducción y coordinación de operaciones (o actividades) dentro de una organización. La naturaleza de la organización es esencialmente inmaterial y, de hecho, la investigación de operaciones, se ha aplicado de manera extensa en áreas tan diversas como la manufactura, el transporte, las telecomunicaciones, la planeación financiera, el cuidado de la salud, la milicia y los servicios públicos, por nombrar sólo unas cuantas. Así, la gama de aplicaciones es extraordinariamente amplia.

La parte de investigación en el nombre significa que la investigación de operaciones usa un enfoque similar a la manera en que se lleva a cabo la investigación en los campos científicos establecidos. En gran medida se usa el método científico para investigar el problema en cuestión. En particular, el proceso comienza por la observación cuidadosa y la formulación del problema incluyendo la recolección de los datos pertinentes. El siguiente paso es la construcción de un modelo científico (por lo general matemático) que intenta abstraer la esencia del problema real. En este punto se propone la hipótesis de que el modelo es una representación lo suficientemente precisa de las características esenciales de la situación como para que las conclusiones (soluciones) obtenidas sean válidas también para el problema real. Después, se lleva a cabo los experimentos

Page 2: Investigacion de Operaciones Blog

adecuados para probar esta hipótesis, modificarla si es necesario y eventualmente verificarla (validación del modelo). Entonces, en cierto modo, la investigación de operaciones incluye la investigación científica creativa de las propiedades fundamentales de las operaciones.

Sin embargo, la IO se ocupa también de la administración práctica de la organización. Así, para tener éxito, deberá también proporcionar conclusiones claras que pueda usar el tomador de decisiones cuando las necesite. De esta manera, intenta resolver los conflictos de intereses entre los componentes de la organización de forma que el resultado sea el mejor para la organización completa. Esto no significa que el estudio de cada problema deba considerar en forma explícita todos los problemas de la organización sino que los objetivos que busca deben ser consistentes con los de toda ella.

GESTIÓN DE INVENTARIOS (STOCKS)

Los inventarios, existencias o stocks son los materiales que la empresa tiene almacenados para facilitar la continuidad del proceso productivo.

La gestión de inventarios tiene como objetivo determinar la cantidad de existencias que se han de mantener y el ritmo de pedidos para cubrir las necesidades de producción.

TIPOS DE EXISTENCIAS

- Materias primas: mediante la transformación o elaboración se destinan al proceso productivo

- Productos semiterminados: productos que la empresa fabrica pero no destina a la venta hasta otra posterior elaboración

- Productos terminados: productos fabricados por la empresa y destinados al consumo final

- Mercaderías: materiales comprados por la empresa y destinados a su posterior venta sin transformación

- Otros aprovisionamientos: envases, embalajes, combustible...

La empresa NECESITA disponer de RECURSOS ALMACENADOS (INVENTARIOS) para:

- Evitar la ruptura de stocks: no quedarse sin productos si hay un incremento inesperado de demanda

- Posibles diferencias entre ritmo de producción y distribución: cuando la demanda depende de la época del año. Ej: se producen abrigos todo el año pero se venden casi todos en invierno

- Obtener grandes descuentos: al comprar materiales en gran cantidad y reducir costes totales

COSTES DE LOS INVENTARIOS

Costes de pedido: costes de realizar un pedido: administrativos (gestión con proveedores), transporte, descarga, seguros,… Existe relación inversa al volumen de inventarios, porque cuanto mayor volumen de existencias menor número de pedidos a realizar en el año

Page 3: Investigacion de Operaciones Blog

Costes de almacenamiento: costes de mantener las existencias en el almacén: espacio, administrativos (personal y sistema gestión), económicos (obsolescencia, depreciación), financieros (intereses de financiar capitales invertidos)

Costes de ruptura de stocks: costes que tiene la empresa cuando se queda sin existencias, no puede producir o no puede entregar el pedido a un cliente.

Demanda: El consumo en un instante. Consumo: La sumatoria de las demandas.

Si el cliente no compra (consume), entonces ninguno de la cadena ha vendido nada.

MODELOS DE INVENTARIOS

MODELO EOQ (SIN FALTANTES)

Este modelo tiene los siguientes supuestos:

1. La demanda es constante y conocida.2. La cantidad ordenada (Q) para reabastecer el inventario llega toda junta cuando se desea,

es decir, cuando el nivel de inventario baja a cero.3. No se permiten planear faltantes.4. La reposición es instantánea. No existe tiempo en el que el pedido se demora.5. Los pedidos se entregan completos (no por partes).

LOGISTICA DE APROVISIONAMIENTOCOMPRA

(Inventarios de MP)

LOGISTICA DE OPERACIONESPRODUCCION

(Inventarios en proceso)

LOGISTICA DE DISTRIBUCION Y TRANSPORTE

COMERCIO Y VENTAS(Inventarios productos terminados)

Page 4: Investigacion de Operaciones Blog

Supongamos que yo como empresa tengo una demanda de 12000 unidades al año, entonces para satisfacerla yo puedo hacer los pedidos por partes:

D(anual)= 12000

Q(cantidad a pedir) Número de veces que voy a pedir (N=D/Q)

Tiempo e que las cantidades pedidas llegan a cero (t=Q/D)

1000 12 1/122000 6 1/63000 4 1/44000 3 1/36000 2 1/2

12000 1 1

GRAFICA DEL MODELO EOQ (SIN FALTANTES)

Como podemos ver en la gráfica las cantidades Q descienden hasta cero en un tiempo t1, entonces la relación entre las cantidades pedidas y el tiempo en que consumen está dado por el área de la región sombreada y representa la cantidad total de inventario existente en un intervalo de tiempo:

Page 5: Investigacion de Operaciones Blog

t 1∗Q2

Entonces la ecuación que representa este modelo de compra C(Q) por periodo es:

C(Q)= Cu*Q + Cp + Cmi*(t 1∗Q

2)

Donde:

Cu: costo unitario del producto

Cu*Q: costo de adquisición de un pedido

CP: costo de hacer un pedido

Cmi: costo de mantener un inventario

Entonces para hallar las cantidades óptimas a pedir minimizando los costos tanto de adquisición como los costos de mantener un inventario, tenemos que optimizar esa función utilizando la definición de derivada.

Multiplicando por N para hallar los costos totales:

N*(C(Q))= [Cu*Q + Cp + Cmi*(t 1∗Q

2)]*N

Costo total (CTA)

Como N=D/Q entonces tenemos:

CTA(Q)= Cu*Q* DQ + Cp *

DQ + Cmi*(

t 1∗Q2

)* DQ

Reduciendo la expresión nos queda:

CTA(Q)= Cu∗DQ +

Cp∗DQ +

Cmi∗t 1∗D2

Derivamos con respecto a Q, luego la ecuación la igualamos a cero y posteriormente despejamos Q y tendremos la siguiente ecuación:

Q´=√ 2Cp∗DCmi

Page 6: Investigacion de Operaciones Blog

Con esta ecuación podemos hallar las cantidades optimas que podemos pedir (productos, materiales, etc.) minimizando los costos totales.

MODELO EOQ (CON FALTANTES)

Es normal que ocurran pequeños faltantes cuando por ahorrar dinero en el tiempo de preparación se pida un lote que no alcance para cubrir todo el ciclo. Sin embargo también existirá un costo asociado a los faltantes, que llevará a que estos no sean excesivos.

El modelo tiene los siguientes supuestos:

1. Se conoce la tasa de la demanda.2. La cantidad Q llega toda cuando se desea.3. Se permiten faltantes planeados. Cuando hay faltantes, los clientes afectados esperan

que el producto esté disponible de nuevo. Las ordenes se satisfacen cuando se reabastece el inventario.

Para este modelo tenemos la siguiente ecuación de costos por periodos:

C(Q;S)=Cu*Q + Cp + t 1∗Imax∗Cmi

2 + t 2∗S∗Cf

2

Donde:

Imax= (Q-S)

Page 7: Investigacion de Operaciones Blog

Se hace una relación de triángulos para hallar t1 y t2 en función de las variables Q y S, con estos tenemos las siguientes relaciones:

t 1t

= ImaxQ

t 1=

(Q−S )Q

∗Q

D

t 1=Q−SD

t 2t

= SQ

t 2=

SQ

∗Q

D

t 2= SD

Con esto reemplazando en la ecuación inicial, tenemos:

C(Q;S)=Cu*Q + Cp + (Q−S )∗(Q−S )∗Cmi

2D + S

2∗Cf2D

Ahora esta ecuación la multiplicamos por N para que nos dé el costo total y posteriormente la derivamos para optimizarla, como podemos darnos cuenta tenemos dos variables (Q, S) que son justo lo que necesitamos optimizar para disminuir los costos, entonces derivamos parcialmente:

Page 8: Investigacion de Operaciones Blog

Derivada con respecto a S:CTA(S) = SCmi – QCmi + SCfIgualando a cero y despejando Q tenemos:

Q= SCfCmi

+S

Despejando en función de (Q - S) tenemos:

(Q−S )= SCfCmi

Ahora la derivada de CTA con respecto a Q es:

CTA(Q )=−CpDQ2 +

(Q−S )CmiQ

−(Q−S )2Cmi

2Q2 −S2Cf

2Q2

Igualando a cero y reemplazando (Q – S) tenemos:

0=−CpDQ2 +

( SCfCmi )∗CmiQ

−( SCfCmi )

2

∗Cmi

2Q2 −S2Cf

2Q2

Simplificando

−CpDQ2 + SCf

Q− S2∗Cf 2

2Q2Cmi−S

2Cf2Q2 =0

Multiplicando cada miembro de la ecuación en ambos lados por Q cuadrada tenemos

−CpD+SCfQ−S2∗Cf 2

2Cmi−S

2Cf2

=0

−CpD+SCfQ−S2Cf2

∗( CfCmi +1)=0

Reemplazando el valor de Q encontrado en la derivada con respecto a S, tenemos:

Page 9: Investigacion de Operaciones Blog

−CpD+S2Cf∗( CfCmi+1)− S2Cf2

∗( CfCmi+1)=0

S2Cf∗( CfCmi +1)−S2Cf2

∗( CfCmi+1)=CpD

S2Cf2

∗( CfCmi +1)=CpD

S2Cf2

∗(Cf +CmiCmi )=CpD

S2=( CmiCf +Cmi )∗2CpD

CfOrganizando

S= 2√( 2CmiCpDCf (Cmi+Cf ))

Page 10: Investigacion de Operaciones Blog

MODELO LEP (SIN FALTANTES)

En este caso se prohíben los faltantes, estableciendo el costo por faltantes como infinito. Las condiciones para el aprovisionamiento instantáneo de los suministros se modifican ligeramente cuando los mismos se manufacturan al recibir la orden, en vez que se surtan de existencias de artículos ya manufacturados. La diferencia está en que los suministros se embarcan instantáneamente conforme se manufacturan.

El gasto principal de adquisición es el costo de preparación cuando una empresa produce sus propios suministros.

El modelo de lote económico de producción tiene los siguientes supuestos:

1. La tasa de producción R mayor que la demanda.2. Tenemos un Op (Orden de Producción).

Page 11: Investigacion de Operaciones Blog

Imax= t1(R – d)

Imax= QR (R – d)

Imax= Q(1 - dR )

Ahora la ecuación de los costos del periodo es:

C(Q)= CuQ + Cop + Cmi(t 1+t2)Imax

2

Reemplazando los valores de (t1+t2) por t y el Imax por Q(1 - dR ) tenemos:

Page 12: Investigacion de Operaciones Blog

C(Q)= CuQ + Cop + Cmi(t )

2Q(1− dR )

Ahora como t = QR la ecuación final será:

C(Q)= CuQ + Cop + CmiQ

2

2D (1− dR )

Multiplicando por N=D/Q para hallar el costo total de los pedidos (CTA):

CTA(Q)= CuD + Cop(DQ ) + CmiQ

2 (1− dR )

Ahora derivamos la ecuación con respecto a Q:

dCTAdQ =

−CopD

Q2 +Cmi2 (1− d

R )Igualando a cero y despejando Q tenemos:

Q=√ 2CopD

Cmi(1− dR )Esta es la expresión final que nos da las cantidades óptimas de Q a pedir.

MODELO LEP (CON FALTANTES)

En este modelo se admiten los faltantes.

Los parámetros de la función de costo total son similares a las del modelo EOQ. En lugar del Costo de ordenar, existe un costo de setup fijo para el costo de la corrida

producción corrida (Cop). Además, se necesita conocer la tasa de producción anual (R) en el modelo.

Page 13: Investigacion de Operaciones Blog

Tenemos que la ecuación que representa el costo de este modelo es:

C(Q;S)= CuQ + Cop + Cmi2

(t1+t2)Imax + C f2

(t3+t4)S (1)Donde:Imax= (R-d)t1 (2)Imax= Dt2 (3)S=t3D (4)S=t4(R-d) (5)t1+t4=Q/R (6)Para deducir la ecuación de costo total debemos reemplazar t1 , t2 , t3 , t4 e Imax por las variables que conocemos en función de Q y S:

De la ecuación 6 tenemos que:t1= QR−t 4

Page 14: Investigacion de Operaciones Blog

De la ecuación 5 despejamos t4 y lo reemplazamos en la ecuación anterior:

t1= QR− SR−d

Multiplicamos ambos lados de la ecuación por (R – d) y tenemos:

t1(R-d)=(R-d) (QR− SR−d )

ImaxReduciendo términos nos quedaría finalmente:

Imax= Q(1−dR )−S (7)

Ahora en la ecuación 2, 3, 4 y 5 despejamos t1, t2, t3 y t4 respectivamente y los reemplazamos en la ecuación principal (1), con esto tenemos:

C(Q;S)= CuQ + Cop + Cmi2 ( ImaxR−d+ImaxD )Imax + C f2 ( SD + S

R−d )S C(Q;S)= CuQ + Cop + Cmi2 ( 1

R−d+ 1D )¿Imax)2 + C f S2

2 ( 1D

+ 1R−d )

Reemplazamos ahora la ecuación que representa el inventario máximo en la función de costos anterior:

C(Q;S)= CuQ + Cop + Cmi2 ( 1

R−d+ 1D )[Q(1− dR )−S ]

2 + C f S2

2 ( 1D

+ 1R−d )

Multiplicando por N=D/Q tenemos la función de costo total a derivar:

CTA(Q;S)= CuD + CopDQ

+ CmiD2Q ( 1

R−d+ 1D ) [Q(1− d

R )−S]2 +

C f S2D

2Q ( 1D

+ 1R−d )

Derivamos la función costo total (CTA) con respecto a S:

Page 15: Investigacion de Operaciones Blog

dCTAdS

= −CmiDQ ( 1

R−d+ 1D )[Q(1− d

R )−S ] + C f SDQ ( 1

D+ 1R−d )

Igualando a cero y factorizando tenemos:

Q(1− dR )=S(1+

C fCmi ) (8)

Q=S (1+C fCmi )( R

R−d )Ahora derivamos CTA con respecto a Q:

dCTAdQ = −CopD

Q2 −CmiD

2Q2 ( 1R−d

+ 1D )[Q(1− d

R )−S ]2

+CmiDQ ( 1

R−d+ 1D )[Q(1−d

R )−S](1− dR )

−C f S2D

2Q2 ( 1D

+ 1R−d )

Igualamos a cero y multiplicamos por Q2/D:0 = −Cop −Cmi2 ( 1R−d

+ 1D )[Q(1− dR )−S ]

2

+CmiQ( 1R−d

+ 1D )[Q(1− d

R )−S](1− dR )

−C f S2

2 ( 1D

+ 1R−d )

Dividiendo entre ( 1D

+ 1R−d ):

0= −Cop

( 1R−d

+ 1D ) −Cmi2 [Q(1− dR )−S ]

2

+CmiQ [Q(1− dR )−S](1− d

R ) −C f S2

2

Q(1− dR )

Page 16: Investigacion de Operaciones Blog

De la ecuación 8 reemplazamos Q(1− dR ):

0= −CopD (R−d )(R−d+D ) −Cmi

2 [S (1+C fCmi )−S ]

2

+Cmi [S (1+C fCmi )−S ]S (1+

C fCmi ) −C f S2

2

De esta ecuación factorizamos, despejamos S y organizando nos queda finalmente la expresión

que representa el S óptimo:

S = √ 2CopDC f √ R−d

R−d+D √ CmiC f+Cmi

Como se mostró en la entrada anterior, la D = d. por tanto la ecuación quedaría así:

S = √ 2CopDC f √ R−d

R−d+D √ CmiC f+Cmi

S = √ 2CopDC f √ R−dR √ Cmi

C f+Cmi

S = √ 2CopDC f √1−D

R √ CmiC f+Cmi

Page 17: Investigacion de Operaciones Blog

MODELO EOQ CON DESCUENTOS POR CANTIDADES

El modelo EOQ con descuentos por cantidad es una extensión del modelo básico de EOQ revisado en la sección anterior y mantiene sus supuestos. Se asume que el costo de adquisición (Cp) disminuye en la medida que aumenta el tamaño de lote. Adicionalmente se considera que el costo de almacenar una unidad en inventario es un porcentaje (I) del costo de adquisición. Por tanto la fórmula a utilizar es:

Q´=√ 2Cp∗DCmi

Donde:

Cmi = porcentaje (I)*costo unitario (Cu)

Al existir un descuento por cantidad o volumen de compra se genera un incentivo a pedir lotes de un mayor tamaño, sin embargo, esto a la vez incrementa el costo de mantener unidades en inventario. Por tanto se busca determinar la cantidad óptima a pedir para cada nivel o  quiebre de precios, analizar si dicho tamaño de pedido es factible, ajustar el tamaño de lote si es necesario y finalmente comparar las distintas alternativas para ver cuál de ellas provee el

menor Costo Total el cual está definido por la siguiente expresión:

CTA(Q)= CuDQ +

CpDQ +

CmiD t 12

Un proveedor le ofrece la siguiente tabla de descuento para la adquisición de su

principal producto, cuya demanda anual usted ha estimado en 5.000 unidades. El costo de emitir

una orden de pedido es de $49 y adicionalmente se ha estimado que el costo anual de

almacenar una unidad en inventario es un 20% del costo de adquisición del producto. ¿Cuál es la

cantidad de la orden que minimiza el costo total del inventario?

Tamaño del Lote (Unidades) Descuento (%) Valor del Producto ($/Unidad)0 a 999 0% 5

1.000 a 1999 4% 4,82.000 o más 5% 4,75

Para dar respuesta a esta situación se propone seguir los siguientes pasos:

PASO 1: Determinar el tamaño óptimo de pedido (Q*) para cada nivel o quiebre de precios.

Page 18: Investigacion de Operaciones Blog

PASO 2: Ajustar la cantidad a pedir en cada quiebre de precio en caso de ser necesario. En

nuestro ejemplo para el tramo 1 Q(1)=700 unidades esta en el intervalo por tanto se mantiene;

para el tramo 2 Q(2)=714 está por debajo de la cota inferior del intervalo, por tanto se aproxima

a esta cota quedando Q(2)=1.000; finalmente en el tramo 3 Q(3)=718 que también está por

debajo de la cota inferior del intervalo, por tanto se aproxima a esta cota quedando Q(3)=2.000

PASO 3: Calcular el costo asociado a cada una de las cantidades determinadas (utilizando la

fórmula de costo total presentada anteriormente)

Costo Tramo 1 = C(700)=$25.700

Costo Tramo 2 = C(1.000)=$24.725

Costo Tramo 3 = C(2.000)=$24.822

Se concluye que el tamaño óptimo de pedido que minimiza los costos totales es 1.000

unidades, con un costo total anual de $24.725.

Page 19: Investigacion de Operaciones Blog

MODELO CON DEMANDA PROBABILÍSTICA

Curva de distr ibución normal: P(Z ≤ a)

Los modelos de inventario en donde la demanda es incierta o aleatoria en un periodo dado se denominan Modelos de Inventarios Probabilísticos. En estos modelos se incluyen algunas versiones del modelo EOQ para demanda incierta en los cuales se incorporan conceptos importantes como el stock de seguridad y el nivel de servicio. Existen dos modelos probabilísticos de revisión continua que algunos autores como Winston y Hillier denominan estrategia (R,Q).

Anteriormente se asociaba este modelo con el método de las urnas, en el cual las unidades para un producto se colocaban en dos urnas. La capacidad de una es igual al punto de reorden. Las unidades se extraen primero de la otra urna. Una vez que este contenedor se vacía es señal para colocar un pedido nuevo. Durante el tiempo de entrega hasta que se recibe el nuevo pedido, las unidades son extraídas de la primea urna, como una especie de stock de seguridad.

Éste modelo se basa en los criterios “R”, el cual se identifica como punto de reorden y “Q”, que denota la cantidad a ordenar.

Una política de inventario basada en estos dos números críticos es sencilla. Siempre que el nivel de inventario de un producto baje a “R” unidades, se coloca una orden de “Q” unidades para reabastecer el inventario.

Las suposiciones que se deben cumplir al aplicar este modelo según Hillier y Liberman son:

1. Cada aplicación se refiere a un solo producto. Lo que significa que no se pueden incluir dos o más productos a la vez.

2. El nivel de inventario está bajo revisión continua, por lo que su valor actual se conoce.

3. Debe usarse una política (R,Q), entonces las únicas decisiones que deben tomarse son las selecciones de R y Q.

4. Existe un tiempo de entrega entre la colocación de una orden y la recepción de la cantidad ordenada. Este tiempo de entrega puede ser fijo o variable.

5. La demanda para retirar unidades del inventario y venderlas durante este tiempo de entrega es incierta. Sin embargo, se conoce o se puede estimar la distribución de probabilidad de la demanda.

6. Si ocurren faltantes antes de recibir la orden, el exceso de demanda queda pendiente, de manera que estos costos faltantes se satisfacen cuando llega la orden.

Page 20: Investigacion de Operaciones Blog

7. Se incurre en un costo de preparación (denotado por Cp) cada vez que se coloca una orden.

8. Se incurre en un costo de mantener (denotado por h) por cada unidad en inventario por unidad de tiempo.

9. Cuando ocurren faltantes, se incurre en un costo por faltantes (denotado por p) por cada unidad que falta por unidad de tiempo hasta que se satisface la demanda pendiente.

Selección del Punto de Reorden

Un enfoque común para elegir el punto de reorden R se basa en el nivel deseado por la administración de servicio al cliente, el cual se puede definir de varias formas, como se describe a continuación:

1. La probabilidad de que ocurra un faltante entre la colocación de la orden y la recepción de pedido.

2. El número promedio de faltantes por año.

3. El porcentaje promedio de la demanda anual que se satisface de inmediato.

4. El retraso promedio en satisfacer las órdenes pendientes cuando ocurre un faltante.

5. El retraso promedio global para satisfacer las órdenes.

Nivel de servicio: Probabilidad de que no ocurra un faltante durante el tiempo de entrega. Por ejemplo, un nivel de servicio de 90% significa que existe la posibilidad de 10% de un faltante de almacén.

Page 21: Investigacion de Operaciones Blog

REGLAS DE LOS INVENTARIOS

1. Toda entrada y salida de inventario debe ser debidamente documentada.2. Todo ítem debe estar debidamente codificado. (código de ubicación y localización).3. En cuanto sea posible todos los ítems deben estar guardados en el mismo lugar.4. Nunca jamás recibir comisiones de un proveedor (código de ética).5. En cuanto sea posible el lugar físico donde se realiza la recepción de materiales debe ser

diferente al lugar de salida de los mismos.6. Los ítems de mayor peso deben ser almacenados de abajo hacia arriba y de mayor a

menor peso.7. Ningún miembro del equipo del almacén se puede ir hasta que no haya un conteo físico de

los ítems que tuvieron movimiento en el día. 8. Se deben contar los mismos ítems con tres auditores y se consignan los dos resultados

iguales.9. En un lugar más lejano de cualquier otro lugar debe haber un extintor.10. Los reportes de inventarios deben estar como máximo 3 días después del inventario.

INVENTARIO LOGÍCO DEBE SER IGUAL AL INVENTARIO REAL

Inv. Sistema de info. Inv. Físico

Un conjunto pequeño de ítems concentran el costo mayor en el total de los inventarios. Este es el principio de Paretto aplicado a los inventarios, es decir, existen prioridades en inventario.

CLASIFICACION ABC

Un aspecto importante para el análisis y la administración de un inventario es determinar qué artículos representan la mayor parte del valor del mismo - midiéndose su uso en dinero - y si justifican su consecuente inmovilización monetaria.

Estos artículos no son necesariamente ni los de mayor precio unitario, ni los que se consumen en mayor proporción, sino aquellos cuyas valorizaciones (precio unitario x consumo o demanda) constituyen % elevados dentro del valor del inventario total.

Generalmente sucede que, aproximadamente el 20% del total de los artículos, representan un 80% del valor del inventario, mientras que el restante 80% del total de los artículos inventariados, alcanza el 20% del valor del inventario total.

El gráfico ABC (o regla del 80/20 o ley del menos significativo) es una herramienta que permite visualizar esta relación y determinar, en forma simple, cuáles artículos son de mayor valor, optimizando así la administración de los recursos de inventario y permitiendo tomas de decisiones más eficientes.

Según este método, se clasifican los artículos en clases, generalmente en tres (A, B o C), permitiendo dar un orden de prioridades a los distintos productos:

Page 22: Investigacion de Operaciones Blog

ARTICULOS A: Los más importantes a los efectos del control.

ARTICULOS B: Aquellos artículos de importancia secundaria.

ARTICULOS C: Los de importancia reducida.

La designación de las tres clases es arbitraria, pudiendo existir cualquier número de clases. También el % exacto de artículos de cada clase varía de un inventario al siguiente. Los factores más importantes son los dos extremos: unos pocos artículos significativos y un gran número de artículos de relativa importancia. Esta relación empírica formulada por Vilfredo Pareto, ha demostrado ser una herramienta muy útil y sencilla de aplicar a la gestión empresaria. Permite concentrar la atención y los esfuerzos sobre las causas más importantes de lo que se quiere controlar y mejorar.

El método o gráfico ABC puede ser aplicado a:

• Las ventas de la empresa y los clientes con los que se efectúan las mismas (optimización de pedidos).

• El valor de los stocks y el número de ítems de los almacenes.

• Los costos y sus componentes.

Los beneficios de la empresa y los artículos que los producen (determinar aquellos productos que, teniendo una alta penetración en el mercado -facturación-, disponen de baja rentabilidad; detectar por prioridades aquellos productos que, teniendo una baja penetración- comercialización- disponen de alta rentabilidad).

Page 23: Investigacion de Operaciones Blog

Ejemplo de aplicación

A continuación se desarrollará un ejemplo que permitirá visualizar cómo se determinan las tres zonas (A-B-C) en un inventario constituido por 20 artículos:

Page 24: Investigacion de Operaciones Blog

Resolución

1. Se debe determinar la participación monetaria de cada artículo en el valor total del inventario. Para ello se debe construir una tabla de acuerdo a lo siguiente:

• Columna nº 1: Corresponde al nº de artículo.

Columna nº 2: Los porcentajes de participación de cada artículo en la cantidad total de artículos. Para nuestro ejemplo, como tenemos un inventario constituido por 20 artículos, cada artículo representa el 5% dentro del total (100%/ 20 art.= 5%)

• Columna nº 3: Representa la valorización de cada artículo. Para obtenerla, multiplicamos su precio unitario por su consumo. Al pie de la columna obtenemos el valor de nuestro inventario de los 20 artículos.

• Columna nº 4: Nos muestra el % que representa cada una de las valorizaciones en el valor total del inventario.

Page 25: Investigacion de Operaciones Blog

3. Ahora se deben reordenar las columnas 1 y 4, tomando las participaciones de cada artículo en sentido decreciente, lo que dará origen a la tabla nº 3:

Page 26: Investigacion de Operaciones Blog

4. Trazado de la gráfica y determinación de zonas ABC:

A partir de los datos de la tabla 3 y la gráfica se puede observar que unos pocos artículos son los de mayor valorización. Si solo se controlaran estrictamente los tres primeros, se estaría controlando aproximadamente el 60% del valor del inventario. Asignamos la zona A para estos artículos. Controlando también los art. 3, 6 y 11, se estaría controlando, en forma aproximada, el 82% del valor del inventario. (Zona B)

Se ve claramente en la gráfica que el 15% del inventario justifica el 60% del valor, mientras que el 30% del mismo justifica el 82% de dicho valor; a su vez, el 70% del inventario justifica el 18% del valor. Si se tiene en cuenta los costos de mantenimiento y de control de estos últimos, se llega a la conclusión que no es necesario controlarlos estrictamente, ya que son de poca valorización, y que debe mantenerse el mínimo stock posible de los mismos.

Page 27: Investigacion de Operaciones Blog

CADENAS DE MARKOV

En la teoría de la probabilidad, se conoce como cadena de Márkov a un tipo especial de proceso estocástico discreto en el que la probabilidad de que ocurra un evento depende del evento inmediatamente anterior. En efecto, las cadenas de este tipo tienen memoria. "Recuerdan" el último evento y esto condiciona las posibilidades de los eventos futuros. Esta dependencia del evento anterior distingue a las cadenas de Márkov de las series de eventos independientes, como tirar una moneda al aire o un dado.

Reciben su nombre del matemático ruso Andrei Andreevitch Markov (1856-1922), que las introdujo en 1907.

Definición:

En matemáticas, se define como un proceso estocástico discreto que cumple con la propiedad de Márkov, es decir, si se conoce la historia del sistema hasta su instante actual, su estado presente resume toda la información relevante para describir en probabilidad su estado futuro.

Una cadena de Márkov es una secuencia X1, X2, X3,... de variables aleatorias. El rango de estas variables, es llamado espacio estado, el valor de Xn es el estado del proceso en el tiempo n. Si la distribución de probabilidad condicional de Xn+1 en estados pasados es una función de Xn por sí sola, entonces:

Donde xi es el estado del proceso en el instante i. La identidad mostrada es la propiedad de Márkov.

Fundamentos básicos:

Cadenas homogéneas y no homogéneas

Una cadena de Markov se dice homogénea si la probabilidad de ir del estado i al estado j en un paso no depende del tiempo en el que se encuentra la cadena, esto es:

Para todo n y para cualquier i, j.

Si para alguna pareja de estados y para algún tiempo n la propiedad antes mencionada no se cumple diremos que la cadena de Markov es no homogénea.

Page 28: Investigacion de Operaciones Blog

Probabilidades de transición y matriz de transición

La probabilidad de ir del estado i al estado j en n unidades de tiempo es

,

En la probabilidad de transición en un paso se omite el superíndice de modo que queda

Un hecho importante es que las probabilidades de transición en n pasos satisfacen la ecuación de Chapman-Kolmogorov, esto es, para cualquier k tal que 0 < k < n se cumple que

Donde E denota el espacio de estados.

Cuando la cadena de Markov es homogénea, muchas de sus propiedades útiles se pueden obtener a través de su matriz de transición, definida entrada a entrada como Ai,j = pij esto es, la entrada i, j corresponde a la probabilidad de ir del estado i a j en un paso.

Del mismo modo se puede obtener la matriz de transición en n pasos como:

, donde .

Vector de probabilidad invariante

Se define la distribución inicial .

Diremos que un vector de probabilidad (finito o infinito numerable) es invariante para una cadena de Markov si:

Donde P denota la matriz de transición de la cadena de Markov. Al vector de probabilidad invariante también se le llama distribución estacionaria o distribución de equilibrio.

Page 29: Investigacion de Operaciones Blog

Clases de comunicación

Para dos estados i,j en el espacio de estados E, diremos que de i se accede a j (y se denotará ) si:

Para algún n,

Si y entonces diremos que i comunica con j y se denotará i↔j.

La propiedad "↔" es una relación de equivalencia. Esta relación induce una partición en el espacio de estados. A estas clases de equivalencia las llamaremos clases de comunicación.

Dado un estado x, denotaremos a su clase de comunicación como C(x).

Diremos que un subconjunto C del espacio de estados (al que denotaremos E) es cerrado si ningún

estado de E-C puede ser accedido desde un estado de C, es decir, si para todo x∈C, para todo y∈E-C y para todo natural m>0.

Tiempos de entrada

Si , definimos el primer tiempo de entrada a C como la variable aleatoria

Esto es, TC denota la primera vez que la cadena entra al conjunto de estados C.

Recurrencia

En una cadena de Markov con espacio de estados E, si x∈E se

define y diremos que:

• x es estado recurrente si Lx = 1.• x es transitorio si Lx < 1• x es absorbente si px,x = 1• Una clase de comunicación es clase recurrente si todos sus estados son recurrentes. Sea

, si x∈Ediremos que:• x es cero-recurrente si • x es positivo-recurrente si

El real μx se interpreta como el tiempo promedio de recurrencia.

Page 30: Investigacion de Operaciones Blog

Periodicidad

El periodo de un estado x∈E se define como:

Donde mcd denota el máximo común divisor.

Si d(x)=1 diremos que x es un estado aperiódico.

Una cadena de Markov se dice aperiódica si todos sus estados son aperiódicos.

Tipos de Cadenas de Markov:

Cadenas irreducibles

Una cadena de Markov se dice irreducible si se cumple cualquiera de las siguientes condiciones

(equivalentes entre sí):

1. Desde cualquier estado de E se puede acceder a cualquier otro.

2. Todos los estados se comunican entre sí.

3. C(x)=E para algún x∈E.

4. C(x)=E para todo x∈E.

5. El único conjunto cerrado es el total.

La cadena de Ehrenfest o la caminata aleatoria sin barreras absorbentes son ejemplos de cadenas

de Markov irreducibles.

Cadenas positivo-recurrentes

Una cadena de Markov se dice positivo-recurrente si todos sus estados son positivo-recurrentes. Si

la cadena es además irreducible es posible demostrar que existe un único vector de probabilidad

invariante y está dado por:

Page 31: Investigacion de Operaciones Blog

Cadenas regulares

Una cadena de Markov se dice regular (también primitiva o ergódica) si existe alguna potencia

positiva de la matriz de transición cuyas entradas sean todas estrictamente mayores que cero.

Cuando el espacio de estados E es finito, si P denota la matriz de transición de la cadena se tiene

que:

Donde W es una matriz con todos sus renglones iguales a un mismo vector de probabilidad w, que

resulta ser el vector de probabilidad invariante de la cadena. En el caso de cadenas regulares, éste

vector invariante es único.

Cadenas absorbentes

Una cadena de Markov con espacio de estados finito se dice absorbente si se cumplen las dos

condiciones siguientes:

1. La cadena tiene al menos un estado absorbente.

2. De cualquier estado no absorbente se accede a algún estado absorbente.

Si denotamos como A al conjunto de todos los estados absorbentes y a su complemento como D,

tenemos los siguientes resultados:

Su matriz de transición siempre se puede llevar a una de la forma

Donde la submatriz Q corresponde a los estados del conjunto D, I es la matriz identidad, 0 es la

matriz nula y R alguna submatriz.

, esto es, no importa en donde se encuentre la cadena, eventualmente

terminará en un estado absorbente.

Cadenas de Markov en tiempo continuo

Si en lugar de considerar una secuencia discreta X1, X2,..., Xi,.. con i indexado en el conjunto de

números naturales, se consideran las variables aleatorias Xt con t que varía en un intervalo

continuo del conjunto de números reales, tendremos una cadena en tiempo continuo. Para

Page 32: Investigacion de Operaciones Blog

este tipo de cadenas en tiempo continuo la propiedad de Márkov se expresa de la siguiente

manera:

Tal que

Aplicaciones de las cadenas de Markov:

Física

Las cadenas de Markov son usadas en muchos problemas de la termodinámica y la física estadística. Ejemplos importantes se pueden encontrar en la Cadena de Ehrenfest o el modelo de difusión de Laplace.

Meteorología

Si consideramos el clima de una región a través de distintos días, es claro que el estado actual solo depende del último estado y no de toda la historia en sí, de modo que se pueden usar cadenas de Markov para formular modelos climatológicos básicos.

Modelos epidemiológicos

Una importante aplicación de las cadenas de Markov se encuentra en el proceso Galton-Watson. Éste es un proceso de ramificación que se puede usar, entre otras cosas, para modelar el desarrollo de una epidemia (véase modelaje matemático de epidemias).

Internet

El pagerank de una página web (usado por Google en sus motores de búsqueda) se define a través de una cadena de Markov, donde la posición que tendrá una página en el buscador será determinada por su peso en la distribución estacionaria de la cadena.

Simulación

Las cadenas de Markov son utilizadas para proveer una solución analítica a ciertos problemas de simulación tales como el Modelo M/M/1.

Juegos de azar

Son muchos los juegos de azar que se pueden modelar a través de una cadena de Markov. El modelo de la ruina del jugador, que establece la probabilidad de que una persona que apuesta en un juego de azar finalmente termine sin dinero, es una de las aplicaciones de las cadenas de Markov en este rubro.

Page 33: Investigacion de Operaciones Blog

Economía y Finanzas

Las cadenas de Markov se pueden utilizar en modelos simples de valuación de opciones para determinar cuándo existe oportunidad de arbitraje, así como en el modelo de colapsos de una bolsa de valores o para determinar la volatilidad de precios. En los negocios, las cadenas de Márkov se han utilizado para analizar los patrones de compra de los deudores morosos, para planear las necesidades de personal y para analizar el reemplazo de equipo.

Ejemplo:

En un país como Colombia existen 3 operadores principales de telefonía móvil como lo son tigo, Comcel y movistar (estados).

Los porcentajes actuales que tiene cada operador en el mercado actual son para tigo 0.4 para Comcel 0.25 y para movistar 0.35. (Estado inicial)

Se tiene la siguiente información un usuario actualmente de tigo tiene una probabilidad de permanecer en tigo de 0.60, de pasar a Comcel 0.2 y de pasarse a movistar de 0.2; si en la actualidad el usuario es cliente de Comcel tiene una probabilidad de mantenerse en Comcel del 0.5 de que esta persona se cambie a tigo 0.3 y que se pase a movistar de 0.2; si el usuario es cliente en la actualidad de movistar la probabilidad que permanezca en movistar es de 0.4 de que se cambie a tigo de 0.3 y a Comcel de 0.3.

Partiendo de esta información podemos elaborar la matriz de transición.

La suma de las probabilidades de cada estado en este caso operador deben ser iguales a 1

Po= (0.4 0.25 0.35) → estado inicial

Page 34: Investigacion de Operaciones Blog

Ahora procedemos a encontrar los estados en los siguientes pasos o tiempos, esto se realiza multiplicando la matriz de transición por el estado inicial y así sucesivamente pero multiplicando por el estado inmediatamente anterior.

Como podemos ver la variación en el periodo 4 al 5 es muy mínima casi insignificante podemos decir que ya se a llegado al vector o estado estable.

TEORIA DE JUEGOS

La Teoría de Juegos se desarrollo con el simple hecho de que un individuo se relacione con otro u otros. Hoy en día se enfrenta cotidianamente a esta teoría, en cualquier momento. Para el hombre la importancia que representa la Teoría de Juegos es evidente, pues a diario se enfrenta a múltiples situaciones que son juegos.

Actualmente la Teoría de Juegos se ocupa sobre todo de que ocurre cuando los hombres se relacionan de forma racional, es decir, cuando los individuos se interrelacionan utilizando el raciocinio. Sin embargo, la Teoría de Juegos tiene todas las respuestas a los todos problemas del mundo.

¿QUÉ ES LA TEORÍA DE JUEGOS?

La Teoría de Juegos consiste en razonamientos circulares, los cuales no pueden ser evitados al considerar cuestiones estratégicas. Por naturaleza, a los humanos no se les va muy bien al pensar sobre los problemas de las relaciones estratégicas, pues generalmente la solución es la lógica a la inversa.

Page 35: Investigacion de Operaciones Blog

En la Teoría de Juegos la intuición no es muy fiable en situaciones estratégicas, razón por la que se debe entrenar tomando en consideración ejemplos instructivos, sin necesidad que los mismos sean reales.

El principal objetivo de la teoría de los juegos es determinar los papeles de conducta racional en situaciones de "juego" en las que los resultados son condicionales a las acciones de jugadores interdependientes.

Un juego es cualquier situación en la cual compiten dos o más jugadores. El Ajedrez y el Póker son buenos ejemplos, pero también lo son el duopolio y el oligopolio en los negocios. La extensión con que un jugador alcanza sus objetivos en un juego depende del azar, de sus recursos físicos y mentales y de los de sus rivales, de las reglas del juego y de los cursos de acciones que siguen los jugadores individuales, es decir, sus estrategias.

Una estrategia es una especificación de la acción que ha de emprender un jugador en cada contingencia posible del juego.

Se supone que, en un juego, todos los jugadores son racionales, inteligentes y están bien informados. En particular, se supone que cada jugador conoce todo el conjunto de estrategias existentes, no solo para él, sino también para sus rivales, y que cada jugador conoce los resultados de todas las combinaciones posibles de las estrategias.

La teoría de juegos está básicamente ligada a las matemáticas, ya que es principalmente una categoría de matemáticas aplicadas, aunque los analistas de juegos utilizan asiduamente otras áreas de esta ciencia, en particular las probabilidades, la estadística y la programación lineal en conjunto con la teoría de juegos. Pero la mayoría de la investigación fundamental es desempeñada por especialistas en otras materias.

Esta teoría tiene aplicaciones en numerosas áreas, como las ciencias políticas o la estrategia militar, que fomentó algunos de los primeros desarrollos de esta teoría. La biología evolutiva, donde se ha utilizado ampliamente para comprender y predecir ciertos resultados de la evolución, como el concepto de estrategia evolutiva estable introducido por John Maynard Smith; o la psicología, donde puede utilizarse para analizar juegos de simple diversión o aspectos más importantes de la vida y la sociedad también son claros ejemplos de aplicaciones..

Pero sin duda, su principal aplicación la encontramos en las ciencias económicas porque intenta encontrar estrategias racionales en situaciones donde el resultado depende no solamente de la estrategia de un participante y de las condiciones del mercado, sino también de las estrategias elegidas por otros jugadores, con objetivos distintos o coincidentes.

En esta ciencia se ha evolucionado notablemente, ya que a partir de los instrumentos proporcionados por Von Neumann y Morgenstern se comenzó a progresar en el conocimiento de la competencia imperfecta, porque hasta entonces solo tenían explicación “juegos” particularmente simples, como el monopolio o la competencia perfecta, ya que el monopolio puede ser tratado como un juego con un único jugador, y la competencia perfecta puede ser entendida teniendo en cuenta un número infinito de jugadores, de manera que cada agente individual no puede tener un efecto sobre agregados de mercado si actúa individualmente.

Page 36: Investigacion de Operaciones Blog

La teoría de juegos ha venido desempeñando, en los últimos tiempos, un papel cada vez mayor en los campos de lógica y ciencias informáticas. Varias teorías de lógica se basan en la semántica propia a los juegos, e informáticos ya han utilizado juegos para representar computaciones.

ORIGEN DE LA TEORÍA DE JUEGOS

La Teoría de Juegos fue creada por Von Neumann y Morgenstern, y descriptas en su libro clásico The Theory of Games Behavior, publicado en 1944. Otros habían anticipado algunas ideas. Los economistas Cournot y Edgeworth fueron particularmente innovadores en el siglo XIX. Otras contribuciones posteriores mencionadas fueron hechas por los matemáticos Borel y Zermelo. El mismo Von Neumann ya había puesto los fundamentos en el artículo publicado en 1928. Sin embargo, no fue hasta que apareció el libro de Von Neumann y Morgenstern que el mundo comprendió cuán potente era el instrumento descubierto para estudiar las relaciones humanas. Von Neumann y Morgenstern investigaron dos planteamientos distintos de la Teoría de Juegos. El primero de ellos el planteamiento estratégico o no cooperativo.

Von Neumann y Morgenstern resolvieron este problema en el caso particular de juegos con dos jugadores cuyos intereses son diametralmente opuestos. A estos juegos se les llama estrictamente competitivos, o de suma cero, porque cualquier ganancia para un jugador siempre se equilibra exactamente por una pérdida correspondiente para el otro jugador. El ajedrez, el backgammon y el póquer son juegos tratados habitualmente como juegos de suma cero.

En el segundo de ellos desarrollaron el planteamiento coalicional o cooperativo, en el que buscaron describir la conducta óptima en juegos con muchos jugadores.

Puesto que éste es un problema mucho más difícil, no es de sorprender que sus resultados fueran mucho menos precisos que los alcanzados para el caso de suma cero y dos jugadores. En particular, Von Neumann abandono todo intento de especificar estrategias óptimas para jugadores individuales. En lugar de ello se propuso clasificar los modelos de formación de coaliciones que son consistentes con conductas racionales.

CONCEPTOS BÁSICOS

JUEGOS BIPERSONALES DE SUMA CERO

En un juego bipersonal de suma cero, cada uno de dos jugadores tiene que escoger entre unas acciones dictadas a cada turno, y la pérdida de cada jugador es igual al beneficio del su contrincante.

MATRIZ DE PAGO

La matriz de pagos de un juego bipersonal de suma cero tiene reglones etiquetados por las acciones del "jugador renglón" y columnas etiquetadas por las acciones del su contrincante, el "jugador columna." La entrada ij de la matriz es el pago que gana el jugador renglón en caso de que el jugador renglón usa acción i y el jugador columna usa acción j.

Page 37: Investigacion de Operaciones Blog

ESTRATEGIA MIXTA, VALOR ESPERADO

Un jugador usa una estrategia pura si usa la misma acción a cada turno del juego. El jugador usa una estrategia mixta si en cada turno escoge al azar una acción para que cada acción se esté usando una fracción determinada del tiempo.

Representamos una estrategia mixta (o pura) del jugador reglón por una matriz con un solo renglón (vector probabilidad):

R = [a b c . . . ]

Con lo mismo número de entradas que renglones, y en cual cada entrada representa la fracción de tiempo que está usada la correspondiente acción (o la probabilidad de usar aquel acción) y donde a + b + . . . = 1.

Una estrategia mixta para el jugador renglón se represente por un vector probabilidad similar, pero en forma de columna C. Para ambos jugadores, estrategias puras son representadas por vectores probabilidad con un solo 1 y el resto de las entradas 0.

VALOR ESPERADO

El valor esperado del juego con matriz de pagos P que resulta por las estrategias mixtas R y C es dado por

e = RPC

El valor esperado del juego es el pago promedio por turno si cada jugador usa su estrategia mixta especificada por R y C después de un gran número de turnos.

CRITERIO MINIMAX, PRINCIPIOS FUNDAMENTALES DE LA TEORÍA DE JUEGOS

CRITERIO MINIMAX

Un jugador quien usa el criterio minimax escoge una estrategia que, entre todas las estrategias posibles, minimiza el daño de la mejor contra-estrategia del otro jugador. Es decir, una estrategia óptima según el criterio minimax es una que minimiza el daño máximo que puede hacer el contrincante.

Encontrar la estrategia se llama solucionar el juego. La tercera parte del tutorial para esta tema muestra un método gráficamente para solucionar juegos 2×2. Para juegos generales, se puede usar el método simplex. Sin embargo, se puede frecuentemente simplificar un juego y a veces solucionarlo por "reducir por predominio" y/o comprobar si es "estrictamente determinado" (vea más abajo).

Page 38: Investigacion de Operaciones Blog

PRINCIPIOS FUNDAMENTALES DE LA TEORÍA DE JUEGOS

Cuando analizamos cualquier juego, hacemos los siguientes supuestos acerca de los dos jugadores:

1. Cada jugador hace la acción mejor posible.

2. Cada jugador sabe que su contrincante está también haciendo la acción mejor posible.

PUNTO DE SILLA, JUEGO ESTRICTAMENTE DETERMINADO

Un punto de silla es un pago que es simultáneamente un mínimo de su renglón y un máximo de su columna. Para encontrar puntos de silla, Encierre en círculo los mínimos de todos los renglones y meta en caja las máximas de todas las columnas. Los puntos de silla son aquellas entradas que son simultáneamente en círculo y en caja.

Un juego es estrictamente determinado si tiene por lo menos uno punto de silla. Las siguientes declaraciones se aplican a los juegos estrictamente determinados:

A. Todos los puntos de silla en un juego tienen los mismos valores de pago.

B. Elegir el renglón y la columna que pasan por cualquier punto de silla de estrategias minimax para ambos jugadores. Es decir, el juego es solucionado por el uso de estas estrategias puras.

El valor de un juego estrictamente determinado es el valor del punto de silla. Un juego justo tiene un valor igual a cero, si no, es injusto o parcial.

ESTRATEGIA ALEATORIA

Es aquella en donde el jugador renglón elige un renglón al azar, de acuerdo con cierta distribución de probabilidad. Por ejemplo, el jugador renglón podría la siguiente distribución de probabilidad:

RESULTADO PROBABILIDAD

Renglón1 2/3

Renglón 2 1/3

Page 39: Investigacion de Operaciones Blog

Si el jugador renglón utiliza esta distribución de forma predecible, como cuando selecciona repetidamente el renglón 1 dos veces y luego el renglón 2 una vez, el jugador columna podría descubrir la estrategia de responder con el fin de reducir al mínimo su eficacia. Por lo tanto, el jugador renglón debe emplear algún dispositivo aleatorio, como la rueda giratoria que se mostro anteriormente (ruleta de pueblo), con el cual elegiría 1 dos terceras partes del tiempo.

Los juegos de punta de silla están estrictamente determinados; es decir, los jugadores adoptan estrategias puras, y el curso del juego se determina por adelantado (suponiendo que los jugadores son agresivos y capaces). Los juegos sin punto de silla no están estrictamente determinados; si un jugador emplea una estrategia aleatoria, el curso del juego estará sujeto al azar, y todo puede suceder. No hay valor fijo para el juego; solo hay un valor muy probable o esperado.

JUEGOS NO ESTRICTAMENTE DETERMINADOS:

Esta clase de juegos tiene más de una alternativa de juego por la que los jugadores podrian ganar, por lo que no están obligados a siempre jugar con la misma estrategia, no presentan un punto silla por que el número menor de todos los máximos de las columnas no es igual al número mayor de los menores de los renglones, dando como resultado un juego no estrictamente determinado.

EJEMPLO:

Formulación de juegos de dos personas con suma cero

Para ilustrar las características básicas de un modelo de teoría de juegos, considérese el juego llamado pares y nones. Éste consiste nada más en que los dos jugadores muestran al mismo tiempo uno o dos dedos. Si el número de dedos coincide, el jugador que apuesta a pares (por ejemplo, el jugador 1) gana la apuesta (digamos $l) al jugador que va por nones (jugador II). Si el número no coincide, el jugador 1 paga $l al jugador II.

Entonces, cada jugador tiene dos estrategias: mostrar uno o dos dedos. La tabla a continuación contiene el pago en dólares que resulta para el jugador 1 en una matriz de pagos.

Page 40: Investigacion de Operaciones Blog

En general, un juego de dos personas se caracteriza por:

1. Las estrategias del jugador I.

2. Las estrategias del jugador II.

3. La matriz de pagos.

Antes de iniciar el juego, cada jugador conoce las estrategias de que dispone, las que tiene su oponente y la matriz de pagos. Una jugada real en el juego consiste en que los dos jugadores elijan al mismo tiempo una estrategia sin saber cuál es la elección de su oponente.

Una estrategia puede constituir una acción sencilla, como mostrar un número par o non de dedos en el juego de pares y nones. Por otro lado, en juegos más complicados que llevan en sí una serie de movimientos, una estrategia es una regla predeterminada que especifica por completo cómo se intenta responder a cada circunstancia posible en cada etapa del juego. Por ejemplo, una estrategia de un jugador de ajedrez indica cómo hacer el siguiente movimiento para todas las posiciones posibles en el tablero, de manera que el número total de estrategias posibles sería astronómico. Las aplicaciones de la teoría de juegos involucran situaciones competitivas mucho menos complicadas que el ajedrez pero las estrategias que se manejan pueden llegar a ser bastante complejas.

Por lo general, la matriz de pagos muestra la ganancia (positiva o negativa) que resultaría con cada combinación de estrategias para el jugador 1. Se da de esta manera, ya que la matriz del jugador II es el negativo de ésta, debido a la naturaleza de la suma cero del juego.

Los elementos de la matriz pueden tener cualquier tipo de unidades, como dólares, siempre que representen con exactitud la utilidad del jugador 1 en el resultado correspondiente. Debe hacerse hincapié en que la utilidad no necesariamente es proporcional a la cantidad de dinero (o cualquier otro bien) cuando se manejan cantidades grandes. Por ejemplo, para una persona pobre $2 millones (después de impuestos) tal vez vale mucho más que el doble de $1 millón. En otras palabras, si a una persona se le da a elegir entre: 1) recibir, con el 50% de posibilidades, $2 millones en lugar de nada y 2) recibir $1 millón con seguridad, ese individuo tal vez prefiriera este último. Por otro lado, el resultado que corresponde a un elemento 2 en una matriz de pagos debe "valer el doble" para el jugador 1 que el resultado correspondiente a un elemento 1. Así, dada la elección, debe serle indiferente un 50% de posibilidades de recibir el primer resultado (en lugar de nada) y recibir en definitiva el último resultado.

Un objetivo primordial de la teoría de juegos es establecer criterios racionales para seleccionar una estrategia, los cuales implican dos suposiciones importantes:

1. Ambos jugadores son racionales.

2. Ambos jugadores eligen sus estrategias sólo para promover su propio bienestar (sin compasión para el oponente).

Page 41: Investigacion de Operaciones Blog

La teoría de juegos se contrapone al análisis de decisión, en donde se hace la suposición de que el tomador de decisiones está jugando un juego contra un oponente pasivo, la naturaleza, que elige sus estrategias de alguna manera aleatoria.

Se desarrollará el criterio estándar de teoría de juegos para elegir las estrategias mediante ejemplos ilustrativos. En particular, a continuación se presenta un ejemplo prototipo que ilustra la formulación de un juego y su solución en algunas situaciones sencillas. Después se desarrollará una variación más complicada de este juego para obtener un criterio más general.

http://www.frm.utn.edu.ar/ioperativa/TJuegos.pdf

http://www.ecpunr.com.ar/Docs/Teoria_de_Juegos%20II.pdf

TEORIA DE DECISIONES

DEFINICIÓN

Una decisión es una elección consciente y racional, orientada a conseguir un objetivo, que se realiza entre diversas posibilidades de actuación (o alternativas). Antes de tomar una decisión deberemos calcular cual será el resultado de escoger una alternativa. En función de las consecuencias previsibles para cada alternativa se tomará la decisión. Así, los elementos que constituyen la estructura de la decisión son: los objetivos de quién decide y las restricciones para conseguirlos; las alternativas posibles y potenciales; las consecuencias de cada alternativa; el escenario en el que se toma la decisión y las preferencias de quien decide.

MÉTODOS Y MODELOS PARA LA TOMA DE DECISIONES

Existen diversas situaciones en las que deben tomarse decisiones empresariales: situaciones de certeza, incertidumbre y riesgo.

Decisiones en situación de certeza

Una situación de certeza es aquella en la que un sujeto tiene información completa sobre una situación determinada, sobre cómo evolucionará y conoce el resultado de su decisión. Ej: decisiones sobre compras cuando se conoce la demanda, de distribución de personal cuando se conoce el coste por persona y operación, etc. La toma de decisiones en un marco de certeza no implica dificultad alguna, más allá de las relacionadas con la gestión empresarial.

Decisiones en situación de riesgo

Son situaciones en la que los datos se describen mediante distribuciones de probabilidad. Se enfrentan a situaciones en donde se corre un riesgo al tomar una decisión.

Decisiones en situación de incertidumbre

Page 42: Investigacion de Operaciones Blog

Una situación de incertidumbre es aquella en la que un sujeto toma la decisión sin conocer del todo la situación y existen varios resultados para cada estrategia. Pueden ser decisiones no competitivas y competitivas.

Decisiones no competitivas

En las decisiones no competitivas nadie se opone a la estrategia del sujeto que decide.

Ej: vendedores de periódicos (se quiere conocer la cantidad a adquirir de acuerdo con las ventas). Para decidir existen una serie de criterios de elección:

- Maximin, pesimista o Wald

- Máximax, optimista o Hurwicz

- Coeficiente de optimismo-pesimismo

- Razón suficiente o Laplace

- Mínimax, coste de oportunidad o Savage

a) El criterio maximin supone maximizar el resultado mínimo, es decir el decisor quiere asegurarse la elección mejor en caso que se dé la situación más desfavorable. Es pesimista. Es útil en situaciones muy inciertas, si quieren evitarse riesgos o si existe conflicto.

b) El criterio maximax consiste en maximizar el máximo; escoger el resultado máximo entre los mejores de cada alternativa. El decisor es optimista.

c) El criterio del coeficiente de optimismo-pesimismo se sitúa entre los dos anteriores. Partimos de un grado de optimismo y de pesimismo relacionados del siguiente modo:

Coeficiente de optimismo= p; coeficiente de pesimismo= (1-p)= q; donde p+q= 1 y 0<p<1.

Dentro de la misma alternativa o estrategia consideraremos el resultado mayor de cada alternativa como p mientras que el resultado menor será q. Se escoge el mayor tras ponderar los resultados esperados por los coeficientes de optimismo y pesimismo.

d) El criterio del principio de razón suficiente espera que todas las situaciones de futuro tendrán la misma probabilidad de suceder. Ante esta situación se elige el resultado medio más elevado.

e) El criterio minimax plantea elegir en función de lo que se dejará de ganar. Por tanto, en primer lugar debe calcularse el máximo coste de oportunidad de cualquier opción y, en segundo lugar, elegir el menor de ellos.

Page 43: Investigacion de Operaciones Blog

EJEMPLO:

Supongamos que una empresa quiere realizar una campaña publicitaria. Se le presentan 3 posibilidades: radio (15 minutos de lunes a jueves en un espacio), TV (1 spot cada semana sobre las 12h) y prensa (1 anuncio 2 días a la semana los lunes y los jueves). Como han hecho campañas anteriormente se han podido valorar los resultados de las diferentes posibilidades del siguiente modo:

Ej: si la demanda de mercado se mantiene alta, la campaña publicitaria en la radio garantiza los mejores resultados. Si la demanda de mercado se mantiene baja, la campaña publicitaria que garantiza los mejores resultados es la prensa. ¿Qué medio de comunicación elegiríais?

a) El pesimista adoptará el MAXIMIN, es decir, escoger el mejor resultado de entre la peor situación. El peor escenario (o peor situación) es que la demanda sea baja. El mejor resultado en el peor escenario es: PRENSA.

b) El optimista adoptará el criterio MAXIMAX, el mejor de los mejores. El mejor escenario es la demanda alta. El mejor de los mejores es: RADIO.

c) Puede escogerse una situación intermedia entre optimismo y pesimismo (CRITERIO OPTIMISMO-PESIMISMO). Debe suponerse un determinado grado de optimismo

(p). Si suponemos p= 60% = 0,6 ; q=0,4: Radio : p * max + q * min = 100 * 0,6 + 20 * 0,4 = 68

T.V. : p * max + q * min = 80 * 0,6 + 5 * 0,4 = 50

Prensa: p * max + q * min = 90 * 0,6 + 25 * 0,4 = 64

Escogerá la RADIO, al ser el resultado mayor de entre las distintas alternativas.

d) Si creemos que todas las situaciones tienen la misma posibilidad de suceder se escogerá el resultado medio más elevado (LAPLACE).

Page 44: Investigacion de Operaciones Blog

Resultado medio radio = (100+40+20)/3 = 53,3

Resultado medio TV = (80+20+5)/3 = 35

Resultado medio prensa = (90+35+25)/3= 50.

Escogerá RADIO

e) Con el MINIMAX se escoge el mínimo de los máximos costes de oportunidad posibles.

Calculamos la matriz de costes de oportunidad: