Informe simulacion analis-salidassimulacion
-
Upload
ines-rodriguez -
Category
Engineering
-
view
157 -
download
0
Transcript of Informe simulacion analis-salidassimulacion
1
Universidad de Oriente Núcleo Nueva Esparta
Escuela de Ingeniería y Ciencias Aplicadas
Lic. Informática
Análisis de las salidas de la simulación
2
Índice
Pág. Introducción………………………………………………………………………………….3 Calculo de número de Corridas……………………………………………………………5 Contadores de Estadísticas Sumarias......................................................................11 Análisis Estadísticos de los Datos Simulados...........................................................13
Prueba de Medias...........................................................................................13
Prueba de Varianza..........................................................................................13
Estimación del intervalo de una media poblacional.................................................16
Conclusión................................................................................................................24
Referencias...............................................................................................................25
3
Introducción
La simulación es una herramienta para evaluar el desempeño de un sistema
existente o propuesto, bajo diferentes configuraciones de interés. Así como la
eliminación de cuellos de botella en líneas de ensamble, la reducción de fallas al no
conocer especificaciones, la prevención en la sobre utilización de recursos, al igual
que la optimización del desempeño del sistema.
En un estudio de simulación, la intervención humana es requerida en todos los
estados del desarrollo del modelo, así como la experimentación, diseño, análisis de
salidas, formulación de conclusiones y toma de decisiones que alteren el sistema
bajo estudio. El único estado en donde la intervención humana no es requerida es en
la corrida de la simulación, con la existencia hoy en día de paquetes de software de
simulación bastante poderosos y eficientes.
Por lo tanto, la formulación del problema, la experimentación el desarrollo de
modelos de simulación así como el análisis, son indispensables para un exitoso
estudio de simulación.
. Las salidas del modelo de simulación se consideran muestras. Las
principales cuestiones en la obtención de estimaciones útiles a partir de muestras
son: que la muestra sea representativa del comportamiento del sistema, y que el
tamaño de la muestra sea lo suficientemente grande para que las estimaciones de
las medidas de ejecución alcancen un buen nivel de precisión. El tamaño de la
muestra es algo que está bien definido, pero la representatividad del comportamiento
4
del sistema depende de la naturaleza de las cuestiones que tienen que ser
contestadas por el modelo.
Se pueden realizar dos tipos de análisis con un modelo de simulación:
Análisis para sistemas con final definido: la ejecución del modelo finaliza
cuando ocurre un evento específico. Se tomaría una muestra por ejecución.
Análisis para sistemas con final no definido (sistemas en estado de equilibrio
o estacionario): el interés está en medias de las medidas de comportamiento de
ejecuciones largas, después de que el sistema ha pasado por algún periodo de
comportamiento transitorio. Las medidas en estado estacionario se pueden definir
como el valor de las medidas en el límite, cuando la longitud de la ejecución tiende a
infinito.
5
Calculo de número de corridas.
Debido a la naturaleza probabilística de los sistemas donde se utiliza la
simulación, se hace imprescindible crear modelos cuyos resultados sean
estadísticamente iguales a los sistemas reales. Uno de los factores que afectan en
forma directa estos resultados es el tamaño de la corrida de simulación o bien el
número de corridas de simulación realizadas para encontrar resultados confiables. Al
realizar una corrida de simulación el resultado promedio de las variables del sistema
tienen un período de inestabilidad y, conforme transcurre el tiempo, esas variables
tienden a un estado estable y es entonces cuando los valores de las variables de
respuesta son confiables. Existen, en general, varias formas para lograr la
estabilización de un modelo de simulación, la primera consiste en utilizar corridas lo
suficientemente largas para que los datos del período de transición resulten
insignificantes, este planteamiento puede ser adecuado si la ejecución del modelo es
rápida. Esta situación no es tan atractiva si la duración del período transitorio es
prolongado, en este caso, se pueden seleccionar condiciones iniciales de arranque
que sean más representativas de la condición de estado estable y que por tanto
reduzca el período transitorio.
El principal problema en este caso es no tener una idea adecuada de las
condiciones iniciales, lo que podría llevar a una polarización de los resultados y en
consecuencia aumentar la varianza, ocasionando tamaños de corrida más grandes.
Una tercera opción es determinar en qué momento se ha llegado al estado estable en
función de los resultados obtenidos, una de las formas más comunes de determinar
6
este momento se consigue graficando el valor promedio dela variable de interés
contra el tiempo de simulación, y cuando se observe que ese promedio ya no cambia
a través del tiempo, detener la corrida de simulación.
El tamaño de una corrida de simulación depende principalmente del tipo de
distribución que se intenta simular y, por decirlo de alguna forma, de la bondad del
generador de números U(0,1) que se está utilizando y de las condiciones iniciales
con que inició la simulación del sistema. En forma general. Para calcular el número
de simulaciones se tiene la expresión:
Cuando la media y la variancia de la distribución a simular se obtuvieron de
una población 𝑛1 de 30 o menos elementos, entonces, el cálculo óptimo de las
simulaciones se modifica de acuerdo con la siguiente ecuación:
7
Esta segunda fórmula se emplea para calcular n óptima basándose en una
corrida simulada del sistema de tamaño 𝑛1. A esta corrida pequeña se le conoce
como prueba piloto, y su función es calcular n en función de la distribución general y
del generador utilizado en la prueba piloto. Pueden usarse ambas fórmulas siempre
y cuando la información de donde se obtienen los estimadores siga,
estadísticamente, una distribución normal. En caso de que los datos analizados sigan
otra distribución se debe hacer uso del teorema de Tchebycheff de tal suerte que el
cálculo se ve reducido a:
El cálculo del número de corridas óptimo, del modelo de simulación en donde
se tengan varias variables probabilísticas, se realiza ejecutando el cálculo para cada
una de ellas y se selecciona la mayor de todas las n; éste será el número de
simulaciones del modelo computacional.
Ejemplo:
Se desea encontrar el número de simulaciones que debe realizar un simulador
de desperdicios de una planta de poliéster, de tal forma que el promedio diario
simulado de desperdicio no difiera más de ± 0.166 σ de su valor real, con una
confiabilidad del 95%.Si se supone o se sabe que el desperdicio diario en toneladas
sigue una distribución normal, entonces, el número de simulaciones óptimo es:
8
Donde:
Z = 1.96 para una confiabilidad del 95%
K = 0.166s = 0.166σ
Sustituyendo la información:
n = 139.4
Ahora bien, si no se tiene idea de la distribución de probabilidad del desperdicio
de la planta o de que siga otro tipo de distribución, se utiliza la expresión:
}
Este cálculo del número de simulaciones óptimo, es un cálculo a priori, sin
embargo, no se asegura del todo que se cumpla con las condiciones de estabilidad.
Una forma más segura de determinar el momento en que el sistema se
estabiliza se consigue al graficar, a través del tiempo, cada uno de los valores
promedio de aquellas variables o resultados que se deseen analizar y al observar el
comportamiento de las variables deteniendo las simulación cuando todas esas
variables se encuentren en estado estable.
Cálculo de Número de Corridas.
Para calcular el número de corridas, se hace referencia a seguir los siguientes pasos:
9
Paso 1: Clasificar cada número aleatorio con respecto al anterior siguiendo las
siguientes características.
Paso 2: Calcular el número de corridas observadas h. Una corrida se forma por un
conjunto de números aleatorios consecutivos del mismo signo
Paso 3: Calcular E(h) y V(h) siguiendo las formulas; Siendo n el número de datos
generados.
Paso 4: Calcular el estadístico si es menor que el valor critico se acepta la hipótesis
de independencia
10
De acuerdo a lo expresado por E. Garcia, H. Garcia y L. Cardenas (2006) existen dos
versiones de la prueba de corridas: la prueba de corridas arriba y abajo y la prueba
de corridas arriba y abajo de la media.
La Prueba de corridas arriba y abajo consiste en determinar una secuencia de
números (S) que solo contiene unos y ceros, de acuerdo a una comparación entre 𝑟𝑗
y 𝑟𝑗-1. Posteriormente se determina el número de corridas observadas, 𝐶0 (una
corrida se identifica como la cantidad de unos o ceros consecutivos). Luego se calcula
el valor esperado, la varianza del número de corridas y el estadístico 𝑍0 mediante las
ecuaciones:
Si el estadístico 𝑍0 es mayor que el valor crítico, se concluye que los números del
conjunto rj no son independientes. De lo contrario no se puede rechazar que el
conjunto 𝑟𝑗 sea independiente.
Para las Prueba de corridas arriba y abajo de la media, su procedimiento consiste en
determinar una secuencia de unos y ceros, de acuerdo con una comparación entre
los números del conjunto 𝑟𝑗 y 0.5. Posteriormente se determina el número de corridas
observadas, 𝐶0, y los valores de 𝑛0 y 𝑛1. 𝐶0 es el número de corridas en la secuencia,
determinado de la misma manera que en la prueba de corridas arriba y abajo; 𝑛0 es
11
igual a la cantidad de ceros en la secuencia, y 𝑛1 es igual a la cantidad de unos de la
secuencia, cumpliéndose que 𝑛0 + 𝑛1=n. Luego se calcula el valor esperado, la
varianza del número de corridas y el estadístico 𝑍0 con las siguientes ecuaciones:
Si el estadístico 𝑍0 esta fuera del intervalo: −𝑍α/2 𝑍0 𝑍α/2 , se concluye que los
números del conjunto 𝑟𝑗 no son independientes. De lo contrario no se puede rechazar
que el conjunto de 𝑟𝑗 es independiente.
Contadores de Estadísticas Sumarias
Estadística Sumaria: Podemos usar una serie de números conocidos como
estadística sumaria para describir las características del conjunto de datos. Dos de
estas características son de particular importancia para los responsables de tomar
decisiones: la de tendencia central y la de dispersión.
Tendencia central: la tendencia central se refiere al punto medio de una distribución.
Las medidas de tendencia central se conocen como medidas de posición.
12
Dispersión: se refiere a la extensión de los datos en una distribución, es decir, al
grado en que las observaciones se distribuyen.
Sesgo: las curvas que representan los puntos de datos de un conjunto de datos
pueden ser simétricas o sesgadas. Las curvas simétricas, tienen una forma tal que
una línea vertical que pase por el punto más alto de la curva dividirá el área de esta
en dos partes iguales. Cada parte es una imagen espejo de la otra.
En las curvas sesgadas, los valores de su distribución de frecuencias están
concentrados en el extremo inferior o en el superior de la escala de medición del eje
horizontal. Los valores no están igualmente distribuidos. Las curvas pueden estar
sesgadas hacia la derecha (positivamente sesgadas) o sesgadas hacia la izquierda
(negativamente sesgadas).
Curtosis: cuando medimos la curtosis de una distribución, estamos midiendo
Su grado de agudeza.
Principio Fundamental del Proceso de Conteo
Hipótesis: Un evento puede realizarse de n1 maneras, un segundo de n2 maneras
y un k-esimo evento de nk maneras.
Conclusión: El número de maneras en que puede suceder una sucesión de los k
eventos en el orden indicado es de: n1*n2*...*nk
Demostración: Por inducción sobre el número de eventos tenemos que para el
primer evento, tenemos n1 formas de hacerlo y no hay nada que probar. Supongamos
13
que para k-1 eventos el número de maneras en que suceden es n1n2...nk-1 entonces,
para los k eventos, tenemos que para cada uno de los nk eventos tenemos n1n2...nk-
1 maneras de realizarlos, por lo que existen n1n2...nk formas de que los eventos
sucedan, por lo tanto queda probado el principio fundamental de conteo.
Análisis Estadísticos de los Datos Simulados: medida y varianza
maestral
Por lo regular, los estudios de simulación se realizan para determinar el valor de
cierta cantidad θ, en este caso se refiere a determinar las medidas de rendimiento,
relacionada con un modelo estocástico particular. La simulación del sistema en
estudio produce datos de salida que son, variables aleatorias cuyo valor esperado
es precisamente el valor buscado θ, es decir el valor
de la medida de rendimiento considerada. Una simulación independiente, vale decir,
otra ejecución de la simulación, proporciona una nueva variable aleatoria
independiente de la anterior, pero con la misma media. Esto continúa hasta obtener
k ejecuciones o réplicas y k variables aleatorias independientes, todas ellas con la
misma distribución y media θ, cuyo promedio sirve como estimador de θ, es decir,
sirve como estimador de la medida de rendimiento estudiada.
Prueba de Media: La media o promedio muestral “X(n)” es el promedio simple de
los datos la cual consiste en verificar que los números generados tengan
una media estadísticamente igual a , de esta manera, se analiza la siguiente
hipótesis:
14
Paso 1: Calcular la media de los n números generados.
Paso 2: Calcular los límites superior e inferior de aceptación:
Paso 3:
Si el valor de se encuentra entre y aceptamos que los números
tienen una media estadísticamente igual a con un nivel de aceptación
Prueba de Varianza: Se puede definir como el "casi promedio" de los cuadrados de
las desviaciones de los datos con respecto a la media maestral. Consiste en verificar
si los números aleatorios generados tienen una varianza de 0.083, de tal forma que
la hipótesis queda expresada como:
15
Paso 1: Para calcular la varianza de los n números generados V(x), usamos la
fórmula matemática de datos referentes a una muestra.
Y para el caso de datos de una población es dada por
Paso 2: Calcular los límites superior e inferior de aceptación.
Paso 3:
Si V(x) se encuentra entre los valores de y , aceptamos la
hipótesis nula y los números aleatorios tienen una varianza estadísticamente igual
16
Según Sheldon (2007) la varianza muestral se define como la "medida" de
los cuadrados de las desviaciones a la media muestral (...) La varianza muestral
denotada por s2 de los datos xi...xn con media se define como:
La media muestral es considerada por el mismo autor como la media
aritmética de los valores de datos. La media muestral denotada por , se define
por:
17
Estimación del intervalo de una media poblacional
La estimación es el conjunto de técnicas que permiten dar un valor aproximado
de un parámetro de una población a partir de los datos proporcionados por una
muestra. Por ejemplo, una estimación de la media de una determinada característica
de una población de tamaño N podría ser la media de esa misma característica para
una muestra de tamaño n.1. La estimación puede ser de dos tipos por intervalos o
puntual
Una ventaja de la estimación por intervalo es que muestra la exactitud con que
estima el parámetro, a menor longitud del intervalo mayor exactitud en la estimación.
Un intervalo de confianza es un rango de valores, centrado en una media muestral
X¯, dentro del cual se espera que con un nivel de confianza (1 − α) se encuentre el
valor del parámetro en cuestión. Los métodos de estimación por intervalo son el
método pivotal y el método general.
La estimación por intervalo consiste en la obtención de un intervalo dentro del
cual estará el valor del parámetro estimado con una cierta probabilidad. En la
estimación por intervalos se usan los siguientes conceptos:
Intervalo de confianza
El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es
el parámetro a estimar. Este intervalo contiene al parámetro estimado con un
determinado nivel de confianza. Pero a veces puede cambiar este intervalo cuando
la muestra no garantiza un axioma o un equivalente circunstancial.
Variabilidad del Parámetro
Si no se conoce, puede obtenerse una aproximación en los datos aportados por la
literatura científica o en un estudio piloto. También hay métodos para calcular el
18
tamaño de la muestra que prescinden de este aspecto. Habitualmente se usa como
medida de esta variabilidad la desviación típica poblacional y se denota σ.
Error de la estimación
Es una medida de su precisión que se corresponde con la amplitud del intervalo de
confianza. Cuanta más precisión se desee en la estimación de un parámetro, más
estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el
error, más observaciones deberán incluirse en la muestra estudiada. En caso de no
incluir nuevas observaciones para la muestra, más error se comete al aumentar la
precisión. Se suele llamar E, según la fórmula E = (θ2 - θ1)/2.
Límite de Confianza
Es la probabilidad de que el verdadero valor del parámetro estimado en la población
se sitúe en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-
α), aunque habitualmente suele expresarse con un porcentaje ((1-α)·100%). Es
habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con
valores α de 0,05 y 0,01 respectivamente.
Valor α
También llamado nivel de significación. Es la probabilidad (en tanto por uno) de fallar
en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de
confianza (1-α). Por ejemplo, en una estimación con un nivel de confianza del 95%,
el valor α es (100-95)/100 = 0,05
Valor crítico
Se representa por Zα/2. Es el valor de la abscisa en una determinada distribución
que deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza.
Normalmente los valores críticos están tabulados o pueden calcularse en función de
la distribución de la población.
19
La estimación puede hacerse a través del intervalo de confianza, Álvarez (2007)
hace el siguiente señalamiento:
Consiste en calcular dos números entre los cuales se encuentra el valor
del parámetro poblacional que se desee estimar con una determinada
probabilidad. Dichos números son límites de intervalo y se calculan según la
distribución del correspondiente estimador en el muestreo. La probabilidad de que
el valor del parámetro esté entre los límites del intervalo es la confianza de
estimación que suele definirse mediante 1- α; α es el error de estimación, si la
confianza es 0,9, α es 0,1. A los intervalos de estimación también se les denomina
intervalos de confianza (...) En la estimación por intervalo es necesario calcular
dos puntos a los que se denomina: límite inferior Li y límite superior Ls, del
intervalo de confianza (...) En general, se pueden deducir las expresiones
necesarias para el cálculo de los límites del intervalo de confianza a partir de una
expresión similar a la:
En la expresión anterior W es el valor del parámetro poblacional que se desea
estimar, Ŵ es su estimador, C es un valor que depende de la distribución del
estimador en el muestreo (...); EEŴ es el error estándar del estimador Ŵ , 1-α es la
confianza con que se realiza la estimación. A partir de la expresión anterior se
deducen los límites del intervalo:
20
A los estimadores se les suele representar con un acento circunflejo sobre
el parámetro que se desea estimar. Por ejemplo, u es la medida poblacional y û
es su estimador. En el caso de la media aritmética poblacional el estimador más
utilizado es la media aritmética muestral que se representa mediante el símbolo
: û= , la igualdad anterior indica que la media muestral es un estimador de la
media poblacional (...) Para un mismo parámetro suele haber muchos
estimadores posibles, hay que elegir el más eficiente.
La precisión en la estimación aumenta con el tamaño de la muestra, ya que al
aumentar ésta disminuye el error estándar del estimador: con muestras grandes
las estimaciones son más precisas y viceversa.
Según Weiers (2006) refiere el intervalo de estimación como:
Un intervalo de estimación para la medida simplemente describe un rango
de valores que es probable que incluya a la medida real de la población (...) Un
intervalo de confianza llamado también (intervalo de estimación) es aquel en donde
existe un grado específico de certeza de que el valor real del parámetro
poblacional caerá dentro de ese intervalo. Al construir un intervalo de confianza
para la medida, es muy importante tener en cuenta si conocemos o no el valor de la
desviación estándar de la población α (ver Gráfico 1).
21
Gráfico 1. Métodos para determinar las estimaciones de intervalo de confianza
para la medida de una población.
22
(...) Cuando se conoce la estimación del intervalo de confianza para la
medida: α conocida, por lo general en los procesos industriales puede conocerse
α aunque se desconoce u. Si la población no tiene una distribución normal, el
tamaño de la muestra debe ser de al menos 30, para que se aplique el teorema
central del límite. Cuando se cumplen estas condiciones, el intervalo de
confianza para la medida de la población es el siguiente (ver Gráfico 2):
Gráfico 2. Límites del intervalo de confianza para la medida de una
población, con α conocida.
(...) Cuando se desconoce α, pero se puede suponer que la población tiene
una distribución normal , el uso de la distribución t es una necesidad si
n<30. Sin embargo, también es adecuado el uso de la distribución t cuando se
desconoce α y los tamaños de la muestra son más grandes. Casi todos los
paquetes de software para estadística suelen utilizar el intervalo de t para todos
los tamaños de muestra cuando se emplea para estimar α. La estimación
del intervalo se resume del modo siguiente (ver Gráfico 3):
23
Gráfico 3. Límites del intervalo de confianza para la medida de una población,
α desconocida.
Como calcular la media poblacional a través del intervalo de confianza
Ejemplo 1: Queremos saber la media de km recorridos por los taxistas de cierta
población. Sabemos por estudios anteriores que = 2.250 km. Para ello, elegimos
una muestra de 100 taxistas y obtenemos una media muestral x =15.200 km.
a) Determina el intervalo de confianza al 99% para .
b) ¿Cuál ha de ser el tamaño mínimo de la muestra para que el error no supere
los 500 km con la misma confianza del 99%?
Solución:
Puesto que n=100 (30), sabemos que 2.250
, , 225100
X N N
.
) (15.200 15.200 ) 0,99 ( ) 0,99225 225
( ) 0,995 2,575 ( ) 579,225 225
int , 99%, y según esta muestra, [14.621;15.779]
L La P L X L P Z
L LP Z ver tabla L
con lo que el ervalo de confianza para al es
b) Si el I.C. ha de ser [ x -500, x +500], entonces, como 2.250
,X Nn
,
500 500( 500 500) 0,99 0,99
2.250 2250
500 500( ) 0,995 2,575 ( )
2.250 2.250
2,575 2.25011,59 134,32 135
500
P x X x P Z
n n
n nP Z ver tabla
n n n
24
Conclusión
Actualmente se reconoce la importancia de la estadística aplicada en el
desarrollo de investigaciones en diversos campos. Cada vez son más los
profesionales de diferentes disciplinas que requieren de métodos estadísticos como
muestreo, simulación, diseño de experimentos, modelamiento estadístico e
inferencia, para llevar a cabo recolección, compendio y análisis de datos y para su
posterior interpretación
La simulación es una técnica de muestreo estadístico controlado
(experimentación) que se emplea conjuntamente con un modelo, para obtener
respuestas aproximadas a problemas probabilísticos complejos; debe seguir las
normas del diseño de experimentos para que los resultados obtenidos puedan
conducir a interpretaciones significativas de las relaciones de interés. La
construcción y operación de un modelo de simulación permite la observación del
comportamiento dinámico de un sistema en condiciones controladas, pudiéndose
efectuar experimentos para comprobar alguna hipótesis acerca del sistema bajo
estudio.
En el Análisis de las Salidas de Simulación, la recolección y validación de
los datos son factores que no se pueden dejar pasar por alto, debido a éstos suman
un factor importante al proporcionar un resultado óptimo en la salida de la
problemática planteada y mientras más exactos y precisos sean los resultados
obtenidos en cuanto a la cantidad del número de corridas, menor es el margen de
error lo que nos acerca más a la realidad que se quiere representar.
25
Referencias
http://www.unamerida.com/archivospdf/337%20Lectura6.3.2.pdf
http://es.wikipedia.org/wiki/Varianza
http://es.wikipedia.org/wiki/Media_(matem%C3%A1ticas)#Media_muestral
http://www.monografias.com/trabajos91/estimacion-intervalos-
confianza/estimacion-intervalos-confianza.shtml