Estadística - Sesión 08

27
Simulación de Sistemas Modelado Estadístico Prueba de Bondad de Ajuste

description

Ajuste de Bondad

Transcript of Estadística - Sesión 08

  • Simulacin de Sistemas Modelado EstadsticoPrueba de Bondad de Ajuste

  • Objetivo de la SesinAprender a Crear una Distribucin de Probabilidad

    Determinar cual es la mejor distribucin que se ajusta a los datos

    Manejar pruebas de bondad de ajuste

  • SistemasTabla de ContenidoCreando una distribucin de probabilidadDistribucin de ProbabilidadVariable Aleatoria Funcin de Distribucin ExponencialPruebas de Bondad de AjustePrueba Chi-Cuadrado ()Prueba Kolmogorov Smirnov (K-S)

  • Distribucin de Probabilidad y SimulacinUna distribucin de probabilidad es un conjunto de valores los cuales son contabilizados a partir de una frecuencia relativa, en el cual, un evento ocurre o es probable que ocurra. Los modelos de simulacin estocstica utilizan distribuciones de probabilidad para representar una gran cantidad de eventos que ocurren aleatoriamente.Creando una Distribucin de Probabilidad

  • 221654104343125192783Ajuste de Curvas

  • Variable AleatoriaUna variable aleatoria es una variable cuyos resultados son determinados por los resultados de un experimento. Ejemplo. Cantidad de tiempo entre arribos de paquetes que llegan a u muelle

    P(X x) indica que la probabilidad de la variable aleatoria X ser menor que o igual a un valor x.

  • Funcin de Densidad de ProbabilidadUna fdp relaciona la probabilidad correspondiente a un valor x individual asociado con una variable aleatoria X

    Un histograma de probabilidad asocia probabilidades con grupos de valores de x

    Ellos pueden ser expresados grficamente, describiendo los pares de valores. Tpicamente el eje horizontal significa valor x y un eje vertical usualmente denota el valor y.

    Usualmente denotado como y = f(x) (interpretado como y es una funcin de x)

  • Primer paso: Recolectar data emprica (data bruta). La data emprica es informacin recuperada (puede ser data histrica), esto es contado o medido, recopilada en su forma original.

    Dado el siguiente ejemplo de data emprica.

    Consideremos que se han registrado 100 observaciones de tiempo entre arribos de mnibus a una terminal terrestre.Creando una Distribucin de Probabilidad

  • Tiempo entre arribos de mnibus a una terminal terrestre (minutos)N= 100 observaciones

    1813340929103810117292221221432205861031111321581232993417104152114086681324142481428121871561054121312245512214121332375125461822623974421912512351

  • Graficando los tiempo entre arribos de mnibus a una terminal terrestre (minutos)

  • Segundo paso: creacin de un histograma de frecuencia (probabilidad) relativa a la data. Agrupar la data por intervalos.

    Intervalos de clase:Regla de STURGES: K = 1 + 3.3 Log (n)n: nmero total de observacionesK: nmero de intervalos

    Para nuestro ejemplo: K = 1 + 3.3 Log (100) = 7.6Entones K es igual a 8 intervalos de clase.

    Ancho de clase = (Max valor Min valor) / k Ancho de clase = (54 - 1) / 8 = 6.625Creando una Distribucin de Probabilidad

  • Frecuencia relativa del tiempo entre arribos

    Nro.Intervalo de claseFrecuencia Probabilidad1[01.000 - 07.625)440.442 [07.625 14.250)260.263[14.250 20.875)90.094[20.875 27.500)80.085[27.500 34.125)70.076[34.125 40.750)30.037[40.750 47.375)20.028[47.375 54.000]10.01TOTAL1001

  • La ecuacin matemtica que describe una funcin de densidad es a menudo dificultosa para establecerla.Esto puede ser aproximado frecuentemente hallando una distribucin de probabilidad estndar conocida (ejemplo: normal, exponencial, gamma, etc.), la cual representa con precisin la distribucin de frecuencia relativa de la data actual. La figura de un histograma de frecuencia relativa provee una pista o indicio para encontrar una distribucin estndar representativa.Creando una Distribucin de Probabilidad

  • Tercer paso: Graficar en un Histograma la frecuencia relativaLa figura del histograma en el grfico indica que una distribucin exponencial es un candidato probable para representar la distribucin de probabilidad de la data observada.

    Creando una Distribucin de Probabilidad

  • Funcin ExponencialMedia:Varianza:2Para nuestro ejemplo = 12.41 (este valor resulta de la suma total de los valores observados, entre el nmero de observaciones)

  • 0204060801.2.3.1.- y = f(0) = 0.08

    2.- y = f(10) = 0.035

    3.- y = f(40) = 0.00300.080.0350.0030.05Tiempo entre arribosProbabilidadxf(x)Funcin de densidad de probabilidad

  • PRUEBA DE BONDAD DE AJUSTELuego de analizar la forma que tiene el grfico del histograma de frecuencias relativas, ste puede mostrar que uno o ms de las distribuciones estndares se parecen para ajustar la data.

    Su utilidad es determinar cual es el mejor tipo de distribucin que ajusta la data.

    Prueba Chi-Cuadrado ()Prueba Kolmogorov Smirnov (K-S)

  • Test Aplicable a v.a. continuas y v.a .discretas y compara las funciones de densidad de probabilidad

    Procedimiento1o. Elaborar el histograma de frecuencias relativas, con la que podemos apreciar cul sera la funcin terica de densidad que se ajusta mejor a los datos del histograma.2o. Desarrollo de la prueba estadstica : 2.1. Planteamiento de hiptesis Hp : La variable en estudio se ajusta a determinada distribucin terica (Uniforme, exponencial, normal, poisson). Ha : La variable en estudio tiene un comportamiento aleatorio que no se ajusta a determinada distribucin terica.3o. Establecimiento del nivel de significacin .4o. Clculos previos y estimacin de la frecuencia esperada o terica5o. Criterios de decisin : Se acepta la Hp, si X2 calc < X2 tab Se rechaza la Hp si X2 calc > X2 tab

  • Dada una muestra X1, X2, ..., Xn de una Fx(x) desconocida. Se desea contrastar. Ho : Fx(x) = Fo(x) v/s H1 : Fx(x) Fo(x)

    Efectuando una particin del soporte de X en k subconjuntos I1, I2, ..., Ik :

    fi : Nmero observados en el subconjunto i-simo (Ii)ei: nmero de observaciones esperadas en Ii bajo Ho

    Test

  • Prueba Chi-Cuadrado ()Chi - cuadrado calculado2(calculado)

    P(X x) =1- e-x/bIntervalosOP(X

  • Prueba Chi-Cuadrado ()Chi - cuadrado calculado2(calculado)

    P(X x) =1- e-x/bIntervalosOP(X

  • 2(teorico) = 2(95%, k 1-P ) = 2(95%, 8 1-1 )

    2(95%, 6) = 12.592

    2(calculado) < 2(teorico)

    4.35 < 12.592

    No se rechaza la hiptesis H0

    Grados de LibertadPara un nivel de confianza del 95%Se tiene las siguientes hiptesis:Ho: Los datos se ajustan a una fdp ExponencialHi: Los datos NO se ajustan a una fdp ExponencialPrueba Chi-Cuadrado ()Cantidad parmetros a estimar (media)

  • Test de Kolmogorov - Smirnov (Test K-S)Mediante la prueba se compara la distribucin acumulada de las frecuencias tericas (Fo) con la distribucin acumulada de las frecuencias observadas (Fn), se encuentra el punto de divergencia mxima y se determina qu probabilidad existe de que una diferencia de esa magnitud se deba al azar.

    Procedimiento: 1o. Calcular las frecuencias esperadas de la distribucin terica especfica por considerar para determinado nmero de clases, en un arreglo de rangos de menor a mayor. 2o Arreglar estos valores tericos en frecuencias acumuladas. 3oArreglar acumulativamente las frecuencias observadas. 4o Aplicar la ecuacin D = |Fo Fn| , donde D es la mxima discrepancia de ambas. 5o Comparar el valor estadstico D de Kolmogorov-Smirnov en la tabla de valores crticos de D. 6o Decidir si se acepta o rechaza la hiptesis.

  • Sea Fo una funcin de distribucin continua y sea Fn la funcin de distribucin emprica de la muestra.Bajo Ho: Fn(x) = Fo(x) se espera que Fn se aproxime a FoDn = Sup | Fn(x) - Fo(x) |

    La distribucin exacta de Dn est tabulada para valores n 40 y distintos niveles de significacin .Para muestras grandes se utiliza la distribucin asinttica de Dn dada por

    x R

    Test de Kolmogorov - Smirnov (Test K-S)

  • Prueba Kolmogorov SmirnovSe tiene las siguientes hiptesis:Ho: Los datos se ajustan a una fdp ExponencialHi: Los datos NO se ajustan a una fdp ExponencialFO: Frecuencia ObservadaFOA: Frec. Observada AcumuladaPOA: Prob. Observada AcumuladaPEA: Prob. Esperada AcumuladaComo:Mxima Diferencia < D(5%,100) No se rechaza la hipotesis H0

    K_SIntervalosFOFOAPOAPEPEAIPEA-POAI17.62544440.440.381628460.381628460.058371547.62514.2526700.70.223766660.605395120.0946048814.2520.8759790.790.131204890.736600010.0533999920.87527.58870.870.076931580.813531590.0564684127.534.1257940.940.04510860.858640190.0813598134.12540.753970.970.026449290.885089480.0849105240.7547.3752990.990.015508460.900597930.0894020747.37554110010.009093340.909691270.09030873100

    Max-DifD0.09460488Menorno se RechazaD Tabla 0.050,13403

  • Prueba Kolmogorov SmirnovSe tiene las siguientes hiptesis:Ho: Los datos se ajustan a una fdp ExponencialHi: Los datos NO se ajustan a una fdp ExponencialFO: Frecuencia ObservadaFOA: Frec. Observada AcumuladaPOA: Prob. Observada AcumuladaPEA: Prob. Esperada AcumuladaComo:Mxima Diferencia < D(5%,100) No se rechaza la hipotesis H0

    K_SIntervalosFOFOAPOAPEPEAIPEA-POAI17.62544440.440.381628460.381628460.058371547.62514.2526700.70.223766660.605395120.0946048814.2520.8759790.790.131204890.736600010.0533999920.87527.58870.870.076931580.813531590.0564684127.534.1257940.940.04510860.858640190.0813598134.12540.753970.970.026449290.885089480.0849105240.7547.3752990.990.015508460.900597930.0894020747.37554110010.009093340.909691270.09030873100

    Max-DifD0.09460488Menorno se RechazaD Tabla 0.050,13403

  • ConclusionesEl Ajuste de curvas se realiza con datos obtenidos del sistema realLa pruebas de bondad de ajuste nos ayudan a determinar que distribucin se ajusta mejor a los datos recolectados.

    *Hasta el momento hemos revisado las funciones de distribucin de probabilidades, la generacin de nmeros aleatorios y como usamos tales nmeros aleatorios con otras funciones de probabilidad para generar los valores aleatorios dependiendo de la funcin adoptada en el modelo.

    Las pginas siguientes nos dan las pautas para seleccionar la funcin de probabilidades adecuada (ajuste de datos a una funcin de probabilidades) al problema y los datos recolectados, as como, las tcnicas que debe usar para estar seguro de haber tomado la decisin correcta.