Determinacion de tipo de distribucion estadistica de un conjunto de datos

9
Julio Rito Vargas Pág. 1 UNIVERSIDAD DE MANAGUA Al más alto nivel SIMULACIÓN DE SISTEMAS Guía prácca #1 Determinar la Distribución de los datos de una Simulación Prof.: MSc. Julio Rito Vargas A. Enero 2013 Objetivos: Utilizar la herramienta Stat::Fit de Promodel con la finalidad de determinar la distribución de probabilidad a partir de un conjunto de datos o Realizar contraste de Hipótesis usando los estadísticos Anderson- Darling, Chi-Cuadrad y Kolmogorov-Smirnov. o Graficar los datos de entrada y graficar todas las distribuciones de probabilidad que se pueden utilizar. o Obtener estadística descriptiva de datos. Ejercicio: Determinación del po de distribución estadísca de un conjunto de datos Estos son los datos del número de automóviles que entran a una gasolinera cada hora. 14 7 13 16 16 13 14 17 15 16 13 15 10 15 16 14 12 17 14 12 13 20 8 17 19 11 12 17 9 18 20 10 18 15 13 16 24 18 16 18 12 14 20 15 10 13 21 23 15 18 Determine la distribución de probabilidad con nivel de significancia del 5%

description

PRUEBA CHI-CUADRADA EXEL Y MANEJO DE SOFTWARE PROMODEL

Transcript of Determinacion de tipo de distribucion estadistica de un conjunto de datos

  • Julio Rito Vargas Pg. 1

    UNIVERSIDAD DE MANAGUA

    Al ms alto nivel

    SIMULACIN DE SISTEMAS

    Gua prctica #1

    Determinar la Distribucin de los datos de una Simulacin

    Prof.: MSc. Julio Rito Vargas A. Enero 2013

    Objetivos:

    Utilizar la herramienta Stat::Fit de Promodel con la finalidad de determinar la distribucin de probabilidad a partir de un conjunto de datos

    o Realizar contraste de Hiptesis usando los estadsticos Anderson- Darling,

    Chi-Cuadrad y Kolmogorov-Smirnov.

    o Graficar los datos de entrada y graficar todas las distribuciones de

    probabilidad que se pueden utilizar.

    o Obtener estadstica descriptiva de datos.

    Ejercicio:

    Determinacin del tipo de distribucin estadstica de un conjunto de datos

    Estos son los datos del nmero de automviles que entran a una gasolinera cada

    hora.

    14 7 13 16 16 13 14 17 15 16

    13 15 10 15 16 14 12 17 14 12

    13 20 8 17 19 11 12 17 9 18

    20 10 18 15 13 16 24 18 16 18

    12 14 20 15 10 13 21 23 15 18

    Determine la distribucin de probabilidad con nivel de significancia del 5%

  • Julio Rito Vargas Pg. 2

    Introduccin

    Ajuste de Curvas. Te ayuda a encontrar la mejor distribucin para representar los

    datos. Stat::fit utiliza las pruebas de Bondad de Ajuste ms comnmente

    conocidas, como son:

    a. Anderson-Darling.

    b. Chi-Cuadrada.

    c. Kolmogorov-Smirnov.

    Stat::Fit permite comparar los resultados entre varias distribuciones analizadas mediante una calificacin. Entre sus procedimientos emplea las pruebas estadsticas Chi-cuadrada, de Kolmogoro v-Smirnov y de Anderson-Darling. Conjuntamente calcula los parmetros apropiados para cada tipo de distribucin, e incluye informacin estadstica adicional como media, moda, valor mnimo, valor mximo y varianza, entre otros datos. Stat::Fit se puede ejecutar desde la pantalla de inicio de Promodel, o bien desde el comando Stat::Fit del men Tools. Entrada de datos y manipulacin Tabla de Datos Un nuevo proyecto se crea haciendo clic en el icono new en la barra de control o seleccionando File en la barra de men y luego New en el submen, esta accin genera un nuevo documento de Stat::Fit , y muestra una tabla vaca de datos (ver imagen 1) . Tambin de se pueden copiar (copy) datos desde otra aplicacin como Excel o el block de notas y pegar (paste) en la tabla de datos (Date Table).

    Imagen 1: Tabla de Datos

    Una vez introducida la informacin es posible

    seleccionar una serie de opciones de anlisis

    estadstico, entre ellas las de estadstica

    descriptiva y de las pruebas de bondad de

    ajuste, de las cuales nos ocuparemos.

    Despus de introducido estos datos en Stat:Fit,

    despliegue el men Statistics y seleccione el

    comando Descriptive . En seguida aparecer una

    nueva ventana con el nombre de Descriptive

    Statistics, en donde se muestra el resumen

    estadstico de la variable (ver Imagen 2)

  • Julio Rito Vargas Pg. 3

    Imagen 2: Ventana de resultados de estadsticos descriptivos

    Estadstica descriptiva:

    Nmero de datos (puntos) 50

    Valor mnimo 7

    Valor mximo 24

    Media 15.04

    Mediana 15.

    Moda 15

    Desviacin estndar 3.62199

    Varianza 13.1188

    Coeficiente de variacin 24.0504

    Asimetra 0.126739

    Curtosis -0.121982

  • Julio Rito Vargas Pg. 4

    Determinacin del tipo de distribucin estadstica:

    Para determinar el tipo de distribucin de los datos, seleccione el comando Auto::Fit del men Fit en la pantalla principal de Stat::Fit. A continuacin se desplegar un cuadro de dilogo similar al que se ilustra en la Imagen 3, en la cual se tiene que seleccionar el tipo de distribucin que se desea probar. Para este ejercicio seleccionamos una distribucin de tipo discreto: discrete distributions por tratarse de datos contables (nmero de automviles que llegan a la gasolinera por hora, y esto es una variable aleatoria con esa caracterstica.

    Imagen 3: Selecciona el tipo de variable aleatoria.

    El resultado se desplegar en la ventana Automatic Fitting, donde se describen las

    distribuciones de probabilidades analizadas, su posicin de acuerdo con el ajuste, y si los

    datos siguen o no algunas de las distribuciones conocidas. En la imagen 4 se observa el

    resultado del anlisis de ajuste del ejercicio, el cual nos indica que no se puede rechazar la

    hiptesis de que los datos provengan de cualquiera de las dos distribuciones Binomial con

    N=102 y p=0.148, o de Poisson, con media 15.

    En esta misma imagen 3, se debe

    seleccionar si la Distribucin es:

    unbounded: no acotada en ambos

    extremos); lower bound: si el lmite

    inferior est acotado, en este caso se

    puede aceptar la propuesta de que la

    cota del lmite inferior sea el dato ms

    pequeo de la muestra; assigned bound

    :o seleccionar explcitamente otro valor

    como lmite inferior. Haga clic en el botn

    Ok para el proceso de ajuste se lleve a

    cabo.

    Haga clic en cualquiera de

    las distribuciones.

    Imagen 4

  • Julio Rito Vargas Pg. 5

    Hacer clic en cualquiera de las dos distribuciones ver imagen 5; en seguida se desplegar el

    histograma que se se muestra; las barras azules representan la frecuencias observadas de

    los datos; la curva roja indica la frecuencia esperada de la distribucin terica.

    El formato del histograma puede ser modificado mediante el comando Graphics style

    (imagen 6) del men Graphics esta opcin est disponible solo est disponible cuando o se

    tiene activa la ventana comparision Graphics.

    Imagen 5: Comparacin grfica

    Imagen 6: Estilo del Grfico.

    Aqu puede cambiar el tipo de

    grfico, la escala, el tipo de letra y

    colores.

    Puede mostrar: un ttulo para el

    grfico, as como leyendas para

    cada uno de los ejes.

  • Julio Rito Vargas Pg. 6

    Prueba Chi-cuadrada:

    Para n=50 datos, consideremos m=11 intervalos

    La media muestral es 15.04 y la varianza es 13.1188

    Permiten establecer la siguiente hiptesis.

    Prueba de Hiptesis:

    Ho: Poission (=15) Automviles/hora

    H1: Otra distribucin.

    Calculo de la media y la desviacin estndar.

    La Distribucin Poisson:

    POISSON.DIST(7,15,VERDADERO) = 0.018002193 (usando Excel)

    POISSON.DIST(9,15,VERDADERO)- POISSON.DIST(7,15,VERDADERO) = 0.051851468

    POISSON.DIST(11,15,VERDADERO)- POISSON.DIST(9,15,VERDADERO) = 0.114898138

    04.1550

    18...714

    n

    xX

    1188.1349

    )04.1518...()04.1514(

    1

    )( 2222

    n

    xxS

    0,1,2,... x!

    )(

    x

    exp

    x

    0180.0 !7

    15

    !6

    15

    !5

    15

    !4

    15

    !3

    15

    !2

    15

    !1

    15

    !0

    15)7,6,5,4,3,12,0(

    157156155154

    153152151150

    eeee

    eeeexp

    0519.0!9

    15

    !8

    15)9,8(

    159158

    ee

    xp

    1149.0!11

    15

    !10

    15)11,10(

    15111510

    ee

    xp

  • Julio Rito Vargas Pg. 7

    POISSON.DIST(13,15,VERDADERO)- POISSON.DIST(11,15,VERDADERO) = 0.178466043

    POISSON.DIST(15,15,VERDADERO)- POISSON.DIST(13,15,VERDADERO) = 0.204871733

    POISSON.DIST(17,15,VERDADERO)- POISSON.DIST(15,15,VERDADERO) = 0.180769176

    POISSON.DIST(19,15,VERDADERO)- POISSON.DIST(17,15,VERDADERO) = 0.126360033

    POISSON.DIST(21,15,VERDADERO)- POISSON.DIST(19,15,VERDADERO) = 0.071674809

    POISSON.DIST(23,15,VERDADERO)- POISSON.DIST(21,15,VERDADERO) = 0.033641832

    POISSON.DIST(25,15,VERDADERO)- POISSON.DIST(23,15,VERDADERO) = 0.013279671

    POISSON.DIST(26 o ms,15,VERDADERO)-POISSON.DIST(25,15,VERDADERO) = 0.00618488

    1785.0!13

    15

    !12

    15)13,12(

    15131512

    ee

    xp

    2049.0!15

    15

    !14

    15)15,14(

    15151514

    ee

    xp

    1808.0!17

    15

    !16

    15)17,16(

    15171516

    ee

    xp

    1264.0!19

    15

    !18

    15)19,18(

    15191518

    ee

    xp

    0717.0!21

    15

    !20

    15)21,20(

    15211520

    ee

    xp

    0336.0!23

    15

    !22

    15)23,22(

    15231522

    ee

    xp

    0133.0!25

    15

    !24

    15)25,24(

    15251524

    ee

    xp

    0062.0!27

    15

    !26

    15,...)26(

    15271526

    ee

    xp

  • Julio Rito Vargas Pg. 8

    Intervalo Oi P(x) Ei=50*p(x) C

    0-7 1 0.0180 0.9001 0.0111

    8-9 2 0.0519 2.5926 0.1354

    10-11 4 0.1149 5.7449 0.5300

    12-13 10 0.1785 8.9233 0.1299

    14-15 11 0.2049 10.2436 0.0559

    16-17 10 0.1808 9.0385 0.1023

    18-19 6 0.1264 6.3180 0.0160

    20-21 4 0.0717 3.5837 0.0483

    22-23 1 0.0336 1.6821 0.2766

    24-25 1 0.0133 0.6640 0.1700

    26-- 0 0.0062 0.3092 0.3092

    Los resultados nos Indican que no podemos rechazar la hiptesis de que la variable

    aleatoria se comporta de acuerdo con una distribucin de Poisson, con una media de 15

    automviles por hora.

    0.3092

    0)-(0.3092...

    9001.0

    1)-(0.9001)(11

    1

    222

    i i

    ii

    E

    OEc

    307.18111,05.02 X 78481.1c

  • Julio Rito Vargas Pg. 9

    Determinar con un nivel de confianza de 95%, que tipo de distribucin siguen los datos,

    usar los estadsticos Chi-cuadrada. Use Stat::Fit.

    0.488 0.116 0.731 0.094 0.684 0.093 0.368 0.090 0.761 0.420

    0.995 0.908 0.183 0.146 0.633 0.567 0.058 0.507 0.780 0.139

    0.088 0.382 0.707 0.413 0.581 0.254 0.440 0.447 0.251 0.870

    0.149 0.427 0.743 0.434 0.260 0.738 0.300 0.302 0.314 0.423

    0.731 0.313 0.908 0.845 0.937 0.607 0.025 0.787 0.608 0.078

    0.591 0.781 0.850 0.048 0.580 0.346 0.723 0.245 0.535 0.610

    0.745 0.005 0.256 0.845 0.445 0.777 0.896 0.513 0.335 0.194

    0.307 0.692 0.905 0.046 0.128 0.766 0.366 0.302 0.302 0.833

    0.084 0.080 0.160 0.028 0.714 0.454 0.913 0.666 0.213 0.373

    0.967 0.280 0.333 0.531 0.285 0.504 0.837 0.681 0.209 0.626