Determinacion de tipo de distribucion estadistica de un conjunto de datos

Julio Rito Vargas Pg. 1

UNIVERSIDAD DE MANAGUA

Al ms alto nivel

SIMULACIN DE SISTEMAS

Gua prctica #1

Determinar la Distribucin de los datos de una Simulacin

Prof.: MSc. Julio Rito Vargas A. Enero 2013

Objetivos:

Utilizar la herramienta Stat::Fit de Promodel con la finalidad de determinar la distribucin de probabilidad a partir de un conjunto de datos

o Realizar contraste de Hiptesis usando los estadsticos Anderson- Darling,

Chi-Cuadrad y Kolmogorov-Smirnov.

o Graficar los datos de entrada y graficar todas las distribuciones de

probabilidad que se pueden utilizar.

o Obtener estadstica descriptiva de datos.

Ejercicio:

Determinacin del tipo de distribucin estadstica de un conjunto de datos

Estos son los datos del nmero de automviles que entran a una gasolinera cada

hora.

14 7 13 16 16 13 14 17 15 16

13 15 10 15 16 14 12 17 14 12

13 20 8 17 19 11 12 17 9 18

20 10 18 15 13 16 24 18 16 18

12 14 20 15 10 13 21 23 15 18

Determine la distribucin de probabilidad con nivel de significancia del 5%


Introduccin

Ajuste de Curvas. Te ayuda a encontrar la mejor distribucin para representar los

datos. Stat::fit utiliza las pruebas de Bondad de Ajuste ms comnmente

conocidas, como son:

a. Anderson-Darling.

b. Chi-Cuadrada.

c. Kolmogorov-Smirnov.

Stat::Fit permite comparar los resultados entre varias distribuciones analizadas mediante una calificacin. Entre sus procedimientos emplea las pruebas estadsticas Chi-cuadrada, de Kolmogoro v-Smirnov y de Anderson-Darling. Conjuntamente calcula los parmetros apropiados para cada tipo de distribucin, e incluye informacin estadstica adicional como media, moda, valor mnimo, valor mximo y varianza, entre otros datos. Stat::Fit se puede ejecutar desde la pantalla de inicio de Promodel, o bien desde el comando Stat::Fit del men Tools. Entrada de datos y manipulacin Tabla de Datos Un nuevo proyecto se crea haciendo clic en el icono new en la barra de control o seleccionando File en la barra de men y luego New en el submen, esta accin genera un nuevo documento de Stat::Fit , y muestra una tabla vaca de datos (ver imagen 1) . Tambin de se pueden copiar (copy) datos desde otra aplicacin como Excel o el block de notas y pegar (paste) en la tabla de datos (Date Table).

Imagen 1: Tabla de Datos

Una vez introducida la informacin es posible

seleccionar una serie de opciones de anlisis

estadstico, entre ellas las de estadstica

descriptiva y de las pruebas de bondad de

ajuste, de las cuales nos ocuparemos.

Despus de introducido estos datos en Stat:Fit,

despliegue el men Statistics y seleccione el

comando Descriptive . En seguida aparecer una

nueva ventana con el nombre de Descriptive

Statistics, en donde se muestra el resumen

estadstico de la variable (ver Imagen 2)


Imagen 2: Ventana de resultados de estadsticos descriptivos

Estadstica descriptiva:

Nmero de datos (puntos) 50

Valor mnimo 7

Valor mximo 24

Media 15.04

Mediana 15.

Moda 15

Desviacin estndar 3.62199

Varianza 13.1188

Coeficiente de variacin 24.0504

Asimetra 0.126739

Curtosis -0.121982


Determinacin del tipo de distribucin estadstica:

Para determinar el tipo de distribucin de los datos, seleccione el comando Auto::Fit del men Fit en la pantalla principal de Stat::Fit. A continuacin se desplegar un cuadro de dilogo similar al que se ilustra en la Imagen 3, en la cual se tiene que seleccionar el tipo de distribucin que se desea probar. Para este ejercicio seleccionamos una distribucin de tipo discreto: discrete distributions por tratarse de datos contables (nmero de automviles que llegan a la gasolinera por hora, y esto es una variable aleatoria con esa caracterstica.

Imagen 3: Selecciona el tipo de variable aleatoria.

El resultado se desplegar en la ventana Automatic Fitting, donde se describen las

distribuciones de probabilidades analizadas, su posicin de acuerdo con el ajuste, y si los

datos siguen o no algunas de las distribuciones conocidas. En la imagen 4 se observa el

resultado del anlisis de ajuste del ejercicio, el cual nos indica que no se puede rechazar la

hiptesis de que los datos provengan de cualquiera de las dos distribuciones Binomial con

N=102 y p=0.148, o de Poisson, con media 15.

En esta misma imagen 3, se debe

seleccionar si la Distribucin es:

unbounded: no acotada en ambos

extremos); lower bound: si el lmite

inferior est acotado, en este caso se

puede aceptar la propuesta de que la

cota del lmite inferior sea el dato ms

pequeo de la muestra; assigned bound

:o seleccionar explcitamente otro valor

como lmite inferior. Haga clic en el botn

Ok para el proceso de ajuste se lleve a

cabo.

Haga clic en cualquiera de

las distribuciones.

Imagen 4


Hacer clic en cualquiera de las dos distribuciones ver imagen 5; en seguida se desplegar el

histograma que se se muestra; las barras azules representan la frecuencias observadas de

los datos; la curva roja indica la frecuencia esperada de la distribucin terica.

El formato del histograma puede ser modificado mediante el comando Graphics style

(imagen 6) del men Graphics esta opcin est disponible solo est disponible cuando o se

tiene activa la ventana comparision Graphics.

Imagen 5: Comparacin grfica

Imagen 6: Estilo del Grfico.

Aqu puede cambiar el tipo de

grfico, la escala, el tipo de letra y

colores.

Puede mostrar: un ttulo para el

grfico, as como leyendas para

cada uno de los ejes.


Prueba Chi-cuadrada:

Para n=50 datos, consideremos m=11 intervalos

La media muestral es 15.04 y la varianza es 13.1188

Permiten establecer la siguiente hiptesis.

Prueba de Hiptesis:

Ho: Poission (=15) Automviles/hora

H1: Otra distribucin.

Calculo de la media y la desviacin estndar.

La Distribucin Poisson:

POISSON.DIST(7,15,VERDADERO) = 0.018002193 (usando Excel)

POISSON.DIST(9,15,VERDADERO)- POISSON.DIST(7,15,VERDADERO) = 0.051851468


04.1550

18...714

n

xX

1188.1349

)04.1518...()04.1514(

1

)( 2222

n

xxS

0,1,2,... x!

)(

x

exp

x

0180.0 !7

15

!6

15

!5

15

!4

15

!3

15

!2

15

!1

15

!0

15)7,6,5,4,3,12,0(

157156155154

153152151150

eeee

eeeexp

0519.0!9

15

!8

15)9,8(

159158

ee

xp

1149.0!11

15

!10

15)11,10(

15111510

ee

xp









POISSON.DIST(26 o ms,15,VERDADERO)-POISSON.DIST(25,15,VERDADERO) = 0.00618488

1785.0!13

15

!12

15)13,12(

15131512

ee

xp

2049.0!15

15

!14

15)15,14(

15151514

ee

xp

1808.0!17

15

!16

15)17,16(

15171516

ee

xp

1264.0!19

15

!18

15)19,18(

15191518

ee

xp

0717.0!21

15

!20

15)21,20(

15211520

ee

xp

0336.0!23

15

!22

15)23,22(

15231522

ee

xp

0133.0!25

15

!24

15)25,24(

15251524

ee

xp

0062.0!27

15

!26

15,...)26(

15271526

ee

xp


Intervalo Oi P(x) Ei=50*p(x) C

0-7 1 0.0180 0.9001 0.0111

8-9 2 0.0519 2.5926 0.1354

10-11 4 0.1149 5.7449 0.5300

12-13 10 0.1785 8.9233 0.1299

14-15 11 0.2049 10.2436 0.0559

16-17 10 0.1808 9.0385 0.1023

18-19 6 0.1264 6.3180 0.0160

20-21 4 0.0717 3.5837 0.0483

22-23 1 0.0336 1.6821 0.2766

24-25 1 0.0133 0.6640 0.1700

26-- 0 0.0062 0.3092 0.3092

Los resultados nos Indican que no podemos rechazar la hiptesis de que la variable

aleatoria se comporta de acuerdo con una distribucin de Poisson, con una media de 15

automviles por hora.

0.3092

0)-(0.3092...

9001.0

1)-(0.9001)(11

1

222

i i

ii

E

OEc

307.18111,05.02 X 78481.1c


Determinar con un nivel de confianza de 95%, que tipo de distribucin siguen los datos,

usar los estadsticos Chi-cuadrada. Use Stat::Fit.

0.488 0.116 0.731 0.094 0.684 0.093 0.368 0.090 0.761 0.420

0.995 0.908 0.183 0.146 0.633 0.567 0.058 0.507 0.780 0.139

0.088 0.382 0.707 0.413 0.581 0.254 0.440 0.447 0.251 0.870

0.149 0.427 0.743 0.434 0.260 0.738 0.300 0.302 0.314 0.423

0.731 0.313 0.908 0.845 0.937 0.607 0.025 0.787 0.608 0.078

0.591 0.781 0.850 0.048 0.580 0.346 0.723 0.245 0.535 0.610

0.745 0.005 0.256 0.845 0.445 0.777 0.896 0.513 0.335 0.194

0.307 0.692 0.905 0.046 0.128 0.766 0.366 0.302 0.302 0.833

0.084 0.080 0.160 0.028 0.714 0.454 0.913 0.666 0.213 0.373

0.967 0.280 0.333 0.531 0.285 0.504 0.837 0.681 0.209 0.626

Determinacion de tipo de distribucion estadistica de un conjunto de datos

Documents

Transcript of Determinacion de tipo de distribucion estadistica de un conjunto de datos