Determinacion de tipo de distribucion estadistica de un conjunto de datos
-
Upload
adalberto-cruz -
Category
Documents
-
view
37 -
download
1
description
Transcript of Determinacion de tipo de distribucion estadistica de un conjunto de datos
-
Julio Rito Vargas Pg. 1
UNIVERSIDAD DE MANAGUA
Al ms alto nivel
SIMULACIN DE SISTEMAS
Gua prctica #1
Determinar la Distribucin de los datos de una Simulacin
Prof.: MSc. Julio Rito Vargas A. Enero 2013
Objetivos:
Utilizar la herramienta Stat::Fit de Promodel con la finalidad de determinar la distribucin de probabilidad a partir de un conjunto de datos
o Realizar contraste de Hiptesis usando los estadsticos Anderson- Darling,
Chi-Cuadrad y Kolmogorov-Smirnov.
o Graficar los datos de entrada y graficar todas las distribuciones de
probabilidad que se pueden utilizar.
o Obtener estadstica descriptiva de datos.
Ejercicio:
Determinacin del tipo de distribucin estadstica de un conjunto de datos
Estos son los datos del nmero de automviles que entran a una gasolinera cada
hora.
14 7 13 16 16 13 14 17 15 16
13 15 10 15 16 14 12 17 14 12
13 20 8 17 19 11 12 17 9 18
20 10 18 15 13 16 24 18 16 18
12 14 20 15 10 13 21 23 15 18
Determine la distribucin de probabilidad con nivel de significancia del 5%
-
Julio Rito Vargas Pg. 2
Introduccin
Ajuste de Curvas. Te ayuda a encontrar la mejor distribucin para representar los
datos. Stat::fit utiliza las pruebas de Bondad de Ajuste ms comnmente
conocidas, como son:
a. Anderson-Darling.
b. Chi-Cuadrada.
c. Kolmogorov-Smirnov.
Stat::Fit permite comparar los resultados entre varias distribuciones analizadas mediante una calificacin. Entre sus procedimientos emplea las pruebas estadsticas Chi-cuadrada, de Kolmogoro v-Smirnov y de Anderson-Darling. Conjuntamente calcula los parmetros apropiados para cada tipo de distribucin, e incluye informacin estadstica adicional como media, moda, valor mnimo, valor mximo y varianza, entre otros datos. Stat::Fit se puede ejecutar desde la pantalla de inicio de Promodel, o bien desde el comando Stat::Fit del men Tools. Entrada de datos y manipulacin Tabla de Datos Un nuevo proyecto se crea haciendo clic en el icono new en la barra de control o seleccionando File en la barra de men y luego New en el submen, esta accin genera un nuevo documento de Stat::Fit , y muestra una tabla vaca de datos (ver imagen 1) . Tambin de se pueden copiar (copy) datos desde otra aplicacin como Excel o el block de notas y pegar (paste) en la tabla de datos (Date Table).
Imagen 1: Tabla de Datos
Una vez introducida la informacin es posible
seleccionar una serie de opciones de anlisis
estadstico, entre ellas las de estadstica
descriptiva y de las pruebas de bondad de
ajuste, de las cuales nos ocuparemos.
Despus de introducido estos datos en Stat:Fit,
despliegue el men Statistics y seleccione el
comando Descriptive . En seguida aparecer una
nueva ventana con el nombre de Descriptive
Statistics, en donde se muestra el resumen
estadstico de la variable (ver Imagen 2)
-
Julio Rito Vargas Pg. 3
Imagen 2: Ventana de resultados de estadsticos descriptivos
Estadstica descriptiva:
Nmero de datos (puntos) 50
Valor mnimo 7
Valor mximo 24
Media 15.04
Mediana 15.
Moda 15
Desviacin estndar 3.62199
Varianza 13.1188
Coeficiente de variacin 24.0504
Asimetra 0.126739
Curtosis -0.121982
-
Julio Rito Vargas Pg. 4
Determinacin del tipo de distribucin estadstica:
Para determinar el tipo de distribucin de los datos, seleccione el comando Auto::Fit del men Fit en la pantalla principal de Stat::Fit. A continuacin se desplegar un cuadro de dilogo similar al que se ilustra en la Imagen 3, en la cual se tiene que seleccionar el tipo de distribucin que se desea probar. Para este ejercicio seleccionamos una distribucin de tipo discreto: discrete distributions por tratarse de datos contables (nmero de automviles que llegan a la gasolinera por hora, y esto es una variable aleatoria con esa caracterstica.
Imagen 3: Selecciona el tipo de variable aleatoria.
El resultado se desplegar en la ventana Automatic Fitting, donde se describen las
distribuciones de probabilidades analizadas, su posicin de acuerdo con el ajuste, y si los
datos siguen o no algunas de las distribuciones conocidas. En la imagen 4 se observa el
resultado del anlisis de ajuste del ejercicio, el cual nos indica que no se puede rechazar la
hiptesis de que los datos provengan de cualquiera de las dos distribuciones Binomial con
N=102 y p=0.148, o de Poisson, con media 15.
En esta misma imagen 3, se debe
seleccionar si la Distribucin es:
unbounded: no acotada en ambos
extremos); lower bound: si el lmite
inferior est acotado, en este caso se
puede aceptar la propuesta de que la
cota del lmite inferior sea el dato ms
pequeo de la muestra; assigned bound
:o seleccionar explcitamente otro valor
como lmite inferior. Haga clic en el botn
Ok para el proceso de ajuste se lleve a
cabo.
Haga clic en cualquiera de
las distribuciones.
Imagen 4
-
Julio Rito Vargas Pg. 5
Hacer clic en cualquiera de las dos distribuciones ver imagen 5; en seguida se desplegar el
histograma que se se muestra; las barras azules representan la frecuencias observadas de
los datos; la curva roja indica la frecuencia esperada de la distribucin terica.
El formato del histograma puede ser modificado mediante el comando Graphics style
(imagen 6) del men Graphics esta opcin est disponible solo est disponible cuando o se
tiene activa la ventana comparision Graphics.
Imagen 5: Comparacin grfica
Imagen 6: Estilo del Grfico.
Aqu puede cambiar el tipo de
grfico, la escala, el tipo de letra y
colores.
Puede mostrar: un ttulo para el
grfico, as como leyendas para
cada uno de los ejes.
-
Julio Rito Vargas Pg. 6
Prueba Chi-cuadrada:
Para n=50 datos, consideremos m=11 intervalos
La media muestral es 15.04 y la varianza es 13.1188
Permiten establecer la siguiente hiptesis.
Prueba de Hiptesis:
Ho: Poission (=15) Automviles/hora
H1: Otra distribucin.
Calculo de la media y la desviacin estndar.
La Distribucin Poisson:
POISSON.DIST(7,15,VERDADERO) = 0.018002193 (usando Excel)
POISSON.DIST(9,15,VERDADERO)- POISSON.DIST(7,15,VERDADERO) = 0.051851468
POISSON.DIST(11,15,VERDADERO)- POISSON.DIST(9,15,VERDADERO) = 0.114898138
04.1550
18...714
n
xX
1188.1349
)04.1518...()04.1514(
1
)( 2222
n
xxS
0,1,2,... x!
)(
x
exp
x
0180.0 !7
15
!6
15
!5
15
!4
15
!3
15
!2
15
!1
15
!0
15)7,6,5,4,3,12,0(
157156155154
153152151150
eeee
eeeexp
0519.0!9
15
!8
15)9,8(
159158
ee
xp
1149.0!11
15
!10
15)11,10(
15111510
ee
xp
-
Julio Rito Vargas Pg. 7
POISSON.DIST(13,15,VERDADERO)- POISSON.DIST(11,15,VERDADERO) = 0.178466043
POISSON.DIST(15,15,VERDADERO)- POISSON.DIST(13,15,VERDADERO) = 0.204871733
POISSON.DIST(17,15,VERDADERO)- POISSON.DIST(15,15,VERDADERO) = 0.180769176
POISSON.DIST(19,15,VERDADERO)- POISSON.DIST(17,15,VERDADERO) = 0.126360033
POISSON.DIST(21,15,VERDADERO)- POISSON.DIST(19,15,VERDADERO) = 0.071674809
POISSON.DIST(23,15,VERDADERO)- POISSON.DIST(21,15,VERDADERO) = 0.033641832
POISSON.DIST(25,15,VERDADERO)- POISSON.DIST(23,15,VERDADERO) = 0.013279671
POISSON.DIST(26 o ms,15,VERDADERO)-POISSON.DIST(25,15,VERDADERO) = 0.00618488
1785.0!13
15
!12
15)13,12(
15131512
ee
xp
2049.0!15
15
!14
15)15,14(
15151514
ee
xp
1808.0!17
15
!16
15)17,16(
15171516
ee
xp
1264.0!19
15
!18
15)19,18(
15191518
ee
xp
0717.0!21
15
!20
15)21,20(
15211520
ee
xp
0336.0!23
15
!22
15)23,22(
15231522
ee
xp
0133.0!25
15
!24
15)25,24(
15251524
ee
xp
0062.0!27
15
!26
15,...)26(
15271526
ee
xp
-
Julio Rito Vargas Pg. 8
Intervalo Oi P(x) Ei=50*p(x) C
0-7 1 0.0180 0.9001 0.0111
8-9 2 0.0519 2.5926 0.1354
10-11 4 0.1149 5.7449 0.5300
12-13 10 0.1785 8.9233 0.1299
14-15 11 0.2049 10.2436 0.0559
16-17 10 0.1808 9.0385 0.1023
18-19 6 0.1264 6.3180 0.0160
20-21 4 0.0717 3.5837 0.0483
22-23 1 0.0336 1.6821 0.2766
24-25 1 0.0133 0.6640 0.1700
26-- 0 0.0062 0.3092 0.3092
Los resultados nos Indican que no podemos rechazar la hiptesis de que la variable
aleatoria se comporta de acuerdo con una distribucin de Poisson, con una media de 15
automviles por hora.
0.3092
0)-(0.3092...
9001.0
1)-(0.9001)(11
1
222
i i
ii
E
OEc
307.18111,05.02 X 78481.1c
-
Julio Rito Vargas Pg. 9
Determinar con un nivel de confianza de 95%, que tipo de distribucin siguen los datos,
usar los estadsticos Chi-cuadrada. Use Stat::Fit.
0.488 0.116 0.731 0.094 0.684 0.093 0.368 0.090 0.761 0.420
0.995 0.908 0.183 0.146 0.633 0.567 0.058 0.507 0.780 0.139
0.088 0.382 0.707 0.413 0.581 0.254 0.440 0.447 0.251 0.870
0.149 0.427 0.743 0.434 0.260 0.738 0.300 0.302 0.314 0.423
0.731 0.313 0.908 0.845 0.937 0.607 0.025 0.787 0.608 0.078
0.591 0.781 0.850 0.048 0.580 0.346 0.723 0.245 0.535 0.610
0.745 0.005 0.256 0.845 0.445 0.777 0.896 0.513 0.335 0.194
0.307 0.692 0.905 0.046 0.128 0.766 0.366 0.302 0.302 0.833
0.084 0.080 0.160 0.028 0.714 0.454 0.913 0.666 0.213 0.373
0.967 0.280 0.333 0.531 0.285 0.504 0.837 0.681 0.209 0.626