Comparación entre modelos matemáticos con un evento real.

43
UNIVERSIDAD DE EL SALVADOR FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA ESCUELA DE MATEMÁTICA “COMPARACIÓN DEL EVENTO: FRECUENCIA CON LA QUE TRANSITAN LOS AUTOBUSES DE LA RUTA 44-M Y 44-T, EN INTERVALOS DE 15 MINUTOS, EN LA PARADA DE LA UNIVERSIDAD DE EL SALVADOR, FRENTE A ANDA, ENTRE LA 1:00 PM Y 2:00 PM; CON DISTINTOS MODELOS DE DISTRIBUCIONES DISCRETOS” DOCENTE: MSC. ROLANDO LEMUS GÓMEZ “PROYECTO DE INVESTIGACIÓN” DE LA ASIGNATURA ESTADÍSTICA II PRESENTADO POR: -GÓMEZ JUÁREZ CESAR OMAR GJ12001 -SOLA GUTIÉRRES VITELIO ALEXANDER SG12031 CIUDAD UNIVERSITARIA, OCTUBRE 2013 1

description

Es un una comparación de un evento real con modelos matemáticos realizados en la UES en la asignatura de Estadística II

Transcript of Comparación entre modelos matemáticos con un evento real.

UNIVERSIDAD DE EL SALVADORFACULTAD DE CIENCIAS NATURALES Y MATEMTICAESCUELA DE MATEMTICA

COMPARACIN DEL EVENTO: FRECUENCIA CON LA QUE TRANSITAN LOS AUTOBUSES DE LA RUTA 44-M Y 44-T, EN INTERVALOS DE 15 MINUTOS, EN LA PARADA DE LA UNIVERSIDAD DE EL SALVADOR, FRENTE A ANDA, ENTRE LA 1:00 PM Y 2:00 PM; CON DISTINTOS MODELOS DE DISTRIBUCIONES DISCRETOSDOCENTE:MSC. ROLANDO LEMUS GMEZ

PROYECTO DE INVESTIGACINDE LA ASIGNATURA ESTADSTICA II PRESENTADO POR:-GMEZ JUREZ CESAR OMARGJ12001-SOLA GUTIRRES VITELIO ALEXANDERSG12031

CIUDAD UNIVERSITARIA, OCTUBRE 2013

INDICECaptulo 1......3-15

1.1 Resumen del informe4

1.2 Introduccin..5-6

1.2.1 Descripcin del Trabajo5

1.2.2 Objetivos..6

1.3 Fundamentos.7-12

1.3.1 Distribucin de Poisson ..7-8

1.3.2 Distribucin Binomial.8-9

1.3.3 Distribucin Hipergeomtrica.9-11

1.3.4 Distribucin Binomial Negativa..11-12

1.4 Mtodo..13-15

Captulo 2......16-29

2.1 Comparacin de probabilidad emprica y terica..16-26

2.2 Conclusiones.27

2.3 Recomendaciones.28

2.4 Bibliografa..29

CAPTULO I

1.1 RESUMEN DEL INFORME

Introduccin: En el presente trabajo se realiz la comparacin de la probabilidad emprica y terica para el evento observado: Frecuencia con la que transitan los autobuses de la ruta 44-M y 44-T en la parada de la Universidad de El Salvador, frente a Anda, entre la 1:00 pm y 2:00 pm.

Objetivo: Comparar la probabilidad emprica y terica del evento: Frecuencia con la que transitan los autobuses de la ruta 44-M y 44-T, en intervalos de 15 minutos, en la parada de la Universidad de El Salvador, frente a Anda, entre la 1:00 pm y 2:00 pm; por medio de la realizacin de tablas de probabilidad y grficas puntuales, de las mismas; para asignar, si es posible, un modelo estadstico que permita describir, de la mejor manera, al evento.

Metodologa: Anotar el nmero de autobuses de la ruta 44-M y ruta 44-T, que transitan en dicha parada, en intervalos de quince minutos entre la 1:00 pm y 2:00 pm., este proceso se realizar en una semana especfica comenzando el lunes y terminando el viernes.

Conclusiones: La variable aleatoria x= nmero de autobuses de la ruta 44-M que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m. puede ser descrita por un modelo de distribucin Binomial.

1.2 INTRODUCCIN

1.2.1 DESCRIPCIN DEL TRABAJO

En el presente trabajo se realiz la comparacin, de la probabilidad emprica y terica, del evento observado: Frecuencia con la que transitan los autobuses de la ruta 44-M y 44-T, en intervalos de 15 minutos, en la parada de la Universidad de El Salvador, frente a Anda, entre la 1:00 pm y 2:00 pm, tomando como variables aleatorias las siguientes:a) X=nmero de autobuses de la ruta 44-M que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m.b) X=nmero de autobuses de la ruta 44-T que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m.La probabilidad terica se calcul utilizando las distribuciones de Poisson y Binomial e Hipergeomtrica, ya que se consider que el evento pudiera ser descrito por estos modelos estadsticos, tomando como base la teora planteada as como la forma en que se obtuvieron los datos.

1.2.2 OBJETIVOS

1.2.2.1 Objetivo General:

Comparar la probabilidad emprica y terica del evento: Frecuencia con la que transitan los autobuses de la ruta 44-M y 44-T, en intervalos de 15 minutos, en la parada de la Universidad de El Salvador, frente a Anda, entre la 1:00 pm y 2:00 pm; por medio de la realizacin de tablas de probabilidad y grficas puntuales, de las mismas; para asignar, si es posible, un modelo estadstico que permita describir, de la mejor manera, al evento.

1.2.2.2 Objetivos Especficos

1) Comparar la probabilidad emprica y terica para las variables aleatorias:a) X=nmero de autobuses de la ruta 44-M que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m.b) X=nmero de autobuses de la ruta 44-T que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m.

1.3 FUNDAMENTOS

1.3.1 DISTRIBUCIN DE POISSONEs unadistribucin de probabilidaddiscretaque expresa, a partir de una frecuencia de ocurrencia media, la probabilidad que ocurra un determinado nmero de eventos durante cierto periodo de tiempo.Fue descubierta porSimon-Denis Poisson, que la dio a conocer en1838en su trabajo Recherches sur la probabilit des jugements en matires criminelles et matire civile (Investigacin sobre la probabilidad de los juicios en materias criminales y civiles).La funcin de masa o densidad de la distribucin de Poisson es:

Dnde: kes el nmero de ocurrencias del evento o fenmeno (la funcin nos da la probabilidad de que el evento suceda precisamentekveces). es un parmetro positivo que representa el nmero de veces que se espera que ocurra el fenmeno durante un intervalo dado. ees la base de los logaritmos naturales (e = 2,71828...)

Tanto elvalor esperadocomo lavarianzade una variable aleatoria con distribucin de Poisson son iguales a .La distribucin de Poisson se aplica a varios fenmenos discretos de la naturaleza (esto es, aquellos fenmenos que ocurren 0, 1, 2, 3,... veces durante un periodo definido de tiempo o en un rea determinada) cuando la probabilidad de ocurrencia del fenmeno es constante en el tiempo o el espacio.1.3.2 DISTRIBUCIN BINOMIALEs unadistribucin de probabilidaddiscreta que mide el nmero de xitos en una secuencia denensayos deBernoulliindependientes entre s, con una probabilidad fijapde ocurrencia del xito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser dicotmico, esto es, slo son posibles dos resultados. A uno de estos se denomina xito y tiene una probabilidad de ocurrenciapy al otro, fracaso, con una probabilidadq= 1 -p. En la distribucin binomial el anterior experimento se repiten veces, de forma independiente, y se trata de calcular la probabilidad de un determinado nmero de xitos. Paran= 1, la binomial se convierte, de hecho, en unadistribucin de Bernoulli.El resultado de cada experimento ha de admitir slo dos categoras (a las que se denomina xito y fracaso).Para representar que unavariable aleatoriaXsigue una distribucin binomial de parmetrosnyp, se escribe:

Sufuncin de probabilidades

Donde Siendo (Lascombinacionesdeen(elementos tomados deen)Propiedades:La media: La varianza:

1.3.3 DISTRIBUCIN HIPERGEOMTRICA

En teora de la probabilidad la distribucin hipergeomtrica es una distribucin discreta relacionada con muestreos aleatorios y sin reemplazo.

Los experimentos que tienen este tipo de distribucin tienen las siguientes caractersticas:a) Al realizar un experimento con este tipo de distribucin, se esperan dos tipos de resultados.b) Las probabilidades asociadas a cada uno de los resultados no son constantes.c) Cada ensayo o repeticin del experimento no es independiente de los dems.d) El nmero de repeticiones del experimento (n) es constante.

Supngase que hay un lote relativamente pequeo que consiste en N artculos, de los cuales k tienen defectos. Si se muestrean dos de ellos en forma sucesiva, entonces el resultado de la segunda extraccin depende en gran medida de lo que haya sucedido en la primera, siempre que el primer objeto extrado no se regrese al lote. Se debe crear una nueva distribucin para manejar este caso en el que intervienen pruebas o ensayos dependientes.Supngase tambin que se extraen n artculos al azar y en forma sucesiva del lote, y que n se regresa ninguno de los artculos que se tomaron como muestra. A esto se le llama muestreo sin remplazo.Para determinar la probabilidad de que, de manera exacta, se seleccionen x artculos defectuosos y k-x del otro tipo, se proceder de la siguiente forma: el nmero de maneras distintas en que puede seleccionarse una muestra de n artculos de un total de N es ; y cada muestra tiene una probabilidad de seleccin igual a . De manera similar, la seleccin de x artculos defectuosos es un evento que puede ocurrir de maneras distintas, y la seleccin de n-x artculos del otro tipo es un evento que puede suceder de maneras. El nmero total de maneras en que ambos eventos pueden ocurrir es . De esta forma, la probabilidad de seleccionar x artculos defectuosos es:

Definicin: Sea N el nmero total de objetos en una poblacin finita, de manera tal que k de stos es de un tipo y N-k de otros. Si se selecciona una muestra aleatoria de la poblacin constituida por n objetos, la probabilidad de que x sea de un tipo exactamente y n-x sea del otro, est dada por la funcin de probabilidad hipergeomtrica:

1.3.4 DISTRIBUCIN BINOMIAL NEGATIVADe la distribucin de Pascal , obtenida a partir de un escenario binomial en que se observa una secuencia de ensayos independientes; la probabilidad de xito en cada ensayo es constante e igual a p,y en lugar de fijar el nmero de ensayos en n y observar el nmero de xitos, supngase que se continun los ensayos hasta que han ocurrido exactamente k xitos. Puede obtenerse la distribucin binomial negativa sustituyendo, n=x+k en la distribucin de Pascal, donde x es el valor de una variable aleatoria que representa el nmero de fracasos hasta que se observan, de manera exacta, k xitos. As pues x es una variable binomial negativa con funcin de probabilidad

Debe notarse que si k=1 en la distribucipon binomial negaitva, surge un caso especial de la distribucin binomial negativa, que se conoces con el nombre de distribucin geomtrica y cuya funcin de probabilidad est dada por La variable aleatoria geomtrica representa el nmero de fallas que ocurren antes de que se presente el primer xito.Observacin: La aplicacin primaria de la distribucin binomial negativa es una alternativa adecuada para el modelo de Poisson cuando la frecuencia de ocurrencia no es constante sobre el tiempo o el espacio. Tambin se emplea de manera frecuente para modelar las estadsticas de accidentes, datos psicolgicos, compras del consumidor y otras situaciones similares en donde la frecuencia de ocurrencia entre grupos o individuos no se espera que sea la misma.

1.4 METODOLOGA

1.4.1 INFORMACIN RELEVANTE DE LOS FUNDAMENTOS

Las distribuciones consideran los siguientes parmetros para describir su funcin de probabilidad:1. La distribucin de Poisson tiene como media E(x)=2. La distribucin Binomial considera la probabilidad de xito p en un ensayo y el nmero de ensayos n.3. La distribucin Hipergeomtrica considera el nmero total de elementos N; el nmero de elementos que se toma como muestra n y el nmero de elementos de un tipo (los que llevan a xito si son seleccionados) k.4. La distribucin Binomial Negativa, considera el nmero de xitos k y la probabilidad de xito p.

1.4.2 INSTRUMENTO DE RECOLECCIN DE DATOSDesde el da lunes 7 hasta el da 11 de octubre de 2013, se anot, en la parada que corresponde a la Universidad de El Salvador frente al edificio de Anda, las frecuencias de los autobuses de las rutas 44-M y 44-T en la siguiente tabla:Fecha:

Ruta:44-M44-T44-M44-T44-M44-T44-M44-T44-M44-T

INTERVALOS

pm[1:00-1:15)

[1:15-1:30)

[1:30-1:45)

[1:45-2:00)

1.4.3 DEFINICIN DE VARIABLES ALEATORIASSe toman en cuenta las siguientes variables aleatorias y sus correspondientes modelos comparados:xModelo comparado

nmero de autobuses de la ruta 44-M que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m.a) Poissonb) Binomialc) Hipergeomtrica

nmero de autobuses de la ruta 44-T que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m.

No se considera realizar una comparacin con la Distribucin Binomial Negativa ya que los datos se obtuvieron anotando, nicamente, la cantidad de autobuses que circulaban en periodos de 15 minutos; mas no, la cantidad de buses de un tipo hasta que apareciera el bus a considerarse como variable aleatoria.1.4.4 ESPACIO MUESTRALEl Espacio Muestral est conformado por: Los autobuses de la ruta 44-M y los autobuses de la ruta 44-T que transitan entre 1:00 p.m. y 2 p.m. en la parada de la Universidad de El Salvador, frente a Anda.

1.4.4 DESCRIPCIN DEL PROCESO DE COMPARACIN DEL EVENTO CON EL MODELO a) Los parmetros que cada modelo necesita se obtuvieron de acuerdo a las siguientes relaciones:1) Variable aleatoria de Poisson: =media emprica para la variable aleatoria x.2) Variable aleatoria Binomial: - p=k/K, K=nmero de autobuses de la ruta 44 contabilizados durante el tiempo de recoleccin de datos, en la semana y k=nmero de autobuses de la ruta 44 (M o T) contabilizados durante el tiempo de recoleccin de datos, en la semana.- n=promedio de autobuses de la ruta 44 que transitan en intervalos de 15 minutos3) Variable aleatoria Hipergeomtrica-N=promedio de autobuses de la ruta 44 que transitan en intervalos de 15 minutos.-k=promedio de autobuses de la ruta 44 (M o T) que transitan en intervalos de 15 minutos.

b) Para cada modelo se realiz una comparacin en tabla de las probabilidades empricas (frecuencias relativas) y la probabilidad terica de la distribucin en cuestin; as como tambin las probabilidades acumuladas respectivas. Adems se realiz la grfica correspondiente a la tabla y se realiz anlisis comparativos de datos: por su error y valores mximos.

CAPTULO II

2.1 COMPARACIN DE PROBABILIDADES EMPRICAS Y TERICAS.

2.1.1RESUMEN DE FRECUENCIAS OBTENIDASFRECUENCIAS OBSERVADASFecha:7-10-138-10-139-10-1310-10-1311-10-13

Ruta:44-M44-T44-M44-T44-M44-T44-M44-T44-M44-T

INTERVALOS

pm[1:00-1:15)||||||||||||||||||||||

[1:15-1:30)|||||||||||||||||||||||

[1:30-1:45)|||||||||||||

[1:45-2:00)||||||||||||||||||||||

RESUMEN DE FRECUENCIAS OBSERVADASNmero de autobuses por intervaloFrecuencia (44-M)Frecuencia (44-T)Frecuencia (44)

0211

1560

2821

35102

40110

5004

6002

RESUMEN DE FRECUENCIAS TOTALESRuta44-M44-T44

Total buses364480

2.1.2 DISTRIBUCIN DE POISSON2.1.2.1 Comparacin para la variable aleatoria x= nmero de autobuses de la ruta 44-M que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m.Frecuencia relativa f(xi)) para la variable aleatoria xxFrecuenciaf(xi)

020.1

150.25

280.4

350.25

total201

Parmetro =E(X)==1.8Comparacin de la probabilidad emprica y terica de la funcin de probabilidad de Poisson, y sus correspondientes acumulativasXf(xi)F(xi)Fp(xi) (Poisson)

00.10.10.16530.1653

10.250.350.29750.4628

20.40.750.26780.7306

30.2510.16070.8913

Comparacin grfica de la probabilidad emprica y terica de la funcin de probabilidad de Poisson.

Comparacin grfica de la probabilidad emprica y terica (acumuladas) de la distribucin de Poisson.

Anlisis: El error ms grande entre probabilidad terica y emprica se da para x=2 con error =0.4-0.2678=0.1322. Mientras que el error ms pequeo se da en x=1 con error=0.2975-.25=0.0475.Grficamente se observa que x alcanza su mximo en x=2 para la probabilidad emprica mientras que la distribucin de Poisson lo obtiene en x=1. En la distribucin acumulativa emprica se obtienen 1 para x=3 mientras que para este mismo valor se obtiene 0.8913 en la distribucin de Poisson, con una diferencia de 0.1087 con la probabilidad emprica para obtenerlo.Conclusin: La variable aleatoria x no se comporta como la distribucin de Poisson.

2.1.2.2 Comparacin para la variable aleatoria x=nmero de autobuses de la ruta 44-T que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m., entre los da Lunes y Viernes.

Frecuencia relativa (f(xi)) para la variable aleatoria xXfrecuenciaf(xi)

010.05

160.30

220.1

3100.5

410.05

total201

Parmetro =E(X)==2.2Comparacin de la probabilidad emprica y terica de la funcin de probabilidad de Poisson, y sus correspondientes acumulativas.Xf(xi)F(xi)Fp(xi)

00.050.050.11080.1108

10.300.350.24380.3546

20.10.450.26810.6227

30.50.950.19660.8193

40.0510.10810.9274

Comparacin grfica de la probabilidad emprica y terica de la funcin de probabilidad de Poisson. Comparacin grfica de la probabilidad emprica y terica (acumuladas) de la distribucin de Poisson.

Anlisis: El error ms grande entre probabilidad terica y emprica se da para x=3 con error =0.5-0.1966=0.3034. Mientras que el error ms pequeo se da en x=1 con error=0.3-.2438=0.0562.Grficamente se observa que para x alcanza su mximo en x=3 para la probabilidad emprica mientras que la distribucin de Poisson lo obtiene en x=2. Adems de observarse dos picos para la probabilidad emprica. En la distribucin acumulativa emprica se obtienen 1 para x=4 mientras que para este mismo valor se obtiene 0.9272 en la distribucin de Poisson con una diferencia de 0.0726 para obtenerlo. Adems de observarse dos picos para la distribucin Conclusin: La variable aleatoria x no se comporta como la distribucin de Poisson.

2.1.3 DISTRIBUCIN BINOMIAL2.1.3.1 Comparacin para la variable aleatoria x= nmero de autobuses de la ruta 44-M que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m.Parmetros:N: Frecuencia relativa (f(xi)) de autobuses de la ruta 44 (M y T)XiFrecuencia f(xi)

010.05

100

210.05

320.1

4100.5

540.2

620.1

total201.0

p:Para el valor p (probabilidad de xito) lo consideraremos como el cociente del nmero de autobuses de la ruta 44-M que transitan durante la semana en la hora antes dicha dividido por el nmero de autobuses de la ruta 44 que transitan durante la semana en la hora antes dicha.

As

Comparacin de la probabilidad emprica y terica de la funcin de probabilidad Binomial, y sus correspondientes acumulativas (F(xi))Xf(xi)F(xi)Fp(xi)

00.10.10.09150.0915

10.250.350.29950.391

20.40.750.36750.7585

30.2510.20050.959

4010.04101

Comparacin grfica de la probabilidad emprica y terica de la funcin de probabilidad de Binomial.

Comparacin grfica de la probabilidad emprica y terica (acumuladas) de la distribucin Binomial.

Anlisis: El error ms grande entre probabilidad terica y emprica se da para x=1 y x=3 con error =0.495. Mientras que el error ms pequeo se da en x=0 con error=0.0085.Grficamente se observa que x alcanza su mximo en x=2 para la probabilidad emprica y tambin para la distribucin binomial. En la distribucin acumulativa emprica se obtienen 1 para x=3 mientras que en la distribucin binomial se obtiene 1 en x=4, observndose para x=3 el valor de 0.959, es decir una diferencia de 0.041 respecto a la probabilidad geomtrica.Conclusin: La variable aleatoria x puede ser descrita por la variable aleatoria binomial.

2.1.4 DISTRIBUCIN HIPERGEOMTRICA2.1.4.1 Comparacin para la variable aleatoria x=nmero de autobuses de la ruta 44-T que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m., entre los da Lunes y Viernes.

Parmetros:N: FRECUENCIA RELATIVA DE AUTOBUSES DE LA RUTA 44 (M y T)XiFrecuenciaF. Relativa f(Xi)

010.05

100

210.05

320.1

4100.5

540.2

620.1

total201.0

As el promedioEntonces N=4

n y k:Frecuencia relativa (f(xi)) de autobuses de la ruta 44-TXFrecuenciaFrecuencia Relativa

010.05

160.30

220.1

3100.5

410.05

total201

Media (emprica)=kk=k=2.2k aproximadamente = 2k=2 y N-k=2, as el n que puede tomarse es 2.

Comparacin de la probabilidad emprica y terica de la funcin de probabilidad Binomial, y sus correspondientes acumulativas (F(xi))Xf(xi)F(xi)P(X=x)F(xi)

00.050.050.16670.1667

10.300.350.66670.8333

20.10.450.16671

30.50.9501

40.05101

Comparacin grfica de la probabilidad emprica y terica de la funcin de probabilidad de Hipergeomtrica.

Anlisis: El error ms grande entre probabilidad terica y emprica se da para x=3, que es de 0.5. Y el valor mnimo de error se da para x=4, que es de 0.05. Para la distribucin acumulativa, la probabilidad de 1 se alcanza en x=4, para la probabilidad hipergeomtrica se alcanza en x=2.Conclusin: la variable aleatoria x no puede ser descrita por un modelo de distribucin hipergeomtrico.

2.2 CONCLUSIONES1) La variable aleatoria x= nmero de autobuses de la ruta 44-M que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m. puede ser no puede ser descrita por el modelo de distribucin de Poisson2) La variable aleatoria x=nmero de autobuses de la ruta 44-T que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m., entre los da Lunes y Viernes no puede ser descrita por el modelo de distribucin de Poisson.

3) La variable aleatoria x= nmero de autobuses de la ruta 44-M que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m. puede ser descrita por un modelo de distribucin Binomial.

4) La variable aleatoria x=nmero de autobuses de la ruta 44-T que transitan en intervalos de 15 minutos entre la 1:00 y 2:00 p.m., entre los da Lunes y Viernes no puede ser descrita por un modelo de distribucin hipergeomtrico.

2.3 RECOMENDACIONES1) Para realizar una comparacin con un modelo de distribucin Binomial Negativo, es necesario, en la contabilizacin de las frecuencias, el orden en que aparecen los dos tipos de autobuses (para el caso que aqu se trat).

2.4 BIBLIOGRAFA1) Probabilidad y Estadstica para Ingeniera, Richar L. Scheaffer, James T. Mc Clave. Grupo Editorial Iberoamrica. 2) Probabilidad y Estadstica, Aplicaciones y Mtodos, George Canavos 1988, Mc Graw Hill.3)http://www.itch.edu.mx/academic/industrial/sabaticorita/_private/03Ddistr%20Hipergeometrica.htm4) es.wikipedia.org/wiki/Distribucin_Binomial5) es.wikipedia.org/wiki/Distribucin_Poisson1