Estadística Inferencial -...

19
Estadística Inferencial

Transcript of Estadística Inferencial -...

Estadística Inferencial

ESTADÍSTICA INFERENCIAL

1

Sesión No. 4

Nombre: Distribuciones de probabilidad para variables. Parte II. Objetivos: Al finalizar la sesión, el estudiante conocerá y calculará las

probabilidades de una distribución de Poisson. Así mismo aplicará con una

herramienta computacional las distribuciones: binomial, hipergeométrica y de

Poisson.

Contextualización

Para analizar problemas de líneas de espera, confiabilidad y control de calidad

como el número de personas que llegan a un lugar determinado en un tiempo

definido, existe una distribución de probabilidades llamada distribución de

Poisson que es utilizada en estos casos. Esta distribución, al igual que la

binomial y la hipergeométrica es una distribución para variables aleatorias

discretas que te será de gran utilidad en el campo laboral.

En la actualidad, el software estadístico ha hecho posible aplicar la estadística

sin tener necesidad de realizar laboriosos cálculos, requiriendo sólo segundos de

procesamiento computacional. Además, existe una gran cantidad de personas

que emplean los métodos de la estadística en casi todas las áreas del

conocimiento y las profesiones.

ESTADÍSTICA INFERENCIAL

2

Introducción al Tema

¿Cómo describir el número de veces que un evento ocurre en un espacio finito de observaciones?

Imagen recuperada de: lowres.cartoonstock.com

En esta sesión conocerás las características básicas de la distribución de

Poisson, desarrollada por Siméon-Denis Poisson (1781-1840). Esta distribución

de probabilidad es un buen modelo para datos que representa el número de

sucesos de un evento determinado en una unidad definida de tiempo o espacio.

Por otro lado, dentro del subtema aplicaciones de cómputo se incluye el uso de

la hoja electrónica Excel 2016, que te permitirá obtener resultados de manera

rápida y certera de problemas relacionados con las distribuciones de

probabilidad de variables discretas, logrando un gran beneficio que se refleja en

una toma de decisiones más adecuada.

ESTADÍSTICA INFERENCIAL

3

Explicación

2.4 Distribución de Poisson

¿Qué es la distribución de Poisson y en qué situaciones se emplea?

La distribución de probabilidad de Poisson describe el número de veces que se

presenta un evento durante un intervalo específico. El intervalo puede ser de

tiempo, distancia, área o volumen (Lind, Marchal, & Wathen, 2012). Esta

distribución nos permite analizar problemas como el número de personas que

llegan a un lugar determinado en un tiempo definido, el número de bacterias en

un cultivo, la cantidad de vehículos que transitan por una autopista, el número de

bloqueos viales por manifestaciones al día en la ciudad de México, el número de

solicitudes de pacientes que requieren atención médica en un hospital, etc.

La distribución de Poisson es aplicable si se cumplen los siguientes supuestos:

Generalmente, la letra 𝑋 representa a esta variable aleatoria discreta y puede

tomar valores enteros (0, 1, 2, 3,…). Se utiliza la letra minúscula 𝑥 para señalar

un valor específico que dicha variable puede tomar. La probabilidad de tener

exactamente 𝑥 ocurrencias en una distribución de Poisson matemáticamente se

describe así:

𝑷(𝑿 = 𝒙) =𝝀𝒙𝒆−𝝀

𝒙!

1. La variable aleatoria es el número de veces que ocurre un evento durante

un intervalo definido.

2. La probabilidad de que ocurra un evento es proporcional al tamaño del

intervalo.

3. Los eventos ocurren al azar y son independientes unos de otros.

ESTADÍSTICA INFERENCIAL

4

Donde:

𝝀: 𝑒𝑒 𝑙𝑙 𝑚𝑒𝑚𝑚𝑙 𝑚𝑒 𝑙𝑙 𝑐𝑙𝑐𝑐𝑚𝑚𝑙𝑚 𝑚𝑒 𝑣𝑒𝑐𝑒𝑒 (é𝑥𝑚𝑐𝑥𝑒)𝑞𝑞𝑒 𝑒𝑒 𝑝𝑝𝑒𝑒𝑒𝑐𝑐𝑙 𝑞𝑐 𝑒𝑣𝑒𝑐𝑐𝑥 𝑒𝑐 𝑞𝑐 𝑚𝑐𝑐𝑒𝑝𝑣𝑙𝑙𝑥

𝑝𝑙𝑝𝑐𝑚𝑐𝑞𝑙𝑙𝑝

𝒆: 𝑒𝑒 𝑙𝑙 𝑐𝑥𝑐𝑒𝑐𝑙𝑐𝑐𝑒 2.71828 (𝑏𝑙𝑒𝑒 𝑚𝑒𝑙 𝑒𝑚𝑒𝑐𝑒𝑚𝑙 𝑚𝑒 𝑙𝑥𝑙𝑙𝑝𝑚𝑐𝑚𝑥𝑒 𝑐𝑒𝑝𝑒𝑝𝑚𝑙𝑐𝑥𝑒)

𝒙: 𝑒𝑒 𝑒𝑙 𝑐ú𝑚𝑒𝑝𝑥 𝑚𝑒 𝑣𝑒𝑐𝑒𝑒 𝑞𝑞𝑒 𝑒𝑒 𝑝𝑝𝑒𝑒𝑒𝑐𝑐𝑙 𝑞𝑐 𝑒𝑣𝑒𝑐𝑐𝑥

𝑷(𝑿): 𝑒𝑒 𝑙𝑙 𝑝𝑝𝑥𝑏𝑙𝑏𝑚𝑙𝑚𝑚𝑙𝑚 𝑚𝑒 𝑞𝑐 𝑣𝑙𝑙𝑥𝑝 𝑒𝑒𝑝𝑒𝑐í𝑓𝑚𝑐𝑥 𝑚𝑒 𝑥

La media y la varianza de la distribución de Poisson son iguales y se calculan

simplemente como:

𝑽𝑽𝑽𝑽𝑽 𝒆𝒆𝒆𝒆𝑽𝑽𝒆𝑽 = 𝝀 𝑽𝑽𝑽𝑽𝑽𝑽𝑽𝑽 = 𝝀

Ahora veamos un ejemplo. Se sabe que en

promedio se reciben 2 clientes en un centro

comercial durante un minuto cualquiera. Si

se supone una distribución de Poisson.

Calcular la probabilidad de que en un minuto

dado:

a. Ningún cliente ingrese al centro comercial.

b. Se reciban más de dos clientes.

Solución:

Sea 𝑋 el número de clientes por minuto, y suponiendo que 𝑋 tiene distribución

de Poisson con 𝜆 = 2.

Para el inciso a) se tiene que

𝑃(𝑋 = 0) =20𝑒−2

0!= 0.1353

Fuente: america-retail.com

ESTADÍSTICA INFERENCIAL

5

La probabilidad de que ningún cliente ingrese al centro comercial en un minuto

dado es de 13.5%.

Para el inciso b)

𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)]

𝑃(𝑋 > 2) = 1 − �20𝑒−2

0!+

21𝑒−2

1!+

22𝑒−2

2!� = 1 − 𝑒−2 �

20

0!+

21

1!+

22

2!� = 0.3233

En este caso la probabilidad de que ingresen al centro comercial más de 2

clientes por minuto es de 32.3%.

Alternativamente, se pueden usar las tablas acumulativas de Poisson. Todo lo

que necesitas saber son los valores de 𝑥 y de 𝜆 en este ejemplo para el inciso a)

𝑥 = 0 y 𝜆 = 2 se tiene el valor de 𝑃(𝑋 = 0) en la intersección, el cual es 𝑃(𝑋 =

0) = 0.1353.

ESTADÍSTICA INFERENCIAL

6

Para el inciso b)

𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2) = 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)]

De la tabla se obtiene

𝑃(𝑋 = 0) = 0.1353

𝑃(𝑋 = 1) = 0.2707

𝑃(𝑋 = 2) = 0.2070

Entonces

𝑃(𝑋 > 2) = 1 − (0.1353 + 0.2707 + 0.2707) = 0.3233

2.5 Aplicaciones de cómputo

¿Qué herramientas de cómputo conoces para calcular probabilidades de las distribuciones binomial, hipergeométrica y de Poisson?

Imagen recuperada de: negociosyemprendimiento.org

En la actualidad existen muchos y variados paquetes estadísticos en el mercado

como SPSS, Minitab, Statgraphics y Excel, entre otros. Ya que Excel es un

software al que pueden acceder todos y se presta a múltiples aplicaciones

estadísticas, vamos a ver cómo calcular las probabilidades de las distribuciones

binomial, hipergeométrica y de Poisson con esta hoja de cálculo.

ESTADÍSTICA INFERENCIAL

7

La función de Excel para calcular probabilidades binomiales es DISTR.BINOM.N.

Esta función tiene cuatro argumentos:

1. Núm_éxito: Número de éxitos en los ensayos (𝒙)

2. Ensayos: Número de ensayos independientes (𝑽)

3. Prob_éxito: Probabilidad de éxito en cada ensayo (𝒆)

4. Acumulado: Valor lógico que determina la forma de la función. Se

emplea FALSO si se quiere la probabilidad de 𝑥 éxitos y VERDADERO si

se desea la probabilidad acumulada de 𝑥 o menos éxitos.

A continuación, se muestra cómo calcular la probabilidad de que 6 elementos

defectuosos se encuentren en una muestra de 10 elementos si la probabilidad

de un elemento defectuoso es 0.5.

Se puede observar que el número de elementos defectuosos (𝑥 ) sigue una

distribución binomial con 𝑐 = 10 y 𝑝 = 0.5.

En la siguiente imagen se observa como seleccionar en la hoja de cálculo la

función de Excel para calcular probabilidades binomiales DISTR.BINOM.N.

Puedes identificar previamente si lo deseas en las celdas A1, A2 y A3 a los

elementos de la función ( 𝑥, 𝑐,𝑝) y en las celdas B1, B2 y B3 sus respectivos

valores. En la celda A4 identificas la probabilidad deseada y seleccionas la celda

B4.

ESTADÍSTICA INFERENCIAL

8

Posteriormente ingresamos en el cuadro de dialogo los valores de cada

argumento, en este caso el acumulado será FALSO, y en automático obtienes

en la parte inferior de los argumentos el resultado: 0.255078125.

Al dar Aceptar se registra en la celda B4 seleccionada, que corresponde a la

probabilidad de que exactamente 6 elementos se encuentren defectuosos de 10

ensayos correctos.

Si quisiéramos calcular la probabilidad de que 6 o menos elementos defectuosos

(𝑥 ≤ 6) se encuentren en una muestra de 10 elementos, si la probabilidad de un

elemento defectuoso es 0.5. De igual forma ingresamos en el cuadro de dialogo

los valores de cada argumento, en este caso el acumulado será VERDADERO, y

se obtendrá el valor de 𝑃(𝑥 ≤ 6) = 0.828125, como se muestra en la imagen.

ESTADÍSTICA INFERENCIAL

9

Para el caso de la distribución hipergeométrica se procede de manera similar.

La función de Excel para calcular la probabilidad hipergeométrica es la

DISTR.HIPERGEOM.N. La cual tiene los siguientes argumentos:

1. Muestra_éxito: Número de éxitos en los ensayos (𝒙)

2. Núm_de_muestra: Número de ensayos (𝑽)

3. Población_éxito: Número de éxitos en la población (𝑽)

4. Núm_de_población: Número de elementos de la población (𝑵)

5. Acumulado. Un valor lógico que determina la forma de la función. Se

emplea FALSO si se quiere la probabilidad de 𝑥 éxitos y VERDADERO si

se desea la probabilidad acumulada de 𝑥 o menos éxitos.

Retomando el ejemplo de la sesión anterior se ilustra el cálculo con Excel de

esta distribución. De 50 carteles para un congreso, 12 no cumplen con los

requisitos establecidos. Si se seleccionan aleatoriamente diez carteles para

ESTADÍSTICA INFERENCIAL

10

revisarlos, ¿cuál es la probabilidad de que exactamente tres de los diez no

cumpla los requisitos?

Tenemos que:

𝑥 = 3 𝑐 = 10 𝑝 = 12 𝑁 = 50

Ingresamos en el cuadro de dialogo los valores de cada argumento, en este

caso el acumulado será FALSO, y en automático obtienes el valor de la

probabilidad de que exactamente tres de los diez no cumpla los requisitos es de

0.270286325.

Ahora vamos a ver que la función de Excel para calcular la probabilidad de

Poisson es POISSON.DIST. La cual tiene los siguientes argumentos:

1. X: El número de eventos (𝒙)

ESTADÍSTICA INFERENCIAL

11

2. Media: Número promedio de veces que ocurre un evento en cierto tiempo

o espacio (𝝀)

3. Acumulado: Un valor lógico que determina la forma de la función. Se

emplea FALSO si se quiere la probabilidad de 𝑥 éxitos y VERDADERO si

se desea la probabilidad acumulada de 𝑥 comprendido entre 0 y 𝑥 ambos

incluidos.

Por ejemplo, la cantidad de llamadas telefónicas que se reciben en una cierta

oficina en una hora es 5 en promedio. Suponiendo que es una variable con

distribución de Poisson, determina la probabilidad de que en cualquier hora se

reciban no más de 3 llamadas.

Después de introducir los argumentos en el cuadro de diálogo se obtiene la

probabilidad 𝑃(𝑥 ≤ 3) = 0.265025915.

¿Cómo calcularías la probabilidad de que en dos horas cualesquiera se recibieran no más de 2 llamadas telefónicas?

ESTADÍSTICA INFERENCIAL

12

Conclusión

En esta sesión pudiste ver que la distribución de Poisson, llamada así en honor a

Simeón-Denis Poisson, es una distribución de probabilidad discreta que expresa

a partir de una tasa de ocurrencia media, la probabilidad de que ocurra un

determinado número de eventos durante un intervalo de tiempo o de espacio.

Existen diferentes paquetes de software para estadística que evitan tediosos

cálculos y permiten concentrarse en el análisis de datos. En este caso hemos

visto que la hoja de cálculo de Excel nos permite calcular las probabilidades de

las distribuciones binomial, hipergeométrica y de Poisson de manera sencilla y

certera.

¿Cómo se calculan las distribuciones de probabilidad de las variables continuas?

ESTADÍSTICA INFERENCIAL

13

Para aprender más

Cuando cae un avión, ¿a los pocos días cae otro?

¿No tiene usted la sensación de que cuando ocurre un accidente de avión, a los pocos días hay otro? En

julio del año pasado tres aviones de pasajeros cayeron en ochos días. En total murieron 462 personas.

Harro Ranter, director de la Red de Seguridad en Aviación -que cataloga los accidentes aéreos-, dijo al

diario El Mundo que no es raro que se den estas seguidillas de siniestros. Analizó los accidentes desde

1990 en aviones con capacidad para más de 14 pasajeros.

El experto encontró 45 fechas en las que hubo dos o más accidentes (salvo colisiones). Y en 105 casos

hubo siniestros en días consecutivos. Uno hoy y otro mañana. Ciento cincuenta veces se dio eso en los

últimos 25 años.

Ranter dijo que "es más común que ocurra un accidente un día después de otro que dos, tres o más días

más tarde".

Arnold Barnett, profesor de Estadística en el Instituto de Tecnología de Massachusetts dijo a la BBC que

esto es "una coincidencia, excepto por la tecnicalidad de que las condiciones meteorológicas adversas que

involucran tormentas y huracanes son más comunes en unas estaciones que en otras".

El número máximo más probable de accidentes de aviones comerciales con más de 18 pasajeros en un

período de ocho días en 10 años es de 3, dijo Barnett aunque basándose en la teoría de la distribución del

matemático y físico Poisson, no descarta que sea más probable que haya intervalos cortos entre los

accidentes que largos.

"Si ocurriera un (accidente) el 1º de agosto, la probabilidad de que el próximo suceda un día después -el 2

de agosto- es 1/365. Pero el chance de que haya un accidente aéreo el 3 de agosto es (364/365) x (1/365),

pues el próximo accidente ocurrirá el 3 de agosto sólo si no hay uno el 2 de agosto", añadió.

El académico calculó que en los países desarrollados la posibilidad de morir en un accidente aéreo es

alrededor de una en 25 millones por vuelo. "Un niño en un aeropuerto británico tiene más probabilidad de

llegar a ser primer ministro, ganar una medalla de oro olímpica o recibir el premio Nobel de física que de

morirse en el avión en el que se va a montar".

Hasta en los países menos desarrollados, la probabilidad de morir en un vuelo es alrededor de una en

750.000, dijo la nota de El Mundo.

Fuente: Cuando cae un avión, ¿a los pocos días cae otro? (24 de marzo de 2015). El Observador.

Obtenido de http://www.elobservador.com.uy/cuando-cae-un-avion-a-los-pocos-dias-cae-otro-n301131

ESTADÍSTICA INFERENCIAL

14

¿Cómo calcular probabilidades binomiales con Minitab?

• Leandro, G. (24 de agosto de 2013). Uso de Minitab: distribución binomial.

[Archivo de video] Recuperado de:

https://www.youtube.com/watch?v=mIdpCn5pHkI

ESTADÍSTICA INFERENCIAL

15

Actividad de Aprendizaje

Instrucciones:

Con la finalidad de profundizar en los conocimientos adquiridos a lo largo de esta

sesión, ahora tendrás que realizar la siguiente actividad:

Resuelve los siguientes problemas empleando ya sea la hoja de cálculo de Excel

o algún otro software de estadística al cual tengas acceso.

1. En una cierta estación de radio llegan 48 llamadas por hora de la audiencia.

a) Calcula la probabilidad de recibir exactamente 10 llamadas telefónicas en

un lapso de 5 minutos.

b) Estima la probabilidad de recibir exactamente 10 llamadas en un lapso de

15 minutos.

2. Los pasajeros de las aerolíneas llegan en forma aleatoria e

independientemente al mostrador de revisión de pasajeros. La tasa promedio

de llegadas es 10 pasajeros por minuto.

a) Calcula la probabilidad de que no llegue ningún pasajero en un lapso de

un minuto.

b) Calcula la probabilidad de que lleguen 3 o menos pasajeros en un lapso

de un minuto.

c) De que no llegue ningún pasajero en un lapso de 15 segundos.

3. Un supervisor en una fábrica procede de acuerdo a una norma de control de

calidad, la cual consiste en elegir al azar 20 productos al azar diariamente y

determinar el número de unidades defectuosas. Si existen dos o más

productos defectuosos la producción se detiene para inspeccionarlos equipos.

Si la probabilidad de que un producto salga defectuoso es del 5%. ¿Cuál será

la probabilidad de que en cualquier día la producción se detenga para aplicar

la norma de control de calidad?

ESTADÍSTICA INFERENCIAL

16

4. El departamento de sistemas de computación hace planes para contratar

este año a 5 ingenieros. Cuenta con 12 candidatos que han salidos bien

evaluados, de los cuales 4 son hombres y 8 mujeres. ¿Cuál es la

probabilidad de que 3 de los 5 contratados sean mujeres?

Inserta las capturas de pantalla en un procesador de textos y analiza los

resultados obtenidos, al final tendrás que guardarlo en formato PDF, y entregarlo

de acuerdo a las indicaciones de tu profesor.

Recuerda que esta actividad te ayudará a familiarizarte con el software

estadístico para el cálculo de probabilidades de las distribuciones binomial,

hipergeométrica y de Poisson.

Esta actividad representa el 5% de tu calificación y se tomará en cuenta lo

siguiente:

• Tus datos generales.

• Título del ejercicio.

• Ejercicios resueltos de forma correcta y completa con su respectiva

captura de pantalla.

• Ortografía y redacción.

• Análisis y conclusiones.

ESTADÍSTICA INFERENCIAL

17

Bibliografía

• Alvarado Verdín, V. M. (2014). Probabilidad y estadística. México: Patria.

• Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadística

para administración y economía (10 ed.). México: Cengage Learning.

• Anderson, D. R., Sweeney, D. J., Williams, T. A., & Martin, K. (2011).

Métodos cuantitativos para los negocios (11 ed.). México: Cengage

Learning.

• Berenson, M. L., & Levine, D. M. (1996). Estadística básica en

administración. Conceptos y aplicaciones. México: Pearson Educación.

• Devore, J. L. (2008). Probabilidad y estadística para ingeniería y ciencias

(8 ed.). México: Cengage Learning.

• González, M. M. T., & Pérez de Vargas, A. (2012). Estadística aplicada.

Una visión instrumental. España: Díaz de Santos.

• Guerrero Peña, A., Buitrago Cardona, M. V., & Curieses Paulete, M. A.

(2007). Estadística básica. Medellín: ITM.

• Levin, R. I., & Rubin, D. S. (2004). Estadística para administración y

economía (7 ed.). México: Pearson Educación.

• Lind, D. A., Marchal, W. G., & Wathen, S. A. (2012). Estadística aplicada a

los negocios y economía (15 ed.). México: McGraw-Hill.

• Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2015). Introducción a la

probabilidad y estadística (14 ed.). México: Cengage Learning.

• Render, B., Stair, R. M., & Hanna, M. E. (2012). Métodos cuantitativos

para los negocios (11 ed.). México: Pearson Educación.

ESTADÍSTICA INFERENCIAL

18

• Rodríguez Franco, J., Pierdant Rodríguez, A., & Rodríguez Jiménez, E. C.

(2014). Estadística para administración. México: Grupo Editorial Patria.

• Valentin, H. (2015). Excel 2016: paso a paso. Estados Unidos: Dream

Berry.

Cibergrafía

• Cuando cae un avión, ¿a los pocos días cae otro? (24 de marzo de 2015).

El Observador. Recuperado de:

http://www.elobservador.com.uy/cuando-cae-un-avion-a-los-pocos-dias-

cae-otro-n301131

• Leandro, G. (24 de agosto de 2013). Uso de Minitab: distribución binomial.

[Archivo de video] Recuperado de:

https://www.youtube.com/watch?v=mIdpCn5pHkI

Te invito a que consultes la Biblioteca Digital UNID