Estadística Inferencial -...

19
Estadística Inferencial

Transcript of Estadística Inferencial -...

Estadística Inferencial

ESTADÍSTICA INFERENCIAL

1

Sesión No. 6

Nombre: Distribuciones de probabilidad para variables aleatorias. Parte II. Objetivos: Al finalizar la sesión, el estudiante conocerá cómo utilizar la

distribución normal para aproximar la distribución de probabilidad de Poisson.

Así mismo conocerá las características y cómo calcular las probabilidades

mediante la distribución exponencial. Conocerá además cómo identificar, aplicar

e implementar con una herramienta computacional algunas de las distribuciones

de variables aleatorias continuas.

Contextualización

Al igual que la distribución binomial, existe otra distribución de probabilidad

discreta que puede ser aproximada a la distribución normal que es continua, tal

es el caso de la distribución de Poisson.

La distribución normal forma la base sobre la cual descansa una gran cantidad

del trabajo en la inferencia estadística, pero existen también numerosas

situaciones que requieren de otros tipos de funciones de densidad de

probabilidad, una de estas funciones es la distribución exponencial que

proporciona modelos de probabilidad muy utilizados en diferentes disciplinas.

ESTADÍSTICA INFERENCIAL

2

Introducción al Tema

¿Qué distribución de probabilidad emplearías para describir el tiempo de espera de los clientes en un banco para ser atendidos?

Imagen recuperada de: counterest.net

En esta sesión, revisarás en primer lugar la aproximación normal de

probabilidades de Poisson. A continuación, se expone otra de las distribuciones

continuas, la distribución exponencial, que es utilizada en problemas donde nos

interesa la probabilidad de falla de algún componente, así como la ocurrencia de

eventos aleatorios en el tiempo.

Además, en el subtema de aplicaciones de cómputo, continuaremos utilizando la

hoja de cálculo Excel 2016, que también nos permite calcular las probabilidades

de distribuciones continuas.

ESTADÍSTICA INFERENCIAL

3

Explicación

3.4 Aproximación normal de probabilidades de Poisson

¿Cuándo una distribución de Poisson se aproxima a la distribución normal?

Dado que la distribución de Poisson es aproximadamente un caso particular de

la distribución binomial, y que esta se aproxima a la distribución normal en

ciertas condiciones, a la distribución de Poisson le sucederá otro tanto. La

siguiente imagen muestra como la distribución de Poisson se aproxima a la

distribución normal conforme aumenta el valor de 𝜆.

Una distribución de Poisson con parámetro 𝜆 suficientemente grande, es decir

𝜆 > 10 se aproxima a una distribución normal; y la distribución normal a la que

se aproxima habrá de tener la misma media y varianza que la distribución de

Poisson de la que proviene.

Si 𝑥 → 𝑃(𝜆) con 𝜆 > 10 ⇒ 𝑥 → 𝑁(𝜆, 𝜆)

Dado que una distribución de Poisson es discreta, la corrección por continuidad

puede, en principio, aplicarse cuando se utiliza la aproximación normal. Para las

áreas que incluyen la parte central de la curva, la corrección por continuidad

generalmente mejora la aproximación normal, pero para las áreas de las colas la

corrección por continuidad algunas veces empeora la aproximación (Navidi,

2006).

Ejemplo:

ESTADÍSTICA INFERENCIAL

4

El número de cuentahabientes que acuden a una sucursal bancaria sigue una

distribución de Poisson, con una media de 25 cuentahabientes por hora.

Encuentra la probabilidad de que haya 90 o más cuentahabientes durante tres

horas.

Solución:

Sea 𝑋 el número de cuentahabientes que acuden a una sucursal bancaria en

tres horas. La media del número de cuentahabientes es de 75, por lo que

𝑋~𝑃𝑃𝑃𝑃𝑃𝑃𝑃(75)

Empleando la aproximación normal 𝑋~𝑁(75, 75). Se desea encontrar 𝑃(𝑋 ≥ 90).

Se calcula 𝑧 de 90, que es

𝑧 =90 − 75√75

= 1.73

Haciendo uso de la tabla 𝑧 se determina que

𝑃(𝑋 ≥ 90) = 1 − 0.9582 = 0.0418

Como lo puedes observar en la siguiente imagen

Por lo tanto, la probabilidad de que haya 90 o más cuentahabientes durante tres

horas es de 4.18%.

ESTADÍSTICA INFERENCIAL

5

3.5 Distribución exponencial de probabilidad

¿En qué situaciones los modelos exponenciales pueden ser empleados?

El origen de esta función de probabilidad se halla en el proceso de Poisson; tal

probabilidad se relaciona con la posibilidad de ocurrencia de un número

específico de éxitos, donde este número es la variable aleatoria. Ahora bien, si

se invierten los papeles, el número de éxitos no será la variable aleatoria, sino el

tiempo; en otras palabras, una variable exponencial 𝑋, es el intervalo de tiempo,

o espacio requerido, para obtener un número específico de éxitos (Elorza Pérez-

Tejada, 2008).

La función de densidad de probabilidad exponencial está dada por (Anderson,

Sweeney, & Williams, Estadística para administración y economía, 2008):

𝑓(𝑥) =1𝜇𝑒−𝑥𝜇

Para 𝑥 ≥ 0, 𝜇 > 0

Donde 𝜇 = valor esperado o media

Como ocurre con cualquier distribución de probabilidad continua, el área bajo la

curva correspondiendo a un intervalo da la probabilidad de que la variable

aleatoria tome algún valor en ese intervalo.

ESTADÍSTICA INFERENCIAL

6

Para calcular probabilidades exponenciales se usa la siguiente fórmula, la cual

aporta la probabilidad acumulada de obtener un valor de la variable aleatoria

exponencial que sean menor o igual que algún valor específico denotado por 𝑥0

(Anderson, Sweeney, & Williams, Estadística para administración y economía,

2008).

𝑃(𝑥 ≤ 𝑥0) = 1 − 𝑒−𝑥0 𝜇⁄

La distribución exponencial tiene la propiedad de que la media y la desviación

estándar son iguales.

Ejemplo:

La vida de cierta marca de baterías está distribuida exponencialmente con

𝜇 = 1 000 horas.

a. ¿Cuál es la probabilidad de que la batería dure menos de 1 000 horas?

𝑃(𝑥 < 1000) = 1 − 𝑒−𝑥0 𝜇⁄ = 1 − 𝑒−(1000 1000⁄ ) = 1 − 𝑒−1

𝑃(𝑥 < 1000) = 0.63212

b. ¿Cuál es la probabilidad de que la batería dure más de 1 500 horas?

𝑃(𝑥 > 1500) = 1 − 𝑃(𝑥 ≤ 1500) = 1 − �1 − 𝑒−(1500 1000⁄ )� = 𝑒−1.5

ESTADÍSTICA INFERENCIAL

7

𝑃(𝑥 > 1500) = 0.223

Otra propiedad de la distribución exponencial es la carencia de memoria, es

decir es una que se olvida del pasado. Para intentar explicar esta propiedad,

supongamos que 𝑋 representa el tiempo de vida de un fusible. La probabilidad

de que el fusible no se queme en las primeras 𝑃 + 𝑡 unidades de tiempo,

habiéndose comprobado que no se había quemado en las primeras 𝑃 unidades

de tiempo es igual a la probabilidad de que el fusible no se queme en las

primeras 𝑡 unidades de tiempo. Dicho de otra manera, la probabilidad de que no

se queme en las próximas 𝑡 unidades de tiempo es la misma que la probabilidad

de que no se queme durante las primeras 𝑡 unidades de tiempo. El hecho de no

haberse quemado en las primeras 𝑃 unidades de tiempo, simplemente no cuenta

(Condor Espinoza, 1989).

3.6 Aplicaciones de cómputo

Si un programa es inútil habrá que demostrarlo

“Cuarta ley de la Programación”

La función de Excel para calcular probabilidades de una distribución normal con

media y desviación estándar especificadas es DISTR.NORM.N. Esta función

tiene los siguientes argumentos:

1. X: Es el valor cuya distribución se desea obtener (𝑥𝑖 = 𝑎)

2. Media: Es la media aritmética de la distribución (𝜇)

3. Desv_estándar: Es la desviación estándar de la distribución (𝜎)

4. Acumulado: Valor lógico que determina la forma de la función. Si el

argumento es VERDADERO, devuelve la función de distribución

acumulada. Si es FALSO, devuelve la función de masa de probabilidad.

ESTADÍSTICA INFERENCIAL

8

Por ejemplo, la duración de una batería en horas que fabrica una empresa se

describe mediante una distribución normal con media 𝜇 = 36 500 y 𝜎 = 5 000. Si

se desea conocer la probabilidad de que una batería dure más de 40 000 horas.

En este caso seleccionamos en la hoja de cálculo la función de Excel

DISTR.NORM.N.

Como se muestra en la imagen de abajo.

Se ingresa en el cuadro de dialogo los valores de los argumentos. En este caso

el acumulado será VERDADERO.

Obtenemos que la probabilidad de que una batería tenga una duración de 40

000 horas es de 0.7580. Por lo tanto, la probabilidad de que una batería dure

más de 40 000 horas es 1 – 0.7580 = 0.2420.

La función de Excel INV.NORM usa un cálculo inverso para hallar el valor de 𝑥

que corresponde a una probabilidad acumulada dada. Esta función tiene los

siguientes argumentos:

1. Probabilidad: Es la probabilidad correspondiente a la distribución normal

2. Media: Es la media aritmética de la distribución (𝜇)

3. Desv_estándar: Es la desviación estándar de la distribución (𝜎)

ESTADÍSTICA INFERENCIAL

9

Por ejemplo, si se quisiera conocer la duración que la empresa debe ofrecer en

su garantía de manera que no más del 10% de las baterías sean aptas para

solicitar la garantía. Se procederá de la siguiente forma: Seleccionamos en la

hoja de cálculo la función de Excel INV.NORM como se muestra en la imagen.

Se ingresa en el cuadro de dialogo los valores de los argumentos.

Se obtiene el valor de 30092, indicando la probabilidad de que una batería dure

30 092 horas es 0.10.

ESTADÍSTICA INFERENCIAL

10

La función de Excel para calcular probabilidades exponenciales es

DISTR.EXP.N, que cuenta con los siguientes argumentos.

1. X: Es el valor de la función.

2. Lambda: Es el valor del parámetro.

3. Acum: Es el valor lógico que indica la forma de la función exponencial

que va a aplicar. Si el valor de este argumento es VERDADERO,

DISTR.EXP.N devuelve la función de distribución acumulativa; si es

FALSO, devuelve la función de densidad de probabilidad.

Por ejemplo, el tiempo en minutos que una persona cualquiera se toma para

revisar su correo electrónico sigue una distribución exponencial con 𝜆 = 15

.

Calcula la probabilidad de que una persona cualquiera permanezca conectado al

servidor de correo menos de un minuto.

Se ingresan los valores de los argumentos en el cuadro de dialogo como se

muestra a continuación

ESTADÍSTICA INFERENCIAL

11

De esta forma se obtiene que la probabilidad de que una persona cualquiera

permanezca conectada al servidor de correo menos de un minuto es de 0.181.

Continuando con el mismo ejemplo, ahora se desea conocer la probabilidad de

que una persona cualquiera permanezca conectada al servidor de correo más de

una hora. Nuevamente ingresamos los valores de los argumentos que son los

siguientes:

Obtenemos el valor de 0.999993856 que corresponde a la probabilidad de que

una persona cualquiera permanezca conectada al servidor del correo una hora.

Por lo tanto, la probabilidad de que una persona cualquiera permanezca

conectada al servidor de correo más de una hora es, 𝑃(𝑋 > 60) = 1 − 𝑃(𝑋 =

60) = 0.0000061

ESTADÍSTICA INFERENCIAL

12

ESTADÍSTICA INFERENCIAL

13

Conclusión

En esta sesión viste que una distribución de Poisson con parámetro 𝜆

suficientemente grande se aproxima a una distribución normal y que la

distribución normal a la que se aproxima deberá tener la misma media y varianza

que la distribución de Poisson de la que proviene.

La distribución exponencial es una distribución continua que cuenta con una

propiedad conocida como falta de memoria y proporciona una amplia

aplicabilidad, como la descripción del tiempo requerido para completar una tarea.

Además, la hoja de cálculo de Excel resulta una herramienta fácil de usar y

accesible para calcular probabilidades de distribuciones continuas.

Sabías que una de las principales áreas de la inferencia estadística son las

pruebas de hipótesis, pero ¿en qué consisten éstas?

ESTADÍSTICA INFERENCIAL

14

Para aprender más

¿Qué es y para qué nos sirve la distribución exponencial?

• Ingeniat. (4 de abril de 2013). Distribución exponencial. [Archivo de video]

Recuperado de:

https://www.youtube.com/watch?v=06oeO43HES8

¿En qué casos podemos utilizar una aproximación de una distribución de probabilidad a otra?

• Morettini, M. (septiembre de 2013). Aproximaciones de distribuciones de

probabilidad: enfoque empírico. Documento obtenido de Portal de

Promoción y Difusión Pública del Conocimiento Académico y Científico:

http://nulan.mdp.edu.ar/2040/1/morettini.2013.pdf

ESTADÍSTICA INFERENCIAL

15

Actividad de Aprendizaje

Instrucciones:

Con la finalidad de profundizar en los conocimientos adquiridos a lo largo de esta

sesión, ahora tendrás que realizar la siguiente actividad:

Resuelve los siguientes problemas empleando ya sea la hoja de cálculo de

Excel o algún otro software de estadística al cual tengas acceso.

1. En un hospital el promedio de pacientes con hipertensión arterial

atendidos por día es de 15. Calcula la probabilidad de que en un día

determinado haya más de 27 pacientes con hipertensión arterial.

2. En una cierta ciudad el número promedio de bloqueos de vialidades al día

debido a manifestaciones es 12. ¿Cuál es la probabilidad aproximada de

tener 17 o menos bloqueos de vialidades debido a manifestaciones en

cualquier día dado?

3. Suponiendo que el tiempo de recorrido de un camión repartidor sigue una

distribución exponencial. Si la media del tiempo recorrido es de 36.5

minutos. ¿Cuál es la probabilidad de que el tiempo de recorrido sea de 40

horas o menos?

4. El periodo de vida en años de un interruptor eléctrico tiene una

distribución exponencial con un promedio de falla de 𝜇 = 2 años. ¿Cuál es

la probabilidad de que un interruptor falle después del segundo año?

Inserta las capturas de pantalla en un procesador de textos y analiza los

resultados obtenidos, al final tendrás que guardarlo en formato PDF, y entregarlo

de acuerdo a las indicaciones de tu profesor.

ESTADÍSTICA INFERENCIAL

16

Recuerda que esta actividad te ayudará a familiarizarte con el software

estadístico para el cálculo de algunas de las probabilidades de las distribuciones

de variables continuas.

Esta actividad representa el 5% de tu calificación y se tomará en cuenta lo

siguiente:

• Tus datos generales.

• Título de la actividad.

• Desarrollo completo y correcto de los ejercicios.

• Análisis y conclusiones.

• Ortografía y redacción.

• Capturas de pantalla visibles.

ESTADÍSTICA INFERENCIAL

17

Bibliografía

• Álvarez, C. R. (2007). Estadística aplicada a las ciencias de la salud.

España: Díaz de Santos.

• Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadística

para administración y economía (10 ed.). México: Cengage Learning.

• Anderson, D. R., Sweeney, D. J., Williams, T. A., & Martin, K. (2011).

Métodos cuantitativos para los negocios (11 ed.). México: Cengage

Learning.

• Berenson, M. L., & Levine, D. M. (1996). Estadística básica en

administración. Conceptos y aplicaciones. México: Pearson Educación.

• Cáceres, H. J. J. (2007). Conceptos básicos de estadística para ciencias

sociales. España: Delta.

• Cóndor, E. I. T. (1989). Teoría de las probabilidades y aplicaciones

estadísticas. San Marcos.

• Elorza, Pérez-Tejada, H. (2008). Estadística para las ciencias sociales,

del comportamiento y de la salud (3 ed.). México: Cengage Learning.

• González, M. M. T., & Pérez de Vargas, A. (2012). Estadística aplicada.

Una visión instrumental. España: Díaz de Santos.

• Hines, W. W., & Montgomery, D. C. (1996). Probabilidad y estadística

para ingeniería y administración (2 ed.). México: Compañía Editorial

Continental.

• Lind, D. A., Marchal, W. G., & Wathen, S. A. (2012). Estadística aplicada a

los negocios y economía (15 ed.). México: McGraw-Hill.

• Navidi, W. (2006). Estadística para ingenieros. México: McGraw-Hill.

ESTADÍSTICA INFERENCIAL

18

• Render, B., Stair, R. M., & Hanna, M. E. (2012). Métodos cuantitativos

para los negocios (11 ed.). México: Pearson Educación.

• Rodríguez, F. J., Pierdant, R. A., & Rodríguez, J. E. C. (2014). Estadística

para administración. México: Grupo Editorial Patria.

Cibergrafía

• Ingeniat. (4 de abril de 2013). Distribución exponencial. [Archivo de video]

Recuperado de:

https://www.youtube.com/watch?v=06oeO43HES8

• Morettini, M. (septiembre de 2013). Aproximaciones de distribuciones de

probabilidad: enfoque empírico. Documento obtenido de Portal de

Promoción y Difusión Pública del Conocimiento Académico y Científico:

http://nulan.mdp.edu.ar/2040/1/morettini.2013.pdf

Te invito a que consultes la Biblioteca Digital UNID