Curso Práctico de Bioestadística Con Herramientas De Excel

69
Curso Práctico de Bioestadística Con Herramientas De Excel Fabrizio Marcillo Morla Fabrizio Marcillo Morla MBA MBA [email protected] (593-9) 4194239

description

Curso Práctico de Bioestadística Con Herramientas De Excel. Fabrizio Marcillo Morla MBA. [email protected] (593-9) 4194239. Fabrizio Marcillo Morla. Guayaquil, 1966. BSc. Acuicultura. (ESPOL 1991). Magister en Administración de Empresas. (ESPOL, 1996). Profesor ESPOL desde el 2001. - PowerPoint PPT Presentation

Transcript of Curso Práctico de Bioestadística Con Herramientas De Excel

Page 1: Curso Práctico de Bioestadística Con Herramientas De Excel

Curso Práctico de Bioestadística Con

Herramientas De Excel

Fabrizio Marcillo Morla MBAFabrizio Marcillo Morla MBA

[email protected](593-9) 4194239

Page 2: Curso Práctico de Bioestadística Con Herramientas De Excel

Fabrizio Marcillo Morla Guayaquil, 1966.Guayaquil, 1966.

BSc. Acuicultura. (ESPOL 1991).BSc. Acuicultura. (ESPOL 1991). Magister en Administración de Empresas. (ESPOL, Magister en Administración de Empresas. (ESPOL,

1996).1996). Profesor ESPOL desde el 2001.Profesor ESPOL desde el 2001.

20 años experiencia profesional: 20 años experiencia profesional: Producción.Producción.

Administración.Administración. Finanzas.Finanzas.

Investigación.Investigación. Consultorías.Consultorías.

Otras Publicaciones del mismo autor en Repositorio ESPOL

Page 3: Curso Práctico de Bioestadística Con Herramientas De Excel

Capitulo 2

Distribuciones de ProbabilidadDistribuciones de Probabilidad

Page 4: Curso Práctico de Bioestadística Con Herramientas De Excel

Distribución de Probabilidad Una distribución o densidad de probabilidad de una Una distribución o densidad de probabilidad de una

variable aleatoria x es la función de distribución de la variable aleatoria x es la función de distribución de la probabilidad de dicha variableprobabilidad de dicha variable Área de curva entre 2 puntos representa la probabilidad de que Área de curva entre 2 puntos representa la probabilidad de que

ocurra un suceso entre esos dos puntos.ocurra un suceso entre esos dos puntos.

Distribuciones probabilidad pueden ser discretas o Distribuciones probabilidad pueden ser discretas o continuas, de acuerdo al tipo de.continuas, de acuerdo al tipo de.

Hay infinidad distribuciones probabilidad, (1 c/población), Hay infinidad distribuciones probabilidad, (1 c/población), pero hay ciertas distribuciones “modelo”:pero hay ciertas distribuciones “modelo”: NormalNormal BinomialBinomial Ji-cuadradoJi-cuadrado "t" de Student, "t" de Student, F de FisherF de Fisher

-1 0 +1

Page 5: Curso Práctico de Bioestadística Con Herramientas De Excel

Distribución binominal

Describe la probabilidad de una variable dicotómica Describe la probabilidad de una variable dicotómica independiente.independiente.

Distribución Binominal de un hombre en un grupo de 10

0

0.05

0.1

0.15

0.2

0.25

0.3

0 1 2 3 4 5 6 7 8 9 10Número de hombres en un grupo de 10

Probabilidad

Page 6: Curso Práctico de Bioestadística Con Herramientas De Excel

Utilidad SSe utiliza e utiliza en situaciones cuya solución tiene dos en situaciones cuya solución tiene dos

posibles resultadosposibles resultados.. AlAl nacer un/a bebé puede ser varón o hembra. nacer un/a bebé puede ser varón o hembra. En el deporte un equipo puede ganar o perderEn el deporte un equipo puede ganar o perder.. Un tratamiento médico puede ser efectivo o inefectivo.Un tratamiento médico puede ser efectivo o inefectivo. Vivo / muerto; enfermo / sano; verdadero / falsoVivo / muerto; enfermo / sano; verdadero / falso Prueba múltiple 4 alternativas: correcta o incorrecta.Prueba múltiple 4 alternativas: correcta o incorrecta. Algo puede considerarse como Éxito o FracasoAlgo puede considerarse como Éxito o Fracaso

““Experimentos de Bernoulli”Experimentos de Bernoulli” Usos:Usos:

Estimación de proporcionesEstimación de proporciones Pruebas de Pruebas de hipotesis de proporcioneshipotesis de proporciones

Page 7: Curso Práctico de Bioestadística Con Herramientas De Excel

Propiedades de un experimento de Bernoulli

1. En cada prueba del experimento sólo hay dos posibles resultados: Éxitos o Fracasos.

2. El resultado obtenido en cada prueba es independiente de los resultados obtenidos en pruebas anteriores.

3. La probabilidad de un suceso (p) es constante y no varía de una prueba a otra.

4. La probabilidad del complemento (1- p) es q .

5. Si repetimos el experimento n veces podemos obtener datos para armar una distribución binomial.

Page 8: Curso Práctico de Bioestadística Con Herramientas De Excel

La Distribución Binomial

Ejemplo distribución probabilidad discreta. Ejemplo distribución probabilidad discreta. Formada por serie experimentos Bernoulli.Formada por serie experimentos Bernoulli. Resultados de cada experimento son Resultados de cada experimento son

mutuamente excluyentes.mutuamente excluyentes. Para construirla necesitamos:Para construirla necesitamos:

1.1. La cantidad de pruebas La cantidad de pruebas nn

2.2. La probabilidad de éxitos La probabilidad de éxitos pp

3.3. Utilizar la función matemática Utilizar la función matemática P(x=k)P(x=k)..

Page 9: Curso Práctico de Bioestadística Con Herramientas De Excel

La función P(x=k)Función de la distribución de Bernoulli:Función de la distribución de Bernoulli:

k = número de aciertos. k = número de aciertos. n = número de experimentos. n = número de experimentos. p = probabilidad de éxito, como por ejemplo, que salga "cara" al p = probabilidad de éxito, como por ejemplo, que salga "cara" al

lanzar la moneda.lanzar la moneda. 1-p = “q”1-p = “q”

Excel Excel ==DISTR.BINOM(k , n, p, DISTR.BINOM(k , n, p, acumuladoacumulado)) Acumulado = falso : solo para x=kAcumulado = falso : solo para x=k Acumulado = Verdadero : para x≤kAcumulado = Verdadero : para x≤k

Ejercicio03 - DistribucionBinomial.xlsxEjercicio03 - DistribucionBinomial.xlsx

Page 10: Curso Práctico de Bioestadística Con Herramientas De Excel

Ejemplo 1 ¿Probabilidad de obtener 6 caras al lanzar una ¿Probabilidad de obtener 6 caras al lanzar una

moneda 10 veces?moneda 10 veces? El número de aciertos k es 6. Esto es x=6El número de aciertos k es 6. Esto es x=6 El número de experimentos n son 10El número de experimentos n son 10 La probabilidad de éxito p = 0.50La probabilidad de éxito p = 0.50 La fórmula quedaría:La fórmula quedaría:

P (k = 6) = 0.205P (k = 6) = 0.205 Es decir, que la probabilidad de obtener 6 caras Es decir, que la probabilidad de obtener 6 caras

al lanzar 10 veces una moneda es de 20.5% .al lanzar 10 veces una moneda es de 20.5% .

Page 11: Curso Práctico de Bioestadística Con Herramientas De Excel

Ejemplo 2 ¿Probabilidad de obtener cuatro veces el ¿Probabilidad de obtener cuatro veces el

número 3 al lanzar un dado ocho veces?número 3 al lanzar un dado ocho veces? El número de aciertos k es 4. Esto es x=4El número de aciertos k es 4. Esto es x=4 El número de experimentos n son 8El número de experimentos n son 8 Probabilidad de éxito p = 1/6 ( 0.1666)Probabilidad de éxito p = 1/6 ( 0.1666) La fórmula queda:La fórmula queda:

P (k = 4) = 0.026P (k = 4) = 0.026 Es decir, probabilidad de obtener cuatro veces el Es decir, probabilidad de obtener cuatro veces el

números 3 al tirar un dado 8 veces es de 2.6%.números 3 al tirar un dado 8 veces es de 2.6%.

Page 12: Curso Práctico de Bioestadística Con Herramientas De Excel

Tabla o Excel?

Page 13: Curso Práctico de Bioestadística Con Herramientas De Excel

Media, Varianza, y Desviación Estandar en Distribución Binomial

qpn

qpn

pn

2

Page 14: Curso Práctico de Bioestadística Con Herramientas De Excel

Ejemplo Al adivinar al azar un examen de 100 Al adivinar al azar un examen de 100

preguntas multiples, cada una con 4 preguntas multiples, cada una con 4 posibles respuestas:posibles respuestas:

3.443

41100

8.1843

41100

2541100

2

Page 15: Curso Práctico de Bioestadística Con Herramientas De Excel

En resumen La distribución binomial se forma de una La distribución binomial se forma de una

serie de experimentos de Bernoulli  serie de experimentos de Bernoulli   La media (μ) en la distribución binomial se La media (μ) en la distribución binomial se

obtiene con el producto de n x pobtiene con el producto de n x p La varianza (σLa varianza (σ22 ) en la distribución binomial ) en la distribución binomial

se obtiene del producto de n x p x q. se obtiene del producto de n x p x q. El valor de q es el complemento de p y se El valor de q es el complemento de p y se

obtiene con 1 – p.obtiene con 1 – p.

Page 16: Curso Práctico de Bioestadística Con Herramientas De Excel

Distribución Normal Descubierta en 1733 por el francés Moiure, Descubierta en 1733 por el francés Moiure,

descrita también por Laplace y Gauss (sinónimo descrita también por Laplace y Gauss (sinónimo de la forma gráfica de esta distribución).de la forma gráfica de esta distribución).

Importancia práctica de esta distribución teórica:Importancia práctica de esta distribución teórica: Muchos fenómenos distribuidos suficientemente Muchos fenómenos distribuidos suficientemente

Normal que distribución es la base de gran parte de la Normal que distribución es la base de gran parte de la teoría estadística usada por los biólogos.teoría estadística usada por los biólogos.

Distribución de promedios.Distribución de promedios. Distribución de errores.Distribución de errores.

Page 17: Curso Práctico de Bioestadística Con Herramientas De Excel

Características D. Normal Área bajo la curva entre 2 puntos representa probabilidad que Área bajo la curva entre 2 puntos representa probabilidad que

ocurra un hecho entre esos dos puntosocurra un hecho entre esos dos puntos Su dominio va de menos infinito a más infinito;Su dominio va de menos infinito a más infinito; Es simétrica con respecto a su media;Es simétrica con respecto a su media; Tiene dos colas y es asintótica al eje x por ambos lados;Tiene dos colas y es asintótica al eje x por ambos lados; El valor del área debajo de toda la curva es igual a 1;El valor del área debajo de toda la curva es igual a 1; El centro de la curva está representado por la media poblacional (El centro de la curva está representado por la media poblacional ().). Para cualquier curva normal, el área de -Para cualquier curva normal, el área de - a + a + es igual a 0.6827; es igual a 0.6827;

de -2de -2 a +2 a +2 de 0,9545 y de -3 de 0,9545 y de -3 a +3 a +3 de 0,9973; de 0,9973; Distribución muestreal de varios estadísticos, como Distribución muestreal de varios estadísticos, como x es normal e x es normal e

independiente de distribución de la población.independiente de distribución de la población.

Page 18: Curso Práctico de Bioestadística Con Herramientas De Excel

D. Normal Tipificada (estandarizada) Distribución especial que representa a todas las variables aleatorias Distribución especial que representa a todas las variables aleatorias

normales y que es la distribución de otra variable normal llamada Z:normales y que es la distribución de otra variable normal llamada Z:

=NORMALIZACION(x;media;desv_estándar)=NORMALIZACION(x;media;desv_estándar) Z se la conoce como variable aleatoria estandarizada.Z se la conoce como variable aleatoria estandarizada. Esta función se caracteriza por tener media igual a cero y desviación Esta función se caracteriza por tener media igual a cero y desviación

tipificada igual a uno : N(0,1)tipificada igual a uno : N(0,1) Representa a todas las distribuciones Normales. Igual densidad de Representa a todas las distribuciones Normales. Igual densidad de

probabilidad, si medimos desviaciones de media en base a probabilidad, si medimos desviaciones de media en base a .. Valores obtenidos de tabla Normal válidos para todas las Valores obtenidos de tabla Normal válidos para todas las

distribuciones Normal de media = distribuciones Normal de media = y varianza = y varianza =22..

Z =x -

Page 19: Curso Práctico de Bioestadística Con Herramientas De Excel

Densidad de Probabilidad

N (0,1)N (0,1) y N( y N(,,22))

Page 20: Curso Práctico de Bioestadística Con Herramientas De Excel

Probabilidad Acumulada

N (0,1)N (0,1) y N( y N(,,22))

Page 21: Curso Práctico de Bioestadística Con Herramientas De Excel

Tabla Distribución Z=DISTR.NORM.ESTAND(Z)

Page 22: Curso Práctico de Bioestadística Con Herramientas De Excel

Uso de Tabla Distribución Z Para determinar la probabilidad de ocurrencia de un Para determinar la probabilidad de ocurrencia de un

suceso entre 2 puntos debemos determinar el área bajo la suceso entre 2 puntos debemos determinar el área bajo la curva entre dichos puntos.curva entre dichos puntos.

Depende tipo de tabla. Usaremos tabla de -Depende tipo de tabla. Usaremos tabla de -a X, ya que a X, ya que da la probabilidad acumulada al igual que Excel. da la probabilidad acumulada al igual que Excel.

Existen otros tipos de tablaExisten otros tipos de tabla 0 a X, X a 0 a X, X a , etc., etc. Debemos razonar siempre como determinar el área.Debemos razonar siempre como determinar el área.

En nuestra tabla, para determinar P(-En nuestra tabla, para determinar P(-a X) o P(Z ≤ X):a X) o P(Z ≤ X):1.1. Buscamos en la columna izquierda de la tabla el valor del entero y Buscamos en la columna izquierda de la tabla el valor del entero y

primer decimalprimer decimal

2.2. Buscamos en la fila superior el valor del segundo decimal, Buscamos en la fila superior el valor del segundo decimal,

3.3. Interceptamos ambos valores obteniendo el valor de P.Interceptamos ambos valores obteniendo el valor de P.

4.4. Interpretamos este valorInterpretamos este valor

Page 23: Curso Práctico de Bioestadística Con Herramientas De Excel

Probabilidad Normal Excel

=DISTR.NORM.ESTAND(Z)=DISTR.NORM.ESTAND(Z) Devuelve la función de distribución normal estándar Devuelve la función de distribución normal estándar

acumulativa. La distribución tiene una media de 0 (cero) acumulativa. La distribución tiene una media de 0 (cero) y una desviación estándar de uno. Use esta función en y una desviación estándar de uno. Use esta función en lugar de una tabla estándar de áreas de curvas normaleslugar de una tabla estándar de áreas de curvas normales

Ejercicio 03 - DistribucionNormal.xlsxEjercicio 03 - DistribucionNormal.xlsx

Page 24: Curso Práctico de Bioestadística Con Herramientas De Excel

Uso Tabla Normal Estándar (a)

Obtenga la probabilidad de que Z obtenga los siguientes Obtenga la probabilidad de que Z obtenga los siguientes valores:valores:

P (P (1.17)1.17) Buscamos en la columna izquierda de la tabla el valor Buscamos en la columna izquierda de la tabla el valor

1.1, y en la primera fila el valor 0.07, interceptamos 1.1, y en la primera fila el valor 0.07, interceptamos ambos valores obteniendo el valor de 0.8790, que es ambos valores obteniendo el valor de 0.8790, que es el valor que buscábamos:el valor que buscábamos:

P(P( 1.17) = 0.879 1.17) = 0.879

Page 25: Curso Práctico de Bioestadística Con Herramientas De Excel

Uso Tabla Normal Estándar (b) P(0P(0 Z Z 1.17) 1.17)

Esto lo podemos escribir de la siguiente forma también:Esto lo podemos escribir de la siguiente forma también:

P(Z ≤1.17) - P(ZP(Z ≤1.17) - P(Z 0) 0) El primer término lo conocemos, por que lo resolvimos en el El primer término lo conocemos, por que lo resolvimos en el

literal a.literal a. Para el segundo término sabemos que la distribución normal es Para el segundo término sabemos que la distribución normal es

simétrica y que su área total es igual a 1, por lo tanto el área que simétrica y que su área total es igual a 1, por lo tanto el área que hay de -hay de -a 0 (P(Z a 0 (P(Z 0)) es igual a 1/2 = 0.5. 0)) es igual a 1/2 = 0.5.

Por lo que el valor que buscábamos estará dado por:Por lo que el valor que buscábamos estará dado por:

P(0≤ Z P(0≤ Z 1.17) = 0.879 - 0.5 = 0.379 1.17) = 0.879 - 0.5 = 0.379

Page 26: Curso Práctico de Bioestadística Con Herramientas De Excel

Uso Tabla Normal Estándar (c) P(Z P(Z 1.17)1.17)

Sabiendo que el área total bajo toda la curva Normal de -Sabiendo que el área total bajo toda la curva Normal de - a + a + es igual a 1, y conociendo el valor del área de -es igual a 1, y conociendo el valor del área de - a 1.17, el valor a 1.17, el valor del área de 1.17 a +del área de 1.17 a +será:será:

1 - P(Z 1 - P(Z 1.17) = 1 - 0.879 = 0.121 1.17) = 1 - 0.879 = 0.121

Page 27: Curso Práctico de Bioestadística Con Herramientas De Excel

Uso Tabla Normal Estándar (d) P(Z P(Z -1.17) -1.17)

Como estamos tratando con una curva simétrica, este valor Como estamos tratando con una curva simétrica, este valor será el mismo que el del literal c:será el mismo que el del literal c:

P(Z P(Z -1.17) = P(Z -1.17) = P(Z 1.17) = 0.121 1.17) = 0.121

Page 28: Curso Práctico de Bioestadística Con Herramientas De Excel

Uso Tabla Normal Estándar (e) P(0.42P(0.42 Z Z 1.17) 1.17)

Al igual que en el literal b, esto lo podemos escribir como:Al igual que en el literal b, esto lo podemos escribir como:

P(Z ≤1.17) - P(ZP(Z ≤1.17) - P(Z 0.42) 0.42).. El primer valor lo conocemos, el segundo lo encontramos en la tabla de la El primer valor lo conocemos, el segundo lo encontramos en la tabla de la

misma forma:misma forma:

P( Z P( Z 1.17) – P(Z 1.17) – P(Z 0.42)= 0.879-0.6628= 0.2162 0.42)= 0.879-0.6628= 0.2162

Page 29: Curso Práctico de Bioestadística Con Herramientas De Excel

Uso Tabla Normal Estándar (f)h)h) P(|Z| P(|Z| 1.17) 1.17)

Determinar el área de -Determinar el área de - a -1.17 y de 1.17 a + a -1.17 y de 1.17 a +. Como la curva es simétrica, . Como la curva es simétrica, simplemente multiplicamos el valor de P(Z simplemente multiplicamos el valor de P(Z 1.17) del literal c por 2: 1.17) del literal c por 2:

P(|Z| P(|Z| 1.17) = 2 x P(Z 1.17) = 2 x P(Z 1.17) = 2 x 0.121 = 0.242 1.17) = 2 x 0.121 = 0.242

Page 30: Curso Práctico de Bioestadística Con Herramientas De Excel

Uso Tabla Normal Estándar (g)i)i) P(|Z| P(|Z| 1.17) 1.17)

Área dada por 1 menos valor literal h, ya que el valor total del área es igual a 1:Área dada por 1 menos valor literal h, ya que el valor total del área es igual a 1:

P(P(ZZ 1.17) = 1- P( 1.17) = 1- P(ZZ 1.17) = 1 - 0.242 = 0.758 1.17) = 1 - 0.242 = 0.758

Page 31: Curso Práctico de Bioestadística Con Herramientas De Excel

Tabla Distribución Z Inversa Otro caso diferente para el cual podemos utilizar la tabla es Otro caso diferente para el cual podemos utilizar la tabla es

para encontrar el valor de Z después del cual se encuentra para encontrar el valor de Z después del cual se encuentra un un x 100 % del área de la curva. x 100 % del área de la curva.

Esto equivale a decir buscar el valor de Z cuya probabilidad Esto equivale a decir buscar el valor de Z cuya probabilidad de ser mayor sea 100 x de ser mayor sea 100 x %, o en su defecto que su %, o en su defecto que su probabilidad de ser menor sea de (1-probabilidad de ser menor sea de (1-)x100 %)x100 %

Page 32: Curso Práctico de Bioestadística Con Herramientas De Excel

Inverso Normal Excel =DISTR.NORM.ESTAND.INV(probabilidad)=DISTR.NORM.ESTAND.INV(probabilidad) Devuelve el inverso de la distribución normal estándar Devuelve el inverso de la distribución normal estándar

acumulativa. Calcula el valor de Z en donde el área de la acumulativa. Calcula el valor de Z en donde el área de la curva a su izquierda es igual a la probabilidad buscada.curva a su izquierda es igual a la probabilidad buscada.

Se calcula con base en iteraciones, y el grado de Se calcula con base en iteraciones, y el grado de precisión puede variar.precisión puede variar.

Page 33: Curso Práctico de Bioestadística Con Herramientas De Excel

Inverso Tabla Normal(0,1) (a) Hallar el valor de Z antes del cual se encuentra el Hallar el valor de Z antes del cual se encuentra el

0.879 del área de la curva0.879 del área de la curva Buscamos en el cuerpo de la tabla el valor Buscamos en el cuerpo de la tabla el valor

correspondiente a 0.8790. Vemos en la columna que correspondiente a 0.8790. Vemos en la columna que corresponde al valor 1.1, y en la primera fila el valor a corresponde al valor 1.1, y en la primera fila el valor a 0.07, lo que nos da 0.07, lo que nos da

Z(1-0.879)=1.17Z(1-0.879)=1.17

Page 34: Curso Práctico de Bioestadística Con Herramientas De Excel

Inverso Tabla Normal(0,1) (b) Hallar el valor de Z después del cual se encuentra el Hallar el valor de Z después del cual se encuentra el

5% del área de la curva:5% del área de la curva: Esto corresponde a un valor de Esto corresponde a un valor de = 0.05 = 0.05 Esto equivale a decir buscar el valor de Z tal que:Esto equivale a decir buscar el valor de Z tal que:

P(Z P(Z x) = 0.05 x) = 0.05 Buscamos en la tabla el valor de 1 - 0.05 = 0.95Buscamos en la tabla el valor de 1 - 0.05 = 0.95 Este se encontraría en la fila correspondiente a 1.6, entre Este se encontraría en la fila correspondiente a 1.6, entre

los valores de las columnas 4 (0.9495) y 5 (0.9505), los valores de las columnas 4 (0.9495) y 5 (0.9505), interpolamos 4.5, y Z sería igual a 1.645.interpolamos 4.5, y Z sería igual a 1.645.

ZZ(0.05)(0.05) = 1.645 = 1.645

Page 35: Curso Práctico de Bioestadística Con Herramientas De Excel

Inverso Tabla Normal(0,1) (c) Hallar el valor de Z tal que el área sobre el mas el Hallar el valor de Z tal que el área sobre el mas el

área bajo -Z sea igual a 0.05:área bajo -Z sea igual a 0.05: Esto equivale a decir buscar el valor de Z tal que:Esto equivale a decir buscar el valor de Z tal que:

P(|Z| P(|Z| x) = 0.05 x) = 0.05 Como es una curva simétrica: Como es una curva simétrica: = 0.05/2=0.025 = 0.05/2=0.025 Buscamos en la tabla el valor de 1 - 0.025 = 0.95Buscamos en la tabla el valor de 1 - 0.025 = 0.95

ZZ(0.025)(0.025) = 1.96 = 1.96

Page 36: Curso Práctico de Bioestadística Con Herramientas De Excel

Inverso Tabla Normal(0,1) (d) (d) Hallar el valor de Z después del cual se Hallar el valor de Z después del cual se

encuentra el 1% del área de la curva:encuentra el 1% del área de la curva: Esto corresponde a un valor de Esto corresponde a un valor de = 0.01 = 0.01 En Excel =DISTR.NORM.ESTAND.INV(0.99)En Excel =DISTR.NORM.ESTAND.INV(0.99)

ZZ(0.01)(0.01) = 2.326 = 2.326

(e)(e) Hallar el valor de Z tal que el área sobre el mas el Hallar el valor de Z tal que el área sobre el mas el área bajo -Z sea igual a 0.01:área bajo -Z sea igual a 0.01:

Como es una curva simétrica: Como es una curva simétrica: = 0.01/2=0.005 = 0.01/2=0.005 En Excel =DISTR.NORM.ESTAND.INV(0.995)En Excel =DISTR.NORM.ESTAND.INV(0.995)

ZZ(0.005)(0.005) = 2.576 = 2.576

Buscar en la tabla para comprobarBuscar en la tabla para comprobar

Page 37: Curso Práctico de Bioestadística Con Herramientas De Excel

Distribución Normal (, ) Esto Ok! para curva N (0,1) pero y si queremos Esto Ok! para curva N (0,1) pero y si queremos

usarlo en población natural con usarlo en población natural con 0 y 0 y 1?1? No hay problema! Tipificamos valor de x en No hay problema! Tipificamos valor de x en

nuestra distribución Normal con fórmula:nuestra distribución Normal con fórmula:

Y procedemos a buscar la probabilidad para este Y procedemos a buscar la probabilidad para este valor determinado. valor determinado.

Z no es más que el número de desviaciones Z no es más que el número de desviaciones estándares a la que se encuentra x de estándares a la que se encuentra x de ..

Z =x -

Page 38: Curso Práctico de Bioestadística Con Herramientas De Excel

Tipificar en Excel = NORMALIZACION(x,= NORMALIZACION(x,))

Valor normalizado de distribución caracterizada por Valor normalizado de distribución caracterizada por los argumentos media y desv_estándar : los argumentos media y desv_estándar : Z =Z =x-x-

=DISTR.NORM(x,=DISTR.NORM(x, Verdadero) Verdadero) Calcula probabilidad de que un valor se encuentre Calcula probabilidad de que un valor se encuentre

bajo x en una distribución N(bajo x en una distribución N(): ): P(Z ≤ x)P(Z ≤ x)

DISTR.NORM.INV(P,DISTR.NORM.INV(P,)) Devuelve el valor x abajo del cual se encuentra el Devuelve el valor x abajo del cual se encuentra el

Px100% del área de la curva para una distribución Px100% del área de la curva para una distribución N(N().).

Page 39: Curso Práctico de Bioestadística Con Herramientas De Excel

Ejercicioa)a) Encontrar la probabilidad que al muestrear una Encontrar la probabilidad que al muestrear una

piscina con una población Normal con peso piscina con una población Normal con peso =5g y =5g y 22=4 encontremos un valor > 7.78g.=4 encontremos un valor > 7.78g.

Como Como 22=4, entonces =4, entonces = 2. = 2. Calculamos el valor de Z:Calculamos el valor de Z:

Y luego calculamos la probabilidad de que Z sea mayor a Y luego calculamos la probabilidad de que Z sea mayor a este valor en la tabla:este valor en la tabla:

P(Z P(Z 1.39) = 1-0.9177=0.0823 1.39) = 1-0.9177=0.0823 En Excel lo podemos hacer directo o por pasosEn Excel lo podemos hacer directo o por pasos

b)b) En la misma piscina calcular entre que valores de En la misma piscina calcular entre que valores de peso se encuentra el 95% de la poblaciónpeso se encuentra el 95% de la población

Z =7.78 -5

2= 1.39

Page 40: Curso Práctico de Bioestadística Con Herramientas De Excel

Distribución Derivada Al muestrear repetidamente una población, Al muestrear repetidamente una población,

obtenemos distribución de sus obtenemos distribución de sus x. x. Distribución Derivada es Normal, independiente Distribución Derivada es Normal, independiente

de distribución de la Población.de distribución de la Población. de población de de población de x de tamaño n es igual a la x de tamaño n es igual a la

de población original, y varianza es 1/n de de población original, y varianza es 1/n de varianza poblacional :varianza poblacional :

xx = = 22xx = = 22/n/n

Teorema Central del LímiteTeorema Central del Límite

4.0 6.0 8.0 10.0 12.0 14.0 16.0

0%

2%

4%

6%

8%

10%

12%

14%

Values

PRO

BA

BIL

ITY

Dist. Deriv Dist. Pobl.

Distribucion de Medias

Page 41: Curso Práctico de Bioestadística Con Herramientas De Excel

4.0 6.0 8.0 10.0 12.0 14.0 16.0

0%

2%

4%

6%

8%

10%

12%

14%

Values

PRO

BA

BIL

ITY

Dist. Deriv Dist. Pobl.

Distribucion de Medias

Page 42: Curso Práctico de Bioestadística Con Herramientas De Excel

Ejercicio Encontrar la probabilidad que al sacar una Encontrar la probabilidad que al sacar una

muestra de tamaño n=16 de una población con muestra de tamaño n=16 de una población con =10 y =10 y 22=4 encontrar un promedio ≥ 11.=4 encontrar un promedio ≥ 11. x es una muestra de población normal derivada con:x es una muestra de población normal derivada con:

xx = = = 10 ; = 10 ; 22xx = = 22/n = 4/16 = 1/4; /n = 4/16 = 1/4; xx = ½ = ½

Buscamos distancia de nuestro promedio a la media:Buscamos distancia de nuestro promedio a la media:

Buscando en la tabla:Buscando en la tabla: P(Z P(Z 2) = 0.228 2) = 0.228

Por lo que podemos decir que la probabilidad de Por lo que podemos decir que la probabilidad de sacar un muestreo de n = 16 y sacar un muestreo de n = 16 y x x 11 es de 11 es de 2.28%, lo cual se considera “poco usual”.2.28%, lo cual se considera “poco usual”.

Z =x -

=11 -10

1 / 2= 2x

x

Page 43: Curso Práctico de Bioestadística Con Herramientas De Excel

Taller Practico

Calcular la distribución derivada para Calcular la distribución derivada para muestras de n= 10 para las bolas de bingomuestras de n= 10 para las bolas de bingo

Page 44: Curso Práctico de Bioestadística Con Herramientas De Excel

Distribución “t” de Student Desarrollada con base en distribuciones de Desarrollada con base en distribuciones de

frecuencia empíricas por William Gosset, (a) frecuencia empíricas por William Gosset, (a) “Student”. “Student”. ““The probable error of a mean” Biometrika The probable error of a mean” Biometrika

19081908 Cervecero - estadístico con dificultadas al usar Cervecero - estadístico con dificultadas al usar

distribución Normal en muestras pequeñas. distribución Normal en muestras pequeñas. Sin embargo fue Fisher el que encontró mas Sin embargo fue Fisher el que encontró mas

aplicaciones para estaaplicaciones para esta

Page 45: Curso Práctico de Bioestadística Con Herramientas De Excel

Distribución “t” de Student Distribución muestreal del promedio se ajusta muy bien a Distribución muestreal del promedio se ajusta muy bien a

la distribución Normal cuando se conoce la distribución Normal cuando se conoce . Si n es . Si n es grande, esto no presenta ningún problema, aun cuando grande, esto no presenta ningún problema, aun cuando sea desconocida, por lo que en este caso es razonable sea desconocida, por lo que en este caso es razonable sustituirla por s. sustituirla por s.

Sin embargo, en el caso de usar valores de n < 30, o sea Sin embargo, en el caso de usar valores de n < 30, o sea en el caso de pequeñas muestras, esto no funciona tan en el caso de pequeñas muestras, esto no funciona tan bien.bien.

Page 46: Curso Práctico de Bioestadística Con Herramientas De Excel

Distribución “t” de Student Definiendo el estadístico t:Definiendo el estadístico t:

Se puede probar que siendo Se puede probar que siendo x el promedio de x el promedio de una muestra tomada de una población normal una muestra tomada de una población normal con media con media y varianza y varianza 22, el estadístico t es el , el estadístico t es el valor de una variable aleatoria con distribución valor de una variable aleatoria con distribución "t" de Student y parámetro "t" de Student y parámetro (grados de libertad) (grados de libertad) = n-1.= n-1.

t =x -

s / n

Page 47: Curso Práctico de Bioestadística Con Herramientas De Excel
Page 48: Curso Práctico de Bioestadística Con Herramientas De Excel
Page 49: Curso Práctico de Bioestadística Con Herramientas De Excel

Características Distribución “t” Tiene media igual 0, es asintótica al eje x y su Tiene media igual 0, es asintótica al eje x y su

dominio va de -dominio va de - a + a +;; El área bajo la curva desde -El área bajo la curva desde - a + a +es igual a 1es igual a 1 0, 0, 22 depende parámetro depende parámetro (grados libertad) (grados libertad) Varianza > 1, pero se aproxima a 1 cuando nVarianza > 1, pero se aproxima a 1 cuando n Al aumentar n, la distribución “t se aproxima a la Al aumentar n, la distribución “t se aproxima a la

Normal; n > 30 ó más, excelente aproximaciónNormal; n > 30 ó más, excelente aproximación Entre las aplicaciones:Entre las aplicaciones:

Estimación de intervalos de confianza para medias a Estimación de intervalos de confianza para medias a partir de muestras pequeñaspartir de muestras pequeñas

Pruebas de hipótesis basadas en muestras < 30Pruebas de hipótesis basadas en muestras < 30

Page 50: Curso Práctico de Bioestadística Con Herramientas De Excel

Tabla de Distribución “t”

Valores de tValores de t a la derecha de a la derecha de

los cuales se encuentra el los cuales se encuentra el (100 x (100 x )% área de la curva.)% área de la curva.

Localizamos la columna del Localizamos la columna del valor de valor de y fila del valor de y fila del valor de . La intersección de la fila y . La intersección de la fila y la columna nos dará el valor la columna nos dará el valor de tde t..

Page 51: Curso Práctico de Bioestadística Con Herramientas De Excel

Probabilidad “t” en Excel

=DISTR.T(x,=DISTR.T(x,,colas),colas) Devuelve el área a la Devuelve el área a la derechaderecha de x ( de x ()) x= valor de t (x= valor de t (solo positivosolo positivo)) = grados de libertad= grados de libertad Colas = 1 o 2 colasColas = 1 o 2 colas

colas= 1, P( X>t ) colas= 1, P( X>t ) colas = 2, P(|X| > t); P(X > t o X < -t). colas = 2, P(|X| > t); P(X > t o X < -t).

Page 52: Curso Práctico de Bioestadística Con Herramientas De Excel

Probabilidad “t” Inversa en Excel

=DISTR.T.INV(=DISTR.T.INV(,,)) Devuelve el valor de t de dos colas, después del cual Devuelve el valor de t de dos colas, después del cual

se encuentra el se encuentra el x 100% del área de la curva. x 100% del área de la curva. P(|X| > t) = P(X < -t o X > t). P(|X| > t) = P(X < -t o X > t). Para una cola, remplazar Para una cola, remplazar por 2 por 2..

Page 53: Curso Práctico de Bioestadística Con Herramientas De Excel

Ejercicio en tabla y Excela)a) Calcular la probabilidad de obtener un valor Calcular la probabilidad de obtener un valor

mayor que 2,26 en una distribución t con 9 gdlmayor que 2,26 en una distribución t con 9 gdl

b)b) Calcular la probabilidad de obtener un valor Calcular la probabilidad de obtener un valor mayor que 2,26 o menor que -2,26 en una mayor que 2,26 o menor que -2,26 en una distribución t con 9 gdldistribución t con 9 gdl

c)c) Calcular el valor de t después del cual se Calcular el valor de t después del cual se encuentre el 5% del área dela curva con 9 gdlencuentre el 5% del área dela curva con 9 gdl

d)d) Calcular el valor de t para a= 0,05 con 9 gdl y dos Calcular el valor de t para a= 0,05 con 9 gdl y dos colascolas

Page 54: Curso Práctico de Bioestadística Con Herramientas De Excel

Ji-cuadrado Distribución Ji-cuadrado es una función de Distribución Ji-cuadrado es una función de

densidad de probabilidad que representa la densidad de probabilidad que representa la distribución muestreal de la varianza.distribución muestreal de la varianza.

Definimos el estadístico Ji-cuadrado (Definimos el estadístico Ji-cuadrado (2) como:2) como:

22

2=(n -1)s

Page 55: Curso Práctico de Bioestadística Con Herramientas De Excel
Page 56: Curso Práctico de Bioestadística Con Herramientas De Excel
Page 57: Curso Práctico de Bioestadística Con Herramientas De Excel

Caracteristicas Ji-cuadrado Asimétrica y asintótica al eje x por la derecha;Asimétrica y asintótica al eje x por la derecha; Su dominio va de 0 a +Su dominio va de 0 a + Area bajo la curva desde 0 a +Area bajo la curva desde 0 a + =1 =1 Tiene parámetro Tiene parámetro = n-1 (g.d.l.) = n-1 (g.d.l.) Al aumentar n se aproxima a la normalAl aumentar n se aproxima a la normal Representa distribución muestreal de varianza.Representa distribución muestreal de varianza. Entre las aplicaciones:Entre las aplicaciones:

Determinación intervalos confianza para varianzasDeterminación intervalos confianza para varianzas Pruebas de hipótesis para una varianzaPruebas de hipótesis para una varianza Tablas de contingenciaTablas de contingencia El ajuste de datos a una distribución dada conocida El ajuste de datos a una distribución dada conocida Las pruebas de independencia.Las pruebas de independencia.

Page 58: Curso Práctico de Bioestadística Con Herramientas De Excel

Tabla Distribución 2

Valores Valores 22 para varios para varios ,, Area a su derecha = Area a su derecha = .. 1ª columna = 1ª columna = 1ª fila: áreas en la cola a 1ª fila: áreas en la cola a

la derecha de la derecha de 22 Cuerpo tabla son los Cuerpo tabla son los

valores de valores de 22

Page 59: Curso Práctico de Bioestadística Con Herramientas De Excel

Probabilidad 2 Excel

=DISTR.CHI(x;=DISTR.CHI(x;)) Devuelve la probabilidad de una variable Devuelve la probabilidad de una variable

aleatoria continua siguiendo una aleatoria continua siguiendo una distribución chi cuadrado de una sola cola distribución chi cuadrado de una sola cola con con g.d.l. g.d.l.

P(X>P(X>22))

Page 60: Curso Práctico de Bioestadística Con Herramientas De Excel

Probabilidad 2 Inversa Excel

=PRUEBA.CHI.INV(P,=PRUEBA.CHI.INV(P,)) Devuelve el valor de Devuelve el valor de 22 para una para una

probabilidad dada, de una distribución Ji-probabilidad dada, de una distribución Ji-cuadrado de una sola cola con cuadrado de una sola cola con g.d.l. g.d.l.

Page 61: Curso Práctico de Bioestadística Con Herramientas De Excel

Ejercicios

Ejercicio06 - DistribucionJi-cuadrado.xlsxEjercicio06 - DistribucionJi-cuadrado.xlsx

a)a) Calcular la probabilidad de obtener un Calcular la probabilidad de obtener un valor mayor de 23.7 en una distribución valor mayor de 23.7 en una distribución 22 con con = 14 g.d.l. = 14 g.d.l.

b)b) Calcular el valor de Calcular el valor de 22 despues del cual se despues del cual se encuentre el 5% del área en una encuentre el 5% del área en una distribución Ji-cuadrado con 4 g.d.l.distribución Ji-cuadrado con 4 g.d.l.

Page 62: Curso Práctico de Bioestadística Con Herramientas De Excel

Distribución "F” de Fisher Tambien llamada "F” de Fisher - SchnedecorTambien llamada "F” de Fisher - Schnedecor Representa la distribución muestreal de la razón de Representa la distribución muestreal de la razón de

dos varianzas. Es decir que se obtiene de la razón dos varianzas. Es decir que se obtiene de la razón de dos distribuciones Ji-cuadrado.de dos distribuciones Ji-cuadrado.

Definimos el estadístico F como:Definimos el estadístico F como:

El cual es el valor de una variable aleatoria que tiene El cual es el valor de una variable aleatoria que tiene distribución F con parámetros distribución F con parámetros 11=n=n11-1 y -1 y 22=n=n22-1.-1.

F = s

s12

22

Page 63: Curso Práctico de Bioestadística Con Herramientas De Excel
Page 64: Curso Práctico de Bioestadística Con Herramientas De Excel
Page 65: Curso Práctico de Bioestadística Con Herramientas De Excel

Propiedades de Distribución F Asimétrica, y asintótica al eje x por el lado Asimétrica, y asintótica al eje x por el lado

derechoderecho Su dominio va de 0 a +Su dominio va de 0 a + Area bajo curva desde 0 a +Area bajo curva desde 0 a + =1 =1 Tiene parámetros Tiene parámetros 11=n=n11-1 y -1 y 22=n=n22-1.-1. Entre sus aplicaciones:Entre sus aplicaciones:

Pruebas de hipótesis entre 2 varianzasPruebas de hipótesis entre 2 varianzas Análisis de varianzaAnálisis de varianza Análisis de covarianza.Análisis de covarianza.

Page 66: Curso Práctico de Bioestadística Con Herramientas De Excel

Tabla de Distribución F Tablas independientes de Tablas independientes de

valores de F para valores de F para =0.01 =0.01 y y =0.05 para varias =0.05 para varias combinaciones de combinaciones de 11 y y 22..

Se escoge la tabla para la Se escoge la tabla para la probabilidad deseada y se probabilidad deseada y se escogeescoge11 en la fila en la fila

superior y superior y 22 en la 1ª en la 1ª

columna. La intersección columna. La intersección nos da el valor de F nos da el valor de F deseado.deseado.

Page 67: Curso Práctico de Bioestadística Con Herramientas De Excel

Probabilidad F Excel

=DISTR.F(x,=DISTR.F(x,11, , 22)) Devuelve el área a la derecha de un valor Devuelve el área a la derecha de un valor

en una distribución F con en una distribución F con 11 y y 22 g.d.l. g.d.l. P( F>x )P( F>x )

Page 68: Curso Práctico de Bioestadística Con Herramientas De Excel

Probabilidad F Inversa Excel

=DISTR.F.INV(=DISTR.F.INV(11, , 22)) Devuelve el valor crítico de F(Devuelve el valor crítico de F() para una ) para una

distribución F con distribución F con 11, , 22 g.d.l. g.d.l.

Page 69: Curso Práctico de Bioestadística Con Herramientas De Excel

Ejercicios

Ejercicio07 - DistribucionF.xlsxEjercicio07 - DistribucionF.xlsx

a)a) Determine la probabilidad de tener un Determine la probabilidad de tener un valor de F mayor que 9.28 en una valor de F mayor que 9.28 en una distribución F con distribución F con 11=3 y =3 y 22=3 g.d.l.=3 g.d.l.

b)b) Halle la el valor crítico de FHalle la el valor crítico de F(0.05)(0.05) para para 1=3 1=3

y y 2=15 g.d.l.2=15 g.d.l.