Seminario 7

43
Seminario 7: La distribución normal

Transcript of Seminario 7

Seminario 7: La distribución

normal

Conceptos básicos de la distribución normal

Teorema del Límite Central

La Ley de los Grandes Números

Tipificación de valores

Aprendamos a mirar las tablas

Ejercicios de estimación de probabilidad aplicada a los

cuidados

Escala de autoestima

Altura de adolescentes andaluces

Glucemia basal

La distribución normal

La curva normal o campana de Gauss es la forma que más

comúnmente adopta la distribución de frecuencias en las variables

continuas.

La distribución normal

Recordemos que…

La distribución normal

Esta distribución se basa en:

Teorema del Límite Central

Ley de los Grandes Números

Recordemos que…

Recordemos que….Teorema del Límite Central

Sí se extraen repetidas muestras aleatorias simples de

tamaño n a partir de una población distribuida

normalmente, de media (a) y desviación típica (b)

La media de las muestras extraídas se distribuyen

normalmente con media a y desviación típica b/raíz

cuadrada de N

Y además si el tamaño n de cada muestra es

suficientemente grande las medias de las muestras

tienden a distribuirse normalmente

Recordemos que … La Ley de los Grandes Números

La segunda parte del Teorema del Límite Central.

“Suficientemente grande”:

Para algunos autores: N=100, para otros N=30

Lo obvio: cuanto mayor sea N, más se aproxima la

distribución muestral a la curva normal

Por tanto,

En poblaciones grandes no tenemos que preocuparnos

del supuesto de normalidad

En poblaciones pequeñas hemos de comprobar el

supuesto de normalidad

Por tanto, la curva normal es un modelo matemático basado en

el Teorema del Límite Central y la Ley de los Grandes Números

Depende de los parámetros: media (µ) y desviación típica (σ)

Así, permite calcular la probabilidad de que una variable tome

valores iguales o inferiores a un valor de esa variable, es decir, la

probabilidad acumulada hasta un punto. Para ello debemos usar

unas tablas ya establecidas, pero antes hay que Tipificar los

valores

La distribución normal Recordemos que…

PROPIEDADES

Es simétrica respecto a su media

Media, mediana y moda: coinciden

El 68,3% de las mediciones están en

+/- 1DS de la media

El 95,4% de las mediciones está en

+/- 2DSde la media

El 99,7% de las mediciones está en

+/- 3DSde la media

La distribución normal tipificada

Recordemos que…

La tipificación de los valores se realiza porque…

Existe una curva normal para cada valor de µ y de σ.

Por ello es preciso estandarizar (tipificar) los valores

observados.

Así, la tipificación nos permite conocer si un valor de la

variable corresponde o no a esa distribución de frecuencia

Recordemos que…

Se puede tipificar siempre que trabajemos con variables

continuas que:

Siguen una distribución normal (Teoría Límite Central)

Tienen más de 100 unidades (Ley Grandes Números)

Esto se consigue convirtiendo los valores observados en

valores z o puntuaciones típicas.

Dada una distribución normal cualquiera, podemos obtener

una distribución normal tipificada realizando la

transformación Z.

X

X

X XZ

S

La tipificación de los valores se realiza así:

Recordemos que…

La distribución normal tipificada

La distribución normal tipificada tiene µ = 0 y σ=1 El valor z representa el número de desviaciones típicas que una observación determinada se aleja de la media

Recordemos que…

La distribución normal tipificada

El área bajo la curva

representa la probabilidad

de que un valor determinado

se encuentre en dicha área.

Así el 100% de los valores se

encuentran en el área bajo la

curva con una probabilidad

igual a 1.

Recordemos que…

Antes de hacer los ejercicios, aprendamos a

mirar las tablas de la Normal, que me

permiten saber la probabilidad de que la

variable Z tome un valor entre -∞ y z, o lo que

es lo mismo, la probabilidad acumulada hasta

el valor de z.

Tablas de distribución Normal

Recordemos que…

Ejercicios

En una muestra de 500 mujeres que reciben asistencia

queremos saber cómo la pobreza afecta a su autoestima.

Medimos la autoestima con una escala de actitud de 20

puntos (variable continua). Suponemos que la distribución

sigue una curva normal

Media autoestima: 8

Desviación típica: 2

¿Qué porcentaje de las destinatarias de la asistencia tienen

puntuaciones de autoestima entre 5 y 8?

Ejercicio: escala de autoestima

Sabemos, por la forma de la curva, que:

La media coincide con lo más alto de la campana: 8

La desviación típica es de 2 puntos

El 50% de las observaciones tienen puntuaciones>8

El 50% de las observaciones tienen puntuaciones<8

Aproximadamente el 68% puntúa entre 6 y 10

Aproximadamente el 95% puntúa entre 4 y 12

Aproximadamente el 99% puntúa entre 2 y 14 Media

Ejercicio: escala de autoestima (cont.)

Hay que transformar las puntuaciones en tipificadas

(Z)

5 8 31,5

2 2X

X

X XZ DE

S

Ejercicio: escala de autoestima (cont.)

Nos vamos a la tabla de la distribución normal (columna B) y buscamos 1,50 que sale ,4332

5 8 0,4332p deX aX

O lo que es lo mismo: un poco más del 43% de las destinatarias de asistencia están entre 5 y 8 de autoestima

O si una persona selecciona al azar hay un 43% de posibilidades que la persona tenga una autoestima entre 5 y 8

Ejercicio: escala de autoestima (cont.)

NOTA: También podemos buscar en la tabla I(B), aunque al valor correspondiente a Z=1,5, (p=0.93319) habrá que restarle el valor correspondiente a Z=0 (p=0,5),

¿Qué proporción de mujeres destinatarias tiene una

puntuación igual o más de 13 en la escala de autoestima?

X= 13

13 está entre 12 y 14 que en la curva normal está

situado entre +2DE y +3DE

13 8 52,5

2 2X

X

X XZ DE

S

Ejercicio: escala de autoestima (cont.)

Nos vamos a la tabla de la distribución normal (columna C)

y buscamos 2,5 y sale 0,0062

En %=p(100)=0,62

O lo que es lo mismo: solo 62 de 10.000 destinatarias de asistencia tienen una puntuación mayor de 13 de autoestima

O, si una persona selecciona en un archivo donde se alojan los casos al azar hay menos de 1% de oportunidad de que saliera un caso con una puntuación de más de 13 en autoestima

13 8 0,0062p deX aX

Ejercicio: escala de autoestima (cont.)

NOTA: También podemos buscar en la tabla I(B), aunque habrá que hacer el cálculo 1 menos el valor correspondiente a Z=2,5, (p=0.99379) .

¿Qué proporción de las destinatarias tiene una proporción entre 4 y 10 en

la escala?

Al observar la campana de Gauss vemos que la

puntuación 4 corresponde a -2DE y 10 a 1DE

Tenemos que calcular el área de la campana que se sitúa

entre la media hasta 1DE y además el que existe entre la

media y el que se sitúa en -2DE

4 8 4

22 2

X

X

X XZ DE

S

10 8 21

2 2X

X

X XZ DE

S

Ejercicio: escala de autoestima (cont.)

Nos vamos a la tabla de la distribución normal (columna B) y

buscamos 2 que sale 0,4772

Nos vamos a la tabla (columna B) y buscamos 1: 0,3413

0,4772+0,3413=0,8185

En %=p(100)=81,85%

O lo que es lo mismo el 82% de las destinatarias de asistencia

tienen una puntuación entre 4 y 10 de autoestima

O Si seleccionamos un nombre al azar del archivo de casos

hay 82% de probabilidad de que la persona seleccionada

puntue entre 4 y 10 de autoestima

Ejercicio: escala de autoestima (cont.)

Ejercicio casa blog

¿Cuál es la probabilidad de que una

destinataria de asistencia seleccionada al

azar obtenga una puntuación de 10.5 o

menos en la escala de autoestima?

¡¡Recuerda plantear el problema de forma adecuada expresando gráficamente lo que

se pregunta!!

1.1 ¿Qué porcentaje de niños tienen una talla menor de 150

cm?

2.1 ¿Qué porcentaje de niños tienen una talla por encima de

150cm?

3.1¿Cuál es el porcentaje de niños con una talla comprendida

entre 137,25 y 145,50 cm?

Supongamos que la altura de adolescentes en Andalucía a los

10 años sigue una distribución normal, siendo la media 140 cm

y la desviación típica 5 cm.

Ejercicio: altura de adolescentes Andalucía

¿Qué porcentaje de adolescentes tienen una talla menor de 150 cm?

• Entre -1σ y +1σ esta el 68.3% de la muestra. 68,3/2= 34,1% a cada lado de la media.

• Entre -2σ y +2σ está el 95,4% de la muestra. 95,4-64,3= 31,1%. Ahora 31,1/2= 13,6% a cada lado de la media.

• Entre -3σ y +3σ está el 99,7% de la muestra. 99,7-95,4= 4,3%. Ahora 4,3/2= 2,1% a cada lado de la media.

Miramos la tabla I (B) de la Normal y sale p(X<150)= 0,97725

El 97,72% de los adolescentes miden menos e 150cm

¿Qué porcentaje de adolescentes tienen una talla menor de 150 cm?

¿Qué porcentaje de niños tienen una talla por encima de 150 cm?

p (X>150) = 1- p(x<150)= 1-0,97725= 0,0228 El 2,28% de los niños tienen una talla por encima de 150cm

¿Qué porcentaje tiene una talla comprendida entre 137,25 y 145,50 cm?

Debemos calcular el área que hay desde 137,25 hasta la media y desde 145,50 hasta la media

¿Qué porcentaje tiene una talla comprendida entre 137,25 y 145,50 cm?

Miramos la tabla (columna B)

p =0,2088

p =0,3643

p =0,2088+0,3643=0,5731

NOTA: También podemos buscar en la tabla I(B), aunque habrá que hacer el cálculo: P(x<145,50)- p(X<137,25) = 0,86433 – (1 – 0,70884) = 0,5731

El 57,31 % de los niños tienen una talla comprendida entre 137,25 a 145,50

La glucemia basal de los diabéticos atendidos en la consulta de

enfermería puede considerarse como una variable normalmente

distribuida con media 106 mg por 100ml y desviación típica de

8 mg por 100 ml N (106;8)

3.1. Calcula la proporción de diabéticos con una glucemia basal

inferior o igual a 120

3.2. La proporción de diabéticos con una glucemia basal comprendida

entre 106 y 110 mg por ml.

3.3. La proporción de diabéticos con una glucemia basal mayor de

120 mg por 100 ml.

3.4. El nivel de glucemia basal tal que por debajo de él están el 25%

de los diabéticos, es decir, el primer cuartil.

Ejercicio: Glucemia basal

3.1. Calcula la proporción de diabéticos con una glucemia basal inferior o igual a 120

3.2. La proporción de diabéticos con una glucemia basal comprendida entre 106 y 110 mg por mla.

0 X=106

Z=0 X=106

3.2. La proporción de diabéticos con una glucemia basal comprendida entre 106 y 110 mg por mla.

3.3. La proporción de diabéticos con una glucemia basal mayor de 120 mg por 100 ml.

Z=0 X=106

Z=0,9599

P=0,0401

Alrededor del 4% de los diabéticos tienen una glucemia mayor de 120mg/ml.

3.4. El nivel de glucemia basal tal que por debajo de él están el 25% de los diabéticos, es decir, el primer cuartil.

Z=a

P=0,25

Conozco el área de la curva, pero no el valor de Z Debo buscar en la tabla el valor 0,25 o el más cercano.

Z=0 X=106

Z=a

P=0,25

El nivel de glucemia basal tal que por debajo de él están el 25% de los diabéticos, es 100,6mg/100ml

Los valores más cercanos a 0,25 se encuentran entre Z=0,67 (p = 0,2514) y Z=0,68 (p=0,2483). El valor medio de Z será 0,675.

3.1. Calcula la proporción de diabéticos con una glucemia basal inferior o igual a 120

Ahora con SPSS

Ahora con Spss