2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach...

17
2º BACHILLERATO – MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II – TEMA 5.- ESTADÍSTICA INFERENCIAL PROFESOR: RAFAEL NÚÑEZ ----------------------------------------------------------------------------------------------------------------------------------------------------------------- 1.- Concepto de variable aleatoria Una variable aleatoria (v.a.) es una función que le hace corresponder a cada resultado de un experimento aleatorio un número real. En las v.a., la media se representa por μ, la varianza por σ 2 y la desviación típica por σ. Las v.a. se clasifican en: Variables aleatorias continuas Son aquellas que pueden tomar todos los valores de un intervalo. Por ejemplo, son v.a. continuas la estatura o el peso de una persona, la longitud de un tornillo, el nivel de agua de un embalse, la temperatura en una ciudad a lo largo del día, etc Variables aleatorias discretas Son aquellas que toman valores aislados, x 1 , x 2 ,…., x n . Ejemplos: 1) Tiramos un dado dos veces y sumamos los puntos obtenidos. Entonces X = suma de los puntos = 2 , 3 , 4 ,…., 12 es una v.a. discreta 2) Lanzamos una moneda 5 veces y anotamos el número de caras que han salido. Entonces, X = número de caras = 0 , 1 , 2 , 3 , 4 , 5 es una v.a. discreta También son v.a. discretas, por ejemplo, el número de hijos de un matrimonio, el número de asignaturas suspensas de un alumno, el número de libros vendidos en una librería, la edad de una persona, etc 2.- Variables aleatorias continuas. Distribución normal Consideremos la variable aleatoria continua X = estatura de los chicos de 17 años de Granada. Supongamos que vamos preguntando a “muchos” chicos por su estatura y el más alto mide 183 cm y el más bajo 153 cm. Dibujamos el histograma de frecuencias tomando clases o intervalos de 1,5 cm El polígono de frecuencias se ajusta a una curva. La función f(x) cuya gráfica es esa curva se llama función de densidad de X. En este ejemplo, se han tomado 20 intervalos de amplitud 1,5 cm. El área de cada rectángulo es la probabilidad de que un chico tomado al azar tenga estatura en el intervalo correspondiente. Por ejemplo, el área del primer rectángulo corresponde aproximadamente a p(153 < X < 154,5) La función F(k) = p(X < k) se llama función de distribución de X

Transcript of 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach...

Page 1: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

2º BACHILLERATO – MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II – TEMA 5.- ESTADÍSTICA INFERENCIAL PROFESOR: RAFAEL NÚÑEZ

-----------------------------------------------------------------------------------------------------------------------------------------------------------------

1.- Concepto de variable aleatoria

Una variable aleatoria (v.a.) es una función que le hace corresponder a cada resultado de un experimento aleatorio un número real.

En las v.a., la media se representa por μ, la varianza por σ2 y la desviación típica por σ.

Las v.a. se clasifican en:

Variables aleatorias continuas Son aquellas que pueden tomar todos los valores de un intervalo.

Por ejemplo, son v.a. continuas la estatura o el peso de una persona, la longitud de un tornillo, el nivel de agua de un embalse, la temperatura en una ciudad a lo largo del día, etc

Variables aleatorias discretas Son aquellas que toman valores aislados, x

1, x

2,…., x

n .

Ejemplos: 1) Tiramos un dado dos veces y sumamos los puntos obtenidos. Entonces X = suma de los puntos = 2 , 3 , 4 ,…., 12 es una v.a. discreta 2) Lanzamos una moneda 5 veces y anotamos el número de caras que han salido. Entonces, X = número de caras = 0 , 1 , 2 , 3 , 4 , 5 es una v.a. discreta También son v.a. discretas, por ejemplo, el número de hijos de un matrimonio, el número de asignaturas suspensas de un alumno, el número de libros vendidos en una librería, la edad de una persona, etc

2.- Variables aleatorias continuas. Distribución normal

Consideremos la variable aleatoria continua X = estatura de los chicos de 17 años de Granada. Supongamos que vamos preguntando a “muchos” chicos por su estatura y el más alto mide 183 cm y el más bajo 153 cm. Dibujamos el histograma de frecuencias tomando clases o intervalos de 1,5 cm

El polígono de frecuencias se ajusta a una curva.

La función f(x) cuya gráfica es esa curva se llama función de densidad de X. En este ejemplo, se han tomado 20 intervalos de amplitud 1,5 cm. El área de cada rectángulo es la probabilidad de que un chico tomado al azar tenga estatura en el intervalo correspondiente. Por ejemplo, el área del primer rectángulo corresponde aproximadamente a p(153 < X < 154,5)

La función F(k) = p(X < k) se llama función de distribución de X

Page 2: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 2

Concepto de distribución normal

La mayoría de las variables aleatorias continuas tienen una función de densidad f(x) cuya gráfica tiene forma de campana. A esta gráfica se le llama campana de Gauss. La gráfica de la función de densidad (campana de Gauss) tiene la siguiente forma:

La gráfica es simétrica respecto de la recta vertical de ecuación x = µ. Se puede demostrar que en el intervalo (μ – σ , μ + σ) se encuentran aproximadamente el 68% de los datos.

Cuando la curva de densidad tiene esta forma diremos que X sigue una distribución normal de

media µ y desviación típica σ. Se escribe así: X → N(µ, σ)

La fórmula de la función de densidad de una distribución normal es f(x) =

1 x.

2

2

1.

. 2e

− −µ

σ

σ π

Las distribuciones de este tipo son muy corrientes en la vida real.

Propiedades elementales de la distribución normal:

p(–∞ < X < ∞) = 1

Luego, el área a la izda de μ y a la dcha de μ son iguales y cada una vale 0,5

P(X = a) = área del segmento vertical que pasa por “a”. Luego, en las v.a. continuas, p(X = a) = 0

p(X < a) = p( X ≤ a) = “el área que hay a la izquierda de X = a”

Distribución N(0,1)

Si en una distribución normal X → N(µ, σ), la media es µ = 0 y la desviación típica es σ = 1,

resulta entonces la distribución Z → N(0,1). Esta variable se llama distribución normal tipificada y la gráfica de su función de densidad es la campana de Gauss centrada en 0

Page 3: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 3

3.- Cálculo de probabilidades en la distribución normal

Uso de la tabla de la distribución N(0,1)

En la distribución normal Z → N(0,1). Llamaremos f(k) = p(Z < k) = p(Z ≤ k)

Para hallar f(k), en lugar de calcular el área a la izquierda de k, se usa la siguiente tabla:

Usando la tabla se puede determinar f(k), con k entre 0 y 4,09.

Fíjate que si k ≥ 3,9 la probabilidad se toma igual a 1. Ejemplo:

Para hallar f(1,24) buscamos en la 1ª columna el número 1,2 y en la 1ª fila 0,04.

La intersección nos da el valor 0,8925. Por tanto, f(1,24) = 0,8925

También se puede usar la tabla en orden inverso para hallar el valor de k.

Ejemplos: 1) Supongamos que f(k) = 0,7190. Buscamos 0,7190 dentro de la tabla y vemos que le corresponde

0,5 (en la 1ª columna) y 0,08 (en la 1ª fila). Por tanto a = 0,58 2) Supongamos que f(k) = 0,9376. En este caso 0,9376 no está en la tabla; los valores más próximos

son 0,9370 (que corresponde a k1 = 1,53) y 0,9382 (que corresponde a k2 = 1,54). Como 0,9376 está prácticamente a la misma distancia de los valores encontrados, tomaremos como valor de k el punto medio de 1,53 y 1,54, es decir k = 1,535

Page 4: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 4

Reglas útiles para calcular probabilidades en la distribución N(0,1)

1) Cálculo de P(Z > k)

P(Z > k) = “Área a la dcha de k” = “Toda el área” – “Área a la izda de k” = 1 – P(Z < k)

Ejemplo: p(Z > 1,32) = 1 – p(Z < 1,32) = 1 – 0,9066 = 0,0934

2) Cálculo de P(Z < – k)

P(Z < – k) = “ Área a la izda de – k” = “Área a la dcha de k” = P(Z > k) = 1 – P(Z < k)

Ejemplo: p(Z < – 0,84) = 1 – p(Z < 0,84) = 1 – 0,7995 = 0,2005

3) Cálculo de P(Z > – k)

P(Z > – k) = “ Área a la derecha de – k” = “Área a la izquierda de k” = P(Z < k)

Ejemplo: p(Z > – 1,48) = p (Z < 1,48) = 0,9306

Page 5: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 5

4) Cálculo de P(a < Z < b)

P(a < Z < b) = “ Área entre a y b” = “Área a la izda de b” – “Área a la izda de a” =

= P(Z < b) – P(Z < a)

Ejemplo: p(2 < Z < 2,76) = p(Z < 2,76) – p(Z < 2) = 0,9971 – 0,9772 = 0,0199

5) Cálculo de P(– b < Z < – a)

P(– b < Z < – a) = “ Área entre – b y – a” = “Área entre a y b” =

= P(a < Z < b) = P(Z < b) – P(Z < a)

Ejemplo: p(– 1,5 < Z < – 0,99) = p(Z < 1,5) – p(Z < 0,99) = 0,9332 – 0,8389 = 0,0943

6) Cálculo de P(– a < Z < b)

P(– a < Z < b) =“Área entre – a y b”=“Área a la izda de b” – “Área a la izquierda de – a”

= P(Z < b) – P(Z < – a) = p(Z < b) – [ 1 – p(Z < a) ] = p(Z < a) + p(Z < b) – 1

Ejemplo: p(– 1 < Z < 2) = p(Z < 1) + p(Z < 2) – 1 = 0,8413 + 0,9772 – 1 = 0,8185

Page 6: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 6

Tipificación de una distribución normal N(µ, σ)

Se puede demostrar que si X → N(µ , σ), entonces la variable Z = −µ

σ

X → N(0,1).

A este proceso se le llama tipificación de la variable.

La tipificación nos permite hallar probabilidades en una distribución X → N(µ , σ)

transformándola en una variable Z → N(0,1).

Por ejemplo, p(a < X < b) = p(−µ

σ

a<

−µ

σ

X <

−µ

σ

b) = p(

−µ

σ

a < Z <

−µ

σ

b)

Esta probabilidad la podemos calcular usando las reglas vistas anteriormente.

Ejemplo:

Si X → N(5,4) , entonces p(1 < X < 7) = p(−1 5

4<

−X 5

4 <

−7 5

4) = p(– 1 < Z < 0,5) =

= p(Z < 1) + p(Z < 0,5) – 1 = 0,8413 + 0,6915 – 1 = 0,5328

ACTIVIDADES

1 En una distribución N(22,5), calcula: a) P(X ≤ 27) b) P(X ≥ 23) c) P(X < 20)

d) p(X > 17) e) P(15 ≤ X < 20) f) P(17 < X ≤ 30) 2 Los pesos de los habitantes de una ciudad se distribuyen normalmente, con media 70 kg y desviación típica 5 kg. Determina: a) La probabilidad de que el peso de un individuo elegido al azar esté entre 60 y 65. b) ¿Qué porcentaje pesaría más de 68 kg? c) Si hubiera 8 000 habitantes, ¿cuántos habitantes pesarían menos de 75 kg?

4.- Teorema central del límite

Sea X una v.a. continua con media µ y desviación típica σ.

Consideramos todas las muestras con reemplazamiento de tamaño n de dicha población: M

1 , M

2 , M

3 , …., etc

Sea 1x la media de la muestra M

1 ,

2x la media de M

2 ,

3x la media de M

3, … , etc

La variable aleatoria X = medias de las muestras de tamaño n: X = 1

x , 2

x , 3

x , … , etc

tiene una distribución con media µ y desviación típica σ

n

.

Si además n ≥ 30 ó X → N(µ,σ), entonces X → N( µ , σ

n

)

Ejemplo:

Consideremos una población formada por 4 estudiantes (N = 4)

Sea la v.a. continua X = notas de un examen = 8, 9, 5, 6. Puedes comprobar que µ = 7 , σ = 5

2

Si ahora consideramos todas las muestras con reemplazamiento de tamaño dos (n = 2) y las medias

de estas muestras, obtenemos una nueva variable X , que viene expresada en la siguiente tabla:

Muestras 8-8 8-9 8-5 8-6 9-8 9-9 9-5 9-6 5-8 5-9 5-5 5-6 6-8 6-9 6-5 6-6

Variable media = X 8 8.5 6.5 7 8.5 9 7 7.5 6.5 7 5 5.5 7 7.5 5.5 6

La media de X es también 7 y su desviación típica es

55 52

4 2n 2

σ

= = =

Page 7: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 7

ACTIVIDADES

3 El cociente intelectual de los alumnos de un centro educativo se distribuye según una ley Normal de media 110 y desviación típica 15. Se extrae una muestra aleatoria simple de 25 alumnos. a) ¿Cuál es la probabilidad de que la media del cociente intelectual de los alumnos de esa muestra sea superior a 113? b) Razone cómo se vería afectada la respuesta a la pregunta anterior si el tamaño de la muestra aumentase. (Propuesto para selectividad Andalucía 2009) 4 Sea X una variable aleatoria Normal de media 50 y desviación típica 4. a) Para muestras de tamaño 4, ¿cuál es la probabilidad de que la media muestral supere el valor 54? b) Si

16X indica la variable aleatoria “media muestral para muestras de tamaño 16”, calcule el valor

de “a” para que P( 50 – a ≤ 16X ≤ 50 + a) = 0,9876 (Propuesto para selectividad Andalucía 2005)

5 Una empresa de teléfonos móviles ha hecho un estudio sobre el tiempo que tardan sus baterías en descargarse, llegando a la conclusión de que dicha duración, en días, sigue una ley Normal de media 3.8 y desviación típica 1. Se toma una muestra de 16 móviles de esta empresa. Halle la probabilidad de que: a) La duración media de las baterías de la muestra esté comprendida entre 4,1 y 4,3 días. b) La duración media de las baterías de la muestra sea inferior a 3,35 días.

(Propuesto para selectividad Andalucía 2004) 6 La resistencia a la rotura, de un tipo de hilos de pesca, es una variable aleatoria Normal, con media 4 kg y desviación típica 1,4 kg. Se toman muestras aleatorias de 25 hilos de este tipo y se obtiene la resistencia media a la rotura. a) ¿Cómo se distribuye la resistencia media a la rotura? b) ¿Cuál es la probabilidad de que la resistencia media a la rotura no pertenezca al intervalo de extremos 3,90 kg y 4,15 kg ?

(Propuesto para selectividad Andalucía 2004)

5.- Variables aleatorias discretas. Distribución binomial

Distribución de probabilidad de una variable aleatoria discreta Se llama distribución de probabilidad de una v.a. discreta X que toma valores x

1, x

2, …, x

n al conjunto

de probabilidades: p1 = p(X = x

1), p

2 = p(X = x

2), …. p

n = p(X = x

n)

O sea, la distribución de probabilidad son los valores pi = p(X = x

i)

Para calcular la distribución de probabilidad se puede hacer una tabla de probabilidades como la siguiente:

xi p

i = p(X = x

i)

x1 p

1

x2 p

2

…. …. x

n p

n

A partir de la tabla se puede dibujar un diagrama de barras, llamado gráfico de probabilidades, representando en el eje horizontal los valores x

i y en el eje vertical los valores p

i

Parámetros de una variable aleatoria discreta

Los parámetros más utilizados en una v.a. discreta son:

Media aritmética o esperanza matemática: =∑ i iμ x p Varianza: 2 2 2

i iσ x p μ∑= −

Desviación típica: ∑= = −2 2 2

i iσ σ x p μ

Nota: La varianza también se puede calcular con la fórmula σ = − µ∑2 2

(x ) pi i

Page 8: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 8

Ejemplo: En el experimento aleatorio de lanzar un dado dos veces. Sea X = “nº de veces que sale el 6”. X es una variable aleatoria discreta, pues X sólo toma los valores x

i: 0 , 1 y 2

Los resultados del experimento los podemos obtener mediante esta tabla:

La distribución de probabilidad es:

Por ejemplo, si queremos calcular la probabilidad de que salga el 6 menos de 2 veces:

P(X < 2) = 1 – p(X = 2) = 1 – 1

36= ≅ =

350,9722 97,22%

36, que coincide con p(X = 0) + p(X = 1)

El gráfico de probabilidades sería:

En todas las distribuciones de probabilidad discreta, se cumple: ∑ ip = 1

Vamos a calcular los parámetros de la distribución:

Media o esperanza matemática de X: = = = ≅∑ i i

12 1μ x p 0,3333

36 3

Varianza de X: ∑

= − = − = ≅

2

2 2 2

i i

7 1 5σ x p μ 0,2778

18 3 18 =

7

18 –

21

3 = −

7 1

18 9 =

5

18= 0,278

Desviación típica de X: = ≅=

2 5σ σ 0,527

18

1 2 3 4 5 6 1 11 12 13 14 15 16 2 21 22 23 24 25 26 3 31 32 33 34 35 36 4 41 42 43 44 45 46 5 51 52 53 54 55 56 6 61 62 63 64 65 66

xi p

i = p(X = x

i)

0 25

36= 0,6944 = 69,44%

1 10

36= 0,2778 = 27,78%

2 1

36= 0,0278 = 2,78%

Total ∑ ip = 1 = 100%

xi p

i x

i p

i x

i2 p

i

0 25

36 0 0

1 10

36

10

36

10

36

2 1

36

2

36

4

36

Total 1 =

12 1

36 3 =

14 7

36 18

Page 9: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 9

Concepto de distribución binomial Si realizamos n veces el mismo experimento y le llamamos X = número de veces que ocurre un suceso A”, entonces X puede tomar los valores: 0, 1, 2, 3,…., n. Llamamos p = p(A).

X es una v.a. discreta con n + 1 valores.

Decimos que la variable aleatoria X tiene distribución de probabilidad binomial B(n , p).

Se representa así: X → B(n , p)

Ejemplos de distribuciones binomiales:

1) Tiramos un dado 15 veces; X = número de veces que sale el 5. Entonces X → B(15 , 1

6)

2) La probabilidad de nacer niña es del 65%. Observamos 30 nacimientos; X = número de niñas.

Entonces, X → B(30 ; 0,65)

3) La probabilidad de que al lanzar a canasta un jugador de baloncesto es del 70%.

Lanza 50 veces; X = número de aciertos. Entonces, X → B(50; 0,7)

4) Lanzamos una moneda 25 veces; X = número de cruces. Entonces, X → B(25 ; 0,5)

Factorial de un número n Es el producto de n por los números naturales menores que él. El factorial de n se representa por n! y se lee “n factorial”.

n ! = n.(n – 1).(n – 2). .... . 3 . 2 . 1 Ejemplos: 1 ! = 1 2 ! = 2 . 1 = 2 3 ! = 3 . 2 . 1 = 6 4 ! = 4 . 3 . 2 . 1 = 24 etc

0 ! = 1 (por convenio)

El factorial de un número también se puede hallar con la calculadora científica usando la función x! Por ejemplo, si queremos calcular 13! , el proceso es el siguiente: 13 x! .

Nos da como resultado: 6 227 020 800.

Este resultado coincidiría con la multiplicación: 13.12.11.10.9.8.7.6.5.4.3.2.1

Número combinatorio Dados dos números naturales n y m con n ≥ m se define el número combinatorio n sobre m así:

n n=

m m . (n m)

!

! !

Propiedades básicas de los números combinatorios

1) n n=

m n m

Ejemplo:

5.4.35 5 5= = =

2 . (5 2) 2 . 32

!! !

! ! ! ! 2 3! .

=10

5.4.35 5 5= = =

3 . (5 3) 3 . 23

!

!! !

! ! ! ! 3!

=10. 2!

2)

nn=

n 0= 1 Ejemplo:

5 5 5 5= = = =1

5 . (5 5) 5 . 0 5 . 15

5 5 5= = =1

0 . (5 0) 1 . 50

! ! !

! ! ! ! !

! !

! ! !

3)

n=

1n Ejemplo:

5.45 5 5= = =

1 . (5 1) 1 . 41

!! !

! ! ! 1 4.= 5!

Page 10: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 10

Distribución de probabilidad en una B(n , p)

pk = p(X = k) =

n

k pk.(1 – p)n – k , k = 0, 1, 2,…, n

Por ejemplo, en una B(5 ; 0,2) → p3 = p(X = 3) =

5

3 0,23. 0,82 = 10 . 0,008 . 0,64 = 0,0512

ACTIVIDADES

7 Lanzamos una moneda 10 veces. Hallar la probabilidad de que salgan: a) 7 cruces b) Más de una cruz c) Entre 3 y 6 cruces.

8 El 4% de los cds que fabrica una determinada empresa informática resulta defectuoso. Los cds se distribuyen en tarrinas de 20 unidades. Calcular la probabilidad de que en una caja haya,

a) al menos dos defectuosos b) ninguno defectuoso c) a lo sumo 3 defectuosos 9 Un dado trucado es tal que la probabilidad de sacar el 6 es del 60%. Si se tira el dado 7 veces, ¿cuál es la probabilidad de que salga el 6 más de 5 veces? 10 Una encuesta revela que el 20% de la población es favorable a un político y el resto es desfavorable. Se eligen 6 personas al azar. Calcula la probabilidad de que: a) Las 6 personas sean desfavorables. b) Al menos dos personas sean favorables

Parámetros de una distribución binomial B(n , p)

Media aritmética o esperanza matemática: =μ np Varianza: = −2

σ np(1 p)

Desviación típica: = = −2

σ σ np(1 p)

Teorema de De Moivre de la binomial

Sea una v.a. X que sigue una distribución binomial B(n , p) siendo np ≥ 5 y n(1 – p) ≥ 5. Entonces, la distribución binomial se puede sustituir por otra v.a. X´ que sigue una distribución normal

−N(np , np(1 p))

De esta forma, podemos calcular probabilidades de una B(n , p) de forma más sencilla y rápida. Se cumple: 1) p(X = a) = p(a – 0,5 < X´ < a + 0,5) 2) p(X < a) = p(X´ < a – 0,5)

3) p(X ≤ a) = p(X´ < a + 0,5) 4) p(a < X < b) = p(a + 0,5 < X´ < b – 0,5)

5) p(a ≤ X ≤ b) = p(a – 0,5 < X´ < b + 0,5)

ACTIVIDADES

11 La probabilidad de que un paciente se recupere de una rara enfermedad de la sangre es de 0.4. Si se sabe que 100 personas han contraído esta enfermedad, calcula la probabilidad de que:

a) al menos 30 sobrevivan b) más de 46 sobrevivan c) menos de 50 no sobrevivan 12 El 15% de los habitantes de una determinada región son diabéticos. Se toma una muestra de 600 de esos habitantes y se pide: a) Número esperado de habitantes que no son diabéticos. b) Probabilidad de que el número de diabéticos sea mayor que 80. c) Probabilidad de que el número de diabéticos esté entre 80 y 110.

Page 11: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 11

6.- Intervalos de confianza

Un intervalo de confianza es un intervalo en el que sabemos que se encuentra un parámetro de una población con una probabilidad determinada.

El nivel de confianza (nc) es la probabilidad de que el parámetro esté en el intervalo de confianza

El nivel de confianza se representa por nc = 1 – α (A α se le llama “nivel de significación”)

El error de estimación o error máximo admisible ( E ) es el mayor error que podemos cometer cuando tomamos como aproximación del parámetro poblacional el parámetro de una muestra de tamaño n

En este curso, sólo vamos a hacer estimaciones para la media μ de una población normal, con μ

desconocida y σ conocida, y para la proporción, p, de individuos de una población que tienen una determinada característica. Luego, vamos a trabajar con intervalos de confianza para la media y para la proporción de la población Parámetro a estimar

Situación Intervalo de

confianza Error máximo

admisible Interpretación

gráfica

Media

Sea X es una v.a. que sigue una distribución normal de la que desconocemos la media

poblacional µ y σ es conocida. Queremos estimar

cuánto vale. Tomamos una muestra de

tamaño n cuya media es x

( , )I x E x E= − +

El punto medio

del intervalo es x y su amplitud es

2E

2

.E z

σ

=

x E− x x E+

Proporción

Si X una v.a. que sigue una distribución normal de la que desconocemos la proporción

de individuos, p, de la población que tiene una

cierta característica y queremos estimar su valor.

Tomamos una muestra de tamaño n cuya proporción de individuos que cumple dicha

característica es �p

� �( , )I p E p E= − +

El punto medio del intervalo es �p y la amplitud

es 2E

� �

2

(1 ).

p pE z

=

�p E− �p �p E+

2

es el valor de la tabla de la N(0,1) que cumple 2

1( )

2

1 ,

c

c

nz

siendo n el nivel de confianza

αφ

α

+

=

= −

Propiedades básicas de los intervalos de confianza

- Cuanto mayor es el tamaño de la muestra, n, menor es el error E (o sea más estrecho es el intervalo de confianza) - Cuanto mayor es el nivel de confianza, n

c , mayor es el error E (o sea más amplio es el intervalo

de confianza)

Page 12: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 12

ACTIVIDADES

13 Se quiere hacer un estudio de mercado para conocer el precio medio de los libros de narrativa que se venden en la actualidad. Para ello se elige una muestra aleatoria de 121 libros, encontrando que tienen un precio medio de 23 €. Se sabe que el precio de los libros de narrativa sigue una distribución Normal con media desconocida y desviación típica 5 €.

a) Obtenga un intervalo de confianza, al 98.8%, para el precio medio de esos libros.

b) ¿Cuántos libros habría que elegir como muestra para que, con la misma confianza, el error máximo de la estimación no excediera de 1 €?

(Propuesto para selectividad Andalucía 2014)

14 Con el fin de estudiar el precio medio del litro de gasolina en una provincia en un determinado día, se seleccionan al azar ese día 9 estaciones de servicio y se observan los siguientes precios, en euros, de un litro de gasolina: 1.3, 1.2, 1.4, 1.27, 1.25, 1.32, 1.37, 1.38, 1.23. Se sabe que el precio del litro de gasolina se distribuye según una ley Normal con desviación típica igual a 0.18 euros.

a) Obtenga un intervalo de confianza, al 95%, para estimar el precio medio del litro de gasolina.

b) Calcule el tamaño muestral mínimo necesario para estimar el precio medio del litro de gasolina con un error no superior a 0.08 euros, con el mismo nivel de confianza.

(Propuesto para selectividad Andalucía 2014) 15 Una panadería produce barras de pan cuya longitud, medida en centímetros, sigue una distribución Normal con una desviación típica de 5 centímetros.

a) A partir de una muestra de 100 barras de pan se ha calculado el intervalo de confianza para la media poblacional, resultando ser (31.2, 33.4). Halle la media muestral y el error de estimación.

b) Para un nivel de confianza del 96%, halle el tamaño muestral mínimo necesario para que el error de estimación máximo sea 1.5. (Propuesto para selectividad Andalucía 2014) 16 El peso de los sobres de café que fabrica una empresa sigue una ley Normal de media desconocida y desviación típica 0.3 g. Se quiere construir un intervalo de confianza para estimar dicha media, con un nivel de confianza del 98%, y para ello se toma una muestra de 9 sobres.

a) ¿Qué amplitud tendrá dicho intervalo?

b) ¿Cómo afectaría a dicha amplitud un aumento del tamaño de la muestra, manteniendo el mismo nivel de confianza?

c) Obtenga el intervalo de confianza sabiendo que los pesos, en gramos, de los sobres de la muestra son: 7 7.1 7 6.93 7.02 7 7.01 6.5 7.1.

(Propuesto para selectividad Andalucía 2013) 17 El peso de las calabazas de una determinada plantación sigue una ley Normal con desviación típica 1200 g.

a) Halle el tamaño mínimo de la muestra que se ha de elegir para, con un nivel de confianza del 95%, estimar el peso medio con un error menor de 450 g.

b) Para el mismo nivel de confianza, indique, razonando la respuesta, si el error aumenta o disminuye al aumentar el tamaño de la muestra.

(Propuesto para selectividad Andalucía 2012)

Page 13: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 13

18 Para estimar la proporción de habitantes que es favorable a la construcción de un centro comercial en un municipio, se ha obtenido el intervalo de confianza (0.31 , 0.39), al 94%.

a) ¿Cuál ha sido el valor de la proporción muestral?

b) Si la muestra aleatoria elegida de esa población para el estudio fue de 500 personas, ¿cuántas de ellas deseaban la construcción del centro comercial?

c) Se desea repetir el estudio para obtener un intervalo de confianza con un error máximo de 0.03 y el mismo nivel de confianza. ¿Cuántas personas, como mínimo, debe tener la nueva muestra aleatoria?

(Propuesto para selectividad Andalucía 2014)

19 Para estimar la proporción de balances contables incorrectos de un banco, se seleccionan aleatoriamente 200 balances, y se encuentra que 19 de ellos son incorrectos.

a) Obtenga un intervalo de confianza, al 95%, para la proporción de balances incorrectos.

b) ¿Cuántos balances se deberán seleccionar para que, con un nivel de confianza del 99%, el error de la estimación no sea superior a 0.02?

(Propuesto para selectividad Andalucía 2014)

20 Queremos estudiar la proporción de personas de una población que acceden a internet a través de teléfono móvil. Para ello hacemos una encuesta a una muestra aleatoria de 400 personas de esa población, y obtenemos que 240 de ellas acceden a internet a través del móvil.

a) Determine un intervalo de confianza, al 98.5%, para la proporción de personas de esa población que acceden a internet a través del teléfono móvil.

b) Razone el efecto que tendría sobre la amplitud del intervalo de confianza el aumento o disminución del tamaño de la muestra, suponiendo que se mantuvieran la misma proporción muestral y el mismo nivel de confianza.

(Propuesto para selectividad Andalucía 2013)

21 Una empresa consultora quiere estudiar algunos aspectos de la vida laboral de los trabajadores de una ciudad. Para ello selecciona una muestra aleatoria de 500 trabajadores, de los que 118 afirman residir en otra ciudad. Con un nivel de confianza del 93%,

a) calcule un intervalo de confianza para la proporción de trabajadores que residen fuera.

b) calcule el error cometido en el intervalo anterior. (Propuesto para selectividad Andalucía 2010)

7.- Contraste de hipótesis

Un contraste o test de hipótesis es el procedimiento mediante el cual se investiga la veracidad o falsedad de una afirmación acerca de algún parámetro (media, proporción o desviación típica) de una población basándose en los resultados obtenidos al tomar una muestra de la población.

Sólo vamos a estudiar contraste de hipótesis para la media μ de una población normal, con μ desconocida y σ conocida, y para la proporción de una población, p Hipótesis nula, H

0: Es la afirmación emitida o formulada, es decir, la que se desea contrastar.

Inicialmente se considera que es verdadera y se mantiene o se rechaza como consecuencia del contraste.

Page 14: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 14

Hipótesis alternativa, H

1: Es cualquier otra hipótesis que recoja una situación contraria a la

dada en la hipótesis nula, de forma que la aceptación de la hipótesis nula H0 implica el rechazo

de la alternativa H1 y viceversa, el rechazo de H0 implica la aceptación de H

1.

Test de hipótesis para la media

Sea una población normal de la que desconocemos la media μ y σ es conocida

Queremos realizar un test de hipótesis para la media de la población con nivel de significación α

El nivel de confianza, es nc = 1 – α

Para ello tomamos una muestra de la población de tamaño n, cuya media es x

Podemos realizar varios tipos de contraste de hipótesis:

Contraste Hipótesis Estadístico

de contraste Región de aceptación

bilateral 0 0

1 0

: ( )

: ( )

H hipótesis nula

H hipótesis alternativa

µ µ

µ µ

=

0x

z

n

µ

σ

=

2 2

( , )R z zα α

= −

2

− 2

unilateral (tipo I)

0 0

1 0

: ( )

: ( )

H hipótesis nula

H hipótesis alternativa

µ µ

µ µ

>

2

( , )R zα

= −∞

2

unilateral (tipo II)

0 0

1 0

: ( )

: ( )

H hipótesis nula

H hipótesis alternativa

µ µ

µ µ

<

2

( , )R zα

= − ∞

2

Si el estadístico de contraste, z∈ R se acepta la hipótesis nula H

0. En caso contrario, se rechaza y por tanto, se acepta la

hipótesis alternativa H1

2

es el valor de la tabla de

la N(0,1) que cumple

2

1( )

2

1 ,

c

c

nz

siendo n el nivel de confianza

αφ

α

+

=

= −

Page 15: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 15

ACTIVIDADES

22 En una bodega utilizan una máquina que debe envasar el vino en botellas con un contenido de 750 ml. Para comprobar si esa máquina funciona correctamente, se toma una muestra de 36 botellas y se observa que el contenido medio de las mismas es de 748 ml.

Suponiendo que la variable “contenido” sigue una distribución Normal con varianza 25, analice mediante un contraste de hipótesis bilateral (H

0: μ = 750) si se puede aceptar, con un nivel de

significación de 0.05, que la máquina envasadora funciona correctamente.

(Propuesto para selectividad Andalucía 2013)

23 Suponiendo que la variable “años de vida de los individuos de un país” sigue una distribución Normal con desviación típica 8.9 años, se desea contrastar la hipótesis de que la vida media de los mismos no supera los 70 años. A partir de una muestra aleatoria de 100 individuos se ha obtenido que su vida media ha sido 71.8 años.

a) Formule el contraste de hipótesis que indica el enunciado.

b) Determine la región crítica a un nivel de significación del 5%.

c) Con los datos muestrales, ¿existe evidencia estadística para rechazar la hipótesis a ese nivel de significación?

(Propuesto para selectividad Andalucía 2011) 24 Un agricultor piensa que la producción media por naranjo, en su finca, es de 88 kg o más. Para confirmar su creencia selecciona, al azar, 10 de sus naranjos, pesa su producción y obtiene como resultado, en kg, para cada uno de ellos:

80, 83 , 87 , 95 , 86 , 92, 85 , 83 , 84 , 95

Se acepta que la producción de un naranjo sigue una distribución Normal con desviación típica 5 kg.

a) Plantee el contraste de hipótesis unilateral que responda a las condiciones del problema y determine la región crítica para un nivel de significación α = 0,05

b) Con los datos de esta muestra, ¿qué conclusión debe obtener el agricultor sobre la producción media por naranjo de su finca, utilizando ese mismo nivel de significación?

(Propuesto para selectividad Andalucía 2010) 25 Una máquina de envasado está diseñada para llenar bolsas con 300 g de almendras. Para comprobar si funciona correctamente, se toma una muestra de 100 bolsas y se observa que su peso medio es de 297 g. Suponiendo que la variable “peso” tiene una distribución Normal con varianza 16, y utilizando un contraste bilateral ¿es aceptable, a un nivel de significación de 0.05, que el funcionamiento de la máquina es correcto? (Propuesto para selectividad Andalucía 2010)

26 La concejalía de Educación de una determinada localidad afirma que el tiempo medio dedicado a la lectura por los jóvenes de entre 15 y 20 años de edad es, a lo sumo, de 8 horas semanales. Para contrastar esta hipótesis, (H

0: μ ≤ 8) se escoge al azar una muestra de 100 jóvenes, de

entre 15 y 20 años, y se obtiene una media de 8.3 horas de dedicación a la lectura. Supuesto que el tiempo dedicado a la lectura sigue una ley Normal con desviación típica igual a 1 hora, ¿qué se puede decir, a un nivel de significación del 5%, sobre la afirmación de la concejalía?

(Propuesto para selectividad Andalucía 2014)

Page 16: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 16

27 Hace 10 años, el consumo medio mensual de electricidad por vivienda en Canarias era de 320 Kw. En el año 2005 se ha tomado una muestra aleatoria de 25 viviendas y se ha obtenido un consumo medio mensual de 350 Kw con una desviación típica de 80 Kw

a) Con un nivel de significación del 10%, ¿se acepta que el consumo medio sigue siendo 320 Kw frente a que ha aumentado?

b) Para estimar el consumo medio con un error menor de 6 Kw y con un nivel de confianza del 90%, ¿qué número de viviendas es necesario considerar?

28 Un índice para calibrar la madurez lectora de los alumnos de primaria se distribuye según una ley Normal con desviación típica 2. Elegida una muestra de 18 alumnos en un centro de primaria, se obtiene una media muestral de 10.8 en dicho índice. Mediante el uso de un contraste de hipótesis, ¿se puede aceptar, con un nivel de significación del 1%, la hipótesis nula de que la media del índice de madurez lectora de los alumnos de este centro no es inferior a 11?

(Propuesto para selectividad Andalucía 2012)

Test de hipótesis para la proporción

Sea una población de la que desconocemos la proporción, p, de individuos que tienen una determinada característica.

Queremos realizar un test de hipótesis para la proporción p con nivel de significación α

Para ello tomamos una muestra de tamaño n, cuya proporción de individuos que cumplen dicha

característica es �p

Podemos realizar varios tipos de contraste de hipótesis:

Contraste Hipótesis Estadístico de

contraste Región de aceptación

bilateral 0 0

1 0

: ( )

: ( )

H p p hipótesis nula

H p p hipótesis alternativa

=

�0

0 0(1 )

p pz

p p

n

=

2 2

( , )R z zα α

= −

2

− 2

unilateral (tipo I)

0 0

1 0

: ( )

: ( )

H p p hipótesis nula

H p p hipótesis alternativa

>

2

( , )R zα

= −∞

2

unilateral (tipo II)

0 0

1 0

: ( )

: ( )

H p p hipótesis nula

H p p hipótesis alternativa

<

2

( , )R zα

= − ∞

2

Si el estadístico de contraste, z∈ R se acepta la hipótesis nula H

0. En caso contrario se rechaza y por tanto se acepta la

hipótesis alternativa H1

2

es el valor de la tabla de

la N(0,1) que cumple

2

1( )

2

1 ,

c

c

nz

siendo n el nivel de confianza

αφ

α

+

=

= −

Page 17: 2º BACHILLERATO - iesaricel.orgiesaricel.org/rafanogal/bachillerato/2bach-ccss2-15-16/2bach ccss... · Esta variable se llama distribución normal tipificada y la gráfica de su

Página 17

ACTIVIDADES

29 Un estudio sociológico afirma que el 70% de las familias cena viendo la televisión. Se desea contrastar la veracidad de esta afirmación y, para ello, se toma una muestra de 500 familias, en la que se observa que 340 ven la televisión mientras cenan. Decida, mediante un contraste de hipótesis, si la afirmación es cierta con un nivel de significación de 0.01. (Propuesto para selectividad Andalucía 2011) 30 El director de una televisión afirma que un nuevo programa que va a emitirse será visto, al menos, por un 30% de personas. Una vez emitido se realizó una encuesta a 500 personas, elegidas al azar, y ésta reveló que 130 de ellas habían visto ese programa.

a) Formule la hipótesis nula y la alternativa del contraste de hipótesis que permite determinar si los datos de la encuesta realizada son compatibles con la afirmación del director.

b) Halle la región crítica de ese contraste para un nivel de significación del 5.5%.

c) Según el dato obtenido en el apartado anterior, ¿qué conclusión se obtiene sobre la afirmación realizada por el director de esa televisión?

(Propuesto para selectividad Andalucía 2011)

31 Se trabaja con la hipótesis de que uno de cada diez varones manifiesta algún tipo de daltonismo.

a) Elegidos 400 varones, se detectan 50 daltónicos. Con un nivel de significación del 10%, ¿se puede aceptar la hipótesis de partida?

b) Sobre la muestra estudiada en a), ¿se obtendría la misma conclusión si α = 0.02? 32 Se considera que, a lo sumo, el 5% de los artículos guardados en un almacén son defectuosos. Pasado un tiempo, la persona encargada del mantenimiento del almacén decide investigar si esa estimación es adecuada. Para ello, escoge aleatoriamente 300 artículos de los que 35 están defectuosos.

a) Plantee un contraste de hipótesis ( 05.0:0

≤pH ) para determinar si ha aumentado la proporción

de artículos defectuosos. Obtenga la región crítica del contraste para un nivel de significación del 5%.

b) ¿Qué conclusión se obtiene con los datos muestrales observados?

(Propuesto para selectividad Andalucía 2012)

33 Se cree que al menos el 25% de los usuarios de teléfonos móviles son de contrato. De una encuesta realizada a 950 personas, elegida al azar, 200 de ellas manifestaron que tenían teléfono móvil de contrato. A la vista de estos resultados y con un nivel de significación del 5%, ¿puede admitirse que la proporción de personas con contrato en su teléfono móvil ha disminuido? Utilice para la resolución del problema un contraste de hipótesis con hipótesis nula “la proporción p es mayor o igual que 0.25”. (Propuesto para selectividad Andalucía 2012) 34 En un barrio de una gran ciudad se inspeccionan 121 viviendas detectando que 22 están deshabitadas.

a) Obtener un intervalo de confianza para la proporción de viviendas habitadas en dicho barrio con un nivel de confianza del 90%.

b) Con un nivel de significación del 5%, ¿se puede aceptar la hipótesis de que la proporción de viviendas deshabitadas en el barrio es, a lo sumo, del 15%?