Ejercicios TEMA 10

24
Estadística Aplicada Tema X 1) Los resultados de una encuesta pretest realizada por un partido político para averiguar sus perspectivas electorales, han dado un total de 80 respuestas favorables en intención de voto sobre un total de 200 entrevistados. A) Establecer un intervalo de confianza del 95% para la proporción esperable de voto en la población. B) Determinar el tamaño de muestra necesario para obtener un intervalo de confianza al 95%, con precisión de 1%. SOLUCIÓN A) Llamaremos a la proporción de votos favorables al partido político en la población de los votantes. Y p a esa misma proporción, pero en la muestra. En la medida en que 5 podemos establecer, de manera aproximada, el siguiente intervalo probabilístico: En nuestro caso, estimando el valor de por medio del resultado muestral, se respeta la condición = 48Así, con los resultados muestrales y el nivel de confianza de 0,95, obtenemos el siguiente intervalo de confianza para : = 0,4 IC = = Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid) 1

description

estadística

Transcript of Ejercicios TEMA 10

Estadística Aplicada Tema X

1) Los resultados de una encuesta pretest realizada por un partido político para averiguar sus perspectivas electorales, han dado un total de 80 respuestas favorables en intención de voto sobre un total de 200 entrevistados.

A) Establecer un intervalo de confianza del 95% para la proporción esperable de voto en la población.

B) Determinar el tamaño de muestra necesario para obtener un intervalo de confianza al 95%, con precisión de 1%.

SOLUCIÓN

A)Llamaremos a la proporción de votos favorables al partido político en la población de los votantes. Y p a esa misma proporción, pero en la muestra.

En la medida en que 5 podemos establecer, de manera aproximada, el siguiente intervalo probabilístico:

En nuestro caso, estimando el valor de por medio del resultado muestral, se respeta la condición

= 48 Así, con los resultados muestrales y el nivel de

confianza de 0,95, obtenemos el siguiente intervalo de confianza para :

= 0,4 IC = =

= = (0,332 , 0,468)

Esto es, entre un 33,2% y un 46,8% de los votos, a un nivel de confianza de 0,95.

B)

Es frecuente que los resultados de un pretest, como el anterior, sirvan para determinar el tamaño de muestra que sería preciso al objeto de lograr una determinada precisión en los resultados.

En general, cabe pensar que la anchura o longitud del intervalo probabilístico venga dada por la diferencia entre sus dos límites.

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)1

Estadística Aplicada Tema X

Así podemos, tras elevar al cuadrado ambos términos de la igualdad, despejar nuestra incógnita.

Esta expresión es válida para el caso de muestreos con

reemplazamiento o cuando el muestreo es sin reemplazamiento pero el tamaño de la muestra es muy pequeño respecto al de la población (por ejemplo, menos del 1%). En otro caso, es decir, en muestreo sin reemplazamiento y tamaños muestrales relativamente grandes respecto a la población, la fórmula resulta algo más larga.

Con los datos del problema: L = 0,02 (1%) 1 - = 0,95 y tomando = p

= 9.219,84 9.220 entrevistas necesarias

Otras veces, para resolver esta misma clase de problemas (determinar el tamaño mínimo de la muestra), lo que se hace es tomar como estimación de , en la fórmula anterior, el valor más desfavorable, esto es, el que da lugar al tamaño más grande de muestra necesaria. Ese valor es 0,5

2) Un laboratorio farmacológico afirma que el analgésico que fabrica es efectivo en la eliminación del dolor de muelas durante doce horas en al menos un 95% de los casos.

Se tomó una muestra de 150 individuos que padecían ese dolor y se les suministró el analgésico citado, siendo efectivo durante doce horas para 132 de ellos. Contrastar la afirmación del fabricante a un nivel de significación del 10%, 5% y 1%.

SOLUCIÓN

Llamaremos a la proporción de casos de personas con dolor de muelas a los que la utilización del analgésico alivia durante doce horas. Se trata de contrastar la afirmación del fabricante.

H0 : 0,95 H1 : 0,95

En la medida en que 5, siendo cierta la hipótesis nula tendremos:

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)2

Estadística Aplicada Tema X

N(0, 1)

Por tanto, en contraste unilateral hacia la izquierda, las regiones del contraste serán las siguientes:

= 0,10 = 0,05 = 0,01

RA = { Z´ -1,28} RA = { Z´ -1,645} RA = { Z´ -2,33}RC = { Z´ -1,28} RC = { Z´ -1,645} RC = { Z´ -2,33}

En nuestro caso, para el valor de considerado en la hipótesis nula, se respeta la condición

= 150 0,95 0,05 = 7,13

El resultado muestral nos lleva al resultado:

= 0,88 = -3,93

Por tanto se rechaza la hipótesis nula a cualquiera de esos niveles de significación.

3) En una muestra aleatoria de 400 adultos y 600 jóvenes que vieron cierto programa de televisión, 100 adultos y 300 jóvenes manifestaron que les había gustado. Determinar los límites de confianza del 95% para la diferencia de proporciones poblacionales de jóvenes y adultos a los que gustó el programa.

SOLUCIÓN

Llamaremos A a la proporción de jóvenes que vieron el programa y les gustó y B a esa misma proporción pero en adultos.

Al tratarse de unas muestras bastante grandes podemos establecer, de forma a proximada, el siguiente intervalo probabilístico.

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)3

Estadística Aplicada Tema X

En el caso que nos ocupa se pide que trabajemos a un nivel de confianza del 0,95 y los resultados muestrales obtenidos son:

= 0,5 para nA = 600 y = 0,25 para nB = 400

Con lo que obtenemos el siguiente intervalo de confianza:

IC = [(0,5 – 0,25) – 1,96 , (0,5 – 0,25) – 1,96

]

= (0,19 , 0,31)

Es decir, la proporción de audiencia joven a la que le gustó el programa superó entre un 19% y un 31% a la audiencia correspondiente de adultos.

4) Una muestra de 200 tuercas de cierta máquina probó que 15 eran defectuosas, mientras que una muestra de 100 tuercas de otra máquina dió 12 defectuosas. Hallar los límites de confianza del 90% y del 95% para la diferencia de proporciones de tuercas defectuosas de las dos máquinas. Discutir y razonar los resultados.

SOLUCIÓN

Llamaremos A a la proporción de tuercas defectuosas obtenidas por la máquina A y B a esa misma proporción en la máquina B.

Al tratarse de uns muestras bastante grandes podemos establecer, de forma a proximada, el siguiente intervalo probabilístico.

Se pide que trabajemos a un nivel de confianza del 0,90 y del 0,95 siendo los resultados muestrales obtenidos:

= 0,075 para nA = 200 y = 0,12 para nB = 100

Para 1 - = 0,90 tenemos que z / 2 = 1,645

Con lo que obtenemos el siguiente intervalo de confianza:

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)4

Estadística Aplicada Tema X

IC = [(0,075 – 0,12) – 1,645 ,

(0,075 – 0,12) –1,645

] =

= (-0,107 , 0,017)

La proporción de tuercas defectuosa fabricadas por la máquina A está entre el 10,7% menos que la máquina B y el 1,7% más (no se puede concluir, estadísticamente, la superioridad de la máquina A).

Para el nivel de confianza del 0,95 la longitud de ese intervalo todavía resultará mayor.

En efecto, para 1 - = 0,95 tenemos que z / 2 = 1,96

IC = [(0,075 – 0,12) – 1,96 ,

(0,075 – 0,12) –1,96 ]

=

= (-0,118 , 0,028)

5) La proporción de defectos en un lote de 100 unidades del proveedor A es 0,04 mientras que en un lote de 150 unidades del proveedor B es de 0,07. Contrastar adecuadamente si hay diferencias entre los proveedores y determinar el nivel crítico o p-valor alcanzado.

SOLUCIÓN

Llamaremos A a la proporción de defectos en los lotes servidos por el proveedor A y B a esa misma proporción en el caso del proveedor B.

No nos dicen si el contraste debe ser unilateral o bilateral. Empezaremos planteándolo al modo bilateral, para estudiarlo después unilateralmente.

H0 : A - B = 0 H1 : A - B 0

Tal como está formulada, la hipótesis nula equivale a suponer que el proveedor A presenta igual porcentaje de defectos que el proveedor B. Si logramos rechazarla, se habrá “probado” su desigualdad, al aceptarse la hipótesis alternativa.

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)5

Estadística Aplicada Tema X

Sabemos que, siendo cierta la hipótesis nula y trabajando con muestras suficientemente grandes:

Donde, consistentemente con la hipótesis nula, hemos de suponer que A = B y, por tanto, se deberá tomar como estimación de una y otra, en el denominador, el valor común p, calculado como promedio de las dos proporciones muestrales.

Con esto ya podemos delimitar las regiones del contraste. A un nivel de significación de 0,05 ( = 0,05) en contraste bilateral

RA = { -1,96 Z´ 1,96 }RC = { Z´ -1,96 ó Z´ 1,96 }

Los resultados empíricos obtenidos

pA = 0,04 para nA = 100 y pB = 0,07 para nA = 150

= 0,058

= -0,994

En consecuencia, no se puede rechazar la hipótesis nula (igualdad de los proveedores).

Si el contraste se plantea de manera unilateral y tenemos en cuenta los indicios de superioridad del proveedor A, el contraste que interesaría proponer (si se buscara confirmar la sospecha) sería unilateral hacia la izquierda:

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)6

B

BB

A

AA

BABA

nn

ppz

)ˆ1(ˆ)ˆ1(ˆ´ 0

N(0, 1)aprox

BA

BABA

n

pp

n

pp

ppZ

)1()1(´ 0

N(0, 1)

aprox

Estadística Aplicada Tema X

H0 : A - B 0 H1 : A - B 0

Con lo que resultan unas regiones del contraste:

RA = { Z´ -1,645 }RC = { Z´ -1,645 } que nos conduce a conclusiones parecidas.

No obstante, hemos de tener en cuenta que los contrastes de proporciones requieren muestras de tamaño bastante considerable para que la prueba resulte de una potencia suficiente.

Por último calcularemos el p-valor, tanto en contraste bilateral como unilateral.

Bilateral: p-valor = PH0 ( Z´ -0,994 ) + PH0 ( Z´ 0,994 ) = 2 (1 – 0,8389) = 0,3222

Unilateral: p-valor = PH0 ( Z´ -0,994 ) = (1 – 0,8389) = 0,1611

En ambos casos el p-valor queda por encima del nivel de significación ( = 0,05) y por ello no se puede rechazar la hipótesis nula. Incluso a un nivel de significación menos exigente (por ejemplo para = 0,10) tampoco se hubiera podido. Sin embargo, en el contraste unilateral adecuado el p-valor es la mitad del obtenido en contraste bilateral. Esto es indicativo de una mayor potencia.

6) Ante una infestación de royas pardas en cereal, el técnico sospecha que la sensibilidad de dos variedades es diferente. Tras tomar muestras en 200 parcelas diferentes de la variedad A observó que en 58 de ellas se dió la enfermedad, mientras que en otra muestra de 150 parcelas de la variedad B se observó roya en 36 de ellas. Obtener los resultados del contraste a un nivel de significación del 5% y determinar el nivel crítico o p-valor obtenido.

SOLUCIÓN

Llamaremos A a la proporción de parcelas sembradas con la variedad A que presentan síntomas de la enfermedad y B a esa misma proporción en el caso de la variedad B.

No nos dicen si el contraste debe ser unilateral o bilateral. Empezaremos planteándolo al modo bilateral, para estudiarlo después unilateralmente.

H0 : A - B = 0 H1 : A - B 0

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)7

Estadística Aplicada Tema X

Tal como está formulada, la hipótesis nula equivale a suponer que el porcentaje de parcelas afectadas en la variedad A es el mismo que en la variedad B. Si se rechaza, aceptaremos la desigualdad entre ambas, al aceptarse la hipótesis alternativa.

Sabemos que, siendo cierta la hipótesis nula y trabajando con muestras suficientemente grandes:

Consistentemente con la hipótesis nula, hemos de suponer que A = B y, por tanto, se deberá tomar como estimaciones de una y otra, en el denominador, el valor común p, calculado como promedio de las dos proporciones muestrales.

Con esto ya podemos delimitar las regiones del contraste. A un nivel de significación de 0,05 ( = 0,05) en contraste bilateral

RA = { -1,96 Z´ 1,96 }RC = { Z´ -1,96 ó Z´ 1,96 }

Los resultados empíricos obtenidos fueron:

pA = = 0,29 para nA = 200 y pB = = 0,24 para nA = 150

= 0,2686

= 1,044

En consecuencia, no se puede rechazar la hipótesis nula (igualdad de las variedades).

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)8

B

BB

A

AA

BABA

nn

ppz

)ˆ1(ˆ)ˆ1(ˆ´ 0

N(0, 1)aprox

BA

BABA

n

pp

n

pp

ppZ

)1()1(´ 0

N(0, 1)

aprox

Estadística Aplicada Tema X

El contraste se puede plantear de manera unilateral (más potente) y teniendo en cuenta los indicios de mayor sensibilidad de la variedad A, debería ser hacia la derecha (para tratar de confirmar lo anterior).

H0 : A - B 0 H1 : A - B 0

Con lo que resultan unas regiones del contraste, para un nivel de significación de 0,05

RA = { Z´ 1,645 }RC = { Z´ 1,645 } que nos conduce a la misma conclusión.

Por último calculemos el p-valor, tanto en contraste bilateral como unilateral.

Bilateral: p-valor = PH0 ( Z´ -1,044 ) + PH0 ( Z´ 1,044 ) = 2 (1 – 0,8508) = 0,2984

Unilateral: p-valor = PH0 ( Z´ 1,044 ) = (1 – 0,8508) = 0,1492

En ambos casos el p-valor queda por encima del nivel de significación ( = 0,05) y por ello no se puede rechazar la hipótesis nula. En el contraste unilateral oportuno el p-valor ha sido la mitad del obtenido en contraste bilateral.

7) En 1.999 una organización de consumidores llevó a cabo un estudio para comprobar la existencia de posibles fraudes e irregularidades en las mediciones de los surtidores de gasolineras en territorio español.

Fueron seleccionadas al azar 300 gasolineras para ser visitadas, tomándose muestras en 220 de ellas y negando su colaboración las 80 restantes.

Las muestras consistieron en la recogida de diez litros de combustible en depósitos especiales, que posteriormente eran comprobados. En algunos casos los errores de capacidad favorecían al consumidor (+%) y en otros le perjudicaban (-%)

Los resultados de esas mediciones se dan en la tabla siguiente, agrupados según la magnitud del error y el tipo de combustible.

Margen de error gasoil super otros TOTAL+0,1% a +1,5% 18 9 3 30

0% 24 4 5 33-0,1% a -1% 67 40 25 132

-1,1% o superior 6 13 6 25TOTAL 115 66 39 220

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)9

Estadística Aplicada Tema X

A) Considerando un censo total de 10.200 gasolineras, determinar un intervalo de confianza del 90% para la proporción de estaciones de servicio dispuestas a colaborar.

B) Contrastar la hipótesis de que es igual la proporción de casos con errores de medición negativos de –1,1% o superiores, entre los surtidores de gasolina super y los de gasoil. Utilizar un nivel de significación del 1% (contraste bilateral) y considerar que las poblaciones respectivas son infinitas.

C) Contrastar la hipótesis de que la proporción de surtidores sin errores o con errores favorables al consumidor es al menos del 35%, obteniendo el nivel crítico de significación en contraste unilateral.

D) Determinar el tamaño de muestra necesario para obtener un intervalo de confianza al nivel del 95% con precisión de 3% para la proporción de surtidores sin errores de medición.

SOLUCIÓN

A)

Este apartado vamos a resolverlo considerando que el muestreo se hace sin reposición. Adicionalmente habremos de tener en cuenta que, según el enunciado, el tamaño de la muestra es relativamente grande respecto al de la población.

= 0,03 > 0,01 lo que justifica el empleo del multiplicador de población finita.

Recordemos (tema VII) que, en estos casos, el error típico debe incluir un factor de corrección, cuya fórmula viene dada por:

donde np es el tamaño de la población y n el tamaño de la muestra.

De esta manera, el intervalo general de probabilidad será:

Utilizaremos como estimación de ( ) la proporción obtenida en la muestra ( p).

La proporción de estaciones de la muestra dispuestas a colaborar ha sido:

y para un nivel de confianza de 0,90 resulta z / 2 = 1,645

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)10

Estadística Aplicada Tema X

De esta manera se obtiene un intervalo de confianza para la población:

IC =

=

= (0,692 , 0,775)

Es decir, entre el 69,2% y el 77,5% de las estaciones estarían dispuestas a colaborar.

B)

Llamaremos A a la proporción de surtidores de gasolina super con errores de medición negativos de –1,1% o superiores (en valor absoluto) y B a esa misma proporción pero en surtidores de gasoil.

H0 : A - B = 0 H1 : A - B 0

Sabemos que, siendo cierta la hipótesis nula y trabajando, como se hizo, con muestras relativamente grandes sobre poblaciones que en la práctica se pueden considerar infinitas:

De manera consistente con la hipótesis nula, hemos de suponer que A = B y, por tanto, se deberá tomar como estimaciones de una y otra, en el denominador, el valor común p, obtenido mediante promedio de las dos proporciones muestrales.

Con esto ya podemos delimitar las regiones del contraste. A un nivel de significación de 0,01 ( = 0,01) en contraste bilateral tenemos que z /2 = 2,58

RA = { -2,58 Z´ 2,58 }RC = { Z´ -2,58 ó Z´ 2,58 }

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)11

B

BB

A

AA

BABA

nn

ppz

)ˆ1(ˆ)ˆ1(ˆ´ 0

N(0, 1)aprox

BA

BABA

n

pp

n

pp

ppZ

)1()1(´ 0

N(0, 1)

aprox

Estadística Aplicada Tema X

Los resultados empíricos obtenidos fueron:

pA = para nA = 66 y pB = para nA = 115

= 3,06

Por tanto se rechaza la hipótesis nula y se concluye que la proporción de surtidores con esos niveles de defecto en la expedición es distinta en uno y otro tipo de carburante.

C)

Ahora llamaremos a la proporción de surtidores sin error en la expedición, o con error, pero, en tal caso, favorable al consumidor. De acuerdo con el enunciado se plantea el cuadro de las hipótesis.

H0 : 0,35 H1 : 0,35 Y es obvio que se trata de un contraste unilateral hacia la izquierda

El estadístico de control puede variar algo, según se considere prácticamente infinita o nó la población. En este caso no podemos saber por el enunciado si la muestra (que supondremos extraida sin reposición) representa más allá del 1% de la población total.

Lo resolveremos considerando que los 220 surtidores de la muestra representan menos del 1% del total de surtidores (serían 10.200 estaciones por el número medio de surtidores por estación). Si no fuera el caso, habría que utilizar en el denominador del estadístico que sigue el factor de corrección para poblaciones finitas, que vimos en el apartado A.

Siendo cierta la hipótesis nula se cumple que:

N(0, 1) aproximadamente.

Con lo que podrían obtenerse unas regiones del contraste. Por ejemplo, para un nivel de significación de 0,05

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)12

Estadística Aplicada Tema X

RA = { Z´ -1,645 }RC = { Z´ -1,645 }

Según los resultados del estudio, tenemos una proporción muestral de surtidores sin errores o favorables al consumidor

p = y = -1,979

Con un nivel de significación del contraste de 0,05 se rechazaría la hipótesis nula.

Pero en el ejercicio en realidad lo que nos piden es obtener el p-valor.

p-valor = PH0 ( Z´ -1,979 ) = (1 – 0,9761) = 0,0239

Por tanto, se rechazaría la hipótesis nula siempre que el nivel de significación utilizado fuera mayor que 0,0239 (por ejemplo 0,05) y, por el contrario, se aceptaria si fuese inferior (por ejemplo 0,01)

D)

Este apartado es semejante al visto en el ejercicio 1 de este mismo tema. Considerando muestreo con reposición, o muestreo sin reposición pero tamaños muestrales muy pequeños respecto a la población tenemos:

Eso permitiría hallar un intervalo probabilístico, de longitud:

Con lo que se llegaría a la fórmula:

Si el muestreo es sin reposición y la muestra tiene un considerable tamaño respecto a la población (más del 1%, por ejemplo) es conveniente modificar algo la fórmula anterior.

En efecto, tendríamos:

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)13

Estadística Aplicada Tema X

y

que da tamaños muestrales algo más pequeños.

En nuestro caso y por las mismas razones dadas en el apartado anterior, utilizaremos la primera de las fórmulas.

y utilizaremos como estimación de

Como L = 2 0,03 = 0,06 y z / 2 = 1,96

= 544,2 545 surtidores en la muestra.

A efectos puramente ilustrativos, emplear la segunda de las fórmulas, tomando un tamaño de población de surtidores igual a 10.200, hubiera dado un tamaño de muestra de 517, algo menor que el obtenido.

8) En una muestra aleatoria de 100 individuos que omitieron el desayuno, 45 dijeron que sentían fatiga a mitad de mañana, mientras que en otra muestra aleatoria de 400 individuos que desayunaron, 120 dijeron sentir fatiga a media mañana. Contrasta bilateralmente la hipótesis de que esa proporción es la misma en ambos grupos, halla el p-valor e indica a qué nivel de significación máximo podría aceptarse la hipótesis nula.

SOLUCIÓN

H0 : A - B = 0 H1 : A - B 0

Siendo cierta la hipótesis nula y trabajando con muestras grandes, sobre poblaciones que se pueden considerar, a efectos prácticos, infinitas, tendremos:

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)14

B

BB

A

AA

BA

nn

ppz

)ˆ1(ˆ)ˆ1(ˆ

N(0, 1)aprox

Estadística Aplicada Tema X

La letra A designa el grupo de gente que no desayuna y la B a los que sí lo hacen. De acuerdo con lo establecido en la hipótesis nula hemos de suponer que las proporciones de fatigados a media mañana es la misma ( A = B ), equivalente a suponer que la diferencia entre ambas es igual a cero.

Por eso se deberá tomar como estimación de una y otra, en el denominador, el valor común p, obtenido mediante promedio de las dos proporciones muestrales.

Ahora ya se podrían delimitar las regiones del contraste. Por ejemplo, para un nivel de significación de 0,05 ( = 0,05), como z /2 = 1,96 tendríamos:

RA = { -1,96 Z´ 1,96 }RC = { Z´ -1,96 ó Z´ 1,96 }

Sin embargo en el enunciado no se establece el nivel de significación del contraste.

Los resultados empíricos encontrados fueron:

y

Por tanto:

Siendo el resultado del estadístico:

El cálculo del p-valor, teniendo en cuenta que el contraste es bilateral, se resuelve obteniendo la probabilidad de que, siendo cierta la hipótesis nula, se obtuviera un resultado superior o igual, en valor absoluto, a 2,34.

p-valor = PH0 ( Z´ -2,34 ) + PH0 ( Z´ 2,34 ) = 2 (1 – 0,9904) = 0,0192

La probabilidad de obtener tales resultados bajo la condición de que en ambos grupos la proporción es la misma es de sólo 0,0192

Y el criterio de uso del p-valor para la toma de la decisión:

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)15

BA

BA

n

pp

n

pp

ppZ

)1()1(

N(0, 1)aprox

Estadística Aplicada Tema X

CONDICIÓN DECISIÓN

p-valor nivel de significación Rechazo de la hipótesis nula

p-valor nivel de significación Aceptación de la hipótesis nula

En concreto, si en este caso se adopta un nivel de significación de 0,05 se debe rechazar la hipótesis nula. En cambio, si el nivel de significación es de 0,01 se debe aceptar.

Por tanto 0,0192 es el nivel de significación máximo al que se podría aceptar la hipótesis nula.

9) Con el objeto de determinar la cuota de notoriedad de una marca se realizó una encuesta entre 220 consumidores, resultando que 132 de ellos manifestaron conocerla.

A) Establece un intervalo de confinaza de 0,95 para determinar la verdadera proporción de consumidores que conocían la marca.

B) Determina a un nivel de confianza de 0,95 el tamaño de muestra necesario para estimar esa proporción con una precisión de 2,5%

C) Tras una campaña publicitaria se repite el sondeo, resultando que en una muestra de 300 encuestados 210 manifestaron conocer la marca. Contrasta la hipótesis de que la notoriedad de la marca es la misma que antes de la campaña, a un nivel de significación de 0,05. Calcula el p-valor correspondiente.

SOLUCIÓN

A)

Como el tamaño de la muestra es bastante grande y se cumple la condición:

n (1 ) 5

puede establecerse un intervalo probabilístico, aproximado, de predicción

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)16

Estadística Aplicada Tema X

En la expresión anterior se utilizará la proporción muestral como estimación de la proporción de consumidores que conocen la marca en el conjunto de la población ( ).

Y como para = 0,05 z2 = 1,96

resulta el siguiente intervalo de confianza:

I.C.= =

=

= (0,535 ; 0,665)

B)

Para resolver este apartado aplicaremos la fórmula vista en problemas anteriores. Concretamente en el ejercicio 1 y en el apartado D del ejercicio 7.

En este caso, tenemos z2 = 1,96 y L = 0,05

De donde resulta:

encuestados

C)

Vamos a establecer un contraste basado en la diferencia de proporciones. La proporción de consumidores que conocen la marca tras haberse realizado la campaña la designamos mediante A siendo B esa misma proporción pero antes de realizar la campaña.

H0 : A - B = 0 H1 : A - B 0

Siendo verdadera la hipótesis nula y trabajando con muestras grandes, tenemos que:

donde

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)17

BA

BA

n

pp

n

pp

ppZ

)1()1(

N(0, 1)aprox

Estadística Aplicada Tema X

Para = 0,05 tenemos que: z2 = 1,96 y en consecuencia:

RA = { -1,96 Z´ 1,96 }RC = { Z´ -1,96 ó Z´ 1,96 }

Sólo queda estudiar los resultados empíricos.

Por lo que se rechaza la hipótesis nula y se concluye que la cuota de notoriedad es diferente de la inicial después de realizada la campaña.

El p-valor, siendo el contraste bilateral, vendrá dado por:

p-valor = PH0 ( Z´ -2,37 ) + PH0 ( Z´ 2,37 ) = 2 (1 – 0,9911) = 0,0178

Es decir, un resultado como el obtenido o más raro aún siendo cierta la hipótesis nula, contaba a priori con un probabilidad de 0,0178. Como esta probabilidad es bastante pequeña e inferior a la del nivel de significación ( = 0,05) se decide rechazar la hipótesis nula.

Escuela Universitaria de Ingeniería Técnica Agrícola I.N.E.A. (U. Valladolid)18