GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente...

36
1 GUÍA pvalor

Transcript of GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente...

Page 2: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

2

  Una empresa de neumáticos afirma que una nueva gama en promedio dura al  

  menos 28.000 km. Las pruebas con 64 neumáticos dan como resultado una 

  duración media de 27.800 km, con una desviación e

  

stándar de 1.000 km.

  Bajo la normalidad de los neumáticos, se pide: 

  a)  Comprobar si hay evidencia suficiente para rechazar la afirmación de la 

       empresa,  un nivel de significación del 5%

  b) ¿Cuál es el p‐valor?

Solución:

a)  Sobre la población de los neumáticos se define la variable aleatoria  

X "duración en kilómetros"   donde  X N(28000, )  

2Las hipótesis sobre la media poblacional  con   desconocida:

0 0 1 1H : 28000 H : 28000

Se trata de un contraste compuesto, unilateral por la izquierda.

Regla de decisión:

0

0

Si x k Se aceptaH (R.A)

Si x k Se rechaza H (R.C)

x

En el muestreo de una población normal con varianza desconocida, con muestras 

sgrandes  n 30  la media muestral  x N ,  

n

1000Bajo la hipótesis nula  x N 28000, N 28000, 125

64

El valor crítico  ,  bajo la hipótesis nula, se determina con el nivel de significación

0,05 : k

 

0 0 0 0P RechazarH H cierta P x k H cierta P x k 28000

Page 3: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

3

x 28000 k 28000 k 28000P P z 0,05

125 125 125

k 28000 k 28000P z P z 0,05

125 125

k 280001,645 k 28000 125 1,645 27794,375

125

x

Siendo  x 27800 27794,375  se acepta la hipótesis nula, por tanto, se 

acepta la afirmación de la empresa con un nivel de confianza del 95%

pb) El p‐valor ( ) es el menor nivel de significación para el que se rechaza la

hipótesis nula, es decir:

p 0p valor P Rechazar el estadístico muestral / H  es cierta ‐

p 0Si    se acepta la hipótesis nula H  

p 0P x 27800 H cierta P x 27800 N 28000,125

x 28000 27800 28000P P z 1,6 P z 1,6 0,0548

125 125

p

0

Para un nivel de significación   0,05  el  p‐valor   0,0548 0,05

Se acepta H

Con una fiabilidad del 95% se acepta que la duración media de los neumáticos 

es de 28.000  km.

Page 4: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

4

  El propietario de un autómovil sospecha que su vehículo tiene un consumo 

  medio de combustible en carretera superior a los 5,6 litros /100 km, que es   

  lo que el fabricante indica en su publicidad. 

  Para apoyar empíricamente su sospecha observa el consumo medio en 11 

  viajes seleccionados aleatoriamente entre todos los que realiza en el año,

  obteniendo los siguientes resultados:

6,1 6,5 5,1 6 5,9 5,2 5,8 5,3 6,2 5,9 6,3

  Se pide:

  a)  ¿Están fundadas las sospechas del propietario a un nivel de significacion 

       del 1%?  

  b) Calcula el p‐valor.

Solución:

a) Se supone que el consumo medio del autómovil sigue una distribución 

    normal N( , ),  siendo ambos parámetros desconocidos. 

n 1

En el muestreo de una población

normal con varianza desconocida,

con muestras pequeñas  n 30 ,

la media muestral  x t

0

1

El fabricante afirma que H : 5,6  y el propietario del vehículo cree 

que  H : 5,6

1Se trata, pues, de un contraste unilateral, donde H  es compuesta

0

0

Si x k R.A : AceptarHRegla decisión:  

Si x k R.C :RechazarH

x

10 10

Bajo la hipótesis nula, con los datos muestrales  x 5,8454 , s 0,4612 ,

0,4612el muestreo sigue una distribución  t 5,6; t (5,6 , 0,139)

11

El valor crítico  , bajo la hipótesis nula,  se calcula a partir del nivel de significación  :k

Page 5: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

5

0 0 0 0P RechazarH H cierta P x k H cierta P x k 5,6

10

x 5,6 k 5,6 k 5,6 k 5,6P P t 0,01 2,764

0,139 0,139 0,139 0,139

k 5,9842

0Siendo  x 5,8454 5,9842  no se puede rechazar la hipótesis nula H ,

con lo que se acepta las afirmaciones del fabricante sobre el consumo 

medio del autómovil. 

p 0b)  p valor P Rechazar el estadístico muestral / H  es cierta

p 0Si    se acepta la hipótesis nula H  

p 0 10P x 5,8454 H cierta P x 27800 t (5,6 , 0,139)

10

x 5,6 5,8454 5,6P P t 1,765 0,055

0,139 0,139

Tabla de la t‐Student:1,372 1,812 1,765 1,812

x 0,0550,10 0,05 x 0,05

p 00,055 0,01 Se acepta H

Con un nivel de confianza del  99%  se acepta que el consumo medio de 

combustible en carretera superior es de 5,6 litros /100 km.

Page 6: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

6

  Un banco quiere analizar si las comisiones que cobra a sus clientes por 

  operaciones en el mercado bursátil difieren significativamente de las que cobra 

  la competencia, cuya media es de 12 euros mensuales con una desviación

  estándar de 4,3 euros. 

  Este banco toma una muestra de 64 operaciones bursátiles y observa que la 

  comisión promedio es de 13,6 euros. Contrastar, al nivel de significación del 5%,   

  que este banco no difiere significativamente en el cobro de comisiones por 

  operaciones en la Bolsa con respecto a la competencia.

Solución:

Sea la v. a.  X="Comisiones que se cobran por operaciones en el mercado bursátil",

donde X N , 4,3

Page 7: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

7

1Como la hipótesis alternativa es  H :  12  en la decisión deben ser válidos

valores de    tanto mayores o menores que 12, por lo que el contraste debe

se bilateral o de dos colas.

0

0

Regla decisión :

Si se acepta H (R.A)

Si se rechaza H (R.C)

x k

x k

4,3Bajo la hipótesis nula: x N 12, N(12, 0,5375)

64

1 2

Con el nivel de significación   0,05  se calculan los valores 

críticos  k , k :

0 0 1 2P RechazarH H cierta P x k N(12, 0,5375) P (x k ) (x k

1 2P(x k ) P(x k ) 0,025 0,025 0,05

1 1 11

x 12 k 12 k 12 k 12P(x k ) P P z P z 0,025

0,5375 0,5375 0,5375 0,5375

        11

k 121,96 k 10,9465

0,5375

2 22

x 12 k 12 k 12P(x k ) P P z 0,025

0,5375 0,5375 0,5375

        22

k 121,96 k 13,0535

0,5375

En consecuencia, la región de aceptación:  10,9465 x 13,0535

Como el banco cobra una  comisión  promedio de 13,6 euros, no se encuentra 

dentro de la región de aceptación, 13,6 (10,9465, 13,0535),  en consecuencia 

difiere significativamente de la competencia. 

Page 8: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

8

p P Rechazar media  muestral   H  es cierta 0/p valor

pSi    se acepta la hipótesis nula H   0

p P x 13,6 N(12, 0,5375) P (x 13,6) (x 13,6)

P(x 13,6) P(x 13,6) 2 P(x 13,6)

x 12 13,6 122 P 2 P(z 2,98) 2 0,00144 0,0029

0,5375 0,5375

x

pSiendo   0,0029 0,05  rechaza la hipótesis nula a un nivel 

de significación del 5%. Por tanto, existe evidencia estadística de que la 

comisión promedio que cobra este banco difiere significativame

nte 

de la competencia.

Page 9: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

9

4,3

La comisión promedio que cobra el banco:  x N 12, N (12, 0,5375)64

Tipificando se obtiene el estadístico de contraste:  

x 12 13,6 12z 2,98 2,98 ( 1,96 , 1,96)

0,5375 0,5375

El valor del estadístico de contraste está en la zona de rechazo, por lo que se 

rechaza la hipótesis nula, afirmando que  la comisión promedio que cobra este 

banco difiere significativamente de la competencia.  

Page 10: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

10

  Un supermercado tiene dos formas diferentes de venta:  tradicional 

  o con caja rápida. En la tradicional, un operario registra cada artículo,  

  lo pone en bolsas y efectua el cobro. En la caja rápida, el cliente 

  registra cada artículo, lo introduce en bolsas y paga en una máquina 

  con tarjeta de crédito. La dirección del supermercado desea saber si 

  el tiempo medio que un cliente se encuentra en la fila del proceso con  

  el método tradicional es mayor que con la caja rápida, reuniendo la 

  información adjunta:

  Tipo     Media     Tamaño     Varianza

cliente   muestral     muestra    p

        2

2

oblacional

 Tradicional       6,1 minutos     49    0,49 minutos   

Caja rápida      5,6 minutos    72  0,36 minutos

  Suponiendo que el tiempo en espera en el proceso sigue una ley 

  normal, con un nivel de confianza del 99%, ¿qué decisión debería

  adoptar el supermercado para agilizar las ventas?

  Solución:

t

cr

Sean las variables de respuesta:  X "tiempo método tradicional" e 

Y "tiempo caja rápida",  que siguen respectivamente N( , 0,7)

y  N( , 0,6)

0 t cr 1 t cr

El   con los datos de la muestra facilita la decisión que debe

tomar la dirección del supermercado, estableciendo las hipótesis:

          H :  H : 

p ‐valor

Tipificando se obtiene el estadístico de contraste:

Page 11: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

11

2 2t cr

t cr

x y 6,1 5,6z 4,082

0,49 0,36

49 72n n

0,01estadístico teórico (valor crítico):   z 2,326

El valor del estadístico de contraste  z 4,082 ( , 2,326) por lo que

se rechaza la hipótesis nula, concluyendo que el supermercado debe 

adoptar la caja rápida.

p 0P Rechazar estadístico muestral / H  es cierta p ‐ valor

p

0

=  0,500 0,490 0,01

se rechaza la hipótesis nula H  

p valor <

0

0

x y k se acepta H (RA) Regla Decisión

x y k se rechaza H (RC)

Page 12: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

12

Se calcula el valor crítico  k  con el nivel de significación  0,01:

0 0P(Error Tipo  I) P Rechazar  H  / H  es cierta 0,01

0

0,49 0,36P x y k H cierta P x y k N 0,

49 72

x y 0 k 0 kP x y k N 0, 0,122 P P z 0,01

0,122 0,122 0,122

k2,326 k 0,284

0,122

0

0

x y 0,284 se acepta H (RA) Regla Decisión  

x y 0,284 se rechaza H (RC)

0Siendo,   x y 6,1 5,6 0,5 0,284 Se rechaza H

El supermercado debe adoptar la caja rápida.

Page 13: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

13

 La directora del departamento de personal de una corporación está buscando   

 empleados para un puesto en el extranjero. Durante el proceso de selección, 

 la administración le pregunta cómo va la incorporación de empleados, y 

 ella contesta que la puntuación promedio en la prueba de aptitudes será de 

 90 puntos. Cuando la administración revisa 19 de los resultados de la prueba, 

 encuentra que la puntuación media es de 83,25 puntos con una desviación 

 estándar de 11.  Bajo el supuesto de normalidad, ¿lleva razón la directora, 

 con un nivel de confianza del 90%?

Solución:

Se supone que la población de resultados de todos los candidatos siguen

una distribución X N( , ) ,siendo ambos parámetros desconocidos.

10 n 1

x

En el muestreo de la población normal con varianza desconocida, con 

xmuestras pequeñas  n 11 30 , la media muestral  x t  con t

s / n

0 1Se establecen las hipótesis:   H :  90 H :  90

Como la hipótesis alternativa es   90  en la decisión deberán ser 

válidos valores de    tanto mayores o menores que 90,  por lo cual 

el contraste debe ser bilateral o de dos colas.

0

0

x k se rechaza H (R.C.)Regla decisión: 

x k se acepta H (R.A.)

Si

Si

p 0p valor P Rechazar estadístico muestral / H es cierta

p 18P x 83,25 t (90 ; 2,524)

18P (x 83,25) (x 83,25) t (90 ; 2,524)

Page 14: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

14

18 18P x 83,25 t (90 ; 2,524) P x 83,25 t (90 ; 2,524)

18 18P x 83,25 t (90 ; 2,524) P x 83,25 t (90 ; 2,524)

18

x 90 83,25 902P x 83,25 t (90 ; 2,524) 2P

2,524 2,524

182P t 2,6774 2(0,008) 0,016

 2,552 2,878 2,674 2,878

Tabla t‐Student:  x 0,0080,01 0,005 x 0,005

pSiendo   0,016 0,10 Se rechaza la hipótesis nula.   

En consecuencia, se rechaza la manifestación de la directora de la corporación.

Page 15: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

15

0

0

Regla decisión: 

x k se acepta H (R.A.)   

x k se rechaza H (R.C.)

Si

Si

El valor crítico k se calcula con el nivel de significación   0,10 :

0 0 18 1 2P Rechazar H H cierta P x k t (90 ; 2,524) P (x k ) (x k

1 2P(x k ) P(x k ) 0,05 0,05 0,10

1 1 11 18 18

x 90 k 90 k 90 k 90P(x k ) P P t P t 0,05

2,524 2,524 2,524 2,524

        11

k 901,734 k 85,62

2,524

2 22 18

x 90 k 90 k 90P(x k ) P P t 0,05

2,524 2,524 2,524

        22

k 901,734 k 94,37

2,524

Para aceptar la hipótesis nula la media muestral se tiene que encontrar en 

el intervalo  85,62 x 94,37 

No encontrándose la media muestral observada  x 83,25  en la región 

de aceptación, con un nivel de significacion de   0,10 , se rechaza la 

manifestación de la directora de la corporación.

Page 16: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

16

x1 /2 , n 1 0,90 0,05 , 18

s 11I ( ) x t I ( ) 83,25 t

n 19

0,90

11I ( ) 83,25 1,734 83,25 4,376 78,874 , 87,626

19

En consecuencia, 78,874 87,626

0La puntuación promedio   90  que manifiesta la directora del 

departamento de personal no se encuentra dentro del intervalo de

la media de la población con una fiabilidad del 90%, teniendo que 

rechaza

r su afirmación.

Page 17: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

17

 Un portal e‐business sabe que el 60% de todos sus visitantes a la web están

 interesados en adquirir sus productos pero son reacios al comercio electrónico 

 y no realizan finalmente la compra vía internet. Sin embargo, en la dirección 

 del portal se piensa que en el último año el porcentaje de gente que está

 dispuesta a comprar por internet ha aumentado y esto se debe reflejar en 

 los resultados empresariales. En esta línea, se tomó una muestra de 500 

 visitantes para conocer su opinión y se observó que el 55% no estaba

 dispuesta a realizar compras vía on‐line. 

 Contrastar con el 2% de significación si el último año se ha reducido el

 porcentaje de personas que no está dispuesta a comprar vía internet.

Solución:

Sea  p "Proporción personas compran on‐line"

1 2 500

Al realizar el contraste sobre la proporción, se parte de una muestra aleatoria

(x , x , , x ),  donde X B(1,  p)

500

i

i 1

xˆLa distribución del estadístico muestral  p   al ser el tamaño sufientemente

n

ˆgrande  n 500  y estar  p  definido como suma de variables independientes entre

sí, según una distribución de Ber

500

i

i 1

nouilli  X B(1,p),  por el teorema central del límite

x pqˆ(TCL) se puede aproximar  p N p,

n n

0 1Se establecen las hipótesis:  H : p 0,6 H : p 0,6

x0,6 0,4ˆBajo la hipótesis nula, el estadístico muestral p N 0,6,  

500

Contraste unilateral a la izquierda

(cola a la izquierda)

Región aceptación  ( z ,   )

Page 18: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

18

x0,6 0,4ˆSiendo que el estadístico p N 0,6, N 0,6, 0,022 ,

500

se obtiene el estadístico de contraste tipificando:

0

0 o

p̂ p 0,55 0,60z 2,27

0,022p .q

n

0 ,02

El estadístico de contraste  z 2,27  no se encuentra en la región de 

aceptación ( z , ) ( 2,05, ), rechazando la hipótesis nula.

En conclusión, existe evidencia empírica que la proporción de visitantes al 

portal que están dispuestos a comprar on‐line ha disminuido, es decir, el 

porcentaje de visitantes que son reacios  a comprar por internet ha aumentado.

p 0p valor P Rechazar estadístico  / H  es cierta

p

p̂ 0,6 0,55 0,6ˆP p 0,55 N 0,6, 0,022 P P(z 2,27)

0,022 0,022

      P(z 2,27) 0,0116

pComo   0,0116 0,02   se rechaza la hipótesis nula a un nivel de 

significación del 2%.

Page 19: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

19

Se determina el valor crítico k con el nivel de significación  0,02

0

0

Contraste unilateral por la izquierda 

p̂ k se  acepta Hregla de decisión: 

p̂ k se  rechaza H

0 0

p̂ 0,6 k 0,6ˆP Rechazar H H cierta P p k N 0,6, 0,022 P

0,022 0,022

k 0,6 k 0,6P z 0,02 2,05 k 0,645

0,022 0,022

ˆEl valor del estadístico muestral (evidencia empírica)  p 0,55 0,642,

por lo que se rechaza la hipótesis nula. En definitiva, ha aumentado el 

porcentaje de personas que son reacios a comprar por inter

net.

 Con el intervalo de confianza unilateral a la izquierda para la proporción, 

ˆverificando si el estadístico p 0,55 pertenece al intervalo:

0 00 0 1 0 0

p .qH : p p H : p p p z ,

n

Page 20: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

20

0,6.0,40,6 2,05. , (0,56 , )

500

ˆSiendo  p 0,55 (0,56 , )  se rechaza la hipótesis nula.

Los contrastes bilaterales corresponden a intervalos centrados, 

mientras que los contrastes unilaterales derechos corresponden 

a estimaciones unilaterales por exceso y los unilaterales izquierdos 

a estimaciones por defecto.

0 0 0 00 0 1 0 0 /2 0 /2

0 0 0/2 0 /2

0 0

0

región rechazo

estadí

Se 

stico con

acepta H

traste

p .q p .qH : p p H : p p p z , p z bilateral

n n

p̂ p p .qˆ     o también:     z z R.C p p z

np

 

n

 

.q

0 00 0 1 0 0

0 0 00

0 0

0

región rechazo

estadístico contraste

Se acepta H

p .qH : p p H : p p , p z unilateral derecho

n

p̂ p p .qˆ    o también:     z z R.C p p z

np .

  

q

n

0 00 0 1 0 0

0 0 01 0 1 1

0 0

0

región rechazo

estadístico

Se acepta H

 contraste

p .qH : p p H : p p p z , unilateral izquierd   o

n

p̂ p p .qˆ    o también:     z z R.C p p z z

np .q

n

z

Page 21: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

21

 Para estudiar si el consumo de tabaco tiende a provocar problemas de

 trombosis debido a un aumento en la capacidad de coagulación, se extrajo 

 muestras de sangre en 10 individuos  antes y después de que fumasen un 

 cigarrillo, midiendo la capacidad de agregación de las plaquetas:

Antes     25 27 44 30 67 53 53 52 60 28             

 Después 29 37 56 46 82 57 80 61 59 43

 Bajo el supuesto de normalidad, ¿hay suficiente evidencia estadística

 (con un nivel de significación 0,01) para afirmar que los fumadores 

 presentan la misma tendencia  a la formación de coágulos?

 Calcular el p‐valor

Solución:

 Sean las variables aleatorias:

1 1 1X "coágulos obtenidos antes de fumar",  donde  X N( , ),  donde    

es el porcentaje medio de agregación de plaquetas antes de fumar.

2 2 2Y "coágulos obtenidos después de fumar",  con  Y N( , ),  donde    

es el porcentaje medio de agregación de plaquetas después de fumar.

Destacar que los datos obtenidos antes de fumar, y los obtenidos después 

de fumar, no son independientes, dado que se obtienen de la misma persona.

No se puede llevar a cabo un contraste de igualdad de medias como se

realizó cuando las muestras eran independientes, se puede considerar 

la variable aleatoria  d X Y  ,  y admitiendo que su distribució

1 2

n sea 

N( , ), efectuar un contraste adecuado sobre  

1 2Se desea probar estadísticamente que   , o lo que es igual, que  0 

por lo que se trata de un contraste bilateral (o de dos colas).

0 1Se establecen las hipótesis:   H :  0    H :  0

Page 22: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

22

0 1 0 1

  En otros casos,  se podría estar ante contrastes unilaterales: 

H :  0  frente a  H :  0    o bien   H :  0  frente a  H :  0

 

  Si se tuviera la creencia de que fumar supone un aumento de forma

0 1 2 1

ción 

de coágulos de 5 puntos, las hipótesis serían:

5H :  5  frente a  H : 

5

Para continuar es necesario conocer la tabla de diferencias:

i

Antes     25   27   44   30   67  53   53  52  60   28

Después 29   37   56   46   82  57   80  61  59   43

d      4 10 12 16 15 4 27 9   1 15

10 10

2 2i d i d

i 1 i 1

1 1d d 11,1 s (d d) 62,32 s 7,89

10 9

09 n 1

d

  En el muestreo de la población normal con varianza desconocida, con 

dmuestras pequeñas  n 10 30 , la media muestral  d t  con t

s / n

como estadístico de contraste.

0n 1

d

dt

s / n

Región de aceptación: 

/2 , n 1 /2 , n 1( t , t )

0n 1

d

n 1 n 1 /2 , (n 1)

dContraste bilateral,  estadístico de contraste:   t    

s / n

Región de aceptación  R.A t :  t t

n 1 n 1 /2 , (n 1)Región crítica  R.C t :  t t

Page 23: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

23

0o n 1 /2 , (n 1)

d

dLo que equivale a decir que H  se acepta si    t t   

s / n

9

11,1 0Bajo la hipótesis nula, el estadístico contraste:   t 4,449

7,89 / 10

/2 , n 1 0,005 , 9t t 3,25 Región aceptación:  ( 3,25 , 3,25)

Siendo  4,449 ( 3,25 , 3,25)  se rechaza la hipótesis nula, pudiendo decir

que los fumadores no presentan la misma tendencia a la formación de coágulos.

p 0 9   p valor P Rechazar estadístico H  es cierta P t 4,449 0,00084

4,297 4,781 4,449 4,781Tabla t‐Student:  x 0,00084

0,001 0,0005 x 0,0005

d1 /2 , n 1

s  El intervalo de confianza es:  I ( ) d t

n

0,99

7,89 I ( ) 11,1 3,25. 19,21 , 2,99

10

El intervalo no abarca el cero,   0 , concluyendo que los fumadores 

no presentan la misma tendencia a la formación de coágulos.

Page 24: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

24

1 2 1 2

Se desea probar estadísticamente

que    o bien que  0

0 1Se contrasta:  H :  0  frente a  H :  0

, n 1Región de aceptación:  ( t , )

0,01 , 9( t , ) ( 2,821 , )

0n 1

d

n 1 n 1 , n 1 1 , n 1

dContraste unilateral a la izquierda,   estadístico de contraste:  t   

s / n

Región de aceptación  R.A t : t t t  

n 1 n 1 1 , n 1Región crítica R.C t : t t

9

11,1 0Bajo la hipótesis nula, el estadístico contraste:  t 4,449

7,89 / 10

Como   4,449 ( 2,821 ,  )   se rechaza la hipótesis nula, aceptando

en consecuencia la hipótesis alternativa, concluyendo que los fumadores

presentan mayor tendencia a la formación de coágulos.

Page 25: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

25

  Intervalo de confianza para el parámetro λ  de una distribución de Poisson :

Aproximación asintótica: Para valores del parámetro   grandes, la distribución

de Poisson puede aproximarse a una distribución normal según P( ) N( , )

1 2 n

i

n

ii 1

Dada una muestra de n observaciones independientes X , X , , X , que siguen 

una distribución de Poisson de parámetro , X P( ) , al ser la distribución de 

Poisson aditiva en   se verifica  X N(n

, n )

aproximadamenteˆEn la muestra:   X N ,n

ˆN(0,1)

n

/2 /2ˆn

ˆP z z 1

1 /2 /2 /2

ˆn

ˆI ( ) z   R.A z , z

 En caso de no ser aplicables las condiciones para utilizar la aproximación 

asintótica, el intervalo exacto, que es válido siempre, viende dado:

             n n

2 21 i 1 /2 i /2

i 1 i 1

1 1I ( ) 2 X ; 2 X 2

2n 2n

Page 26: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

26

  Contraste bilateral para el parámetro λ  de una distribución de Poisson :

0 00 0 1 0 /2 /2

0 0

ˆ ˆH :   H :   R.A z R.C z

/n /n

  Contraste unilateral a la derecha para el parámetro λ  de una distribución 

de Poisson :

0 0 1 0H :   H :  

0

0

ˆR.A z

/n

0

0

ˆR.C z

/n

  Contraste unilateral a la izquierda para el parámetro λ  de una distribución

 de Poisson :

0 0 1 0H :   H :  

01

0

ˆR.A z

/n

01

0

ˆR.C z

/ n

Page 27: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

27

 Se quiere comprobar la efectividad de una vacuna contra una alergía. Para

 ello se suministró la vacuna a cien personas y se les comparó con un grupo  

 testigo de cien pacientes afectados también por la alergía en épocas  

 pasadas. Entre los vacunados, ocho sufrieron alergía y entre los no 

 vacunados veinticinco volvieron a sufrir alergía. 

 ¿Se puede concluir que la  vacuna es eficaz en disminuir la alergía?. 

 Utilizar un nivel de significación de 0,05.   

Solución:

Sean las variables aleatorias:

X "número pacientes vacunados afectados por la alergía" 

Y "número pacientes no vacunados afectados por la alergía"

1 1 2 2donde,  X B(p , n )  e   Y B(p , n )

1 1 1

2 2 2

8ˆ ˆp 0,08 q 0,92 n 100

100En el muestreo:  

25ˆ ˆp 0,25 q 0,75 n 100

100

1 2Las muestras n n 100  son grandes, en consecuencia, ambas 

distribuciones se pueden aproximar a normales: 

1 1 1 1 1 2 2 2 2 2X N n p , n p q   ,   Y N n p , n p q

2 2 1 12 1 2 1

2 1

p q p qˆ ˆEn el muestreo:  p p N p p ,   

n n

2 1Para ver si la vacuna es eficaz hay que contrastar si  p p

0 2 1 1 2 1H :  p p  H :  p p

Región aceptación:  ( , 1,65)

Page 28: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

28

2 2 1 1

2 1

2 1

p q p qˆ ˆ Bajo la hipótesis nula p p N 0,  , tipificando se obtiene

n n

 el estadístico de contraste:

2 1

2 2 1 1

2 1

ˆ ˆp p 0,25 0,08z 3,4

p q p q 0,25. 0,75 0,08. 0,92

n n 100 100

2 1

El estadístico de contraste  z 3,4  no se encuentra en la región de 

aceptación ( , 1,65), rechazando la hipótesis nula y concluyendo 

que la vacuna es eficaz (p p )

p 0  p valor P Rechazar estadístico H  es cierta

p P(z 3,4) 0,00337

p0,00337 0,05    se rechaza la hipótesis nula a 

un nivel de significación del 5%.

1 2 Intervalo de confianza para la diferencia de parámetros (p p ) de dos

distribuciones binomiales.

1 1 2 21 1 2 1 2 /2 0,025

1 2

ˆ ˆ ˆ ˆp q p qˆ ˆI (p p ) (p p ) z    z 1,96

n n

1 1 2

0,08.0,92 0,75.0,25I (p p ) (0,08 0,25) 1,96  

100 100

1 1 2 1 2I (p p ) 0,269 , 0,07   0,269 p p 0,07

1 2

1 2

Como el intervalo no cubre el cero (p p 0) se rechaza que la vacuna no 

tenga eficacia. Por otra parte, ambos límites del intervalo de confianza son 

negativos, lo que significa que p p

Page 29: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

29

Page 30: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

30

Page 31: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

31

Page 32: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

32

  Se ha comprobado un micrómetro con una serie de piezas patrón. Bajo el  

  supuesto de normalidad, con un nivel de significación de 0,01, se desea 

  comprobar si el micrómetro tiene error en las lecturas realizadas:

Patrón  0,003 0,100 0,200 0,300 0,400 0,500 0,600 0,700     Lectura 0,002 0,09 0,198 0,297 0,403 0,498 0,602 0,698

Solución:

1 1

2 2

Se plantea el modelo: Sea que la variable de respuesta  X "valor en el patrón" 

sigue una normal N( , ) y la variable  Y "valor en la lectura" sigue una 

normal N( , )

1

11 1 n 1 2

1 1

xX N( , ) en la muestra: t

s / n

2

22 2 n 1 2

2 2

yY N( , ) en la muestra: t

s /n

2 21 2 1 1 1 2X Y N ,  con una muestra n + n 16 30 :

1 2

1 2n n 2 2 2

1 2

1 2

(x y) ( )t

s s

n n

Se trata de un contraste de hipótesis bilateral de igualdad de medias  de 

poblaciones normales. Hipótesis del contraste: 

0 1 2 1 2 1 1 2 1 2  H :  0 H :  0

1 2n n 2 2 21 2

1 2

x yBajo la hipótesis nula:  t  

s s

n n

estadístico contraste

21 1 1

22 2 2

x 0,350 s 0,06  s 0,244 n 8Muestras 

y 0,349 s 0,061 s 0,246 n 8

Page 33: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

33

1 2n n 2 14

0,350 0,349 t t 0,081

0,06 0,061

8 8

p 14Como   p valor P t 0,081 0,01 se admite la hipótesis 

nula, pudiendo decir que el micrómetro no tiene error

1 2 1 2/2 ,n n 2 /2 ,n n 2R.A ( t , t )

1 2/2 ,n n 2 0,005 ,14t t 2,977

( 2,977 , 2,977)

Se observa que   0,081 ( 2,977 , 2,977) con lo que se admite la hipótesis nula,

pudiendo concluir que el micrómetro no tiene error y las diferencia que se 

observan son debidas al azar o al observador.

  La duración de una enfermedad sigue una ley normal. Para su curación se

  emplean dos tipos de antiobióticos y se desea comprobar estadísticamente  

  cuál de los dos es más eficaz respecto a la duración de la enfermedad. A

  tal fin se observan seis enfermos a los que se aplica el primer antibiótico

  y cinco enferemos a los que se aplica el segundo antibiótico. 

  Los datos obtenidos han sido: 

    21 1

22 2

x 12 días s 16 n 6                     

y 15 días s 16 n 5

  ¿Cuál de los dos antibióticos es más eficaz a un nivel de significación 0,05?

Solución:

1 1

La variable de respuesta  X "duración de la enfermedad con el primer 

antibiótico" sigue una normal N( , ) y la variable  Y "duración de la 

enfermedad con el segundo antibiótico" sigue una normal N(

2 2, )

Page 34: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

34

1

11 1 n 1 2

1 1

xX N( , ) en la muestra: t

s / n

2

22 2 n 1 2

2 2

yY N( , ) en la muestra: t

s /n

2 21 2 1 1 1 2X Y N ,  con una muestra n + n 11 30 :

1 2

1 2n n 2 2 2

1 2

1 2

(x y) ( )t

s s

n n

 Se trata de un contraste de hipótesis unilateral a la derecha de igualdad 

de medias  de poblaciones normales. Hipótesis del contraste: 

0 1 2 1 2 1 1 2 1 2  H :  0 H :  0

1 2n n 2 2 21 2

1 2

x yBajo la hipótesis nula:  t  

s s

n n

estadístico contraste

1 2n n 2 9

12 15 t t 1,24

16 16

6 5

p 9 9 9p valor P t 1,24 P t 1,24 1 P t 1,24

       1 0,1286 0,8714

0,883 1,383 1,24 1,383Tabla t‐Student:  x 0,1286

0,20 0,10 x 0,10

pComo   p valor 0,8714 0,05 Se admite la hipótesis nula, 

concluyendo que el primer antibiótico tiene una duración media 

inferior en la curación de la enfermedad.

Page 35: GUÍA p valor - Estadistica · 2017. 8. 4. · Y"tiempo caja rápida", que siguen respectivamente N( ,0,7) y N( ,0,6) 0t cr 1 t cr El con los datos de la muestra facilitala decisión

35

1 2, n n 2 R.A ( , t )

1 2, n n 2 0,05 , 9t t 1,833

R.A ( , 1,833)

0 1 2 1 2 1 1 2 1 2  H :  0 H :  0

1 2n n 2 9

12 15Bajo la hipótesis nula:   t t 1,24 

16 16

6 5

0 1 21,24 ( , 1,833) Se admite H :    

El primer antibiótico tiene una duración media inferior en la curación 

de la enfermedad.

2 21 2

 Se trata de un contraste unilateral para las medias de dos poblaciones

normales con muestras pequeñas, varianzas desconocidas pero iguales  

(debido a la información muestral s s ). Hipótesis del c

ontraste: 

                                0 1 2 1 1 2  H :  H : 

1 2, n n 2

p

1 2

x y:  t   :  t

1 1s

n n

Estadístico contraste Estadístico teórico

2 22 1 1 2 2p

1 2

(n 1)s (n 1)sVarianza muestral ponderada:    s

n n 2

2p p

6 . 16 5 . 16 s 16 s 4

6 5 2

p

1 2

x y 12 15 3 t 1,24

2,421 1 1 1s 4

n n 6 5

0 0,05 , 9Se acepta la hipótesis  H   ya que  t 1,24 1,833 t