Estadistica

43
ESTAD ´ ISTICA I Tema 5: Contraste de hip´ otesis I Planteamiento del problema I Conceptos b´ asicos: hip´ otesis nula y alternativa, tipos de errores, nivel de significaci´ on, regi´ on cr´ ıtica o de rechazo, tama˜ no del test, potencia I Contrastes para la media de una distribuci´ on I Consistencia de tests. Tests insesgados y UMP I p-valor I Contrastes para dos muestras. Distribuci´ on F de Fisher-Snedecor I Lema de Neyman-Pearson. Tests ´ optimos I Construcci´ on de tests: test de raz´ on de verosimilitudes, test bayesiano. Estad´ ıstica I (Mat/DG). Profesora: Amparo Ba´ ıllo Tema 5: Contraste de hip´ otesis 1

description

Prueba de Hipotesis

Transcript of Estadistica

  • ESTADISTICA ITema 5: Contraste de hipotesis

    I Planteamiento del problemaI Conceptos basicos: hipotesis nula y alternativa, tipos de errores,

    nivel de significacion, region crtica o de rechazo, tamano del test,potencia

    I Contrastes para la media de una distribucionI Consistencia de tests. Tests insesgados y UMPI p-valorI Contrastes para dos muestras. Distribucion F de Fisher-SnedecorI Lema de Neyman-Pearson. Tests optimosI Construccion de tests: test de razon de verosimilitudes, test

    bayesiano.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 1

  • Planteamiento del problema. Conceptos basicos

    El objetivo de la teora de contraste de hipotesis es elegir entre dosposibilidades excluyentes (hipotesis nula e hipotesis alternativa)relativas al valor de un parametro poblacional, a partir de lainformacion proporcionada por los datos muestrales.

    Sea X1, . . . ,Xn una muestra aleatoria de una v.a. X con funcionde distribucion F, donde .Objetivo: Dada una particion del espacio parametrico = 0 1, deseamos decidir, en base a la muestra obtenida, si 0 o si 1. Queremos contrastar

    H0 : 0 (hipotesis nula)H1 : 1 (hipotesis alternativa)

    Un test para contrastar estas dos hipotesis consiste en proporcionaruna regla de decision que, a cada posible observacion de la muestra(x1, . . . , xn), le asigne una decision: aceptar o rechazar H0.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 2

  • Los contrastes habituales (no aleatorizados) se definen medianteuna region crtica o region de rechazo R Rn, de tal manera que,cuando (x1, . . . , xn) R, se rechaza la hipotesis nula.

    Espacio muestral

    (x1,...,xn)

    (x1,...,xn)

    Regin crticao de rechazoR

    Regin deaceptacin A

    Rechazo H0

    Acepto H0

    TEST

    Decisin

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 3

  • Es importante destacar que la metodologa de contraste dehipotesis no demuestra la validez de la hipotesis que se aceptaen cada caso (en el sentido en el que se demuestra algo medianteun metodo deductivo, por ejemplo).

    La manera correcta de interpretar los resultados es decir que losdatos disponibles proporcionan (o no proporcionan) evidenciaestadstica suficiente en contra de la hipotesis nula. En todo caso,la conclusion depende de informacion incompleta y aleatoria,procedente de una o varias muestras, y siempre existe la posibilidadde cometer un error aceptando una hipotesis equivocada.

    Los procedimientos que se utilizan habitualmente se suelendenominar contrastes o tests de hipotesis.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 4

  • Posibles errores de un test:

    I Error de tipo I: Rechazar H0 cuando H0 es cierta.

    I Error de tipo II: Aceptar H0 cuando H0 es falsa.

    La funcion de potencia de un test con region de rechazo R paracontrastar H0 : 0 frente a H1 : 1 es la funcion

    n : [0, 1] 7 n() = P{(X1, . . . ,Xn) R}

    Lo que nos gustara:

    0 1

    Potencia = 1Potencia = 1

    Potencia = 0

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 5

  • Lo que en realidad se suele hacer (teora de Neyman-Pearson):

    1. Acotar la maxima probabilidad de error de tipo I.

    Se fija un nivel de significacion (0, 1). Tpicamente = 0, 05. Se define el tamano de un test como la maxima probabilidad

    de error de tipo I: max0

    P(R) = max0

    n().

    Se busca una region de rechazo R tal que max0

    P(R) .2. Minimizar la probabilidad de error de tipo II. Se intenta

    buscar una region de rechazo R que maximice la funcion depotencia cuando 1.

    Las hipotesis H0 y H1 no son simetricas.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 6

  • Como vemos, los test de hipotesis estan disenados para controlar laprobabilidad maxima de rechazar H0 cuando es cierta. Enconsecuencia, suelen ser conservadores con la hipotesis nula:hace falta mucha evidencia muestral para rechazar H0.

    Observemos que es posible que, con los mismos datos, H0 serechace para un nivel de significacion = 0.05 y se acepte para = 0.01.

    En una primera aproximacion, los problemas de contraste dehipotesis pueden clasificarse en problemas de una muestra (cuandohay una sola poblacion de interes) y problemas de dos muestras(cuando se quiere comparar dos poblaciones y se dispone de unamuestra de cada una de ellas). Presentaremos las ideas basicas enel caso de los problemas de una muestra pero pueden extendersede modo analogo a los de dos muestras.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 7

  • Un ejemplo ilustrativo y sus consecuencias

    Ejemplo: Se analiza un envo de botellas de aceite envasado conun mecanismo del que se afirma que, en media, rellena las botellascon 100 cl. de aceite. Examinada una muestra de 5 botellas seobtiene que el promedio es 95 cl. y la cuasivarianza es 1.1.Suponemos que la v.a. X = contenido de aceite (en cl.) en unabotella sigue una distribucion N(, ). Hay suficiente evidenciaemprica para afirmar que el contenido medio de las botellas no es100 cl.?Queremos contrastar

    H0 : = 100, frente a H1 : 6= 100.Otra posibilidad sera preguntarse si existe evidencia empricasuficiente para afirmar que el consumidor recibe, en promedio,menos cantidad de la que indica la etiqueta. En ese caso, elplanteamiento correcto sera contrastar

    H0 : 100, frente a H1 : < 100.Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 8

  • Ejemplo (cont.): Tenemos, por tanto, un problema del tipo:

    contrastar H0 : = 0 frente a H1 : 6= 0(siendo 0 un valor prefijado) a partir de una muestra X1, . . . ,Xnextrada de N(, ).

    Para ello prefijamos el nivel de significacion del test (0, 1) (porejemplo, = 0.05) y observamos que, si H0 fuera cierta,

    X 0s/

    n tn1. (1)

    Por otra parte, esta claro que deberamos sospechar que H0 es falsa(y, por tanto, H1 es cierta) cuando x resulte estar suficientementealejada de 0. El resultado (1) nos ayuda a decidir, de un modoracional, que es lo que significa suficientemente alejada.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 9

  • Ejemplo (cont.): En efecto, dada una muestra x1, . . . , xn, parecemuy natural decidir que H0 es falsa cuando tengamos x 0s/n

    > tn1;/2. (2)ya que, en este caso, tenemos una muestra que sera muy rara sirealmente H0 fuera cierta.Observese que, de todos modos, hay una probabilidad , prefijada,de cometer un error de tipo I (rechazar H0 siendo cierta).Analogamente, si el problema hubiera sido contrastar

    H0 : 0 frente a H1 : < 0,

    un criterio razonable para rechazar H0 con un nivel de significacion sera

    x 0s/

    n< tn1;. (3)

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 10

  • Ejemplo (cont.): En el ejemplo del envasado de aceite x = 95,s2 = 1.1, n = 5. Por tanto, x 0s/n

    = 10.66y como 10.66 > t4;0.025 = 2.776445, H0 : = 100 se rechaza alnivel de significacion = 0.05 y, dado que10.66 > t4;0.005 = 4.604095, tambien se rechaza al nivel 0.01.

    Sin embargo, supongamos que hubieramos obtenido x = 98,s2 = 1.1, n = 5. Entonces x 0s/n

    = 4.264014y la hipotesis H0 se rechazara al nivel = 0.05 pero NO serechazara al nivel 0.01.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 11

  • Ejemplo (cont.): En el ejemplo de las botellas, supongamos quequeremos contrastar

    H0 : 100 frente a H1 : < 100.

    Entonces el criterio para rechazar H0 con un nivel de significacion sera

    x 100s/

    5< t4;.

    Supongamos que hubieramos obtenido x = 98. Entoncesx 100

    s/

    5= 4.2640. Como t4;0.01 = 3.7469, la hipotesis nula

    H0 : 100 se rechaza al nivel 0.01 (y tambien por supuesto, alnivel 0.05, ya que t4;0.05 = 2.1318).

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 12

  • Algunas consecuencias y observaciones:

    El anterior ejemplo es un solo un caso particular de contraste dehipotesis, pero nos permite extraer algunas consecuencias y daralgunas definiciones generales sobre la metodologa del contrastede hipotesis.

    I Asimetra de las hipotesis: H0 se acepta a menos que se hayaobtenido suficiente evidencia estadstica en contra de ella. Poresta razon, cuando H0 se acepta no debe pensarse que se hademostrado su validez. H0 representa la hipotesis que estamosdispuestos a aceptar a menos que se obtengan fuertes indiciosen contra.

    I Errores de tipo I y II: En todo caso siempre hay unaprobabilidad positiva de cometer uno de los dos posibles errores:rechazar H0 cuando es cierta (error de tipo I) o aceptar H0cuando es falsa (error de tipo II).

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 13

  • I El nivel de significacion: Los tests usuales estan construidos demodo que la maxima probabilidad de cometer el error de tipo Iesta acotada por un valor prefijado , el nivel de significacion(no confundir con el nivel de confianza de los intervalos).

    I La decision de rechazar o aceptar H0 depende del nivel designificacion elegido. Cuanto mas pequeno es masconservador se hace el test a favor de H0, es decir, que paraaceptar H1 cuando es muy pequeno, debemos tener muchaevidencia estadstica.

    I Cuando se toma una decision (aceptar o rechazar H0) debeindicarse siempre el nivel de significacion del test que se hautilizado.

    I Cuando se acepta H0 no debe pensarse que se ha demostradoH0 sino que no se ha encontrado suficiente evidencia emprica(al nivel prefijado ) en contra de H0.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 14

  • I Cuando se acepta H1 debe recordarse tambien que lainterpretacion correcta es que los datos obtenidosproporcionan suficiente evidencia estadstica al nivel paraaceptar H1. Una muestra diferente (o un nivel de significacionmas bajo) podran haber llevado a conclusiones distintas.

    I Dualidad con los intervalos de confianza: en algunos casos dehipotesis nula simple (i.e. del tipo H0 : = 0) el test usualrechaza H0 (al nivel de significacion ) si y solo si el intervalode nivel de confianza 1 no contiene al valor 0.Ejemplo: Si X N(, ) la region de rechazo

    R =

    {(x1, . . . , xn) : |x 0| tn1;/2

    sn

    }del contraste

    H0 : = 0

    H1 : 6= 0equivale a

    R = {(x1, . . . , xn) : 0 / IC1()} .Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 15

  • Contrastes para la media de una distribucion

    En cada caso se rechaza H0 cuando (x1, . . . , xn) R. Distribucion normal con varianza conocida: Sea X1, . . . ,Xnuna muestra aleatoria de X N(, ) con conocido.

    H0 : = 0 R =

    {(x1, . . . , xn) : |x 0| z/2

    n

    }H0 : 0 R =

    {(x1, . . . , xn) : x 0 z

    n

    }H0 : 0 R =

    {(x1, . . . , xn) : x 0 z1

    n

    }donde z es tal que (z) = 1 siendo la funcion dedistribucion de la N(0, 1).

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 16

  • Distribucion normal con varianza desconocida: SeaX1, . . . ,Xn una muestra aleatoria de X N(, ) con desconocido.

    H0 : = 0 R =

    {(x1, . . . , xn) : |x 0| tn1;/2

    sn

    }H0 : 0 R =

    {(x1, . . . , xn) : x 0 tn1; s

    n

    }H0 : 0 R =

    {(x1, . . . , xn) : x 0 tn1;1 s

    n

    }

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 17

  • Tests de nivel aproximado (muestras grandes) para lamedia de cualquier distribucion: Sea X1, . . . ,Xn una muestraaleatoria de X con E(X ) = z/2}

    H0 : 0, frente a H1 : > 0

    R =

    {(x1, . . . , xn) :

    x 0s/

    n> z

    }H0 : 0, frente a H1 : < 0

    R =

    {(x1, . . . , xn) :

    x 0s/

    n< z

    }

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 18

  • Tests de nivel aproximado (muestras grandes) para elparametro p en una Bernoulli: Sea X1, . . . ,Xn una muestraaleatoria de X Bernoulli(p).

    H0 : p = p0, frente a H1 : p 6= p0.

    El criterio de rechazo es (x1, . . . , xn) R, siendo

    R =

    (x1, . . . , xn) : x p0p0(1p0)

    n

    > z/2

    y analogamente para los tests con hipotesis H1 unilaterales.

    En el formulario que se puede descargar de la pagina webhay una lista de las regiones crticas correspondientes alos contrastes de uso mas frecuente.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 19

  • Contrastes para la varianza de una normal

    Sea X1, . . . ,Xn una muestra aleatoria de X N(, ) con desconocido.

    H0 : = 0 R =

    {(n 1)s2

    20/ (2n1;1/2 , 2n1;/2)

    }= {20 / IC1(2)}

    H0 : 0 R ={

    (n 1)s220

    2n1;}

    H0 : 0 R ={

    (n 1)s220

    2n1;1}

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 20

  • El concepto de p-valor

    Dado un test, definido para todos los niveles de significacionposibles, se define el p-valor, para unos datos prefijados, como elnfimo de los valores para los cuales se rechaza la hipotesis nulaa un nivel de significacion .

    P(x1, . . . , xn) = inf{ : H0 es rechazada al nivel }.

    Cuanto mas pequeno es el p-valor, mas evidencia estadsticaaportan los datos a favor de H1.

    El p-valor se puede interpretar como la probabilidad de obtener unvalor al menos tan raro como el que se ha obtenido cuando H0es cierta.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 21

  • Ejemplo: Los lagartos del desierto se esconden del calor en veranopara evitar que su temperatura corporal interna llegue al nivel letalde 45oC. Se ha tomado una muestra para estudiar el tiempo X (enminutos) requerido para que la temperatura de un lagarto alcancelos 45oC, partiendo de su temperatura normal mientras estaban enla sombra. Se han obtenido los siguientes datos:

    10,1 12,5 12,2 10,2 12,8 12,111,2 11,4 10,7 14,9 13,9 13,3

    Suponiendo que X sigue una distribucion N(, ) y, en base aestos datos, puede concluirse que el tiempo medio requerido paraalcanzar la temperatura letal es menor que 13 minutos?

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 22

  • Contrastes para dos muestras

    Caso de muestras independientes:

    Se tienen dos muestras X1, . . . ,Xn1 e Y1, . . . ,Yn2 de dos v.a. X eY . Ambas muestras se suponen independientes entre s. Se deseacontrastar hipotesis del tipo

    H0 : 1 = 2

    H0 : 1 2H0 : 1 = 2

    En los ejercicios propuestos se pueden encontrar varios ejemplos.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 23

  • Uno de los tests mas usuales es el de igualdad de medias para dospoblaciones normales homocedasticas, es decir, con 1 = 2:Se puede probar que, bajo H0 : 1 = 2,

    X Ysp

    1n1

    + 1n2

    tn1+n22

    y, por tanto, una region crtica al nivel es

    R =

    {|x y | > tn1+n22;/2 sp

    1

    n1+

    1

    n2

    }siendo

    s2p =(n1 1)s21 + (n2 1)s22

    n1 + n2 2la varianza combinada (pooled variance).

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 24

  • Para contrastar la hipotesis de homocedasticidad (igualdad devarianzas) de dos poblaciones normales presentamos una nuevadistribucion auxiliar.

    Sean Q1 y Q2 v.a. independientes con distribuciones 2n1 y

    2n2 ,

    respectivamente. La distribucion deQ1/n1Q2/n2

    se denomina F de

    Fisher-Snedecor con n1 y n2 grados de libertad, Fn1,n2 .

    0 1 2 3 4 5

    0.00.5

    1.01.5

    2.0

    range(x)

    c(0, 2)

    n1=1, n2=1

    n1=2, n2=1

    n1=5, n2=2

    n1=100, n2=1

    n1=100, n2=100

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 25

  • Si s21 , s22 son la cuasi-varianzas de dos muestras independientes de

    tamano n1 y n2 extradas, respectivamente, de dos poblacionesN(1, 1) y N(2, 2), se tiene

    (n1 1)s2121

    2n11,(n2 1)s22

    22 2n21,

    Por tanto, bajo H0 : 1 = 2,

    s21s22 Fn11,n21.

    De este resultado se derivan los tests para comparar 1 y 2.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 26

  • H0 : 1 = 2 R =

    {s21s22

    / (Fn11;n21;1/2,Fn11;n21;/2)}

    =

    {1 / IC1

    (2122

    )}H0 : 1 2 R =

    {s21s22> Fn11;n21;

    }H0 : 1 2 R =

    {s21s22< Fn11;n21;1

    }

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 27

  • Caso de muestras emparejadas:

    Surge en aquellas situaciones con n1 = n2 en que Xi e Yi no sonindependientes (porque corresponden, por ejemplo, a medicionessobre el mismo individuo antes y despues de un tratamiento).

    Se reducen a problemas de una muestra para la muestra dediferencias Di = Xi Yi .Puede verse un ejemplo en los problemas de la Relacion 5.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 28

  • Consistencia de tests. Tests insesgados y UMP

    Se dice que una sucesion de tests con un nivel prefijado esconsistente cuando

    limnn() = 1, 1 = \0.

    Se dice que un test es insesgado cuando

    n() 0 y n() 1.

    Se dice que un test con funcion de potencia n es uniformementemas potente (UMP) dentro de una clase Bn, de tests de nivel basados en muestras de tamano n cuando

    n() n(), 1siendo n la funcion de potencia de cualquier otro test de la claseBn,.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 29

  • El lema de Neyman-Pearson

    Se considera el problema de hipotesis simple y alternativa simple

    H0 : = 0 frente a H1 : = 1.

    Denotemos fn(x1, . . . , xn; ) =n

    i=1 f (xi ; ).Dado (0, 1), supongamos que la region

    R ={

    (x1, . . . , xn) :fn(x1, . . . , xn; 1)

    fn(x1, . . . , xn; 0)> k

    }verifica P0(R) = . Entonces

    P1(R) P1(R),

    siendo R la region crtica de cualquier otro test tal que P0(R) .En otras palabras, R es el test optimo de nivel para el problemaconsiderado.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 30

  • Demostracion del lema de Neyman-Pearson: Denotemosx = (x1, . . . , xn)

    P1(R) P1(R) =

    RRc

    fn(x; 1)dxRcR

    fn(x; 1)dx,

    pero, por definicion de R,RRc

    fn(x; 1)dx kRRc

    fn(x; 0)dx

    y tambien RcR

    fn(x; 1)dx kRcR

    fn(x; 0)dx.

    Por lo tanto

    P1(R) P1(R) k

    [RRc

    fn(x; 0)dxRcR

    f (x; 0)dx

    ]= k

    [R

    fn(x; 0)dxR

    fn(x; 0)dx

    ]= k [P0(R

    ) P0(R)] 0. Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 31

  • Familias parametricas con cociente de verosimilitudesmonotono y tests optimos

    I Como construir tests optimos en problemas que no sean de hipotesissimple y alternativa simple?

    I Consideremos el caso en que el modelo es de la forma f (; ), siendo , donde R es un intervalo.

    I Sea fn(x1, . . . , xn; ) =n

    i=1 f (xi ; ).

    I Supongamos que queremos contrastar H0 : 0 frente a H1 : > 0.

    Definicion.- Se dice que f (|) es una familia parametrica concociente de verosimilitudes monotono (CVM) si existe unestadstico Tn(x1, . . . , xn) tal que, para todo 1, 2, con 1 < 2, larazon de verosimilitudes

    fn(x1, . . . , xn; 2)

    fn(x1, . . . , xn; 1)

    es una funcion monotona no decreciente de Tn(x1, . . . , xn).

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 32

  • Como consecuencia directa del Lema de Neyman-Pearson y de laanterior definicion se tiene

    Teorema.- Supongamos que f (; ) cumple la propiedad CVM yque k es tal que

    P0{Tn > k} = .Supongamos ademas que P{Tn = c} = 0, para todo y c.Entonces, R = {(x1, . . . , xn) : Tn(x1, . . . , xn) > k} es la regioncrtica de un test optimo (uniformemente mas potente) de nivel para contrastar H0 : 0 frente a H1 : > 0.

    Un resultado analogo es valido para H0 : 0 frente aH1 : < 0 aunque en este caso la propiedad CVM debe cumplirsecambiando no decreciente por no creciente.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 33

  • Ejemplo: Sea f (; ) una uniforme en (0, ). La propiedad CVM secumple con Tn(x1, . . . , xn) = max{x1, . . . , xn}. Por tanto, el testoptimo de nivel para H0 : 0 frente a H1 : > 0 es

    R = {(x1, . . . , xn) : max{x1, . . . , xn} > k}, donde 1(

    k0

    )n=

    es decir, k = exp(

    1n log(1 ) + log(0)

    ).

    Ejemplo: Si f (x ; ) = ex1[0,)(x), la propiedad CVM secumple con Tn(x1, . . . , xn) = 1/

    ni=1 xi .

    Por tanto, el test optimo de nivel para H0 : 0 frente aH1 : > 0 es

    R = {(x1, . . . , xn) : 1ni=1 xi

    > k} donde P0{n

    i=1

    Xi 2k1;,

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 37

  • Aqu el numerador de n es

    n!

    O1! . . .Ok !pO110 . . . p

    Okk0 ,

    siendo Oj = #{i : xi = aj} las frecuencias observadas de los distintosvalores de la variable [notese que, bajo H0, (O1, . . . ,Ok) tienedistribucion multinomial M(n; p10, . . . , pk0)]. El denominador de n es

    n!

    O1! . . .Ok !

    (O1n

    )O1. . .

    (Okn

    )Ok.

    Sustituyendo en n es inmediato ver que el estadstico de contraste sepuede expresar en la forma

    2 log n = 2k

    i=1

    Oi log

    (Oiei

    ),

    donde ei = npi0, i = 1, . . . , k son las frecuencias esperadas (bajo H0)

    de los distintos valores de la variable en una muestra de tamano n.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 38

  • Un ejemplo clasico: el experimento de Mendel

    En el famoso experimento de Mendel secruzaron plantas de guisantes con fenotiporugoso-amarillo con otras de fenotipo liso-verde. En la segunda generacion se podanobservar cuatro fenotipos (liso-amarillo,rugoso-amarillo, liso-verde, rugoso-verde)cuyas respectivas probabilidades, segun lateora de la herencia mendeliana, deban ser

    p10 =9

    16, p20 =

    3

    16, p30 =

    3

    16, p40 =

    1

    16.

    Observados n = 556 guisantes en la segundageneracion del experimento se obtuvieron lossiguientes numeros de guisantes con estosfenotipos:

    O1 = 315,O2 = 101,O3 = 108,O4 = 32.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 39

  • Proporcionan estos resultados alguna evidencia en contra de lateora mendeliana?

    Aplicamos el test para contrastar H0 : p1 =9

    16 , . . . , p4 =1

    16 :

    e1 = 556 916

    = 312.75, e2 = e3 = 556 316

    = 104.25, e4 = 556 116

    = 34.75

    En definitiva, el test de cociente de verosimilitudes compara las Oicon las ei y rechaza la hipotesis nula cuando hay demasiadasdiferencias entre ellas. Esto se hace formalmente mediante elestadstico

    2 log n = 2k

    i=1

    Oi log

    (Oiei

    )= 0.4754

    El p-valor (calculado a partir de la distribucion 23) es 0.9281 loque, por supuesto, no indica ninguna evidencia estadstica encontra de H0.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 40

  • Hay una controversia clasica en la historia de la ciencia en elsentido de que los resultados de Mendel eran demasiado buenos,es decir, haba demasiada concordancia entre las Oi y las ei (porejemplo, R.A. Fisher era de esta opinion; ver su artculo de 1936,Has Mendels work been rediscovered?, en The Annals ofScience).

    Se ha sugerido que este supuesto exceso de concordancia podadeberse a un sesgo de repeticion (confirmation bias) producidopor la repeticion de los resultados hasta que las Oi concordasenfuertemente con las ei . Tambien se ha conjeturado que algunayudante de Mendel pudo actuar con exceso de celomanipulando los resultados. En todo caso, las ideas basicas deMendel eran acertadas y han tenido una influencia decisiva.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 41

  • Construccion de tests. Test bayesianos

    Se desea contrastar

    H0 : 0 frente a H1 : \0.

    Como siempre, la informacion procede de una muestra x1, . . . , xn.

    La metodologa bayesiana supone que la densidad que ha generadolos datos es f (|) y que el parametro puede considerarse comouna v.a. con distribucion a priori pi(). A partir de aqu se calculanla distribucion a posteriori pi(|x1, . . . , xn) dada por

    pi(|x1, . . . , xn) = fn(x1, . . . , xn|)pi() fn(x1, . . . , xn|)pi()d

    ,

    donde fn(x1, . . . , xn|) =n

    i=1 f (xi ; ).

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 42

  • El elemento fundamental en la inferencia bayesiana es siempre ladistribucion a posteriori. A partir de ella se pueden calcular lasprobabilidades a posteriori de ambas hipotesis

    P{ 0|x1, . . . , xn} = pi(H0|x1, . . . , xn) =

    0

    pi(|x1, . . . , xn)d,P{ 1|x1, . . . , xn} = pi(H1|x1, . . . , xn) = 1 pi(H0|x1, . . . , xn),

    y decidir dependiendo de sus valores. Tpicamente se optara porH1 cuando

    pi(H1|x1, . . . , xn) ,donde (0, 1) es un valor que se fija dependiendo de la gravedadque se atribuya al error de tipo I (rechazar H0 cuando es cierta).

    Observemos que la metodologa bayesiana de contraste de hipotesisdepende fuertemente de la eleccion de la distribucion a priori pi.

    Estadstica I (Mat/DG). Profesora: Amparo Ballo Tema 5: Contraste de hipotesis 43