Tema 11. Contraste de Hipótesis (13 y 15-04)

5
1 CONTRASTE DE HIPÓTESIS En este tema hablaremos sobre el contraste de hipótesis. Ante una afirmación, tendremos que comprobar su fiabilidad, es decir, si lo que se nos está diciendo es verdadero o falso. Para comprobar la exactitud de los datos emplearemos el contraste de hipótesis. Tenemos una población objetivo de n individuos (número muy elevado), una x que es variable que queremos contrastar siguiendo una distribución normal y unos parámetros como la media y la desviación estándar, que pueden ser conocidos o desconocidos. Los pasos que hay que seguir para realizar un contraste de hipótesis son los siguientes: 1. Establecer la hipótesis nula en términos de igualdad 2. Establecer la hipótesis alternativa, que puede hacerse de tres maneras, dependiendo del interés del investigador en el primer caso se habla de contraste bilateral o de dos colas, y en los otros dos de lateral (derecho en el 2º caso, o izquierdo en el 3º) o una cola. 3. Elegir un nivel de significación: nivel crítico para α 4. Elegir un estadístico de contraste: estadístico cuya distribución muestral se conozca en H0 y que esté relacionado con q y establecer, en base a dicha distribución, la región crítica: región en la que el estadístico tiene una probabilidad menor que a si H0 fuera cierta y, en consecuencia, si el estadístico cayera en la misma, se rechazaría H0. Obsérvese que, de esta manera, se está más seguro cuando se rechaza una hipótesis que cuando no. Por eso se fija como H0 lo que se quiere rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar. Por otro lado, la decisión se toma en base a la distribución muestral en H0, por eso es necesario que tenga la igualdad. 5. Calcular el estadístico para una muestra aleatoria y compararlo con la región crítica, o equivalentemente, calcular el "valor p" del estadístico (probabilidad de obtener ese valor, u otro más alejado de la H0, si H0 fuera cierta) y compararlo con α. A continuación se explicarán los siguientes puntos: 1. Formulación de Hipótesis Consiste en formular una hipótesis: La hipótesis es una afirmación sobre el valor de los parámetros en la población objetivo (NO en la muestra). Se formula en lenguaje estadístico y por parejas: - H0 : Hipótesis nula, la que queremos contrastar. Siempre lleva el signo “=” Ejemplo: La media de peso en la población que asiste mi centro de salud es de 70 kg μx= 70 kg Grupo 3 13 y 15 de abril

description

Comi

Transcript of Tema 11. Contraste de Hipótesis (13 y 15-04)

  • 1

    CONTRASTE DE HIPTESIS En este tema hablaremos sobre el contraste de hiptesis. Ante una afirmacin, tendremos que comprobar su fiabilidad, es decir, si lo que se nos est diciendo es verdadero o falso. Para comprobar la exactitud de los datos emplearemos el contraste de hiptesis. Tenemos una poblacin objetivo de n individuos (nmero muy elevado), una x que es variable que queremos contrastar siguiendo una distribucin normal y unos parmetros como la media y la desviacin estndar, que pueden ser conocidos o desconocidos. Los pasos que hay que seguir para realizar un contraste de hiptesis son los siguientes:

    1. Establecer la hiptesis nula en trminos de igualdad

    2. Establecer la hiptesis alternativa, que puede hacerse de tres maneras, dependiendo del inters del investigador

    en el primer caso se habla de contraste bilateral o de dos colas, y en los otros dos de lateral (derecho en el 2 caso, o izquierdo en el 3) o una cola.

    3. Elegir un nivel de significacin: nivel crtico para

    4. Elegir un estadstico de contraste: estadstico cuya distribucin muestral se conozca en H0 y que est relacionado con q y establecer, en base a dicha distribucin, la regin crtica: regin en la que el estadstico tiene una probabilidad menor que a si H0 fuera cierta y, en consecuencia, si el estadstico cayera en la misma, se rechazara H0.

    Obsrvese que, de esta manera, se est ms seguro cuando se rechaza una hiptesis que cuando no. Por eso se fija como H0 lo que se quiere rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar. Por otro lado, la decisin se toma en base a la distribucin muestral en H0, por eso es necesario que tenga la igualdad.

    5. Calcular el estadstico para una muestra aleatoria y compararlo con la regin crtica, o equivalentemente, calcular el "valor p" del estadstico (probabilidad de obtener ese valor, u otro ms alejado de la H0, si H0 fuera cierta) y compararlo con .

    A continuacin se explicarn los siguientes puntos:

    1. Formulacin de Hiptesis Consiste en formular una hiptesis: La hiptesis es una afirmacin sobre el valor de los parmetros en la poblacin objetivo (NO en la muestra). Se formula en lenguaje estadstico y por parejas: - H0 : Hiptesis nula, la que queremos contrastar. Siempre lleva el signo = Ejemplo: La media de peso en la poblacin que asiste mi centro de salud es de 70 kg x= 70 kg

    Grupo 3 13 y 15 de abril

  • 2

    - H1: Es la hiptesis alternativa . Puede ser:

    Diferente a : contraste de dos colas Mayor >: contraste con cola hacia la derecha

    Menor

  • 3

    4. Nivel de significacin (p) : nivel de significacin del test p: nivel de significacin de los datos p es un punto en la distribucin, que corresponde a la probabilidad de observar el valor de H0 o uno todava ms extremo. Cuanto ms bajo es p ms raro es haber observado lo de mi muestra si de verdad fuese cierta la hiptesis nula

    *En el caso del contraste de dos colas se multiplica por 2 ya que es simtrica y pasa lo mismo en los dos lados.

    Regla automtica de decisin: - Si p< : El valor de la media muestral pertenece a la zona de rechazo. El contraste

    es estadsticamente significativo. rechazamos H0 - Si p > : El valor del estadstico de contraste pertenece a la regin de aceptacin.

    Los datos no contienen suficiente evidencia para rechazar H0, con lo cual no es estadsticamente significativo.

    La regin de aceptacin est delimitada por A la zona de no rechazo se le denomina intervalo de confianza, y en el caso de un de 0,05 incluira el 95% de la poblacin.

  • 4

    5. Contraste sobre la media Para contrastar medias para variables continuas se calcular la diferencia de medias muestrales.

    A la hora de escoger un estadstico de contraste, si quiero contrastar la media escoger la media muestral. Esta puede tener una distribucin normal o de T de Student. En el segundo caso, podr estandarizada a una normal si n es mayor a 30. El estadstico de contraste debe ser:

    - Insesgado: su esperanza es el parmetro incluido en la hiptesis nula - Eficiente: mnima varianza - De distribucin conocida

    6. Contraste sobre la media de dos poblaciones independientes

    Este clculo es fundamental para comparar tratamientos. Ejemplo Tenemos dos poblaciones independientes de las que escogeremos una muestra y sacaremos la media de peso.

    Formulamos una hiptesis (Ho) afirmando que las medias son iguales, y su alternativa.

  • 5

    En el caso de los tratamientos, si Ho no es cierta, es decir, si la efectividad de los tratamientos no es la misma, sabremos que uno es ms eficaz que el otro.

    7. Contraste sobre la proporcin Conviene recordar que en proporciones nos olvidamos de la T de student porque aproximamos la binomial a una normal.