Manual de Estadistica Aplicada a La Investigación Social

208
1 Verificación de hipótesis sobre los parámetros poblacionales El estudio que se acaba de hacer en el Capitulo anterior sobre los conceptos y las técnicas de la estimación puntual y por intervalos ha servido para empezar a familiarizarnos con la inferencia estadística. En el presente capitulo se va a considerar otro enfoque de la inferencia estadística: la verificación de hipótesis. A pesar de que los temas referentes a la estimación por intervalos y a la verificación de hipótesis se tratan aquí en capítulos separados, no son cuestiones tan diferentes como lo podría indicar esta forma de tratarlos. Ambas ideas se fundamentan en los conceptos de probabilidad y de distribución muestral que se estudiaron en los capítulos anteriores. Ambos también hacen posible la toma de decisiones acerca de una población con base en la información contenida en una muestra de esa población. 6.1 HIPOTESIS La palabra hipótesis se define como: 1. Una afirmación que esta sujeta a verificación o comprobación, 2. Una suposición que se utiliza como base para una acción.* El punto clave de estas definiciones esta en que una hipótesis es una afirmación o suposición y no un hecho establecido. De esta manera, al no existir un conocimiento previo sobre la efectividad de dos métodos de enseñanza, un investigador puede proponer la hipótesis de que para la• enseñanza de la lectura a estudiantes de primer ano, el método A es superior al método B. Un fabricante de drogas puede hacer la hipótesis de que un determinado medicamento es más efectivo que otro que se venía usando normalmente en el tratamiento de una enfermedad. Un fabricante de plásticos puede hacer la hipótesis de que ciertas láminas de determinado tipo de plástico tienen una resistencia a la tracción promedio de 75 libras. Hipótesis de esta naturaleza pueden basarse en la experiencia y la observación, experimentación, o en la intuición. Las hipótesis establecidas en esta forma proporcionan con frecuencia motivo para realizar una investigación. Por esta razón podemos denominarlas hipótesis de investigación. Generalmente hay que volver a plantear las hipótesis de investigación antes de verificarlas estadísticamente. Cuando ya se han planteado en forma conveniente, de tal forma que se puedan comprobar por medio de los métodos estadísticos que se estudian en el presente capitulo, las hipótesis reciben el nombre de hipótesis estadísticas. Las hipótesis estadísticas son afirmaciones sobre una o mas poblaciones, o mejor, como es mas frecuente, afirmaciones sobre uno o mas parámetros de una o mas poblaciones. Las hipótesis estadísticas son de dos tipos. Primero esta la hipótesis nula, que se simboliza por Ho y que es la hipótesis que se debe comprobar. La hipótesis nula se llama también hipótesis de ninguna diferencia (por esto el término nula). Es una afirmación en la que se dice que no hay ninguna diferencia entre dos poblaciones, entre dos parámetros poblacionales o entre el valor verdadero de algún parámetro y su valor hipotético. Veamos nuevamente las tres hipótesis de investigación que se acabaron de enunciar y establezcamos para cada una de ellas la hipótesis nula correspondiente. En el caso de la hipótesis de investigación sobre los métodos de enseñanza de la lectura a alumnos de primer ano, supongamos que el criterio de efectividad con que se van a comparar los dos métodos es el puntaje obtenido en una prueba de rendimiento en lectura hecha al terminar el año. La hipótesis nula apropiada (Ho) consistiría en afirmar que no hay ninguna diferencia entre la efectividad de los dos métodos de enseñanza de lectura, o mas específicamente, que el puntaje promedio obtenido en la prueba por los estudiantes que aprendieron según el método A es igual (no es diferente de) al puntaje promedio de los estudiantes que aprendieron según el método B. Podemos expresar la hipótesis nula en forma mas compacta como

description

estadistica

Transcript of Manual de Estadistica Aplicada a La Investigación Social

  • 1

    Verificacin de hiptesis sobre los parmetros poblacionales El estudio que se acaba de hacer en el Capitulo anterior sobre los conceptos y las tcnicas de la

    estimacin puntual y por intervalos ha servido para empezar a familiarizarnos con la inferencia estadstica. En el presente capitulo se va a considerar otro enfoque de la inferencia estadstica: la verificacin de hiptesis. A pesar de que los temas referentes a la estimacin por intervalos y a la verificacin de hiptesis se tratan aqu en captulos separados, no son cuestiones tan diferentes como lo podra indicar esta forma de tratarlos. Ambas ideas se fundamentan en los conceptos de probabilidad y de distribucin muestral que se estudiaron en los captulos anteriores. Ambos tambin hacen posible la toma de decisiones acerca de una poblacin con base en la informacin contenida en una muestra de esa poblacin.

    6.1 HIPOTESIS La palabra hiptesis se define como: 1. Una afirmacin que esta sujeta a verificacin o comprobacin, 2. Una suposicin que se utiliza como base para una accin.* El punto clave de estas definiciones esta en que una hiptesis es una afirmacin o suposicin y no

    un hecho establecido. De esta manera, al no existir un conocimiento previo sobre la efectividad de dos mtodos de enseanza, un investigador puede proponer la hiptesis de que para la enseanza de la lectura a estudiantes de primer ano, el mtodo A es superior al mtodo B. Un fabricante de drogas puede hacer la hiptesis de que un determinado medicamento es ms efectivo que otro que se vena usando normalmente en el tratamiento de una enfermedad. Un fabricante de plsticos puede hacer la hiptesis de que ciertas lminas de determinado tipo de plstico tienen una resistencia a la traccin promedio de 75 libras. Hiptesis de esta naturaleza pueden basarse en la experiencia y la observacin, experimentacin, o en la intuicin. Las hiptesis establecidas en esta forma proporcionan con frecuencia motivo para realizar una investigacin. Por esta razn podemos denominarlas hiptesis de investigacin.

    Generalmente hay que volver a plantear las hiptesis de investigacin antes de verificarlas

    estadsticamente. Cuando ya se han planteado en forma conveniente, de tal forma que se puedan comprobar por medio de los mtodos estadsticos que se estudian en el presente capitulo, las hiptesis reciben el nombre de hiptesis estadsticas. Las hiptesis estadsticas son afirmaciones sobre una o mas poblaciones, o mejor, como es mas frecuente, afirmaciones sobre uno o mas parmetros de una o mas poblaciones.

    Las hiptesis estadsticas son de dos tipos. Primero esta la hiptesis nula, que se simboliza por Ho y

    que es la hiptesis que se debe comprobar. La hiptesis nula se llama tambin hiptesis de ninguna diferencia (por esto el trmino nula). Es una afirmacin en la que se dice que no hay ninguna diferencia entre dos poblaciones, entre dos parmetros poblacionales o entre el valor verdadero de algn parmetro y su valor hipottico.

    Veamos nuevamente las tres hiptesis de investigacin que se acabaron de enunciar y establezcamos

    para cada una de ellas la hiptesis nula correspondiente. En el caso de la hiptesis de investigacin sobre los mtodos de enseanza de la lectura a alumnos de primer ano, supongamos que el criterio de efectividad con que se van a comparar los dos mtodos es el puntaje obtenido en una prueba de rendimiento en lectura hecha al terminar el ao. La hiptesis nula apropiada (Ho) consistira en afirmar que no hay ninguna diferencia entre la efectividad de los dos mtodos de enseanza de lectura, o mas especficamente, que el puntaje promedio obtenido en la prueba por los estudiantes que aprendieron segn el mtodo A es igual (no es diferente de) al puntaje promedio de los estudiantes que aprendieron segn el mtodo B. Podemos expresar la hiptesis nula en forma mas compacta como

  • 2

    Supongamos que la efectividad de la nueva droga y la de la droga usual que se menciono antes, se

    mide en funcin de la proporcin de casos que responden favorablemente al tratamiento mediante cada una. La hiptesis nula apropiada consistira en afirmar que la proporcin de casos que responden favorablemente a la nueva droga es igual a la proporcin de casos que responden favorablemente a la droga usual, o

    Finalmente, en el caso de la hiptesis de investigacin que afirma que las laminas de cierto

    tipo de plstico tienen una resistencia promedio a la traccin de 75 libras, la hiptesis nula apropiada consistira en decir que la resistencia a la traccin promedio es de 75 libras, o

    Para verificar una hiptesis nula, examinamos los datos de la muestra tomada de la

    poblacin pertinente y determinamos si son o no compatibles con la hiptesis nula. Si los datos de la muestra no son compatibles con la hiptesis nula, entonces Ho se rechaza. Si los datos son compatibles con la hiptesis nula, entonces Ho no se rechaza. En la Seccin 6.2 explicaremos el criterio que se usa para determinar si los datos de la muestra son o no compatibles con la hiptesis nula.

    Si la hiptesis nula no se rechaza, decimos que los datos particulares de la muestra no dan

    suficiente evidencia como para que concluyamos que la hiptesis nula es falsa. Si la hiptesis nula se rechaza, decimos que los datos particulares de la muestra si dan suficiente evidencia como para hacernos concluir que la hiptesis nula es falsa y que una segunda hiptesis es verdadera. Esta segunda hiptesis, de la que hemos concluido que es verdadera si la hiptesis nula es rechazada, se denomina hiptesis alterna y se designa con el smbolo H1. Generalmente la hiptesis alterna y la hiptesis de investigacin son la misma.

    Vamos a referirnos nuevamente a las hiptesis de investigacin que planteamos

    anteriormente, para establecer en cada caso cual seria la hiptesis nula y la hiptesis alterna apropiada.

    1 hiptesis de investigacin: el mtodo A es superior al mtodo B para la enseanza de la

    lectura a alumnos de primer ao.

    2 hiptesis de investigacin: la nueva droga es ms efectiva que la droga usual en el

    tratamiento de la enfermedad X.

    3 hiptesis de investigacin: la resistencia promedio verdadera a la traccin de las lminas del tipo A es 75 libras.

  • 3

    Obsrvese que en los dos primeros casos, la hiptesis de investigacin y la hiptesis alterna son la misma, mientras que en el tercer caso la hiptesis de investigacin es la misma que la hiptesis nula.

    Cuando se establecen hiptesis del tipo indicado en (1) y en (2) se procura generalmente que

    las hiptesis nula y alterna se complementen entre si y para esto se incluye una desigualdad en la hiptesis nula que vaya en direccin opuesta a la de la hiptesis alterna. Por ejemplo, podramos escribir las hiptesis anteriores (1) y (2) como

    Y

    Este mtodo de plantear las hiptesis nula y alterna realza el hecho de que cuando la hiptesis

    alterna establece una desviacin respecto de una igualdad en una direccin, las desviaciones respecto de la igualdad en la direccin opuesta no tienen ningn inters. Por ejemplo, el director del departamento de control de calidad de una empresa manufacturera puede hacer las siguientes hiptesis como parte del procedimiento para aceptar o rechazar las remesas de materias primas procedentes de los distintos proveedores.

    El director del departamento de control de calidad desea detectar todas aquellas remesas en

    que la proporcin de artculos defectuosos sea mayor que o, el nivel mximo aceptable, para poderlas rechazar. Si la proporcin defectuosa es menor que el nivel aceptable, tanto mejor.

    6.2 PROCEDIMIENTO DE VERIFICACION DE HIPOTESIS Como ilustracin de los procedimientos para verificar hiptesis, examinemos el ejemplo siguiente.

    Con base en varios aos de experiencia, un equipo de psiclogos cree que individuos no conformistas tienen un nivel mayor de amor propio que los conformistas. Aunque los psiclogos recuerdan muchos casos en que se pueden fundamentar sus aseveraciones, saben que, para darle mas peso a sus conjeturas, deben emplear un mtodo cientfico en el anlisis de la evidencia. Les parece que un procedimiento de verificacin de hiptesis estadsticas les resulta ms apropiado. De acuerdo con esto, establecen la siguiente hiptesis nula y la siguiente hiptesis alterna:

    donde x es el puntaje medio poblacional obtenido por los no conformistas en una prueba que

    tena por objeto medir el nivel de amor propio y y,. es el puntaje medio poblacional obtenido por conformistas en la misma prueba.

    La poblacin sobre la que desean los psiclogos hacer inferencias, es la poblacin de todas las

    personas que se pueden caracterizar como conformistas o no conformistas. Los psiclogos obtienen muestras independientes de conformistas y de no conformistas que, segn ellos, se pueden tratar como muestras aleatorias de las poblaciones de inters. Administran las pruebas para medir el amor propio a los individuos de las dos muestras y calculan el puntaje promedio para cada una. Descubren

    que x A = 80 y x B= 75. Aunque la direccin de la diferencia de las medias muestrales es compatible con su hiptesis de investigacin (y alterna), los psiclogos saben que existen por lo

  • 4

    menos dos maneras de explicar esta diferencia: (1) el puntaje verdadero medio de amor propio de la poblacin de los no conformistas podra no ser superior al que corresponde a la poblacin de los conformistas. Los resultados observados en la muestra se deben simplemente a la casualidad. (2) Los resultados observados en la muestra podran reflejar el verdadero estado de las cosas y es acertado sacar como conclusin que el puntaje verdadero medio de amor propio para los no conformistas es superior al de los conformistas. El conocimiento y la comprensin de las sutiles ideas de los procedimientos de verificacin de hiptesis permitir que los psiclogos puedan escoger entre las dos explicaciones. Vamos a dedicar el resto de esta seccin a los conceptos y tcnicas especficas que se utilizan en la verificacin de hiptesis.

    Podemos formalizar el procedimiento que se debe seguir para verifi car una hiptesis

    estableciendo, en forma secuencial, los diversos pasos que forman el procedimiento. En esta seccin enumeramos y explicamos cada uno de estos pasos llevando el mismo orden que guardan normalmente en la prctica. Se pueden identificar nueve pasos principales.

    1 Planteamiento de la hiptesis 2 Seleccin del nivel de significacin 3 Descripcin de la poblacin que interesa y planteamiento de las suposiciones necesarias 4 Seleccin del estadstico pertinente 5 Especificacin del estadstico de prueba y consideracin de su distribucin 6 Especificacin de las regiones de rechazo y aceptacin 7 Recoleccin de datos y clculo de los estadsticos necesarios 8 Decisin estadstica 9 conclusin A continuacin, vamos a describir cada uno de estos pasos en trminos generales y

    posteriormente los explicaremos con ejemplos especficos. 1 Planteamiento de la hiptesis. En la Seccin 6.1 vimos las diferentes clases de hiptesis

    que se pueden hacer y la forma en que se expresan. En virtud de que el estudiante que se inicia en el estudio de la estadstica encuentra con frecuencia dificultades cuando tiene que establecer la forma de plantear la hiptesis nula y la hiptesis alterna, vamos a ampliar esta materia. Generalmente, queremos obtener una conclusin (paso 9) rechazando la hiptesis nula. Es decir, ordinariamente preferimos que los datos de nuestra muestra apoyen la hiptesis alterna (en la Seccin 6.4 explicaremos las razones de esto). En consecuencia, al determinar lo que debe ser la hiptesis alterna, debemos preguntarnos que deseo concluir?" o "que creo que es verdadero?". La respuesta a estas preguntas constituye la expresin de la hiptesis alterna. Luego, el planteamiento complementario de la hiptesis alterna, sirve de hiptesis nula.

    Por ejemplo, consideremos un investigador que establece como hiptesis de investigacin el

    hecho de que, en la enseanza de la lectura a alumnos de primer ao, el mtodo A es superior al mtodo B. Frente a la pregunta "que deseo concluir?", el investigador responder que desea sacar la conclusin de que el mtodo A es superior al mtodo B. Por tanto, la hiptesis alterna consiste en A > B y la hiptesis nula, que es el complemento de este planteamiento, en PA < PB. Este ejemplo, muestra como, normalmente, se formula primero la hiptesis alterna.

    2 Seleccin del nivel de significacin. Teniendo en cuenta los resultados que se obtienen

    en el anlisis de los datos de la muestra, rechazamos o no la hiptesis nula. Rechazar la hiptesis nula no

  • 5

    constituye una prueba de que sea falsa. Sin tener en cuenta que tan incompatible sea la evidencia de la muestra con la hiptesis nula, cabe la posibilidad de que esta ltima sea realmente verdadera. Anlogamente, el hecho de no rechazar la hiptesis nula no es una prueba de que sea verdadera y de que la hiptesis alterna sea falsa. De la misma manera que en el caso anterior, aunque la hiptesis nula no sea rechazada, cabe la posibilidad de que sea falsa. La consideracin de estos hechos nos lleva a la conclusin de que en el rechazo o el no rechazo de la hiptesis nula se corre el riesgo de equivocarse. Aunque generalmente no sabemos si en una determinada accin (rechazo o no rechazo de Ho) cometemos un error o no, podemos indicar los dos tipos de error posibles, de la manera siguiente:

    (a) Rechazo de una hiptesis nula verdadera. Este error se denomina error de Tipo I. (b) aceptacin de una hiptesis nula falsa. Este error se denomina error de Tipo II. Podemos ilustrar la relacin entre la certeza de la hiptesis nula (es decir, si es verdadera o

    es falsa) y la decisin estadstica (rechazar o no rechazar Ho) como se ve en la Tabla 6.1.

    Siguiendo la costumbre que se tiene en estadstica, representaremos con la probabilidad de

    cometer un error de tipo I y con la probabilidad de cometer un error de Tipo II. As pues

    Para la verificacin de una hiptesis determinada preferiramos que y fueran pequeos. En virtud de la relacin entre estas dos probabilidades, encontramos que, para un tamao de muestra dado, una

    disminucin de tiene como contraparte un aumento de y viceversa. Siendo esto as, parece prudente que, en una situacin determinada, tratemos de minimizar la

    probabilidad de cometer el error mas serio. Desafortunadamente, en muchas reas de investigacin, es difcil, o imposible, evaluar los dos tipos de error en cuanto a la seriedad de cada uno de ellos. Entonces, lo

    que se hace en estas situaciones es seleccionar algn valor pequeo para , digamos 0.10, 0.05 0.01. La

    eleccin de refleja la opinin que tiene el investigador sobre la seriedad del error de Tipo I. Mientras mas serias se consideren las consecuencias de cometer un error de Tipo I, menor ser el valor que se

    le asigne a

    Con frecuencia, se denomina nivel de significacin. Cuando se escoge un nivel de significacin

    igual a y se rechaza la hiptesis nula, decimos que los resultados de la muestra son significativos.

    3 Descripcin de la poblacin que interesa y planteamiento de las suposiciones

    necesarias. Los procedimientos para la verificacin de hiptesis dependen de las caractersticas de la distribucin muestral que esta implcita. Las caractersticas de la distribucin muestral dependen en parte de la naturaleza de la poblacin muestreada. Por esta razn, debemos investigar la naturaleza de la poblacin muestreada para justificar la seleccin del procedimiento. Generalmente nos interesamos en conocer el tamao aproximado de la poblacin y en saber si se puede considerar o no normalmente distribuida, en forma aproximada. Tambin, deseamos establecer el hecho de que sea razonable suponer que la muestra tomada constituye una muestra aleatoria simple de la poblacin de inters.

    4 Seleccin del estadstico pertinente. El estadstico particular que va a formar parte del

    procedimiento para la verificacin de hiptesis esta determinado por el parmetro que tiene relacin con la hiptesis. De esta manera, si se trata de verificar una hiptesis sobre una media poblacional, el

  • 6

    estadstico pertinente es x . o media muestral. tambin podramos considerar la distribucin muestral del estadstico pertinente. En trminos generales lo que se desea saber es la media, la varianza (o la desviacin tpica) y la forma funcional aplicable de la distribucin muestral. Por ejemplo, si estamos verificando una hiptesis sobre una media poblacional y si el muestreo se hace en una poblacin

    que esta normalmente distribuida, sabemos que la distribucin de x . la media de la muestra, estar normalmente distribuida con media y varianza 2/n.

    5 Especificacin del estadstico de prueba y consideracin de su distribucin. DEFINICION Un estadstico de prueba es una cantidad numrica que se calcula a partir de los datos

    de una muestra y que se utiliza para tomar la decisin de rechazar o no rechazar una hiptesis nula.

    El estadstico de prueba se determina teniendo en cuenta el parmetro sobre el que se hace la

    hiptesis y la naturaleza de la distribucin muestral del estadstico pertinente. Cuando el muestreo se hace en una poblacin normalmente distribuida, con varianza conocida, el estadstico de prueba que se usa para verificar una hiptesis sobre la media poblacional es:

    donde x es la media de una muestra de tamao n, 0 es el valor hipottico de la media poblacional y es la desviacin tpica de la poblacin. Este estadstico de prueba se distribuye como la distribucin normal estandarizada. Cuando el muestreo se hace en una poblacin normalmente distribuida, con varianza desconocida, el estadstico de prueba que se usa para verificar una hiptesis sobre la media poblacional es:

    donde x , o y n se definen como se hizo anteriormente y S es la desviacin tpica de la muestra. Este estadstico de prueba sigue la distribucin t de Student con n - 1 grados de libertad.

    Posteriormente estudiaremos otros estadsticos de prueba que se encuentran con frecuencia. 6 Especificacin de las regiones de rechazo y de aceptacin. DEFINICION En la verificacin de una hiptesis, la regin de rechazo consta de todos aquellos

    valores del estadstico de prueba que son de tal magnitud que, de ser el valor observado del estadstico de prueba igual a uno de ellos, la hiptesis nula se rechaza.

    La regin de aceptacin es el complemento de la regin de rechazo. Si el valor observado

    del estadstico de prueba es igual a alguno de los valores que componen la regin de aceptacin, la hiptesis nula no se rechaza.

    Tal como vamos a ver, los tamaos de las regiones de rechazo y de aceptacin estn

    determinados por . Para explicar la manera de determinar las regiones de rechazo y aceptacin, consideremos el caso de

    que, con el propsito de verificar una hiptesis sobre una media poblacional, se extrae una muestra de una poblacin normalmente distribuida, con varianza conocida. Como ya lo hemos indicado, el estadstico de

    http://-t.la/

  • 7

    prueba apropiado en este caso es Z. Supongamos que deseamos verificar la hiptesis nula de que una media poblacional, , es igual a

    algn valor particular o, frente a la hiptesis alterna de que no es igual a o. Las hiptesis nula y alterna se pueden plantear as:

    Digamos adems que , probabilidad de rechazar una hiptesis nula verdadera, es 0.05.

    Ahora consideremos la distribucin muestral de las medias calculadas a partir de muestras de tamao

    n tomadas de nuestra poblacin especfica. De acuerdo con lo que vimos anteriormente sabemos que la

    distribucin muestral de x esta normalmente distribuida. Si la hiptesis nula es verdadera, la media de la

    distribucin muestral es igual a o. tambin sabemos que el (1 - ) % = 95% de todas las x caern dentro de 1.96 errores tpicos de la media, que, de ser Ho verdadera, es igual a o. Esto lo podemos expresar por medio de la siguiente ecuacin de probabilidad:

    La Figura 6.1 describe grficamente esta ecuacin y la distribucin muestral. La probabilidad de que

    una sola muestra aleatoria simple de tamao n arroje un valor de x igual a o mayor que o + 1.960 x

    es igual a /2 = 0.025.La probabilidad de que una sola muestra aleatoria arroje un valor de x igual o

    menor que 0 - 1.96 x -, es tambin igual a /2 = 0.025. Si tenemos un valor numrico especfico para o, podemos calcular valores numricos reales para o 1.96 x . Por ejemplo, supongamos que o = 100

    (esto es, hacemos la hiptesis de que es igual a 100), x = 30 y n = 25. Los valores numricos de o 1.96 (30/25) son 88.24 y 111.76.

    Podemos decir que la probabilidad de observar un valor de x entre 88.24 y 111.76, siendo Ho verdadera, es igual a 0.95. Si Ho es verdadera, la probabilidad de que una sola muestra aleatoria simple de tamao 25 arroje una media igual o mayor que 111.76 es igual a 0.025 y la probabilidad de que una sola muestra aleatoria simple arroje una media igual o menor que 88.24 es igual tambin a 0.025.

    Supongamos que en realidad estamos observando un valor de x igual o mayor que 111.76 o igual o menor que 88.24. Tenemos que concluir que ha ocurrido un caso raro (con una probabilidad de ocurrir igual a 0.05) u ofrecer otra explicacin. En un procedimiento de verificacin de hiptesis la nica alternativa que queda es afirmar que la hiptesis nula es falsa; o lo que es lo mismo, que la muestra no se extrajo de una poblacin que tiene la media hipottica. En realidad, esta ultima explicacin es la que se acepta cuando las hiptesis son Ho: = o y H1: o el nivel de significacin es y se

    presenta un valor de x que es igual o mayor que 0. + Z/2 (n) o uno que es menor o igual a o -Z/2 (-/ n). Al aceptar esta explicacin estamos rechazando la hiptesis nula. Si se decide rechazar en estas

    circunstancias la' hiptesis Ho se corre un riesgo, , de tomar una decisin equivocada. En

    consecuencia debemos asignarle a un valor pequeo (digamos 0.10, 0.05 0.01) para que la

  • 8

    probabilidad de equivocarnos (de rechazar una hiptesis nula verdadera) sea pequea. Como vamos a rechazar Ho : = o en favor de H1 : o, cuando nuestra muestra nica arroje

    una media x igual o mayor que o + Z/2 (/'n), o igual o menor que o - Z/2 (/'n), estos valores de

    x constituyen la regin de rechazo para nuestra verificacin de hiptesis. Su complemento, conforma por lo tanto la regin de aceptacin.

    Podemos expresar las regiones de aceptacin y de rechazo en funcin del estadstico de prueba, Z,

    observando que los nmeros se transforman en - Z/2 y Z/2 respectivamente cuando utilizamos la formula

    Z= ( x -o)/ (/'n)

    La Figura 6.2 muestra las regiones de aceptacin y de rechazo, tanto en funcin de x como de z, para verificar, con un nivel de significacin a, Ho = 0 frente a la alternativa H1: o .

    Si calculamos con base en los datos de la muestra un valor de

    y este resulta mayor o igual a Z/2 o menor o igual a Z/2 rechazamos Ho. En cualquier otro caso, no rechazamos Ho. Se dice que un valor calculado de Z es significativo si nos

    lleva a rechazar una hiptesis nula.

    Llamamos valores crticos de un estadstico de prueba a aquellos valores que, como Z/2

    y - Z/2 de la Figura 6.2 (b), separan una regin de rechazo de una regin de aceptacin. Ellos nos dicen

    cuando debemos dejar de creer que la hiptesis nula es verdadera y empezar a creer que es falsa. Llamamos hiptesis alternas de dos lados o bilateral, a las hiptesis alternas de la forma H1 o

    puesto que generalmente nos conducen a una regin de rechazo que esta compuesta de dos lados o colas de la distribucin del estadstico de prueba. Y al procedimiento adecuado para verificar una hiptesis nula frente a una hiptesis alterna bilateral, como el que se describi anteriormente, le damos el nombre de prueba de hiptesis de dos lados o bilateral.

    Con frecuencia, como ya lo hemos visto, la hiptesis nula es de la forma Ho: < o y la hiptesis

    alterna de la forma: HI: > o. A una hiptesis alterna de este tipo la Llamamos hiptesis unilateral, puesto que solo valores grandes del estadstico de prueba causan el rechazo de la hiptesis nula y, por tanto, la regin de rechazo esta localizada solamente en la cola superior de la distribucin del estadstico de prueba. Es decir, que toda la probabilidad a esta localizada en una sola cola y no esta dividida por la mitad como sucede en la prueba bilateral. Por ejemplo, el equipo de psiclogos descrito anteriormente, que esta interesado en los puntajes de los conformistas y los no conformistas, utilizan una prueba unilateral con la regin de rechazo localizada solamente en la cola superior. Si seleccionan un nivel de significacin (probabilidad de rechazar una hiptesis nula verdadera) de 0.05, todo el valor 0.05 constituir el rea de la cola superior en la distribucin muestral. Para las hiptesis alternas de la forma H1:. < o solamente los valores pequeos del estadstico de prueba causan el rechazo de la hiptesis nula y, por tanto, toda la regin de rechazo se encontrara en la cola inferior de la distribucin.

  • 9

    Hasta este momento, nuestros ejemplos sobre la verificacin de hiptesis se han restringido a

    pruebas con la media poblacional. En secciones posteriores, vamos a estudiar la verificacin de hiptesis para aquellos casos en que el muestreo se toma de poblaciones que no estn normalmente distribuidas, as como tambin para casos en que estn implcitos otros parmetros poblacionales.

    7 Recoleccin de datos y clculo de los estadsticos necesarios. Los datos que se

    necesitan para verificar las hiptesis formuladas y que satisfacen las suposiciones necesarias de la prueba se deben recolectar en una forma adecuada. Una vez que se han recogido se calcula el estadstico apropiado y el estadstico de prueba.

    8 Decisin estadstica. Se compara el valor real calculado del estadstico de prueba con

    el valor crtico de este. Si el valor calculado esta en la regin de rechazo, entonces se rechaza Ho, de lo contrario, no se rechaza.

    9 conclusin. En tanto que la decisin se expresa en funcin del estadstico de prueba,

    la conclusin se expresa en funcin del parmetro y/o la poblacin a que se refiere la prueba. Por ejemplo, cuando rechazamos Ho: = o, concluimos que "la media de poblacin no es igual a o". Cuando no rechazamos la hiptesis nula nuestra conclusin carece de la fuerza de conviccin que tiene cuando se rechaza una hiptesis nula. Esto se debe a que, aunque de antemano sabemos que la probabilidad de rechazar una hiptesis nula verdadera es pequea

    (esto lo sabemos por la seleccin que hemos hecho de ), generalmente no conocemos el

    valor de o probabilidad de aceptar (no rechazar) una hiptesis nula falsa. Esta puede ser, y

    frecuentemente lo es, muy grande. (En la Seccin 6.4 analizaremos este punto detalladamente).

    En consecuencia, al no rechazar Ho: = o concluimos que "la media de poblacin puede

  • 10

    ser igual a o ".

    En las prximas secciones explicaremos, con ejemplos, el procedimiento general para la verificacin de hiptesis que se ha descrito en esta seccin. Explicaremos la verificacin de hiptesis cuando los parmetros de inters son la media poblacional, la diferencia entre dos medias poblacionales, una proporcin poblacional, la diferencia entre dos proporciones poblacionales, la varianza poblacional y la razn entre dos varianzas poblacionales.

    6.3 VERIFICACION DE UNA HIPOTESIS SOBRE UNA MEDIA POBLACIONAL UNICA En esta seccin vamos a explicar, con ejemplos, el procedimiento que se usa para la

    verificacin, de hiptesis cuando el parmetro de inters es la media poblacional. Consideraremos tres casos: (1) el caso en que el muestreo se hace en una poblacin normalmente distribuida, con varianza conocida, (2) el caso en que el muestreo se hace en una poblacin normalmente distribuida con varianza desconocida y (3) el caso en que el muestreo se hace en una poblacin que no esta normalmente distribuida.

    poblacin normalmente distribuida, 2 conocida Para explicar la verificacin de hiptesis sobre medidas poblacionales, vamos a considerar

    primero el caso de que la poblacin de inters esta distribuida normalmente y se conoce su varianza.

    Ejemplo 6.1 La media y la desviacin tpica del peso de los hombres que jugaron ftbol en una

    universidad durante las primeras 10 temporadas son = 162.5 libras y = 18.0 libras. El departamento de atletismo desea saber si hay alguna razn para creer el peso promedio de los que jugaron ftbol durante las 10 ultimas temporadas es diferente del peso promedio de los que jugaron ftbol durante las primeras diez temporadas.

    Los miembros del departamento desean basar su conclusin en una muestra de tamao n =

    25. El procedimiento para la verificacin de la hiptesis se explica a continuacin. 1 Planteamiento de la hiptesis. Los investigadores que desean saber si el peso promedio de

    los que jugaron ftbol durante las 10 ltimas temporadas difiere de 162.5, piensan que una conclusin de esta naturaleza se justificara si pudieran rechazar la hiptesis nula de que el peso promedio de la poblacin de inters es igual a 162.5. Las hiptesis correctas, nula y alterna, son entonces las siguientes:

    2 Nivel de significacin. Los investigadores establecen que la probabilidad de cometer un error de Tipo I ser igual a = 0.05.

    3 Descripcin de la poblacin y suposiciones. La poblacin consiste en los pesos de todos

    los hombres que jugaron ftbol durante las 10 ltimas temporadas. Los investigadores piensan que los pesos de esta poblacin estn mas o menos distribuidos normalmente y que tienen una desviacin tpica igual a 18.0, o desviacin tpica de los pesos correspondientes a los que jugaron durante las primeras 10 temporadas.

    4 El estadstico pertinente. Como las hiptesis se refieren a una media poblacional, el

    estadstico apropiado es x o media muestral. En virtud de que se supone que la poblacin esta

    distribuida en forma aproximadamente normal, la distribucin muestral de x , para todos los fines

  • 11

    prcticos, puede considerarse como distribuida en forma aproximadamente normal. Si la hiptesis nula es verdadera, x , la media de la distribucin muestral, es igual a 162.5. Si, como lo creen los investigadores, la desviacin tpica de la poblacin es 18.0 libras, entonces la desviacin tpica de la

    distribucin muestral de x (o error tpico de x ) es (x = n = 18.0/25 = 3.6.

    5 El estadstico de prueba y su distribucin. Como el estadstico pertinente es x , es

    conocida y se supone que x esta normalmente distribuida, el estadstico de prueba es Z, que esta normalmente distribuido cola media 0 y desviacin tpica 1.

    6 Regiones de rechazo y de aceptacin. Como a = 0.05 y como se trata de una prueba

    bilateral, la regin de rechazo consta de dos partes. La primera parte, localizada en la cola derecha de la distribucin de z consiste en todos los valores de z tales que, cuando Ho es verdadera, la probabilidad de ocurrencia aleatoria de una z de ese tamao o mas grande es igual o menor que 0.025. La segunda mitad de la regin de rechazo, localizada en la cola izquierda de la distribucin de z, consta de todos aquellos valores de z tales que, cuando Ho es verdadera, la probabilidad de que ocurra al azar una z de ese tamao o mas pequea es igual o menor que 0.025. La Tabla E del Apndice muestra que los valores crticos son z = + 1.96 y z = - 1.96. La regin de aceptacin consta de todos los valores de z que son menores que + 1.96 pero mayores que - 1.96. Si a partir de los datos de la muestra obtenemos un valor de z igual o mayor que + 1.96 o igual o menor que - 1.96, rechazaremos la hiptesis nula.

    Las zonas de rechazo y de aceptacin tambin se pueden describir en funcin de x . La zona de

    rechazo consta de dos conjuntos de valores de x (calculados a partir de muestras de tamao 25 extradas de la poblacin de inters): los que son tan grandes que la probabilidad de ocurrencia de valores de ese tamao o mas grandes, cuando Ho es verdadera, es igual o menor que 0.025 y los que son tan pequeos que la probabilidad de ocurrencia de valores de ese tamao o mas pequeos es igual o menor

    que 0.025. Los valores crticos para la regin de rechazo son valores de x , que estn localizados a una distancia de 1.96 errores tpicos a cada lado de la media hipottica. Los valores crticos son:

    Si la muestra arroja un valor de x que quede a una distancia de 1.96 errores tpicos o mas medida

    desde la media hipottica (esto es, si la x calculada es mayor o igual a 169.6 o menor o igual que 155.4), rechazaremos H,). En cualquier otro caso, no la rechazaremos. La Figura 6.3 muestra las regiones

    de rechazo y de aceptacin en funcin tanto de z como de x . 7 Recoleccin de datos y clculos. Se selecciona una muestra aleatoria simple de los puntajes

    de 25 personas que jugaron ftbol durante los d1timos diez anos. La media de los pesos de la muestra resulta ser igual a 178.7.

    8 Decisin estadstica. Con los datos de la muestra se calcula

    Como 4.50 es mayor que 1.96, este valor de z cae dentro de la regin de rechazo y por tanto

    rechazamos HO. Obsrvese tambin que 178.7 es mayor que 169.6, el valor critico superior expresado en funcin

    de x . Por tanto habramos podido rechazar la hiptesis nula sin necesidad de calcular un valor z. 9 conclusin. Como rechazamos HO, volvemos a la hiptesis alterna para poder sacar una

    conclusin. En este ejemplo podemos concluir, con base en los datos de la muestra, que el peso

  • 12

    promedio de los jugadores de ftbol de la universidad durante la ltima dcada, es diferente al peso promedio de los jugadores durante la primera dcada.

    Informe de los resultados. En los artculos de las revistas que contienen anlisis estadsticos de

    proyectos de investigacin, encontramos una variedad de maneras de presentar los resultados. A veces, se informa el valor del estadstico de prueba o el del estadstico de la muestra junto con la afirmacin de si era o no significativo en el nivel de significacin escogido. De acuerdo con este mtodo, informaramos los resultados del presente ejemplo, poniendo "z = 4.50, significativo en el

    nivel 0.05", o x = 178.7, significativo en el nivel 0.05". Cuando un resultado es significativo tanto en el nivel 0.05 como en el nivel 0.01, muchos

    autores lo indican por medio de asteriscos. A los resultados que son significativos en el nivel 0.05, pero no en el nivel 0.01, se les agrega un asterisco (*) y a los que son significativos en el nivel 0.01, dos asteriscos (**). Como, en el presente ejemplo, 4.50 es mayor que 2.58 (valor de z en una prueba bilateral con a = 0.01) el resultado se informara como z = 4.50** 6 x = 178.7**. Tal vez la forma mas comn de presentar los resultados, en la literatura, es utilizando valores p.

    DEFINICION Un valor p es el valor ms pequeo de con el que se puede rechazar la hiptesis nula.

    Existe la probabilidad de obtener, cuando Ho es verdadera, un valor del estadstico de prueba tan

    extremo o ms extremo que aquel que realmente se ha observado. Si los resultados estadsticos se presentan en una tabla, el valor p se indica generalmente en nota de pie de pgina. Si los resultados se exponen en el texto de un artculo, el valor p se informa generalmente de manera similar o a veces entre parntesis.

    Al determinar un valor p, debemos tener en cuenta si la prueba es unilateral o bilateral. Si la

    prueba es bilateral, los valores de p sern dos veces ms grandes de lo que serian en una prueba unilateral, puesto que habr que tener en cuenta la probabilidad de obtener un valor extremo del estadstico de prueba en cualquier direccin.

    Para obtener el valor de p correspondiente al presente ejemplo, en el que la prueba es bilateral,

    debemos buscar la probabilidad de observar un valor de z tan extremo o ms extremo que 4.50, en

  • 13

    cualquier direccin, cuando Ho es verdadera. Si consultamos la Tabla E del Apndice, vemos que el valor tabulado mas grande de z es 3.09 y la probabilidad de obtener un valor de este tamao o mas grande es 0.5 - 0.4990 = 0.001. Como 4.50 esta mucho mas a la derecha de 0 que 3.09, la probabilidad de observar un valor de z tan grande o mas grande que 4.50, cuando Ho es verdadera, es menor que 0.001. Como z = 4.50 se calcu1 como parte de una prueba bilateral, debemos tener presente un valor tan extremo como 4.50 en la direccin opuesta. En consecuencia, el valor p que buscamos, es menor que 2(0.001) = 0.002. Este resultado lo presentaramos en un informe como "p < 0.002". La Figura 6.4 muestra el valor p correspondiente a este ejemplo.

    Verificacin de hiptesis unilateral. Con frecuencia la naturaleza de una hiptesis de

    investigacin es tal, que conduce a una hiptesis alterna unilateral que, a su vez, lleva a una prueba unilateral que utiliza una regin de rechazo unilateral.

    Cuando solo valores extremadamente grandes del estadstico de prueba (o solo valores

    pequeos) dan origen al rechazo de la hiptesis nula, resulta conveniente utilizar una hiptesis alterna unilateral. Verificamos la hiptesis nula mediante una prueba unilateral y utilizamos entonces una regin de rechazo unilateral. Supongamos, por ejemplo, que el muestreo se hace en una poblacin normalmente distribuida con una varianza de poblacin conocida y que la naturaleza de la hiptesis de investigacin es tal que las hiptesis estadsticas son

    Como solamente valores grandes del estadstico de prueba darn origen al rechazo de Ho

    (los valores pequeos trataran de apoyar la hiptesis nula), la regin de rechazo estar compuesta de valores grandes del estadstico de prueba y por tanto, deber localizarse en la cola superior de la distribucin del estadstico de prueba. En realidad, la regin de rechazo estar compuesta de aquellos valores del estadstico de prueba tan grandes que la probabilidad de observar valores de ese

    tamao o mas grandes, siendo Ho verdadera, es igual o menor que . Figura 6.5 Regiones de aceptacin y de rechazo para dos conjuntos de hiptesis estadsticas unilaterales. El

    muestreo se hizo en una poblacin normalmente distribuida, con varianza de poblacin conocida.

  • 14

    Por otra parte, si las hiptesis estadsticas son con un nivel de significacin , la regin de rechazo

    estar localizada en la cola inferior de la distribucin del estadstico de prueba, puesto que solamente valores pequeos del estadstico darn origen al rechazo de la hiptesis nula. La Figura 6.5 muestra las regiones de aceptacin y de rechazo en estas dos situaciones.

    Obsrvese que, para Ho o y H1 > o , existe un gran nmero de valores hipotticos para .

    La forma de la hiptesis indica que el procedimiento de la verificacin de hiptesis podra resultar adecuado para cada uno de los valores hipotticos. Sin embargo, por razones prcticas, se suele verificar la hiptesis nula, acompaada de una alterna unilateral, solo en el punto de igualdad. Un pequeo clculo nos demuestra que si se rechaza Ho cuando la prueba se hace en el punto de igualdad, entonces Ho se rechazara para cualquier otro valor hipottico de que este indicado por la hiptesis nula.

    Ejemplo 6.2 La experiencia ha demostrado que, el tiempo promedio de reaccin a determinado estimulo en

    sujetos normales que estn dentro de cierto limite de edad es de 65 milisegundos con una desviacin tpica de 15 milisegundos. Un equipo de investigaciones psicolgicas cree que silos individuos reciben cierto tipo de entrenamiento muestran entonces, en promedio, un tiempo de respuesta mas corto. Con el fin de aclarar si esta opinin se puede probar, el equipo realizo el siguiente procedimiento para la verificacin de hiptesis.

    1 Planteamiento de la hiptesis. Podemos establecer formalmente la hiptesis de

    investigacin correspondiente a este ejemplo as: el tiempo promedio de reaccin al estimulo de los sujetos normales que reciben entrenamiento experimental es mas corto que el de los sujetos que no lo reciben". Esta hiptesis de investigacin conduce a las siguientes hiptesis estadsticas:

    La hiptesis alterna es unilateral puesto que solo los valores "pequeos" del estadstico de prueba

    darn origen al rechazo de la hiptesis nula. Obsrvese tambin que la hiptesis alterna y la hiptesis de investigacin son la misma.

    2 Nivel de significacin. Sea = 0.01.

  • 15

    3 Descripcin de la poblacin y suposiciones. La poblacin que consta de todos los valores

    de tiempo de respuesta al estimulo en sujetos normales es hipottica, puesto que, en realidad, no existe en el momento. Los investigadores creen que es razonable suponer que esta poblacin de valores hipotticos, de obtenerse, estar normalmente distribuida, con una desviacin tpica de 15, desviacin tpica de los sujetos normales que no reciben entrenamiento. En el experimento participa una muestra de 20 sujetos.

    4 El estadstico pertinente. El estadstico mas importante es x , si suponen que la poblacin esta normalmente distribuida, los investigadores pueden suponer tambin que la distribucin

    muestral de x , ser normal y tendr una media de 65 y una desviacin tpica de (x

    = 1520 =

    3.35), en caso de que la hiptesis nula sea verdadera.

    5 El estadstico de prueba y su distribucin. Como el estadstico mas importante, x , esta normalmente distribuido y como se supone que es conocida, el estadstico de prueba adecuado es Z.

    6 Regiones de rechazo y de aceptacin. En virtud de que solamente valores "pequeos" del

    estadstico de prueba calculado darn origen al rechazo de la hiptesis nula, la regin de rechazo estar localizada en la cola izquierda de la distribucin de z.

    En otras palabras, la regin de rechazo constara de todos los valores de z tan pequeos, que la

    probabilidad de obtener un valor de ese tamao o menor, cuando H o es verdadera, es igual o menor que 0.01, o nivel de significacin escogido. En la Tabla E del Apndice encontramos que el valor crtico de

    z es igual a -2.33. Obtenemos el valor critico, en funcin de x , sabiendo que esta localizado a una

    distancia de 2.33 errores tpicos a la izquierda de la media supuesta de la distribucin muestral de x . Como

    x = 3.35, esta distancia es igual a 2.33 X 3.35 = 7.81. El valor critico, en funcin de x , es entonces, 65

    - 7.81 = 57.19. La Figura 6.6 muestra las zonas de rechazo y de aceptacin tanto en funcin de z como

    de x . 7 Recoleccin de datos y clculos. Veinte sujetos normales recibieron el entrenamiento y en

    seguida se les hizo una prueba para determinar sus tiempos de reaccin al estimulo. Los investigadores registraron un tiempo de reaccin promedio de 55.5 milisegundos. Con base en estos datos, podemos calcular z = (55.5 - 65)/3.35 =-2.84.

    8 Decisin estadstica. Como el valor de z calculado,-2.84, es menor que -2.33 (es decir

  • 16

    como -2.84 cae en la regin de rechazo), rechazamos Ho. Observemos tambin que x = 55.5 cae

    en la regin de rechazo definida en trminos de x . Sin tener en cuenta si el estadstico pertinente (en

    este caso x ) o el estadstico de prueba se utilizan para determinar si H o se rechaza o no, en una situacin dada la decisin siempre ser la misma. La Figura 6.6 muestra donde se localizan los valores calculados

    de x y z respecto de los valores crticos. De acuerdo con la Tabla E del Apndice encontramos que la probabilidad de obtener un valor de z igual o menor que -2.84, cuando H o es verdadera, es 0.0023.

    Entonces, la probabilidad de observar un valor de x igual o menor que 55.5, cuando H o es verdadera, es de 0.0023. Por eso, el valor p correspondiente a este ejemplo es 0.0023 como se indica en la Figura 6.6.

    9 Conclusin. Como rechazamos H O, concluimos que Hl es verdadera. Es decir, en el presente

    ejemplo, concluimos que el tiempo promedio de reaccin de los sujetos que reciben entrenamiento especial es mas corto que el de aquellos que no lo reciben.

    Poblacin distribuida normalmente, 2 desconocida Cuando resulta apropiado verificar una hiptesis sobre una media poblacional, la varianza poblacional

    2 generalmente es desconocida y en consecuencia no se puede determinar exactamente n, o error

    tpico del estadstico pertinente x . Si la muestra es grande, se puede hacer una estimacin satisfactoria de 2 con los datos de la muestra. Si la poblacin de inters esta normalmente distribuida, las medias muestrales lo estarn tambin y se podr utilizar el estadstico de prueba z. Inclusive cuando la poblacin no esta normalmente distribuida, la distribucin muestral de la media esta distribuida en forma aproximadamente normal como consecuencia del teorema del lmite central y, por tanto, se puede utilizar a z como estadstico de prueba. Sin embargo, cuando el tamao de la muestra es pequeo, no se puede aplicar el teorema de lmite central y es necesario buscar un estadstico de prueba distinto de z. Si se sabe que la poblacin esta, al menos aproximadamente, distribuida en forma normal, o si, al no tenerse un conocimiento preciso esto parece ser una suposicin razonable, el estadstico t, constituye la mejor eleccin de un estadstico de prueba. En el Capitulo 11 se estudiaran los procedimientos para la verificacin de hiptesis que son apropiados cuando el tamao de la muestra es pequeo y cuando no se puede suponer que la poblacin esta normalmente distribuida.

    Ejemplo 6.3 Un fabricante de drogas dice que el tiempo promedio para que se disuelva el contenido de cierta

    cpsula es de 50 minutos. El equipo de investigaciones de una empresa competitiva no cree en esto. Por eso, hace una prueba con una muestra al azar de 20 cpsulas y calcula una media muestral de 54 minutos y desviacin tpica de 15. El equipo de investigaciones deseaba saber si puede concluir que el tiempo promedio que se requiere para que se disuelva el contenido es mayor que 50 minutos. El equipo Ilevo a cabo el siguiente procedimiento para la verificacin de hiptesis.

    1 Planteamiento de la hiptesis. La hiptesis de investigacin es la siguiente: "el tiempo

    promedio requerido para que se disuelva el contenido de la cpsula es mayor que 50 minutos". Las hiptesis estadsticas son:

    2 Nivel de significacin. La probabilidad de cometer un error de Tipo I se fija en = 0.05. 3 Descripcin de la poblacin y suposiciones. El equipo de investigaciones supone que la

    poblacin de los tiempos de disolucin esta distribuida en forma aproximadamente normal.

    4 El estadstico pertinente. El estadstico pertinente es x , la media de la muestra. 5 El estadstico de prueba y su distribucin. En virtud de que n es pequeo (menor que 30),

    es desconocido y se supone que la poblacin de la muestra esta normalmente distribuida, el estadstico

  • 17

    de prueba apropiado es:

    que sigue la distribucin t, de Student con n - 1 grados de libertad. 6 Regiones de rechazo y de aceptacin. Mediante la Tabla F del Apndice encontramos que el valor

    critico de t para una prueba unilateral con = 0.05 y 20 - 1 = 19 grados de libertad, es 1.7291. El

    valor critico, expresado en funcin de x esta dado por 50 + (1.7291) (15/20) = 55.8. La Figura 6.7 muestra las regiones de aceptacin y de rechazo en funcin de t.

    7 Recoleccin de datos y clculos. Como ya lo anotamos, una muestra al azar de 20

    observaciones arrojo una media de 54 y una desviacin tpica de 15. A partir de estos datos podemos calcular

    8 Decisin estadstica. Como el valor de t calculado, 1.19, es menor que 1.7291 (es decir, cae en

    la regin de aceptacin) no podemos rechazar HO. Llegamos a la misma decisin observando que x

    = 54 es menor que 55.8 valor critico de x . Consultando la Tabla F del Apndice podemos obtener algn conocimiento de la magnitud del valor p para esta prueba. Observamos que para 19 grados de libertad, la probabilidad de obtener un valor t tan grande o ms grande que 1.328, cuando Ho es verdadera, es 0.10. Como el valor de t calculado, 1.19, es menor que 1.328, concluimos que para esta prueba p > 0.10. Para obtener un valor ms exacto de p, necesitaramos consultar una tabla mas completa de la distribucin t.

    9 Conclusin. Como hemos rechazado HO, concluimos que Ho puede ser verdadera, es decir, que

    el tiempo promedio que se requiere para que el contenido de la cpsula se disuelva puede ser de 50 minutos o de menos.

    En el Capitulo 5 vimos que cuando el tamao de la muestra es grande, muchos expertos en

    estadstica prefieren utilizar la distribucin z ms bien que la distribucin t cuando construyen intervalos de confianza para , aunque sea desconocida. De la misma manera, muchos expertos prefieren z, en vez de t, para verificar hiptesis, cuando tienen muestras grandes, a pesar de que a sea desconocida.

    Esta practica se justifica por el hecho de que, cuando Ho es verdadera, ( = o ) y n es grande, el

    estadstico esta distribuido aproximadamente como la distribucin normal estandarizada.

  • 18

    Cuando se sigue esta practica, se compara, para la significacin, el valor calculado del estadstico de prueba con un valor apropiado de la distribucin z.

    Muestreo en una poblacin no distribuida normalmente Con frecuencia, la poblacin de inters no esta normalmente distribuida. En otros

    casos, el investigador, que no conoce la forma funcional de la poblacin, no quiere suponer que esta normalmente distribuida. En situaciones como estos, el estadstico t no es apropiado como estadstico de prueba y el estadstico z es apropiado nicamente si el tamao de la muestra es grande. En el siguiente ejemplo, vamos a explicar el procedimiento para la verificacin de hiptesis que se debe emplear cuando el muestreo se hace en una poblacin no distribuida normalmente, con varianza desconocida (el caso usual) y cuando el tamao de la muestra es suficientemente grande como para aplicar el teorema del Lmite central.

    Ejemplo 6.4 Un grupo de profesores investigadores de una escuela de educacin de cierta universidad

    partan de la hiptesis de que el enriquecimiento del plan de estudios en el colegio hara aumentar los puntajes en habilidad verbal cuando los estudiantes presentaran los exmenes de admisin de la universidad. Con el fin de observar si era posible obtener alguna evidencia para apoyar su hiptesis, los profesores introdujeron un programa de enriquecimiento en el plan de estudios de primer ano de un colegio local. El programa continuo, con esta clase, hasta el ltimo ano. Al finalizar el ultimo ao, 125 alumnos de esta clase tomaron exmenes de admisin en la universidad. El puntaje verbal promedio fue de 590 con una desviacin tpica de 35. El puntaje verbal promedio de los estudiantes que presentaron estos exmenes durante los 5 aos anteriores fue de 580. Los profesores deseaban saber si podan sacar como conclusin que el enriquecimiento del plan de estudios haba aumentado el puntaje verbal promedio. Se puede llevar a cabo el siguiente procedimiento para la verificacin de hiptesis.

    1 Planteamiento de la hiptesis . hiptesis de investigacin: "el enriquecimiento del plan

    de estudios del colegio mejora los puntajes en habilidad verbal de los alumnos que presentan examen de admisin en la universidad".

    2 Nivel de significacin. Sea 0.05. 3 Descripcin de la poblacin y suposiciones. En virtud de que el tamao de la muestra es

    grande, se puede aplicar el teorema del lmite central sin tener en cuenta la forma funcional de la poblacin. Se supone que los 125 puntajes constituyen una muestra aleatoria de una poblacin grande de puntajes.

    4 El estadstico pertinente. Como las hiptesis se refieren a la media de poblacin, el estadstico

    ms importante es x , o media muestral. La distribucin de x esta distribuida en forma aproximadamente normal, puesto que n es grande. Si Ho es verdadera, la media de la distribucin

    muestral de x es 580 o menos. Como la prueba se va a realizar en el punto de igualdad, la distribucin

    pertinente tiene una media de 580, si Ho es verdadera. El error tpico estimado de x esta dado por

    ns / = 35 / 125 = 3.13.

    5 El estadstico de prueba y su distribucin. El estadstico de prueba apropiado es z, que

    esta normalmente distribuido, con media 0 y desviacin tpica 1. 6 Regiones de rechazo y de aceptacin. El valor crtico de z es 1.645, de modo que la

    regin de rechazo consta de todos los valores de z iguales o mayores que 1.645 y la regin de aceptacin

    consta de todos los valores de z menores que 1.645. El valor critico de x es 580 + (1.645) (3.13) =

  • 19

    585.15. Expresada en funcin de x la regin de rechazo consta de todos los valores de x mayores o

    iguales a 585.15 y la regin de aceptacin de todos los valores de x menores que 585.15.

    7 Recoleccin de datos y clculos. Como ya lo advertimos, n = 125, x = 590, y S = 35. A partir de estos datos podemos calcular

    8 Decisin estadstica. Como el valor de z calculado, 3.19, es mayor que el valor critico de z,

    1.645, rechazamos HO. tambin, puesto que la x observada, 590, es mayor que el valor critico de x , 585.15, rechazamos HO. El valor p para esta prueba es menor que 0.001.

    9 Conclusin. Debido a que se rechaza HO, los profesores pueden concluir que el enriquecimiento

    del plan de estudios de un colegio mejora el puntaje en habilidad verbal de los exmenes de admisin en la universidad.

    EJERCICIOS 1 En una poblacin normalmente distribuida con desviacin tpica igual a 32, se extrae una

    muestra aleatoria simple de tamao 16, que arroja una media y una desviacin tpica de 520 y 40 respectivamente. A partir de estos datos, se puede concluir, en el nivel de significacin 0.05, que es mayor que 516? Hacer una grafica para explicar la localizacin de las zonas de rechazo y de aceptacin en funcin tanto del estadstico pertinente como del estadstico de prueba. Cual es el valor p para esta prueba?

    2 Una muestra aleatoria simple de tamao 9 tomada de una poblacin normalmente distribuida

    arrojo una media y una desviacin tpica de 150 y 30 respectivamente. Proporcionan estos datos evidencia suficiente para poder concluir que la media poblacional es menor que 160? Cual es el valor p para esta prueba?

    3 A partir de los datos de una muestra aleatoria simple de 100 estudiantes de bachillerato

    seleccionados en varios colegios de una ciudad se averiguo que los gastos medios semanales de los estudiantes eran de 3.25 pesos con una desviacin tpica de 1 peso. Proporcionan estos datos suficiente evidencia como para decir que la media poblacional es diferente de $ 3.00? Cual es el valor p para esta prueba?

    4 Un especialista en lectura cree que los estudiantes de ciases no programadas obtienen puntajes

    superiores en pruebas de comprensin de lectura que los estudiantes de clases programadas. El puntaje medio obtenido en la prueba de comprensin de lectura por los estudiantes de clases programadas que entraron a 4o. grado durante los 5 aos anteriores es de 4.25. Un grupo de 81 estudiantes que asisti a clases no programadas durante sus 3 primeros aos, obtuvo un puntaje en la prueba de comprensin de lectura de 5.30, con una desviacin tpica de 1.8. Proporcionan estos datos evidencia suficiente como

    para apoyar la hiptesis del especialista en lectura? Sea = 0.01. Cual es el valor p en esta prueba? 5 Un investigador agrcola crea que el nmero medio de acres que los hacendados de un

    determinado estado dedicaban a cierto cultivo era inferior a 6. El investigador envi por correo un cuestionario a una muestra aleatoria simple de 25 hacendados de ese estado en que les solicitaba informacin sobre el nmero de acres sembrados. La media y la desviacin tpica de la muestra fue de 5 y 1,5 acres respectivamente. En el nivel de significacin 0.05 sirven estos datos de apoyo a la opinin del investigador? Cul es el valor p para esta prueba?

    6 Un consejero escolar ha descubierto que durante los ltimos 5 anos los alumnos de ltimo

    ano que no tuvieron consejera vocacional y que tomaron una prueba de madurez, obtuvieron un puntaje promedio de 190. El consejero opina que los estudiantes que reciben consejera

  • 20

    vocacional individualmente tienen en promedio un puntaje superior a este. El puntaje promedio de 64 estudiantes de ltimo ano que recibieron consejera vocacional individual durante su ltimo ano de colegio, fue de 205 con una desviacin tpica de 24. Constituyen estos datos un apoyo para la opinin del consejero? Sea a = 0.05. Cul es el valor p para esta prueba?

    7 Un trabajador social cree que el numero promedio de anos de escolaridad correspondiente

    a los adultos que se encuentran inscritos en el bienestar social, es menor que 5. Una muestra aleatoria de 169 de estos adultos arrojo una media de 4.6 aos de escolaridad con una desviacin tpica de 3.9 aos. Proporcionan estos datos evidencia suficiente para que el trabajador social concluya que p < 5 aos? Sea = 0.05. Cul es el valor p para esta prueba?

    8 Una muestra aleatoria de 100 familias seleccionadas en un determinado sector arrojo un

    promedio de ingresos familiares por ano de 9700 y una desviacin tpica de 1000. Proporcionan estos

    resultados suficiente evidencia para indicar que la media verdadera es menor de $10 000? Sea = 0.05.

    9 Una muestra aleatoria de 16 hembras de una especie de pequeos mamferos fue

    seleccionada en una regin geogrfica. La longitud promedio de la cola de las hembras de la muestra fue de 94 milmetros con una desviacin tpica de 12 milmetros. La longitud promedio de la cola de las hembras de esta misma especie en otra regin geogrfica fue de 81 milmetros. Proporcionan estos datos evidencia suficiente para indicar que la muestra provena de una poblacin con una media mayor que 81? Sea = 0.05. Cul es el valor p para esta prueba? Que suposiciones hay que hacer?

    10 Una muestra aleatoria de 25 personas que desempean una ocupacin determinada

    obtuvieron un puntaje promedio de actitud espacial de 89, con una desviacin tpica de 20. Proporcionan estos datos suficiente evidencia para concluir que el puntaje promedio verdadero para la poblacin prueba?

    11 Un trabajador social cree que el peso promedio de los muchachos de 10 aos que viven en

    un sector rural determinado es inferior a 34 kilogramos. Una muestra aleatoria de 25 muchachos tomada de esa poblacin arrojo un peso promedio de 30 kilogramos y una desviacin tpica de 10. Proporcionan estos datos evidencia suficiente para concluir que la opinin del trabajador social es correcta en el nivel de significacin 0.05? Expresar las suposiciones necesarias en la aplicacin del procedimiento de verificacin y calcular el va lor de p correspondiente.

    12 Un nutricionista cree que el consumo diario promedio de protenas en una poblacin es menor

    que 75 gramos. Una muestra aleatoria de 16 sujetos arrojo una media de 73.8 gramos con una desviacin tpica de 2.4 gramos. Constituyen estos datos un fundamento para la opinin del nutricionista? Sea =

    0.05. Calcular el valor de p para esta prueba y enunciar las suposiciones que sean necesarias. 13 Una encuesta de 64 empleados profesionales de una institucin correccional revelo que el

    tiempo promedio de empleo en el campo correccional era de 5 aos con una desviacin tpica de 4 anos. Sirven estos datos de soporte a la hiptesis de que el tiempo promedio de empleo de todos

    los empleados de este tipo esta por debajo de los 6 aos? Sea = 0.05. 14 Una encuesta hecha a 100 estudiantes matriculados en una universidad urbana revelo que

    durante un trimestre de primavera, la cantidad promedio de dinero gastado en vestuario se elevo a $55 con una desviacin tpica de $20.00. Verificar la hiptesis nula de que = $60.00. Sea = 0.05. Calcular el valor p para esta prueba.

    6.4 EL ERROR DE TIPO II Y LA POTENCIA DE UNA PRUEBA En las pruebas de hiptesis que se acaban de estudiar, a, la probabilidad de cometer un error

    de Tipo I (rechazando una hiptesis nula verdadera), ha estado bajo el control del inves tigador y se le ha fijado un valor pequeo, como 0.05 6 0.01. En esta seccin vamos a estudiar con ms

    detalle a , o probabilidad de cometer un error de Tipo II (aceptando una hiptesis nula falsa).

  • 21

    El error de Tipo II

    Consideremos la hiptesis Ho: , = o y H1: o con = 0.05. Supongamos que la

    poblacin pertinente esta normalmente distribuida, con varianza conocida 2. Siendo = 0.05,

    la regin de rechazo queda definida y consta de todos los valores de x mayores o iguales a +

    1.96 x y menores o iguales a o - 1.96 ,, donde o es la media hipottica de la distribucin

    muestral de x . La Figura 6.8 muestra esta distribucin, base de la verificacin de hiptesis.

    Si Ho es falsa, la distribucin muestral verdadera de x no estar centrada en o , como se ve en la Figura 6.8, sino que quedara centrada sobre la media poblacional verdadera. Si es igual a 1, por ejemplo, la distribucin muestral de x quedara centrada sobre 1. Sin embargo, las regiones de rechazo y de aceptacin quedaran fijas, puesto que estn determinadas por y por Ho. Si el valor

    de x calculado con los datos de la muestra simple, que se extrajo de la poblacin para verificar Ho, cae en la regin de aceptacin, cuando realmente es igual a 1, Ho ser "aceptada" y se cometer un error de Tipo II. La probabilidad, , de que este suceso ocurra es igual a la parte del

    rea bajo la curva de x centrada sobre 1 que coincide con el rea bajo la curva de x centrada sobre o

    que se encuentra entre los valores crticos de x . Ver Figura 6.9.

    Figura 6.8- distribucin muestral hipottica de x para Ho: = o, H1 o , cuando el muestreo se hace en una poblacin normalmente distribuida con varianza 2 ( = 0.05).

  • 22

    Bajo la hiptesis H1 o, puede asumir un numero infinito de valores y por lo tanto existe

    un numero infinito de posibles valores de . Aquel que se deba aplicar en una situacin dada,

    cuando Ho es falsa, depende del valor verdadero de . En la practica, no conocemos el valor verdadero de cuando Ho es falsa y por tanto no sabemos el valor real de . La Figura 6.9 muestra algunas

    alternativas posibles para , cuando Ho es falsa y las correspondientes . En esta figura, las distribuciones muestrales correspondientes a diversos valores de aparecen verticalmente para ms claridad. Debemos darnos cuenta de que, en realidad, los diversos valores de estn todos localizados sobre el mismo eje

    x y, en consecuencia, todas las curvas de distribucin muestral correspondientes tienen la misma lnea x como eje horizontal. Tambin debemos darnos cuenta de que, a pesar de que en la Figura 6.9 solamente se muestran seis alternativas diferentes de Ho : = o. existe un numero infinito de ellas. Al observar la Figura 6.9 se puede ver que las alternativas para o que estn localizadas cerca de o, producen valores ms grandes de que las alternativas que estn lejos de o. Por ejemplo, la distancia que hay entre

    1 y o es mas corta que la distancia que hay entre 2 y o y, en consecuencia, 1 es mayor que 2.

    Expliquemos ahora por medio de un ejemplo como se calcula un error de Tipo II. Ejemplo 6.5 Un psiclogo clnico deseaba verificar, en el nivel de significacin 0.05, la hiptesis de que el

    promedio del CI de un grupo de retardados mentales era de 65. Una muestra aleatoria de 50 sujetos arrojo una desviacin tpica de 12. El psiclogo tambin deseaba calcular la probabilidad de cometer un

    error de Tipo II. Los valores diferentes de para los cuales se calculo fueron 1 = 67, 2=70, 3=63, y 4=61.

    Los valores crticos para la verificacin de hiptesis son

  • 23

    La Figura 6.10 muestra estos valores crticos.

    Al determinar para los diferentes valores de , suponemos que S = 12, estimacin muestral de

    , es una estimacin apropiada para cada caso. Primero calcularemos para la alternativa l = 67. Si Ho =

    65 es falsa porque es realmente igual a 67, la distribucin muestral apropiada de x estara centrada

    en 67. Como los valores crticos de x , bajo la hiptesis Ho, son 62 y 68, "aceptaremos" Ho siempre que

    un valor observado de x caiga entre 62 y 68. Si es realmente igual a 67, estaremos "aceptando" una hiptesis nula falsa. La probabilidad de "aceptar" una hiptesis nula falsa (cometiendo un error

    de Tipo II) cuando = 67 es igual al rea, entre 62 y 68, que esta bajo la curva de x centrada sobre 67. Podemos expresar esta rea en trminos probabilsticas de la manera siguiente:

    Para calcular esta probabilidad convertimos a x en la escala normal estandarizada y obtenemos

    La figura 6.11 muestra grficamente este valor 1 de

  • 24

    Clculos semejantes para 2 = 70, 3 = 63 y 4 = 61, dan respectivamente los valores 2 =

    0.1190, 3 = 0.7208 y 4 = 0.2776. La Figura 6.12 muestra estos distintos valores de y tambin el de

    1.

    Obsrvese que disminuye cuando la distancia entre o y el otro valor de , para el cual se calcula

    13, aumenta. Tambin obsrvese que en el Ejemplo 6.5 todos los valores calculados de , como se ve en

    la Figura 6.12, son mayores que el valor preseleccionado de = 0.05. En realidad, hay que seleccionar un

    valor de aproximadamente igual a 70.8 o a 59.2 para que el valor correspondiente de sea igual a 0.05.

    As pues, la probabilidad de "aceptar" una hiptesis nula falsa, , es siempre mayor que , excepto cuando la hiptesis nula es falsa porque el verdadero valor de "esta muy lejos" de o.

    En muchas situaciones practicas, no estamos motivados para verificar hiptesis sobre medias

    poblaciones tales que, si Ho es falsa, el valor real de esta muy lejos de o . Por ejemplo, no podemos imaginar a alguien que este interesado en verificar estadsticamente la hiptesis nula de que la estatura promedio de los nios de seis aos es igual a la estatura promedio de los adultos. Por el contrario, no pondramos en tela de juicio el inters de alguien por verificar la hiptesis nula de que la estatura promedio de un grupo determinado de mujeres adultas es igual a la estatura promedio de otro grupo de mujeres. En otras palabras, en muchas situaciones practicas, si Ho es falsa, es falsa porque el valor verdadero de esta cerca de o. Por otra parte, mientras mas cerca este el valor verdadero de respecto de o, ms grande ser el valor de , la probabilidad de "aceptar" una hiptesis nula falsa. Es por esta razn que

    advertimos que una conclusin que se basa en una hiptesis nula rechazada es mas decisiva que una que se basa en una hiptesis nula "aceptada".

  • 25

    Es tambin por esta razn que, cuando rechazamos una hiptesis nula, decimos que Hl es verdadera,

    pero cuando "aceptamos" o dejamos de rechazar una hiptesis nula, decimos que Ho puede ser verdadera.

    La potencia de una prueba Un concepto muy util para evaluar las verificaciones de hiptesis lo constituye la potencia de una

    prueba. La potencia de una prueba es la probabilidad de rechazar una hiptesis nula falsa.

    Generalmente viene expresado por 1 - . Para una dada, decimos que una prueba es mas potente que

    otra, si el valor de 1 - es mayor en la una que en la otra para todos los valores de .

    Con frecuencia, es til contar, para una prueba particular, con lo que se conoce con el nombre de

    funcin potencia. DEFINICION Una funcin potencia es una funcin que muestra la relacin que existe entre la

    probabilidad de rechazar una hiptesis nula y los diferentes valores que puede asumir el parmetro dadas una hiptesis nula, una hiptesis alterna y un nivel de significacin determinado.

    La Tabla 6.2 da algunos de los valores de la funcin potencia correspondiente al Ejemplo 6.5. Se puede obtener una curva de potencia representando grficamente la funcin potencia. Los

    posibles valores del parmetro se representan sobre el eje horizontal y los valores de 1 - sobre el eje vertical. La Figura 6.13 muestra el grafico de la funcin potencia de la Tabla 6.2.

    La funcin potencia se usa para determinar la magnitud de 1 - cuando son verdaderos los valores

    especficos de la hiptesis alterna. La Figura 6.13 muestra la apariencia general en forma de V de las curvas de potencia

    correspondientes a pruebas bilaterales. En trminos generales una prueba bilateral que discrimina bien entre el valor del parmetro en Ho y los valores en H1 (excepto los que se encuentran cerca al valor expresado de Ho) da como resultado una curva de potencia en forma de V estrecha. Una curva en V extendida indica que la prueba discrimina pobremente en un intervalo relativamente amplio de valores diferentes del parmetro.

    La curva de potencia para una prueba unilateral con la regin de rechazo en la cola superior toma la

    forma de una S alargada. Una prueba unilateral con la regin de rechazo en la cola inferior de la distribucin tiene como resultado una curva de potencia que se asemeja a una S alargada pero al revs. La Figura 6.14 muestra la curva de potencia para el Ejemplo 6.2, que utiliza una prueba unilateral con regin de rechazo en la cola inferior de la distribucin muestral.

  • 26

    EJERCICIOS 15 Con los datos del Ejercicio 1, construir y representar grficamente la funcin potencia. 16 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 3. 17 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 4. 18 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 6. 19 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 7. 20 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 8. 21 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 13. 22 Construir y representar grficamente la funcin potencia correspondiente al Ejercicio 14. 6.5 VERIFICACIN DE UNA HIPTESIS SOBRE LA DIFERENCIA ENTRE DOS MEDIAS

    PBLACINALES En el Captulo 5 estudiamos la construccin de intervalos de confianza para la diferencia entre

    dos medias poblacionales. En el presente captulo vamos plantearnos el problema de verificar hiptesis sobre la diferencia entre dos medias poblacionales. El ejemplo que se estudi anteriormente relacionado con el equipo de psiclogos interesado en los puntajes de amor propio de los conformistas y de los no conformistas es una ilustracin de este tipo de pruebas de hiptesis. En ese ejemplo los psiclogos deseaban saber si era posible obtener la conclusin de que los puntajes

  • 27

    promedio de amor propio de los no conformistas es mayor que el de los conformistas. Podramos 'citar otros ejemplos. Un bilogo podra estar interesado en saber si es posible concluir que la duracin promedio de vida de algn animal es inferior en un tipo determinado de medio ambiente que en otro. Un socilogo podra querer saber si el nmero promedio de aos de educacin es diferente en dos poblaciones. Un economista tal vez est interesado en saber si el ingreso familiar promedio es diferente en dos grupos. Vamos a estudiar pruebas bilaterales y pruebas unilaterales para cada una de las tres situaciones siguientes: (1) cuando el muestreo se hace en dos poblaciones que estn distribuidas en forma por lo menos aproximadamente normal, con varianzas conocidas, (2) cuando el muestreo se hace en dos poblaciones que estn distribuidas en forma por lo menos aproximadamente normal con varianzas desconocidas pero iguales y (3) cuando el muestreo se hace en dos poblaciones que no estn normalmente distribuidas.

    En el Captulo 4 vimos las distribuciones muestrales apropiadas para cada una de estas situaciones.

    Poblaciones normalmente distribuidas, 21 y 2

    2 conocidas

    Ejemplo 6.6 En un establecimiento escolar suburbano, se seleccion al azar una muestra de 25 alumnos de

    quinto grado (grupo A) de una poblacin de estudiantes pertenecientes a familias en que ambos padres trabajan. Se seleccion tambin una muestra al azar de 15 estudiantes (grupo B) del mismo grado y establecimiento escolar entre aquellos estudiantes que pertenecen a familias en que solamente el padre trabaja. El anlisis de los puntajes de rendimiento escolar de los dos grupos dio los siguientes resultados:

    Puntaje promedio ( x ) Grupo 78 Grupo B 85

    La experiencia muestra que las poblaciones de puntajes para ambos grupos estn distribuidas en

    forma aproximadamente normal, con varianzas de = 81 y ( x ) = 25. Con el fin de determinar si se puede concluir, con base en estos datos, que la media de la poblacin de la que se seleccion el grupo A es inferior a la media de la poblacin de la que se seleccion el grupo B, se puede llevar a cabo la siguiente verificacin de hiptesis.

    1 Planteamiento de la hiptesis.

    2 Nivel de significacin. = 0.05. 3 Descripcin de las poblaciones y suposiciones. Como ya lo hemos observado se cree

    que es razonable suponer que las dos poblaciones estn distribuidas en forma aproximadamente normal. Las muestras son independientes.

    4 El estadstico pertinente. En virtud de que se va a verificar una hiptesis sobre la

    diferencia entre dos medias poblacionales, el estadstico ms adecuado es la diferencia entre las medias muestrales que se calcula a partir de las muestras tomadas de las poblaciones. El estadstico puede

    designarse como x1 - x 2. De acuerdo con lo que vimos en el Captulo 4, sabemos que, en esta

    situacin, podemos considerar que la distribucin muestral de x est normalmente distribuida con varianza igual a

  • 28

    y con media igual a 0, si Ho es verdadera. 5 El estadstico de prueba y su distribucin . Como suponemos que la poblacin est

    normalmente distribuida y como conocemos las varianzas poblacionales, el estadstico de prueba ms adecuado es z, que sigue la distribucin normal estandarizada.

    6 Regiones de rechazo y de aceptacin . El valor crtico de z es - 1.645.

    El valor crtico de x A, - x B es

    7 Recoleccin de datos y clculos. De acuerdo con los resultados dados anteriormente

    encontramos que .x.A -.xB = 78 - 85 = -7. El valor z que se puede calcular con base en estos datos es

    8 Decisin estadstica. Como -7 < -3.64 y -3.16 < -1.645 podemos rechazar Ho . 9 Conclusin. Se concluye que en ese establecimiento escolar, los puntajes promedio

    generales de rendimiento de los estudiantes de quinto grado que pertenecen a familias en que ambos padres trabajan son inferiores a los de los estudiantes que pertenecen a familias en que solamente el padre trabaja.

    Podemos hacer una forma semejante a la que se acaba de describir, hiptesis bilaterales que tienen

    la siguiente forma:

    Poblaciones normalmente distribuidas, 1 y '2 desconocidas pero iguales Ejemplo 6.7 Dos profesores de una escuela de educacin de una universidad desean comparar los puntajes

    totales de rendimiento de los estudiantes de octavo grado que han sido mviles (poblacin 1) durante sus aos de escuela elemental con los puntajes de los estudiantes que no lo han sido (poblacin 2). Especficamente desean saber si pueden concluir con los datos de la muestra (n1 = 15, n2 = 22), si el puntaje de rendimiento promedio es diferente en los dos grupos. Los profesores definieron como estudiantes mviles a aquellos que asistieron a dos o ms escuelas elementales. Clasificaron como no mviles a los estudiantes que haban asistido a la misma escuela durante todos los aos de escuela elemental. Los profesores efectan el siguiente procedimiento para la verificacin de hiptesis.

    1 Planteamiento de la hiptesis. Como los investigadores no tienen cmo especificar la

    direccin de la diferencia que pudiera existir entre las dos medias poblacionales, hacen las siguientes hiptesis alternas bilaterales:

  • 29

    2 Nivel de significacin. Sea = 0.05. 3 Descripcin de las poblaciones y suposiciones. Los profesores suponen que ambas

    poblaciones estn distribuidas en forma aproximadamente normal. Las varianzas poblacionales son desconocidas, pero los profesores suponen que son iguales. Las muestras son independientes.

    4 El estadstico pertinente. El estadstico ms adecuado es x 1- x 2, que, en virtud de que se supone que las dos poblaciones estn distribuidas en forma aproximadamente normal, podemos considerar como normalmente distribuido. Si Ho es verdadera, la media de la distribucin muestral es 1 -2

    = 0 y su varianza es ( 12

    1 / n ,) + ( 22

    2 / n ). Como 12

    1 / n y 22

    2 / n son desconocidas, no podemos calcular

    la varianza verdadera de x1- x 2 y, en consecuencia, excluimos a z como estadstico de prueba.

    5 El estadstico de prueba. Como se observ en el paso 4, z no es el estadstico de prueba

    apropiado. Como se supone que las dos poblaciones estn distribuidas en forma aproximadamente normal, con varianzas desconocidas pero iguales, el estadstico de prueba ms adecuado es el estadstico t de Student con n1 + n2 - 2 grados de libertad.

    6 Regiones de rechazo y de aceptacin. Como los grados de libertad son 15 + 22 -- 2 =

    del Apndice, que los valores crticos de t son

    2.0301. No podemos calcular los valores crticos de x1 -- x 2 , haber calculado las varianzas muestrales.

    7 Recoleccin de datos y clculos. Los profesores obtuvieron las siguientes medias y

    varianzas muestrales.

    La estimacin combinada de la varianza de la poblacin comn es:

    que es el error tpico de x 1 - x 2 .

    El valor de t que se puede calcular con base en estos datos es:

    8 Decisin estadstica. Como -2.0301 < -1.14 < 2.0301 es decir, como -1.14 cae en la

    regin de aceptacin, no podemos rechazar Ho. Hacindolo de otro modo, podramos haber basado nuestra decisin de rechazar o no a HO

    en la magnitud de la diferencia observada x1 - x 2 = 85 - 87 = -2. Los valores crticos de x 1 - x 2

    estn dados por 0 (2.0301) (1.76) = -3.57

  • 30

    Como --3.57 < -2 < 3.57, no podemos rechazar Ho. 9 Conclusin. Con base en estos datos, los profesores pueden concluir que no debe haber

    ninguna diferencia entre las dos medias de poblacin. Muestreo en poblaciones no distribuidas normalmente

    Ejemplo 6.8 Un equipo de consejeros de rehabilitacin juvenil tiene la impresin de que los jvenes

    reincidentes y los no reincidentes son diferentes en cuanto al promedio de edad en que caen en poder de las autoridades. Con el objeto de ver si pueden tener evidencias para corroborar esta idea, el equipo saca una muestra aleatoria de nR = 50 registros de reincidentes y una de nN = 60 de no reincidentes. Efectan el siguiente procedimiento para la verificacin de hiptesis.

    1 Planteamiento de la hiptesis.

    donde N es la edad promedio de los no reincidentes en el momento en que cayeron por

    primera vez en manos de la polica y la edad promedio en que los reincidentes cayeron por primera vez en manos de la polica.

    2 Nivel de significacin. Sea

    3 Descripcin de las poblaciones y suposiciones. Las formas funcionales de las

    poblaciones no se conocen, pero esto no trae ningn problema para la determinacin del estadstico de prueba, puesto que las muestras son grandes. Podemos suponer que los tamaos de las

    muestras son suficientemente grandes como para proporcionar estimaciones aceptables de ( 2R y 2

    N

    . Las muestras son independientes.

    4 El estadstico pertinente. El estadstico ms adecuado es xN -- x R que, como consecuencia

    del teorema del lmite central, est distribuido en forma aproximadamente normal, con un error tpico de

    y una media, de 0, si Ho es verdadera. Como 2

    R y 2

    N son desconocidas, podemos estimarlas

    mediante 2RS y 2

    NS para poder obtener

    que es una estimacin de (2

    Nx y 2

    Rx

    5 El estadstico de prueba. Con base en las consideraciones hechas en el paso 4, el estadstico de prueba adecuado es z.

    6 Regiones de rechazo y de aceptacin. El valor crtico de z es 1.645. 7 Recoleccin de

    datos y clculos. Se obtienen las siguientes medias y varianzas muestrales.

  • 31

    Con base en estos datos calculamos

    8 Decisin estadstica. Como 5.94 > 1.645, rechazamos Ho. Procediendo de otro modo,

    podramos haber basado nuestra decisin en la magnitud de la diferencia entre las medias muestrales xN

    -- x R = 14.9 - 12.3 = 2.6, en comparacin con el valor crtico de x N -- x R, que est dado por

    Como 2.6 > 0.72, podemos rechazar Ho . 9. Conclusin. La edad promedio en que los no reincidentes tienen su primer contacto con

    las autoridades es mayor que la de los reincidentes. EJERCICIOS 23 Un terapeuta ocupacional realiz un estudio para evaluar los mritos relativos de dos aparatos

    prostticos ideados para facilitar la destreza manual. El terapeuta le entreg a 21 pacientes con idnticas dificultades uno de los dos aparatos para que lo usaran mientras realizaban determinada tarea. Once pacientes llevaron el aparato A y 10 el B. El investigador registr el tiempo que gast cada paciente en realizar la tarea y obtuvo los siguientes resultados:

    x = 65 segundos, 2AS = 81

    x , = 75 segundos, 2BS = 64.

    Darn estos datos evidencia suficiente como para concluir que el aparato A es ms efectivo que

    el aparato B? Sea = 0.05. 24 Como parte de un estudio relacionado con la conducta de una especie animal, unos zologos

    realizaron un experimento para determinar si esa especie animal presentaba en promedio diferentes tiempos de respuesta a un estmulo bajo dos condiciones diferentes (condicin I y condicin II). Los investigadores sometieron una muestra aleatoria de 15 animales a la condicin I. Para cada animal registraron el tiempo transcurrido entre el comienzo del estmulo y la respuesta. Tomaron los mismos registros con una muestra aleatoria de 17 animales que fueron sometidos a la condicin II. Sus resultados fueron los siguientes:

    Proporcionan estos datos evidencia suficiente como para concluir que el promedio de tiempos de

    respuesta es diferente bajo las dos condiciones? Sea = 0.01. 25 Como parte de un proyecto de investigacin, un psiclogo seleccion una muestra aleatoria

    de 12 muchachas y otra de 9 muchachos. Luego, le pidi a cada individuo que dibujara una figura masculina. El tiempo promedio que gastaron las mujeres fue de 8 minutos con una varianza de 18. Para los hombres el tiempo fue de 13 minutos, con una varianza de 22.5. Indican estos datos que los hombres en promedio gastan ms tiempo cuando dibujan una figura de hombre que las mujeres? Sea = 0.05.

    26 Se llev a cabo una encuesta entre los ancianos de una comunidad para comparar los niveles

  • 32

    de amor propio entre los que vivan y los que no vivan en ancianatos (solos o con parientes). Se le dio a cada uno una prueba para medir su amor propio. Se obtuvieron los siguientes resultados:

    Proporcionarn estos datos evidencia suficiente como para deducir que los ancianos que no viven

    en los ancianatos tienen un puntaje promedio superior de amor propio a los que viven en ancianatos? Sea

    = 0.01. 27 Se llev a cabo un estudio para evaluar los efectos del hacinamiento sobre el aprendizaje, entre

    nios de escuela elemental. A una muestra aleatoria de 50 nios se le ense una destreza determinada en condiciones de hacinamiento y a otra de 45 nios se le ense la misma destreza, con los mismos profesores, pero sin hacinamiento. Al terminar el experimento se le adminis tr a cada nio una prueba para determinar su nivel de dominio de la habilidad. Se obtuvieron los siguientes resultados:

    Proporcionan estos datos evidencia suficiente como para concluir que la enseanza es menos

    efectiva bajo condiciones de hacinamiento? Sea = 0.05. 28 Al comienzo del ao escolar se distribuyeron al azar los alumnos de ltimo ao de un colegio

    en dos grupos, cada uno con 50 estudiantes. El grupo A recibi consejera vocacional individual. El grupo B no recibi ninguna consejera. Al final del ao, se le hizo a cada alumno una prueba para medir su nivel de conocimientos sobre las distintas carreras. Los resultados fueron los siguientes:

    Proporcionan estos datos evidencia suficiente como para concluir que la consejera individual es

    efectiva para aumentar el conocimiento de las carreras profesionales? Sea = 0.05.

    29 En un estudio cuyo objeto era evaluar los efectos del ruido sobre la capacidad de aprender,

    se distribuyeron aleatoriamente en dos grupos 24 estudiantes. Al grupo 1 se le ense una habilidad en condiciones de ruido. Al grupo 2 se le ense la misma habilidad, con el mismo profesor, pero sin ruidos. Al final del experimento se administr a cada estudiante una prueba para medir su nivel de dominio de la habilidad. Los resultados fueron los siguientes:

    Proporcionan estos datos evidencia suficiente como para concluir que el ruido es un factor

    que impide el aprendizaje? Sea = 0.05. 30 En un laboratorio de psicologa, los investigadores hicieron llegar, por diferentes conductos,

    una sustancia txica hasta el sistema nervioso central de varios animales experimentales. La variable de inters fue el tiempo, en horas, que corri entre la administracin de la toxina y la iniciacin de los sntomas. Se obtuvieron los siguientes resultados:

  • 33

    Proporcionan estos datos evidencia suficiente como para concluir que, en promedio, la iniciacin de los sntomas se inicia ms pronto cuando la toxina se administra por el conducto B? Sea = 0.05.

    6.6 COMPARACIONES PAREADAS En el Captulo 5 estudiamos la construccin de intervalos de confianza para diferencias entre

    medias poblacionales, teniendo en cuenta datos de muestras aleatorias que no son independientes. Tambin, vimos la razn fundamental y las ventajas que ofrece utilizar este tipo de datos, que se denominan datos pareados u observaciones pareadas. Partiendo de la misma teora que sirve de fundamento para la construccin de intervalos de confianza para diferencias entre medias poblacionales, podemos verificar tambin hiptesis acerca de diferencias entre medias poblacionales. Resulta conveniente una prueba bilateral cuando la hiptesis nula establece que la media verdadera de las diferencias entre dos conjuntos de observaciones pareadas es igual a 0, sin ninguna especificacin de que la diferencia tenga una direccin y no otra. Si la hiptesis alterna establece que el conjunto de observaciones de una poblacin es mayor (o menor) que el otro conjunto, es conveniente usar una prueba unilateral. Expliqumonos con un ejemplo.

    8 Decisin estadstica. Como el valor calculado de t, 2.20, es mayor que el valor crtico de

    1.7613, rechazamos Ho. 9 Conclusin. Concluimos que las situaciones que producen ansiedad aumentan el nivel de

    ese producto qumico en la sangre. EJERCICIOS 31 La Tabla 6.4 muestra los puntajes de CI de 12 nios a quienes se les diagnostic

    inhabilidad para el aprendizaje antes y despus de 9 meses de la iniciacin de un programa remedial. Proporcionan estos datos evidencia suficiente como para concluir que el programa remedial es

    efectivo para aumentar los puntajes de CI en este tipo de nios? Sea = 0.05. 32 La Tabla 6.5 muestra la concentracin de cierto producto qumico en la orina de 10

    adultos despus de la administracin, por dos vas distintas, de una droga que contena ese producto. Proporcionan esos datos evidencia suficiente como para concluir que la administracin

    intramuscular de la droga produce una mayor concentracin del producto qumico en la orina?. Sea

  • 34

    = 0.05.

    33 Un psiclogo seleccion al azar a 15 seoras con sus maridos entre los residentes de un

    sector urbano y les solicit que-completaran un cuestionario para medir el nivel de satisfaccin respecto de la comunidad donde vivan. La Tabla 6.6 muestra los resultados de la encuesta. Proporcionan estos datos una indicacin de que los maridos de ese sector estn ms satisfechos con

    la comunidad que sus esposas? Sea = 0.05. 6.7 VERIFICACION DE UNA HIPTESIS SOBRE UNA PROPORCIN PBLACINAL NICA Como ya lo hemos visto, con frecuencia deseamos hacer inferencias acerca de proporciones

    poblacionales. En el Captulo 5 vimos cmo se construyen estimaciones por intervalos de confianza