Prueba de Hipótesis

UNIDAD III:INFERENCIA ESTADÍSTICA

175 Cátedra de Cálculo Estadístico y Biometría – Facultad de Ciencias Agrarias – UNCUYO / Ciclo 2015

PPRRUUEEBBAA DDEE HHIIPPÓÓTTEESSIISS 11.1.INTRODUCCIÓN

11.2.ELEMENTOS DE LAS PRUEBAS DE HIPÓTESIS

11.3.PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL

11.3.1. Caso: muestra grande

11.3.2. Caso: muestra pequeña

11.4.PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

11.4.1. Muestras independientes 11.4.1.1. Caso de muestras grandes 11.4.1.2. Caso de muestras pequeñas

11.4.2. Muestras apareadas 11.5.PRUEBAS DE HIPÓTESIS PARA UNA PROPORCIÓN POBLACIONAL

11.5.1. Prueba de hipótesis para un conteo

11.5.2. Prueba de hipótesis para una proporción 11.6.PRUEBAS DE HIPÓTESIS PARA DOS PROPORCIONES POBLACIONALES

1111..11.. IINNTTRROODDUUCCCCIIÓÓNN Al iniciar el estudio de los métodos estadísticos (descriptivos e inferenciales) se indicó que a

través de la inferencia estadística se podía llegar a generalizaciones respecto de las características de una población, utilizando las observaciones empíricas de una muestra tomada al azar.

Una vez introducidas las nociones de distribución de probabilidad de una variable aleatoria y de que los estadígrafos son variables aleatorias y por tanto tienen en el muestreo una distribución de probabilidades, se está en condiciones de desarrollar los métodos de inferencia estadística que permiten resolver dos grandes grupos de problemas relacionados con: a) la estimación de parámetros poblacionales a partir del conocimiento de una muestra y b) probar si un enunciado afirmativo (hipótesis o suposición) acerca de un parámetro poblacional, o más de uno, puede sostenerse o no frente a la evidencia empírica aportada por una o más muestras aleatorias.

La gran importancia de la inferencia estadística radica en que proporciona herramientas para actuar, pese a desconocer cuales son las verdaderas características de la población, solamente a costa de tomar conciencia de la existencia de una condición de incertidumbre. Esto ya fue analizado al estimar un parámetro poblacional tanto en forma puntual (error de estimación) como intervalar (nivel de confianza).

En este capítulo se introducirán las denominadas pruebas de hipótesis. Como primera idea se dirá que todo el mundo toma decisiones en su vida diaria, algunas son de fundamental importancia y otras son menos significativas. Pero en todos los casos se actúa de acuerdo a un patrón que consiste en ponderar alternativas y optar por alguna de ellas, con base al conocimiento disponible, tras lo cual se suele llevar a la práctica algún tipo de acción, como por ejemplo se emprende un viaje, se hace una compra, se asiste a una reunión y otras.

En el campo de las ciencias experimentales, es tan importante el papel que desempeña la Estadística en la toma de decisiones que se la suele definir como la ciencia para el “estudio de las decisiones frente a la incertidumbre". En otras palabras, se puede decir que se llaman decisiones estadísticas a las decisiones que se toman con respecto a las poblaciones, a partir del conocimiento incompleto. Por ejemplo, a partir de los datos del muestreo se puede decidir si una nueva variedad tiene mayor rendimiento que otra de uso tradicional, o si el agregado de un conservante mejora la vida útil de un alimento o si un hábitat es más favorable para la vizcacha que otro, etc.

En el campo de la investigación, por lo general los procesos de toma de decisiones comienzan con la identificación de un problema de interés, siguen con el planteo de dos hipótesis que postulan puntos de vista opuestos y, con base a información empírica se concluye con el rechazo de una de ellas y el sostenimiento de la otra. En Estadística las dos hipótesis mutuamente excluyentes reciben el nombre de hipótesis nula e hipótesis alternativa, y se expresan en forma simbólica. Un ejemplo de esto último puede ser, respectivamente:

Ho: µ1 = µ2 y H1: µ1 ≠ µ2

El análisis estadístico de los datos muestrales permitirá discernir con bases probabilísticas, cuál es la hipótesis que encuentra apoyo o sostenibilidad. En el campo científico los investigadores partirán del enunciado de una hipótesis en términos del problema de interés, que es la hipótesis de investigación, hipótesis científica o hipótesis de trabajo �� y que, por lo general, coincide con la hipótesis estadística alternativa. Las hipótesis son proposiciones provisionales y exploratorias y, por tanto, su valor de veracidad o falsedad depende críticamente de las pruebas empíricas. En este sentido, la concepción de reproducibilidad de los resultados es fundamental para confirmar una hipótesis como explicación de un fenómeno. Así, cuando resulte un valor muestral observado de la media � próximo al de la media poblacional de la correspondiente distribución en el muestreo (valor supuesto o hipotético),

TEMA



esto es cuando resulta un valor métrico que responde a la variabilidad esperada por azar, no se podrá contradecir a lo enunciado en la hipótesis nula (hipótesis verosímil) y habrá que tomar una decisión desfavorable a la hipótesis de investigación. Los procedimientos que llevan a sostener o descartar la hipótesis nula, perjudicando o favoreciendo respectivamente el sostenimiento de la hipótesis alternativa, son denominados pruebas de hipótesis.

Para la toma de decisión en una prueba de hipótesis existen dos alternativas muy utilizadas, a saber: a) uno tradicional que se basa en utilizar el denominado valor crítico del estadígrafo de la prueba de hipótesis de acuerdo a su distribución de probabilidades en el muestreo y, b) uno más moderno que ha cobrado popularidad a través de los software estadísticos que emplea el valor p, que se refiere a la probabilidad condicional de que el valor tomado por el estadígrafo muestral se deba al azar. Una tercera alternativa es emplear una estimación paramétrica bajo enfoque de prueba de hipótesis.

En este capítulo se presentarán las pruebas de hipótesis referidas a las medias y a las proporciones de una o dos poblaciones. En los siguientes capítulos serán tratadas pruebas de hipótesis para resolver otros tipos de problemas.

1111..22.. EELLEEMMEENNTTOOSS DDEE LLAASS PPRRUUEEBBAASS DDEE HHIIPPÓÓTTEESSIISS Las pruebas de hipótesis constituyen un procedimiento estadístico sólido y riguroso para emitir

juicios probables acerca de una población y, al mismo tiempo, conocer la magnitud y la probabilidad de los errores en los que se puede incurrir al expresar los correspondientes juicios finales. Por ejemplo, se suele afirmar que el hábito de fumar causa cáncer; aún así, se conocen muchos casos de personas que pese a haber fumado diariamente gran cantidad de cigarrillos jamás padecieron cáncer, llegando a alcanzar edades muy avanzadas, así como hay muchos casos de personas que jamás fumaron y murieron a causa del cáncer. Entonces, ¿hasta qué grado es posible afirmar que el cigarrillo produce cáncer? Para averiguarlo se necesita realizar un experimento bajo la hipótesis de investigación “que los fumadores son más propensos a morir por cáncer que los no fumadores”, y aplicar una prueba de hipótesis a datos de una muestra aleatoria de fumadores y otra de no fumadores, asumiendo a la luz de los resultados o evidencia empírica un cierto margen de riesgo de equivocarse en las conclusiones.

Por ejemplo si, sobre la base de datos de una muestra, un ingeniero tiene que tomar una

decisión acerca de que un cierto plan de fertilización aumenta el verdadero rendimiento promedio (µ) de un cultivo hortícola al menos en 3000 kg/ha, entonces puede realizar una prueba de hipótesis con una muestra de cultivos para corroborar o desmentir sus sospechas. Lo mismo si un fabricante de una línea de productos alimentarios destinada a lactantes quiere decidir la fabricación de un nuevo producto si se demuestra que el 80% de los lactantes que consuman el nuevo producto aumentan significativamente su peso. O bien si un viticultor que produce uvas para consumo en fresco en una zona inserta en un entorno natural tiene pérdidas importantes a causa de la depredación de los pájaros, insectos y alimañas. En los tres casos los problemas pueden conducir a postular una hipótesis para someterla a prueba, las que respectivamente serían: “el rendimiento medio del cultivo con el plan de fertilización es cuando menos de 3.000 kg/ha superior a cuando el plan no se aplica”, “el 80% de los lactantes que consumen el nuevo producto durante cierto período alcanzan mayor peso que si consumen otro producto”, “las pérdidas de uva por acción de los pájaros, insectos y alimañas superan un cierto nivel económico”.

Definición 11.1

Una hipótesis es una aseveración o conjetura con respecto a un problema de interés.

Para aplicar una prueba de hipótesis hay que traducir la problemática a dos enunciados complementarios conocidos como hipótesis estadísticas.

Definición 11.2 Una hipótesis estadística es una aseveración o conjetura con respecto a una o más poblaciones. En el análisis estadístico es usual el planteo de un par de hipótesis: la hipótesis nula y la hipótesis alternativa. Las hipótesis estadísticas se plantean formalmente en notación simbólica.

Definición 11.3. La hipótesis estadística nula, simbolizada como Ho, es la hipótesis que se somete a prueba. Por lo general, es una afirmación acerca de que un parámetro poblacional tiene un valor específico (o bien no se diferencia de un valor referencial).

Definición 11.4. La hipótesis estadística alternativa, simbolizada como H1, es una afirmación sobre el mismo parámetro poblacional considerado en la hipótesis nula, que especifica que el mismo tiene un valor diferente, de alguna manera, al postulado en la hipótesis nula.

En el contexto de las ciencias experimentales, la hipótesis alternativa concuerda con la hipótesis de investigación, porque representa lo que el investigador espera demostrar como “verdadero”, dado que expresa el enunciado explicativo de su interpretación acerca de un fenómeno aleatorio de interés. La hipótesis de investigación se plantea en términos del problema en cuestión.



Una hipótesis nula referida a un parámetro poblacional siempre se establecerá de modo que especifique un valor exacto del parámetro, en tanto que la hipótesis alternativa permite la posibilidad de que el parámetro tome varios valores (mayor al especificado, menor al especificado o, bien diferente al especificado). Además la hipótesis alternativa suele ser la afirmación que el experimentador desea demostrar que es verdadera, de modo que el deseo profundo de éste es que la prueba de hipótesis le ayude a demostrar a través de la evidencia muestral que la hipótesis nula no puede sostenerse, lo cual implicará una probable veracidad de la hipótesis alternativa, que enuncia la interpretación o creencia acerca de la realidad.

Definición 11.5.

Una prueba de hipótesis es un proceso que permite tomar una decisión entre dos hipótesis opuestas: Ho y H1. Estas hipótesis se plantean de modo que una es la negación de la otra (de esta forma una de ellas siempre resulta verdadera y la otra siempre es falsa). En la práctica la hipótesis nula, Ho, se somete a prueba esperando poder demostrar que su ocurrencia es muy improbable, lo cual implicará que la otra hipótesis, H1, es probablemente la verdadera.

La idea básica de la prueba de hipótesis es que los hechos (datos muestrales) aporten la evidencia para refutar Ho, o sea que la hipótesis nula es la afirmación que puede resultar refutada por la realidad. El resultado deseado de la persona que realiza la prueba, se expresa en la hipótesis alternativa bajo la convicción de que los hechos demostrarán la factibilidad del enunciado hipotético o “teoría del investigador”, porque demostrarán la improbable veracidad de hipótesis nula.

El planteamiento formal de la hipótesis nula está vinculado a una estructura probabilística que hace referencia a la probabilidad de que se tomen decisiones que lleven a una conclusión errónea. Las pruebas estadísticas se aplican bajo el supuesto de que la hipótesis nula es un enunciado verdadero. Frente a la evidencia muestral que proporciona una información incompleta acerca de la población, se puede tomar la decisión de no sostener la hipótesis nula (no aceptar o rechazar Ho) o bien sostenerla (aceptar Ho). Pero los estados de la naturaleza pueden ser: la hipótesis nula realmente es verdadera o bien la hipótesis nula realmente es falsa. Luego la combinación de las dos posibles decisiones con los dos posibles estados de la naturaleza, arrojan cuatro posibles resultados (Tabla 11.1).

Tabla 11.1: Cuatro resultados posibles en una prueba de hipótesis

Decisión Hipótesis nula (en la realidad)

Verdadera Falsa

Aceptar H0 Se toma una decisión correcta de tipo A Se comete un Error tipo II

No aceptar H0 Se comete un Error tipo I Se toma una decisión correcta de tipo B

Una decisión correcta de tipo A ocurre cuando la hipótesis nula es verdadera y se decide a su favor. Una decisión correcta de tipo B ocurre cuando la hipótesis nula es falsa y la decisión es en oposición a la hipótesis nula.

Definición 11.6. Se comete un error de tipo I cuando no se acepta la hipótesis nula Ho, siendo que esta era verdadera, es decir que se toma incorrectamente una decisión contra ella. A la no aceptación de la hipótesis nula cuando es verdadera se lo denomina error de tipo I.

Definición 11.7. Se comete un error de tipo II cuando se acepta la hipótesis nula Ho siendo que esta era falsa, es decir que se toma incorrectamente una decisión a favor de ella. La aceptación de la hipótesis nula cuando no es verdadera se llama error de tipo II.

Por ejemplo, se sospecha que un detergente de primera marca es mejor que otro de segunda marca y se desea probar ambos productos, porque de no ser así se tomaría la decisión de comprar el detergente más barato. La idea “el detergente de primera marca es mejor que el detergente de segunda marca” es la razón para realizar la prueba, por lo que se vuelve la hipótesis del investigador (hipótesis estadística alternativa). De este modo las hipótesis en términos del problema son:

H0: “No hay diferencia en el desempeño de los detergentes”. H1: “el detergente de primera marca es mejor que el detergente de segunda marca”

Los cuatro posibles resultados y las acciones consiguientes serán:



Tabla 11.2: Cuatro posibles resultados y las acciones resultantes del ejemplo

Decisión

Condición del estado de la naturaleza

La hipótesis nula es verdadera Veracidad de la situación:

no hay diferencia entre los detergentes

La hipótesis nula es falsa Veracidad de la situación:

el detergente de primera marca es mejor.

Aceptar H0

Decisión correcta de tipo A

• Conclusión: se determinó que no hay diferencia entre los detergentes.

• Acción: el consumidor compra el detergente de segunda marca, ahorra dinero y obtiene los mismos resultados.

Decisión incorrecta: Error tipo II • Conclusión: se determinó que no hay

diferencia.

• Acción: el consumidor compra el detergente de segunda marca, ahorra dinero pero obtiene peores resultados.

No aceptar H0

Decisión incorrecta: Error tipo I • Conclusión: se determinó que el

detergente de primera marca es mejor.

• Acción: el consumidor compra el detergente de 1º marca, gasta dinero extra sin obtener mejores resultados.

Decisión correcta de tipo B

• Conclusión: se determinó que el detergente de primera marca es mejor.

• Acción: el consumidor compra el detergente de 1º marca y, aunque gasta más, obtiene mejores resultados.

La verdad o falsedad de una hipótesis estadística nunca se sabe con absoluta certidumbre a menos que se examinara a toda la población, situación poco práctica en la mayoría de los casos, además de onerosa y de requerir mayores tiempos. En su lugar se toma una muestra aleatoria de la población de interés, y los datos observados se usan para proporcionar evidencia que puede resultar directamente a favor o no de la hipótesis nula Ho, e indirectamente con relación a la hipótesis planteada por el investigador. En otras palabras, la evidencia de la muestra que es consistente con la hipótesis Ho conduce al rechazo de la hipótesis del investigador, mientras que la evidencia que resulta inconsistente con la hipótesis Ho lleva al apoyo de la hipótesis del investigador.

La aceptación de una hipótesis nula Ho simplemente implica que los datos observados no dan suficiente evidencia para rechazarla. Puesto de otra forma, la aceptación significa que hay una alta probabilidad de obtener la información muestral observada bajo el hecho de que la hipótesis Ho es verdadera. En tanto que la no aceptación de una hipótesis nula Ho implica que hay suficiente evidencia muestral para refutarla.

Recuerde:

En una prueba de hipótesis nunca se tiene la certeza de haber tomado una decisión correcta.

A la luz de lo que acontece interesa controlar la probabilidad de cometer un error al tomar decisiones basadas en pruebas de hipótesis.

Las probabilidades asociadas a los diferentes tipos de errores en las pruebas de hipótesis son las

denominadas probabilidades α (con relación a un error de tipo I) y β (con relación a un error de tipo II).

Cuadro 11.3. Probabilidades asignadas a los errores tipo I y II.

Decisión Hipótesis nula

Es verdadera Es falsa

No rechazar H0 Decisión correcta de tipo A

Probabilidad(A) = α−1 P(Error tipo II)=�

Rechazar H0 P(Error tipo I)=�

“Nivel de significancia”

Decisión correcta de tipo B �� = 1 − � “Potencia de una prueba”

Por convención, los valores de probabilidad de mayor uso para βα y son 0.01 y 0.05. La

probabilidad asignada a cada error depende de la gravedad de éstos. Mientras más grave es un error, menos se desea que ocurra; en consecuencia, se le asigna una menor probabilidad. ¿Cómo se controlan los errores? βα y son probabilidades de errores, cada una bajo condiciones separadas, y no

pueden combinarse. Así, no es posible determinar una sola probabilidad para tomar una decisión incorrecta. De manera semejante, las dos decisiones correctas son distintas y ajenas, y cada una tiene

su propia probabilidad; α−1 es la probabilidad de tomar la decisión correcta cuando la hipótesis nula es

verdadera, y β−1 es la probabilidad de tomar la decisión correcta cuando la hipótesis nula es falsa. La

forma de controlar en forma simultánea ambos errores, esto es reducir la probabilidad de cometerlos, es aumentando el tamaño muestral. Definición 11.8. A β−1 se le denomina potencia de la prueba estadística, ya que mide la capacidad de una prueba

de hipótesis para rechazar una hipótesis nula falsa, lo que es una característica muy importante

La decisión de rechazar o no rechazar la H0 se basa en la información que contiene una muestra extraída de la población de interés. Esta información toma la forma de estadígrafo de prueba o valor-p.



¿Cómo se decide entre rechazar o no rechazar la H0? El conjunto entero de valores que el estadígrafo de prueba puede asumir se divide en dos regiones:

- un conjunto consta de los valores que apoyan la hipótesis alternativa y conducen al rechazo de la hipótesis nula, ésta es la región de rechazo;

- el otro está constituido por valores que apoyan la hipótesis nula y se designa con el nombre de región de aceptación.

De esta manera se establece una regla de decisión. Tal regla especifica los criterios para rechazar o no rechazar la H0, y se sustenta en tres elementos:

1. El nivel de significancia 2. La distribución de probabilidad de un estadígrafo de prueba 3. El valor crítico del estadígrafo de prueba que define las dos regiones.

Región de aceptación Región de rechazo

(Acepto H0) (Rechazo H0)

� Valor crítico

Definición 11.9. En forma general, el valor crítico es el “primer” valor límite” de la región crítica (o región de rechazo).

Definición 11.11 El estadígrafo de prueba es la variable aleatoria cuyo valor se calcula a partir de los datos muestrales y que se utiliza para tomar la decisión de “no rechazo” o “rechazo” de la H0 cuando se observa en qué región se encuentra su valor.

La regla de decisión debe establecerse antes de recolectar los datos. Una vez tomada la muestra, se calcula el valor muestral del estadígrafo de prueba (evidencia aportada por los datos muestrales) y se lo compara con el valor crítico, tomando finalmente la decisión estadística.

La toma de decisión será en base a lo siguiente:

a) si el estadígrafo de prueba cae dentro de la región de rechazo, se rechaza la hipótesis nula.

b) si el estadígrafo de prueba está en la región de aceptación, no se rechaza de hipótesis nula.

La comparación del valor calculado del estadígrafo de prueba con el valor crítico para tomar la decisión de rechazar o aceptar la hipótesis nula nos lleva a una dificultad relacionada a los distintos niveles de significancia que la prueba de hipótesis puede tomar. Los diferentes investigadores pueden fijar distintos niveles de significancia arribando a conclusiones diferentes (por ejemplo, para la misma prueba de hipótesis puede rechazarse la hipótesis nula con un nivel de significancia de 0,05 pero aceptarla con un nivel de significancia de 0,01). Además, el valor del estadígrafo de prueba no nos da suficiente información contra la hipótesis nula. Por esto es que muchos investigadores utilizan el valor de probabilidad observado o valor p, para evitar ambigüedades.

Definición 11.12

El valor-p o valor observado de probabilidad de una prueba estadística, es el valor más pequeño al cual H0 sería rechazada cuando se utiliza un procedimiento de prueba especificado con un conjunto de datos dado. Una vez que se ha determinado el valor p, la toma de decisión a un nivel particular de significancia resulta de comparar el valor p con �:

1. � �� ≤ � ⇒ ��ℎ � ! �"��#�$"�%�� "��

2. � �� > � ⇒ "��ℎ � ! �"��#�$"�%�� "��

Un valor p pequeño indica que el valor observado del estadígrafo de prueba está lejos del valor hipotético. Esto es una fuerte evidencia de que H0 es falsa y debe rechazarse. Si los valores p son grandes, entonces significa que el estadígrafo de prueba observado no está lejos del valor hipotético y no apoya el rechazo de H0.

Se acostumbra llamar a los datos significativos cuando ! es rechazada y no significativos, de lo contrario. El valor p es entonces el nivel más pequeño al cual los datos son significativos.

Para completar una prueba de hipótesis es necesario escribir una conclusión que describa cuidadosamente el significado de la decisión relativa al propósito de la misma.

La conclusión en términos estadísticos será:

a) si la decisión es “rechazar la H0”, entonces la conclusión debe verbalizarse más o menos como “la muestra aporta suficiente evidencia al nivel de significancia α para demostrar que… (se completa con la expresión estadística correspondiente a la hipótesis alternativa)”

b) si la decisión es “no rechazar la H0”, entonces la conclusión debe verbalizarse más o menos como “la muestra no aporta suficiente evidencia al nivel de significancia α para demostrar que … (se completa con la expresión estadística correspondiente a la hipótesis alternativa)”



Al escribir la decisión y la conclusión recuerde que:

1) la decisión se toma sobre H0,

2) conclusión es una afirmación acerca de la confirmación, o no, del argumento de H1.

Esto es consistente con la “actitud” de todo el procedimiento de la prueba de hipótesis. La hipótesis nula es la afirmación que está “en juicio”, y por tanto la decisión debe versar sobre ella. El argumento de la hipótesis alternativa es el pensamiento que ocasionó hacer la prueba (hipótesis de investigación o de trabajo). En consecuencia, al escribir la conclusión debe contestarse la cuestión que condujo a la hipótesis alternativa.

PASOS DE LA PRUEBA DE HIPÓTESIS

Paso 1: Plantear el problema

a. Identificar el parámetro poblacional de interés b. Establecer la hipótesis científica c. Establecer las hipótesis estadísticas (hipótesis nula H0 e hipótesis alternativa H1)

Paso 2: Especificar los criterio de prueba

a. Comprobar los supuestos de la prueba b. Elegir el nivel de significancia c. Identificar la distribución de probabilidad y elegir el estadígrafo de prueba a utilizar d. Determinar la regla de decisión: valor(es) crítico(s) y las regiones de aceptación y de

rechazo Paso 3: Recolectar y presentar la evidencia muestral

a. Recolectar la información muestral b. Calcular el valor del estadígrafo de prueba muestral

Paso 4: Tomar la decisión

a. Comparar el valor crítico con el valor muestral b. Tomar la decisión estadística

Paso 5: Dar las conclusiones

a. Escribir la conclusión estadística. b. Escribir la conclusión en términos del problema.

Finalmente, antes de entrar en las diferentes aplicaciones de pruebas de hipótesis,

complementaremos la descripción de las hipótesis: 1. La hipótesis nula especifica un valor particular de un parámetro de la población. Por ejemplo,

el parámetro proporción, H0: π = 0,5. 2. La hipótesis alternativa puede asumir tres formas. Cada una de ellas determinará una

ubicación específica de la(s) región(es) crítica(s), como se muestra en el cuadro 11.3. 3. Para muchas pruebas de hipótesis, el signo de H1 “apunta” en la dirección que está localizada

la región crítica. (Piense en el signo de desigualdad como si fuese al mismo tiempo menor que y mayor que, apuntando así ambas direcciones.)

Cuadro 11.4: Clases de pruebas de hipótesis de acuerdo a en la hipótesis alternativa

5.0:1 <πH 5.0:1 ≠πH 5.0:1 >πH

Región Crítica

Una región del lado izquierdo

Prueba de una cola o unilateral a la izquierda

Dos regiones, la mitad de cada lado

Prueba de dos colas o bilateral

Una región del lado derecho

Prueba de una cola o unilateral a la derecha

Diagrama ilustrativo de las áreas de la distribución de probabilidad del estadígrafo en el muestreo

α α−1 αα−12/α α−1 2/α

Cátedra de Cálculo

1111..33.. PPRRUUEEBBAA DDEE HH

1111..33..11.. CCaassoo:: mmuuPodemos aplicar la prueba para muestras grandes para una hipótesis acerca de una media

poblacional. El parámetro

x , y la desviación estándar

los primeros pasos de la prueba en el sigu

Ejemplo 11.1. Una planta química local ha producido un promedio diario de 880 toneladas de un

producto químico durante los últimos años. A la gerente de control de calidad le gustaría saber si este promedio ha cambiado en los meses rec

el promedio y desviación estándar de los n=50 producciones con

Pruebe la hipótesis apropiada con

Solución 1º) Hipótesis estadísticas

2º) Nivel de significancia �3ª) Estadígrafo de prueba:

Como se desconoce la varianza poblacional, la desviación estándar poblacional la desviación estándar muestral con buena aproximación, ya que

4º) Regla de decisión

5º) Cálculo: Al usar s para aproximar

Prueba estadística para 1. 1. Planteo de Hipótesis

a) Hipótesis científicab) Hipótesis estadísticas

Hipótesis nula:

Hipótesis Alternativa:

2. Nivel de significancia:

3. Estadígrafo de prueba:

Supuesto: Las n observaciones en la muestra se seleccionaron al azar de la población y n es grande, es

decir 30≥n .

4. Regla de decisión: rechazo la H

O cuando el valor α<p

%��

culo Estadístico y Biometría – Facultad de Cien

HHIIPPÓÓTTEESSIISS PPAARRAA UUNNAA MMEEDD

uueessttrraa ggrraannddee Podemos aplicar la prueba para muestras grandes para una hipótesis acerca de una media

poblacional. El parámetro θ que se desea probar es µ , cuyo

, y la desviación estándar θ

σ ˆ de la distribución muestral de

prueba en el siguiente recuadro

Una planta química local ha producido un promedio diario de 880 toneladas de unproducto químico durante los últimos años. A la gerente de control de calidad le gustaría saber si este promedio ha cambiado en los meses recientes. Selecciona al azar 50 días de la base de datos y calcula

el promedio y desviación estándar de los n=50 producciones con

Pruebe la hipótesis apropiada con 05,0=α .

estadísticas: !:( = 880 +:( , 880 � = 0,05

3ª) Estadígrafo de prueba: La estimación puntual para µ es �.

xxz

x σσ

µ0 =−

=

Como se desconoce la varianza poblacional, la desviación estándar poblacional la desviación estándar muestral con buena aproximación, ya que

Valor crítico de z �!,!/0 = −1,96 y �!,340 = 1Se rechaza la hipótesis nula si

σ , se obtiene

Prueba estadística para µ en una muestra grande

Hipótesis científica b) Hipótesis estadísticas

Hipótesis nula: 00 : µµ =H

Hipótesis Alternativa: Prueba de una cola Prueba de dos colas

) H (o

01

01

µµ

µµ

<

>

:

:H H

Nivel de significancia: α

. Estadígrafo de prueba: n

xxz

x σ

µ

σ

µ 00 −

=−

=

as n observaciones en la muestra se seleccionaron al azar de la población y n es grande, es

Regla de decisión: rechazo la H0 cuando Prueba de una cola Prueba de dos colas

) H

cuando bien (o

01 µµ

α

α

<

−<

>

:

zz

zz

/2zz α>

α

%��


iencias Agrarias – UNCUYO / Ciclo 2015

DDIIAA PPOOBBLLAACCIIOONNAALL

Podemos aplicar la prueba para muestras grandes para una hipótesis acerca de una media

cuyo estimador puntual θ es la media muestral

de la distribución muestral de x es nσ . Se indica un resumen de

Una planta química local ha producido un promedio diario de 880 toneladas de unproducto químico durante los últimos años. A la gerente de control de calidad le gustaría saber si este

ientes. Selecciona al azar 50 días de la base de datos y calcula

el promedio y desviación estándar de los n=50 producciones con tx 871= y s=21t, respectivamente.

. Entonces,

n

x

σ

µ0−

Como se desconoce la varianza poblacional, la desviación estándar poblacional se estima con la desviación estándar muestral con buena aproximación, ya que " 5 30.

1,96

Se rechaza la hipótesis nula si �!,!/0 7 � 7 �!,340

Prueba de dos colas

01H µµ ≠:


Prueba de dos colas

/2zzbien o α−<

%��


181

Podemos aplicar la prueba para muestras grandes para una hipótesis acerca de una media

es la media muestral

. Se indica un resumen de

Una planta química local ha producido un promedio diario de 880 toneladas de un producto químico durante los últimos años. A la gerente de control de calidad le gustaría saber si este

ientes. Selecciona al azar 50 días de la base de datos y calcula

y s=21t, respectivamente.

se estima con


Cátedra de Cálculo Es

6º) Decisión Para 05,0=α , la región de rechazo se compone de los valores de z>1.96 y z<

muestral calculado con el estadígrafo de prueba z, es igual a rechazo, por lo que se rechaza la hipótesis nula de igualdad de la media 7º) Conclusión La muestra aporta evidencia suficientede producción para un producto químico es Se puede decir, con un nivel de significancia de 0,05, que la produccióncambiado.

1111..33..22.. CCaassoo:: mmuueesstt Al igual que en el ca

siguiente recuadro

Ejemplo 11.2. Un nuevo proceso para producir diamantes sintéticos sólo puede funcionar a un nivel rentable si el peso promedio de los diamantes que se obtengla rentabilidad del proceso se generan seis diamantes cuyos pesos son 0,460,54 quilates. ¿Las seis mediciones proporcionan suficiente evidencia de que el peso promedio de los diamantes que se obtienen con este proceso sobrepasa los 0,5 quilates?1º) Hipótesis estadísticas: !: ( = 0,589�� :�# +:( > 0,589�� :�# 2º) Nivel de significancia � =3º) Estadígrafo de prueba: Se supone que la población de la cual provienen los pesos de los diamantes sigue una distribución normal y se desconoce la desviac

Donde n -1 = 5 grados de libertad



Hipótesis nula:

Hipótesis Alternativa:Prueba de una cola

2. Nivel de significancia: α

3. Estadígrafo de prueba: t

Supuesto: la muestra es seleccionada al azar de una población normalmente distribuida. 4. Regla de decisión: rechazo la H

Prueba de una cola

H

(o

>t

O cuando el valor de α<p

Los valores críticos de t, αt

en la tabla de distribución de Student.


Estadístico y Biometría – Facultad de Ciencias

5021

880871 0 −

=−

=ns

xz

µ

, la región de rechazo se compone de los valores de z>1.96 y z<

muestral calculado con el estadígrafo de prueba z, es igual a se rechaza la hipótesis nula de igualdad de la media

La muestra aporta evidencia suficiente, para un nivel de significanciae producción para un producto químico es distinto a 880 toneladas

Se puede decir, con un nivel de significancia de 0,05, que la producción

ttrraa ppeeqquueeññaa ccoonn vvaarriiaannzzaa ppo

Al igual que en el caso anterior, se indica un resumen de l

Un nuevo proceso para producir diamantes sintéticos sólo puede funcionar a un nivel rentable si el peso promedio de los diamantes que se obtengan es mayor que 0,5 quilates. Para evaluar la rentabilidad del proceso se generan seis diamantes cuyos pesos son 0,46

as seis mediciones proporcionan suficiente evidencia de que el peso promedio de los ue se obtienen con este proceso sobrepasa los 0,5 quilates?

= 0,05 º) Estadígrafo de prueba: Se supone que la población de la cual provienen los pesos de los diamantes

sigue una distribución normal y se desconoce la desviación estándar poblacional. Entonces

: = � − (# √"⁄ ↝ >�:; 0; 1; " − 15 grados de libertad

Prueba estadística para µ en una muestra pequeña

científica b) Hipótesis estadísticas

Hipótesis nula: 00 : µµ =H


) H (o

01

01

µµ

µµ

<

>

:

:H 1H µ:

ns

x 0µ−=

: la muestra es seleccionada al azar de una población normalmente distribuida.

. Regla de decisión: rechazo la H0 cuando Prueba de una cola Prueba de dos colas

) H

cuando bien t (o

01 µµ

α

α

<

−<

>

:

t

t

/2 bien t o t αt>

α

y 2/αt se basa en (n-1) grados de libertad. Estos valores tabulados se encuentran

en la tabla de distribución de Student.

%�:� %�:


182ias Agrarias – UNCUYO / Ciclo 2015

03.3−=

, la región de rechazo se compone de los valores de z>1.96 y z<-1.96. Como el valor

muestral calculado con el estadígrafo de prueba z, es igual a –3.03, este valor cae en la región de se rechaza la hipótesis nula de igualdad de la media a un valor determinado.

ra un nivel de significancia de 0,05, para decir que el promedio 880 toneladas.

Se puede decir, con un nivel de significancia de 0,05, que la producción del producto químico

poobbllaacciioonnaall ddeessccoonnoocciiddaa

e indica un resumen de los primeros pasos de la prueba en el

Un nuevo proceso para producir diamantes sintéticos sólo puede funcionar a un nivel an es mayor que 0,5 quilates. Para evaluar

la rentabilidad del proceso se generan seis diamantes cuyos pesos son 0,46; 0,61; 0,52; 0,48; 0,57 y as seis mediciones proporcionan suficiente evidencia de que el peso promedio de los

ue se obtienen con este proceso sobrepasa los 0,5 quilates?

º) Estadígrafo de prueba: Se supone que la población de la cual provienen los pesos de los diamantes ión estándar poblacional. Entonces

1�

Prueba de dos colas

0µµ ≠

: la muestra es seleccionada al azar de una población normalmente distribuida.

Prueba de dos colas

/2bien t αt−<

1) grados de libertad. Estos valores tabulados se encuentran

:�


182

1.96. Como el valor

en la región de

el promedio

del producto químico ha

prueba en el

Un nuevo proceso para producir diamantes sintéticos sólo puede funcionar a un nivel an es mayor que 0,5 quilates. Para evaluar

0,57 y as seis mediciones proporcionan suficiente evidencia de que el peso promedio de los

º) Estadígrafo de prueba: Se supone que la población de la cual provienen los pesos de los diamantes

1) grados de libertad. Estos valores tabulados se encuentran



5º) Cálculos

Y el estadígrafo de prueba es un estadístico t con (ncalculadora usted puede verificar que la media y la desviación estándar de los seis pesos del diamante son 0,53 y 0,0559, respectivamente. El valor calculado del est

6º) Decisión Al igual que con las pruebas para muestras grandes, el estadígrafo de prueba proporciona la

evidencia para rechazar o aceptar HSi se elige un nivel de significancia de 5% (

distribución de Student para determinar la región de rechazo en la cola derecha. Como el valor muestral del estadígrafo de prueba H0. Los datos no proporcionan evidencia suficiente de que el peso promedio de los diamantes sea mayor que 0,5 quilates.

Gráfico 11.3: Región de Rechazo de la hi

“Bajo un nivel de significancia del 5% no se rechaza la hipótesis nula por ser 7º) Conclusión

La muestra no aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que peso promedio de los diamantes obtenidos por el nuevo procedimiento es mayor que 0,05 quilates.

Ejemplo 11.3. Se diseñó un nuevo sistema para el control del inventario de un pequeño fabricante, con el propósito de reducir el mismo a menos de 3000 motorinventario en reserva al final de cada uno de ocho días, seleccionados aleatoriamente; los resultados se muestran en la siguiente tabla. ¿Con los datos hay evidencia suficiente que señale que el promedio del número diario de motores en el inventario es menor que 3000?

1º) Hipótesis estadísticas

2º) Nivel de significancia

3º) Estadígrafo de prueba


5º) Cálculos Puede verificarse que la media y la desviación estándar muestral para las n=8 mediciones de la

tabla, son 75.2858=µ y

%�:�

2,015

0,05

tc=-1,895

%�:�


Valor crítico de t :!,340;0@A = 2,015

Se rechaza la hipótesis nula si

stadígrafo de prueba es un estadístico t con (ncalculadora usted puede verificar que la media y la desviación estándar de los seis pesos del diamante son 0,53 y 0,0559, respectivamente. El valor calculado del estadígrafo de prueba es entonces

60559.0

5.053.0 0 −

=−

=ns

xt

µ

Al igual que con las pruebas para muestras grandes, el estadígrafo de prueba proporciona la evidencia para rechazar o aceptar H0 dependiendo de qué tan lejos quede t del centro de la distrSi se elige un nivel de significancia de 5% (α =0,05), debe utilizar los valores críticos de t de la tabla de

distribución de Student para determinar la región de rechazo en la cola derecha. Como el valor muestral fo de prueba (1,32), no cae en la región de rechazo

. Los datos no proporcionan evidencia suficiente de que el peso promedio de los diamantes sea mayor

Gráfico 11.3: Región de Rechazo de la hipótesis nula para el ejemplo 11.2.

“Bajo un nivel de significancia del 5% no se rechaza la hipótesis nula por ser

La muestra no aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que peso promedio de los diamantes obtenidos por el nuevo procedimiento es mayor que 0,05 quilates.

Se diseñó un nuevo sistema para el control del inventario de un pequeño fabricante, con el propósito de reducir el mismo a menos de 3000 motores por día. Se llevó a cabo un muestreo del inventario en reserva al final de cada uno de ocho días, seleccionados aleatoriamente; los resultados se muestran en la siguiente tabla. ¿Con los datos hay evidencia suficiente que señale que el promedio del

ro diario de motores en el inventario es menor que 3000?Número de motores

2905 2895 2725 3005 2835 2835 3065 2605

Hipótesis estadísticas

3000

3000

1

0

<

=

µ

µ

:

:

H

H

Nivel de significancia 050,=α

Estadígrafo de prueba ns

xt

µ−=

Si tenemos un 05,0=α y se coloca 0,05 en la cola inferior de la distribución

t, obtenemos el valor crítico para n=8 mediciones (o bien n

libertad) como 895,1−=ct . Por lo tanto se rechazará la H

Puede verificarse que la media y la desviación estándar muestral para las n=8 mediciones de la

y 77.146=s . Sustituyendo los valores

877.146

300075.2858 −=

−=

ns

xt

µ

%�:�



Se rechaza la hipótesis nula si : 7 :!,340;0@A stadígrafo de prueba es un estadístico t con (n-1) = (6-1) = 5 grados de libertad. Con su

calculadora usted puede verificar que la media y la desviación estándar de los seis pesos del diamante adígrafo de prueba es entonces

32,16

=

Al igual que con las pruebas para muestras grandes, el estadígrafo de prueba proporciona la dependiendo de qué tan lejos quede t del centro de la distribución.

=0,05), debe utilizar los valores críticos de t de la tabla de

distribución de Student para determinar la región de rechazo en la cola derecha. Como el valor muestral en la región de rechazo (Gráfico 11.3), no se puede rechazar la


pótesis nula para el ejemplo 11.2.

“Bajo un nivel de significancia del 5% no se rechaza la hipótesis nula por ser : = 1,32 7 :!,340;0@A.” La muestra no aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que

peso promedio de los diamantes obtenidos por el nuevo procedimiento es mayor que 0,05 quilates.

Se diseñó un nuevo sistema para el control del inventario de un pequeño fabricante, con es por día. Se llevó a cabo un muestreo del

inventario en reserva al final de cada uno de ocho días, seleccionados aleatoriamente; los resultados se muestran en la siguiente tabla. ¿Con los datos hay evidencia suficiente que señale que el promedio del

ro diario de motores en el inventario es menor que 3000?

y se coloca 0,05 en la cola inferior de la distribución

t, obtenemos el valor crítico para n=8 mediciones (o bien n – 1 =7 grados de

. Por lo tanto se rechazará la H0 si 895.1−<mt


. Sustituyendo los valores en el estadígrafo de prueba, obtenemos:

72.28

3000−=


183

5 grados de libertad. Con su calculadora usted puede verificar que la media y la desviación estándar de los seis pesos del diamante

Al igual que con las pruebas para muestras grandes, el estadígrafo de prueba proporciona la ibución.

=0,05), debe utilizar los valores críticos de t de la tabla de

distribución de Student para determinar la región de rechazo en la cola derecha. Como el valor muestral , no se puede rechazar la


La muestra no aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que el peso promedio de los diamantes obtenidos por el nuevo procedimiento es mayor que 0,05 quilates.

Se diseñó un nuevo sistema para el control del inventario de un pequeño fabricante, con es por día. Se llevó a cabo un muestreo del

inventario en reserva al final de cada uno de ocho días, seleccionados aleatoriamente; los resultados se muestran en la siguiente tabla. ¿Con los datos hay evidencia suficiente que señale que el promedio del

y se coloca 0,05 en la cola inferior de la distribución

1 =7 grados de

895 .


en el estadígrafo de prueba, obtenemos:


6º) Decisión Ya que el valor observado de t

para rechazar la H0.

7º) Conclusión

La muestra aporta suficientenuevo sistema de control de inventario reduce el número promedio de motores en existencia por día, hasta menos de 3000. Además, habrá confianza razonable en haber tomado la decisión correcta.

Ahora, si los resultados de este ejemplo se quieren dar a conocer, ¿qué valorinforme? El valor-p para esta prueba, es la probabilidad de observar un valor del estadígrafo t por lo menos tan contradictorio a la hipótesis nula como el valor ob

valor de 72.2−≤t . A diferencia de la tabla de las áreas bajo la curva normal, la tabla para la distribución de t no da las áreas correspondientes a varios valores de tcorrespondientes a las áreas de la cola

1111..44.. PPRRUUEEBBAA DDEE HHIIPPOOBBLLAACCIIOONNAALL

1111..44..11.. MMuueessttrraass iinndd

1111..44..11..11.. CCaassoo ddee mmuueesstt

En el recuadro se planteamuestras grandes independientes. Los datos los conformarán dos muestras, una para cada población.

Prueba estadística para �C3. 1. Planteo de Hipótesis


Hipótesis nula:Hipótesis Alternativa:

Prueba de una cola o

2. Nivel de significancia: α3. Estadígrafo de prueba:

Supuesto: las muestras aleatorias e independientes se seleccionan de dos poblaciones y 4. Regla de decisión: rechazo la H

Prueba de una cola

(o

H

z

O cuando el valor- α<p



Ya que el valor observado de t muestral se localiza en la región de rechazo, hay evidencia suficiente

La muestra aporta suficiente evidencia, con un nivel de significancia de 0,05nuevo sistema de control de inventario reduce el número promedio de motores en existencia por día, hasta menos de 3000. Además, habrá confianza razonable en haber tomado la decisión correcta.

si los resultados de este ejemplo se quieren dar a conocer, ¿qué valor

para esta prueba, es la probabilidad de observar un valor del estadígrafo t por lo menos tan contradictorio a la hipótesis nula como el valor observado para este conjunto de datos, a saber, un

. A diferencia de la tabla de las áreas bajo la curva normal, la tabla para la distribución de t no da las áreas correspondientes a varios valores de tcorrespondientes a las áreas de la cola inferior, iguales a 0,10; 0,05; 0,025.

Gráfico 11.4. Valor p para la prueba del ejemplo

IIPPÓÓTTEESSIISS PPAARRAA LLAA DDIIFFEERRLLEESS

ddeeppeennddiieenntteess

ttrraass ggrraannddeess

En el recuadro se plantean los pasos para la prueba de hipótesis muestras grandes independientes. Los datos los conformarán dos muestras, una para cada población.

-2,72

Valor-p

� = ��+ − �/� − DCE − CFGH�IJKIL� = ��+ −MH"

�CE − CF� con muestras grandes


ótesis nula: !:�CE − CF� = N Hipótesis Alternativa:

Prueba de una cola Prueba de dos colas +:�CE − CF� > 0 +:�CE − CF� 7 0 +:�CE

las muestras aleatorias e independientes se seleccionan de dos poblaciones y

. Regla de decisión: rechazo la H0 cuando

Prueba de una cola Prueba de dos colas

) )(:

cuando bien (o

0211 DH

zz

z

<−

−<

>

µµα

α

/2 bien o zz α>



se localiza en la región de rechazo, hay evidencia suficiente

on un nivel de significancia de 0,05, para decir que el nuevo sistema de control de inventario reduce el número promedio de motores en existencia por día, hasta menos de 3000. Además, habrá confianza razonable en haber tomado la decisión correcta.

si los resultados de este ejemplo se quieren dar a conocer, ¿qué valor-p aparecería en el

para esta prueba, es la probabilidad de observar un valor del estadígrafo t por lo menos servado para este conjunto de datos, a saber, un

. A diferencia de la tabla de las áreas bajo la curva normal, la tabla para la distribución de t no da las áreas correspondientes a varios valores de t, sino que proporciona los valores

, iguales a 0,10; 0,05; 0,025.

Valor p para la prueba del ejemplo 11.3

RREENNCCIIAA EENNTTRREE DDOOSS MMEEDDIIAA

a prueba de hipótesis de la diferencia de medias de muestras grandes independientes. Los datos los conformarán dos muestras, una para cada población.

� − �/� − 0MH+/"+ O H/

/"/

Prueba de dos colas

� − CF� , N

las muestras aleatorias e independientes se seleccionan de dos poblaciones y "+ 5 30 y "/ 5 30

Prueba de dos colas

/2zzbien α−<


184

se localiza en la región de rechazo, hay evidencia suficiente

que el nuevo sistema de control de inventario reduce el número promedio de motores en existencia por día,

aparecería en el

para esta prueba, es la probabilidad de observar un valor del estadígrafo t por lo menos servado para este conjunto de datos, a saber, un

. A diferencia de la tabla de las áreas bajo la curva normal, la tabla para la distribución s valores

AASS

la diferencia de medias de muestras grandes independientes. Los datos los conformarán dos muestras, una para cada población.

30


La idea básica es simple. Se calculará la diencuentra alejada de 0, se concluirá que las medias poblacionales son diferentes. Si la diferencia se aproxima a 0, se concluirá que las medias poblacionales podrían ser iguales. Estas características analizarán en el ejemplo 11.4.

Ejemplo 11.4. Una compañía desea comparar las expectativas salariales anuales de su personal de ventas femenino y masculino, según su nuevo plan de compensaciones de ventas más comisión. Se pidió a n1=40 vendedoras y nbajo el nuevo plan. Las medias muestrales y

¿Proporcionan los datos evidencia que indique una diferencia

entre vendedores y vendedoras? Realice la prueba con Solución 1º) Hipótesis

Hipótesis científica: El ingreso anual entre las vendedoras y los vendedores es diferente.Hipótesis estadísticas:

0 : µH

1 : µH

2º) Nivel de significancia: 3º) Estadígrafo de prueba:son aleatorias, grandes e independientesmuestrales #+/ y #// . El estadígrafo de


5º) Cálculo:

6º) Decisión Para 05,0=α , la región de rechazo se compone de los valores de z>1.96 y z<

muestral calculado con el estadígrafo de prueba z, es igual a rechazo, por lo que se rechaza la hip7º) Conclusión Las muestras aportan evidencia suficientediferentes. Se puede decir, con un nivel de significancia de 0,05vendedoras y los vendedores son diferentes bajo el nuevo plan.

1111..44..11..22.. CCaassoo ddee mmuuee

El marco del problema que consideramos ahora es idéntico al que se analizó para una prueba con muestras grandes. Se seleccionan muestras aleatori

poblaciones con medias y varianzas

dos medias de población.La prueba con muestras

se basa en la suposición que ambas poblaciones se distribuyen normalmente y que tienen además

varianzas iguales, es decir,

%��


La idea básica es simple. Se calculará la diferencia de las medias muestrales. Si la diferencia se encuentra alejada de 0, se concluirá que las medias poblacionales son diferentes. Si la diferencia se aproxima a 0, se concluirá que las medias poblacionales podrían ser iguales. Estas características analizarán en el ejemplo 11.4.

Una compañía desea comparar las expectativas salariales anuales de su personal de ventas femenino y masculino, según su nuevo plan de compensaciones de ventas más comisión. Se

=40 vendedoras y n2=40 vendedores, muestreados al azar, predijeran sus ingresos anuales bajo el nuevo plan. Las medias muestrales y las desviaciones muestrales resultaron

2312$

31083$

1

1

=

=

s

x

2569$

29745$

2

2

=

=

s

x

¿Proporcionan los datos evidencia que indique una diferencia

vendedoras? Realice la prueba con α=0.05

Hipótesis científica: El ingreso anual entre las vendedoras y los vendedores es diferente.s:

21 µµ = , es decir, 21 =− µµ

21 µµ ≠ , es decir, D0 ≠ 0.

Nivel de significancia: � = 0,05 Estadígrafo de prueba: Bajo el supuesto de normalidad de ambas poblaciones

son aleatorias, grandes e independientes, se estiman las varianzas poblacionales con las varia. El estadígrafo de prueba tiene distribución normal con

2

2

2

1

2

1

21

nn

Dxxz

σσ+

−−=

)(

Valor crítico de z �!,!/0 = −1,96 y �!,340 = 1Se rechaza la hipótesis nula si

2569

40

2312

2974531083

2

2

2

2

1

2

1

021 ()(

+

−=

+

−−=

nn

Dxxz

σσ

, la región de rechazo se compone de los valores de z>1.96 y z<

muestral calculado con el estadígrafo de prueba z, es igual a se rechaza la hipótesis nula de igualdad de las medias.

Las muestras aportan evidencia suficiente, con un nivel de significancia de 0,05

con un nivel de significancia de 0,05, que las expectativas salarialevendedoras y los vendedores son diferentes bajo el nuevo plan.

eessttrraass ppeeqquueeññaass

El marco del problema que consideramos ahora es idéntico al que se analizó para una prueba con muestras grandes. Se seleccionan muestras aleatorias independientes de n

poblaciones con medias y varianzas µ1, 2

1σ y µ2 ,2

2σ . El objetivo es inferir la dif

dos medias de población. La prueba con muestras pequeñas, en relación con una diferencia entre

se basa en la suposición que ambas poblaciones se distribuyen normalmente y que tienen además

es decir, 22

2

2

1 σσσ == . La prueba se resume en el cuadro sigu



ferencia de las medias muestrales. Si la diferencia se encuentra alejada de 0, se concluirá que las medias poblacionales son diferentes. Si la diferencia se aproxima a 0, se concluirá que las medias poblacionales podrían ser iguales. Estas características


vendedores, muestreados al azar, predijeran sus ingresos anuales las desviaciones muestrales resultaron

2569

29745

¿Proporcionan los datos evidencia que indique una diferencia en el promedio del ingreso anual esperado

5.

Hipótesis científica: El ingreso anual entre las vendedoras y los vendedores es diferente.

00 == D

Bajo el supuesto de normalidad de ambas poblaciones y que las muestras , se estiman las varianzas poblacionales con las varia

prueba tiene distribución normal con ( = 0 y H = 1:

0D

1,96

Se rechaza la hipótesis nula si �!,!/0 7 � 7 �!,340

452

40

2569

029745

2,

)=

−

, la región de rechazo se compone de los valores de z>1.96 y z<-1.96. Como el valor

muestral calculado con el estadígrafo de prueba z, es igual a 2,45, este valor cae en la región de ótesis nula de igualdad de las medias.

con un nivel de significancia de 0,05, de que las medias son

que las expectativas salariales anuales entre las vendedoras y los vendedores son diferentes bajo el nuevo plan.

El marco del problema que consideramos ahora es idéntico al que se analizó para una prueba as independientes de n1 y n2 mediciones de dos

El objetivo es inferir la diferencia ( )21 µµ − entre las

en relación con una diferencia entre medias poblacionales, se basa en la suposición que ambas poblaciones se distribuyen normalmente y que tienen además

. La prueba se resume en el cuadro siguiente.


185

ferencia de las medias muestrales. Si la diferencia se encuentra alejada de 0, se concluirá que las medias poblacionales son diferentes. Si la diferencia se aproxima a 0, se concluirá que las medias poblacionales podrían ser iguales. Estas características se


vendedores, muestreados al azar, predijeran sus ingresos anuales

en el promedio del ingreso anual esperado

las muestras , se estiman las varianzas poblacionales con las varianzas

1.96. Como el valor

en la región de

de que las medias son

s anuales entre las

El marco del problema que consideramos ahora es idéntico al que se analizó para una prueba mediciones de dos

entre las

medias poblacionales, se basa en la suposición que ambas poblaciones se distribuyen normalmente y que tienen además


Ejemplo 11.5. Se lleva a cabo un experimento para comparar el desgaste de abrasivos de dos materiales laminados. Se prueban 12 piezas del material 1 y 10 piezas del material 2 exponiéndolas a una máquina para medir el desgaste. La muestra d85 unidades con una desviación estándar muestral de 4; en tanto que la muestra del material 2 tiene un desgaste promedio de 81 y una desviación estándar muestral de 5. ¿Podríamos concluir, con un nivel designificancia de 0,05, que el desgaste abrasivo del material 1 excede al del material 2? Suponga que las poblaciones son aproximadamente normales y con varianzas iguales. Solución 1º) Hipótesis

Hipótesis científica: “El material laminado 1 tiene un desgalaminado 2”

Hipótesis estadísticas:

10 : µ =H

11 µ >:H

2º) Nivel de significancia: � = 3º) Estadígrafo de prueba

Siendo:

Prueba estadística para �C4. 1. Planteo de Hipótesis



Prueba de una cola + o +



Donde

Supuesto: las muestras aleatorias e independientes se seleccionan de dos poblaciones normalmente distribuidas. Las varianzas poblacionales son iguales.

4. Regla de decisión: rechazo

Prueba de una cola

(o

H

t >




Se lleva a cabo un experimento para comparar el desgaste de abrasivos de dos materiales laminados. Se prueban 12 piezas del material 1 y 10 piezas del material 2 exponiéndolas a una máquina para medir el desgaste. La muestra del material 1 da un desgaste promedio codificado de 85 unidades con una desviación estándar muestral de 4; en tanto que la muestra del material 2 tiene un desgaste promedio de 81 y una desviación estándar muestral de 5. ¿Podríamos concluir, con un nivel designificancia de 0,05, que el desgaste abrasivo del material 1 excede al del material 2? Suponga que las poblaciones son aproximadamente normales y con varianzas iguales.

El material laminado 1 tiene un desgalaminado 2”

Hipótesis estadísticas:

2µ= , es decir, 21 =− Dµµ

2µ> , es decir, D0 > 0.

= 0,05

: = ��+ − �/� − DCE − CFG#PQ 1"+ O 1"/= ��+ −#PQ"

#P = M�"+ − 1�#+/ O �"/ − 1�"+ O "/ − 2

: = ��+ − �/� − DCE − CFG#PQ 1"+ O 1"/= ��+ −#PQ"

#P = M�"+ − 1�#+/ O �"/ − 1�"+ O "/ − 2

�CE − CF� con muestras pequeñas


Hipótesis nula: !:�CE − CF� = N Hipótesis Alternativa:


+:�CE − CF� > 0 +:�CE − CF� 7 0

+:�CE −

las muestras aleatorias e independientes se seleccionan de dos poblaciones normalmente distribuidas. Las varianzas poblacionales son iguales.



)

cuando bien t (o

0211 DH

t

t

<−

−<

>

)(: µµ

α

α

/2 bien t o t αt>

�" O " − 2�



Se lleva a cabo un experimento para comparar el desgaste de abrasivos de dos materiales laminados. Se prueban 12 piezas del material 1 y 10 piezas del material 2 exponiéndolas a

el material 1 da un desgaste promedio codificado de 85 unidades con una desviación estándar muestral de 4; en tanto que la muestra del material 2 tiene un desgaste promedio de 81 y una desviación estándar muestral de 5. ¿Podríamos concluir, con un nivel designificancia de 0,05, que el desgaste abrasivo del material 1 excede al del material 2? Suponga que las poblaciones son aproximadamente normales y con varianzas iguales.

El material laminado 1 tiene un desgaste abrasivo mayor que el del material

00 =D

� − �/� − 0Q 1"+ O 1"/

�#//

� − �/� − 0Q 1"+ O 1"/

�#//

Prueba de dos colas

� − CF� , N

las muestras aleatorias e independientes se seleccionan de dos poblaciones normalmente

Prueba de dos colas

/2bien t αt−<


186

Se lleva a cabo un experimento para comparar el desgaste de abrasivos de dos materiales laminados. Se prueban 12 piezas del material 1 y 10 piezas del material 2 exponiéndolas a

el material 1 da un desgaste promedio codificado de 85 unidades con una desviación estándar muestral de 4; en tanto que la muestra del material 2 tiene un desgaste promedio de 81 y una desviación estándar muestral de 5. ¿Podríamos concluir, con un nivel de significancia de 0,05, que el desgaste abrasivo del material 1 excede al del material 2? Suponga que las

ste abrasivo mayor que el del material

las muestras aleatorias e independientes se seleccionan de dos poblaciones normalmente



5º) Cálculos

#P = M�"+ − 1�#+/ O �"/ − 1�#//"+ O "/ − 2 =

: = ��+ − �/� − DCE − CFG#PQ 1"+ O 1"/= �4

6º) Decisión Con un nivel de significanciaabrasivo de los dos materiales son iguales. 7º) Conclusión La muestra aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que el desgabrasivo medio del material laminado 1 es mayor que

1111..44..22.. MMuueessttrraass ppLos procedimientos

basan en la relación que hay entre dos conjuntos de datos muestrales, provenientes cada uno de poblaciones distintas. Cuaparearse como resultado de la aplicación de estudios denominados “antes y después”, de una misma unidad de análisis o de la correspondencia efectuada entre dos objetos semejantes entre síobtener “pares correspondientes”. Los datos que integran las parejas se comparan directamente entre sí, usando la diferencia de sus valores numéricos. La diferencia resultante se denomina pareada �S = TE − TF�. El inicio de l

%�:�

1,725




o 2. Nivel de significancia:


Donde n es el número de diferencias por parejas y diferencia. Supuesto: con distribución normal.


O cuando el valor de <p

Los valores críticos de t,

encuentran en la tabla de distribución de Student.


Valor crítico de t, para � = 0,05:!,30;/! = 1,725


= M�12 − 1�4/ O �10 − 1�5/12 O 10 − 2 = M�11��16� O �920G �85 − 81� − 0

4,48Q 112 O 110= 44,48Q1160

= 4�4,48��0,43� =

significancia de 0,05, se rechaza la hipótesiabrasivo de los dos materiales son iguales.

La muestra aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que el desgabrasivo medio del material laminado 1 es mayor que el del material laminado 2

ppaarreeaaddaass Los procedimientos mencionados precedentemente para comparar dos medias poblacionales se

basan en la relación que hay entre dos conjuntos de datos muestrales, provenientes cada uno de poblaciones distintas. Cuando están implicadas muestras apareadas implica que los datos pueden parearse como resultado de la aplicación de estudios denominados “antes y después”, de una misma unidad de análisis o de la correspondencia efectuada entre dos objetos semejantes entre síobtener “pares correspondientes”. Los datos que integran las parejas se comparan directamente entre sí, usando la diferencia de sus valores numéricos. La diferencia resultante se denomina � El inicio de la prueba se resume en el cuadro siguiente

: = � − (V#VW = � − (V#V √"X = �#VX

Prueba estadística para CS con muestras pequeñas


Hipótesis nula: !:(V = N Hipótesis Alternativa:

Prueba de una cola Prueba de dos colas +:CS > 0 o +:CS 7 0

+α

. Estadígrafo de prueba:

n es el número de diferencias por parejas y #VW es el error típico de la variable promedio de la : se seleccionan aleatoriamente las n diferencias por parejas de

con distribución normal.



)

cuando bien t (o

0211 DH

t

tt

<−

−<

>

)(: µµ

α

α

/2t αt>

α<

Los valores críticos de t, :Y y :Y /⁄ se basa en �" − 1� grados de libertad. Estos valores tabulados se

encuentran en la tabla de distribución de Student.

%�:� %



05 y �"+ O "/ − 2� = 12 O 10 − 2 = 20 Se rechaza la hipótesis nula si : 7 :!,30;/!

�9��25� = M40120 = Z20,05 = [, [\

� = 41,926 = F, N]

de 0,05, se rechaza la hipótesis nula de que las medias del desgaste

La muestra aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que el desgdel material laminado 2.

para comparar dos medias poblacionales se basan en la relación que hay entre dos conjuntos de datos muestrales, provenientes cada uno de

ndo están implicadas muestras apareadas implica que los datos pueden parearse como resultado de la aplicación de estudios denominados “antes y después”, de una misma unidad de análisis o de la correspondencia efectuada entre dos objetos semejantes entre sí, a fin de obtener “pares correspondientes”. Los datos que integran las parejas se comparan directamente entre sí, usando la diferencia de sus valores numéricos. La diferencia resultante se denomina diferencia

e resume en el cuadro siguiente

�√"X

Prueba de dos colas

+:CS , N

es el error típico de la variable promedio de la se seleccionan aleatoriamente las n diferencias por parejas de una población

Prueba de dos colas

/2bien t o αt−<

grados de libertad. Estos valores tabulados se

%�:�


187

s nula de que las medias del desgaste

La muestra aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que el desgaste

para comparar dos medias poblacionales se basan en la relación que hay entre dos conjuntos de datos muestrales, provenientes cada uno de

ndo están implicadas muestras apareadas implica que los datos pueden parearse como resultado de la aplicación de estudios denominados “antes y después”, de una misma

a fin de obtener “pares correspondientes”. Los datos que integran las parejas se comparan directamente entre

diferencia

es el error típico de la variable promedio de la una población

grados de libertad. Estos valores tabulados se


Ejemplo 11.6. Un fabricante quiere neumáticos, A y B, para los automóviles. neumático de tipo A y el otro tipo B a 6 automóviles y se montaron las ruedas traseras de dichos vehículos. Luego de un número especificado de kilómetros se registró el grado de desgaste para cada par de neumáticos. Estas mediciones suficiente para indicar una diferencia en el

Debido a que los automóviles, conductores y condiciones son los mismos para cada neumático de un conjunto de datos pareados, tiene sentido utilizar una tercera variable, la diferencia pareada muestras dependientes de datos se combinarán en un conjunto de valores

1º) Hipótesis Hipótesis científica: “No hay diferencia en el desgaste de los neumáticos A y B” Hipótesis estadística:

2º) Nivel de significancia � = 3º) Estadígrafo de prueba


5º) Cálculo del estadígrafo de pruebaLos estadígrafos muestrales necesarios son: la media de las diferencias y la desviación estándar de las diferencias. Entonces:

El estadígrafo de prueba resulta

6º) Decisión Con un nivel de significancia 7º) Conclusión La muestra aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que los neumáticos A y B tienen desgastes diferentes bajo las mismas condiciones de uso.

%�:�

-2,571 2,571



Un fabricante quiere comparar la resistencia al desgaste de dos tipos diferentes de neumáticos, A y B, para los automóviles. Para hacer la comparación, se asignneumático de tipo A y el otro tipo B a 6 automóviles y se montaron las ruedas traseras de dichos vehículos. Luego de un número especificado de kilómetros se registró el grado de desgaste para cada par de neumáticos. Estas mediciones se encuentran en la tabla 11.3. ¿Presentan los datos evidencia suficiente para indicar una diferencia en el desgaste promedio de los dos tipos de neumáticos?

Tabla 11.3. Datos de desgaste de los neumáticos

Automóvil Neumático A Neumático B

1 125 2 64 3 94 4 38 5 90 6 106

Debido a que los automóviles, conductores y condiciones son los mismos para cada neumático de un conjunto de datos pareados, tiene sentido utilizar una tercera variable, la diferencia pareada

ras dependientes de datos se combinarán en un conjunto de valores

Automóvil � = � −1 8 2 1 3 9 4 -1 5 12 6 9

Hipótesis científica: “No hay diferencia en el desgaste de los neumáticos A y B”ca: !:(V = N +:CS , N = 0,05

: = � − (V#VW = � − (V#V √"X = � −#V √XValor crítico de t para � 2⁄ = 0,025:!,!/0 = −2,571 y :!,340 = 2,571

Se rechaza la hipótesis nula si :!

5º) Cálculo del estadígrafo de prueba Los estadígrafos muestrales necesarios son: la media de las diferencias y la desviación estándar de las

� = ∑�" = 386 = 6,33

#V = M∑D�_ − �G/" − 1 = Z26,27 =El estadígrafo de prueba resulta

: = � − (V#V √"X = 6,33 − 05,13 √6` = a, NF

Con un nivel de significancia � = 0,05, se rechaza la hipótesis nula.

La muestra aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que los neumáticos A y B tienen desgastes diferentes bajo las mismas condiciones de uso.



comparar la resistencia al desgaste de dos tipos diferentes de hacer la comparación, se asignaron aleatoriamente un

neumático de tipo A y el otro tipo B a 6 automóviles y se montaron las ruedas traseras de dichos vehículos. Luego de un número especificado de kilómetros se registró el grado de desgaste para cada

se encuentran en la tabla 11.3. ¿Presentan los datos evidencia promedio de los dos tipos de neumáticos?

Tabla 11.3. Datos de desgaste de los neumáticos

Neumático B

133 65 103 37 102 115

Debido a que los automóviles, conductores y condiciones son los mismos para cada neumático de un conjunto de datos pareados, tiene sentido utilizar una tercera variable, la diferencia pareada S. Las dos

ras dependientes de datos se combinarán en un conjunto de valores �, donde � = � − b.

b

Hipótesis científica: “No hay diferencia en el desgaste de los neumáticos A y B”

0√"X

025 y c = 6 − 1 = 5

!,!/0 7 : 7 :!,340

Los estadígrafos muestrales necesarios son: la media de las diferencias y la desviación estándar de las

= 5,13

NF

aza la hipótesis nula.

La muestra aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que los neumáticos A y B tienen desgastes diferentes bajo las mismas condiciones de uso.


188

comparar la resistencia al desgaste de dos tipos diferentes de aron aleatoriamente un

neumático de tipo A y el otro tipo B a 6 automóviles y se montaron las ruedas traseras de dichos vehículos. Luego de un número especificado de kilómetros se registró el grado de desgaste para cada

se encuentran en la tabla 11.3. ¿Presentan los datos evidencia

Debido a que los automóviles, conductores y condiciones son los mismos para cada neumático de un Las dos

Los estadígrafos muestrales necesarios son: la media de las diferencias y la desviación estándar de las

La muestra aporta evidencia suficiente, con un nivel de significancia de 0,05, para decir que los



1111..55.. PPRRUUEEBBAASS DDEE HHIIPPÓÓTTEESSIISS PPAARRAA UUNNAA PPRROOPPOORRCCIIÓÓNN PPOOBBLLAACCIIOONNAALL Varios de los métodos utilizados en la inspección muestral, en el control de la calidad y en la verificación de confiabilidad se fundamentan en pruebas de la hipótesis nula de que una proporción es igual a una constante determinada. Pueden aplicarse pruebas exactas con base en la distribución binomial, pero se considerarán aquí las pruebas aproximadas para grandes muestras que se basan en la aproximación normal a la distribución binomial.

1111..55..11.. PPrruueebbaa ddee hhiippóótteessiiss ppaarraa uunn ccoonntteeoo ((xx))

Se probará la hipótesis nula 0ππ = contra una de las alternativas 0ππ < , 0ππ > o 0ππ ≠

mediante la aplicación del estadígrafo, que es un valor de una variable aleatoria, y tiene aproximadamente una distribución normal estándar:

)( ππ

π

σ

µ

−

−=→

−=

1

c

cxz

xz

Ejemplo 11.7. Suponga que un nutricionista afirma que al menos el 75% de los niños de preescolar de cierto país tienen dietas deficientes en proteínas y que un estudio de muestra revela que esto es cierto en 206 niños de una muestra de 300 niños de preescolar. Demuestre la afirmación para el nivel de significancia 0,05. 1º) Hipótesis Hipótesis científica Hipótesis estadísticas:

75,0:0 =πH

7501 ,: <πH

2º) Nivel de significancia: 05,0=α

3º) Estadígrafo de prueba:

)( ππ

π

−

−=

1

c

cxz


Se rechaza la hipótesis nula si 645.1−<mz , obteniendo el valor de la tabla

de F(z).

5º) Cálculos

[ ]532

250750300

750300206

1 .

),)(,(

),(

)(−=

−=

−

−=

ππ

π

c

cxz

6º) Decisión Como zm=-2.53 es menor que zc=-1.645, se debe rechazar la hipótesis nula.

7º) Conclusión Los datos muestrales aportan evidencia suficiente, a un nivel de significancia de 0,05, para decir que por lo menos el 75% de los niños de preescolar de un país dado tienen dietas deficientes en proteínas.

1111..55..22.. PPrruueebbaa ddee hhiippóótteessiiss ppaarraa uunnaa pprrooppoorrcciióónn ( )π

Cuando se extrae una muestra aleatoria de n ensayos idénticos de una población binomial, la

proporción muestral de tiene una distribución aproximadamente normal si n es grande, con media (fg = d y error típico

Hfg = Md�1 − d��

La hipótesis respecto a que la proporción en la población posee un cierto atributo d, se prueba según la forma general y se formula como:

00 : ππ =H

Contra una alternativa de una o de dos colas

0a0a0 :H bien, o :H bien, o : ππππππ ≠<>aH

0,05

zc= -1,645

%��


El estadígrafo de prueba se construye usando

verdadera π . La proporción muestral

hipotéticos, para formar un estadímuestra grande.

Ejemplo 11.7. Según información recientede todas las edades. En el año 2002 se reportó que 1276 de una muestra de 4115 adultos fueron encontrados obesos (índice corporal mayor a 30). Una encuesta realizada 4 años antes reveló que el 20% de los adultos encuestados sproporción verdadera de adultos obesos es más de 1,5 veces el porcentaje de la encuesta? Tome en cuenta un nivel de significancia de 0,10. 1º) Hipótesis Hipótesis científica Hipótesis estadísticas:

0 : πH

1 :πH

2º) Nivel de significancia: α



Prueba estadística para π6. 1. Planteo de Hipótesis


Hipótesis nula:

Hipótesis Alternativa:Prueba de una cola



donde de = Ih

Supuesto: El muestreo satisface los supuestos

la distribución muestral de de). 4. Regla de decisión: rechazo la H

Prueba de una cola

H

(o

>z


0,05

zc= -1,645

0,10

zc= 1,28

%��



El estadígrafo de prueba se construye usando p , el mejor estimador de la proporción poblacional

a proporción muestral p se estandariza, por medio de la media y el error estándar

hipotéticos, para formar un estadígrafo de prueba z. A continuación se resume esta prueba para una

Según información reciente, la obesidad es un problema de todas las edades. En el año 2002 se reportó que 1276 de una muestra de 4115 adultos fueron

(índice corporal mayor a 30). Una encuesta realizada 4 años antes reveló que el 20% de los adultos encuestados se consideraron obesos. ¿Sugieren los datos más recientes que la proporción verdadera de adultos obesos es más de 1,5 veces el porcentaje de la encuesta? Tome en cuenta un nivel de significancia de 0,10.

ísticas:

300,=π

300,>π

100,=

i = de − dZd�1 − d� �⁄

Se rechaza la hipótesis nula si mz

de F(z).

i = de − dZd�1 − d� �⁄

π en una muestra grande


Hipótesis nula: 00 : ππ =H


) H (o

01

01

ππ

ππ

<

>

:

:H 1H π:

: El muestreo satisface los supuestos de un experimento binomial y n es bastante grande para que de se puede aproximar mediante una distribución normal (


) :H

cuando bien

0a ππα

α

<

−<

>

zz

z

/2 bien o zz α>

α %�� %��



, el mejor estimador de la proporción poblacional

se estandariza, por medio de la media y el error estándar

de prueba z. A continuación se resume esta prueba para una

la obesidad es un problema creciente en el país en grupos de todas las edades. En el año 2002 se reportó que 1276 de una muestra de 4115 adultos fueron

(índice corporal mayor a 30). Una encuesta realizada 4 años antes reveló que el e consideraron obesos. ¿Sugieren los datos más recientes que la

proporción verdadera de adultos obesos es más de 1,5 veces el porcentaje de la encuesta? Tome en

281,>m , obteniendo el valor de la tabla

Prueba de dos colas

0ππ ≠

de un experimento binomial y n es bastante grande para que

se puede aproximar mediante una distribución normal ( 50 >πc y 51 0 >− )( πc

Prueba de dos colas

/2zzbien α−<

�


190

, el mejor estimador de la proporción poblacional

se estandariza, por medio de la media y el error estándar

de prueba z. A continuación se resume esta prueba para una

creciente en el país en grupos de todas las edades. En el año 2002 se reportó que 1276 de una muestra de 4115 adultos fueron

(índice corporal mayor a 30). Una encuesta realizada 4 años antes reveló que el e consideraron obesos. ¿Sugieren los datos más recientes que la

proporción verdadera de adultos obesos es más de 1,5 veces el porcentaje de la encuesta? Tome en

el valor de la tabla

de un experimento binomial y n es bastante grande para que

5



5º) Cálculos

de = �" = 12764115 = 0,31

� = de − dZd�1 − d� �⁄ = 0,31 − 0,30

Q�0,30��0,70�4115= 0,0100,0071 = E, [N

6º) Decisión

Como zm=1,40 es mayor a 1,28 se rechaza la hipótesis nula. 7º) Conclusión Los datos muestrales aportan evidencia suficiente, a un nivel de significancia de 0,10, para decir que la proporción de obesos adultos que resultó en el informe es mayor al 30%, es decir que ha aumentado más de 1,5 veces la proporción con respecto a los encuestados 4 años antes.

1111..66.. PPRRUUEEBBAASS DDEE HHIIPPÓÓTTEESSIISS PPAARRAA DDOOSS PPRROOPPOORRCCIIOONNEESS

PPOOBBLLAACCIIOONNAALLEESS Existen muchos problemas en los cuales debemos decidir si una diferencia observada entre dos

proporciones de muestra se puede atribuir a la oportunidad o si esto es indicativo de que las proporciones verdaderas correspondientes son desiguales. Por ejemplo, quizás queramos decidir sobre la base de los datos de muestras si en realidad existe una diferencia entre las proporciones de personas a quienes se les aplican vacunas contra la influenza y a quienes no se les aplican, quienes en realidad contraen la enfermedad, o quizás deseemos verificar sobre la base de muestras si dos fabricantes de equipo electrónico envían a las distribuidoras las mismas proporciones de aparatos defectuosos. El método que se aplicará para demostrar si una diferencia observada entre dos proporciones de una muestra se puede atribuir a la oportunidad o si es estadísticamente significativa, se basa en la

teoría siguiente: si 21 y xx son los números de aciertos obtenidos en n1 ensayos de un tipo y n2 de otro,

todos los ensayos son independientes y las probabilidades correspondientes de lograr un acierto son,

respectivamente, 1π y 2π , entonces la distribución de muestreo de 2

2

1

1

n

x

n

x− tiene la media 21 ππ − y la

desviación estándar 2

22

1

11 11

cc

)()( ππππ −+

− Es costumbre referirnos a esta desviación estándar

como el error típico de la diferencia entre dos proporciones.

Cuando se demuestra la hipótesis nula πππ == 21 , contra una hipótesis alternativa adecuada,

la media de la distribución de muestreo de la diferencia entre las dos proporciones de muestra es

21 ππ − =0 y su desviación estándar puede escribirse como

+−

21

111

cc)( ππ donde π suele

estimarse combinando los datos y sustituyendo por π la proporción de muestra combinada

21

21

cc

xx

+

+=π . Siendo así con relación a muestras grandes, la distribución de muestreo de la diferencia

entre dos proporciones se puede calcular muy aproximadamente con una distribución normal, con base en el estadígrafo

+−

−

=

21

2

2

1

1

111

cc

c

x

c

x

z

)ˆ(ˆ ππ

con 21

21

cc

xx

+

+=π


Ejemplo 11.8. Para demostrar la efectividad de un nuevo medicamento que alivia el dolor, a 80 pacientes de una clínica se les dio una pastilla que contiene el medicamento y a otros 80 se les administró un placebo. En el nivel de significancia 0,01, ¿de la droga, si del primer grupo 56 de los pacientes sintieron un efecto benéfico mientras que en el otro grupo, 38 pacientes también sintieron un efecto benéfico? 1º) Hipótesis Hipótesis científica Hipótesis estadísticas

0 :πH

1 π:H

2º) Nivel de significancia: α




Hipótesis nula:

Hipótesis Alterna

2. Nivel de significancia:


(

+−

−=

1

11

1

1

c

z)(

ˆˆ

ππ

ππ

Donde 111 cx /ˆ =π

(utilizado en el error estándar), se estima por

Supuesto: las muestras se seleccionan de una manera aleatoria e independiente en las dos poblaciones binomiales, y n

muestreo de ( 1 pp −

11qn , 22 pn y 2qn


O cuando el valor de



Para demostrar la efectividad de un nuevo medicamento que alivia el dolor, a 80 pacientes de una clínica se les dio una pastilla que contiene el medicamento y a otros 80 se les administró un placebo. En el nivel de significancia 0,01, ¿qué podemos concluir acerca de la efectividad de la droga, si del primer grupo 56 de los pacientes sintieron un efecto benéfico mientras que en el otro grupo, 38 pacientes también sintieron un efecto benéfico?

s estadísticas

21 ππ =

21 ππ >

01,0=

+−

−

=

21

2

2

1

1

111

cc

c

x

c

x

z

)ˆ(ˆ ππ

Prueba estadística para 21 ππ − de dos muestras grandesPlanteo de Hipótesis


Hipótesis nula: 120 : ππ =H o equivalente


0))H (o

0)

211

211

<−

>−

ππ

ππ

(:

(:H

. Nivel de significancia: α =

. Estadígrafo de prueba:

) ( )−

+−

−=

−+

−

21

21

2

22

2

111

0

ccc

)()(

ˆˆ

)(

ˆ

ππππ

ππ

ππ

π

y 222 cx /ˆ =π . Puesto que no se conoce el valor común de

(utilizado en el error estándar), se estima por

21

21

cc

xx

+

+=π

: las muestras se seleccionan de una manera aleatoria e independiente en las dos poblaciones binomiales, y n1 y n2 son lo suficientemente grandes para que la distribución de

)2p pueda ser aproximada mediante una distribución normal. Es decir,

2 deben ser mayores a 5.


0))(:H

cuando bien (o

21a <−

−<

>

ππα

α

zz

zz z

O cuando el valor de απ < %�� %��



Para demostrar la efectividad de un nuevo medicamento que alivia el dolor, a 80 pacientes de una clínica se les dio una pastilla que contiene el medicamento y a otros 80 se les

qué podemos concluir acerca de la efectividad de la droga, si del primer grupo 56 de los pacientes sintieron un efecto benéfico mientras que en el otro

dos muestras grandes

o equivalente 0)(: 210 =−ππH

Prueba de dos colas

0)H 211 ≠− ππ(:

+−

−

=

21

2

2

1

1

111

cc

c

x

c

x

)ˆ(ˆ ππ

o que no se conoce el valor común de πππ == 21

: las muestras se seleccionan de una manera aleatoria e independiente en las dos n lo suficientemente grandes para que la distribución de

pueda ser aproximada mediante una distribución normal. Es decir, 11 pn ,

Prueba de dos colas

/2/2 zzbien o zz αα −<>

��


192

Para demostrar la efectividad de un nuevo medicamento que alivia el dolor, a 80 pacientes de una clínica se les dio una pastilla que contiene el medicamento y a otros 80 se les

qué podemos concluir acerca de la efectividad de la droga, si del primer grupo 56 de los pacientes sintieron un efecto benéfico mientras que en el otro



5º) Cálculo del valor muestral del estadígrafo de prueba

Al sustituir en la fórmula

Reemplazando en el estadígrafo de prueba ob

111

21

2

2

1

1

)ˆ(ˆ

+−

−

=

cc

c

x

c

x

z

ππ

6º) Decisión

Como zm=2.89 excede a z 7º) Conclusión

La muestra aporta evidencia suficiente, con un nivel de significanciauna diferencia entre los grupos de pacientes frente al efecto benéfico de la droga.

0,05

zc= -1,645

0,

zc= 2,33

%��



F(z).

Cálculo del valor muestral del estadígrafo de prueba

Al sustituir en la fórmula 21

21

nn

xxp

+

+= los valores correspondientes se obtiene

Reemplazando en el estadígrafo de prueba obtenemos el valor muestral de z

( )( )2

80

1

80

14125058750

80

38

80

56

..

=

+

−=

=2.89 excede a zc=2.33, se debe rechazar la hipótesis nula.

La muestra aporta evidencia suficiente, con un nivel de significanciadiferencia entre los grupos de pacientes frente al efecto benéfico de la droga.

0,01

= 2,33



332,>mz , obtenido el valor de la tabla de

los valores correspondientes se obtiene 08080

3856=

+

+=p

tenemos el valor muestral de z

892.

=2.33, se debe rechazar la hipótesis nula.

La muestra aporta evidencia suficiente, con un nivel de significancia de 0,01, para decir que existediferencia entre los grupos de pacientes frente al efecto benéfico de la droga.


193

obtenido el valor de la tabla de

5875.0

de 0,01, para decir que existe

Prueba de Hipótesis

Documents

Transcript of Prueba de Hipótesis