Test de Hipotesis

46
1 ESTADISTICA PARA INVESTIGACION EN SALUD MODULO 3 : PRUEBAS DE HIPOTESIS FERNANDO QUEVEDO RICARDI MARCELA BARRIA CONCHA Facultad de Medicina. Universidad de Chile Septiembre 2006

Transcript of Test de Hipotesis

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 1/46

 

1

ESTADISTICA PARA INVESTIGACION EN

SALUD

MODULO 3 : PRUEBAS DE HIPOTESIS

FERNANDO QUEVEDO RICARDI

MARCELA BARRIA CONCHA

Facultad de Medicina. Universidad de ChileSeptiembre 2006

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 2/46

 

Objetivo del Módulo

Entregar los elementos que permitan al alumno realizar pruebas de hipótesis para comparar 

el promedio de una muestra con el promedio del universo, el porcentaje de una muestra con

el porcentaje del universo, los porcentajes de dos muestras, los promedios de dos o másmuestras, y evaluar la asociación entre dos variables.

Contenidos Temáticos

Preámbulo

Capítulo I: Prueba de hipótesis para comparar una muestra con el universo▪ Promedio

▪ Porcentaje

Capítulo II: Prueba de hipótesis para comparar dos muestras▪ Promedio

▪ Porcentaje

Capítulo III: Prueba de Ji cuadrado

▪ Prueba de asociación▪ Prueba de bondad de ajuste

Capítulo IV:▪ Análisis de varianza: generalidades

▪ Regresión: generalidades

Aprendizajes Esperados

Al finalizar el módulo 3, usted estará en condiciones de lo siguiente:

▪ Formular hipótesis estadísticas correspondientes a un problema de investigación.

▪ Elegir el estadístico de prueba apropiado para la hipótesis planteada.

▪ Elegir el nivel de significación de la prueba.

▪ Buscar en la tabla el valor del estadístico de prueba asociado al nivel de

significación (valor crítico).

▪ Calcular el estadístico de prueba con los datos del problema.

2

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 3/46

 

▪ Tomar una decisión respecto de las hipótesis, en función del valor del estadístico de

 prueba.▪ Sacar conclusiones fundamentadas en la decisión.

Preámbulo

Antes que Nada

Es frecuente, especialmente en el campo de la salud, que un profesional en ejercicio de su

actividad observe un fenómeno que lo hace pensar que el grupo al que está observandotiene un comportamiento especial respecto a una determinada variable.

Así, por ejemplo, un kinesiólogo puede pensar que los pacientes sometidos a una secuenciaespecial de ejercicios demoran menos en recuperar la función muscular que aquellostratados con el método tradicional. A un médico radicado en Punta Arenas le puede parecer 

que los suicidios adolescentes son más frecuentes en su región. Un profesional de la

nutrición puede creer que los pacientes con problemas de absorción intestinal respondenmejor a una alimentación con verduras que con carnes. El director de salud de una

municipalidad puede pensar que su consultorio tiene mejor resolución de problemas

complejos que el consultorio del municipio vecino.

Detrás de todas estas situaciones se esconde una hipótesis que espera para ser verificada.

Definición de hipótesis

Una hipótesis se define como una afirmación transitoria que debe ser sometida a prueba. La

inferencia estadística propone un procedimiento para llevar a cabo la prueba de lashipótesis. Propone, primero, enunciarlas formalmente y luego contrastarlas con la evidencia

de los datos. Son los datos, entonces, con su coro de características, los que dirán si una

hipótesis es falsa o verdadera.

Este procedimiento se realiza considerando a los parámetros, que ya sabemos corresponden

al universo, como los objetos para los cuales se enuncian las hipótesis. Dicho de otro modo,

las hipótesis se enuncian para los parámetros.Por ejemplo, una hipótesis, al decir: “el promedio de días de recuperación de la enfermedad

X es 25”, está afirmando que, en el universo, los pacientes se demoran en promedio 25 díasen mejorar. Será tarea del investigador probar la veracidad o falsedad de dicha afirmación

contrastando el valor propuesto para el parámetro del universo (25), con los datos reales

 provenientes de una muestra cualquiera. Si producto de esta comparación resulta que el promedio obtenido en la muestra es de 22 días, se le encarga a la estadística que resuelva el

dilema de si la diferencia entre el promedio muestral (22) y el poblacional (25) permite

3

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 4/46

 

aceptar como verdadera la hipótesis planteada. Será el método estadístico el que permita en

definitiva resolver este dilema, evaluando la significación de la diferencia entre 22 y 25.

¿Azar o no?

El método de las pruebas de hipótesis consiste fundamentalmente en establecer la

 probabilidad de que sea consecuencia del azar la diferencia existente entre dos cantidades.

Se pueden distinguir dos situaciones: 

a. Diferencia entre un valor muestral y el parámetro.b. b. Diferencia entre dos o mas valores muestrales.

En el caso a, se tratará de evaluar la diferencia entre un valor obtenido en la muestra(estadístico) y un valor correspondiente en el universo (parámetro), y en el caso b se

evaluará la diferencia entre dos valores provenientes de dos muestras (estadísticos). Los

valores que se comparen, ya sean de la muestra o del universo, pueden ser promedios,

 porcentajes u otros. Nosotros nos ocuparemos sólo de promedios y porcentajes.

En general, lo que hace una prueba estadística es evaluar la diferencia entre dos omás valores (dos promedios, dos porcentajes). Respecto de esta diferencia seelabora una hipótesis previa y se plantea formalmente en términos estadísticos.

Luego, usando la distribución de probabilidad adecuada, se calcula la probabilidadde la diferencia entre los valores comparados. Si la probabilidad de obtener taldiferencia es pequeña, diremos que dicha diferencia es significativa.

Estadístico de Prueba

Para realizar tan delicada operación debemos utilizar el instrumento apropiado. A dicho

instrumento le llamaremos estadístico de prueba. Con los datos de nuestras muestras podremos calcular el estadístico de prueba. Luego buscaremos la probabilidad de

4

Creo que la media es 25 días...

Son

demasiados...

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 5/46

 

ocurrencia de dicho estadístico en la tabla correspondiente (Normal, t de student u otra) y a

la luz de la probabilidad obtenida tomaremos una decisión respecto de nuestra querida

hipótesis.

Esto, que hemos descrito en forma bastante general, lo iremos desarrollando aplicado a

 problemas e hipótesis específicas en el transcurso del módulo 3, pero trataremos demantener para todas las situaciones un mismo esquema de trabajo. Ese esquema es el

siguiente:

1. Plantear la hipótesis en términos estadísticos.

Esta etapa consiste en representar el problema de investigación bajo la forma de dos

hipótesis excluyentes: la Hipótesis Nula y la Hipótesis Alternativa.

a) Hipótesis Nula. Esta hipótesis plantea que los valores comparados son iguales.Dependiendo del problema podrá presentarse como:

 b) Hipótesis Alternativa. Esta hipótesis plantea que los valores comparados sondistintos y por lo tanto pertenecen a universos distintos. Dependiendo del

 problema podrá presentarse como:

2. Elegir un nivel de significación.

El nivel de significación es la probabilidad de que la diferencia observada se deba al azar.

Interesa que esta probabilidad sea pequeña, por eso, en la práctica se utilizan valores

iguales o inferiores a 0,05. El valor más usado es 0,05 pero también puede ser 0,04; 0,02;0,01; etc. Al nivel de significación se le identifica con la letra griega alfa (α  ). Al elegir un

5

Rechazo H0

Rechazo H0

No rechazo H0

Η 0: µ =25

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 6/46

 

valor de alfa concreto, estamos dejando la mitad de alfa en cada extremo de la distribución

de probabilidades ( 2/α  ).

<br>

 

3. Calcular el estadístico de prueba a base de los datos muestrales.

El estadístico que se utilice para la prueba de la hipótesis dependerá de los elementos que

 participan en él. Así, cuando se trate comparar 2 promedios usaremos el estadístico t deStudent; cuando necesitemos comparar dos porcentajes muestrales usaremos Z, etc. Pero ya

iremos viendo a cada uno de estos estadísticos actuar en terreno.

4. Buscar, en la tabla correspondiente.▪ La probabilidad de obtener un valor igual o mayor al estadístico calculado, cuando

éste sea positivo, o

▪ La probabilidad de obtener un valor menor o igual, cuando el estadístico sea

negativo.

▪ En resumen: )( 0 z  z  P  ≥ cuando z0 sea positivo o )( 0 z  z  P  ≤ cuando z0 sea

negativo.

5. Comparar la probabilidad obtenida en la tabla con el nivel de significaciónelegido en el punto 2 y tomar una decisión respecto de las hipótesisplanteadas.

Parece evidente que para tomar una buena decisión es conveniente disponer de criterios.

Debemos decidir si la hipótesis nula es verdadera o falsa. Entonces, de acuerdo a la

evidencia aportada por los datos de la muestra aceptaremos o rechazaremos la hipótesisnula según el siguiente criterio:

Se rechazará la hipótesis nula si la probabilidad encontrada en la tablaes inferior a la mitad del nivel de significación )2/(α  .

6. Elaborar una conclusión derivada de la decisión.

Una vez tomada la decisión sobre las hipótesis debemos exponer lo que esto significa en elcontexto de nuestro problema particular.

6

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 7/46

 

7. Apoyar todo el proceso de análisis con un gráfico del problema.

A la hora de tomar la decisión es muy útil y orientador un buen gráfico donde se consigne

el nivel de significación, el valor del estadístico y la probabilidad asociada a él.

Capítulo I

Prueba de Hipótesis para Comparar una Muestra con el Universo

Para solucionar los problemas planteados en este capítulo haremos uso de dos estadísticos.

Usaremos uno u otro dependiendo de la situación problema.

A continuación se presenta el esquema de solución general que aplicaremos en cada una detres situaciones problema.

a) Se está comparando el promedio de la muestra con el promedio del universo yse conoce la desviación estándar del universo.

Estadístico a utilizar:n

 x z 

/

00

0

σ 

 µ −=

Donde:1. z0 tiene probabilidad de ocurrencia en la tabla de distribución

normal,

2. 0 x es el promedio de la muestra,

3. 0 µ  es el promedio del universo,

4. σ  es la deviación estándar del universo y

5. n es el tamaño de la muestra.

b) Se está comparando el promedio de la muestra con el promedio del universo y

NO se conoce la desviación estándar del universo.

Estadístico a utilizar:n s

 xt 

/

0

0

0µ −

=

Donde:

1. “t0” tiene probabilidad e de ocurrencia en la tabla de

distribución t de Student con n-1 grados de libertad.

7

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 8/46

 

2. 0 x es el promedio de la muestra,

3. 0 µ  es el promedio del universo,

4. σ  es la deviación estándar del universo y

5. n es el tamaño de la muestra.

c) Se está comparando el porcentaje de la muestra con el porcentaje del universo.

Estadístico a utilizar:nQ P 

 P  p z 

/)( 00

000

×

−=

Donde:

1. z0 tiene probabilidad de ocurrencia en la tabla de distribución normal,

2. 0 p es el porcentaje de la muestra,

3. 0

 P 

es el porcentaje del universo,4. 0

Q es el complemento P0 (100-P0) y

5. n es el tamaño de la muestra.

Comparación del Promedio de una Muestra con el Promedio delUniverso

El problema para el investigador es el siguiente: en una población determinada, el peso de

nacimiento promedio es 3,38 kilos y la desviación estándar 0,42 kilos. Se sospecha que los

hijos de madres adolescentes tienen un peso de nacimiento diferente, probablemente menor.

En una muestra de 25 recién nacidos de madres adolescentes se obtuvo un promedio de

 peso al nacimiento de 2,85 kg, con una desviación estándar de 0,5 kg. ¿Se puede aceptar lahipótesis de que esta muestra pertenece a una población cuyo promedio y desviación

estándar son, respectivamente, 3,38kg y 0,42kg?

Identifiquemos los elementos del problema:

1. Promedio del universo 38,30 = µ 

2. Promedio de la muestra 85,20= x

3. Desviación estándar del universo 42,0=σ  

4. Desviación estándar de la muestra 5,0= s

5. Tamaño de muestra n=25

Una vez identificados los datos del problema, buscaremos la solución guiados por el

esquema básico.

1. Planteamiento de hipótesis en términos estadísticos.

8

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 9/46

 

38,3:0 = µ  H 

Esta hipótesis (hipótesis nula) plantea que la muestra, aunque tiene un promedio diferente, proviene de un universo cuyo promedio es 3,38 y que la diferencia entre promedio de la

muestra y promedio del universo está dentro del error de muestreo.

38,3:1

≠ µ  H 

Esta hipótesis (hipótesis alternativa) plantea que la muestra no proviene de este universo ya

que la diferencia entre promedio de muestra y promedio del universo es mayor que el error de muestreo (recuerde el error de los intervalos de confianza).

2. Elegir el nivel de significación.

Elegimos un nivel de significación 05,0=α   . Este valor lo fija el investigador y debe ser 

menor o igual a 0,05.

3. Calcular el estadístico de prueba.

Como se conoce la desviación estándar del universo )(σ   el estadístico para someter a

 prueba esta hipótesis será Z y su fórmula de cálculo es:

n

 x z 

/

0

σ 

 µ −=

Llevando los datos del problema a la fórmula del estadístico se obtiene:

=−

=

25/42,0

38,385,2 z  -6,3

Entonces, el valor del estadístico de prueba es -6,3.

4. Buscar en la tabla normal la probabilidad de ocurrencia que tiene un valor de z igual o inferior a -6,3.

Vemos en la tabla que el máximo valor de z que aparece es -3,49 y que la probabilidad de

encontrar un valor igual o inferior a -3,49 es 0,0002 (probabilidad de la cola).

5. Comparar la probabilidad obtenida en la tabla con el nivel de significaciónelegido en el punto 2 y tomar una decisión respecto de las hipótesisplanteadas.

Dado que el valor de Z calculado (-6,3) está en un extremo de la curva, la probabilidad de

obtener un valor igual o inferior a él es menor que la mitad del nivel de significación

elegido ( 025,02/ =α  ). El hecho de que la probabilidad asociada al estadístico de prueba

9

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 10/46

 

sea menor que la mitad del nivel de significación nos conduce a la decisión de rechazar la

hipótesis nula (según el criterio enunciado).

6. Elaborar una conclusión derivada de dicha decisión.

Ya que rechazamos la hipótesis nula, que plantea que la muestra observada pertenece a un

universo con promedio 3,38 kg, podemos afirmar lo contrario, es decir que: “la muestra de25 RN no pertenece al universo con promedio 3,38, pertenece a un universo cuyo promedio

es distinto de 3,38”. Esta afirmación se hace con un nivel de significación de 0,05.

7. Apoyar todo el proceso de análisis con un buen gráfico del problema.

Gráfico del problema.

Se observa en el gráfico que la probabilidad del estadístico de prueba es inferior a la mitad

del nivel de significación lo que indica que la diferencia entre la muestra y el universo es

significativa.

Supongamos ahora que el investigador no tiene información sobre la desviación estándar 

del universo. En ese caso la única diferencia en la solución estará en el estadístico de

 prueba, que en vez de usar “z” deberá usar “t”.

25/5,0

38,385,2

/

00 −=

−=

n s

 xt 

 µ = - 5,3

Buscamos en la tabla “t”, con 24 grados de libertad, la probabilidad asociada a este valor.Mirando la tabla, en la fila de los 24 grados, se observa que el último valor a la derecha es

3,745. Subiendo desde este valor hasta la primera fila de la tabla encontramos que la

 probabilidad asociada a los valores superiores a 3,745 es 0,0005.Como la curva es simétrica se supone que ambas colas tienen igual probabilidad, por lo

tanto podemos asociar también a - 3,745 una probabilidad de 0,0005.

Finalmente, como la probabilidad del estadístico de prueba (0,0005) es menor que la mitaddel nivel de significación (0,025), nuestra decisión de rechazo de la hipótesis nula se

mantiene y por consiguiente también se mantienen las conclusiones.

10

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 11/46

 

Comparación del Porcentaje de una Muestra con el Porcentaje delUniversoEl problema para el investigador es el siguiente: en una población determinada, 28,2% de

las personas presentan algún problema de salud mental. Producto de su experiencia en un

consultorio rural, un profesional de la salud sospecha que en la población asignada a eseconsultorio el porcentaje de personas con problemas de salud mental es superior al de la

 población. Con el objeto de probar su hipótesis toma una muestra al azar, de 63 personas,

encontrando un 31% de ellas con problemas de salud mental.

A la luz de estos antecedentes, ¿se puede aceptar la hipótesis de que elporcentaje de problemas de salud mental en este consultorio es distinto de 28,2?

¿Cuáles son los datos que entrega el problema?

P0= 28,2 Porcentaje del universo con problemas de

salud mental

Q0= 71,8 Porcentaje del universo sin problemas desalud mental

p0= 31 Porcentaje de la muestra

n= 63 Tamaño de la muestra

1. Las hipótesis serán:2,28:0 = P  H    2,28:

1≠ P  H 

 

2. Elegiremos un nivel de significación 04,0=α 

3. El estadístico de prueba será:

49,063/)8,712,28(

2,2831

/)(00

00

0 =×

−=

×

−=

nQ P 

 P  p z 

4. Buscamos en la tabla normal la probabilidad asociada a un valor de z mayor de0,49. Como la tabla entrega la probabilidad de encontrar un valor de z inferior a

0,49 (0.6879), la probabilidad de valores de z mayores a 0.49 se obtiene por 

diferencia: 1- 0,6879 = 0,3121.

11

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 12/46

 

5. Comparamos la probabilidad encontrada con la mitad del nivel de significación:02,02/ =α   

6. Dado que el valor de z calculado (0,49) se encuentra más o menos al centro de la

curva, su probabilidad, según tabla es de 0,3121 que resulta mayor a la mitad delnivel de significación elegido ( )02,02/ =α  .

Esto nos conduce a la decisión de aceptar la hipótesis nula (ver gráfico).

7. Aceptar la hipótesis nula significa aceptar que el porcentaje de problemas de salud

mental en la muestra no es significativamente distinto del porcentaje del universo.

Por lo tanto, el porcentaje de problemas de salud mental del consultorio estudiado

no es distinto al de la población.

12

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 13/46

 

Ejercicio, Capítulo I, Módulo 3

Problema 1

El porcentaje de complicaciones postoperatorias en los pacientes sometidos a unadeterminada intervención quirúrgica es de 12%. Se aplica una nueva técnica a una muestra

de 36 pacientes y se obtiene un 9% de pacientes con complicaciones.

¿Se puede aceptar la hipótesis de que el porcentaje de complicaciones con la nueva técnica

es distinto al tradicional? Use un nivel de significación de 0,04.

Si lo desea, puede usar tablas como las que se muestran para anotar sus datos y los pasos

del desarrollo en su archivo Word.

 

Elementos (datos) del

problema

Descripción del dato

P0=

Q0=

 p0=

n=

Pasos del desarrollo del problema:

1.- Hipótesis

2.- Nivel de significación

3.- Estadístico de prueba

4.- Probabilidad

5.- Comparación de la

 probabilidad encontrada conel nivel de significación y

decisión.

6.- Conclusión

13

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 14/46

 

 No olvide dibujar su gráfico.

Problema 2

En una empresa con 62 empleados se observa un gasto medio en salud de 292 unidades

monetarias y una desviación estándar de 40 unidades. Con el antecedente de que el gastomedio en salud de la población del país es de 308 unidades monetarias ¿Se puede afirmar 

que el gasto medio en salud de los empleados de la empresa es distinto al del país? Use alfa

de 0,05.

Elementos (datos) del

problema

Descripción del dato

Desarrollo del problema:

1.- Hipótesis

2.- Nivel de significación

3.- Estadístico de prueba

4.- Probabilidad

5.- Comparación de la probabilidad encontrada con

el nivel de significación y

decisión.

6.- Conclusión

 No olvide dibujar su gráfico.

14

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 15/46

 

Para Tener Presente

Una hipótesis es una afirmación transitoria que debe ser sometida aprueba.

<br>

El método de las pruebas de hipótesis consiste fundamentalmente enestablecer la probabilidad de que la diferencia entre dos cantidades seaconsecuencia del azar.

<br>

Pasos para realizar una prueba de hipótesis:

1. Plantear la hipótesis en términos estadísticos:

Hipótesis Nula: los valores comparados son iguales.

00: µ  µ = H  o 00 : P  P  H  =

210 : µ  µ  = H  o 210 : P  P  H  =

Hipótesis Alternativa: los valores comparados son distintos y por lo tanto pertenecen a universos distintos.

01 : µ  µ ≠ H  o 01 : P  P  H  ≠

211 : µ  µ  ≠ H  o 211 : P  P  H  ≠

2. Elegir un nivel de significación o alfa (α  ): Se utilizan valores iguales oinferiores a 0,05. El valor más usado es 0,05. Se deja la mitad de alfa en cada

extremo de la distribución de probabilidad ( 2/α  ).

3. Calcular el estadístico de prueba con los datos muestrales: El estadístico que se

utilice dependerá de los elementos que participan en el problema.

4. Buscar, en la tabla correspondiente, la probabilidad de obtener un valor igual omayor al estadístico calculado, cuando éste sea positivo, y la probabilidad de

obtener un valor menor o igual, cuando el estadístico sea negativo.

5. Comparar la probabilidad obtenida en la tabla con el nivel de significación

elegido en el punto 2 y tomar una decisión respecto de las hipótesis planteadas:

se rechazará la hipótesis nula si la probabilidad es inferior a la mitad del nivelde significación.

6. Elaborar una conclusión derivada de la decisión

15

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 16/46

 

7. Apoyar el proceso de análisis con un gráfico del problema

Capítulo II

Prueba de Hipótesis para Comparar dos Muestras

Para desarrollar este tema seguiremos un esquema similar al del capítulo anterior.Estudiaremos tres situaciones problema que, sin ser las únicas, son las más frecuentes.

a) Comparación de la diferencia de promedios de dos muestras independientes.

 b) Comparación de promedios de dos muestras pareadas.c) Comparación de porcentajes de dos muestras.

Consideraciones previas

Antes de analizar la diferencia entre los promedios muestrales debemos responder algunas

 preguntas importantes que harán la diferencia en el procedimiento a seguir.

1.-¿Se trata de dos muestras independientes o pareadas?

Diremos que dos muestras son independientes cuando no se establece ninguna relación previa al análisis entre las unidades de una y otra muestra. Por ejemplo, sujetos de uno y

otro curso, enfermos de dos consultorios, hombres comparados con mujeres.

En cambio diremos que se trata de muestras pareadas si en forma previa al análisis, se

forman parejas entre los individuos de una muestra con los individuos de la otra muestra.

Por ejemplo, el caso con su control, distintas dietas pueden probarse en dos animales de lamisma camada, Sin embargo, cuando queda más clara esta situación es cuando se comparan

distintas medidas para los mismos individuos; por ejemplo, al medir antes y después del

tratamiento a un mismo grupo de individuos se obtienen resultados pareados ocorrelacionados.

2.-¿Son conocidos los valores de la varianza, o las varianzas de lossupuestos universos?

Como existe la posibilidad de que ambas muestras provengan de un mismo universo,

entonces en ese caso se trataría de una sola varianza del universo. ¿Se conoce dicha

varianza?

16

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 17/46

 

Pero también existe la posibilidad de que las muestras comparadas provengan de universos

distintos y en ese caso habría dos varianzas universales. ¿Son éstas conocidas?

3.-A la luz de las varianzas de las muestras, ¿podemos suponer que lasvarianzas son iguales?

Bueno, en esta parte y con todo derecho, podríamos reclamar en contra de lascomplicaciones de la estadística, pero seguramente el cumplimiento de estas exigencias nos

 permitirá obtener resultados más confiables.

Cada posible respuesta a estas interrogantes nos conducirá a ocupar una fórmuladistinta para calcular el estadístico. Por ello veremos, en primer lugar, la forma deresponder a las preguntas planteadas.

Las Respuestas

La respuesta a la primera pregunta es fácil, porque se encuentra incorporadadentro del mismo problema de investigación: es una característica de los datos;forma parte del diseño de la investigación.

La segunda pregunta tampoco es tan complicada porque será cuestión de revisar los antecedentes de que dispone el investigador. Lo más frecuente es que estedato se desconozca y, por lo tanto, para efectos de este curso, nosotrosasumiremos que la o las varianzas del universo son desconocidas.

Para responder a la tercera pregunta se hace necesario realizar una prueba dehipótesis para probar la igualdad o diferencia de las varianzas. La realización de lamisma no es difícil y es frecuente que los programas computacionales de análisisestadístico la hagan en forma automática sin que sea necesario solicitarla, y laentreguen como parte de los resultados. Como lo más frecuente es que lasvarianzas de las muestras comparadas tengan varianzas similares, nosotros eneste curso haremos los análisis bajo este supuesto.

Hechas estas aclaraciones procederemos a describir en forma general los estadísticos que

 participan en cada situación.

a) Comparar los promedios de dos muestras independientes (con varianzasdesconocidas y supuestas iguales)

Estadístico a utilizar:

−=

21

2

21

0

11

nn

 s

 x xt 

Donde:

17

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 18/46

 

1. “t0” tiene probabilidad e de ocurrencia en la tabla de distribución t de

Student con 221 −+ nn grados de libertad.

2.2

)1()1(

21

2

22

2

112

−+

−+−=

nn

 sn sn s es la varianza común estimada.

3. t0 tiene probabilidad de ocurrencia en la tabla t.

4. 1 x es el promedio de la muestra 1 y 2 x es el promedio de la muestra 2.

5. n1 y n2 son los tamaños de las respectivas muestras.

b) Comparar los promedios de dos muestras pareadas.

Estadístico a utilizar:n s

 Dt 

 D /

0

0=

Donde:6. “t0” tiene probabilidad e de ocurrencia en la tabla de

distribución t de Student con n-1 grados de libertad.

7. D es la diferencia promedio entre las parejas de datos.

8. D s es la desviación estándar de las diferencias entre las

 parejas de datos.

9. n es el tamaño de la muestra (número de parejas de datos).

c) Comparar los porcentajes de dos muestras.

Estadístico a utilizar:

+××

−=

21

210

11

nnq p

 p p z 

Con21

2211

nn

 pn pn p

+

×+×=

Donde: 6. z0 tiene probabilidad de ocurrencia en la tabla de distribución normal.

7. p es la estimación del porcentaje común.

8. q es el complemento de p (100-p).

9. n1 y n2 son los tamaños de las respectivas muestras.

18

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 19/46

 

Comparación de los Promedios de Dos Muestras Independientes(con Varianzas Desconocidas e Iguales)

El problema para el investigador es el siguiente: en una maternidad dela Región Metropolitana se sospecha que los hijos de madresadolescentes tienen un peso de nacimiento diferente, probablementemenor, al peso de los recién nacidos de madres mayores de 25 años.

Con el objeto de probar la hipótesis se tomó una muestra de 36 recién nacidos de madres

adolescentes obteniendo un promedio de peso al nacimiento de 2,85 kg, con una desviación

estándar de 0,5 kg, y una muestra de 28 recién nacidos de madres mayores de 25 añosobteniendo en promedio 3,05 kg y una desviación estándar de 0,42.

Identifiquemos los elementos del problema.

6. Promedios de las muestras 1 y 2 85,21 = x y 05,32 = x

7. Desviaciones estándar de las muestras 1 y 2 5,01= s y 42,0

2= s

8. Tamaños de las muestras n1=36 y n2=28

Una vez identificados los datos del problema, buscaremos la solución guiados por el

esquema básico que usted ya conoce del capítulo anterior.

1. Planteamiento de hipótesis en términos estadísticos.

210 : µ  µ  = H 

Esta hipótesis (hipótesis nula) plantea que las muestras, aunque tienen promediosdiferentes, provienen de un mismo universo y que la diferencia observada se debe al azar.

211: µ  µ  ≠ H 

Esta hipótesis (hipótesis alternativa) plantea que las muestras provienen de universos con promedios distintos.

 

2. Elegimos un nivel de significación 05,0=α   .Calcular el estadístico de prueba:

21,022836

42,0)128(5,0)136(

2

)1()1(22

21

2

22

2

112 =−+

−+−=

−+

−+−=

nn

 sn sn s

19

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 20/46

 

73,1

28

1

36

121,0

85,205,3

11

21

2

21

0 =

−=

−=

nn s

 x xt 

Nota: Se aconseja restar al mayor de los promedios, el menor, de tal modo que la diferencia

resulte positiva y facilite de este modo su búsqueda en la tabla. Entonces el estadístico de

 prueba es t=1,73

3. Como los grados de libertad son 62 (n1 +n2-2), buscamos en la tabla “t”, con 60grados de libertad, la probabilidad de ocurrencia que tiene un valor de “t” igual osuperior a 1,73.

Vemos en la tabla que 1,73 se encuentra entre 1,671 y 2,021 por lo tanto la probabilidad deun valor superior a él es mayor que la mitad de alfa.(0,025)(probabilidad de la cola).

4. El hecho de que la probabilidad asociada al estadístico de prueba sea mayor que la mitad del nivel de significación nos conduce a la decisión de aceptar lahipótesis nula.

5. Aceptar la hipótesis nula significa aceptar que el peso promedio al nacimientoes igual en madres adolescentes y madres mayores de 25 años. Ambas muestrasprovienen de un mismo universo.

6. Gráfico del problema.

Se observa en el gráfico que la probabilidad del estadístico de prueba es superior a la mitad

del nivel de significación (0,025), lo que indica que la diferencia entre las muestras no essignificativa.

Comparación de Dos Muestras con Observaciones Pareadas

20

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 21/46

 

Con el objeto de evaluar el efecto de la instrucción en el conocimientode los alumnos, se tomó una muestra de 10 alumnos y se compararonlas notas obtenidas antes y después de la instrucción.

Los resultados fueron los siguientes.

Antes: 4,

4

3,

7

4,

7

2,8 4,2 4,3 3,5 3,7 3,1 1,9

Después: 4,

0

5,

2

5,

7

4,2 4,8 3,9 4,1 3,0 4,6 6,8

Como aquí lo que interesa es evaluar el cambio individual se hace necesario generar una

variable que exprese ese cambio. Proponemos entonces crear la variable “x” que exprese ladiferencia entre las mediciones individuales. De este modo la variable

x = Después - Antes

será nuestra variable de estudio y respecto de ella formularemos la hipótesis nula

  0:0 = µ  H  plantea que el promedio real (del universo) de las diferencias individuales es

cero

y la hipótesis alternativa

0:1 ≠ µ  H  plantea que el promedio real de las diferencias es distinto de cero.

Para decidir entre las hipótesis será necesario calcular un estadístico de prueba en base alos valores de la variable “x”

Antes Despues x4,4 4 -0,4

3,7 5,2 1,5

4,7 5,7 1

2,8 4,2 1,4

4,2 4,8 0,6

4,3 3,9 -0,4

3,5 4,1 0,6

3,7 3 -0,7

3,1 4,6 1,5

1,9 6,8 4,9

El esquema de esta prueba de hipótesis corresponde al utilizado para “comparar un promedio muestral con el promedio del universo”, visto en el capítulo anterior.

21

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 22/46

 

Empezaremos calculando promedio y desviación estándar para la variable diferencia (x) y

a continuación someteremos a prueba la hipótesis de que el promedio de las diferenciasobservadas (  µ ) es igual a cero.

Promedio de la muestra1= x  Desviación estándar  25,1= s

Estadístico de prueba será:

10/25,1

01

/

00 −=

−=

n s

 xt 

µ = 2,5

Buscamos ahora en la tabla “t”, con 9 (n-1) grados de libertad, la probabilidad asociada aeste valor. Mirando la tabla, en la fila de los 9 grados, se observa que el valor asociado a la

mitad de alfa (0,025) es 2,262. Como el valor 2,5 se encuentra hacia la derecha de 2,262

nos conduce al rechazo de la hipótesis nula.

Por lo tanto el promedio de las diferencias “antes – después” es significativo, lo que nos

 permite concluír que, asociado a la intervención educativa, se observa un aumentosignificativo del puntaje en los alumnos estudiados.

Comparación de los Porcentajes de Dos Muestras

El problema para el investigador es el siguiente.

En un consultorio urbano, el 28,2% de una muestra de 47 personas presenta algún problema de salud mental. En una muestra de 63 personas de un consultorio rural, el 31% de las personas tiene algún problema de salud mental.

22

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 23/46

 

A la luz de estos antecedentes, ¿se puede aceptar la hipótesis de que el porcentaje de

 problemás de salud mental en el consultorio rural es distinto al del consultorio urbano?

¿Cuáles son los datos que entrega el problema?

 p1= 28,2 Porcentaje de problemás de salud mental en la muestra

urbana. p2= 31 Porcentaje de problemás de salud mental en la muestra rural.

n1= 47 Tamaño de la muestra urbana.

n2= 63 Tamaño de la muestra rural.

 

1. Las hipótesis serán:

210 : P  P  H  = y 211 : P  P  H  ≠

2. Elegiremos un nivel de significación 04,0=α   

3. El estadístico de prueba será:

 

+××

−=

21

210

11

nnq p

 p p z 

Calcularemos primero el porcentaje común ( p)

  8,296347

31632,2847

21

2211 =+

×+×=

+

×+×=

nn

 pn pn p

Entonces p=29,8 y q=100-p=70,2.

Luego reemplazamos todos los valores en la formula de Z

31,0

63

1

47

12,708,29

312,280 −=

+××

−= z 

4. Buscamos en la tabla normal la probabilidad asociada a un valor de z menor de-0,31.

23

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 24/46

 

Resulta 0,3783.

5. Comparamos la probabilidad encontrada con la mitad del nivel de significación.

02,02/ =α   

6. Dado que el valor de z calculado (-0,31) se encuentra más o menos al centro dela curva, su probabilidad, según tabla es de 0,3783 que resulta mayor a la mitaddel nivel de significación elegido )02,02/ =α  .

Esto nos conduce a la decisión de aceptar la hipótesis nula (ver gráfico).

7. Aceptar la hipótesis nula significa aceptar que el porcentaje de problemas desalud mental es similar en ambos consultorios.

Ejercicio, Capítulo II, Módulo 3

Problema 1

El porcentaje de complicaciones postoperatorias en 15 pacientes sometidos al procedimiento tradicional es de 12%. Se aplica una nueva técnica a una muestra de 22

 pacientes y se obtiene un 9% de complicaciones.

¿Se puede aceptar la hipótesis de que el porcentaje de complicaciones con la nueva técnica

es distinto al tradicional? Use un nivel de significación de 0,01.

Si lo desea, puede usar tablas como las que se muestran a continuación para anotar susdatos y los pasos del desarrollo.

 

Elementos (datos) delproblema

Descripción del dato

 p1 =

q1 =

24

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 25/46

 

 p2 =

q2 =

n1 =

n2 =

Pasos del desarrollo del problema:

1.- Hipótesis

2.- Nivel de significación

3.- Estadístico de prueba

4.- Probabilidad

5.- Comparación de la

 probabilidad encontrada con el

nivel de significación y decisión.

6.- Conclusión

 No olvide dibujar su gráfico.

Problema 2

En una empresa pública de 62 empleados, se observa un gasto medio en salud de 282

unidades monetarias y una desviación estándar de 40 unidades. En una empresa privada,con 57 empleados, el gasto medio en salud es de 308 unidades monetarias con desviación

estándar de 25 unidades.

¿Se puede afirmar que el gasto medio en salud de los empleados de la empresa pública es

distinto al gasto medio en salud de los empleados de la empresa privada?

Use alfa de 0,05.

Elementos (datos) delproblema

Descripción del dato

25

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 26/46

 

Desarrollo del problema:

1.- Hipótesis

2.- Nivel de significación

3.- Estadístico de prueba

4.- Probabilidad

5.- Comparación de la probabilidad encontrada con elnivel de significación y decisión.

6.- Conclusión

 No olvide dibujar su gráfico.

Problema 3

Se desea conocer el efecto de un anticonceptivo oral sobre el peso corporal de las usuarias.

Para ello se toma una muestra de 9 mujeres sanas y se mide su peso antes de iniciar el

tratamiento y tres meses después. Se obtienen los siguientes resultados:

Mujer Peso inicio Peso a los 3meses

1 53 54

2 62 65

3 57 62

4 66 64

5 59 62

6 62 63

7 53 55

8 62 62

9 57 58

26

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 27/46

 

Pruebe la hipótesis de que el peso de las mujeres a los 3 meses de tratamiento es distinto del

 peso inicial.

Use un nivel de significación de 0,01.

Elementos (datos) delproblema Descripción del dato

Desarrollo del problema:

1.- Hipótesis

2.- Nivel de significación

3.- Estadístico de prueba

4.- Probabilidad

5.- Comparación de la probabilidad encontrada con elnivel de significación y decisión.

6.- Conclusión

 No olvide dibujar su gráfico.

Solución de los ejercicios:

Para Tener Presente

Al estudiar diferencias entre dos muestras se identifican las siguientes situaciones

27

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 28/46

 

problema:1. Comparación de la diferencia de promedios de dos muestras independientes.2. Comparación de promedios de dos muestras pareadas.3. Comparación de porcentajes de dos muestras.

Muestras independientes son aquellas en las cuales los sujetos de una muestra notienen relación alguna con los de la otra muestra.

Muestras pareadas son aquellas en las cuales los individuos o las mediciones deuna muestra están de alguna manera ligados o pareados con los de otra muestra.El caso más típico es el de las mediciones repetidas en los mismos sujetos.

 

Situaciones problema y estadístico a usar 

Situaciónproblema

Estadístico a usar Otras fórmulas

Comparación depromedios dedos muestrasindependientes(con varianzasdesconocidas ysupuestasiguales)

 

−=

21

2

21

0

11

nn

 s

 x xt 

Grados de libertad: n1+n2-2

1

)1()1(

21

2

22

2

112

−+

−+−=

nn

 sn sn s  

S2 varianza común estimada

Comparación depromedios dedos muestraspareadas

La variable de trabajo es ladiferencia entre cada par dedatos

 n s

 Dt 

 D /

0

0 =

Grados de libertad: n-1

 Se debe calcular promedio ydesviación estándar de la variablediferencia

Comparación

entre losporcentajes dedos muestras

 

+××

=

21

210

11

nnq p

 p p

 z 

 

21

2211

nn

 pn pn p

+

×+×=

P: estimación del porcentaje común 

28

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 29/46

 

Capítulo III

La Prueba de Ji-cuadrado

Introducción

Del mismo modo que los estadísticos “z”, con su distribución Normal y “t”, con sudistribución t de Student, nos han servido para someter a prueba hipótesis que involucran a

 promedios y porcentajes, el estadístico ji-cuadrado, que tiene distribución de probabilidad

del mismo nombre, nos servirá para someter a prueba hipótesis referidas a distribuciones defrecuencias.

En primer lugar usaremos el estadístico ji-cuadrado para probar la asociaciónentre dos variables, y luego lo usaremos para evaluar en qué medida se ajusta ladistribución de frecuencias obtenida con los datos de una muestra, a unadistribución teórica o esperada.

En términos generales, esta prueba contrasta frecuencias observadas con las frecuenciasesperadas de acuerdo con la hipótesis nula. Al igual que en el caso de las pruebas

anteriormente estudiadas, ilustraremos con ejemplos.

Ji- cuadrado como Prueba de Asociación

Supongamos que un investigador está interesado en evaluar la asociación entre uso decinturón de seguridad en vehículos particulares y el nivel socioeconómico del conductor del

vehículo. Con este objeto se toma una muestra de conductores a quienes se clasifica en una

tabla de asociación encontrando los siguientes resultados:

Uso deCinturón Nivel socioec.bajo Nivel socioec.medio Nivel socioec.alto TOTAL

SI 8 15 28 51

 NO 13 16 14 43

TOTAL 21 31 42 94

¿Permiten estos datos afirmar que el uso del cinturón de seguridad depende del nivel

socioeconómico? Usaremos un nivel de significación alfa = 0,05.

29

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 30/46

 

Los pasos del análisis estadístico en este caso son los siguientes:

1. En primer lugar debemos plantear las hipótesis que someteremos a prueba:

H 0 : “El uso de cinturón de seguridad es independiente del nivel socioeconómico”.H 1: “El uso del cinturón de seguridad depende del nivel socioeconómico”.

En esta prueba estadística siempre la hipótesis nula plantea que las variables analizadas son

independientes.

2. En segundo lugar debemos obtener (calcular) las frecuencias esperadas.

Estas son las frecuencias que debieran darse si las variables fueran independientes, es decir,

si fuera cierta la hipótesis nula.

Las frecuencias esperadas se obtendrán de la distribución de frecuencias del total de loscasos, 51 personas de un total de 94 usan el cinturón y 43 de 94 no lo usan. Esa misma

 proporción se debería dar al interior de los tres grupos de nivel socioeconómico, de manera

que el cálculo responde al siguiente razonamiento: si de 94 personas 51 usan cinturón, de21 personas, ¿cuantas debieran usarlo?

La respuesta a esta pregunta se obtiene aplicando la “regla de tres” y es 11,4. Este

 procedimiento debe repetirse con todas las frecuencias del interior de la tabla.

El detalle de los cálculos es el siguiente:

 Nivel bajo: (21x51/94)=11,4 - (21x43/94) = 9,6

 Nivel medio: (31x51/94)=16,8 - (31x43/94) = 14,2

 Nivel alto: (42x51/94)=22,8 - (42x43/94) = 19,2

Estas son las frecuencias que debieran presentarse si la hipótesis nula fuera verdadera y, por 

consiguiente, las variables fueran independientes.

Estos valores los anotamos en una tabla con las mismas celdas que la anterior; así

tendremos una tabla con los valores observados y una tabla con los valores esperados, que

anotaremos en cursiva, para identificarlos bien.

Uso de cinturón Nivel bajo Nivel medio Nivel alto TOTAL

SI 11,4 16,8 22,8 51

 NO 9,6 14,2 19,2 43

TOTAL 21 31 42 94

30

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 31/46

 

3. Ahora debemos calcular el estadístico de prueba.

En este caso, el estadístico de prueba es Ji-cuadrado que, como dijimos al comienzo,compara las frecuencias que entregan los datos de la muestra (frecuencias observadas) con

las frecuencias esperadas, y tiene la siguiente fórmula cálculo:

∑ −=i

ii

eeo

2

2 )( χ 

donde io representa a cada frecuencia observada y ie representa a cada frecuencia

esperada.

De este modo el valor del estadístico de prueba para este problema será:

23,52,19

)2,1914(8,22

)8,2228(2,14

)2,1416(8,16

)8,1615(6,9

)6,913(4,11

)4,118(

)(

222222

2

2

=−+−+−+−+−+−

=−

=∑i

ii

e

eo χ 

Entonces 23,52= χ  .

Este es el valor de nuestro estadístico de prueba que ahora, siguiendo el procedimiento de problemas anteriores (paso 4), debemos comparar con un valor de la tabla de

 probabilidades para ji-cuadrado ( 2 χ   ), que está en el anexo Tablas estadísticas. Esta tabla

es muy parecida a la tabla t de student, pero tiene sólo valores positivos porque ji-cuadradosólo da resultados positivos (véase grafico que muestra la forma de la curva, con valores

desde 0 hasta infinito).

Uso de tabla ji-cuadrado

La tabla de ji-cuadrado tiene en la primera columna los grados de libertad y en la primerafila la probabilidad asociada a valores mayores a un determinado valor del estadístico

(véase gráfico de la tabla).

Los grados de libertad dependen del número de celdas que tiene la tabla de asociación

donde están los datos del problema y su fórmula de cálculo es muy sencilla:

Grados de libertad (gl) = (nº de filas – 1) x (nº de columnas – 1)

31

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 32/46

 

Así, en nuestro ejemplo, en que hay 2 filas y 3 columnas, los grados de libertad serán:

gl = (2 - 1) x (3 - 1) = 2

 Nótese que no se consideran la fila ni la columna de los totales.

Al comienzo elegimos un nivel de significación alfa = 0,05. Entonces un valor de tabla para2

 χ   asociado a 2 grados de libertad y alfa 0,05 es 5,99.

32

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 33/46

 

Por lo tanto, como en el gráfico dibujado más abajo, vemos que 5,23 se encuentra a la

izquierda de 5,99, la probabilidad asociada a valores superiores a 5,23 es mayor que alfa(0,05).

Según esto, debemos aceptar la hipótesis nula que plantea que las variables “uso decinturón de seguridad” y “nivel socioeconómico” son independientes.

Limitaciones y correcciones

▪ Cuando resulta alguna frecuencia esperada inferior a 5, se recomienda aplicar la

corrección de “Yates”. Esta consiste en restar del valor absoluto de cada

diferencia, el valor 0,5. De tal modo que la fórmula de ji-cuadrado corregida sería:

 

−−=

i

ii

e

eo2

2)5,0(

 χ 

▪ Si alguna de las frecuencias esperadas resulta inferior a 1, se recomienda reagrupar 

categorías tratando de aumentar las frecuencias pequeñas..

Ji-cuadrado como Prueba de Bondad de Ajuste

También se puede usar el estadístico ji-cuadrado para evaluar cuan buena puede resultar 

una distribución teórica, cuando pretende representar la distribución real de los datos de unamuestra determinada.

A esto se le llama evaluar la bondad de un ajuste. Probar la bondad de un ajuste es ver enqué medida se ajustan los datos observados a una distribución teórica o esperada.

Tomemos como ejemplo la distribución esperada para los individuos de una población queson clasificados según grupo sanguíneo.

33

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 34/46

 

Según estudios realizados en población, se espera que dicha distribución, en porcentajes,

sea la siguiente:

Grupo Frecuencia esperadaAB 2%

A 30,5%B 9,3%

0 58,2%

En una muestra de 150 dadores de sangre se encontró la siguiente distribución:

Grupo Frecuencia observada

AB 4

A 48

B 15

0 83

1. Las hipótesis del problema son:

H 0 : los datos se ajustan a la distribución teórica.H 1: los datos no se ajustan a la distribución teórica.

2. Siguiendo el esquema general de solución propuesto para las pruebas dehipótesis, ahora corresponde elegir un nivel de significación.

Elijamos entonces alfa = 0,01.

El estadístico de prueba será ji-cuadrado, cuya fórmula ya conocemos:

∑−

=i

ii

e

eo2

2 )( χ 

Debemos calcular las frecuencias esperadas en nuestro grupo. Si aplicamos los porcentajes

esperados a la muestra de 150 casos podemos obtener las siguientes frecuencias esperadas

(ei):

Grupo Frec. oi Frec. ei

AB 4 3,00

A 48 45,75

B 15 13,95

0 83 87,30

Total 150 150,00

34

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 35/46

 

Los grados de libertad de esta tabla se obtienen restando 1 al número de filas, en este caso:

gl = 4 -1 = 3.

Recordemos que la fila del total no se considera para los grados de libertad.

Si ya tenemos las frecuencias observadas y esperadas, podemos proceder a evaluar la

diferencia entre ellas utilizando el estadístico ji-cuadrado.

Si la diferencia entre frecuencias observadas y esperadas es grande, significará que la

hipótesis nula es falsa, o sea, esta distribución no se ajusta a la distribución teórica y si, en

cambio, resulta que la diferencia entre frecuencias observadas y esperadas no es muygrande, significará que la hipótesis nula es verdadera; por lo tanto, la distribución en la

muestra se ajusta a la distribución teórica y diremos que no hay significación estadística.

El valor del estadístico de prueba ( 2 χ   ) es una medida de la diferencia entre frecuencias

observadas y esperadas; por lo tanto, mientras mayor resulte2

 χ   , más fácil será rechazar lahipótesis nula.

3. Calculemos entonces nuestro estadístico de prueba con los datos de nuestroejemplo:

4,03,87

)3,8783(

95,13

)95,1315(

75,45

)75,4548(

4

)44()(22222

2 =−

+−

+−

+−

=−

=∑i

ii

e

eo χ 

4,02 = χ 

4. Ahora debemos comparar este valor con el valor de ji-cuadrado de la tabla quebuscaremos con alfa=0,01 y 3 grados de libertad.

Según tabla ese valor es 11,34.

5. Al comparar el valor del estadístico de prueba (0,4) con el valor de tabla (11,34),vemos que 0,4 se encuentra a la izquierda de 11,34 desplazado hacia el centro dela curva y que, por lo tanto, la probabilidad de valores mayores a él es muysuperior al nivel de significación alfa = 0,01.

6. Conclusión

Dado que la probabilidad de 4,02≥ χ  es mayor que alfa, se acepta la hipótesis nula. Esto

significa que los datos observados se ajustan a la distribución teórica, por lo tanto las

diferencias observadas no son estadísticamente significativas.

7. Gráfico

35

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 36/46

 

Ejercicio, Capítulo III, Módulo 3

Problema 1

Intentando determinar si el sexo influye en el número de licencias por enfermedad, en un

consultorio de atención primaria se tomó una muestra de pacientes en control y se les

clasificó según sexo y número de licencias por enfermedad obtenidas durante el año.

Los datos se clasificaron en una tabla de 4 filas y 2 columnas. Se obtuvo un valor de ji-

cuadrado de 8,31.

Con estos datos complete el siguiente cuadro y dibuje el gráfico correspondiente.

1.- Hipótesis

2.- Nivel de significación Alfa = 0,05

3.- Estadístico de prueba

4.- Probabilidad

5.- Comparación de la probabilidad encontrada con el

nivel de significación y decisión.

6.- Conclusión

Problema 2

El gerente de una planta industrial pretende determinar si el número de empleados que

asisten al consultorio médico de la planta se encuentra distribuido en forma equitativa,

36

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 37/46

 

durante los 5 días de trabajo de la semana. Durante un período de trabajo de un mes se

registró el siguiente número de consultas por día:

Lunes Martes Miércoles Jueves Viernes49 35 32 39 45

Usando 05,0=α   , ¿existe alguna razón para creer que el número de empleados que asisten

al consultorio médico, no se encuentra distribuido en forma equitativa durante los días de

trabajo de la semana?

Con estos datos complete el siguiente cuadro y dibuje el gráfico correspondiente.

1.- Hipótesis

2.- Nivel de significación Alfa = 0,05

3.- Estadístico de prueba

4.- Probabilidad

5.- Comparación de la probabilidad encontrada con el

nivel de significación y decisión.

6.- Conclusión

Para Tener Presente

La prueba Ji cuadrado se usa para someter a prueba hipótesis referidas adistribuciones de frecuencias.

Esta prueba contrasta frecuencias observadas con frecuencias esperadas.

Sus usos son dos:- Prueba de asociación, en que se prueba la dependencia o independencia entredos variables.- Prueba de bondad de un ajuste, en que se prueba si una determinadadistribución de frecuencias se “ajusta” a un modelo teórico.

37

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 38/46

 

El valor de Ji cuadrado está determinado por los grados de libertad, que secalculan de la siguiente manera:- Prueba de asociación (filas – 1) x (columnas – 1)- Prueba de bondad de un ajuste: filas – 1

Capítulo IV

Generalidad de Análisis de Varianza (ANOVA) y Regresión

Introducción

Cuando trabajamos con variables cuantitativas continuas, por su misma naturaleza, las

 posibilidades de análisis estadístico se extienden hasta el infinito. Así de inmensa es

también la riqueza de conclusiones que podremos extraer. Esto se ha desarrollado demanera explosiva gracias a los programas estadísticos a los que en la actualidad tenemos

acceso. Sin embargo, siempre se necesitará la interpretación de esos resultados que a veces

con un simple click tenemos en nuestras manos.

Ejemplos de lo anterior son el análisis de varianza, conocido como ANOVA y la regresión

lineal simple y múltiple, entre otros métodos, algunos muy complejos.

Análisis de Varianza

La técnica del análisis de varianza se aplica con distintos objetivos. Es frecuente su uso en

el análisis de resultados de estudios que utilizan diseños de asignación aleatorizada, en que

se comparan simultáneamente varias combinaciones experimentales. En este capítulo nos

38

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 39/46

 

limitaremos a hacer uso del análisis de varianza para la comparación de promedios de más

de dos muestras.

A diferencia de los capítulos anteriores, no entregaremos el detalle de los cálculos

necesarios para hacer el análisis, sino que, siguiendo el enfoque general de los problemas

de pruebas de hipótesis:▪ señalaremos la oportunidad de su aplicación,

▪ identificaremos los elementos que participan en el análisis,

▪ veremos la forma adecuada de plantear las hipótesis,

▪ identificaremos la distribución de probabilidad del estadístico de prueba,

▪ revisaremos los criterios de decisión,

▪ y orientaremos al estudiante en la elaboración de las conclusiones.

En todo este proceso supondremos que el valor del estadístico de prueba se obtiene con

cualquier programa estadístico de computación.

El método de análisis de varianza es apropiado para someter a prueba la hipótesisde que los promedios de tres o más muestras son iguales.

Para empezar debemos señalar que se trabaja con los valores individuales, que tienen

variabilidad dentro de cada grupo en estudio y también existe variabilidad entre los grupos.

La varianza total, entonces, se descompone en: varianza entre grupos y varianza dentro delos grupos.

El estadístico de prueba (f) es el cuociente entre estas dos varianzas. Si elresultado es igual a 1 significa que ambas varianzas son iguales y por lo tanto lavariación entre los grupos es equivalente a la variación dentro de los grupos. Si elestadístico “f” resulta ser suficientemente mayor que 1, diremos que la varianzaentre los grupos es mayor que la varianza dentro de los grupos y que, por lo tanto,los grupos difieren entre sí.

Las hipótesis serán:

3210 : µ  µ  µ  == H  …, los promedios son iguales

:1 H  al menos 2 promedios son diferentes

El estadístico de prueba es2

1

V  F  = cuyos valores de probabilidad asociados se

encuentran en la tabla de Fisher que ocupa las páginas 5, 6 y 7 de las tablas estadísticas

(Véase Anexo 1: Tablas estadísticas).

39

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 40/46

 

En la fórmula de F, V1 representa la varianza entre los grupos y V2 representa la varianza

dentro de los grupos.

Para buscar los valores de F en la tabla se necesitan los grados de libertad; ahora veremos,

con un ejemplo, cómo se obtienen.

Consideremos el siguiente caso:

En un estudio para medir los niveles de actividad de la fosfatasaalcalina del suero en niños con problemas de crecimiento, se tomaron45 niños que fueron clasificados en 4 grupos, según el medicamentoque estaban recibiendo.

Se entregan, en una tabla, los resultados de los niveles de actividad de la fosfatasa alcalina

 para los 45 niños, separados en cuatro grupos de acuerdo al medicamento. Se calcula el

estadístico de prueba resultando: F = 3,57.

¿Se puede afirmar que la actividad media de la fosfatasa alcalina es la mismapara los cuatro grupos?

Solución:

43210 : µ  µ  µ  µ  === H 

H1: al menos 2 promedios son diferentes.

Elegimos alfa = 0,05.

Cálculo de grados de libertad:

Para F en la tabla de Ficher, necesitamos calcular 2 tipos de grados de libertad quellamaremos n1 y n2, tal como aparecen en la tabla, definidos como sigue:

n1 = número de grupos – 1

 

n2 = número de sujetos – número de

grupos

Del problema se desprende que son 45 sujetos y 4 grupos, por lo tanto los grados de

libertad serán:

n1 = 4-1 = 3

yn2 = 45-4 = 41

Ahora podemos buscar en la tabla de Fisher el valor correspondiente a n1 = 3 grados delibertad en la primera fila, y n2 = 41 grados de libertad en la primera columna. Como no

40

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 41/46

 

existe n2 = 41, tomamos 40, ubicado en la página 7. Podemos ver que donde se cruza la

columna de n1 = 3 con la fila de n2 = 40. Encontramos dos valores: 2,84 para alfa de 0,05 y

4,31 (en negrita) para alfa de 0,01.

Ya que el alfa elegido por nosotros es 0,05, usamos 2,84 para compararlo con el valor 

calculado de F = 3,57 entregado como dato del problema.

Como 3,57 se encuentra a la derecha del valor de tabla f = 2,84, la probabilidad deencontrar un valor mayor que él es inferior al nivel de significación. Esto nos permite

rechazar la hipótesis nula (ver gráfico).

Podemos concluir, entonces, que el promedio de actividad de la fosfatasa alcalina no es el

mismo para todos los grupos.

LINK EPI

Seguramente en la práctica usted dispondrá de los resultados de su estudio en una planilla o

 base de datos y pedirá al computador que haga un análisis de varianza (ANOVA) a susdatos. El computador obedientemente le entregará, como resultado, el valor del estadístico

de prueba (f) con una probabilidad asociada (p). Usted comparará ese valor de “p” con alfa:si p es menor que alfa, usted rechazará la hipótesis nula y concluirá que los promedios delas muestras no son iguales. Es muy probable que, aunque usted no haya realizado los

cálculos, si logra interpretar adecuadamente los resultados entregados por el computador,

sienta un mayor nivel de autonomía en el vuelo estadístico.

41

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 42/46

 

Regresión Lineal

A menudo, es necesario resolver en la práctica problemas que involucran a conjuntos de

variables que están relacionadas entre sí. En estas situaciones es posible identificar una

variable dependiente o respuesta y un conjunto de variables independientes o de regresión.

La variable respuesta depende de las variables de regresión.

Se concibe la regresión como el proceso de ajuste de un modelo o ecuaciónmatemática a la relación de un conjunto de variables.

En este capítulo haremos una revisión conceptual del modelo de regresión lineal simple,

con sólo una variable de regresión.

Supongamos, como ejemplo, que se quiere obtener un modelo de regresión lineal para la

relación entre las variables cantidad de lluvia caída y partículas de contaminación en el aire.

Se dispone de un listado con los datos correspondientes a 9 días de observación.

El modelo que se busca está representado por la ecuación de la recta

bxa y +=

Donde  y

representa la estimación del valor de la variable dependiente (partículas decontaminación) para un valor cualquiera de la variable independiente x (lluvia).

▪ “a” representa el valor que tomará  y

cuando x sea cero, es decir, la cantidad de partículas de contaminación que se estiman cuando no caiga lluvia.

▪ “b” es el incremento que experimentará la variable partículas de contaminación por cada unidad de lluvia caída, corresponde a la pendiente de la recta.

▪ “x” representa, en el modelo, la cantidad de lluvia caída.

En el siguiente cuadro se muestran los datos del problema y los calculos preliminares paraobtener los valores de “a” y “b” en el modelo de regresión que se ajuste mejor a los datos

del problema.

En las últimas filas del cuadro siguiente están los valores calculados de “a” y “b”.

42

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 43/46

 

x=lluviay=contaminación X2 Y2 xy

4,3 126 18,49 15876 541,8

4,5 121 20,25 14641 544,5

5,9 116 34,81 13456 684,4

5,6 118 31,36 13924 660,8

6,1 114 37,21 12996 695,4

5,2 118 27,04 13924 613,6

3,8 132 14,44 17424 501,6

2,1 141 4,41 19881 296,1

7,5 108 56,25 11664 810

45 1094 244,26 133786 5348,2

b =-6,3

a=153

En el gráfico se ha dibujado la nube de puntos que muestra los datos del problema y la rectarepresenta al modelo de regresión, que es la recta que mejor se ajusta a la relación entre las

variables.

A continuación procederemos a la interpretación de los valores calculados y al finalentregaremos las fórmulas utilizadas para su cálculo.

El modelo de regresión que mejor describe la relación entre las variables estudiadas es:

   x y 3,6153 −=

Este modelo indica que cuando no llueve hay 153 partículas de contaminación y por cadaunidad de lluvia caída la contaminación disminuye en 6,3 partículas.

Usando el modelo obtenido es posible estimar el número de partículas de contaminaciónque debiera haber en un día con 8,5 unidades de lluvia.

43

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 44/46

 

5,83,6153 ×−= y

 45,99= y

Por lo tanto se estima que en un día con 8,5 unidades de lluvia habrá 99,45 partículas de

contaminación.

Suponemos que los engorrosos cálculos que implica la obtención de resultados en estas

materias serán encargados a las computadoras pero de todos modos, por si alguien quisiera

revisar los cálculos de este ejemplo, entregaremos las fórmulas para obtener a y b en elmodelo de regresión.

[ ]∑ ∑∑ ∑ ∑

−=

22 x xn

 y x xynb  

 xb ya −=

De la última fila de la tabla de cálculos se pueden extraer los siguientes elementos

45=∑ x ∑ =1094 y ∑ = 2,5348 xy 26,2442

=∑ x

La regresión es un tema muy amplio y lo que aquí hemos revisado es sóloun barniz de iniciación.

Se pueden construir intervalos de confianza para los valores de a y b, también se pueden

enunciar hipótesis respecto de ellos en la población.

Las estimaciones realizadas para valores de contaminación en determinados niveles de

lluvia podrían llevar asociados niveles de confianza.

Lo dejaremos hasta aquí, pero son temas que en el futuro podrían ser revisados con mayor 

detención.

44

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 45/46

 

Finalización del Módulo 3

Resumen

En este módulo se entregaron los elementos para realizar las pruebas de hipótesismás corrientemente usadas.

En primer lugar se presentó una definición de hipótesis, señalando que estánreferidas a parámetros o valores en el universo.

Se presentó un esquema de trabajo común para todas las pruebas y que esel siguiente:

1. Plantear las hipótesis en términos estadísticos: Hipótesis Nula e HipótesisAlternativa.2. Elegir un nivel de significación o alfa (α  ): Se utilizan valores iguales o inferioresa 0,05.3. Calcular el estadístico de prueba con los datos muestrales.4. Buscar, en la tabla correspondiente, la probabilidad asociada a ese valor delestadístico.5. Comparar la probabilidad obtenida en la tabla con el nivel de significación

elegido en el punto 2 y tomar una decisión respecto de las hipótesis.6. Elaborar una conclusión derivada de la decisión.Apoyar el proceso de análisis con un gráfico del problema.

Luego, ilustrando con un ejemplo y un ejercicio para cada caso, sedesarrollaron las pruebas de hipótesis para cada una de las siguientessituaciones:

1. Prueba de hipótesis para comparar una muestra con el universo.a) Comparación promedio de muestra versus promedio del universo,

conociendo la desviación estándar del universo.

 b) Comparación de promedio de muestral con el promedio del universo SINconocer la desviación estándar del universo.

c) Comparación de porcentaje muestral con porcentaje del universo.2. Prueba de hipótesis para comparar dos muestras

a) Comparación de los promedios de dos muestras independientes (convarianzas desconocidas e iguales).

b) Comparación de dos muestras con observaciones pareadas.c) Comparación de los porcentajes de dos muestras.

3. Prueba de Ji cuadrado

45

5/6/2018 Test de Hipotesis - slidepdf.com

http://slidepdf.com/reader/full/test-de-hipotesis 46/46

 

a) Prueba de asociaciónb) Prueba de la bondad de un ajuste.

Por último, se expone en términos generales, el uso del análisis de varianza y laregresión múltiple.

46