UAP Facultad de Ingenieríasuap.edu.pe/.../20101DA02010220802010402114074.pdf · Estas pruebas no...

19
UAP Facultad de Ingenierías Gladys Enríquez Mantilla 175 PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS Estas pruebas no se basan en ninguna suposición en cuanto a la distribución de probabilidad a partir de la que fueron obtenidos los datos. Son muy útiles cuando no puede suponerse que los datos cumplen las condiciones de una prueba paramétrica o cuando los datos se presentan en forma ordinal. Las principales pruebas no paramétricas son: Prueba no Paramétrica Su alternativa Paramétrica Prueba de Rachas - Prueba del Signo para una muestra. Prueba de Wilcoxon para una muestra. Prueba t para la media. Prueba del Signo para 2 muestras pareadas. Prueba de Wilcoxon para 2 muestras pareadas. Prueba t para datos pareados. Prueba U de Mann-Whitney. Prueba t para dos muestras independientes. Prueba de Kruskal-Wallis. Anova de un factor. Prueba de Friedman Anova de un factor y un bloque Coeficiente de Correlación por Rangos de Spearman Coeficiente de Correlación de Pearson. Ventajas: - El procedimiento es relativamente fácil de entender y de aplicar. - Su uso es apropiado para muestras de tamaño mayor o igual que 25. - No se afectan significativamente en presencia de observaciones atípicas o outliers. - Si uno o más de los supuestos distribucionales en una prueba paramétrica no se cumplen, la correspondiente prueba no paramétrica es más eficiente. - Tienen un gran campo de aplicación. Desventajas: - Serán menos eficientes que el procedimiento paramétrico correspondiente cuando se pueden aplicar ambos métodos. Es decir, si se puede utilizar una prueba paramétrica y se usa una no paramétrica, entonces hay una pérdida de información. - Son menos eficientes si las muestras son menores que 25..

Transcript of UAP Facultad de Ingenieríasuap.edu.pe/.../20101DA02010220802010402114074.pdf · Estas pruebas no...

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

175

PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS

Estas pruebas no se basan en ninguna suposición en cuanto a la distribución de probabilidad a partir de la que fueron obtenidos los datos. Son muy útiles cuando no puede suponerse que los datos cumplen las condiciones de una prueba paramétrica o cuando los datos se presentan en forma ordinal. Las principales pruebas no paramétricas son:

Prueba no Paramétrica Su alternativa Paramétrica Prueba de Rachas -

Prueba del Signo para una muestra. Prueba de Wilcoxon para una muestra.

Prueba t para la media.

Prueba del Signo para 2 muestras pareadas. Prueba de Wilcoxon para 2 muestras pareadas.

Prueba t para datos pareados.

Prueba U de Mann-Whitney. Prueba t para dos muestras independientes.

Prueba de Kruskal-Wallis. Anova de un factor.

Prueba de Friedman Anova de un factor y un bloque

Coeficiente de Correlación por Rangos de Spearman

Coeficiente de Correlación de Pearson.

Ventajas:

- El procedimiento es relativamente fácil de entender y de aplicar. - Su uso es apropiado para muestras de tamaño mayor o igual que 25. - No se afectan significativamente en presencia de observaciones atípicas o

outliers. - Si uno o más de los supuestos distribucionales en una prueba paramétrica no se

cumplen, la correspondiente prueba no paramétrica es más eficiente. - Tienen un gran campo de aplicación.

Desventajas:

- Serán menos eficientes que el procedimiento paramétrico correspondiente cuando se pueden aplicar ambos métodos. Es decir, si se puede utilizar una prueba paramétrica y se usa una no paramétrica, entonces hay una pérdida de información.

- Son menos eficientes si las muestras son menores que 25..

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

176

PRUEBA DE RACHAS

Se llama racha a la interacción entre elementos iguales dentro de una secuencia de sucesos observables. El número de elementos de una racha se llama longitud. Por ejemplo, si se tiene la secuencia de dos sucesos A y B:

AAA BB A BB AA BBB ésta tiene 6 rachas Cuyas longitudes son: 3 2 1 2 2 3

Si en una muestra, la aparición de un elemento condiciona la aparición de otro; entonces la muestra no es aleatoria. Esta prueba se utiliza para determinar si la muestra fue extraída de manera aleatoria; es decir si es aleatorio el orden de aparición de dos valores de una variable. Hipótesis:

:H0 La muestra es aleatoria. :H1 La muestra no es aleatoria.

Ejemplo: El registro de juegos perdidos y ganados por un equipo de fútbol en sus últimos 60 partidos consecutivos fue el siguiente: Resultado G G G G G G P G G G G G G P G G G G G G G P P P G G P P P P G P P P P G P P P P G G P P G G G G P G G G G P G G G G G G

¿Se puede afirmar que los resultados han sido aleatorios? Hipótesis:

.aleatoriossidohannoresultadosLos:H.aleatoriossidohanresultadosLos:H

1

0

Ingresar los datos:

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

177

Luego, codificar estos datos texto en datos numéricos: asignando 1 a G y 2 a P. Manip – Code – Tex to Numeric…

OK

Stat – Nonparametrics - Runs Test…

OK

Runs Test: C2 C2

K = 1.3500

The observed number of runs = 19 The expected number of runs = 28.3000 21 Observations above K 39 below

The test is significant at 0.0077 Interpretación: P= 0.0077 entonces se acepta 1H por lo tanto los resultados no han sido

aleatorios.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

178

PRUEBA DEL SIGNO

Para un grupo: Se utiliza para probar hipótesis sobre la mediana de un grupo con distribución continua. Es una alternativa a la prueba t para la media poblacional.

Sobre la base de una muestra aleatoria de tamaño n, se sustituye cada valor de la muestra mayor que la mediana con el signo positivo (+) y cada valor menor que la mediana con el signo negativo (-). Hipótesis:

:H0 La mediana poblacional es igual a un valor dado. :H1 La mediana poblacional es menor (mayor o diferente) del valor dado.

Para dos grupos: Se utiliza para probar la hipótesis sobre la mediana con grupos pareados o dependientes. Se estudia la diferencia para cada par de observaciones pero no se estudian los dos grupos individualmente como se hacía en las pruebas paramétricas. La prueba del Signo no toma en cuenta la magnitud de la diferencia. Hipótesis:

:H0 La diferencia es cero (no hay cambio). :H1 La diferencia es menor (mayor o diferente) de cero.

Ejemplo 1: Prueba del Signo para un grupo. Se supone que el peso mediano de un grupo de personas con sobrepeso es inferior a 97 kilos. Los datos obtenidos son los siguientes:

96.4 96.0 95.3 97.0 96.5 96.8 93.2 95.2 95.2 100.3 99.1 98.5 97.3 97.0 96.1 94.9

¿Es correcta dicha afirmación? Solución: Hipótesis:

97quemenoresmedianaLa:H97aigualoeriorsupesmedianaLa:H

1

0

• INGRESAR LOS DATOS:

C1

Peso 96.4 96

95.3 97

96.5 96.8 93.2 95.2 etc.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

179

Stat – Nonparametrics – 1-Sample Sign…

Sign Test for Median: Peso Sign test of median = 97.00 versus < 97.00 N Below Equal Above P Median Peso 16 10 2 4 0.0898 96.45

Interpretación: Como el valor P es mayor que 0.05, entonces con una confianza del 95% concluimos que la mediana no es menor que 97. Se acepta Ho.

Ejemplo 2: Prueba del Signo para dos grupos pareados. Se desea hacer un estudio para comparar la energía en reposo usada por personas con cierta enfermedad vs. La energía en reposo usada por personas sanas. Para ello se eligen al azar pares de personas (pacientes de la misma edad, sexo, estatura y peso) enfermas y sanas. Los datos son los siguientes:

Energía usada por pacientes par

enfermos sanos 1 1153 996 2 1132 1080 3 1165 1182 4 1460 1452 5 1634 1162 6 1493 1619 7 1358 1140 8 1453 1123 9 1185 1113 10 1824 1463 11 1793 1632 12 1930 1614 13 2075 1836

Obtener una conclusión significativa.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

180

Solución: Hipótesis:

:H0 No hay diferencia entre personas sanas y enfermas. (La mediana de las diferencias es cero) :H1 Sí hay diferencia entre personas sanas y enfermas.

• INGRESAR LOS DATOS:

C1 C2 C3 enfermos sanos Diferencia

1153 996 1132 1080 1165 1182 1460 1452 1634 1162 1493 1619 1358 1140 1453 1123 1185 1113 1824 1463 1793 1632 1930 1614 2075 1836

En la columna C3 escribir como título: Diferencia Calc – Calculator…

En la columna C3 aparecerá el resultado de restar la columna C1 menos la columna C2.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

181

Stat – Nonparametrics – 1-Sample Sign…

Sign Test for Median: Diferencia Sign test of median = 0.00000 versus not = 0.00000 N Below Equal Above P Median Diferenc 13 2 0 11 0.0225 161.0 Interpretación: Como el valor P es menor que 0.05, entonces con una confianza del 95% concluimos que la mediana no es cero, es decir existen evidencias para afirmar que sí hay diferencias entre personas sanas y enfermas en cuanto a la energía usada en reposo. Se acepta la hipótesis alternativa.

PRUEBA DE WILCOXON

Esta prueba se utiliza para probar hipótesis relativas a la mediana con un solo grupo o con grupos pareados o dependientes en una población simétrica, es decir se utiliza en los mismos casos que la prueba del signo pero la diferencia radica en que la prueba de Wilcoxon es un procedimiento que utiliza tanto la dirección (signo) como la magnitud mientras que la prueba del Signo considera sólo la dirección. Esta prueba considera que si la hipótesis nula fuera cierta, las diferencias negativas serían similares en cantidad y tamaño a las diferencias positivas. Para un grupo: Hipótesis:

:H0 La mediana poblacional es igual a un valor dado. :H1 La mediana poblacional es menor (mayor o diferente) del valor dado.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

182

Para dos grupos: Hipótesis:

:H0 La diferencia es cero (no hay cambio). :H1 La diferencia es menor (mayor o diferente) de cero.

Ejemplo 1: Prueba de Wilcoxon para un grupo. Un actuario de una compañía de seguros desea examinar los registros de reclamos por robo de las personas que tienen póliza contra incendio y robo. En el pasado, la mediana fue de 85 dólares por reclamo. Se toma una muestra aleatoria de 18 reclamos y los resultados, expresados en dólares, son los siguientes:

140 92 35 202 80 87 80 100 47 25 160 68 50 65 310 90 75 120

¿Ha aumentado significativamente la mediana? Solución: Hipótesis:

:H0 La mediana no ha aumentado. :H1 La mediana ha aumentado. ( Me > 85 )

• INGRESAR LOS DATOS:

Stat – Nonparametrics – 1 Sample Wilcoxon…

OK

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

183

Wilcoxon Signed Rank Test: Reclamos Test of median = 85.00 versus median > 85.00 N for Wilcoxon Estimated N Test Statistic P Median Reclamos 18 18 91.5 0.405 87.50

Interpretación: Como el valor P es mayor que 0.05, entonces con una confianza del 95% concluimos que la mediana no es mayor que 85. Se acepta Ho. Ejemplo 2: Prueba de Wilcoxon para dos grupos pareados. Adamson estudió los efectos sobre la salud causados por la exposición diaria a fuertes ejercicios físicos en unos varones voluntarios. Para ocho de los sujetos la tabla muestra los niveles nocturnos de plasma corticostiroide observados en controles las noches anteriores y posteriores a los ejercicios.

Antes 69.9 46.0 63.7 55.9 53.9 72.9 53.9 36.5 Después 49.9 45.9 47.5 57.9 47.1 50.3 36.7 31.4

¿Se puede afirmar que el nivel nocturno de plasma corticostiroide disminuye con los ejercicios? Solución: Hipótesis:

:H0 La mediana de las diferencias no es mayor que cero. :H1 La mediana de las diferencias es mayor que cero.

• INGRESAR LOS DATOS:

C1 C2 C3

Antes Después Diferencia 69.9 49.9 46 45.9

63.7 47.5 55.9 57.9 53.9 47.1 72.9 50.3 53.9 36.7 36.5 31.4

En la columna C3 escribir como título: Diferencia

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

184

Calc – Calculator…

En la columna C3 aparecerá el resultado de restar la columna C1 menos la columna C2. Stat – Nonparametrics – 1- Sample Wilcoxon…

Wilcoxon Signed Rank Test: Diferencia Test of median = 0.000000 versus median > 0.000000 N for Wilcoxon Estimated N Test Statistic P Median Diferenc 8 8 34.0 0.015 10.90

Interpretación: Como P es menor que 0.05 entonces se acepta la hipótesis alternativa.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

185

PRUEBA DE MANN-WHITNEY

Esta prueba se usa cuando se quiere comparar dos poblaciones usando muestras independientes, es decir es una prueba alterna a la prueba t para comparar dos medias usando muestras independientes. Es una prueba no paramétrica que mide las diferencias entre medias, asignando rangos a cada grupo. Hipótesis:

:H0 La mediana de las dos poblaciones son iguales. :H1 La mediana de la primera población es menor (mayor o diferente) que la

mediana de la segunda población. Estadística de Prueba:

111

21 R2

)1n(nnnU −+

+=

Donde: 1n : Número de elementos en la muestra 1. 2n : Número de elementos en la muestra 2. 1R : Suma de los rangos de los elementos en la muestra 1. 2R : Suma de los rangos de los elementos en la muestra 2. Ejemplo: El director de control de calidad de una firma farmacéutica desea saber si dos métodos de producción de comprimidos proporcionan diferencias entre los espesores medianos. Una muestra aleatoria de comprimidos es extraída de lotes producidos por los dos métodos, ofreciendo los siguientes resultados que han sido codificados:

método A: 51 42 45 48 52 44 58 41 52 44 45 52 61 60 41

método B: 40 47 36 39 37 46 43 55 53 56

¿Proporcionan estos datos suficiente evidencia en contra de que las medianas poblacionales no son las mismas? Solución: Hipótesis:

:H0 Las medianas poblacionales son las mismas. :H1 Las medianas poblacionales no son las mismas.

• INGRESAR LOS DATOS:

En la columna C1 ingresar los datos del método A y en la columna C2 ingresar los datos del método B.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

186

Stat – Nonparametrics – Mann- Whitney…

Mann-Whitney Test and CI: método A, método B método A N = 15 Median = 48.00 método B N = 10 Median = 44.50 Point estimate for ETA1-ETA2 is 5.00 95.1 Percent CI for ETA1-ETA2 is (-3.00,9.00) W = 217.0 Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.2330 The test is significant at 0.2324 (adjusted for ties) Cannot reject at alpha = 0.05 Interpretación: Como P = 0.2324 es mayor que 0.05 entonces se acepta la hipótesis nula. Es decir, con una confianza del 95% podemos afirmar que estos datos proporcionan suficiente evidencia en contra de que las medianas poblacionales no son las mismas.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

187

PRUEBA DE KRUSKAL-WALLIS

Es una alternativa a la prueba F del análisis de varianza para diseños de clasificación simple. En este caso, se comparan varios grupos pero usando la mediana de cada uno de ellos, en lugar de las medias. Hipótesis:

:H0 La mediana de las k poblaciones consideradas son iguales. :H1 Al menos una de las k poblaciones tiene mediana distinta a las otras.

Ejemplo: Se tienen tres restaurantes A, B y C que elaboran los domingos el mismo menú. En cada uno de ellos se selecciona una muestra de tamaño 9, 7 y 6 respectivamente y se les pide que puntúen de 0 a 10 el grado de satisfacción y calidad que les ha proporcionado el menú. Los datos que se obtuvieron fueron:

A : 7.0 4.5 5.6 8.2 6.3 5.0 9.1 8.7 6.9 B : 5.4 6.2 8.0 7.9 4.2 6.7 9.6 C : 8.5 7.4 5.0 4.9 7.2 6.1

¿Se puede concluir que no todos los restaurantes presentan la misma mediana poblacional? Solución:

:H0 Todos los restaurantes presentan la misma mediana. :H1 No todos los restaurantes presentan la misma mediana.

• INGRESAR LOS DATOS:

C1 C2 Puntaje Restaurante

7 A 4.5 A 5.6 A 8.2 A 6.3 A 5 A

9.1 A 8.7 A 6.9 A 5.4 B 6.2 B 8 B

7.9 B 4.2 B 6.7 B 9.6 B 8.5 C 7.4 C 5 C

4.9 C 7.2 C 6.1 C

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

188

Stat – Nonparametrics – Kruskal-Wallis…

Kruskal-Wallis Test: Puntaje versus Restaurante Kruskal-Wallis Test on Puntaje Restaura N Median Ave Rank Z A 9 6.900 11.9 0.27 B 7 6.700 11.7 0.11 C 6 6.650 10.6 -0.41 Overall 22 11.5 H = 0.17 DF = 2 P = 0.919 H = 0.17 DF = 2 P = 0.919 (adjusted for ties)

Interpretación: Como p es mayor que 0.05 entonces se acepta Ho, es decir no existen evidencias como para afirmar que no todos los restaurantes presentan la misma mediana.

PRUEBA DE HIPÓTESIS DE FRIEDMAN

Se utiliza cuando se desea comparar los efectos de k tratamientos y se sabe que hay una variable que, si bien no es de interés directo, puede interferir la capacidad de detectar diferencias reales entre los k tratamientos. Estadística de Prueba:

2k

1ii 2

)1k(bRS ∑=

⎥⎦⎤

⎢⎣⎡ +

−=

Donde: k : número de tratamientos. b : número de bloques. iR : suma de los rangos asociados con cada uno de los k tratamientos.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

189

Ejemplo: Un experimento sobre la alimentación de ganado porcino se lleva a cabo mediante la comparación de tres raciones diferentes A, B y C. Se han administrado las mismas a tres cerdos de cinco camadas, obteniendo las siguientes ganancias de peso en libras:

Camadas (bloques) Ración 1 2 3 4 5

A 6.7 16.2 13.4 10.8 14.2 B 13.3 15.2 20.2 9.9 19.6 C 8.2 16.3 13.8 15.8 14.4

¿Existen diferencias en el peso ganado por cada ración a un nivel de significación del 1%? Solución:

0H : No existen diferencias en el peso ganado por cada ración.

1H : Al menos una de las raciones presenta una ganancia de peso diferente.

• INGRESAR LOS DATOS:

Stat Nonparametrics – Friedman…

OK

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

190

Friedman Test: gan Peso versus Racion, Camada Friedman test for gan Peso by Racion blocked by Camada S = 2.80 DF = 2 P = 0.247 Est Sum of Racion N Median Ranks A 5 13.433 7.0 B 5 18.867 11.0 C 5 13.800 12.0 Grand median = 15.367

Interpretación: Como P=0,247 es mayor que 0,05 entonces se acepta 0H . Es decir con una confianza del 95% se puede concluir que no existen diferencias en el peso ganado por cada ración.

COEFICIENTE DE CORRELACIÓN POR RANGOS DE SPEARMAN

La correlación de Spearman mide el grado de asociación entre dos variables cuantitativas que siguen una tendencia siempre creciente o siempre decreciente. Es decir, es más general que el coeficiente de correlación de Pearson, el cual asume que la relación entre las dos variables solamente es lineal, la correlación de Spearman en cambio se puede calcular para relaciones exponenciales o logarítmicas entre las variables. Este coeficiente se emplea cuando no se puede determinar la magnitud de las características pero sí se pueden ordenar por su tamaño o por su importancia relativa con respecto a los demás términos de la serie. El coeficiente de correlación de Spearman simplemente es la correlación de Pearson entre los rangos de los valores de las dos variables y se puede utilizar como un estadístico de prueba para verificar la independencia entre X e Y.

Para el cálculo del coeficiente de Spearman se utiliza la fórmula:

)1n(n

d61r 2

2i

S−

−= ∑

Donde: n : número de observaciones pareadas.

iyixi rrd −= es la diferencia entre los rangos de X e Y. Hipótesis: :H0 X e Y son mutuamente independientes.

:H1 X e Y no son mutuamente independientes.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

191

Ejemplo:

Como parte de un estudio, un equipo de investigadores médicos recolectó valores de secreción de aldosterorna y valores del área superficial del cuerpo en un grupo de 18 niños. Area SupCorp: 0.20 0.25 0.50 0.60 0.70 0.55 0.40 0.55 0.75 0.60 0.30 0.28 0.30 0.40 0.25 0.72 0.70 0.50 Novel Aldost. 22 41 80 50 70 110 32 69 120 30 52 36 100 100 70 22 40 50 ¿Proporcionan estos datos evidencia suficiente como para indicar que los niveles de secreción de aldosterona y los valores del área superficial del cuerpo en los niños no son independientes? Solución:

• INGRESAR LOS DATOS:

C1 C2

Area SCorp Nov Aldost. 0.2 22 0.25 41 0.5 80 0.6 50 0.7 70 0.55 110 0.4 32 0.55 69 0.75 120 0.6 30 0.3 52 0.28 36 0.3 100 0.4 100 0.25 70 0.72 22 0.7 40 0.5 50

Para calcular los rangos de cada una de estas columnas se procede de la siguiente manera: Manip – Rank…

Al presionar OK, aparecen los rangos entonces en la columna C3 se debe escribir Rango de C1.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

192

Manip – Rank…

Al presionar OK, aparecen los rangos entonces en la columna C4 se debe escribir Rango de C2.

La hoja de cálculo debe presentar las siguientes columnas:

C1 C2 C3 C4 Area SupCorp Novel Aldost. Rango de C1 Rango de C2

0.2 22 1 1.5 0.25 41 2.5 7 0.5 80 9.5 14 0.6 50 13.5 8.5 0.7 70 15.5 12.5 0.55 110 11.5 17 0.4 32 7.5 4 0.55 69 11.5 11 0.75 120 18 18 0.6 30 13.5 3 0.3 52 5.5 10 0.28 36 4 5 0.3 100 5.5 15.5 0.4 100 7.5 15.5 0.25 70 2.5 12.5 0.72 22 17 1.5 0.7 40 15.5 6 0.5 50 9.5 8.5

A continuación se encuentra el coeficiente de correlación de los rangos, es decir de las columnas C3 y C4.

UAP Facultad de Ingenierías

Gladys Enríquez Mantilla

193

Stat – Basic Statistics – Correlation…

Correlations: Rango de C1, Rango de C2 Pearson correlation of Rango de C1 and Rango de C2 = 0.124

P-Value = 0.625

Interpretación: Como p es mayor que 0.05 entonces se acepta Ho, es decir estos datos proporcionan evidencia suficiente como para indicar que los niveles de secreción de aldosterona y los valores del área superficial del cuerpo en los niños sí son independientes