Estadística no paramétrica

87

Click here to load reader

Transcript of Estadística no paramétrica

Page 1: Estadística no paramétrica

Lic. Luz María Supo Zapata

ESTADÍSTICA II

CUARTA UNIDADCUARTA UNIDAD

Page 2: Estadística no paramétrica

ESTADÍSTICA II

APLICACIÓNAPLICACIÓN

Las pruebas de hipótesis realizadas en los capítulos anteriores respecto a los parámetros poblacionales de medias, proporciones o varianzas son hechas bajo supuestos a las poblaciones, tales como supuestos de normalidad.

Lamentablemente no todas las poblaciones cumplen con este supuesto, pero existen técnicas estadísticas útiles que no necesitan de supuestos de las poblaciones conocidas como Pruebas No Paramétricas o pruebas de distribución libre.

Page 3: Estadística no paramétrica

ESTADÍSTICA II

PRUEBAS NO PARAMÉTRICAS MÁS UTILIZADAS

PRUEBAS NO PARAMÉTRICAS MÁS UTILIZADAS

1. Prueba de signos

2. Prueba Chi – cuadrado

2.1     Prueba de Bondad de ajuste

2.2     Prueba de Independencia y homogeneidad

3. Prueba de Kruskal – Wallis

4. Correlación de Rangos de Spearman

5. Prueba de rachas

Page 4: Estadística no paramétrica

ESTADÍSTICA II

VENTAJAS DE LAS PRUEBAS NO PARAMÉTRICAS

VENTAJAS DE LAS PRUEBAS NO PARAMÉTRICAS

1. No requiere que hagamos la suposición de que las poblaciones distribuidas normalmente.

2. Se aplican a datos categóricos

3. Implican cálculos más sencillos, por lo tanto son más fáciles de entender y aplicar

Page 5: Estadística no paramétrica

ESTADÍSTICA II

DESVENTAJAS DE LAS PRUEBAS NO PARAMÉTRICAS

DESVENTAJAS DE LAS PRUEBAS NO PARAMÉTRICAS

1. Desperdician información, ya que los datos originales se reducen a una forma cualitativa

2. A menudo no son tan eficientes como las prueba paramétricas por lo tanto se necesita evidencias más fuertes

Page 6: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICA NO PARAMÉTRICAESTADÍSTICA NO PARAMÉTRICA

Page 7: Estadística no paramétrica

ESTADÍSTICA II

PRUEBA DE SIGNOSPRUEBA DE SIGNOS

Se le llama prueba del signo porque la información contenida en la muestra seleccionada se puede transformar en un conjunto de signos más y menos, y cuando se hace la prueba no se hace uso de la magnitud de los valores de la muestra, sino solamente se consideran los signos.

Page 8: Estadística no paramétrica

ESTADÍSTICA II

PRUEBA DE SIGNOSPRUEBA DE SIGNOS

Se pueden probar estas aseveraciones:

1.Aseveraciones que incluyen datos apareados de datos muestrales.

2.Aseveraciones que incluyen datos nominales.

3.Aseveraciones acerca de la mediana de una sola población.

Page 9: Estadística no paramétrica

ESTADÍSTICA II

REQUISITOSREQUISITOS

1. Los datos muestrales se seleccionan aleatoriamente

2. No existe el requisito de que los datos muestrales provengan de una población con una distribución particular, como la distribución normal

Page 10: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICO DE PRUEBAESTADÍSTICO DE PRUEBA

1. Para n≤25

x : el número de veces que ocurre el signo menos frecuente

n: el número total, de signos positivos y negativos combinados

Los valores críticos x se encuentran en la Tabla A-7

Page 11: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICO DE PRUEBAESTADÍSTICO DE PRUEBA

1. Para n>25

x : el número de veces que ocurre el signo menos frecuente

n: el número total, de signos positivos y negativos combinados

Los valores críticos x se encuentran en la Tabla A-2

Page 12: Estadística no paramétrica

ESTADÍSTICA II

ASEVERACIÓN QUE INCLUYE DATOS APAREADOS

ASEVERACIÓN QUE INCLUYE DATOS APAREADOS

Procedimiento:

1. Restamos cada valor de la segunda variable del valor correspondiente de la primera variable

2. Registramos sólo el signo de la diferencia que se encontró en el paso 1. Excluimos los empates

“Si dos conjuntos de datos tienen medianas iguales, el número de signos positivos debe ser aproximadamente igual al número de signos negativos”

Page 13: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO:DIFERENCIA ENTRE TEMPERATURAS REALES Y PRONOSTICADAS

EJEMPLO:DIFERENCIA ENTRE TEMPERATURAS REALES Y PRONOSTICADAS

Los siguientes datos corresponden a temperaturas máximas reales y el pronóstico de temperaturas máximas de tres días. ¿Parece existir una diferencia?

Real Máxima 80 77 81 85 73 73 80 72 83 81 75 78 80 71 73 78 75 63

Pronóstico 3 días máxima

79 86 79 83 80 76 80 79 76 79 78 75 74 73 73 76 76 73

Real Máxima 63 70 77 82 81 76 77 76 74 66 66 62 71 68 66 71 58Pronóstico 3 días máxima

75 68 77 83 78 75 77 72 74 74 68 72 72 73 66 68 62

Page 14: Estadística no paramétrica

ESTADÍSTICA II

ASEVERACIÓN QUE INCLUYE DATOS NOMINALES

ASEVERACIÓN QUE INCLUYE DATOS NOMINALES

Datos nominales:

Incluyen nombres, etiquetas o categorías

“Se aplican los signos más o menos en forma arbitraria a las categorías.”

Page 15: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 1: PRUEBA PARA LA MEDIANA DEL PESO DE MONEDAS DE 25 CENTAVOS.

EJEMPLO 1: PRUEBA PARA LA MEDIANA DEL PESO DE MONEDAS DE 25 CENTAVOS.

A continuación se listan los pesos (en gramos) de monedas de 25 centavos, acuñadas después de 1964, seleccionadas al azar. Se supone que el peso de las monedas tiene una mediana de 5.670 g. Utilice un nivel de significancia de 0.05 para probar la aseveración de que la mediana es igual a 5.670 g. Al parecer, ¿las monedas están acuñadas según las especificaciones?

5.7027 5.7495 5.7050 5.5941 5.7247 5.6114 5.6160 5.5999 5.7790 5.6841

Page 16: Estadística no paramétrica

ESTADÍSTICA II

ASEVERACIÓN ACERCA DE LA MEDIANA DE UNA SOLA POBLACIÓN

ASEVERACIÓN ACERCA DE LA MEDIANA DE UNA SOLA POBLACIÓN

Los signos positivos y negativos se basan en el valor que se asevera para la mediana.

Page 17: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 2: TEMPERATURAS CORPORALESEJEMPLO 2: TEMPERATURAS CORPORALES

Las temperaturas corporales medidas a 106 adultos. para probar. con la prueba de signos, la aseveración de que la mediana es menor que 98.6°F. El conjunto de datos tiene 106 sujetos: 68 sujetos con temperaturas por debajo de 98.6°F, 23 sujetos con temperaturas por encima de 98.6°F y 15 sujetos con temperaturas iguales a 98.6°F

Page 18: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICA NO PARAMÉTRICAESTADÍSTICA NO PARAMÉTRICA

PARA DATOS APAREADOS

Page 19: Estadística no paramétrica

ESTADÍSTICA II

PRUEBA DE RANGOS CON SIGNOS DE WILCOXON

PRUEBA DE RANGOS CON SIGNOS DE WILCOXON

Utiliza rangos ordenados de datos muestrales consistentes en datos apareados

Se usa para probar las diferencias en las distribuciones poblacionales y para probar la aseveración de que una muestra proviene de una población con una mediana específica.

Page 20: Estadística no paramétrica

ESTADÍSTICA II

PLANTEAMIENTO DE HIPÓTESISPLANTEAMIENTO DE HIPÓTESIS

H0: Los datos apareados .tienen diferencias que provienen de una población con una mediana igual a cero

H1: Los datos apareados .tienen diferencias que provienen de una población con una mediana diferente a cero.

Page 21: Estadística no paramétrica

ESTADÍSTICA II

PROCEDIMIENTOPROCEDIMIENTO

1. Calcule d (restando el segundo valor menos el primero), descarte d=0.

2. Ignore los signos de las diferencias y ordene las diferencias de la más baja a la más alta y reemplace por el valor del rango correspondiente.

3. Adjunte a cada rango el signo de la diferencia de la que provino.

Page 22: Estadística no paramétrica

ESTADÍSTICA II

PROCEDIMIENTOPROCEDIMIENTO

4. Calcule la suma de los valores absolutos de los rangos negativos. También de los rangos positivos.

5. Utilice T que sea la más pequeña de las dos sumas que se calcularon en el paso 4.

6. Utilice n que sea el número de pares de datos para los que la diferencia d no es cero.

Page 23: Estadística no paramétrica

ESTADÍSTICA II

PROCEDIMIENTOPROCEDIMIENTO

7. Determine el estadístico de prueba y los valores críticos.

8. Tome su decisión y conclusión apropiada.

Page 24: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICO DE PRUBEBAESTADÍSTICO DE PRUBEBA

Si n≤30 el Estadístico de prueba es TDonde T es el más pequeño de las siguientes sumas:1.La suma de los valores absolutos de los rangos negativos de las diferencias d que no sean ceros.2.La suma de los rangos positivos de las diferencias d que no sean ceros

El valor crítico de T se encuentra en la tabla A-8

Page 25: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICO DE PRUEBAESTADÍSTICO DE PRUEBA

Si n>30 usar el siguiente estadístico de prueba.

24)12)(1(

4)1(

nnn

nnT

z

“Los valores críticos de z se encuentran en la tabla A-2.”

Page 26: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 3EJEMPLO 3

Remítase a los datos muestrales apareados indicados y utilice la prueba de rangos con signo de Wilcoxon para probar la aseveración de que los datos apareados tienen diferencias que provienen de una población con una mediana igual a cero. Utilice un nivel de significancia de 0.05.

Page 27: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 3 (continuación)EJEMPLO 3 (continuación)

X 90 93 112 97 102 115 148 152 121

Y 88 91 115 95 103 116 150 147 119

Page 28: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICA NO PARAMÉTRICAESTADÍSTICA NO PARAMÉTRICA

PARA DOS MUESTRAS INDEPENDIENTES

Page 29: Estadística no paramétrica

ESTADÍSTICA II

PRUEBA DE LA SUMA DE RANGOS DE WILCOXON

PRUEBA DE LA SUMA DE RANGOS DE WILCOXON

Utiliza rangos de datos muestrales consistentes en muestras independientes

Se usa para probar la hipótesis nula de que las dos muestras independientes provienen de poblaciones con medianas iguales.

Es equivalente a la prueba de U de Mann-Whitney.

Page 30: Estadística no paramétrica

ESTADÍSTICA II

PLANTEAMIENTO DE HIPÓTESISPLANTEAMIENTO DE HIPÓTESIS

H0: Las dos muestras provienen de poblaciones con medianas iguales

H1: Las dos muestras provienen de poblaciones con medianas diferentes

Page 31: Estadística no paramétrica

ESTADÍSTICA II

PROCEDIMIENTOPROCEDIMIENTO

1. Combine temporalmente las dos muestras en una muestra grande y a cada valor muestral reemplace su rango.

2. Calcule la suma de los rangos de las dos muestras

3. Calcule el valor del estadístico de prueba z.

Page 32: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICA DE PRUEBAESTADÍSTICA DE PRUEBA

R

RRz

2

)1( 211

nnnR

12

)1( 2121

nnnnR

Valores CríticosLos valores críticos se encuentran en la tabla A-2.

Page 33: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 4:PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE LA ANTIGÜEDAD DE AUTOMÓVILES Y TAXIS.

EJEMPLO 4:PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE LA ANTIGÜEDAD DE AUTOMÓVILES Y TAXIS.

Cuando el autor visitó Dublín en Irlanda, registró la antigüedad de automóviles y taxis seleccionados al azar. A continuación se listan las antigüedades (en años). Utilice un nivel de significancia de 0.05 para probar la aseveración de que existe una diferencia entre la mediana de la antigüedad de un automóvil de Dublín y la mediana de la antigüedad de un taxi de Dublín.

Page 34: Estadística no paramétrica

ESTADÍSTICA II

Podríamos esperar que los taxis fueran más nuevos, pero, ¿qué sugieren los resultados?

AUTOMOVILES

4 0 8 11 14 3 4 4 3 58 3 3 7 4 6 6 1 8 2 1511 4 1 6 1 8

TAXIS

8 8 0 3 8 4 3 3 6 117 7 6 9 5 10 8 4 3 4

EJEMPLO 4:PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE LA ANTIGÜEDAD DE AUTOMÓVILES Y TAXIS(continuación)

EJEMPLO 4:PRUEBA DE HIPÓTESIS DE LA DIFERENCIA DE LA ANTIGÜEDAD DE AUTOMÓVILES Y TAXIS(continuación)

Page 35: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICA NO PARAMÉTRICAESTADÍSTICA NO PARAMÉTRICA

Page 36: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICO DE PRUEBAESTADÍSTICO DE PRUEBA

12

1(2

2121

21

nnnn

nnU

z

Rnn

nnU

2

)1( 1121

Es equivalente a la prueba de la suma de rangos de Wilcoxon para muestras independientes.

Donde:

Page 37: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICA NO PARAMÉTRICAESTADÍSTICA NO PARAMÉTRICA

PRUEBA DE BONDAD DE AJUSTE

Page 38: Estadística no paramétrica

ESTADÍSTICA II

PRUEBA DE BONDAD DE AJUSTEPRUEBA DE BONDAD DE AJUSTE

La prueba de bondad de ajuste se utiliza para determinar si la distribución de los valores en la población se ajusta a una forma particular planteada como hipótesis.

Por ejemplo una distribución uniforme.

Page 39: Estadística no paramétrica

ESTADÍSTICA II

LA HIPÓTESISLA HIPÓTESIS

H0: La población sigue la distribución ...

H1: La población no sigue la distribución ...

Page 40: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICO DE PRUEBAESTADÍSTICO DE PRUEBA

c

i i

ii

EEO

1

22 )(

En donde:Oi es la frecuencia de los eventos observados

en los datos muestrales.Ei es la frecuencia de los eventos esperados si

la hipótesis nula es correcta.x es el número de categorías o clases.

ii npE

Page 41: Estadística no paramétrica

ESTADÍSTICA II

REGLA DE DECISIÓNREGLA DE DECISIÓN

El estadístico de prueba se conpara con el valor crítico de la tabla 2 con c – 1 grados de libertad con grados de significación.Si el valor de 2 es mayor que el valor crítico, entonces rechazar la hipótesis nula H0.

gl=k-1

X2

F(x2)

RA1-

1-RR

Page 42: Estadística no paramétrica

ESTADÍSTICA II

FRECUENCIAS ESPERADAS PEQUEÑASFRECUENCIAS ESPERADAS PEQUEÑAS

Cuando c > 2, si más del 20% de las Ei son menores que 5, habrá que combinar las categorías adyacentes cuando sea razonable hacerlo, reduciendo de este modo el valor de c e incrementando los valores de algunas de las Ei.

Page 43: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 5:EL NEUMÁTICO DESINFLADO Y LA CLASE PERDIDA

EJEMPLO 5:EL NEUMÁTICO DESINFLADO Y LA CLASE PERDIDA

Un cuento clásico se refiere a cuatro estudiantes que van juntos en un automóvil y no llegan a un examen; como excusa. Dijeron al profesor que un neumático se desinfló en el camino.

Page 44: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 5:EL NEUMÁTICO DESINFLADO Y LA CLASE PERDIDA(continuación)

EJEMPLO 5:EL NEUMÁTICO DESINFLADO Y LA CLASE PERDIDA(continuación)

En el examen de recuperación, el profesor pidió a los estudiantes que identificaran el neumático en particular que se desinfló. Si en realidad no tuvieron un neumático desinflado, ¿serían capaces de identificar el mismo neumático?.

Page 45: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 5:EL NEUMÁTICO DESINFLADO Y LA CLASE PERDIDA(continuación)

EJEMPLO 5:EL NEUMÁTICO DESINFLADO Y LA CLASE PERDIDA(continuación)

El autor pidió a otros 41 estudiantes que identificaran el neumático que ellos seleccionarían. Los resultados están listados en la siguiente tabla (excepto el de un estudiante que seleccionó el neumático de refacción). Utilice un nivel de significancia de 0.05.

Page 46: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 5:EL NEUMÁTICO DESINFLADO Y LA CLASE PERDIDA(continuación)

EJEMPLO 5:EL NEUMÁTICO DESINFLADO Y LA CLASE PERDIDA(continuación)

Utilice un nivel de significancia de 0.05 para probar la aseveración del autor de que los resultados se ajustan a una distribución uniforme. ¿Qué sugiere el resultado acerca de la capacidad de los cuatro estudiantes de seleccionar el mismo neumático cuando en realidad su excusa fue una mentira?.

Page 47: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 5:EL NEUMÁTICO DESINFLADO Y LA CLASE PERDIDA(continuación)

EJEMPLO 5:EL NEUMÁTICO DESINFLADO Y LA CLASE PERDIDA(continuación)

NeumáticoFrontal izquierd

o

Frontalderecho

Traseroizquierdo

Trasero derecho

NúmeroSeleccionad

o11 15 8 6

Page 48: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 6:MUERTES POR CHOQUES DE AUTOMOVILESEJEMPLO 6:MUERTES POR CHOQUES DE AUTOMOVILES

Se seleccionaron al azar muertes por choques de automóviles y los resultados se incluyen en la siguiente tabla. Utilice un nivel de significancia de 0.05 para probar la aseveración de que las muertes por choques de automóviles ocurren con la misma frecuencia en los diferentes días de la semana.

Page 49: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 6:MUERTES POR CHOQUES DE AUTOMOVILES (continuación)

EJEMPLO 6:MUERTES POR CHOQUES DE AUTOMOVILES (continuación)

¿Cómo se explicarían los resultados? ¿Por qué parece haber un número excepcionalmente grande de muertes por choques de automóviles los sábados?

Día Dom Lun Mar Mié Jue Vie Sáb

Número de muertes

132 98 95 98 105 133 158

Page 50: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICA NO PARAMÉTRICAESTADÍSTICA NO PARAMÉTRICA

INDEPENDENCIA Y HOMOGENEIDAD

Page 51: Estadística no paramétrica

ESTADÍSTICA II

PRUEBA DE INDEPENDENCIAPRUEBA DE INDEPENDENCIA

La Prueba Chi-cuadrado de independencia también permite la comparación de dos atributos para determinar si existe una asociación entre ellos.

¿Cuándo se utiliza?

Se utiliza cuando se quiere determinar si las variables son independientes o dependientes respectivamente una de la otra.

Page 52: Estadística no paramétrica

ESTADÍSTICA II

LA HIPÓTESISLA HIPÓTESIS

H0: Las variables (fila y columna) son independientes.

H1: Las variables (fila y columna) son dependientes.

Page 53: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICO DE PRUEBAESTADÍSTICO DE PRUEBA

i

ii

E

EO 22 )(

Donde:Oi : Frecuencia Observada de la i-ésima fila

con la j-ésima columnaEi : Frecuencia Esperada de la i-ésima fila

con la j-ésima columnani : frecuencia de la i-ésima filanj : frecuencia de la j-ésima columnan : tamaño de la muestra

n

nnE jii

Page 54: Estadística no paramétrica

ESTADÍSTICA II

REGLA DE DECISIÓNREGLA DE DECISIÓN

El estadístico de prueba se compara con el valor crítico de la tabla 2 con (f - 1)(c - 1) grados de libertad con grados de significación.Si el valor de 2 es mayor que el valor crítico, entonces rechazar la hipótesis nula H0

gl=(f-1)*(c-1)

X2

F(x2)

RA1-

1-RR

Page 55: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 7:RIESGOS DE TRABAJOEJEMPLO 7:RIESGOS DE TRABAJO

Utilice los datos en la tabla para probar la aseveración de que la ocupación es independiente de que la causa de muerte sea homicidio. La tabla está basada en datos del Departamento del Trabajo de Estados Unidos, Bureau of Labor Statistics. Al parecer, ¿una ocupación en particular es más proclive a los homicidios? De ser así, ¿cuál es?

Policías Cajeros Taxistas Guardias

Homicidio 82 107 70 59

Otra causa de muerte que no es homicidio

92 9 29 42

Page 56: Estadística no paramétrica

ESTADÍSTICA II

PRUEBA DE HOMOGENEIDADPRUEBA DE HOMOGENEIDAD

Se prueba la aseveración de que las poblaciones tienen las mismas proporciones de algunos características.

Page 57: Estadística no paramétrica

ESTADÍSTICA II

LA HIPÓTESISLA HIPÓTESIS

H0: Las proporciones de las poblaciones son iguales.

H1: Las proporciones de las poblaciones no son iguales.

Page 58: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 8:¿LA EXACTITUD DEL ESCÁNER ES LA MISMA PARA LAS OFERTAS?

EJEMPLO 8:¿LA EXACTITUD DEL ESCÁNER ES LA MISMA PARA LAS OFERTAS?

¿En un estudio de sistemas de cobro por escáner en almacenes, se utilizaron muestras de compras para comparar las lecturas por escáner de los precios con los precios etiquetados. La tabla adjunta resume resultados de una muestra de 819 artículos.

Page 59: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 8:¿LA EXACTITUD DEL ESCÁNER ES LA MISMA PARA LAS OFERTAS?(continuación)

EJEMPLO 8:¿LA EXACTITUD DEL ESCÁNER ES LA MISMA PARA LAS OFERTAS?(continuación)

Cuando los almacenes utilizan escáner para cobrar los artículos, ¿las tasas de error son las mismas para los artículos con precio normal que para los artículos en oferta? ¿Cómo podría cambiar la conducta de los consumidores si creen que ocurren desproporcionadamente más cobros excesivos en los artículos en oferta?

Page 60: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 8:¿LA EXACTITUD DEL ESCÁNER ES LA MISMA PARA LAS OFERTAS?(continuación)

EJEMPLO 8:¿LA EXACTITUD DEL ESCÁNER ES LA MISMA PARA LAS OFERTAS?(continuación)

Artículos conPrecio normal

Artículos enoferta

Cobros de menos

20 7

Cobros de más 15 29

Precio correcto 384 364

Page 61: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICA NO PARAMÉTRICAESTADÍSTICA NO PARAMÉTRICA

PRUEBA H

Page 62: Estadística no paramétrica

ESTADÍSTICA II

PRUEBA DE KRUSKAL - WALLIS O PRUEBA H PRUEBA DE KRUSKAL - WALLIS O PRUEBA H

Se utiliza para probar que muestras (tres o más poblaciones) independientes provienen de poblaciones con medianas iguales.

Page 63: Estadística no paramétrica

ESTADÍSTICA II

LA HIPÓTESISLA HIPÓTESIS

H0 :Las muestras provienen de poblaciones con medianas iguales.

H1: Las muestras provienen de poblaciones con medianas que no son iguales.

Page 64: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICO DE PRUEBAESTADÍSTICO DE PRUEBA

)1(3)1(

12 2

nnR

nnH

i

i

Donde: H = valor estadístico de la prueba de Kruskal-Wallis.n = tamaño total de la muestra.Ri

2 = sumatoria de los rangos elevados al cuadrado.ni = tamaño de la muestra de cada grupo.

Page 65: Estadística no paramétrica

ESTADÍSTICA II

REGLA DE DECISIÓNREGLA DE DECISIÓN

El estadístico de prueba (H) se compara con el valor crítico de la tabla 2 con c-1 grados de libertad con grados de significación.Si el valor de H es mayor que el valor crítico, entonces rechazar la hipótesis nula H0.

gl=k-1

X2

F(x2)

RA1-

1-RR

Page 66: Estadística no paramétrica

ESTADÍSTICA II

FACTOR DE CORRECCIÓNFACTOR DE CORRECCIÓN

Debe aplicarse siempre que existan muchos empates: divida H entre.

NN

T

3

1

Para cada grupo de observaciones empatadas en el conjunto combinado de datos muéstrales, calcule:

T = t3 - t donde t es el número de observaciones que están empatadas en el grupo individual.

N es el número de observaciones en todas las muestras combinadas.

Page 67: Estadística no paramétrica

ESTADÍSTICA II

FACTOR DE CORRECCIÓNFACTOR DE CORRECCIÓN

Calcule t para cada grupo de valores empatados, luego calcule el valor de T para cada grupo, y después sume los valores T para obtener ∑T. El número total de observaciones en todas las muestras combinadas es N. Utilice este procedimiento para calcular el valor corregido de H para el ejercicio 1.

Page 68: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 9:¿AFECTA EL PESO DE UN AUTOMÓVIL LAS HERIDAS EN LA CABEZA PRODUCIDAS EN UN CHOQUE?

EJEMPLO 9:¿AFECTA EL PESO DE UN AUTOMÓVIL LAS HERIDAS EN LA CABEZA PRODUCIDAS EN UN CHOQUE?

Se obtuvieron datos de experimentos de choques realizados por la National Transportation Safety Administration. Se compraron automóviles nuevos, se impactaron contra una barrera fija a 35 mi/h y se registraron las mediciones en un maniquí en el asiento del conductor.

Page 69: Estadística no paramétrica

ESTADÍSTICA II

Utilice los datos muéstrales listados abajo para probar las diferencias en las mediciones de heridas en la cabeza (de acuerdo con el Head Injury Criterion, HIC) en cuatro categorías de peso. ¿Existe evidencia suficiente para concluir que las mediciones de heridas en la cabeza para las cuatro categorías de peso de automóviles no son las mismas?.

EJEMPLO 9:¿AFECTA EL PESO DE UN AUTOMÓVIL LAS HERIDAS EN LA CABEZA PRODUCIDAS EN UN CHOQUE?(continuación)

EJEMPLO 9:¿AFECTA EL PESO DE UN AUTOMÓVIL LAS HERIDAS EN LA CABEZA PRODUCIDAS EN UN CHOQUE?(continuación)

Page 70: Estadística no paramétrica

ESTADÍSTICA II

¿Sugieren los datos que los automóviles más pesados son más seguros en un choque?

EJEMPLO 9:¿AFECTA EL PESO DE UN AUTOMÓVIL LAS HERIDAS EN LA CABEZA PRODUCIDAS EN UN CHOQUE?(continuación)

EJEMPLO 9:¿AFECTA EL PESO DE UN AUTOMÓVIL LAS HERIDAS EN LA CABEZA PRODUCIDAS EN UN CHOQUE?(continuación)

Subcompacto

681 428 917 898 420

Compacto 643 655 442 514 525

Mediano 469 727 525 454 259

Grande 384 656 602 687 360

Page 71: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICA NO PARAMÉTRICAESTADÍSTICA NO PARAMÉTRICA

Page 72: Estadística no paramétrica

ESTADÍSTICA II

CORRELACIÓN DE RANGOS DE SPEARMAN

CORRELACIÓN DE RANGOS DE SPEARMAN

Se utiliza para probar una asociación entre dos variables con datos apareados.

Page 73: Estadística no paramétrica

ESTADÍSTICA II

LA HIPÓTESISLA HIPÓTESIS

H0 : = 0 ; No existe correlación entre las dos variables.

 

H1 : 0 ; Si existe correlación entre las dos variables.

Page 74: Estadística no paramétrica

ESTADÍSTICA II

COEFICIENTE DE CORRELACIÓN DE SPEARMAN

COEFICIENTE DE CORRELACIÓN DE SPEARMAN

Donde :di : es la diferencia entre los puntajes de cada

observación.n : Tamaño de la muestraAdemás se debe cumplir que -1 rs 1

Sin empates

Page 75: Estadística no paramétrica

ESTADÍSTICA II

Empates

COEFICIENTE DE CORRELACIÓN DE SPEARMAN

COEFICIENTE DE CORRELACIÓN DE SPEARMAN

Page 76: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICO DE PRUEBAESTADÍSTICO DE PRUEBA

Para muestras pequñas (n≤30), se hace uso de la tabla A-9.Si rs se encuentra en el intervalo de los valores críticos de la tabla A-9 entonces se acepta H0.

Page 77: Estadística no paramétrica

ESTADÍSTICA II

Para muestras grandes (n>30) la distribución de rs se aproxima a la normal, donde el estadístico de prueba es:

1 nrz s

Si el valor del estadístico de prueba es mayor que el valor crítico de z al nivel de /2 rechazar H0.

-z z

RA

RRRR

ESTADÍSTICO DE PRUEBAESTADÍSTICO DE PRUEBA

Page 78: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 10:GRILLOS Y TEMPERATURAEJEMPLO 10:GRILLOS Y TEMPERATURA

Se estudió la relación entre la temperatura y el número de veces que un grillo chirría en un minuto. Abajo se listan los números de chirridos por minuto y las temperaturas correspondientes en grados Fahrenheit (según datos de The Song of Insects, de George W. Pierce, Harvard University Press).

Page 79: Estadística no paramétrica

ESTADÍSTICA II

¿Existe evidencia suficiente para concluir que existe una relación entre el número de chirridos por minuto y la temperatura?

EJEMPLO 10:GRILLOS Y TEMPERATURA(continuación)

EJEMPLO 10:GRILLOS Y TEMPERATURA(continuación)

Chirridos en un minuto

882 1188

1104

864 1200 1032 960 900

Temperatura(enºF)

69,7 93,3 84,3 76,3 88,6 82,6 71,6 79,6

Page 80: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICA NO PARAMÉTRICAESTADÍSTICA NO PARAMÉTRICA

Page 81: Estadística no paramétrica

ESTADÍSTICA II

PRUEBA DE RACHASPRUEBA DE RACHAS

Utilizada para comprobar la aleatoriedad de las muestras.

RACHA (G) : Una serie continua de uno o más símbolos.

Page 82: Estadística no paramétrica

ESTADÍSTICA II

LA HIPÓTESISLA HIPÓTESIS

Ho : Existe aleatoriedad en la muestra.

H1 : No existe aleatoriedad en la muestra.

Page 83: Estadística no paramétrica

ESTADÍSTICA II

REGLA DE DECISIÓNREGLA DE DECISIÓN

Cuando n1 como n2 son menores o iguales a 20

Usar la Tabla A-10.

Si el valor de G no se encuentra entre los valores críticos de las tablas entonces se rechaza H0.  

Page 84: Estadística no paramétrica

ESTADÍSTICA II

Cuando n1 como n2 son mayores que 20

La distribución de la muestra se aproxima a la normalidad. Entonces se puede decir que tiene:

12

21

21

nnnn

G )1(

)2(2

212

21

212121

nnnn

nnnnnnG

Media Desviación estándar

PRUEBA DE RACHASPRUEBA DE RACHAS

Page 85: Estadística no paramétrica

ESTADÍSTICA II

ESTADÍSTICO DE PRUEBAESTADÍSTICO DE PRUEBA

G

GGZ

Sigue una Distribución Normal estandarizada

Page 86: Estadística no paramétrica

ESTADÍSTICA II

REGLA DE DECISIÓNREGLA DE DECISIÓN

Si el valor de estadístico cae fuera de la región de aceptación, H0 se rechaza.

Page 87: Estadística no paramétrica

ESTADÍSTICA II

EJEMPLO 11:GÉNEROS DE OSOSEJEMPLO 11:GÉNEROS DE OSOS

Realice una prueba de rachas para detectar aleatoriedad utilizando los géneros de 20 osos. A continuación se listan los géneros.

M M M M H H M M H H M M H M H M M H M M