UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

34
INSTITUTO TECNOLÒGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN” CARRERA: ING. ADMÒN DE EMPRESAS. MATERIA: ESTADISTICA II TRABAJO: RESUMEN DE LA UNIDAD V TEMA: “ESTADÍSTICA NO PARAMÉTRICA.” MAESTRO: ING.JOSÈ GUADALUPE RODRIGUEZ RAMOS.

description

CARRERA: ADMÒN DE EMPRESAS.ALUMNO: FELIX CASTRO GRACÌAMATERIA: ESTADISITCA II

Transcript of UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

Page 1: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

“INSTITUTO TECNOLÒGICO SUPERIOR DE LA SIERRA NEGRA DE AJALPAN”

CARRERA: ING. ADMÒN DE EMPRESAS.

MATERIA: ESTADISTICA II

TRABAJO: RESUMEN DE LA UNIDAD V

TEMA: “ESTADÍSTICA NO PARAMÉTRICA.”

MAESTRO: ING.JOSÈ GUADALUPE RODRIGUEZ RAMOS.

ELABORADO POR: FELIX CASTRO GARCÌA

FECHA DE ENTREGA: MAYO DE 2012

Page 2: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

INDICE

UNIDAD 4

ESTADÍSTICA NO PARAMÉTRICA.

5.1 Escala de medición

5.2 Métodos estadísticos contra no

Paramétricos

5.3 Prueba de corridas para

aleatoriedad

5.4 Una muestra: prueba de signos

5.5 Una muestra: prueba de Wilcoxon

5.6 Dos muestras: prueba de Mann-

Whitney

5.7 Observaciones pareadas: prueba

de signos

5.8Observaciones pareadas prueba

de Wilcoxon

5.9Varias muestras independientes:

prueba de Krauskal-Wallis

Page 3: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

INTRODUCCIÒN

La estadística no paramétrica es una rama de la estadística que estudia las

pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los

llamados criterios paramétricos. Su distribución no puede ser definida a priori (se

utilizan para distinguir entre dos tipos de conocimiento: el conocimiento a priori es

aquel que, en algún sentido importante, es independiente de la experiencia;

mientras que el conocimiento a posteriori es aquel que, en algún sentido

importante, depende de la experiencia.), pues son los datos observados los que la

determinan. La utilización de estos métodos se hace recomendable cuando no se

puede asumir que los datos se ajusten a una distribución conocida, cuando el nivel

de medida empleado no sea, como mínimo, de intervalo.

5.1 ESCALA DE MEDICIÓN

Existen diversas definiciones del término "medición", pero estas dependen de los

diferentes puntos de vista que se puedan tener al abordar el problema de la

cuantificación y el proceso mismo de la construcción de una escala o instrumento

de medición. En general, se entiende por medición la asignación de números a

elementos u objetos para representar o cuantificar una propiedad. El problema

básico está dado por la asignación un numeral que represente la magnitud de la

característica que queremos medir y que dicho números pueden analizarse por

manipulaciones de acuerdo a ciertas reglas. Por medio de la medición, los

atributos de nuestras percepciones se transforman en entidades conocidas y

manejables llamadas "números". Es evidente que el mundo resultaría caótico si no

pudiéramos medir nada. En este caso cabría preguntarse de que le serviría la

físico saber que el hierro tiene una alta temperatura de fusión.

Page 4: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

Niveles o Escalas de mediciones

Escala Nominal:

La escala de medida nominal, puede considerarse la escala de nivel más bajo, y

consiste en la asignación, puramente arbitraria de números o símbolos a cada una

de las diferentes categorías en las cuales podemos dividir el carácter que

observamos, sin que puedan establecerse relaciones entre dichas categorías, a no

ser el de que cada elemento pueda pertenecer a una y solo una de estas

categorías.

Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a

la misma sean equivalentes respecto del atributo o propiedad en estudio, después

de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar

de denominaciones, se le atribuyan números, puede ser una de las razones por

las cuales se le conoce como "medidas nominales".

Por ejemplo, podemos estar interesados en clasificar los estudiantes de la

UNESR Núcleo San Carlos de acuerdos a la carrera que cursan.

Carrera Número asignada a la categoría

Educación 1

Administración 2

Se ha de tener presente que los números asignados a cada categoría sirven única

y exclusivamente para identificar la categoría y no poseen propiedades

cuantitativas.

Escala Ordinal:

En caso de que puedan detectarse diversos grados de un atributo o propiedad de

un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse

a la propiedad de "orden" de los números asignándolo a los objetos en estudio de

Page 5: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse

que A posee un mayor grado de atributo que B.

La asignación de números a las distintas categorías no puede ser completamente

arbitraria, debe hacerse atendiendo al orden existente entre éstas.

Los caracteres que posee una escala de medida ordinal permiten, por el hecho

mismo de poder ordenar todas sus categorías, el cálculo de las medidas

estadísticas de posición, como por ejemplo la mediana.

Ejemplo:

Al asignar un número a los pacientes de una consulta médica, según el orden de

llegada, estamos llevando una escala ordinal, es decir que al primero en llegar

ordinal, es decir que al primeo en llegar le asignamos el nº 1, al siguiente el nº 2 y

así sucesivamente, de esta forma, cada número representará una categoría en

general, con un solo elemento y se puede establecer relaciones entre ellas, ya que

los números asignados guardan la misma relación que el orden de llegada a la

consulta.

Escalas de intervalos iguales:

La escala de intervalos iguales, está caracterizada por una unidad de medida

común y constante que asigna un número igual al número de unidades

equivalentes a la de la magnitud que posea el elemento observado. Es importante

destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no

refleja en ningún momento ausencia de la magnitud que estamos midiendo. Esta

escala, además de poseer las características de la escala ordinal, encontramos

que la asignación de los números a los elemento es tan precisa que podemos

determinar la magnitud de los intervalos (distancia) entre todos los elementos de la

escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera

escala verdaderamente cuantitativa y a los caracteres que posean esta escala de

medida pueden calculársele todas las medidas estadísticas a excepción del

coeficiente de variación.

Page 6: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

Ejemplo:

El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.

Escala de coeficientes o Razones:

El nivel de medida más elevado es el de cocientes o razones, y se diferencia de

las escalas de intervalos iguales únicamente por poseer un punto cero propio

como origen; es decir que el valor cero de esta escala significa ausencia de la

magnitud que estamos midiendo. Si se observa una carencia total de propiedad,

se dispone de una unidad de medida para el efecto. A iguales diferencias entre los

números asignados corresponden iguales diferencias en el grado de atributo

presente en el objeto de estudio. Además, siendo que cero ya no es arbitrario, sino

un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la

magnitud de la propiedad presente en B.

Ejemplo:

En una encuesta realizada en un barrio de esta localidad se observó que hay

familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de

hijos que aquellas que tienen 3 hijos.

5.2 MÉTODOS ESTADÍSTICOS CONTRA NO PARAMÉTRICOS

Es una rama de la estadística que estudia las pruebas y modelos estadísticos

cuya distribución subyacente no se ajusta a los llamados criterios paramétricos. Su

distribución no puede ser definida a priori, pues son los datos observados los que

la determinan. La utilización de estos métodos se hace recomendable cuando no

se puede asumir que los datos se ajusten a una distribución conocida, cuando el

nivel de medida empleado no sea, como mínimo, de intervalo.

Las principales pruebas no paramétricas son las siguientes:

Prueba χ² de Pearson

Prueba binomial

Prueba de Anderson-Darling

Page 7: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

Prueba de Cochran

Prueba de Cohen kappa

Prueba de Fisher

Prueba de Friedman

Prueba de Kendall

Prueba de Kolmogórov-Smirnov

Prueba de Kruskal-Wallis

Prueba de Kuiper

Prueba de Mann-Whitney o prueba de Wilcoxon

Prueba de McNemar

Prueba de la mediana

Prueba de Siegel-Tukey

Coeficiente de correlación de Spearman

Tablas de contingencia

Prueba de Wald-Wolfowitz

Prueba de los signos de Wilcoxon

La mayoría de estos test estadísticos están programados en los paquetes

estadísticos más frecuentes, quedando para el investigador, simplemente, la tarea

de decidir por cuál de todos ellos guiarse o que hacer en caso de que dos test nos

den resultados opuestos. Hay que decir que, para poder aplicar cada uno existen

diversas hipótesis nulas que deben cumplir nuestros datos para que los resultados

de aplicar el test sean fiables. Esto es, no se puede aplicar todos los test y

quedarse con el que mejor convenga para la investigación sin verificar si se

cumplen las hipótesis necesarias. La violación de las hipótesis necesarias para un

test invalida cualquier resultado posterior y son una de las causas más frecuentes

de que un estudio sea estadísticamente incorrecto. Esto ocurre sobre todo cuando

el investigador desconoce la naturaleza interna de los test y se limita a aplicarlos

sistemáticamente.

5.3 PRUEBA DE CORRIDAS PARA ALEATORIEDAD

Page 8: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

Una corrida es una serie de observaciones similares. La prueba de corridas se usa

para probar la aleatoriedad de una serie de observaciones cuando cada observación

puede ser asignada a una de dos categorías.

Ejemplo. En relación con una muestra aleatoria de n = 10 individuos, supongamos que

cuando se les clasifica por sexo la secuencia de observaciones es: M, M, M, M, F, F,

F, F, M, M. Estos datos contienen tres corridas, o series de elementos semejantes.

Respecto de datos numéricos, un medio para obtener el esquema requerido de dos

categorías es clasificar cada observación según si es superior o inferior a la mediana

del grupo. En general, mucho menos corridas o mucho más corridas que las que

serían de esperar al azar resultarían en el rechazo de la hipótesis nula de que la

secuencia de observaciones es una secuencia aleatoria.

El número de corridas de elementos semejantes se determina de acuerdo con los

datos muéstrales, con el uso del símbolo R para designar el número de corridas

observadas. Si n1 equivale al número de elementos muestreados de un tipo y n2 al

número de elementos muestreados del segundo tipo, la media y el error estándar

asociados con la distribución de muestreo de la estadística de prueba R cuando la

secuencia es aleatoria son

Sin, n1 > 20 o n2 > 20, la distribución de muestreo de r aproxima la distribución

normal. Por lo tanto, en estas circunstancias la estadística R puede convertirse a la

estadística de prueba z.

5.4 UNA MUESTRA: PRUEBA DE SIGNOS

La prueba de los signos puede utilizarse para probar una hipótesis nula referente al valor de la medida de la población. En consecuencia, es el equivalente no paramétrico a la prueba de una hipótesis referente al valor de la medida de la población. Es necesario que los valores de la muestra aleatoria se encuentren al menos en la escala ordinal, aunque no se requiere de supuestos acerca de la forma de la distribución de la población.Las hipótesis nula y alternativa pueden aludir ya sea a una prueba bilateral o unilateral. Si Med denota la mediana de la población y Med0 designa al valor hipotético, las hipótesis nulas y alternativa para una prueba de dos extremos son: H0: Med=Med0

H1: Med≠Med0Se aplica un signo de más a cada valor muestra observada mayor que el valor hipotético de la mediana y un signo de menos a cada valor menor que el valor hipotético de la mediana. Si un valor maestral es exactamente igual a la mediana hipotética, no se le aplica ningún signo, con lo que el tamaño de muestra efectivo

Page 9: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

se reduce. Si la hipótesis nula sobre el valor de la mediana es cierta, el número de signos de más debería ser aproximadamente igual al número de signos de menos. O, para decirlo de otra manera, la proporción de signos de mas debe ser de alrededor de 0.50. Por consiguiente, la hipótesis nula que se prueba en una prueba bilaterales H0: π=0.50, donde π es la proporción de la población de los signos de mas o de menos. Así, una hipótesis referente al valor de la mediana se prueba en realidad como una hipótesis sobre π. Si la muestra es grande, se puede hacer uso de la distribución normal.

5.5 UNA MUESTRA: PRUEBA DE WILCOXON

La prueba de Wilcoxon puede usarse para probar una hipótesis nula referente al valor de la medida de la población. Pero dado que la prueba Wilcoxon considera la magnitud de la diferencia entre cada valor muestral y el valor hipotético de la mediana, es una prueba más sensible que la prueba de los signos.

Sea X una variable aleatoria continua. Podemos plantear cierta hipótesis sobre la mediana de dicha variable en la población, por ejemplo, M=M0. Extraigamos una muestra de tamaño m y averigüemos las diferencias Di = X - M0. Consideremos únicamente la n diferencias no nulas (n “m). Atribuyamos un rango u orden (0i) a cada diferencia según su magnitud sin tener en cuenta el signo. Sumemos por un lado los 0+i, rangos correspondientes a diferencias positivas y por otro lado los 0-i, rangos correspondientes a diferencias negativas. La suma de los órdenes de diferencias positivas sería igual a la suma de los órdenes de diferencias negativas, caso que la mediana fuera el valor propuesto M0. En las muestras, siendo M0 el valor de la verdadera mediana, aparecerán por azar ciertas discrepancias, pero si la suma de los rangos de un ciclo es considerablemente mayor que la suma de los rangos de otro signo, nos hará concebir serias dudas sobre la veracidad de M0. La prueba de Wilcoxon va a permitir contrastar la hipótesis de que una muestra aleatoria procede de una población con mediana M0. Además, bajo el supuesto de simetría este contraste se puede referir a la media, E(X). Esta prueba es mucho más sensible y poderosa que la prueba de los signos; como se puede apreciar utiliza más información, pues no solo tiene en cuenta si las diferencias son positivas o negativas, sino también su magnitud. El contraste de Wilcoxon puede ser utilizado para comparar datos por parejas. Supongamos que la distribución de las diferencias es simétrica, y nuestro propósito es contrastar la hipótesis nula de que dicha distribución está centrada en 0. Eliminando aquellos pares para los

Page 10: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

cuales la diferencia es 0 se calculan los rangos en orden creciente de magnitud de los valores absolutos de las restantes diferencias. Se calculan las sumas de los rangos positivos y negativos, y la menor de estas sumas es el estadístico de Wilcoxon. La hipótesis nula será rechazada si T es menor o igual que el valor correspondiente. Cuando n≥25 y la hipótesis nula es cierta, la estadística t tiene una distribución aproximadamente normal. La media y el error estándar asociados con esta distribución de muestreo son, respectivamente: µ_T=(N(N+1))/4 σ_T=√ ((N(N+1) (2N+1))/24) En el caso de una muestra relativamente grande la prueba puede realizarse usando la distribución normal de probabilidad y calculando la estadística de prueba z, de la siguiente manera: Z= (T-µ_R)/σ_T

Page 11: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

5.6 DOS MUESTRAS: PRUEBA DE MANN-WHITNEY

La prueba de Mann-Whitney se emplea en aquellos casos en los que deseamos

contrastar si existen diferencias entre las poblaciones de donde se extraen dos

muestras, que han de ser aleatorias e independientes. La utilidad de esta prueba

es la misma que la de la prueba t, pero no parte de supuestos y puede ser

aplicada a datos medidos en escala ordinal.

El procedimiento es el siguiente:

1. Hipótesis:

Hipótesis nula: No existen diferencias entre los dos grupos.

Hipótesis alternativa: Hay diferencias entre los dos grupos.

2. Estadístico de contraste:

En este caso, el estadístico a emplear se denomina U de Mann-Whitney, que se

calcula siguiendo estos pasos:

a) Se procede a ordenar las puntuaciones de las dos muestras como si fueran una

sola.

b) A cada una de ellas se le asigna un rango.

c) Se calcula el estadístico T, a partir de la suma de los rangos de la muestra de

menor tamaño.

d) Teniendo T, se calcula U:

Donde U = n1n2 + n1 (n1 + 1)/2 - T

Donde n1 es el número de sujetos de la muestra de menor tamaño, y n2 el de la

muestra mayor.

3. Como en el caso anterior, el valor observado es comparado con valores

tabulados.

En dicha tabla encontramos la probabilidad asociada a cada valor del estadístico

para una prueba unilateral. Si nuestro contraste es bilateral, sólo tendremos que

multiplicar por dos el valor tabular correspondiente a una cola.

Page 12: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

5.7 OBSERVACIONES PAREADAS: PRUEBA DE SIGNOS

También se puede utilizar la prueba de signo para probar la hipótesis nula

para observaciones pareadas. Aquí se reemplaza cada diferencia, di, con un signo más o menos dependiendo si la diferencia ajustada, d i-d0, es positiva o negativa. A lo largo de esta sección suponemos que las poblaciones son simétricas. Sin embargo, aun si las poblaciones son asimétricas se puede llevar a cabo el mismo procedimiento de prueba, pero las hipótesis se refieren a las medianas poblacionales en lugar de las medias.

Ejemplo:

1. Una compañía de taxis trata de decidir si el uso de llantas radiales en lugar de llantas regulares con cinturón mejora la economía de combustible. Se equipan 16 automóviles con llantas radiales y se manejan por un recorrido de prueba establecido. Sin cambiar de conductores, se equipan los mismos autos con llantas regulares con cinturón y se manejan una vez más por el recorrido de prueba. Se registra el consumo de gasolina, en kilómetros por litro, de la siguiente manera:

Automóvil Llantas radialesLlantas con cinturón

1 4.2 4.1

2 4.7 4.9

3 6.6 6.2

4 7.0 6.9

5 6.7 6.8

6 4.5 4.4

7 5.7 5.7

8 6.0 5.8

9 7.4 6.9

10 4.9 4.9

Page 13: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

11 6.1 6.0

12 5.2 4.9

13 5.7 5.3

14 6.9 6.5

15 6.8 7.1

16 4.9 4.8

¿Se puede concluir en el nivel de significancia de 0.05 que los autos equipados con llantas radiales obtienen mejores economías de combustible que los equipados con llantas regulares con cinturón?

Solución:

Regla de decisión:

Si zR 1.645 no se rechaza Ho.

Si zR> 1.645 se rechaza Ho.

Se procede ha realizar las diferencias entre de los kilómetros por litro entre llantas radiales y con cinturón:

Automóvil Llantas radialesLlantas con cinturón

d

1 4.2 4.1 +

Page 14: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

2 4.7 4.9 -

3 6.6 6.2 +

4 7.0 6.9 +

5 6.7 6.8 -

6 4.5 4.4 +

7 5.7 5.7 0

8 6.0 5.8 +

9 7.4 6.9 +

10 4.9 4.9 0

11 6.1 6.0 +

12 5.2 4.9 +

13 5.7 5.3 +

14 6.9 6.5 +

15 6.8 7.1 -

16 4.9 4.8 +

Al observar las diferencias se ve que sólo existe una n=14, ya que se descartan los valores de cero. Se tiene r+ = 11

Decisión y conclusión:

Como 2.14 es mayor a 1.645 se rechaza H0 y se concluye con un = 0.05 que las llantas radiales mejoran la economía de combustible.

Page 15: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

5.8 OBSERVACIONES PAREADAS PRUEBA DE WILCOXON

PRUEBA DE RANGO CON SIGNO DE WILCOXON

Se puede notar que la prueba de signo utiliza sólo los signos más y menos de las diferencias entre las observaciones y 0 en el caso de una muestra, o los signos más y menos de las diferencias entre los pares de observaciones en el caso de la muestra pareada, pero no toma en consideración la magnitud de estas diferencias.

Una prueba que utiliza dirección y magnitud, propuesta en 1945 por Frank Wilcoxon, se llama ahora comúnmente prueba de rango con signo de Wilcoxon.

Esta prueba se aplica en el caso de una distribución continua simétrica. Bajo esta condición se puede probar la hipótesis nula 0. Primero se resta de cada valor muestral y se descarta todas las diferencias iguales a cero. Se asigna un rango de 1 a la diferencia absoluta más pequeña, un rango de 2 a la siguiente más pequeña, y así sucesivamente. Cuando el valor absoluto de dos o más diferencias es el mismo, se asigna a cada uno el promedio de los rangos que se asignarían si las diferencias se distinguieran. Por ejemplo, si la quinta y sexta diferencia son iguales en valor absoluto, a cada una se le asignaría un rango de 5.5. Si la hipótesis 0 es verdadera, el total de los rangos que corresponden a las diferencias positivas debe ser casi igual al total de los rangos que corresponden a las diferencias negativas. Se representan esos totales como w+ y w-, respectivamente. Se designa el menor de w+ y w- con w.

Al seleccionar muestras repetidas esperaríamos que variaran w+ y w-, y por tanto w. De esta manera se puede considerar a w+ y w-, y w como valores de las correspondientes variables aleatorias W+, W-, y W. La hipótesis nula 0 se puede rechazar a favor de la alternativa 0 sólo si w+ es pequeña y w- es grande. Del mismo modo, la alternativa 0 se puede aceptar sólo si w+ es grande y w- es pequeña. Para una alternativa bilateral se puede rechazar H0 a favor de H1 si w+ o w- y por tanto w son suficientemente pequeñas. No importa cuál hipótesis alternativa puede ser, rechazar la hipótesis nula cuando el valor de la estadística apropiada W+, W-, o W es suficientemente pequeño.

Dos Muestras con Observaciones Pareadas

Para probar la hipótesis nula de que se muestrean dos poblaciones simétricas continuas con para el caso de una muestra pareada, se clasifican las diferencias de las observaciones paradas sin importar el signo y se procede como en el caso de una muestra. Los diversos procedimientos de prueba para los casos de una sola muestra y de una muestra pareada se resumen en la siguiente tabla:

Page 16: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

No es difícil mostrar que siempre que n<5 y el nivel de significancia no exceda 0.05 para una prueba de una cola ó 0.10 para una prueba de dos colas, todos los valores posibles de w+, w-, o w conducirán a la aceptación de la hipótesis nula. Sin embargo, cuando 5 n 30, la tabla A.16 muestra valores críticos aproximados de W+ y W- para niveles de significancia iguales a 0.01, 0.025 y 0.05 para una prueba de una cola, y valores críticos de W para niveles de significancia iguales a 0.02, 0.05 y 0.10 para una prueba de dos colas. La hipótesis nula se rechaza si el valor calculado w+, w-, o w es menor o igual que el valor de tabla apropiado. Por ejemplo, cuando n=12 la tabla A.16 muestra que se requiere un valor de w+ 17 para que la alternativa unilateral sea significativa en el nivel 0.05.

Page 17: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

Ejemplos:

1. Los siguientes datos representan el número de horas que un compensador

opera antes de requerir una recarga: 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0,

1.2 y 1.7. Utilice la prueba de rango con signo para probar la hipótesis en el

nivel de significancia de 0.05 que este compensador particular opera con

una media de 1.8 horas antes de requerir una recarga.

Solución:

H0;

H1;

Se procederá a efectuar las diferencias y a poner rango con signo a los

datos.

1.

Dato di = dato - 1.8 Rangos

1.5 -0.3 5.5

2.2 0.4 7

0.9 -0.9 10

1.3 -0.5 8

2.0 0.2 3

1.6 -0.2 3

1.8 0 Se anula

1.5 -0.3 5.5

2.0 0.2 3

1.2 -0.6 9

Page 18: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

1.7 -0.1 1

Regla de decisión:

Para una n = 10, después de descartar la medición que es igual a 1.8, la

tabla A.16 muestra que la región crítica es w 8.

Cálculos:

W+ = 7 + 3 + 3 = 13

w- = 5.5 + 10 + 8 + 3 + 5.5 + 9 + 1 = 42

Por lo que w = 13 (menor entre w+ y w-).

Decisión y Conclusión:

Como 13 no es menor que 8, no se rechaza H0 y se concluye con un =

0.05 que el tiempo promedio de operación no es significativamente

diferente de 1.8 horas.

 

1. Se afirma que un estudiante universitario de último año puede aumentar su

calificación en el área del campo de especialidad del examen de registro de

graduados en al menos 50 puntos si de antemano se le proporcionan

problemas de muestra. Para probar esta afirmación, se dividen 20 estudiantes

del último año en 10 pares de modo que cada par tenga casi el mismo

promedio de puntos de calidad general en sus primeros años en la universidad.

Los problemas y respuestas de muestra se proporcionan al azar a un miembro

de cada par una semana antes del examen. Se registran las siguientes

calificaciones del examen:

ParCon problemas de

muestra

Sin problemas de

muestra

1 531 509

2 621 540

3 663 688

Page 19: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

4 579 502

5 451 424

6 660 683

7 591 568

8 719 748

9 543 530

10 575 524

Pruebe la hipótesis nula en el nivel de significancia de 0.05 de que los problemas

aumentan las calificaciones en 50 puntos contra la hipótesis Alternativa de que el

aumento es menor a 50 puntos.

Solución: ajustadas sin importar el signo y se aplica el mismo procedimiento.

En este caso d0 = 50, por lo que se procede a calcular las diferencias entre las

muestras y luego restarles el valor de 50. Se representara con y la

calificación media de todos los estudiantes que resuelven el examen en cuestión

con y sin problemas de muestra, respectivamente.

H0;

H1;

Regla de decisión:

Para n=10 la tabla muestra que la región crítica es w+ 11.

Cálculos:

La prueba de rango con signo también se puede utilizar para probar la hipótesis

nula d0. En este caso las poblaciones no necesitan ser simétricas. Como

con la prueba de signo, se resta d0 de cada diferencia, se clasifican las diferencias

Page 20: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

W+ = 6 + 3.5 + 1 =

10.5

Decisión y Conclusión:

Como 10.5 es menor

que 11 se rechaza H0 y se concluye con un = 0.05 que los problemas de

muestra, en promedio, no aumentan las calificaciones de registro de graduados en

50 puntos.

Par

Con

problemas

de

muestra

Sin

problemas

de

muestra

di

di

d0

Rangos

1 531 509 22-

285

2 621 540 81 31 6

3 663 688-

25

-

759

4 579 502 77 27 3.5

5 451 424 27-

232

6 660 683-

23

-

738

7 591 568 23-

273.5

8 719 748-

29

-

7910

9 543 530 13-

377

10 575 524 51 1 1

Page 21: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA
Page 22: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

5.9 VARIAS MUESTRAS INDEPENDIENTES: PRUEBA DE

KRAUSKAL-WALLIS

Esta prueba estadística de análisis de varianza de entrada simple de Kruskal-Wallis es una extensión de la prueba de U Mann-Whitney, en razón de que se usan rangos para su aplicación; por otra parte, este procedimiento se emplea cuando el modelo experimental contiene más de dos muestras independientes.

Dicha prueba se define matemáticamente de la forma siguiente:

Donde:

H = valor estadístico de la prueba de

Kruskal-Wallis.

N = tamaño total de la muestra.

Rc2 = sumatoria de los rangos elevados al

cuadrado.

ni = tamaño de la muestra de cada grupo.

L = ajuste dado por el ajuste de ligas o

empates de los rangos.

El ajuste L se calcula de la manera siguiente:

Donde:

Li = valor de número de empates de un rango.

N = tamaño total de la muestra.

 Se utiliza cuando:

Cuando son diferentes tratamientos o condiciones.

Muestras pequeñas.

Se utiliza escala ordinal.

Si las muestras se seleccionaron de las diferentes poblaciones.

Contrastar hipótesis (direccional o no direccional).

Page 23: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

Pasos:

1. Ordenar las observaciones en rangos de todos los grupos, del más pequeño

al mayor.

2. Asignar el rango para cada observación en función de cada grupo de

contraste, elabora la sumatoria de rangos, elevar al cuadrado este valor y

dividirlo entre el número de elementos que contiene (ni).

3. Detectar las ligas o empates entre los rangos de cada grupo y aplicar la

ecuación (L) para obtener el ajuste.

4. Aplicar la ecuación de Kruskal-Wallis y obtener el estadístico H.

5. Calcular los rangos de libertad (gl): gl = K grupos - 1.

6. Comparar el estadístico H, de acuerdo con los grados de libertad, en la tabla

de distribución de ji cuadrada en razón de distribuirse de forma similar.

7. Decidir si se acepta o rechaza la hipótesis.

Ejemplo:

Un investigador estudia el efecto benéfico de cuatro sustancias

anticonvulsionantes (fenobarbital, difenilhidantoinato -DFH-, diacepam y

clonacepam), para proteger contra la muerte producida por un convulsionante, la

tiosemicarbazida, la cual se manifiesta después de crisis clónica y tónica,

respectivamente. El investigador elige al azar a 24 ratones de la misma edad y

peso y les inyecta anticonvulsionante previamente a la tiosemicarbazida. A partir

de este momento, inicia la cuenta en tiempo, hasta que mueren los ratones;

además mide las observaciones en horas de tiempo transcurrido.

Elección de la prueba estadística.

Las mediciones se realizan en horas, por lo que la variable puede ser continua y,

en consecuencia, una escala de intervalo; sin embargo, algunos ratones no

murieron y el tiempo está calificado nominalmente como infinito. Este obstáculo

Page 24: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

impide concederle la calificación de escala de intervalo, por lo cual se elige una

escala de tipo ordinal.

Planteamiento de la hipótesis.

Hipótesis alterna (Ha). La protección de la muerte por drogas anticonvulsionante contra el fármaco convulsionante tiosemicarbazida, se muestra diferente entre los cuatro grupos, y hay mejor protección por el diacepam.

Hipótesis nula (Ho). Las diferencias observadas en los cuatro grupos de fármacos anticonvulsionantes, para evitar la muerte producida por la tiosemicarbazida, se deben al azar.

Nivel de significación.

Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza

Ho.

Zona de rechazo.

Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha

Tiempo en horas que tarda el fármaco en causar la muerte en ratones.

Aplicación de la prueba estadística.

De acuerdo con los pasos, se inicia con el ordenamiento de todas las

observaciones a partir del valor más pequeño hasta el mayor y la detección de las

ligas o empates.

Page 25: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

Arreglo de los datos para asignar rangos y detectar las ligas o empates.

Una vez efectuado el ordenamiento en rangos de las observaciones, se hacen las

sumatorias de los rangos. Para facilitar esta tarea, elabórese una tabla en la que

sustituyan los datos.

Sustitución por rangos. Observaciones de la primera tabla.

Se calcula el valor de ajuste por ligas con la siguiente fórmula:

Page 26: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

Con el ajuste de L, se procede a calcular el valor estadístico de la prueba de Kruskal-Wallis.

Calculamos los grados de libertad.gl = K grupos - 1 = 4 - 1 = 3El estadístico H calculado de 15.4, se compara con los valores críticos de ji cuadrada. En seguida se busca en esa hilera la cifra de grados de libertad (3) hasta el nivel de significancia de 0.05 y se observa el valor 7.82, hasta los críticos 11.34 y 16.27, donde se encuentra el calculado. Esto quiere decir que la probabilidad de que exista una diferencia se halla a una probabilidad de error entre 0.01 y 0.001.

Decisión.Como el valor estadístico H tiene una probabilidad menor que 0.01 y éste es menor que el nivel de significancia, se acepta Ha y se rechaza Ho.

Interpretación.Entre las drogas anticonvulsionantes, existe diferencia significativa en cuanto a la protección de muerte a los ratones cuando se les inyecta el fármaco tiosemicarbazida. El diacepam se manifestó principalmente con los rangos más altos y se muestra distinto de los demás anticonvulsionantes (véase la siguiente figura). Sumatoria de rangos de las observaciones.

Page 27: UNIDAD V: ESTADÍSTICA NO PARAMÉTRICA

BIBLIOGRAFÍA

1. Sprent P. Applied nonparametric statistical methods. 2nd Ed., Chapman-Hall, London, 1993:1-3.

2. Glantz SA. Primer of Biostatistics, 3th ed., McGraw Hill, New Yor, 1992

3.- Bloquear todos los resultados de es.wikipedia.org