ESTADÍSTICA NO PARAMÉTRICA

download ESTADÍSTICA NO PARAMÉTRICA

of 15

Transcript of ESTADÍSTICA NO PARAMÉTRICA

ESTADSTICA NO PARAMTRICA1. Introduccin:

Los mtodos de estadstica inferencial que hemos estudiado a durante el curso, son llamados mtodos paramtricos porque ellos son basados en muestreos de una poblacin con parmetros especficos, como la media ( ), la desviacin estndar ( ) o la proporcin (p). Estos mtodos paramtricos usualmente tienen que ajustarse a algunas condiciones completamente estrictas, as como el requisito de que los dato s de la muestra provengan de una poblacin normalmente distribuidas. Esta seccin presenta los mtodos no paramtricos, los cuales no tienen tales estrictos requisitos. La mayor parte de las tcnicas estudiadas hacen suposiciones sobre la composicin de los datos de la poblacin. Las suposiciones comunes son que la poblacin sigue una distribucin normal, que varias poblaciones tienen varianzas iguales y que los datos se miden en una escala de intervalos o en una escala de razn. Este tema presentar un gr upo de tcnicas llamadas no paramtricas que son tiles cuando estas suposiciones no se cumplen.

2. ESTADSTICA NO PARAMTRICA:

La estadstica no paramtrica es una rama de la estadstica que estudia las pruebas y modelos estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos. Su distribucin no puede ser definida a priori, pues son los datos observados los que la determinan. La utilizacin de estos mtodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una distribucin conocida, cuando el nivel de medida empleado no sea, como mnimo, de intervalo. Las principales pruebas no paramtricas son las siguientes:y y y y y y y y y y y y y y y y y y y

Prueba de Pearson Prueba binomial Prueba de Anderson-Darling Prueba de Cochran Prueba de Cohen kappa Prueba de Fisher Prueba de Friedman Prueba de Kendall Prueba de Kolmogrov-Smirnov Prueba de Kruskal-Wallis Prueba de Kuiper Prueba de Mann-Whitney o prueba de Wilcoxon Prueba de McNemar Prueba de la mediana Prueba de Siegel-Tukey Coeficiente de correlacin de Spearman Tablas de contingencia Prueba de Wald-Wolfowitz Prueba de los signos de Wilcoxon

3. PRUEBAS NO PARAMTRICAS: Definicin:

Se denominan pruebas no paramtricas aquellas que no presuponen una distribucin de probabilidad para los datos, por ello se conocen tambin como de distribucin libre (distribution free). En la mayor parte de ellas los resultados estadsticos se derivan nicamente a partir de procedimientos de ordenacin y recuento, por lo que su base lgica es de fcil comprensin. Cuando trabajamos con muestras pequeas (n < 10) en las que se desconoce si es vlido suponer la normalidad de los datos, conviene utilizar pruebas no paramtricas, al menos para corroborar los resultados obtenidos a partir de la utilizacin de la teora basada en la normal. En estos casos se emplea como parmetro de centralizacin la mediana , que es aquel punto para el que el valor de X est el 50% de las veces por debajo y el 50% por encima. Aunque el trmino no paramtrico sugiere que la prueba no est basada en un parmetro, hay algunas pruebas no paramtricas que dependen de un parmetro tal como la media. Las pruebas no paramtricas, sin embargo, no requieren una distribucin particular, de manera que algunas veces son referidas como pruebas de libre distribucin . Aunque libre distribucin es una descripcin ms exacta, el trmino no paramtrico es ms comnmente usado.

El

i

l p

p

ti

:

4. VE V . i t p 2. p 3. if

J S Y ESVE j s t it p ti t f l t p t i t , f l il p l t l t t t t i ti i t l s p

J S s P ti p p p l p

E

m i p

S s

P

I

S

pli ti l p ti l t t i l t t . i p l ti i it l , l i ti i . p , t l ti i t t . E , l t t .

pli l

ll i i ti

pli p p t ti i t pli

l i pl

l

p

De ventaja de lo M todo No Paramtrico

1. Los mtodos no paramtricos tienden a perder informacin porque datos numricos exactos son frecuentemente reducidos a una forma cualitativa. . Las pruebas no paramtricas no son tan eficientes como las pruebas paramtricas, de manera que con una prueba no paramtrica generalmente se necesita evidencia ms fuerte (as como una muestra ms grande o mayores diferencias) antes de rechazar una hiptesis nula. Cuando los requisitos de la distribucin de una poblacin son satisfechos, las pruebas no paramtricas son generalmente menos eficientes que sus contrapartes paramtricas, pero la reduccin de eficiencia puede ser compensada por un aumento en el tamao de la muestra.

5. PRUEBA DE FRIEDMAN 5.1. DEFINICION

En estadstica la prueba de Friedman es una prueba no paramtrica desarrollado por el economista Milton Friedman. Equivalente a la prueba ANOVA para dos factores en la versin no paramtrica, el mtodo consiste en ordenar los datos p or filas o bloques, reemplazndolos por su respectivo orden. Al ordenarlos, debemos considerar la existencia de datos idnticos.5.2. Comparacin de vario cla ificadore

Los mtodos anteriores no fueron diseados para la media de varias variables. Cuando se hacen muchos test, parte de la hiptesis nula se rechaza debido a la aleatoriedad (Salzberg97). Dos posibles alternativas: ANOVA Prueba de Friedman ANOVA Friedman te t

Mtodo estadstico habitual. Condiciones: Distribucin normal. Requiere que las variables aleatorias tengan igual varianza. La naturaleza de los datos no da pistas sobre la satisfaccin de la condicin anterior. La violacin de las condiciones tiene un gran efecto en el post-hoc test.

Es la versin no-paramtrica del ANOVA. Utilizar la modificacin de Iman y Davenport (1980) al ser un mejor estadstico (menos conservativo). Se cumplen las condiciones impuestas por ANOVa? SI => Utilizar ANOVA. NO => Utilizar Friedman test.

5.3.

MUESTRAS RELACIONADAS. PRUEBA DE FRIEDMAN

Esta prueba puede utilizarse en aquellas situaciones en las que se seleccionan n grupos de k elementos de forma que los elementos de cada grupo sean lo ms parecidos posible entre s, y a cada uno de los elementos del grupo se le aplica uno de entre k ''tratamientos'', o bien cuando a cada uno de los elementos de una muestra de tamao n se le aplican los k ''tratamientos''. La hiptesis nula que se contrasta es que las respuestas asociadas a cada uno de los ''trat amientos'' tienen la misma distribucin de probabilidad o distribuciones con la misma mediana, frente a la hiptesis alternativa de que por lo menos la distribucin de una de las respuestas difiere de las dems. Para poder utilizar esta prueba las respuest as deben ser variables continuas y estar medidas por lo menos en una escala ordinal. Hiptesis: Hiptesis nula (H0): No existen diferencias entre los grupos. Hiptesis alternativa (H1): Hay diferencias entre los grupos.

Los datos se disponen en una tabla en la que en cada fila se recogen las respuestas de los k elementos de cada grupo a los k tratamientos:Grupo\ Tratamiento 1 ... i ... n 1 x11 .... xi1 ... xn1 2 x12 .... xi2 ... xn2 ... ... ... ... ... ... j x1j .... xij ... xnj ... ... ... ... ... ... k x1k .... xik ... xnk

A las observaciones de cada fila se les asignan rangos de menor a mayor desde 1 hasta k; a continuacin se suman los rangos correspondientes a cada columna, siendo RJ la suma correspondiente a la columna j-sima. Si la hiptesis nula es cierta, la distribucin de los rangos en cada fila se debe al azar, y es de esperar que la suma de los rangos correspondientes a cada columna sea aproximadamente igual a n(k + 1)/ . La prueba de Friedman determina si las RJ observadas difieren significativamente del valor esperado bajo la hiptesis nula. El estadstico de prueba es:

Si Ho es cierta y el nmero de columnas y/o de filas es moderadamente grande la distribucin de F se aproxima a una chi-cuadrado con k - 1 grados de libertad; de forma que se rechaza la hiptesis nula para valores de superiores al valor crtico para el nivel de significacin fijado.

5.4.

CARACTERSTICAS X r Se utiliza cuando:y y y y y

Trabaja con datos ordinales. Sirve para establecer diferencias. Se utiliza para ms de tres tratamientos. Las muestras son sacadas de la misma poblacin. Para muestras pequeas: K = grandes: K = - 4 y H = > 9. - 4 y H = - 9; para muestras

y y y y

Asignar al azar a los sujetos a cada condicin. Muestras igualadas (igual nmero de sujetos en cada condicin). Se asignan rangos por condicin. Se trabaja con tablas de doble entrada. Pasos:

1. Ordenar las observaciones en funcin de los cambios advertidos despus del tratamiento o tratamientos. . Asignar rangos del dato ms pequeo al mayor en funcin de las hileras. . Efectuar la sumatoria de los rangos en funci n de las columnas Rc y elevarlos al cuadrado Rc . 4. Aplicar la frmula de anlisis de varianza de doble entrada por rangos de Friedman. 5. Comparar el valor de X r de Friedman con las tablas de valores crticos de probabilidad propia, cuando la muestra es pequea. En caso de muestras grandes, utilizar las tablas de valores crticos de ji cuadrada de Pearson.

5.5.

E ERCICIOS:

1. La asociacin de padres de un centro convoca sucesivamente tres reuniones dirigidas a los padres de alumnos de un mismo grupo o clase, en las que se abordaron respectivamente temas relacionados con el apoyo de la familia al estudio (Tema A), el juego y el tiempo libre de los nios (Tema B), y la part icipacin de los padres en el centro (Tema C). Si contamos los datos de asistencia a cada una de las tres reuniones para los padres de alumnos de 6 clases, podemos afirmar que los tres temas atrajeron de modo distinto a los convocados? ( = 0.05)

Tema A 3 3 3 2 3 3

Tema B

Tema C 1 1

1 1 1 1

SOLUCIN. Dado que el nmero de sujetos es pequeo, deberemos utilizar una prueba no paramtrica, y puesto que los casos se hayan relacionados, la prueba ms idnea es el anlisis de la varianza de dos clasificaciones por rangos de Friedman. En primer lugar, plantea remos las hiptesis: H0: No existen diferencias entre en la atraccin a los tres temas. H1: Existen diferencias significativas entre en la atraccin a los tres temas. El estadstico de contraste que emplearemos ser:

Por lo tanto, calcularemos la suma de rangos para cada columna:

Tema A 3 3 3 2 3 3

Tema B

Tema C 1 1

1 1 1 1

RA = 17, R B = 1 y RC = 7. Sustituyendo:

Comparamos el valor observado con el que nos ofrece la tabla, teniendo en cuenta que X sigue una distribucin de chi cuadrado con k -1 grados de libertad. Por tanto, el valor crtico ser

0.95

Puesto que el valor observado es mayor que el crtic o, aqul entra en la regin de rechazo, por lo que podemos rechazar con una confianza del 95% que existen diferencias significativas en cuanto a la atraccin a los distintos temas.

= 5.991

2. Un investigador desea comparar los niveles de memoria en nios de 4, 6, 8, 10 y 12 aos despus de 3 diferentes tratamientos. Eleccin de la prueba estadstica. El modelo experimental tiene tres o ms muestras dependientes. Vase: Flujograma 5SOLUCION

Planteamiento de la hiptesis.y

y

Hiptesis alterna (Ha). Hay diferencia significati va en nios de 4, 6, 8, 10 y 12 aos, despus de aplicar 3 diferentes tipos de tratamiento. Hiptesis nula (Ho). No hay diferencia significativa en nios de 4, 6, 8, 10 y 12 aos, despus de aplicar 3 diferentes tipos de tratamiento.Nivel de significacin. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho. Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha. Escala = 0 - 20

Aplicacin de la prueba estadstica. Transformamos los valores en rangos de acuerdo con la prueba de Friedman, en funcin de las hileras. Al valor ms bajo le corresponde el rango 1, respetando el orden hasta el dato que tiene la cifra ms alta.

Rango1 = 8 Rango2 = 9 Rango3 =13Calculamos la X2r de Friedman.

Se utiliza la tabla N para pruebas pequeas. Con tres columnas y cinco hileras se compara el valor calculado de X2r de Friedman con la tabla correspondiente de distribucin de probabilidad. Las cifras aproximadas al estadstico calculado 2.8 = 0.367. Decisin. Como el valor de X 2r calculado es igual a 2.8, la probabilidad es de 0.367, esto indica que es menor que el nivel de significancia, por lo cual, se acepta Ha y se rechaza Ho. Interpretacin. Aceptada Ha, se acepta que entre los tres tratamientos ex isten distintos grados de memoria adquirida. Se distingue notoriamente que el tratamiento A es menos eficaz, con respecto a los otros dos tratamientos. Por otro lado, el tratamiento B ofrece mayores ventajas para la adquisicin de memoria

5.6. y y yy

BIBLIOGRAFA

www.wikipedia.com/estadistica_no_parametrica www.rincondelvago.com/prueba_no_parametrica www.monografias.com/ED800Estadisticas_no_parametricas.http://tarwi.lamolina.edu.pe/~fmendiburu/index-filer/academic/metodos1.htm http://ocwus.us.es/metodos-de-investigacion-y-diagnostico-eneducacion/analisis-de-datos-en-la-investigacioneducativa/Bloque_II/page_95.htm/

y