Coeficientes de correlación de pearson y de sperman

15
Coeficientes de Correlación de Pearson y de Spearman. Mayerling Barrios 26.449.379

Transcript of Coeficientes de correlación de pearson y de sperman

Page 1: Coeficientes de correlación de pearson y de sperman

Coeficientes de Correlación de Pearson

y de Spearman.Mayerling Barrios 26.449.379

Page 2: Coeficientes de correlación de pearson y de sperman

Coeficiente de Correlación de Pearson El Coeficiente de Correlación de Pearson es una medida de la relación lineal

entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables. De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

Ejemplos de diagramas de dispersión con diferentes valores del coeficiente de correlación (ρ)

Page 3: Coeficientes de correlación de pearson y de sperman

Coeficiente de Correlación de PearsonEl coeficiente de correlación de Pearson es un índice de fácil ejecución e, igualmente, de fácil interpretación. Digamos, en primera instancia, que sus valores absolutos oscilan entre 0 y 1.

En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra siendo la expresión que nos permite calcularlo:

Donde: es la varianza de (X, Y). es la desviación típica de la variable X. es la desviación típica de la variable Y.

Page 4: Coeficientes de correlación de pearson y de sperman

Uso del Coeficiente de Correlación de PearsonIdentifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de los requisitos es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.

Para cantidades grandes de información, el calculo puede ser tedioso. Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre

las dos variables. Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información.

Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las dos variables.

Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se comparan.

Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación. Los grados de libertad se calculan como el número de las dos observaciones menos 2.

Page 5: Coeficientes de correlación de pearson y de sperman

Ventajas del Coeficiente de Correlación de Pearson

► Reporta un valor de correlación cercano a -1 como indicador de que hay una relación linear negativa entre las dos variables.

► Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos particulares. El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de acuerdo con las variables que se comparan.

► Determina la importancia de los resultados. Esto se logra con el uso del coeficiente de correlación, grados de libertad y una tabla de valores críticos del coeficiente de correlación. Los grados de libertad se calculan como el número de las dos observaciones menos 2.

► Identifica el dependiente variable que se probará entre dos observaciones derivadas independientemente. Uno de los requisitos es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.

► Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos variables.

► Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables.

► Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información.

Page 6: Coeficientes de correlación de pearson y de sperman

Desventajas del Coeficiente de Correlación de Pearson

El coeficiente de correlación debe ser seleccionado en base a las escalas de medidas usadas en cada una de las variables.

La determinación del tamaño de muestra en las de tablas de contingencias varia según sea el objetivo:

a) Determinar probabilidades de incidencias.b) Docimar independencias entres dos variables.c) Analizar la asociación entre las variables.

El tamaño de muestra para construir intervalo de confianza para el coeficiente de correlación poblacional de Pearson es función de la longitud del intervalo, de la probabilidad de confianza y del coeficiente de correlación muestral. Por esta razón se sugiere un procedimiento secuencial para este propósito.

El tamaño de muestra para docimar la significación del coeficiente de correlación poblacional de Pearson es función de las probabilidades de cometer errores del tipo I y del tipo II y del valor del coeficiente de correlación muestral.

Para cantidades grandes de información, el calculo puede ser tedioso.

Page 7: Coeficientes de correlación de pearson y de sperman

Aplicación de la prueba estadísticaLas observaciones de cada variable se deben ordenar en rangos, así como obtener las diferencias entre los rangos, efectuar la sumatoria y elevar ésta al cuadrado.Educación de algunas madres y calificación de desarrollo mental de los hijos.Calculo de los grados de libertad (gl). gl = numero de parejas - 1 = 8 - 1 = 7El valor rs calculado se compara con los valores críticos de rs del coeficiente de correlación por rangos de Spearman. El valor crítico de rs con 7 grados de libertad, para una probabilidad de 0.05 del nivel de significancia es 0.714, o sea, mayor que el calculado. Por lo tanto, éste tiene una probabilidad mayor que 0.05. Decisión Como el valor de probabilidad de rs de 0.69 es mayor que 0.05, se acepta Ho y se rechaza Ha. Interpretación El coeficiente de correlación de Spearman de 0.69 es menor que los valores críticos de la tabla, pues a éstos corresponde la probabilidad de obtener esa magnitud, al nivel de confianza de 0.05 y 0.01, para 0.714 y 0.893. Esto significa que para aceptar Ha, se requiere tener un valor igual o más lato que 0.714.Por lo tanto se acepta Ho y se rechaza Ha, aun cuando, como se observa en la siguiente figura, existe una asociación relativa entre la educación formal de la madre y el desarrollo mental de sus hijos; sin embargo, ésta no es significativa.

Enfoque de Pearson

Page 8: Coeficientes de correlación de pearson y de sperman

Es una medida de la correlación entre dos variables aleatorias continuas. Este coeficiente es una medida de asociación lineal que utiliza los rangos, números de orden, de cada grupo de sujetos y compara dichos rangos.La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia.Se diferencia de la correlación de Pearson en que utiliza valores medidos a nivel de una escala ordinal.Si alguna de las variables está medida a nivel de escala de intervalo/razón deberá procederse antes de operar el estadístico a su conversión en forma ordinal.

Coeficiente de Correlación de Spearman

Page 9: Coeficientes de correlación de pearson y de sperman

Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos series ordenadas.

A veces, este coeficiente es denominado por la letra griega (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación

La fórmula de cálculo para puede derivarse de la utilizada en el caso de ; bastaría aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por los n primeros números naturales.

Uso del Coeficiente de Correlación de Spearman

Page 10: Coeficientes de correlación de pearson y de sperman

Uso del Coeficiente de Correlación de Sperman► A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de la

correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente:

► Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y.

Page 11: Coeficientes de correlación de pearson y de sperman

Propiedades del Coeficiente de Correlación de Spearman

► El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1.

► Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.

► El coeficiente rs es un caso particular de rxy, puesto que se calcula a partir de éste, por aplicación del coeficiente de Pearson a valores ordinales considerados como puntuaciones.

► Si calculamos el coeficiente de correlación de Pearson entre dos variables X e Y, y el coeficiente de correlación de Spearman para las mismas puntuaciones pero transformadas en rangos, ambos coeficientes se aproximan en valor según aumenta el número de sujetos n.

Page 12: Coeficientes de correlación de pearson y de sperman

Ventajas del Coeficiente de Correlación de Spearman► Al ser Spearman una técnica no paramétrica es libre de distribución probabilística.► Los supuestos son menos estrictos. Es robusto a la presencia de outliers (es decir permite

ciertos desvíos del patrón normal).► La manifestación de una relación causa-efecto es posible sólo a través de la comprensión

de la relación natural que existe entre las variable y no debe manifestarse sólo por la existencia de una fuerte correlación.

► Los valores se repiten asignado el promedio de los rangos que les correesponderian a cada uno de ellos.

► El coeficiente de correlación de Spearman es enos sensible a los valores extremos que el coeficiente de Pearson

Ejemplo: Con base en la información de las 44 truchas y ante el no cumplimiento de los supuestos del coeficiente de correlación de Pearson se aplicó la técnica no paramétrica de Spearman dando como resultado la siguiente salida:

Page 13: Coeficientes de correlación de pearson y de sperman

Desventajas del Coeficiente de Correlación de Spearman

► Es asociada entre dos variables aleatorias continuas.

► Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos.

► 0 cero, significa no correlacion pero no independencia.

► R no debe ser usado para decir algo sobra la relación causa y efecto.

Page 14: Coeficientes de correlación de pearson y de sperman

Enfoque de SpearmanUna generalización del coeficiente de Spearman es útil en la situación en la cual hay tres o más condiciones, varios individuos son observados en cada una de ellas, y predecimos que las observaciones tendrán un orden en particular.

Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar cierta tarea, y predecimos que su habilidad mejorará de intento en intento.

El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que existan valores extremos, pues si calculamos la correlación de Pearson, los resultados se verán afectados.

La interpretación del resultado del coeficiente de correlación de Spearmanse encuentra entre los valores de -1 y 1. La significación estadística de uncoeficiente debe tenerse en cuenta conjuntamente con la relevancia clínicadel fenómeno que se estudia.

Page 15: Coeficientes de correlación de pearson y de sperman

Bibliografía

https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson

http://es.slideshare.net/AidaBermdez/presentacion-coeficientes-de-correlacion-de-pearson-y-spearman

http://kovachi.sel.inf.uc3m.es/@api/deki/files/141/=correlacion.pdf http://www.monografias.com/trabajos85/coeficiente-correlacion-karl-

pearson/coeficiente-correlacion-karl-pearson.shtml