Presentación diapositiva

11
Republica Bolivariana de Venezuela Instituto universitario ``Santiago Mariño`` Sede –Barcelona Coeficiente de correlación de Pearson y de Sperman Profesor: Ramón Ara Bachiller : Darwin Amaro Cedula :26.072.745

Transcript of Presentación diapositiva

Page 1: Presentación diapositiva

Republica Bolivariana de Venezuela Instituto universitario ``Santiago Mariño``

Sede –Barcelona

Coeficiente de correlación de Pearson y de Sperman

Profesor: Ramón Ara Bachiller : Darwin Amaro Cedula :26.072.745

Page 2: Presentación diapositiva

Coeficiente de correlación de Pearson

En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

Page 3: Presentación diapositiva

Uso del coeficiente de correlación de Pearson

Predecir el valor de una variable dado un valor determinado de la otra variable.

Se trata de valorar la asociación entre dos variables cuantitativas estudiando el método conocido como correlación.

Dicho cálculo es el primer paso para determinar la relación entre las variables.

Consiste en la posibilidad de calcular su distribución muestral y así poder determinar su error típico de estimación.

Reporta un valor de correlación Permite cercano a 0 como un indicador de que no hay relación lineal entre 2 variables.

Reporta un valor de correlación cercano a 1 como un indicador de que existe una relación lineal positiva entre las 2 variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información

Page 4: Presentación diapositiva

Ventajas y Desventajas del Coeficiente de Pearson

Ventajas

Es llamado así en homenaje a Karl PearsonLa dos variable son designadas por X e YRequiere datos en cantidad solo de periodo base

Desventajas

Cuando las variable X e Y son independientes , el numerador se anula y el coeficiente de correlación poblacional tiene el valor 0.El valor 0 representa falta de correlación.

Page 5: Presentación diapositiva

Enfoques de pearsonEn la perspectiva de Pearson, para establecer el nivel de

significación estadística habría que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es preferible minimizar. Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de error, introdujeron el concepto de “poder de una prueba estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y está definido por 1-beta, y en estrecha relación con éste se ha desarrollado el concepto de “tamaño del efecto” que algunos han propuesto como sustituto de los valores p en los informes de investigación científica. Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la prueba F, llamada así en honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado por r.

Page 6: Presentación diapositiva

Coeficiente de correlación de Spearman

En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.

La interpretación de coeficiente de Spearman es igual que la del

coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

Page 7: Presentación diapositiva

Uso del coeficiente de correlación de Spearman

Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos series ordenadas. A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs.La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por la n primeros números naturales. A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de la correlación entre dos variables X e Y, medidas al menos en escala ordinal.

Page 8: Presentación diapositiva

Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y. El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1. Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.

Page 9: Presentación diapositiva

Ventajas y Desventajas del Coeficiente de Spearman

Ventajas No requieren poblaciones normalmente distribuidas. Pueden frecuentemente ser aplicados a datos no numéricos, tal como el género de los que contestan una encuesta. Pueden ser aplicados a una amplia variedad por que ellos no tienen los requisitos rígidos de los métodos paramétricos correspondientes.

Desventajas Tienden a perder información porque datos numéricos exactos son frecuentemente reducidos a una forma cualitativa. R no debe ser utilizado para decir algo sobre la relación entre causa y efecto.Las pruebas no paramétricas no son tan eficientes como las pruebas paramétricas.

Page 10: Presentación diapositiva

Enfoque de SpermanUna generalización del coeficiente de Spearman es útil en la

situación en la cual hay tres o más condiciones, varios individuos son observados en cada una de ellas, y predecimos que las observaciones tendrán un orden en particular. Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar cierta tarea, y predecimos que su habilidad mejorará de intento en intento. El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que existan valores extremos, pues si calculamos la correlación de Pearson, los resultados se verán afectados. La interpretación del resultado del coeficiente de correlación de Spearman se encuentra entre los valores de -1 y 1. La significación estadística de un coeficiente debe tenerse en cuenta conjuntamente con la relevancia clínica del fenómeno que se estudia.