2. Profincyt - Análisis de Datos II

download 2. Profincyt - Análisis de Datos II

of 16

Transcript of 2. Profincyt - Análisis de Datos II

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    1/16

    Programa de Formacin en Investigacin,Ciencia y Tecnologa (ProFInCyT)

    Anlisis de Datos II:Anlisis bivariados y multivariados

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    2/16

    Unidad 2:

    Correlacin: Pearson ySpearman

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    3/16

    Introduccin1 La correlacin fue utilizada por primera vez por

    Sir Francis Galton, aunque su discpulo KarlPearson (1857-1936) fue quien estudi enprofundidad sus propiedades.

    Pearson fue el autor de la prueba Chi-Cuadrado ydel anlisis de componentes principales, mientrasque la correlacin de rangos fue introducida porCharles Edward Spearman en 1904 al intentar

    construir una teora de la inteligencia.

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    4/16

    Cuando se estudian dos o tres variables esimportante obtener una medida de la dependenciao de la relacin entre esas variables.

    Para estudiar y medir esta relacin, el primer pasoconsistir en recoger los datos y representarlosluego mediante un diagrama de dispersin.

    Esta representacin grfica es la que ms se utilizaen el estudio de la dependencia de dos o tresvariables y es tiles como anlisis previo a lacorrelacin.

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    5/16

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    6/16

    La correlacin mide la relacin linealentre dos

    variables y su sentido (directo o inverso).

    Cuando la relacin es perfectamente lineal dichocoeficiente vale 1 ( -1).

    Cuando el coeficiente tiene un valor prximo acero, o bien no existe relacin entre las variablesanalizadas o bien dicha relacin no es lineal.

    Caractersticas de la Correlacin

    2

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    7/16

    Diagrama para el anlisis del coeficiente decorrelacin entre dos variables:

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    8/16

    La correlacin puede ser:

    Correlacin

    Simple Una variableindependiente

    Mltiple Varias variablesindependientes

    CannicaVarias variablesindependientes y

    varias dependientes

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    9/16

    Formas de estimar la correlacin (r)

    1. El coeficiente de correlacin dePearson esutilizado cuando ambas variables son cuantitativas

    y siguen una distribucin normal.

    2. El coeficiente de correlacin deSpearman seutiliza cuando alguna de las variables es ordinal, o

    dicotmica, o para variables cuantitativas perocuando se trabaja con muestras pequeas.

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    10/16

    1. Coeficiente de correlacin dePearson

    Fue pensado para utilizarse con variablescuantitativas.

    Es un ndice que mide el grado de covariacinentre distintas variables relacionadas linealmente.

    Puede haber variables fuertemente relacionadas,pero no de forma lineal, en cuyo caso no debeaplicarse la correlacin de Pearson.

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    11/16

    Es recomendable utilizarlo cuando:

    Las mediciones de los datos se realizan en unaescala ordinal

    Cuando existen valores extremos (afectan mucho el

    coeficiente de correlacin de Pearson)

    Ante distribuciones no normales.

    2. Coeficiente de correlacin deSpearman

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    12/16

    Este coeficiente es una medida de asociacin lineal

    que utiliza los rangos.

    Reemplaza los valores originales de ambasvariables por nmeros enteros positivos,comenzando del 1 en adelante, que correspondan asu ordenamiento de menor a mayor magnitud(RANGOS).

    Para ello, los valores reales de cada una de lasvariables son ordenados de menor a mayor, porseparado y reemplazados por los rangos.

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    13/16

    El coeficiente de correlacin, en cualquiera de sus

    formas (Pearson o Spearman) es un ndice cuyosvalores absolutos oscilan entre -1 y +1.

    Cuanto ms cerca de -1 o +1, mayor ser lacorrelacin, y menor cuanto ms cerca de cero.

    Interpretacin del coeficiente de

    Correlacin3

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    14/16

    Tamao de la muestra

    A pesar de las diferentes posturas en relacin a lainterpretacin de los puntajes, que los mismos seano no significativos depende en gran medida deltamao de la muestra.

    Tendencias dbiles son muy improbables en grandesmasas de datos, mientras que tendencias fuertespueden ser relativamente probables en una muestrapequea.

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    15/16

    Variabilidad compartida o explicada

    La interpretacin del coeficiente de correlacin entrminos de proporcin de variabilidadcompartida o explicada, ofrece una idea ms cabalde la magnitud de la relacin.

    Se realiza mediante el coeficiente dedeterminacin, definido como el cuadrado delcoeficiente de correlacin.

  • 7/27/2019 2. Profincyt - Anlisis de Datos II

    16/16

    Ejemplo

    Si la correlacin entre inteligencia y rendimientoacadmico es de 0.8, significa que 0.82 = 0.64 es laproporcin de varianza compartida entre ambas

    variables.

    Esto puede interpretarse como que las variacionesde una, se explican en un 64% por las variaciones dela otra.

    Si bien tericamente podemos inferir una relacincausal entre ambas variables, empricamente lacorrelacin no nos permite realizar dicha inferencia.