Correlación y Covarianza (14).1

download Correlación y Covarianza (14).1

of 27

Transcript of Correlación y Covarianza (14).1

  • 8/18/2019 Correlación y Covarianza (14).1

    1/27

  • 8/18/2019 Correlación y Covarianza (14).1

    2/27

    UNIDAD 5

    SESIÓN: 14Covarianza

    Regresión lineal, Correlación de Pearson y Coeficiente dedeterminación.

    Recuperado de: http://personales.upv.es/jcanizar/modulo_3/cluster_5.html

    Indicadores de Logro:

    - Describe, calcula e interpreta los valores de la ecuación de la regresión y correlación lineal.

  • 8/18/2019 Correlación y Covarianza (14).1

    3/27

    REGRESIÓN

    CORRELACIÓN

    Permite averiguar la forma probable de las relaciones entre las variables.Permite predecir o estimar el valor de una variable que corresponde al valorde otra variable.

    Es la medición de la intensidad de la relación entre variables.Presentan una distribución normal bivariada ( X e Y varíanconjuntamente)

    R e c u p e r a d o d e : h t t p : / / u c e . u n i o v i . e s / c u r s o l i n e a l / I n f o r m e s e 4 . h t m l

  • 8/18/2019 Correlación y Covarianza (14).1

    4/27

    Valor estimado de Y para un determinado valorde X:a= Valor que toma Y cuando X es igual a cero.b= Coeficiente de regresión (indica el incremento de lavariable Y al incrementarse X en una unidad.

    Objetivo:- Predecir o estimar el valor de la variable Y

    en función de otra u otras variablesindependientes o predictoras.

    Regresión Lineal

    Pretende establecer si hayrelación funcional entre dosvariables cuantitativas

    Y =α + βXα y β son los parámetrosa y b son estimadores de α y β

    Se puede establecer cómo estánrelacionadas las variables(fenómeno de causa-efecto).

    Los valores que toma la variableindependiente son seleccionadas por elinvestigador (no aleatorias) y los valoresde la variable dependiente se determinanpor la relación entre las variables .

  • 8/18/2019 Correlación y Covarianza (14).1

    5/27

    Supuestos:

    a) La variable dependiente es una variable aleatoria.

    b) Variables independientes y dependientes están relacionadas en formalineal.

    c) Establece que aunque se puedan controlar los valores de la variableindependiente, los valores de la variable dependiente deben obtenerse através del proceso de muestreo aleatorio.

    d) Que las varianzas de las distribuciones condicionales de la variabledependiente, dados diferentes valores de la variable independiente seantodas iguales.

    e) Que las distribuciones condicionales de la variable dependiente, dados

    diferentes valores de la variable independiente están distribuidasnormalmente.

    f) Los valores observados de la variable dependiente sean independientesentre si.

  • 8/18/2019 Correlación y Covarianza (14).1

    6/27

    ECUACIÓN DE REGRESIÓN LINEAL SIMPLE

    Error estimadoSon desviaciones de los valores observadosde la variable respuesta, respecto a la Líneade regresión.

    Considerando la muestra

    0

    = α + β iXi + ei

  • 8/18/2019 Correlación y Covarianza (14).1

    7/27

    Método de los MínimosCuadrados.- ajusta la recta quecumple la siguiente condición: lasuma de los cuadrados de lasdesviaciones de cada valorobservado respecto a sucorrespondiente valor de predicción,sea mínima.

    =1Al utilizar el método de mínimos cuadradosobtenemos las siguientes dos ecuacionesconocidas como ecuaciones normales:

    n

    i

    i

    n

    i

    ii

    n

    i

    i

    n

    i

    i

    n

    i

    i

    X b X aY X

    X bnaY

    1

    2

    11

    11

  • 8/18/2019 Correlación y Covarianza (14).1

    8/27

    Resolviendo el sistema de ecuaciones normales se obtiene que:

    22

    2

    ii

    iiiii

    X X n

    Y X X Y X a

    22

    ii

    iiii

    X X n

    Y X Y X nb

    O también:

  • 8/18/2019 Correlación y Covarianza (14).1

    9/27

    ERROR ESTÁNDAR DE ESTIMACIÓN

    .2

    ( )2

  • 8/18/2019 Correlación y Covarianza (14).1

    10/27

    COVARIANZA 1

    n

    i ii

    xy

    X X Y Y s

    n

    Enunciados:a) Si las dos variables crecen o decrecen a la vez (nube de puntos creciente).b) Si una variable crece, la otra tiene tendencia a decrecer (nube de puntosdecreciente).c) Si los puntos se reparten con igual intensidad, (no hay relación

    lineal).

    Medida que nos permite determinar lavariabilidad conjunta de dos variablesnuméricas (cuantitativas).

    La covarianza mide la fuerza de larelación lineal entre dos variables

  • 8/18/2019 Correlación y Covarianza (14).1

    11/27

    Hallar la covarianza del siguiente conjunto de datos:

    Solución:

    = 5

    .Sxy = 894/5– 30.4 x 5

    Sxy = 26.8

  • 8/18/2019 Correlación y Covarianza (14).1

    12/27

  • 8/18/2019 Correlación y Covarianza (14).1

    13/27

    Los valores que puede tomar el coeficiente de correlación "r" son:

    -1 < r < 1

    Si "r" > 0 La correlación lineal es positiva (si sube el valor de una variablesube el de la otra). La correlación es tanto más fuerte cuanto más seaproxime a 1.

    Si "r" < 0 La correlación lineal es negativa (si sube el valor de una variable

    disminuye el de la otra). La correlación negativa es tanto más fuerte cuantomás se aproxime a -1.

    Si "r" = 0 No existe correlación lineal entre las variables, aunque podríaexistir otro tipo de correlación (parabólica, exponencial, etc.)

    De todos modos, aunque el valor de "r" fuera próximo a 1 ó -1, tampoco estoquiere decir obligatoriamente que existe una relación de causa-efecto entrelas dos variables, ya que este resultado podría haberse debido al puro azar

  • 8/18/2019 Correlación y Covarianza (14).1

    14/27

  • 8/18/2019 Correlación y Covarianza (14).1

    15/27

    Coeficiente de correlación:

    Estadístico de Prueba:

  • 8/18/2019 Correlación y Covarianza (14).1

    16/27

  • 8/18/2019 Correlación y Covarianza (14).1

    17/27

    Ejemplo:

    El dueño de una tienda de artefactos está interesado en medir el efectodel precio de un televisor, sobre la cantidad vendida. Los resultados de latabla adjunta se obtuvieron de una muestra aleatoria de las ventas de 8semanas. El precio está dado en soles y las ventas unidades.

    Precio(soles)

    1920 2050 1970 2130 2080 1990 1780 1720

    Ventas(unidades)

    25.4 14.7 18.6 12.4 11.1 15.7 29.2 35.2

  • 8/18/2019 Correlación y Covarianza (14).1

    18/27

    CálculosX Y X.Y X2 Y2

    19202050197021302080199017801720

    25.414.718.612.411.115.729.235.2

    4876830135366422641223088312435197660544

    36864004202500388090045369004326400396010031684002958400

    645.16216.09345.96153.76123.21246.49852.641239.04

    15640 162.3 308808 30720000 3822.35

    35.3822

    30720000308808

    3.16215640

    8

    1

    2

    8

    1

    28

    1

    8

    1

    8

    1

    i

    i

    i

    ii

    i

    i

    i

    i

    i

    i

    Y

    X Y X

    Y X

  • 8/18/2019 Correlación y Covarianza (14).1

    19/27

    a) Construya el Diagrama de Dispersión

  • 8/18/2019 Correlación y Covarianza (14).1

    20/27

    b) Calcule el Coeficiente de Correlación Lineal

    X Y X.Y X2 Y2

    192020501970213020801990

    17801720

    25.414.718.612.411.115.7

    29.235.2

    487683013536642264122308831243

    5197660544

    368640042025003880900453690043264003960100

    31684002958400

    645.16216.09345.96153.76123.21246.49

    852.641239.04

    15640 162.3 308808 30720000 3822.35

    Reemplazando en la fórmula obtenemos un r = - 0.9726

    Interpretación: Existe una alta correlación lineal negativa, lo cualsignifica que cuando el precio de los televisores suben; las ventas bajan.

    ) Obt ió d l ió d ió li l

  • 8/18/2019 Correlación y Covarianza (14).1

    21/27

    c ) Obtención de la ecuación de regresión lineal:

    Reemplazando en las fórmulas tenemos:

    a = 30720000 (162.3) – 15640 (308808) = 135.78(30720000) – (15640) 2

    b = 8(308808) – 15640 (162.3) = - 0.0598(30720000) – (15640) 2

    La ecuación de regresión será:= 135.7 - 0.059 X

    Interpretación: Al aumentar el preciode un artefacto en un sol, entonces las

    ventas se reducen enaproximadamente 0.06 unidades; estosignificaría que si el precio aumentaraen 100 soles se venderíanaproximadamente 6 unidades menos.

  • 8/18/2019 Correlación y Covarianza (14).1

    22/27

    Se desea pronosticar las ventas, para una determinada semana si elprecio de un televisor se estableciera en 2000 soles.

    = 135.7 - 0.059 (2000) = 17.63 es decir aproximadamente 18televisores

  • 8/18/2019 Correlación y Covarianza (14).1

    23/27

    Ejemplo:

    Un analista extrae una muestra de 10 embarques en camión que ha realizadouna empresa y registra la distancia en millas así como el tiempo de entrega

    con una aproximación de medio día desde el momento en que el embarqueestuvo disponible para recogerlo. Construya el diagrama de dispersión yrealice los cálculos correspondientes.

    Fletemuestreado 1 2 3 4 5 6 7 8 9 10

    Distancia X(millas) 825 215 1070 550 480 920 1350 325 670 1215

    Tiempo deentrega Y

    (días)3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0

  • 8/18/2019 Correlación y Covarianza (14).1

    24/27

    Solución:

    Resultados

    a = 2.85

    b = 0.00358

    Y = 2.85 -0.00358X

    r = 0.9489

    r2 = 0.9004

    Sxy=

  • 8/18/2019 Correlación y Covarianza (14).1

    25/27

    Ejemplo:Analizar si las variables están relacionadas linealmente y aplicar el estadísticode prueba.

    Tabla: Nivel de inteligencia (X vs. Rendimiento académico (Y)

  • 8/18/2019 Correlación y Covarianza (14).1

    26/27

  • 8/18/2019 Correlación y Covarianza (14).1

    27/27