Analisis de Regresion y Correlacion

download Analisis de Regresion y Correlacion

of 38

description

estadística inferencial

Transcript of Analisis de Regresion y Correlacion

  • ANALISIS DE REGRESION Y CORRELACION

    Area

    Pre

    cio

    30002500200015001000

    220000

    200000

    180000

    160000

    140000

    120000

    Scatterplot of Precio vs Area

    Mgr. Sonia Urquidi B.

  • OBJETIVOS Describir la relacin entre dos o ms

    variables

    Describir la fuerza de la relacin entre las variables independientes y la variable dependiente

    Aplicar a la realidad

    Especificar y Estimar un Modelo de Relacin entre las variables econmicas relativas a una determinada cuestin conceptual

  • CONTENIDO

    1. Introduccin

    2. Regresin simple

    3. Regresin lineal simple

    4. Anlisis de correlacin

    5. Pruebas para parmetros poblacionales

    6. Anlisis de regresin mltiple

    7. Coeficiente de correlacin mltiple

  • 1. Introduccin

    Publicidad Ventas 35 350 50 450 40 360 65 540 55 520 45 420 70 560

  • Regresin y correlacin son las dos herramientas estadsticas ms poderosas y tiles que se pueden utilizar para solucionar muchos problemas.

    Es un mtodo de anlisis de datos que sirve para poner en evidencia las relaciones que existen entre diversas variables

  • Con la regresin, se pretende identificar y cuantificar alguna relacin funcional entre dos o ms variables.

    Una variable puede depender de una o ms variables.

    Si solo depende de una, se puede decir que Y depende de X:

    Y = f(X)

    Regresin simple

  • Si depende de varias:

    Y =f (X1, X2,,Xn)

    Regresin mltiple

    Demanda est en funcin de:

  • 2. Regresin simple

    Es la relacin entre dos variables.

    Puede ser: Lineal: a medida

    que X cambia Y cambia en una cantidad constante

  • Curvilnea

  • Curvilnea

  • 3. Regresin Lineal Simple Se trata de predecir el comportamiento

    de Y usando X.

    El modelo de regresin lineal simple es de la forma:

    XY10

    Variable dependiente o respuesta

    Variable independiente o predictora o explicativa

    Intercepto

    Pendiente

    Error aleatorio

  • Ejemplos

    Y Ventas

    X es la publicidad

    La recta es:

    Y = 124 + 6 X

    Intercepto Pendiente

    Variacin vertical

    Variacin horizontal

  • Lnea de regresin estimada

    El modelo de regresin lineal es estimado por la ecuacin

    eXY 10

    Estimaciones

    10 Error

    Solo puede estimarse

  • Lnea de regresin estimada

    El modelo de regresin estimada es:

    XY10

  • Interpretacin de los Coeficientes de Regresin:

    Interpretacin del intercepto :

    Indica el valor promedio de la variable de respuesta Y cuando X es cero. Si se tiene certeza de que la variable predictora X no puede asumir el valor 0, entonces la interpretacin no tiene sentido.

    Interpretacin de la pendiente :

    Indica el cambio promedio en la variable de respuesta Y cuando X se incrementa en una unidad.

    0

    1

  • La ecuacin para estimar los parmetros de regresin es:

    XY10

    Es la recta que mejor se ajusta a los

    datos muestrales

    De lo que se trata es de estimar

    0

    1

  • MINIMOS CUADRADOS ORDINARIOS

    Procedimiento matemtico para

    estimar la recta de regresin.

    M.C.O produce una recta que se

    extiende por el centro del

    diagrama de dispersin

    aproximndose a todos los

    puntos de datos ms que

    cualquier otra recta.

  • Ejemplo

    Publicidad Ventas

    35 350

    50 450

    40 360

    65 540

    55 520

    45 420

    70 560 0

    100

    200

    300

    400

    500

    600

    0 10 20 30 40 50 60 70 80

    Ventas

    Diagrama de dispersin

  • 320

    370

    420

    470

    520

    570

    620

    30 35 40 45 50 55 60 65 70 75

    Ventas y Publicidad

    Cambiando origen de los ejes

  • 320

    370

    420

    470

    520

    570

    620

    30 35 40 45 50 55 60 65 70 75

    Ventas y Publicidad

    Agregando la recta estimada

    XY

    10

  • 320

    370

    420

    470

    520

    570

    620

    30 35 40 45 50 55 60 65 70 75

    Ventas y Publicidad

    XY10

    iY

    iY

  • 320

    370

    420

    470

    520

    570

    620

    30 35 40 45 50 55 60 65 70 75

    Ventas y Publicidad

    XY10

    iY

    iY

    Error

  • DIFERENCIA ENTRE LOS VALORES REALES DE Y

    ERROR

    iY

    Y EL ESTIMADO DE Y

    iY

    )(iiYYError

  • M.C.O HACE QUE SE MINIMICE LA SUMA DE ESTOS ERRORES AL CUADRADO

    0)( ii YY

    mnimoYYii

    2

    )(

  • mnimoYYii

    2

    )(

    COMO LA RECTA ESTIMADA ES:

    mnimoXYii

    2

    10)(

    iXY

    10

    REEMPLAZANDO VALORES:

  • DERIVANDO LOS PARAMETROS E IGUALANDO A O Y APLICANDO SUMAT.

    mnimoXYii

    2

    10)(

    ii XnY 10

    2

    10 iiii XXXY

  • XYi

    47.634.124

    La recta estimada es:

  • SUPUESTOS DEL MODELO DE REGRESION

    1. El trmino de error es una variable aleatoria distribuida normalmente

    Para cada valor de X, no necesariamente existe un solo valor de Y

    Algunas veces Y estar por encima de la recta de regresin y otras por debajo, da el llamado error, los mismos que se distribuyen en forma normal y aleatoriamente alrededor de la recta de regresin poblacional

  • 2. Varianzas iguales de los valores Y

    M.C.O asume que las varianzas en los valores de Y es la misma para todos los valores de X.

    Supuesto de HOMOSCEDASTICIDAD

    Y en la prctica?

  • 2. Los trminos de error son independientes uno de otro

    El trmino error encontrado para un valor de Y, no se relaciona con el trmino de error para cualquier otro valor de Y

    Esto puede verse analizando el diagrama de los errores de los datos muestrales, si no se observa ningn patrn, se puede asumir que los trminos de error no se relacionan.

    Si no cumple este supuesto, se dice que hay autocorrelacin.

  • 4. Medidas de bondad de ajuste

    A la recta de regresin, se la denomina tambin la recta del ajuste ptimo, sin embargo es necesario conocer qu tan bien se ajustan los datos a esta recta

    1. Error estndar de la estimacin

    2. Coeficiente de determinacin

  • Error estndar de la estimacin:

    Se Es una medida del grado de

    dispersin de los valores Yi alrededor de la recta de regresin

  • Mide la variacin de los puntos de los datos por encima y por debajo de la recta

    320

    370

    420

    470

    520

    570

    620

    30 35 40 45 50 55 60 65 70 75

    Ventas y Publicidad

  • Qu pasa si todos los puntos estn sobre la recta?

    Cunto es el error de estimacin?

    As ocurre en la realidad?

    Siempre hay dispersin

    Es medida por el error estndar de la estimacin

  • Error estndar de la

    estimacin: Se

    2

    )( 2

    n

    YYS iieVentas

    350 450 360 540 520 420 560

    Y est 350,79 447,84 383,14 544,89 480,19 415,49 577,24

    (Yi Y est)^2 0,69 4,42 537,70 24,64 1.579,77 19,86 299,94

    2.467,03

    27

    03,2467

    eS

    21,22eS

  • Error estndar de la

    estimacin: Se, tambin se puede calcular:

    CMESe

    2n

    SCECME

    X

    XY

    YSC

    SCSCSCE

    2)(

  • A TRAVS DE EXCEL

    Estadsticas de la regresin Coeficiente de correlacin mltiple 0,97139156 Coeficiente de determinacin R^2 0,94360156 R^2 ajustado 0,93232187 Error tpico 22,2127395 Observaciones 7

  • GRACIAS