Análisis de datos y Estadística Avanzada - webs.ucm.· Ejemplo de diagrama de dispersión. Los...

download Análisis de datos y Estadística Avanzada - webs.ucm.· Ejemplo de diagrama de dispersión. Los datos

of 12

  • date post

    28-Jul-2018
  • Category

    Documents

  • view

    218
  • download

    0

Embed Size (px)

Transcript of Análisis de datos y Estadística Avanzada - webs.ucm.· Ejemplo de diagrama de dispersión. Los...

  • Anlisis de datos y Estadstica AvanzadaMster Interuniversitario de Astrofsica UCM+UAM

    Tema 4: Regresin lineal simple

    Javier Gorgas y Nicols CardielDepartamento de Astrofsica y Ciencias de la Atmsfera

    Facultad de Ciencias Fsicas

    Universidad Complutense de Madrid

    Tema 4: Regresin lineal simple () Anlisis de datos y Estadstica Avanzada 1Curso 2010/2011 1 / 29

    Esquema

    1 IntroduccinAnlisis de regresinTipos de regresin

    2 Regresin lineal simpleTratamiento clsicoTratamiento avanzado6 mtodos de ajuste por mnimos cuadrados

    Tema 4: Regresin lineal simple () Anlisis de datos y Estadstica Avanzada 2Curso 2010/2011 2 / 29

  • Introduccin Anlisis de regresin

    Qu es la regresin?El trmino regresin fue acuado por Francis Galton en el siglo XIX parareferirse a fenmenos biolgicos: los descendientes de progenitoresexcepcionales son, en promedio, menos excepcionales que los progenitores, y

    ms parecidos a sus ancestros ms distantes (Galton utiliz el trmino reversional hablar de guisantes en 1877, y regression al referirse a la altura de humanosen 1885).

    Tema 4: Regresin lineal simple () Anlisis de datos y Estadstica Avanzada 3Curso 2010/2011 4 / 29

    Introduccin Anlisis de regresin

    Anlisis de regresinEl anlisis de regresin es un intento de examinar la relacin que existe entreuna variable dependiente (variable respuesta) y un conjunto de variablesindependientes (predictores).

    El modelo matemtico que establece dicha relacin es la ecuacin de regresin.

    La variable dependiente se modela como una variable aleatoria.

    La ecuacin de regresin contiene una serie de parmetros de regresin(constantes) que establecen la relacin cuantitativa entre las variablesindependientes y la dependiente. Estos parmetros se estiman a partir de datos.

    Los parmetros de un modelo de regresin pueden estimarse de variasmaneras, por ejemplo utilizando

    el mtodo de mnimos cuadrados (OLS, del ingls ordinary least squares)el mtodo de mxima verosimilitudtcnicas bayesianas. . .

    Tema 4: Regresin lineal simple () Anlisis de datos y Estadstica Avanzada 4Curso 2010/2011 5 / 29

  • Introduccin Tipos de regresin

    Regresin lineal y no linealRegresin lineal: la relacin entre la respuesta Y (variable dependiente) y las variablesindependientes Xi es lineal

    Y = 0 + 1X1 + 2X2 + . . . + nXn.

    En este sentido, una relacin del tipo

    Y = 0 + 1X + 2X 2

    tambin es lineal (lineal en X y X 2), aunque la representacin grfica no sea una lnearecta.Algunos problemas no lineales pueden linealizarse realizando una transformacinadecuada. Por ejemplo

    Y = abX

    se linealiza tomando logaritmos a ambos lados, es decir

    ln(Y) = ln(a) + ln(b)X .

    Regresin no lineal: aquella en la que la relacin entre la respuesta y las variablesindependientes no es una funcin lineal o linealizable.

    En este tema vamos a concentrarnos en la regresin lineal simple: Y = + X .

    Simple? En absoluto!

    Tema 4: Regresin lineal simple () Anlisis de datos y Estadstica Avanzada 5Curso 2010/2011 7 / 29

    Regresin lineal simple Tratamiento clsico

    Ejemplo de diagrama de dispersin. Los datos corresponden a las medidasde dispersin de velocidades y luminosidad en una muestra de 40 galaxiaselpticas realizadas por Schechter P.L. (1980).

    Cuando en un diagrama de dispersin los datos se distribuyen aproximadamente a lo largo de unalnea reacta ajustaremos una recta de regresin. La regresin de y sobre x vendr dada entoncespor y = a + bx, con a y b dos parmetros a determinar. Grficamente, a ser la ordenada en elorigen y b la pendiente de la recta.

    Tema 4: Regresin lineal simple () Anlisis de datos y Estadstica Avanzada 6Curso 2010/2011 9 / 29

  • Regresin lineal simple Tratamiento clsico

    Cmo se determina la recta de regresin? (Mtodo de mnimos cuadrados)Se minimiza la suma de los cuadrados de las distancias entrelos valores yi y los valores dados por la recta:

    yi = a + bxi

    di = yi yi (residuo)

    M =NX

    i=1d2i =

    NX

    i=1(yi yi)

    2

    M =NX

    i=1(a + bxi yi)2

    8:

    Ma =

    Ph2 a+bxiyi

    i

    1

    i

    i= 0

    Mb =

    Ph2 a+bxiyi

    i

    xii

    i= 0

    8