Regresion y Correlacion

4

Click here to load reader

Transcript of Regresion y Correlacion

Page 1: Regresion y Correlacion

UNIVERSIDAD NACIONAL EXPERIMENTAL “FRANCISCO DE MIRANDA”

DPTO. DE FÍSICA Y MATEMÁTICA CÁTEDRA: ESTADÍSTICA

TEMA Nº 8. REGRESIÓN LINEAL SIMPLE Y CORRELACIÓN

REGRESIÓN: Consiste en la medición del “grado de dependencia” de una variable dependiente Y sobre una variable independiente (o de regresión) X. La variable independiente es manipulada por el experimentador. Es decir, el experimentador decide qué valores tomará la variable independiente, mientras los valores de la variable dependiente están determinados por la relación, si existe, entre ambas variables. Por ejemplo, si un investigador mide el grado de dependencia del ritmo cardíaco en ciertos animales sometiéndolos a temperaturas específicas tales como: 10ºC, 20ºC, 30ºC. En este caso, la Temperatura no es una variable aleatoria porque los valores de “T” son establecidos por el investigador. El ritmo cardíaco, por su parte, si es una VA ya que no está bajo el control del investigador. CORRELACIÓN: Consiste en determinar el “grado de asociación” (interdependencia) entre dos variable. En la Correlación se está interesado en saber si dos variables covarían, es decir, si varían juntas. Por ejemplo, un investigador desea determinar la asociación entre la biomasa marina y la cantidad de clorofila. El investigador por tanto, saca repetidas muestras de agua de un lugar de muestreo en un lago y mide la cantidad de clorofila y la biomasa en cada muestra repetida. En esta situación el investigador no tiene control sobre una u otra variable, puesto que ambos valores encontrados en las muestras serán “los que la naturaleza provee”. Por ello, estas variables son aleatorias y la correlación es el procedimiento estadístico adecuado. MODELO DE REGRESIÓN LINEAL SIMPLE: Continuando con el ejemplo anterior, considérese el diagrama de Dispersión siguiente donde Y representa el Ritmo Cardíaco de un cierto animal y X la Temperatura a la cual es sometido dicho animal bajo ciertas condiciones.

Page 2: Regresion y Correlacion

Un análisis a este diagrama de dispersión indica que, si bien una curva no pasa exactamente por todos los puntos, existe una evidencia fuerte de que los puntos están dispersos de manera aleatoria alrededor de una línea recta. Por consiguiente, es razonable suponer que la media de la VA Y está relacionada con X por la siguiente relación lineal:

XββμXYE 10XY

Donde:

- 0β , 1β , reciben el nombre de Coeficientes de Regresión, los cuales son

parámetros que deben estimarse a partir de datos muestrales. La manera apropiada para generalizar este hecho, con un modelo Probabilística Lineal es suponer que el valor esperado de Y es una función lineal de X, pero que para una valor fijo de X, el valor real de Y está determinado por el valor medio de la función (el modelo lineal) más un término que representa un error aleatorio, por ejemplo:

εXββY 10 , donde ε : Error aleatorio con =0 y V= 2

Este modelo recibe el nombre de MODELO DE REGRESIÓN LINEAL SIMPLE, ya que solo tiene una variable independiente o regresor. MÉTODO DE MÍNIMOS CUADRADOS Supóngase ahora que se tienen n pares de observaciones (x1, y1); (x2, y2);…;(xn, yn). En el siguiente gráfico puede observarse una representación gráfica de dispersión de los datos observados y un candidato para la recta de

Regresión. Las estimaciones de 0 y 1 deben dar como resultado una línea que, en algún sentido, se “ajuste mejor” a los datos.

Temperatura (X)

Rit

mo

Ca

rdía

co

(Y

)

Page 3: Regresion y Correlacion

Temperatura (X)

Rit

mo

Ca

rdía

co

(Y

)

El Método de Mínimos Cuadrados: consiste en estimar los coeficientes de

regresión ( 0, 1) de modo que se minimice la suma de los cuadrados de las distancias verticales que hay entre cada valor observado y la recta de regresión estimada. Entonces, la recta de regresión estimada o ajustada, es:

XββY 1ˆˆˆ

0

Las estimaciones de mínimos cuadrados de loa ordenada al origen y la pendiente del modelo de Regresión Lineal Simple son:

XβYβ 10ˆˆ

xx

xy

22

i

ii

2

i

ii

1S

S

XnX

XXY

XX

YXnYXβ̂

PREDICCIÓN DE “Y” PARA UN VALOR DADO DE “X” – USO DE LA ECUACIÓN DE PREDICCIÓN EN ESTIMACIÓN: Una aplicación importante de un modelo de regresión es la Predicción de observaciones nuevas o futuras de Y, correspondientes a un valor especificado de la variable de regresión X. Si X0 es el regresor de interés, entonces:

010 XββY ˆˆˆ0 ,

Recta de regresión estimada

Valor observado (y)

Page 4: Regresion y Correlacion

es el estimador puntual del valor nuevo o futuro de la respuesta Y0