Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple.

Post on 23-Jan-2016

263 views 0 download

Transcript of Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple.

Pronósticos, Series de Tiempo y Regresión

Capítulo 4: Regresión Lineal Múltiple

Temas

Modelo de Regresión Lineal Estimaciones de Mínimos Cuadrados y

Estimación Puntual y Predicción Error Cuadrático Medio y Error Estándar Utilidad del Modelo: R2, R2 Ajustada y la

Prueba F Global Prueba de la Significancia de Una Variable

Independiente Intervalos de Confianza Para Valores

Esperados y de Predicción Temas Avanzados

Modelo de Regresión Lineal

Se emplean más de una variable independiente.

relaciona y con x1, x2, ..., xk

modelo:

kkxxxy xxxyk

22110,...,,| 21

Modelo de Regresión Lineal

Valor medio de y cuando los valores de las variables independientes son x1, x2, ..., xk :

parámetros: β0, β1, β2, ..., βk

término de error:

kkxxxy xxxyk

22110,...,,| 21

Modelo de Regresión Lineal

Suposiciones del modelo de regresión lineal:

1. En cualquier combinación dada de valores de x1, x2, ..., xk , la media de la población de los valores

potenciales de = 0

2. Suposición de la varianza constante

3. Suposición de normalidad

4. Suposición de la independencia

Modelo de Regresión Lineal

Interpretación de los parámetros de regresión β0, β1, β2, ..., βk

Los parámetros relacionan la media de la variable dependiente con

las variables independientes en un sentido global.

β0 : ordenada al origen

β1 : cambio en el consumo medio de combustible a la semana que se

asocia con el incremento de un grado en la temperatura promedio

cuando no cambia el índice de enfriamiento.

β2 : cambio en el consumo medio de combustible a la semana que se

asocia con el incremento de una unidad en el índice de enfriamiento

cuando no cambia la temperatura horaria promedio.

Modelo de Regresión Lineal

Interpretación geométrica del modelo de

regresión

región experimental: combinaciones de los

valores observados de x1, x2, ..., xk

plano de medias

Estimaciones de Mínimos Cuadrados y Estimación Puntual y Predicción Estimación puntual del valor medio y de un

valor individual de la variable dependiente y cuando los valores de las variables independientes son x01, x02, ..., x0k .

Se predice = 0 Esta ecuación se llama la ecuación de

predicción de mínimos cuadrados

kk xbxbxbby 00220110ˆ

Error Cuadrático Medio y Error Estándar Una estimación puntual de σ2 es el error

cuadrático medio:

Una estimación puntual de σ es el error estándar:

12

kn

SSEs

1

kn

SSEs

Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global En el caso del modelo de regresión lineal múltiple,

1. Variación total = Σ(yi-y)2

2. Variación explicada = Σ(yi-y)2

3. Variación inexplicada = Σ(yi-yi)2

4. Variación total = Variación explicada + Variación inexplicada

5. El coeficiente de determinación múltiple es R2 = (variación explicada)/(variación total)

6. El R2 es la proporción de la variación total en los n valores observados de la variable dependiente que explica el modelo de regresión global

7. Coeficiente de correlación múltiple: R = √R2

Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global R2 Ajustada

donde R2 es el coeficiente de determinación múltiple n es la cantidad de observaciones y k es la cantidad de variables independientes en

el modelo

1

1

122

kn

n

n

kRR

Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global

H0: β0 = β1 = β2 =... = βk = 0

Ha: por lo menos uno de los β0, β1,

β2, ..., βk ≠ 0

Estadística F global:

1/exp_

/exp_)(mod

knlicadainVariación

klicadaVariacióneloF

Utilidad del Modelo: R2, R2 Ajustada y la Prueba F Global

Se puede rechazar H0 y aceptar Ha en el nivel

de significancia α si se mantiene alguna de las

condiciones siguientes: Estadística F (modelo) > F[α]

valor p < α donde el punto F[α] se basa en k grados de

libertad pra el numerador y n-(k+1) para el denominador.

Prueba de la Significancia de Una Variable Independiente

Defina la estadística de una prueba

y asuma que las suposiciones de regresión se mantienen.

jb

j

s

bt

Prueba de la Significancia de Una Variable Independiente

Hipótesis alternativa

Condición de punto de rechazo

Valor p

Ha : βj ≠ 0 2 (área bajo la curva t a la derecha de |t|)

Ha : βj > 0 área bajo la curva t a la derecha de t

Ha : βj < 0 área bajo la curva t a la izquierda de t

)1(2/|| kntt

1 kntt

1 kntt

Prueba de la Significancia de Una Variable Independiente

Si se cumplen las suposiciones de la

regresión, un intervalo de confianza de

100(1-α)% para el parámetro de

regresión βj es

jbkn

j stb 12/

Intervalos de Confianza Para Valores Esperados y de Predicción Para calcular el valor de distancia en un

modelo de regresión múltiple, se requiere de álgegra de matrices.

(Véase el Apéndice B.)

Intervalos de Confianza Para Valores Esperados y de Predicción Si se cumplen las suposiciones de la

regresión, un intervalo de confianza de 100(1-α)% para el valor medio de y cuando los valores de las variables independientes son x01, x02, ..., x0k es

..ˆ 12/ dvsty kn

Intervalos de Confianza Para Valores Esperados y de Predicción Si se cumplen las suposiciones de la

regresión, un intervalo de predicción 100(1-α)% para un valor individual de y cuando los valores de las variables independientes son x01, x02, ..., x0k es

..1ˆ 12/ dvsty kn

Temas Avanzados

Modelo de Regresión Cuadrática Interacción Uso de Variables Ficticias para Modelar

Variables Independientes Cualitativas Prueba F Parcial: Prueba de la

Significancia de una Parte de un Modelo de Regresión

Modelo de Regresión Cuadrática El modelo de regresión cuadrática que

relaciona y con x es

2210 xxy

Modelo de Regresión Cuadrática

μy|x μy|x μy|x

μy|x μy|x μy|x

x x x

x x x

Interacción

Se introduce un término de interacción

cuando se cree que una variable (xi)

influye en la relación entre otra variable

(xj) independiente y la variable

dependiente, y.

21322110 xxxxy

Uso de Variables Ficticias para Modelar Variables Independientes Cualitativas Cuando se quiere incluir una variabla

cualitativa, se pueden utilizar variables ficticias (variables indicadoras, dummies).

Toman el valor de 1 o 0. En efecto, esta variable influye en el

intercepto.

Uso de Variables Ficticias para Modelar Variables Independientes Cualitativas Ejemplo para comparar tres

ubicaciones:

DM DDxy 32110

DM DDxy 864.6374.2886859.0978.14ˆ