Estadística Descriptiva y Analisis de Datos con la Hoja de Cálculo Excel Regresión mínimo...

Post on 05-Mar-2015

25 views 1 download

Transcript of Estadística Descriptiva y Analisis de Datos con la Hoja de Cálculo Excel Regresión mínimo...

Estadística Descriptiva y Analisis de Datos con la Hoja de Cálculo Excel

Regresión mínimo cuadrada (II)

Problemas con los errores

• Violación de las hipótesis sobre los errores

• Heterocedasticidad

• Autocorrelación

Heterocedasticidad

R esidu o s co n h etero ced asticidad

0

5 00

10 00

15 00

20 00

25 00

30 00

35 00

0 200 400 600 800 10 00

Re siduo s valor ab soluto (e )

Va

ria

ble

es

tim

ad

a (

y)

Test para detectar la Heterocedasticidad

• Test de Bartlett

• Test de Goldfeld-Quandt

• Test de White

Autocorrelación

Residuos con problema de autocorrelación

-1000

-500

0

500

1000

1940 1950 1960 1970 1980 1990 2000 2010

Test de Durbin-Watson

ttt uee 1ˆ∙ˆ

n

tt

n

ttt

e

eed

1

2

2

21

ˆ

)ˆˆ(

El valor de estadístico d oscila entre 0 y 4, valores cercanos 2 indican ausencia de autocorrelación.

Ejemplo 5.2

Consumo de Energía Eléctrica(miles de TEP)

PIB(millones de euros)

1987 9427 3553121988 9876 3734121989 10410 3914431990 10974 4062521991 11372 4165821992 11488 4204621993 11569 4161261994 11999 4260411995 12462 4377871996 12827 4484571997 13331 4665131998 14290 4867851999 15364 5073462000 16309 5287142001 17282 5437462002 17756 554852

Estimación MCO. Ejemplo 5.2

Estadísticas de la regresiónCoeficiente de correlación múltiple 0.99619699Coeficiente de determinación R2 0.99240844R2 ajustado 0.99186619Error típico 233.805853Observaciones 16

Coeficientes Error típico Estadístico t ProbabilidadIntercepción -6234.453 451.562 -13.806 0.000PIB-$ 0.043 0.001 42.780 0.000

Errores Ejemplo 5.2

Grafico de los residuos

-400,0

-300,0

-200,0

-100,0

0,0

100,0

200,0

300,0

400,0

500,0

600,0

1986 1988 1990 1992 1994 1996 1998 2000 2002 2004

Calculo estadístico. Ejemplo 5.2

Y* et et2 et-et-1 (et-et-1)

2

1987 8933 494.2 354817.81988 9705 170.5 373241.5 -323.6 104742.41989 10475 -65.2 391508.2 -235.7 55551.61990 11107 -133.3 406385.3 -68.2 4645.21991 11548 -176.3 416758.3 -43.0 1845.51992 11714 -225.9 420687.9 -49.6 2462.81993 11529 40.2 416085.8 266.1 70804.91994 11952 46.9 425994.1 6.8 45.61995 12453 8.5 437778.5 -38.4 1474.91996 12909 -81.9 448538.9 -90.5 8185.41997 13680 -348.7 466861.7 -266.8 71161.51998 14545 -255.1 487040.1 93.6 8769.21999 15423 -58.8 507404.8 196.3 38536.62000 16335 -25.9 528739.9 32.9 1079.72001 16977 305.4 543440.6 331.3 109776.42002 17451 305.3 554546.7 -0.1 0.0Total 0.0 7179830.0 -188.8 479081.7

0667.00.830,179,7

7.081,479

ˆ

)ˆˆ(

1

2

2

21

n

ii

n

iii

e

eed

Regla de decisión

• Si d di rechazamos la hipótesis nula de no autocorrelación frente a la hipótesis alternativa de autocorrelación positiva.

• Si d 4 – di rechazamos la hipótesis nula de no autocorrelación frente a la hipótesis alternativa de autocorrelación negativa.

• Si ds d 4- ds aceptamos la hipótesis nula de no autocorrelación.

• Los valores teóricos del estadístico para n=16 observaciones y k=1 variables explicativas, son dD=0.98 y dU=1.24. Dado 0.0667 < 0.98 no podemos rechazar la hipótesis de existencia de autocorrelación positiva.

Regresión Lineal Múltiple: forma matricial del modelo

MCO

tktktt eXXXeXY ...∙ 2211

nY

Y

Y

Y...

2

1

k21

21

22221

11211

X ...X X

...

............

...

...

nknn

k

k

XXX

XXX

XXX

X

K

...

2

1

ne

e

e

e...

2

1

Solución matricial MCO

YXXX ')'(ˆ 1

n

iik

n

iiik

ii

n

iiki

n

ii

n

iii

n

iiki

n

iii

n

ii

XXXX

XXXXX

XXXXX

XX

1

2

12

n

11ik

12

1

22

112

11

121

1

21

...X

..................

...

...

'

n

iiik

n

iii

n

iii

YX

YX

YX

YX

1

12

11

....

`

Con término independiente

n

iik

n

iiik

iik

n

iiki

n

ii

n

ii

n

iik

n

ii

XXX

XXXX

XXn

XX

1

2

12

n

1

11

1

21

11

111

...X

..................

...

...

'

n

iiik

n

iii

n

ii

YX

YX

Y

YX

1

11

1

....

`

Problema de las estimaciones del modelo lineal múltiple:

multicolinealidad

• Matriz (X’X) no invertible porque su determinante es cero ó próximo a cero

• Ocurre por que existe alguna combinación lineal entre las variables dependientes (Xk)

Funciones que se pueden estimar por MCO

• Funciones que se transforman en ecuaciones lineales.

• Funciones con variables explicativas cualitativas.

• Funciones con variables endogenas cualitativas: modelos logit y probit.

Funciones q ue se pueden estimar por MCO mediante

transformaciones

• Función polinómica

• Función potencial

• Función exponencial

• Función logaritmica tt XbaY log

tXt abY

btt aXY

ktkttt XXXY ...2

210

Variable cualitativa como explicativa

• Las variables cualitativas expresan cualidades o atributos de los agentes o individuos (sexo, religión, nacionalidad, nivel de estudios, etc.) y también recogen acontecimientos extraordinarios como guerras, terremotos, climatologías adversas, huelgas, etc.

• Toman valores según atributos. Varón=1, Mujer=0 . mes de Huelga=1, Mes sin huelga=0.

• También pueden utilizarse para tratar los cambios estacionales.• Hay que tener cuidado con la multicolinealidad

Cualitativa para modelizar estacionalidad (I)

Año Q Demanda de Electricidad (GWh)PIB (millones de euros)1S 2S 3S1996 1 40919 109275 1 0 0

2 37275 111875 0 1 03 38070 111211 0 0 14 39981 116096 0 0 0

1997 1 40246 113396 1 0 02 39070 115566 0 1 03 40464 115744 0 0 14 42602 121807 0 0 0

1998 1 43263 118399 1 0 02 41535 120735 0 1 03 43273 121472 0 0 14 45010 126179 0 0 0

Cualitativa para modelizar estacionalidad (II)

3S 2S 1S PIB cte 1066,059923 -996,2154378 3087,378754 0,554750757 -24706,01664 434,268651 432,1741601 439,4452975 0,014926114 1999,126408

R2 0,981770046 854,4242183 #N/A #N/A #N/AF 363,5197257 27 #N/A #N/A #N/A

Modelos Logit/Probit

• La variable dependiente es dicotómica (toma valores 0 y 1)

• Los errores no siguen la distribución binomial• Para que las predicciones estén en el intervalo

(0,1) hay que utilizar la funciones acotadas como son la distribución normal o logística para obtener prediciones para la variable dependiente.