Download - Tema 1. Informacion

8/18/2019 Tema 1. Informacion

1/38


2/38

INTRODUCCION

- Econometría: este vocablo procede del griego y significa “medida

de la economía”

- Esta definición no caracteriza completamente el contenido de lamateria, pero pone de manifiesto su carácter necesariamente

cuantitativo

- ! lo largo del tiempo, la Econometría "a ido ampliando su

contenido debido fundamentalmente a # aspectos:

o El desarrollo de la $eoría Económica

o %os avances en la $eoría Estadística

o El desarrollo de la &nformática y la creciente disponibilidad y

fácil acceso a grandes bases de datos 'tanto a nivel macro

como micro(- )or tanto, el continuo avance de esta disciplina "ace *ue no "aya

una definición generalmente aceptada

- &ntriligator '1+( define Econometría como a*uella rama de la

Economía *ue se ocupa de medir desde el punto de vista empírico

cual*uier relación entre variables económicas

- .e acuerdo con esta definición, los dos ingredientes básicos de la

Econometría son: 1( %a $eoría Económica y /( %os datos

- %a característica fundamental de esta disciplina es *ue debe saber

con0ugar perfectamente ambos ingredientes En otras palabras, un

económetra no puede defender la medición sin teoría, pero

tampoco la teoría sin datos

- aber con0ugar perfectamente teoría, datos y t2cnicas estadísticas

es lo más difícil, pero tambi2n lo más atractivo de la Econometría

!lguien di0o *ue “la Econometría sería más fácil sin datos”

- En definitiva, la Econometría debe complementar a la $eoría

Económica, para validar determinadas relaciones *ue postula

usando datos En este sentido, el económetra no puede prescindir

de la $eoría, ni el teórico de lo *ue “dicen los datos”

Relaciones entre la Teoría Económica y la Econometría

'1( %a Econometría necesita primero de la $eoría Económica para

*ue le proporcione un marco conceptual concreto )or e0emplo, la

teoría de 3eynes proporciona un marco en el *ue se relacionan

dos variables económicas: 4onsumo ' C ( y 5enta 'Y (, en donde,

además se postula *ue el C es una función de la Y : ' (C f Y = y noa la inversa En ocasiones, el económetra puede partir no de una

teoría, sino del sentido com6n o de la intuición de *ue e7ista unarelación entre un con0unto de variables )or e0emplo, puede

/


3/38

preguntarse si un tipo de inter2s a corto plazo depende de su

propia "istoria pasada o no

'/( %a teoría económica tambi2n necesita de la econometría para

poder validar, contrastar, determinadas "ipótesis postuladas por el

teórico En el e0emplo de la función de consumo 3eynesiana, se postula una función lineal entre C e Y : C a bY = + , donde a es el

consumo autónomo y b la propensión marginal a consumir

!demás, se supone *ue 8 1b≤ ≤ 9sando datos, el económetra

puede contrastar si esta restricción se cumple o no

'( %a teoría económica necesita de la econometría para poder seguir

desarrollándose Es decir, la evidencia empírica obtenida con los

datos puede ayudar a reformular teorías ya e7istentes o incluso,

sugerir nuevas En el e0emplo anterior, se puede contrastar si la

relación entre C e Y es lineal o no !demás, se puede contrastar

si la relación entre C e Y es estática Es decir, el C en un instante

puede depender de la Y en ese momento, pero tambi2n del C e Y

pasados

Pasos en un Estudio Econométrico:

'1( )ara *ue la teoría económica pueda utilizarse en un estudio

econom2trico necesita de una elaboración matemática *ue de lugar

a un modelo y en concreto, a un modelo econométrico 9n modeloeconom2trico no es un modelo geom2trico ni un modelomatemático En un modelo geom2trico se representan mediante

gráficos o diagramas relaciones entre variables económicas

'&;%


4/38

C e Y %a interpretación de ε es la influencia combinada sobre elC de variables distintas a la Y En concreto, en la función de

consumo, ε puede recoger factores como las e7pectativas de los

agentes, factores estacionales, tipos de inter2s En esta función

asumimos *ue el factor determinante del C es la Y , pero esto essólo una apro7imación En general, ε recogerá “todos los fallos del

modelo” %as "ipótesis *ue "agamos sobre estas variables aleatorias

son fundamentales para decidir *u2 t2cnica econom2trica usar

c( El tama>o El modelo debe ser pe*ue>o, escueto Esto *uiere

decir *ue tiene *ue tener pocos parámetros *ue le caracterizen

a Aormalmente, son gratuitos

.atos de sección cruzada: miden una variable en un momento

determinado del tiempo para distintas entidades Estas entidades

pueden ser individuos, familias, países, empresas, 4omunidades

!utónomas, sectores empresariales, etc )or e0emplo, podemos

tener una función de consumo familiar: i i iC a bY ε = + + , donde elsubíndice i "ace referencia a la familia

Estos datos fundamentalmente se obtienen a partir de entrevistas o

encuestas "ec"as a las entidades correspondientes %as dos fuentes

#


5/38

más importantes de este tipo de datos son: la E)@ 'Encuesta de

)resupuestos @amiliares( y la 4? '4entral de ?alances(

.atos de panel: surgen al cruzar una sección cruzada con una serie

temporal En nuestro e0emplo, tendríamos el dato de consumo deuna familia a lo largo de una serie de a>os 9n panel supone

disponer de muc"a más información *ue en una sección cruzada, ya

*ue tenemos distintas observaciones de una misma variable

'consumo( para una misma unidad 'familia( Esto es difícil

conseguir en una ciencia no e7perimental como es la Economía

En un panel se pueden analizar o contrastar "ipótesis *ue no es

posible con una sección cruzada )or e0emplo, contrastar si "a

"abido diferencias en el comportamiento del consumo de las

familias despu2s de un cambio de política económica 'impuestos(

en un momento determinado del tiempo

$anto las secciones cruzadas como los paneles no suele ser

información gratuita

'( 9na vez *ue se "a especificado el modelo y *ue se dispone de los

datos adecuados de todas las variables, se pasa a la etapa de

estimación del mismo 4onsiste en medir empíricamente los parámetros *ue caracterizan el modelo y a*uí entra la estadística,sobre todo la inferencia estadística '*ue usa la información

muestral disponible para inferir características de toda una

población(

'#( 9na vez *ue el modelo "a sido estimado usando las técnicaseconométricas adecuadas, llegamos al paso de la verificación oalidación del modelo e establecen criterios 'gráficos yestadísticos( para rec"azar o aceptar el modelo !*uí comienza un

proceso iterativo en la modelización, ya *ue si no aceptamos un

modelo, no lo usamos, sino *ue reformulamos el modelo teórico, o bien, tratamos de una forma más adecuada los datos ! veces, es

fácil teorizar sobre relaciones entre variables *ue están definidas de

forma precisa, pero otra cosa es obtener datos seguros de estas

variables )or e0emplo, es difícil siempre obtener datos razonables

de los beneficios de una empresa, de un tipo de inter2s o del stocB

de capital de una economía En algunos casos, no e7iste

contrapartida observable para una variable teórica

C


6/38

Usos de un modelo econométrico estimado: )ueden ser varios:

'1( !nálisis estructural e usa el modelo estimado para medir la

relación entre variables económicas !lgunos e0emplos, son la

medición de la propensión marginal a consumir de un país, de laelasticidad demanda-precio de un bien, de la elasticidad de la

producción-input de una empresa, de la curva de )"illips 'inflación

y paro(, de la relación entre ventas y publicidad de un producto en

una empresa, de la relación entre el rendimiento y riesgo de un

activo financiero, de la relación entre el salario y el nivel de

educación de un individuo, etc

'/( )redicción Es el uso más frecuente de un modelo econom2trico e

usa para predecir el valor futuro de una variable de inter2s %as

predicciones se usan para tomar decisiones )or e0emplo, todo el

mundo predice &nflación, )&? o 4onsumo @uera de la economía,

todos los días se "acen previsiones meteorológicas

'( Evaluación de políticas económicas e usa para simular el valor

futuro de una variable ba0o distintos supuestos de evolución de otras

En nuestro e0emplo, sería predecir el patrón de evolución de

consumo ba0o distintos escenarios de evolución de la renta i una

autoridad controla algunas variables, como la cantidad de dinero,

puede evaluar el efecto sobre la tasa de inflación ante distintos

escenarios de crecimiento monetario

Clasi!icación de aria"les en un modelo econométrico

%a principal clasificación es la de:

Dariable Endógena: es a*uella e7plicada por otras variables Es denotada

por y

Dariables E7ógenas: e7plican a la endógena pero no pueden estar influidas

por ella )uede "aber k variables e7plicativas y son denotadas por

1 /, ,, k x x x

ay *ue tener en cuenta *ue esta distinción varía dependiendo del modelo

econom2trico en particular y su ob0etivo !sí, una e7ógena en un modelo

puede pasar a ser la endógena de otro E0 ' (C f Y ε = + y ' (Y f M ε = + ,donde M es cantidad de dinero

Dariables continuas: pueden tomar valores en todos los puntos de la recta

real 'C e Y (

Dariables discretas: sólo toman valores en algunos puntos de la recta real

F


7/38

9n e0emplo son las variables ficticias o dummies *ue toman valor uno o

cero %a idea es *ue "ay características *ue no se pueden medir 'en euros,

en Bilos, etc(, pero *ue pueden ser factores relevantes a la "ora de e7plicar

a otra variable )or e0emplo, en la función de consumo familiar, además de

la renta, el "ec"o de *ue la familia viva en el campo o en la ciudad puedeser relevante para e7plicar diferencias en el consumo )ara ello, se

construye una variable ficticia *ue toma uno para las familias *ue viven en

la ciudad y cero para las *ue viven en el campo ' i D ( y se introduce como

una e7ógena más en el modelo


8/38

TEMA #$ E% MODE%O DE RE&RE'I(N %INEA% 'IMP%E )&ENERA%

El ob0etivo es especificar, estimar y contrastar relaciones entre variableseconómicas usando datos

)ara ello, es necesario "acer una serie de "ipótesis simplificatorias

'1( *i+ótesis de linealidad en los +ar,metros Establece la linealidaden los parámetros en la relación entre la variable endógena y las

e7ógenas Es decir, en la función de consumo tendremos

1 /t t t C Y β β ε = + +

donde 1β y /β son los parámetros de esta relación Ao "ay *ue confundir

esta "ipótesis de linealidad con la linealidad entre las variables )or

e0emplo, en las relaciones entre y y x *ue se dan a continuación, sólo la

primera es formalmente lineal in embargo, cumplen la "ipótesis de

linealidad en los parámetros las tres:

1 / y xβ β = +

1 /

x

y eβ β = +1 /

ln y xβ β = +

En determinadas relaciones económicas no se cumple la "ipótesis de

linealidad en los coeficientes 9n e0emplo sencillo es la función de

producción de tipo 4obb-.ouglas, donde Y representa el output de la

empresa, L es traba0o y K es el stocB de capital:

Y AK Lα β =

%os parámetros desconocidos de esta función son A 'parámetro de

eficiencia(, α 'elasticidad del output con respecto al capital( y β

'elasticidad del output con respecto al traba0o( 9na simple transformación

logarítmica en los datos, "ace *ue esta relación cumpla la linealidad en los

parámetros Es decir:

ln ln ln lnY A K Lα β = + +


9/38

E0emplos de relaciones entre variables económicas no lineales en los

parámetros "ay muc"os, por e0emplo, en una función de 4onsumo no lineal

como:

c

C a bY = +

donde a, b y c son los parámetros *ue caracterizan esta relación En este

caso, "abría *ue estimar estos tres parámetros dada una muestra de C y Y

4ontrastar una relación lineal entre C y Y , e*uivale a contrastar si el

parámetro c es unitario o no

'/( *i+ótesis de es+eci!icación correcta Esta "ipótesis supone *ue lask variables e7plicativas del modelo son a*uellas variables

relevantes *ue e7plican el comportamiento de la endógena G *ue

están todas Ao e7iste ninguna variable i x *ue no e7pli*ue nada de

la y Es decir, el modelo está bien planteado o especificado

Esta "ipótesis supone aceptar en la práctica dos cosas no siempre

ciertas:

'a( !ceptar *ue siempre "ay una teoría detrás *ue me permite

saber c6ales son las variables relevantes en cada modelo

'b( !ceptar *ue sobre estas variables dispongo siempre de

información muestral adecuada

El incumplimiento de esta "ipótesis se da en muc"os casos E0emplo: i

uno *uiere estimar con datos de sección cruzada una función de consumo

Beynesiana, además de la renta familiar, e7isten otras muc"as variables *ue

e7plican el comportamiento del consumo de una familia )or e0emplo, el

n6mero de "i0os, la edad del cabeza de familia, si la mu0er traba0a o no, si

se vive en el campo o en la ciudad, etc in embargo, nunca será posible

incluir todas y cada una de las variables *ue determinan el consumo de una

familia

'( *i+ótesis de -rados de li"ertad +ositios %os grados de libertadde un modelo se definen como la diferencia entre el n6mero de datos

' n ( y el n6mero de variables e7plicativas ' k ( Es decir, 8 gl n k = − ≥

Esta "ipótesis supone *ue, como mínimo, es necesario disponer de

tantos datos como parámetros a estimar Ao obstante, es preferible

siempre disponer de más datos *ue parámetros a estimar En el e0emplo

de la función de consumo Beynesiana "ay *ue estimar dos parámetros 'ay b( 4on un 6nico dato, no sería posible estimar de forma 6nica ambos

+


10/38

parámetros 4on dos datos, sería posible obtener una 6nica estimación

de a y b, pero para *ue la estimación sea estable, es me0or tener una

nube de datos y pocos parámetros a estimar

'#( *i+ótesis de +ar,metros constantes Esta "ipótesis supone *ue los parámetros 1 /, ,, k β β β son constantes en el tiempo

i traba0amos con n datos en la función de consumo Beynesiana,

suponer *ue la propensión marginal a consumir es constante en el

tiempo, implica *ue se obtiene una estimación *ue "a de interpretarse

como la propensión marginal a consumir media en ese período de

tama>o n i el período muestral con el *ue se traba0a es muy amplio y

"eterog2neo 'por e0emplo, incluye períodos de crisis y de auge(, es más

difícil mantener esta "ipótesis *ue si la muestra es "omog2nea

'C( *i+ótesis de inde+endencia lineal entre las aria"lese.+licatias Esta "ipótesis implica *ue cada variable e7plicativacontiene información adicional sobre la endógena *ue no está

contenida en otras i "ubiera información repetida, "abría variables

e7plicativas dependientes linealmente de otras @ormalmente, se

puede resumir la información muestral sobre las k variables

e7plicativas 'regresores( en una matriz, denotada por X , de tama>on k × con la siguiente estructura:

11 1

1

k

n nk

x x

x x

÷ ÷ ÷

K

M O M

L

donde cada columna recoge los datos asociados a cada variable x El

"ec"o de *ue cada columna sea linealmente independiente de las otras

implica *ue el rango de la matriz X es completo, es decir, igual a k i

alguna variable x

es linealmente dependiente de otra, decimos *uee7iste un problema de multicolinealidad e7acta

'F( *i+ótesis de re-resores no estoc,sticos Esta "ipótesis implica *uelos datos de las variables e7plicativas son fi0os en muestras

repetidas Es decir, el valor de las variables e7plicativas es constante

en la función de distribución de la endógena

E7isten tres situaciones en Econometría donde no es posible

mantener esta "ipótesis:

18


11/38

'F1(


12/38

'1( Esperanza nula en todo instante de tiempo: ' ( 8, 1,/,t " t nε = ∀ = K Ga*ue t ε es tratado como la suma de muc"os efectos individuales sobre la

endógena, donde el signo de cada uno es desconocido, no e7iste ninguna

razón para esperar cual*uier valor distinto de cero upongamos *ue

' (t " ε µ = , entonces el modelo 1 / t t xβ β ε + + es el mismo *ue1 /

' ( ' (t t

xβ µ β ε µ + + + − , donde el nuevo t2rmino de error: Ht t ε ε µ = − , es tal

*ue laH' ( 8t

" ε =

9na situación en la *ue se incumple esta "ipótesis, es cuando a su vez,

se incumple otra, como es omitir en el modelo una variable relevante i

la verdadera función de consumo es

t t t t C a bY ci ε = + + +

donde t i es un tipo de inter2s y se traba0a con un modelo *ue omite esta

variable:

t t t C a bY ν = + +

donde t ν es el t2rmino de error de esta ecuación y además, se sabe *ue

t t t ciν ε = + Es fácil comprobar *ue ' ( 8t t " ciν = ≠ , aun*ue t ε tenga

esperanza nula e usan las "ipótesis de parámetros constantes yregresores no estocásticos

'/( Darianza constante 'omocedasticidad( upone *ue al cumplirse

'1(, la/ /var' ( ' ( , 1,/, ,

t t " t nε ε σ = = ∀ = K i la variabilidad 'o dispersión

alrededor de la media( de las perturbaciones cambia con el tiempo

"ablamos de "eterocedasticidad

Es muy frecuente la "eterocedasticidad en modelos donde se usan datos

de sección cruzada i tenemos la función de consumo familiar utilizada

"asta a"ora, es fácil comprender *ue a*uellas familias con mayor nivel

de renta tengan mayor variabilidad en su consumo 'además de satisfacer

necesidades básicas, pueden consumir otras cosas( )uesto *ue el error

del modelo está relacionado con el consumo, lo *ue ocurrirá es *ue a

mayor renta, mayor varianza en el consumo y por tanto, mayor varianza

en el error

'( !usencia de autocorrelación en todo instante de tiempo &mplica

*ue la cov' ( ' ( 8, , 1,/, ,t # t # " t # n t #ε ε ε ε = = ∀ = ≠K i "ay autocorrelación, elerror en un momento del tiempo ayudaría a predecir el error en un

1/


13/38

momento posterior y los errores tendrían inercia i no "ay

autocorrelación, la "istoria pasada no ayuda a predecir el

comportamiento futuro y los errores son completamente aleatorios e

imprevisibles

Es muy frecuente el incumplimiento de esta "ipótesis en modelos

donde se usan datos de series temporales

Estas restricciones se imponen para e7igir “un buen

comportamiento” a las variables t ε , aun*ue tambi2n "ay razones

t2cnicas *ue nos obligan a "acer estas "ipótesis )uesto *ue tenemos n

variables aleatorias 1, /' , (nε ε ε K , su caracterización e7ige "ablar, al

menos, de sus dos primeros momentos 'media y varianza(:


14/38

%a información asociada a la variable endógena se almacena en un

vector columna Y de tama>o 1n × :

Y I

1

n

y

y

÷ ÷ ÷

%a información asociada a las variables e7plicativas se recoge en una

matriz llamada X de tama>o n k × :

X I

11 1

1

k

n nk

x x

x x

÷ ÷ ÷

%as perturbaciones en un vector ε de tama>o 1n × y los parámetros enun vector β de tama>o 1k × :

ε /1

n

ε

ε

÷ ÷ ÷

J β I

1

k

β

β

÷ ÷ ÷

El modelo lineal general '


15/38

Estimación del modelo lineal sim+le:

upongamos *ue *ueremos estimar los parámetros de la función de

consumo Beynesiana 'modelo de regresión lineal simple(:

t t t C a bY ε = + +

donde a es el consumo autónomo y b la propensión marginal a

consumir )ara ello, se dispone de una muestra de n datos de consumo y

renta *ue se puede representar en el plano t C e t Y 4ada punto

representa el par de valores de 4onsumo y 5enta observados en ese

período 'a>o( concreto Esto se denomina A9?E .E )9A$= real,

donde "abrá tantos puntos como datos utilizados

Kráfico: Aube de puntos real y recta de a0uste

500

1000

1500

2000

2500

500 1000 1500 2000 2500 3000

RENTA

C O N S U M O

i suponemos un modelo lineal entre ambas variables, dada la nube de

puntos, una estimación del modelo viene dada por una recta llamada

5E4$! .E !N9$E definida por:

OOt

a bY +

donde Oa representa una estimación del consumo autónomo y Ob una

estimación de la propensión marginal a consumir )ara cada valor de t Y ,

la recta de a0uste genera un valor de consumo *ue denotamos por Ot C ,

*ue no tiene por *u2 coincidir con el consumo real t C i dado un valor

de la t Y , el modelo predice un valor de consumo tal *ue Ot t C C = , en eseinstante de tiempo el modelo a0usta perfectamente i dado un valor de

la t Y , el modelo genera un valor del consumo tal *ue Ot t C C < , el modeloinfraestima el verdadero valor del consumo en ese a>o y comete un

error Este error es medible y se denomina 5E&.9=, es decir

1C


16/38

OOt t t

C C ε = − El residuo puede ser nulo, positivo o negativo, si el modeloacierta, infraestima o sobrestima el verdadero valor de consumo En

general, en todos los puntos de la nube real por encima de la recta de

a0uste, el verdadero valor de consumo está por encima de lo *ue predice

la rectaJ en los puntos sobre la recta de a0uste el modelo no se e*uivocay en los puntos de la nube real por deba0o de la recta, el verdadero valor

de consumo está por deba0o de lo *ue a0usta el modelo 'la recta(

El ob0etivo a"ora es conseguir una estimación de a y b de manera *ue se

cumpla alg6n criterio de optimalidad )or e0emplo, un criterio sería

minimizar la suma de los residuos cometidos en toda la muestra:

1 1

OO Omin minn n

t t t

t t

C a bY ε

= =

= − −∑ ∑

Este no es un buen criterio, ya *ue los errores individuales *ue comete

el modelo pueden ser muy grandes, pero al tener signo los errores

grandes y positivos se pueden compensar con los grandes y negativos

%a solución obvia es eliminar en este criterio el signo de los residuos,

tomando por e0emplo el valor absoluto:

1

Ominn

t

t

ε

=

∑

En este caso, el problema es la dificultad analítica de obtener una

solución para Oa y Ob Ao obstante, otra forma de eliminar el signo de

una variable es elevarla al cuadrado El criterio de optimalidad sería

obterner una e7presión de Oa y Ob *ue minimize la suma de los cuadrados

de los residuos:

/ /

1 1

OO Omin min ' (n n

t t t

t t

C a bY ε

= =

= − −∑ ∑

*ue tiene las venta0as de '1( eliminar la compensación de errores por el

signo, '/( penalizar más los errores grandes *ue los pe*ue>os y '(

llevar a una solución analítica sencilla Este criterio de estimación es el

más conocido en Econometría y se denomina


17/38

/ /

1 1

OO Omin min ' (n n

t t t

t t

C a bY ε = =

= − −∑ ∑

olución: 4ondiciones de primer orden:

/

1

1

OOO/ ' ( 8

O

n

t nt

t t

t

C a bY a

ε =

=

∂

= − − − =∂

∑∑

/

1

1

OOO/ ' ( 8

O

n

t nt

t t t

t

C a bY Y b

ε =

=

∂= − − − =

∂

∑∑

Este es un sistema de dos ecuaciones con dos incógnitas .e la primeracondición, se obtiene *ue:

1 1

O OO O8n n

t t

t t

C na b Y a C bY = =

− + + = ⇒ = −∑ ∑

donde C e Y representan las medias muestrales de 4onsumo y 5enta,

respectivamente 9sando la segunda condición de primer orden y la

solución para Oa , se obtiene:

/ /

1 1 1 1 1 1

O O OO 8 ' ( 8n n n n n n

t t t t t t t t

t t t t t t

C Y a Y b Y C Y C bY Y b Y = = = = = =

− + + = ⇒ − + − + =∑ ∑ ∑ ∑ ∑ ∑

y operando:

/

1 1 1 1

O' (n n n n

t t t t t

t t t t

b Y Y Y C Y C Y = = = =

− = − ⇒∑ ∑ ∑ ∑

1 1

/ / /

1 1

' (' (O

' (

n n

t t t t

t t

n n

t t

t t

C Y nCY C C Y Y

b

Y nY Y Y

= =

= =

− − −= =

− −

∑ ∑

∑ ∑

%as dos fórmulas en los recuadros son los estimadores


18/38

E0ercicio para el estudiante: 4omprobar *ue la solución obtenida es un

mínimo Es decir, mostrar *ue el "essiano es definido positivo:

/ / / /

/

/ / / /

/

O O

OO' ( OO O

O OO ' (

t t

t t

a a b %

b a b

ε ε

ε ε

∂ ∂

∂ ∂ ∂ = ∂ ∂ ∂ ∂ ∂

∑ ∑

∑ ∑

Estimación del modelo lineal -eneral 0M%&1:

.ada la formulación matricial del o compatible y A una matriz

cuadrada %a solución analítica a las condiciones de primer orden es:

1


19/38

O! ! X X X Y β =

Este es un sistema de k ecuaciones con k incógnitas ' 1 /O O O, ,,

k β β β (,

llamado sistema de ecuaciones normales El estimador Oβ *ue satisface

este sistema se llama estimador por o ' k k × (, teniendo *ue:

1O ' (! ! X X X Y β −=

E0ercicio para el estudiante: 4omprobar *ue la solución obtenida es un

mínimo

Pro+iedades estadísticas del estimador MCO de β :

%inealidad: El estimador


20/38

donde se "an usado las "ipótesis de '1( parámetros constantes, '/(

regresores fi0os e independientes linealmente y '( esperanza nula del

t2rmino de error

E!iciencia: El estimador


21/38

Prue"a: El vector de residuos o ' (n n× es la llamada matriz de proyección*ue tiene propiedades importantes: '1( es sim2trica, '/( idempotente ,'(

no tiene inversa y '#( es ortogonal a la matriz X , es decir, 8 MX =

E0ercicio para el estudiante: )robar estas cuatro propiedades de la matriz M

! partir de la relación anterior y de las propiedades de la matriz M , se

obtiene: O ' ( MY M X M ε β ε ε = = + = )or tanto, siempre *ue se desee la

suma de cuadrados de los residuos se puede escribir como una formacuadrática:

O O! ! M ε ε ε ε =

@inalmente, la esperanza de esa suma es igual a:

/ /

O O' ( ' ( P ' (Q P ' (Q

P ' (Q P ' (Q P Q P Q

! ! ! !

! !

" " M " t* M " t* M

t* " M t* M" t* M t* M

ε ε ε ε ε ε εε

εε εε σ σ

= = = =

= = = =

y la traza de la matriz M :

1 1 1' ( P ' ( Q P ' ( Q P' ( Q! ! ! ! ! ! t* M t* $ X X X X n t* X X X X n t* X X X X n k − − −= − = − = − = −

ya *ue la matriz M es cuadrada y de dimensión n y 1' (! X X − de tama>o' (k k × .e "ec"o, la prueba de *ue esta matriz no tiene inversa esinmediata, ya *ue el rango de una matriz idempotente coincide con su

traza

9na vez obtenido un estimador insesgado de la varianza residual, dada

cual*uier muestra de Y y X en el


22/38

E0ercicio para el estudiante: )robar *ue el estimador de la varianza delOβ


23/38

Pro+iedades al-e"raicas del criterio de estimación MCO

ay *ue distinguir las propiedades algebraicas del criterio


24/38

Prue"a: ! partir de la primera ecuación normal de un modelo conconstante:

O OO O O' ( 8 ' ( 8 8 8

! ! ! ! !

t i X i Y i Y X i Y Y iβ β ε ε = ⇒ − = ⇒ − = ⇒ = ⇒ =∑Pro+iedad 7 En el


25/38

Prue"a: %a suma de cuadrados de residuos


26/38

E0ercicio para el estudiante: 4omprobar *ue se cumplen estas F

propiedades con los datos del e0ercicio num2rico 1

Medidas de "ondad de ao en los EE99 y el AS de

cigue>as en ese mismo a>o y estados %a estimación del modelo *ue

e7plica el AS de nacimientos en función del AS de cigue>as proporciona

un / muy elevado y esto sabemos *ue es esp6reo %a razón es *ue en

ese a>o la correlación muestral entre ambas variables fue muy alta y

/F


27/38

aun*ue no "ay ninguna relación causal entre ambas, el coeficiente de

determinación es bueno, pero enga>oso

En relaciones donde tiene sentido relacionar determinadas variables

'4onsumo y 5enta(, el coeficiente de determinación puede ser e7cesivamente alto si en el período muestral considerado ambas

variables evolucionan de forma muy parecida o presentan una tendencia

com6n

=tro problema distinto del / convencional es *ue nunca empeora

cuando en el modelo introducimos variables e7plicativas adicionales Es

decir, aun*ue una nueva variable no sea muy relevante, su incorporación

"ace *ue, en el peor de los casos, el / no cambie, o bien, con un poco

de suerte, aumente &ntroducir un nuevo regresor en el modelo tiene dos

efectos: '1( disminuyen los grados de libertad y 2ste es negativo y '/(

disminuye la suma residual y 2ste es positivo i el peso del efecto

negativo es mayor *ue la me0ora en el a0uste, no compensará introducir

esta nueva variable y a la inversa

%a solución a 2ste 6ltimo problema es utilizar el llamado / a0ustado o

corregido de grados de libertad ' / ( *ue se calcula como:

/ /1

1 '1 (

n

n k

−

= − −−

En esta formulación del / se tienen en cuenta dos efectos: '1( i

aumenta el n6mero de regresores en el modelo, disminuyen los grados

de libertad y esto se penaliza, es decir:/1nk n k

n k

−↑ ⇒↓ − ⇒↑ ⇒↓

− y '/(

Esos nuevos regresores pueden me0orar el modelo en t2rminos de a0uste,

es decir: / /k + ↑ ⇒↓ ⇒↑ ⇒↑ i el efecto de penalización es menor *ue el efecto de me0ora en el a0uste, el / aumentará e indicará *ue

compensa la introducción de esas nuevas variables y a la inversa

4omo e0emplo, supongamos *ue se "an estimado dos funciones de

consumo alternativas:

/O OO J 88t t t

C a bY ε = + + =/O OO O J 8

t t t t C a bY ci ν = + + + =

donde t i es un $ipo de inter2s !mbos modelos están anidados ya *ue se

*uiere e7plicar el 4onsumo en función de la 5enta 'en el primero( o bien, introducir un nuevo regresor '$ipo de inter2s( en el modelo más

/


28/38

sencillo El "ec"o de *ue el / sea mayor en el modelo más complicado

indica *ue el $ipo de inter2s es una variable *ue compensa introducir

'en t2rminos de a0uste( a pesar de *ue los grados de libertad "ayan

disminuido

Deriación del / : e obtiene a partir del / convencional

/ ;1 1;

+, +, n ,

+! +! n= − = −

donde dividiendo por n la uma 5esidual y la uma $otal, esta medida

se puede interpretar como un ratio de varianzas &mplantando la

restricción de *ue los estimadores de las varianzas residual y de la

variable endógena sean insesgados, se obtiene el / corregido de los

grados de libertad:

/ /; 11 1 '1 (; 1

+ n k n

+! n n k

− −= − = − −

− −

E0ercicio para el estudiante: 4alcular el / convencional y el corregido

usando los datos del e0ercicio num2rico 1 &nterpretar este coeficiente

Pr,ctica con los datos de Anscom"e y Eie=s$

En un conocido traba0o publicado por @N !nscombe en 1+ '“Krap"s

in tatistical !nalysis”, !/e Ame*ican +tati#tician, /, pp1-/1(, se

ilustran algunos aspectos básicos del análisis de regresión lineal usando

los datos simulados *ue figuran en la tabla siguiente 'tambi2n en

''')ucm)e#0info0ecocuan0ect*1(:

t 1t y /t y :t y #t y 1t x /t x

1 8# +1# #F FC 1888 88/ F+C 1# F CF 88 88

C # 1/# 1 188 88

# 1 11 # +88 88

C +/F 1 # 1188 88

F ++F 18 # 8# 1#88 88

/# F1 F8 C/C F88 88

#/F 18 C+ 1/C8 #88 1+88

+ 18# +1 1C CCF 1/88 88

18 #/ /F F#/ +1 88 8811 CF ## C F+ C88 88

/


29/38

.ada esta información se pide:

'1( Estimar por


30/38


31/38

'/( 5epresente gráficamente la nube de puntos real 0unto con la

recta a0ustada en cada uno de los cuatro modelos

considerados:

&

10

12

2 & 10 12 1 1&

1

Y 1

2

&

10

2 & 10 12 1 1&

1

Y 2

&

10

12

1

2 & 10 12 1 1&

1

Y 3

&

10

12

1

5 10 15 20

2

Y 0

En el modelo 'a( la relación entre las variables es más o menos

lineal, luego la "ipótesis de linealidad en los parámetros "ace *ue el

a0uste sea razonable

En el modelo 'b( la relación entre las variables es claramente no

lineal y el a0uste podría me0orar claramente especificando el modelo deotras formas, como por e0emplo:

/

1 / :t t t t y x xβ β β ε = + + +

1 /ln

t t t y xβ β ε = + +

En el modelo 'c( todos los puntos de la nube real, e7ceptuando uno,

se a0ustan casi perfectamente en una recta *ue no es la estimada por*ue

ese valo* atípico 'el tercer par de valores( "ace *ue la recta de a0uste

cambie de pendiente y el a0uste sea peor En este caso, se aprende *ue la presencia de una o más observaciones atípicas pueden alterar todos los

1


32/38

resultados de la estimación )or tanto, el tratamiento de atípicos antes de

estimar una relación puede ser crucial

En el modelo 'd( tenemos otro problema diferente en los datos %os

datos de la variable e7plicativa /t x son todos igual a , e7ceptuando eloctavo valor, *ue es igual a 1+ .e "ec"o, 2ste es el dato *ue "ace *ue la

recta de a0uste est2 anclada donde está i elimináramos el par de

valores de la endógena y de la e7ógena para el instante t.2, no sería

posible estimar por ?IMA @ERO'IMI%ITUD

Es otro m2todo de estimación del vector de parámetrosβ

en ela y en el me0or de

los casos, aleatoria Kracias al $eorema 4entral del %ímite,

se puede demostrar *ue si e7iste un n6mero grande de

variables aleatorias independientes e id2nticamente

distribuidas, la suma de todas ellas seguirá una normal

/


33/38

'b( 9na variante del $eorema 4entral del %ímite afirma *ue

aun*ue el n6mero de variables no sea muy grande o no

sean estrictamente independientes, su suma puede seguir

teniendo una distribución normal

'c( 4on el supuesto de normalidad, se pueden obtener fácilmente las distribuciones *ue siguen los estimadores


34/38

; / / ; / /

/

1' ( ' ( '/ ( e7p ' ( ' ( ' , (

/

n n ! f Y f Y X Y X Lε σ β β β σ σ

− − = = Π − − − =

siendo la función de verosimilitud cuando depende de los parámetros β

y /σ , dada una muestra de Y y X Esta es la función de densidadcon0unta de Y y X , dados los valores de los parámetros β y /σ

=btener la e7presión de los estimadores por má7ima verosimilitud de β

y /σ , supone ma7imizar la función de verosimilitud,/' , ( L β σ )ara *ue

sea más fácil y puesto *ue no cambia el óptimo se ma7imiza el

logaritmo neperiano de la función de verosimilitud:

/ /

/

1ma7 ln ' , ( ln / ln ' ( ' (

/ / /

! n n L Y X Y X β σ σ β β σ

= − Π − − − −

4ondiciones de primer orden:

/1

/

ln ' , ( 1 O' / / ( 8 ' (/

! ! ! !

M5

L X Y X X X X X Y

β σ β β

β σ

−∂ = − − + = ⇒ =∂

//

/ / #

O Oln ' , ( ' ( ' ( 1O8

/ /

! !

M5

L n Y X Y X

n

β σ β β ε ε σ

σ σ σ

∂ − − = − − − = ⇒ = ÷∂

)or tanto, el estimador


35/38

Pro+iedades estadísticas del estimador M@: %a cota de 4ramer 5ao proporciona la mínima varianza *ue puede alcanzar cual*uier estimador

insesgado de un vector de parámetros .ic"a cota viene dada por la

inversa de la matriz de información ' $ (, donde 2sta viene definida por laesperanza del "essiano cambiada de signo Es decir:

/

/

ln ' ( L $ "

θ

θ

∂= − ∂

, siendo /β

θ σ

=

$omando las derivadas segundas a las condiciones de primer orden, se

tiene *ue:

/ /

/ /ln ' , (

!

L X X β σ β σ

∂ = −∂

/ /

/ #

ln ' , ( P Q

' (' (

! L X X Y β σ β

β σ σ

∂ −=

∂ ∂

/ /

/ / # F

ln ' , ( P Q P Q

' (' ( /

! L n Y X Y X β σ β β

σ σ σ σ

∂ − −= −

∂ ∂

y formando el "essiano:

/ #

# F

P Q

P Q P Q

/

! !

!

X X X X Y

% n Y X Y X

β

σ σ

β β

σ σ

−−

=− −

− −

%a esperanza de los t2rminos del "essiano es igual a:

/ /

! ! X X X X "

σ σ − = −

# #

P Q8

! ! X X Y X " "

β ε

σ σ

−= =

/

# F # F # F #

P Q P Q P Q

/ / / /

! ! n Y X Y X n " n n n "

β β ε ε σ

σ σ σ σ σ σ σ

− −− = − = − = −

C


36/38

)uesto *ue la matriz de información es diagonal por blo*ues, su inversa

tambi2n y tiene la e7presión:

/ 1

1

#

' ( 8

/8

! X X

$ n

σ

σ

−

−

=

Esta matriz indica *ue la cota inferior para la varianza de un estimador

insesgado de β es / 1' (! X X σ − y la cota inferior para la varianza de un

estimador insesgado de /σ es la e7presión#/

n

σ

En el caso


37/38

%a varianza del estimador de β llamado HOβ es:

H H H /O O Ovar' ( P' (' ( Q ' (! ! ! ! " " C C CC β β β β β εε σ = − − = =

!un*ue todavía no son comparables ambas matrices de varianzas y

covarianzas, es posible siempre descomponer una matriz fi0a como la C

en la suma de otras dos: C ( D= + , donde 8 D ≠ y postmultiplicando por

la matriz X esa identidad, tenemos *ue CX (X DX = + 4omo k CX $ = , por insesgadez y k (X $ = , por definición, es obvio *ue 8 DX = )or tanto:

H / / / / / /Ovar' ( ' (' (! ! ! ! ! ! CC ( D ( D (( DD D( (Dβ σ σ σ σ σ σ = = + + = + + +

teniendo en cuenta *ue1' (! ! (( X X −= y 8! ! D( (D= = , se obtiene :

H / 1 / H /O O Ovar' ( ' ( var' ( var' (! ! ! X X DD DDβ σ σ β β σ −= + ⇒ = +

y la matriz / ! DDσ es definida positiva por construcción

A+éndice 7$ .istribuciones de los estimadores


38/38

! partir de este resultado podemos derivar inmediatamente la

distribución del estimador de /σ por