8/18/2019 Tema 1. Informacion
1/38
8/18/2019 Tema 1. Informacion
2/38
INTRODUCCION
- Econometría: este vocablo procede del griego y significa “medida
de la economía”
- Esta definición no caracteriza completamente el contenido de lamateria, pero pone de manifiesto su carácter necesariamente
cuantitativo
- ! lo largo del tiempo, la Econometría "a ido ampliando su
contenido debido fundamentalmente a # aspectos:
o El desarrollo de la $eoría Económica
o %os avances en la $eoría Estadística
o El desarrollo de la &nformática y la creciente disponibilidad y
fácil acceso a grandes bases de datos 'tanto a nivel macro
como micro(- )or tanto, el continuo avance de esta disciplina "ace *ue no "aya
una definición generalmente aceptada
- &ntriligator '1+( define Econometría como a*uella rama de la
Economía *ue se ocupa de medir desde el punto de vista empírico
cual*uier relación entre variables económicas
- .e acuerdo con esta definición, los dos ingredientes básicos de la
Econometría son: 1( %a $eoría Económica y /( %os datos
- %a característica fundamental de esta disciplina es *ue debe saber
con0ugar perfectamente ambos ingredientes En otras palabras, un
económetra no puede defender la medición sin teoría, pero
tampoco la teoría sin datos
- aber con0ugar perfectamente teoría, datos y t2cnicas estadísticas
es lo más difícil, pero tambi2n lo más atractivo de la Econometría
!lguien di0o *ue “la Econometría sería más fácil sin datos”
- En definitiva, la Econometría debe complementar a la $eoría
Económica, para validar determinadas relaciones *ue postula
usando datos En este sentido, el económetra no puede prescindir
de la $eoría, ni el teórico de lo *ue “dicen los datos”
Relaciones entre la Teoría Económica y la Econometría
'1( %a Econometría necesita primero de la $eoría Económica para
*ue le proporcione un marco conceptual concreto )or e0emplo, la
teoría de 3eynes proporciona un marco en el *ue se relacionan
dos variables económicas: 4onsumo ' C ( y 5enta 'Y (, en donde,
además se postula *ue el C es una función de la Y : ' (C f Y = y noa la inversa En ocasiones, el económetra puede partir no de una
teoría, sino del sentido com6n o de la intuición de *ue e7ista unarelación entre un con0unto de variables )or e0emplo, puede
/
8/18/2019 Tema 1. Informacion
3/38
preguntarse si un tipo de inter2s a corto plazo depende de su
propia "istoria pasada o no
'/( %a teoría económica tambi2n necesita de la econometría para
poder validar, contrastar, determinadas "ipótesis postuladas por el
teórico En el e0emplo de la función de consumo 3eynesiana, se postula una función lineal entre C e Y : C a bY = + , donde a es el
consumo autónomo y b la propensión marginal a consumir
!demás, se supone *ue 8 1b≤ ≤ 9sando datos, el económetra
puede contrastar si esta restricción se cumple o no
'( %a teoría económica necesita de la econometría para poder seguir
desarrollándose Es decir, la evidencia empírica obtenida con los
datos puede ayudar a reformular teorías ya e7istentes o incluso,
sugerir nuevas En el e0emplo anterior, se puede contrastar si la
relación entre C e Y es lineal o no !demás, se puede contrastar
si la relación entre C e Y es estática Es decir, el C en un instante
puede depender de la Y en ese momento, pero tambi2n del C e Y
pasados
Pasos en un Estudio Econométrico:
'1( )ara *ue la teoría económica pueda utilizarse en un estudio
econom2trico necesita de una elaboración matemática *ue de lugar
a un modelo y en concreto, a un modelo econométrico 9n modeloeconom2trico no es un modelo geom2trico ni un modelomatemático En un modelo geom2trico se representan mediante
gráficos o diagramas relaciones entre variables económicas
'&;%
8/18/2019 Tema 1. Informacion
4/38
C e Y %a interpretación de ε es la influencia combinada sobre elC de variables distintas a la Y En concreto, en la función de
consumo, ε puede recoger factores como las e7pectativas de los
agentes, factores estacionales, tipos de inter2s En esta función
asumimos *ue el factor determinante del C es la Y , pero esto essólo una apro7imación En general, ε recogerá “todos los fallos del
modelo” %as "ipótesis *ue "agamos sobre estas variables aleatorias
son fundamentales para decidir *u2 t2cnica econom2trica usar
c( El tama>o El modelo debe ser pe*ue>o, escueto Esto *uiere
decir *ue tiene *ue tener pocos parámetros *ue le caracterizen
a Aormalmente, son gratuitos
.atos de sección cruzada: miden una variable en un momento
determinado del tiempo para distintas entidades Estas entidades
pueden ser individuos, familias, países, empresas, 4omunidades
!utónomas, sectores empresariales, etc )or e0emplo, podemos
tener una función de consumo familiar: i i iC a bY ε = + + , donde elsubíndice i "ace referencia a la familia
Estos datos fundamentalmente se obtienen a partir de entrevistas o
encuestas "ec"as a las entidades correspondientes %as dos fuentes
#
8/18/2019 Tema 1. Informacion
5/38
más importantes de este tipo de datos son: la E)@ 'Encuesta de
)resupuestos @amiliares( y la 4? '4entral de ?alances(
.atos de panel: surgen al cruzar una sección cruzada con una serie
temporal En nuestro e0emplo, tendríamos el dato de consumo deuna familia a lo largo de una serie de a>os 9n panel supone
disponer de muc"a más información *ue en una sección cruzada, ya
*ue tenemos distintas observaciones de una misma variable
'consumo( para una misma unidad 'familia( Esto es difícil
conseguir en una ciencia no e7perimental como es la Economía
En un panel se pueden analizar o contrastar "ipótesis *ue no es
posible con una sección cruzada )or e0emplo, contrastar si "a
"abido diferencias en el comportamiento del consumo de las
familias despu2s de un cambio de política económica 'impuestos(
en un momento determinado del tiempo
$anto las secciones cruzadas como los paneles no suele ser
información gratuita
'( 9na vez *ue se "a especificado el modelo y *ue se dispone de los
datos adecuados de todas las variables, se pasa a la etapa de
estimación del mismo 4onsiste en medir empíricamente los parámetros *ue caracterizan el modelo y a*uí entra la estadística,sobre todo la inferencia estadística '*ue usa la información
muestral disponible para inferir características de toda una
población(
'#( 9na vez *ue el modelo "a sido estimado usando las técnicaseconométricas adecuadas, llegamos al paso de la verificación oalidación del modelo e establecen criterios 'gráficos yestadísticos( para rec"azar o aceptar el modelo !*uí comienza un
proceso iterativo en la modelización, ya *ue si no aceptamos un
modelo, no lo usamos, sino *ue reformulamos el modelo teórico, o bien, tratamos de una forma más adecuada los datos ! veces, es
fácil teorizar sobre relaciones entre variables *ue están definidas de
forma precisa, pero otra cosa es obtener datos seguros de estas
variables )or e0emplo, es difícil siempre obtener datos razonables
de los beneficios de una empresa, de un tipo de inter2s o del stocB
de capital de una economía En algunos casos, no e7iste
contrapartida observable para una variable teórica
C
8/18/2019 Tema 1. Informacion
6/38
Usos de un modelo econométrico estimado: )ueden ser varios:
'1( !nálisis estructural e usa el modelo estimado para medir la
relación entre variables económicas !lgunos e0emplos, son la
medición de la propensión marginal a consumir de un país, de laelasticidad demanda-precio de un bien, de la elasticidad de la
producción-input de una empresa, de la curva de )"illips 'inflación
y paro(, de la relación entre ventas y publicidad de un producto en
una empresa, de la relación entre el rendimiento y riesgo de un
activo financiero, de la relación entre el salario y el nivel de
educación de un individuo, etc
'/( )redicción Es el uso más frecuente de un modelo econom2trico e
usa para predecir el valor futuro de una variable de inter2s %as
predicciones se usan para tomar decisiones )or e0emplo, todo el
mundo predice &nflación, )&? o 4onsumo @uera de la economía,
todos los días se "acen previsiones meteorológicas
'( Evaluación de políticas económicas e usa para simular el valor
futuro de una variable ba0o distintos supuestos de evolución de otras
En nuestro e0emplo, sería predecir el patrón de evolución de
consumo ba0o distintos escenarios de evolución de la renta i una
autoridad controla algunas variables, como la cantidad de dinero,
puede evaluar el efecto sobre la tasa de inflación ante distintos
escenarios de crecimiento monetario
Clasi!icación de aria"les en un modelo econométrico
%a principal clasificación es la de:
Dariable Endógena: es a*uella e7plicada por otras variables Es denotada
por y
Dariables E7ógenas: e7plican a la endógena pero no pueden estar influidas
por ella )uede "aber k variables e7plicativas y son denotadas por
1 /, ,, k x x x
ay *ue tener en cuenta *ue esta distinción varía dependiendo del modelo
econom2trico en particular y su ob0etivo !sí, una e7ógena en un modelo
puede pasar a ser la endógena de otro E0 ' (C f Y ε = + y ' (Y f M ε = + ,donde M es cantidad de dinero
Dariables continuas: pueden tomar valores en todos los puntos de la recta
real 'C e Y (
Dariables discretas: sólo toman valores en algunos puntos de la recta real
F
8/18/2019 Tema 1. Informacion
7/38
9n e0emplo son las variables ficticias o dummies *ue toman valor uno o
cero %a idea es *ue "ay características *ue no se pueden medir 'en euros,
en Bilos, etc(, pero *ue pueden ser factores relevantes a la "ora de e7plicar
a otra variable )or e0emplo, en la función de consumo familiar, además de
la renta, el "ec"o de *ue la familia viva en el campo o en la ciudad puedeser relevante para e7plicar diferencias en el consumo )ara ello, se
construye una variable ficticia *ue toma uno para las familias *ue viven en
la ciudad y cero para las *ue viven en el campo ' i D ( y se introduce como
una e7ógena más en el modelo
8/18/2019 Tema 1. Informacion
8/38
TEMA #$ E% MODE%O DE RE&RE'I(N %INEA% 'IMP%E )&ENERA%
El ob0etivo es especificar, estimar y contrastar relaciones entre variableseconómicas usando datos
)ara ello, es necesario "acer una serie de "ipótesis simplificatorias
'1( *i+ótesis de linealidad en los +ar,metros Establece la linealidaden los parámetros en la relación entre la variable endógena y las
e7ógenas Es decir, en la función de consumo tendremos
1 /t t t C Y β β ε = + +
donde 1β y /β son los parámetros de esta relación Ao "ay *ue confundir
esta "ipótesis de linealidad con la linealidad entre las variables )or
e0emplo, en las relaciones entre y y x *ue se dan a continuación, sólo la
primera es formalmente lineal in embargo, cumplen la "ipótesis de
linealidad en los parámetros las tres:
1 / y xβ β = +
1 /
x
y eβ β = +1 /
ln y xβ β = +
En determinadas relaciones económicas no se cumple la "ipótesis de
linealidad en los coeficientes 9n e0emplo sencillo es la función de
producción de tipo 4obb-.ouglas, donde Y representa el output de la
empresa, L es traba0o y K es el stocB de capital:
Y AK Lα β =
%os parámetros desconocidos de esta función son A 'parámetro de
eficiencia(, α 'elasticidad del output con respecto al capital( y β
'elasticidad del output con respecto al traba0o( 9na simple transformación
logarítmica en los datos, "ace *ue esta relación cumpla la linealidad en los
parámetros Es decir:
ln ln ln lnY A K Lα β = + +
8/18/2019 Tema 1. Informacion
9/38
E0emplos de relaciones entre variables económicas no lineales en los
parámetros "ay muc"os, por e0emplo, en una función de 4onsumo no lineal
como:
c
C a bY = +
donde a, b y c son los parámetros *ue caracterizan esta relación En este
caso, "abría *ue estimar estos tres parámetros dada una muestra de C y Y
4ontrastar una relación lineal entre C y Y , e*uivale a contrastar si el
parámetro c es unitario o no
'/( *i+ótesis de es+eci!icación correcta Esta "ipótesis supone *ue lask variables e7plicativas del modelo son a*uellas variables
relevantes *ue e7plican el comportamiento de la endógena G *ue
están todas Ao e7iste ninguna variable i x *ue no e7pli*ue nada de
la y Es decir, el modelo está bien planteado o especificado
Esta "ipótesis supone aceptar en la práctica dos cosas no siempre
ciertas:
'a( !ceptar *ue siempre "ay una teoría detrás *ue me permite
saber c6ales son las variables relevantes en cada modelo
'b( !ceptar *ue sobre estas variables dispongo siempre de
información muestral adecuada
El incumplimiento de esta "ipótesis se da en muc"os casos E0emplo: i
uno *uiere estimar con datos de sección cruzada una función de consumo
Beynesiana, además de la renta familiar, e7isten otras muc"as variables *ue
e7plican el comportamiento del consumo de una familia )or e0emplo, el
n6mero de "i0os, la edad del cabeza de familia, si la mu0er traba0a o no, si
se vive en el campo o en la ciudad, etc in embargo, nunca será posible
incluir todas y cada una de las variables *ue determinan el consumo de una
familia
'( *i+ótesis de -rados de li"ertad +ositios %os grados de libertadde un modelo se definen como la diferencia entre el n6mero de datos
' n ( y el n6mero de variables e7plicativas ' k ( Es decir, 8 gl n k = − ≥
Esta "ipótesis supone *ue, como mínimo, es necesario disponer de
tantos datos como parámetros a estimar Ao obstante, es preferible
siempre disponer de más datos *ue parámetros a estimar En el e0emplo
de la función de consumo Beynesiana "ay *ue estimar dos parámetros 'ay b( 4on un 6nico dato, no sería posible estimar de forma 6nica ambos
+
8/18/2019 Tema 1. Informacion
10/38
parámetros 4on dos datos, sería posible obtener una 6nica estimación
de a y b, pero para *ue la estimación sea estable, es me0or tener una
nube de datos y pocos parámetros a estimar
'#( *i+ótesis de +ar,metros constantes Esta "ipótesis supone *ue los parámetros 1 /, ,, k β β β son constantes en el tiempo
i traba0amos con n datos en la función de consumo Beynesiana,
suponer *ue la propensión marginal a consumir es constante en el
tiempo, implica *ue se obtiene una estimación *ue "a de interpretarse
como la propensión marginal a consumir media en ese período de
tama>o n i el período muestral con el *ue se traba0a es muy amplio y
"eterog2neo 'por e0emplo, incluye períodos de crisis y de auge(, es más
difícil mantener esta "ipótesis *ue si la muestra es "omog2nea
'C( *i+ótesis de inde+endencia lineal entre las aria"lese.+licatias Esta "ipótesis implica *ue cada variable e7plicativacontiene información adicional sobre la endógena *ue no está
contenida en otras i "ubiera información repetida, "abría variables
e7plicativas dependientes linealmente de otras @ormalmente, se
puede resumir la información muestral sobre las k variables
e7plicativas 'regresores( en una matriz, denotada por X , de tama>on k × con la siguiente estructura:
11 1
1
k
n nk
x x
x x
÷ ÷ ÷
K
M O M
L
donde cada columna recoge los datos asociados a cada variable x El
"ec"o de *ue cada columna sea linealmente independiente de las otras
implica *ue el rango de la matriz X es completo, es decir, igual a k i
alguna variable x
es linealmente dependiente de otra, decimos *uee7iste un problema de multicolinealidad e7acta
'F( *i+ótesis de re-resores no estoc,sticos Esta "ipótesis implica *uelos datos de las variables e7plicativas son fi0os en muestras
repetidas Es decir, el valor de las variables e7plicativas es constante
en la función de distribución de la endógena
E7isten tres situaciones en Econometría donde no es posible
mantener esta "ipótesis:
18
8/18/2019 Tema 1. Informacion
11/38
'F1(
8/18/2019 Tema 1. Informacion
12/38
'1( Esperanza nula en todo instante de tiempo: ' ( 8, 1,/,t " t nε = ∀ = K Ga*ue t ε es tratado como la suma de muc"os efectos individuales sobre la
endógena, donde el signo de cada uno es desconocido, no e7iste ninguna
razón para esperar cual*uier valor distinto de cero upongamos *ue
' (t " ε µ = , entonces el modelo 1 / t t xβ β ε + + es el mismo *ue1 /
' ( ' (t t
xβ µ β ε µ + + + − , donde el nuevo t2rmino de error: Ht t ε ε µ = − , es tal
*ue laH' ( 8t
" ε =
9na situación en la *ue se incumple esta "ipótesis, es cuando a su vez,
se incumple otra, como es omitir en el modelo una variable relevante i
la verdadera función de consumo es
t t t t C a bY ci ε = + + +
donde t i es un tipo de inter2s y se traba0a con un modelo *ue omite esta
variable:
t t t C a bY ν = + +
donde t ν es el t2rmino de error de esta ecuación y además, se sabe *ue
t t t ciν ε = + Es fácil comprobar *ue ' ( 8t t " ciν = ≠ , aun*ue t ε tenga
esperanza nula e usan las "ipótesis de parámetros constantes yregresores no estocásticos
'/( Darianza constante 'omocedasticidad( upone *ue al cumplirse
'1(, la/ /var' ( ' ( , 1,/, ,
t t " t nε ε σ = = ∀ = K i la variabilidad 'o dispersión
alrededor de la media( de las perturbaciones cambia con el tiempo
"ablamos de "eterocedasticidad
Es muy frecuente la "eterocedasticidad en modelos donde se usan datos
de sección cruzada i tenemos la función de consumo familiar utilizada
"asta a"ora, es fácil comprender *ue a*uellas familias con mayor nivel
de renta tengan mayor variabilidad en su consumo 'además de satisfacer
necesidades básicas, pueden consumir otras cosas( )uesto *ue el error
del modelo está relacionado con el consumo, lo *ue ocurrirá es *ue a
mayor renta, mayor varianza en el consumo y por tanto, mayor varianza
en el error
'( !usencia de autocorrelación en todo instante de tiempo &mplica
*ue la cov' ( ' ( 8, , 1,/, ,t # t # " t # n t #ε ε ε ε = = ∀ = ≠K i "ay autocorrelación, elerror en un momento del tiempo ayudaría a predecir el error en un
1/
8/18/2019 Tema 1. Informacion
13/38
momento posterior y los errores tendrían inercia i no "ay
autocorrelación, la "istoria pasada no ayuda a predecir el
comportamiento futuro y los errores son completamente aleatorios e
imprevisibles
Es muy frecuente el incumplimiento de esta "ipótesis en modelos
donde se usan datos de series temporales
Estas restricciones se imponen para e7igir “un buen
comportamiento” a las variables t ε , aun*ue tambi2n "ay razones
t2cnicas *ue nos obligan a "acer estas "ipótesis )uesto *ue tenemos n
variables aleatorias 1, /' , (nε ε ε K , su caracterización e7ige "ablar, al
menos, de sus dos primeros momentos 'media y varianza(:
8/18/2019 Tema 1. Informacion
14/38
%a información asociada a la variable endógena se almacena en un
vector columna Y de tama>o 1n × :
Y I
1
n
y
y
÷ ÷ ÷
%a información asociada a las variables e7plicativas se recoge en una
matriz llamada X de tama>o n k × :
X I
11 1
1
k
n nk
x x
x x
÷ ÷ ÷
%as perturbaciones en un vector ε de tama>o 1n × y los parámetros enun vector β de tama>o 1k × :
ε /1
n
ε
ε
÷ ÷ ÷
J β I
1
k
β
β
÷ ÷ ÷
El modelo lineal general '
8/18/2019 Tema 1. Informacion
15/38
Estimación del modelo lineal sim+le:
upongamos *ue *ueremos estimar los parámetros de la función de
consumo Beynesiana 'modelo de regresión lineal simple(:
t t t C a bY ε = + +
donde a es el consumo autónomo y b la propensión marginal a
consumir )ara ello, se dispone de una muestra de n datos de consumo y
renta *ue se puede representar en el plano t C e t Y 4ada punto
representa el par de valores de 4onsumo y 5enta observados en ese
período 'a>o( concreto Esto se denomina A9?E .E )9A$= real,
donde "abrá tantos puntos como datos utilizados
Kráfico: Aube de puntos real y recta de a0uste
500
1000
1500
2000
2500
500 1000 1500 2000 2500 3000
RENTA
C O N S U M O
i suponemos un modelo lineal entre ambas variables, dada la nube de
puntos, una estimación del modelo viene dada por una recta llamada
5E4$! .E !N9$E definida por:
OOt
a bY +
donde Oa representa una estimación del consumo autónomo y Ob una
estimación de la propensión marginal a consumir )ara cada valor de t Y ,
la recta de a0uste genera un valor de consumo *ue denotamos por Ot C ,
*ue no tiene por *u2 coincidir con el consumo real t C i dado un valor
de la t Y , el modelo predice un valor de consumo tal *ue Ot t C C = , en eseinstante de tiempo el modelo a0usta perfectamente i dado un valor de
la t Y , el modelo genera un valor del consumo tal *ue Ot t C C < , el modeloinfraestima el verdadero valor del consumo en ese a>o y comete un
error Este error es medible y se denomina 5E&.9=, es decir
1C
8/18/2019 Tema 1. Informacion
16/38
OOt t t
C C ε = − El residuo puede ser nulo, positivo o negativo, si el modeloacierta, infraestima o sobrestima el verdadero valor de consumo En
general, en todos los puntos de la nube real por encima de la recta de
a0uste, el verdadero valor de consumo está por encima de lo *ue predice
la rectaJ en los puntos sobre la recta de a0uste el modelo no se e*uivocay en los puntos de la nube real por deba0o de la recta, el verdadero valor
de consumo está por deba0o de lo *ue a0usta el modelo 'la recta(
El ob0etivo a"ora es conseguir una estimación de a y b de manera *ue se
cumpla alg6n criterio de optimalidad )or e0emplo, un criterio sería
minimizar la suma de los residuos cometidos en toda la muestra:
1 1
OO Omin minn n
t t t
t t
C a bY ε
= =
= − −∑ ∑
Este no es un buen criterio, ya *ue los errores individuales *ue comete
el modelo pueden ser muy grandes, pero al tener signo los errores
grandes y positivos se pueden compensar con los grandes y negativos
%a solución obvia es eliminar en este criterio el signo de los residuos,
tomando por e0emplo el valor absoluto:
1
Ominn
t
t
ε
=
∑
En este caso, el problema es la dificultad analítica de obtener una
solución para Oa y Ob Ao obstante, otra forma de eliminar el signo de
una variable es elevarla al cuadrado El criterio de optimalidad sería
obterner una e7presión de Oa y Ob *ue minimize la suma de los cuadrados
de los residuos:
/ /
1 1
OO Omin min ' (n n
t t t
t t
C a bY ε
= =
= − −∑ ∑
*ue tiene las venta0as de '1( eliminar la compensación de errores por el
signo, '/( penalizar más los errores grandes *ue los pe*ue>os y '(
llevar a una solución analítica sencilla Este criterio de estimación es el
más conocido en Econometría y se denomina
8/18/2019 Tema 1. Informacion
17/38
/ /
1 1
OO Omin min ' (n n
t t t
t t
C a bY ε = =
= − −∑ ∑
olución: 4ondiciones de primer orden:
/
1
1
OOO/ ' ( 8
O
n
t nt
t t
t
C a bY a
ε =
=
∂
= − − − =∂
∑∑
/
1
1
OOO/ ' ( 8
O
n
t nt
t t t
t
C a bY Y b
ε =
=
∂= − − − =
∂
∑∑
Este es un sistema de dos ecuaciones con dos incógnitas .e la primeracondición, se obtiene *ue:
1 1
O OO O8n n
t t
t t
C na b Y a C bY = =
− + + = ⇒ = −∑ ∑
donde C e Y representan las medias muestrales de 4onsumo y 5enta,
respectivamente 9sando la segunda condición de primer orden y la
solución para Oa , se obtiene:
/ /
1 1 1 1 1 1
O O OO 8 ' ( 8n n n n n n
t t t t t t t t
t t t t t t
C Y a Y b Y C Y C bY Y b Y = = = = = =
− + + = ⇒ − + − + =∑ ∑ ∑ ∑ ∑ ∑
y operando:
/
1 1 1 1
O' (n n n n
t t t t t
t t t t
b Y Y Y C Y C Y = = = =
− = − ⇒∑ ∑ ∑ ∑
1 1
/ / /
1 1
' (' (O
' (
n n
t t t t
t t
n n
t t
t t
C Y nCY C C Y Y
b
Y nY Y Y
= =
= =
− − −= =
− −
∑ ∑
∑ ∑
%as dos fórmulas en los recuadros son los estimadores
8/18/2019 Tema 1. Informacion
18/38
E0ercicio para el estudiante: 4omprobar *ue la solución obtenida es un
mínimo Es decir, mostrar *ue el "essiano es definido positivo:
/ / / /
/
/ / / /
/
O O
OO' ( OO O
O OO ' (
t t
t t
a a b %
b a b
ε ε
ε ε
∂ ∂
∂ ∂ ∂ = ∂ ∂ ∂ ∂ ∂
∑ ∑
∑ ∑
Estimación del modelo lineal -eneral 0M%&1:
.ada la formulación matricial del o compatible y A una matriz
cuadrada %a solución analítica a las condiciones de primer orden es:
1
8/18/2019 Tema 1. Informacion
19/38
O! ! X X X Y β =
Este es un sistema de k ecuaciones con k incógnitas ' 1 /O O O, ,,
k β β β (,
llamado sistema de ecuaciones normales El estimador Oβ *ue satisface
este sistema se llama estimador por o ' k k × (, teniendo *ue:
1O ' (! ! X X X Y β −=
E0ercicio para el estudiante: 4omprobar *ue la solución obtenida es un
mínimo
Pro+iedades estadísticas del estimador MCO de β :
%inealidad: El estimador
8/18/2019 Tema 1. Informacion
20/38
donde se "an usado las "ipótesis de '1( parámetros constantes, '/(
regresores fi0os e independientes linealmente y '( esperanza nula del
t2rmino de error
E!iciencia: El estimador
8/18/2019 Tema 1. Informacion
21/38
Prue"a: El vector de residuos o ' (n n× es la llamada matriz de proyección*ue tiene propiedades importantes: '1( es sim2trica, '/( idempotente ,'(
no tiene inversa y '#( es ortogonal a la matriz X , es decir, 8 MX =
E0ercicio para el estudiante: )robar estas cuatro propiedades de la matriz M
! partir de la relación anterior y de las propiedades de la matriz M , se
obtiene: O ' ( MY M X M ε β ε ε = = + = )or tanto, siempre *ue se desee la
suma de cuadrados de los residuos se puede escribir como una formacuadrática:
O O! ! M ε ε ε ε =
@inalmente, la esperanza de esa suma es igual a:
/ /
O O' ( ' ( P ' (Q P ' (Q
P ' (Q P ' (Q P Q P Q
! ! ! !
! !
" " M " t* M " t* M
t* " M t* M" t* M t* M
ε ε ε ε ε ε εε
εε εε σ σ
= = = =
= = = =
y la traza de la matriz M :
1 1 1' ( P ' ( Q P ' ( Q P' ( Q! ! ! ! ! ! t* M t* $ X X X X n t* X X X X n t* X X X X n k − − −= − = − = − = −
ya *ue la matriz M es cuadrada y de dimensión n y 1' (! X X − de tama>o' (k k × .e "ec"o, la prueba de *ue esta matriz no tiene inversa esinmediata, ya *ue el rango de una matriz idempotente coincide con su
traza
9na vez obtenido un estimador insesgado de la varianza residual, dada
cual*uier muestra de Y y X en el
8/18/2019 Tema 1. Informacion
22/38
E0ercicio para el estudiante: )robar *ue el estimador de la varianza delOβ
8/18/2019 Tema 1. Informacion
23/38
Pro+iedades al-e"raicas del criterio de estimación MCO
ay *ue distinguir las propiedades algebraicas del criterio
8/18/2019 Tema 1. Informacion
24/38
Prue"a: ! partir de la primera ecuación normal de un modelo conconstante:
O OO O O' ( 8 ' ( 8 8 8
! ! ! ! !
t i X i Y i Y X i Y Y iβ β ε ε = ⇒ − = ⇒ − = ⇒ = ⇒ =∑Pro+iedad 7 En el
8/18/2019 Tema 1. Informacion
25/38
Prue"a: %a suma de cuadrados de residuos
8/18/2019 Tema 1. Informacion
26/38
E0ercicio para el estudiante: 4omprobar *ue se cumplen estas F
propiedades con los datos del e0ercicio num2rico 1
Medidas de "ondad de ao en los EE99 y el AS de
cigue>as en ese mismo a>o y estados %a estimación del modelo *ue
e7plica el AS de nacimientos en función del AS de cigue>as proporciona
un / muy elevado y esto sabemos *ue es esp6reo %a razón es *ue en
ese a>o la correlación muestral entre ambas variables fue muy alta y
/F
8/18/2019 Tema 1. Informacion
27/38
aun*ue no "ay ninguna relación causal entre ambas, el coeficiente de
determinación es bueno, pero enga>oso
En relaciones donde tiene sentido relacionar determinadas variables
'4onsumo y 5enta(, el coeficiente de determinación puede ser e7cesivamente alto si en el período muestral considerado ambas
variables evolucionan de forma muy parecida o presentan una tendencia
com6n
=tro problema distinto del / convencional es *ue nunca empeora
cuando en el modelo introducimos variables e7plicativas adicionales Es
decir, aun*ue una nueva variable no sea muy relevante, su incorporación
"ace *ue, en el peor de los casos, el / no cambie, o bien, con un poco
de suerte, aumente &ntroducir un nuevo regresor en el modelo tiene dos
efectos: '1( disminuyen los grados de libertad y 2ste es negativo y '/(
disminuye la suma residual y 2ste es positivo i el peso del efecto
negativo es mayor *ue la me0ora en el a0uste, no compensará introducir
esta nueva variable y a la inversa
%a solución a 2ste 6ltimo problema es utilizar el llamado / a0ustado o
corregido de grados de libertad ' / ( *ue se calcula como:
/ /1
1 '1 (
n
n k
−
= − −−
En esta formulación del / se tienen en cuenta dos efectos: '1( i
aumenta el n6mero de regresores en el modelo, disminuyen los grados
de libertad y esto se penaliza, es decir:/1nk n k
n k
−↑ ⇒↓ − ⇒↑ ⇒↓
− y '/(
Esos nuevos regresores pueden me0orar el modelo en t2rminos de a0uste,
es decir: / /k + ↑ ⇒↓ ⇒↑ ⇒↑ i el efecto de penalización es menor *ue el efecto de me0ora en el a0uste, el / aumentará e indicará *ue
compensa la introducción de esas nuevas variables y a la inversa
4omo e0emplo, supongamos *ue se "an estimado dos funciones de
consumo alternativas:
/O OO J 88t t t
C a bY ε = + + =/O OO O J 8
t t t t C a bY ci ν = + + + =
donde t i es un $ipo de inter2s !mbos modelos están anidados ya *ue se
*uiere e7plicar el 4onsumo en función de la 5enta 'en el primero( o bien, introducir un nuevo regresor '$ipo de inter2s( en el modelo más
/
8/18/2019 Tema 1. Informacion
28/38
sencillo El "ec"o de *ue el / sea mayor en el modelo más complicado
indica *ue el $ipo de inter2s es una variable *ue compensa introducir
'en t2rminos de a0uste( a pesar de *ue los grados de libertad "ayan
disminuido
Deriación del / : e obtiene a partir del / convencional
/ ;1 1;
+, +, n ,
+! +! n= − = −
donde dividiendo por n la uma 5esidual y la uma $otal, esta medida
se puede interpretar como un ratio de varianzas &mplantando la
restricción de *ue los estimadores de las varianzas residual y de la
variable endógena sean insesgados, se obtiene el / corregido de los
grados de libertad:
/ /; 11 1 '1 (; 1
+ n k n
+! n n k
− −= − = − −
− −
E0ercicio para el estudiante: 4alcular el / convencional y el corregido
usando los datos del e0ercicio num2rico 1 &nterpretar este coeficiente
Pr,ctica con los datos de Anscom"e y Eie=s$
En un conocido traba0o publicado por @N !nscombe en 1+ '“Krap"s
in tatistical !nalysis”, !/e Ame*ican +tati#tician, /, pp1-/1(, se
ilustran algunos aspectos básicos del análisis de regresión lineal usando
los datos simulados *ue figuran en la tabla siguiente 'tambi2n en
''')ucm)e#0info0ecocuan0ect*1(:
t 1t y /t y :t y #t y 1t x /t x
1 8# +1# #F FC 1888 88/ F+C 1# F CF 88 88
C # 1/# 1 188 88
# 1 11 # +88 88
C +/F 1 # 1188 88
F ++F 18 # 8# 1#88 88
/# F1 F8 C/C F88 88
#/F 18 C+ 1/C8 #88 1+88
+ 18# +1 1C CCF 1/88 88
18 #/ /F F#/ +1 88 8811 CF ## C F+ C88 88
/
8/18/2019 Tema 1. Informacion
29/38
.ada esta información se pide:
'1( Estimar por
8/18/2019 Tema 1. Informacion
30/38
8/18/2019 Tema 1. Informacion
31/38
'/( 5epresente gráficamente la nube de puntos real 0unto con la
recta a0ustada en cada uno de los cuatro modelos
considerados:
&
10
12
2 & 10 12 1 1&
1
Y 1
2
&
10
2 & 10 12 1 1&
1
Y 2
&
10
12
1
2 & 10 12 1 1&
1
Y 3
&
10
12
1
5 10 15 20
2
Y 0
En el modelo 'a( la relación entre las variables es más o menos
lineal, luego la "ipótesis de linealidad en los parámetros "ace *ue el
a0uste sea razonable
En el modelo 'b( la relación entre las variables es claramente no
lineal y el a0uste podría me0orar claramente especificando el modelo deotras formas, como por e0emplo:
/
1 / :t t t t y x xβ β β ε = + + +
1 /ln
t t t y xβ β ε = + +
En el modelo 'c( todos los puntos de la nube real, e7ceptuando uno,
se a0ustan casi perfectamente en una recta *ue no es la estimada por*ue
ese valo* atípico 'el tercer par de valores( "ace *ue la recta de a0uste
cambie de pendiente y el a0uste sea peor En este caso, se aprende *ue la presencia de una o más observaciones atípicas pueden alterar todos los
1
8/18/2019 Tema 1. Informacion
32/38
resultados de la estimación )or tanto, el tratamiento de atípicos antes de
estimar una relación puede ser crucial
En el modelo 'd( tenemos otro problema diferente en los datos %os
datos de la variable e7plicativa /t x son todos igual a , e7ceptuando eloctavo valor, *ue es igual a 1+ .e "ec"o, 2ste es el dato *ue "ace *ue la
recta de a0uste est2 anclada donde está i elimináramos el par de
valores de la endógena y de la e7ógena para el instante t.2, no sería
posible estimar por ?IMA @ERO'IMI%ITUD
Es otro m2todo de estimación del vector de parámetrosβ
en ela y en el me0or de
los casos, aleatoria Kracias al $eorema 4entral del %ímite,
se puede demostrar *ue si e7iste un n6mero grande de
variables aleatorias independientes e id2nticamente
distribuidas, la suma de todas ellas seguirá una normal
/
8/18/2019 Tema 1. Informacion
33/38
'b( 9na variante del $eorema 4entral del %ímite afirma *ue
aun*ue el n6mero de variables no sea muy grande o no
sean estrictamente independientes, su suma puede seguir
teniendo una distribución normal
'c( 4on el supuesto de normalidad, se pueden obtener fácilmente las distribuciones *ue siguen los estimadores
8/18/2019 Tema 1. Informacion
34/38
; / / ; / /
/
1' ( ' ( '/ ( e7p ' ( ' ( ' , (
/
n n ! f Y f Y X Y X Lε σ β β β σ σ
− − = = Π − − − =
siendo la función de verosimilitud cuando depende de los parámetros β
y /σ , dada una muestra de Y y X Esta es la función de densidadcon0unta de Y y X , dados los valores de los parámetros β y /σ
=btener la e7presión de los estimadores por má7ima verosimilitud de β
y /σ , supone ma7imizar la función de verosimilitud,/' , ( L β σ )ara *ue
sea más fácil y puesto *ue no cambia el óptimo se ma7imiza el
logaritmo neperiano de la función de verosimilitud:
/ /
/
1ma7 ln ' , ( ln / ln ' ( ' (
/ / /
! n n L Y X Y X β σ σ β β σ
= − Π − − − −
4ondiciones de primer orden:
/1
/
ln ' , ( 1 O' / / ( 8 ' (/
! ! ! !
M5
L X Y X X X X X Y
β σ β β
β σ
−∂ = − − + = ⇒ =∂
//
/ / #
O Oln ' , ( ' ( ' ( 1O8
/ /
! !
M5
L n Y X Y X
n
β σ β β ε ε σ
σ σ σ
∂ − − = − − − = ⇒ = ÷∂
)or tanto, el estimador
8/18/2019 Tema 1. Informacion
35/38
Pro+iedades estadísticas del estimador M@: %a cota de 4ramer 5ao proporciona la mínima varianza *ue puede alcanzar cual*uier estimador
insesgado de un vector de parámetros .ic"a cota viene dada por la
inversa de la matriz de información ' $ (, donde 2sta viene definida por laesperanza del "essiano cambiada de signo Es decir:
/
/
ln ' ( L $ "
θ
θ
∂= − ∂
, siendo /β
θ σ
=
$omando las derivadas segundas a las condiciones de primer orden, se
tiene *ue:
/ /
/ /ln ' , (
!
L X X β σ β σ
∂ = −∂
/ /
/ #
ln ' , ( P Q
' (' (
! L X X Y β σ β
β σ σ
∂ −=
∂ ∂
/ /
/ / # F
ln ' , ( P Q P Q
' (' ( /
! L n Y X Y X β σ β β
σ σ σ σ
∂ − −= −
∂ ∂
y formando el "essiano:
/ #
# F
P Q
P Q P Q
/
! !
!
X X X X Y
% n Y X Y X
β
σ σ
β β
σ σ
−−
=− −
− −
%a esperanza de los t2rminos del "essiano es igual a:
/ /
! ! X X X X "
σ σ − = −
# #
P Q8
! ! X X Y X " "
β ε
σ σ
−= =
/
# F # F # F #
P Q P Q P Q
/ / / /
! ! n Y X Y X n " n n n "
β β ε ε σ
σ σ σ σ σ σ σ
− −− = − = − = −
C
8/18/2019 Tema 1. Informacion
36/38
)uesto *ue la matriz de información es diagonal por blo*ues, su inversa
tambi2n y tiene la e7presión:
/ 1
1
#
' ( 8
/8
! X X
$ n
σ
σ
−
−
=
Esta matriz indica *ue la cota inferior para la varianza de un estimador
insesgado de β es / 1' (! X X σ − y la cota inferior para la varianza de un
estimador insesgado de /σ es la e7presión#/
n
σ
En el caso
8/18/2019 Tema 1. Informacion
37/38
%a varianza del estimador de β llamado HOβ es:
H H H /O O Ovar' ( P' (' ( Q ' (! ! ! ! " " C C CC β β β β β εε σ = − − = =
!un*ue todavía no son comparables ambas matrices de varianzas y
covarianzas, es posible siempre descomponer una matriz fi0a como la C
en la suma de otras dos: C ( D= + , donde 8 D ≠ y postmultiplicando por
la matriz X esa identidad, tenemos *ue CX (X DX = + 4omo k CX $ = , por insesgadez y k (X $ = , por definición, es obvio *ue 8 DX = )or tanto:
H / / / / / /Ovar' ( ' (' (! ! ! ! ! ! CC ( D ( D (( DD D( (Dβ σ σ σ σ σ σ = = + + = + + +
teniendo en cuenta *ue1' (! ! (( X X −= y 8! ! D( (D= = , se obtiene :
H / 1 / H /O O Ovar' ( ' ( var' ( var' (! ! ! X X DD DDβ σ σ β β σ −= + ⇒ = +
y la matriz / ! DDσ es definida positiva por construcción
A+éndice 7$ .istribuciones de los estimadores
8/18/2019 Tema 1. Informacion
38/38
! partir de este resultado podemos derivar inmediatamente la
distribución del estimador de /σ por
Top Related