TEMA 4. DATOS PANEL. MODELOS ESTÁTICOS

PUBLICACIONES DE 4º CURSO

Licenciatura: ECONOMICAS

Asignatura: MODELOS REGIONALES

TEMA 4:

DATOS PANEL: MODELOS ESTÁTICOS

Autores: Jesús Mur; Ana Angulo

Departamento: ANÁLISIS ECONÓMICO

Curso Académico: 2008/2009

Facultad de Ciencias Económicas y Empresariales

Universidad de Zaragoza

2

Indice

1- Introducción.

2- Fuentes de heterogeneidad en conjuntos de datos panel.

3- Estimación en modelos de datos panel estáticos.

4- Contrastes de especificación en modelos de datos panel estáticos.

5- Efectos espaciales en modelos de datos panel.

3

1. INTRODUCCIÓN

Se dice que estamos en presencia de un conjunto de datos de panel cuando se

dispone, simultáneamente, de información de corte transversal y de serie temporal. Esto es

cuando se dispone de observaciones sobre determinadas características de un conjunto de

agentes (individuos, países, empresas, etc.) a lo largo de un período continuado de tiempo.

La recogida de información se lleva a cabo, por tanto, en dos dimensiones y, de este modo,

se generan múltiples observaciones puntuales para cada unidad económica.

Generalmente, los paneles de datos se distinguen unos de otros según su

amplitud transversal y temporal. Así, los paneles con un número muy amplio de

observaciones transversales y un número de períodos reducido se denominan Paneles

Micro. En el caso contrario, número de periodos elevado e información transversal

reducida se conoce con el nombre de Paneles Macro. Por último, en el caso realmente

extraordinario de contar con un panel con amplia dimensión tanto temporal como

transversal hablaríamos de un Campo aleatorio (Random Field).

Así mismo, resulta habitual hablar de paneles de datos equilibrados o paneles

completos cuando el número de observaciones transversales es el mismo para cada

período temporal.

Comenzaremos presentando una breve descripción de las principales ventajas,

así como de las limitaciones, del uso de muestras de datos de panel en la investigación

económica en relación con las bases de datos que sólo contemplan una dimensión

temporal (series temporales) o individual (corte transversal). Para ello nos basaremos en

los trabajos de Hsiao (2000), Klevmarken (1989), Solon (1989) y Baltagi (2001). Entre

las principales ventajas hay que destacar las siguientes:

1) Los datos de panel proporcionan menos problemas de multicolinealidad

(presente en numerosas ocasiones al utilizar datos de series temporales), más grados de

4

libertad y, por tanto, mayor eficiencia. En efecto, la utilización de datos de panel, como ya

hemos comentado, permite utilizar un conjunto de datos más informativos, en el sentido de

que es capaz de recoger con mayor precisión la variabilidad en los datos, tanto la existente

entre individuos como la que existe a lo largo del tiempo.

2) Asimismo, la utilización de datos de panel permite identificar y medir algunos

efectos que no pueden considerarse al utilizar únicamente datos de corte transversal o datos

de series temporales. Ben-Porath (1973) sugiere un ejemplo. Supongamos que tenemos

datos de corte transversal correspondientes a un determinado número de mujeres en el que

una variable es la participación media anual en el mercado de trabajo. Supongamos que

una determinada mujer ha participado una media del 50%. Esta cifra ha podido ser

generada por dos situaciones diferentes. O bien ha trabajado el 50% de los años

considerados, o bien trabaja a tiempo parcial durante todos los años. Las implicaciones de

ambas situaciones son distintas y sólo la utilización de datos de panel permitiría

discriminar ambas situaciones.

3) A diferencia de los datos de corte transversal, una ventaja adicional de los datos

de panel radica en la posible modelización de efectos dinámicos. Por ejemplo, en los datos

de corte transversal podemos determinar qué porcentaje de la población consume un

determinado producto en un determinado momento. La utilización de datos de panel

permite analizar qué porcentaje de personas que consumían un producto siguen haciéndolo

y quienes han dejado de consumirlo. Un ejemplo de esto que acabamos de mencionar

referido al desempleo puede encontrarse en Ashenfelter (1978) y Ashenfelter y Solon

(1982).

4) Otra de las ventajas atribuidas a los datos de panel con respecto a los datos de

corte transversal es la gran capacidad que ofrecen al investigador de construir y

contrastar complicados modelos de comportamiento. De hecho, el análisis y la

modelización de la eficiencia técnica resulta más interesante realizarla utilizando datos

de panel (Baltagi y Griffin, 1988b; Cornwell y otros, 1990; y Kumbhakar, 1990, 1991,

1992, 1993). Además, es necesario introducir menos restricciones a la hora de estimar

modelos de retardos distribuidos usando datos de panel, en relación con los que son

necesarios cuando se utilizan datos de series temporales (Hsiao, 1986).

5

5) Por otra parte, los datos de panel permiten resolver o reducir la magnitud de

un problema econométrico muy importante que, a menudo aparece en los estudios

empíricos. Nos referimos a la presencia de variables omitidas (inobservadas u

observadas con error) que están correlacionadas con las variables explicativas del

modelo. Por ejemplo, consideremos el siguiente modelo de regresión:

itititit zxy ερβα +++= '' Ni ,...,1= ; Tt ,...,1= (1)

donde dada la naturaleza de los datos, utilizaremos dos tipos de subíndices: i para los

individuos1 ( Ni ,...,1= ) y t para el período temporal ( Tt ,...,1= ) y donde itx y itz son

vectores de variables exógenas, donde el término de error itε se distribuye de forma

idéntica e independiente sobre i y t con media cero y varianza 2εσ . En estas

circunstancias, es bien conocido que la estimación MCO proporciona estimadores

consistentes de los parámetros del modelo βα , y ρ. Sin embargo, si suponemos que las

variables incluidas en itz son inobservables, y que además la covarianza entre itx y itz

no es cero, (es decir, están correlacionadas con itx ), entonces los estimadores MCO

obtenidos al hacer la regresión de ity sobre itx serán sesgados2.

En estas circunstancia, se puede comprobar como la disponibilidad de datos de

panel permite solucionar el problema. Al disponer de observaciones repetidas para un

grupo de individuos podemos eliminar el efecto de las variables incluidas en z . Si por

ejemplo, iit zz = para todo t (los valores de z permanecen constantes a lo largo del

tiempo para un individuo, pero varían entre individuos), podemos tomar las primeras

diferencias de las observaciones individuales en el tiempo y obtener:

1 Utilizaremos el término individuos para referirnos a las unidades de corte transversal. Como se ha comentado con anterioridad, también puede tratarse de empresas, hogares, países, etc. 2 Siempre que se omiten variables relevantes se incurre en un problema de sesgadez de los parámetros incluidos salvo que las variables incluidas y las omitidas sean ortogonales.

6

( ) ( )1,'

1,1, −−− −+−=− tiittiittiit xxyy εεβ Ni ,...,1= ; Tt ,...,1= (2)

De forma análoga, si tit zz = para todo i (los valores de z permanecen constantes

entre individuos en un determinado momento del tiempo, pero presentan variación

temporal), podemos tomar desviaciones con respecto a la media entre individuos en un

periodo de tiempo y obtener:

⎟⎠⎞

⎜⎝⎛ −+⎟

⎠⎞

⎜⎝⎛ −=−

−−−

tittittit xxyy εεβ'

Ni ,...,1= ; Tt ,...,1= (3)

donde N

yy

N

iit

t

∑== 1 ,

N

xx

N

iit

t

∑== 1 y

N

N

iit

t

∑== 1

εε .

De esta forma, podemos obtener estimadores insesgados y consistentes para β,

en base a las regresiones (2) y (3). Sin embargo, si únicamente se hubiera dispuesto de

datos de corte transversal (T=1) para el primer caso ( iit zz = ), o datos de series

temporales (N=1) para el segundo ( tit zz = ), tales transformaciones no se podrían haber

llevado a cabo. En consecuencia, no se podrían obtener estimadores consistentes de β a

no ser que se contara con instrumentos que estuvieran correlacionados con z, pero

incorrelados con x y ε.

Existen numerosas aplicaciones que permiten ilustrar este punto. Utilicemos, por

ejemplo, el trabajo de Baltagi y Levin (1992) en el que se estima la demanda de tabaco

en Estados Unidos de 46 estados durante 25 años. Concretamente, se modeliza el

consumo como una función de la renta, los precios y el consumo retardado. Estas

variables varían entre estados y en el tiempo. Sin embargo, hay muchas otras variables

que pueden ser invariantes en el tiempo o entre estados y pueden afectar al consumo.

Ejemplos de las primeras (invariantes en el tiempo) serían la religión o la educación.

Entre las segundas podría citarse la publicidad sobre radio o televisión que,

normalmente, relaciona negativamente el consumo de tabaco con la salud. La

7

información referente a dichas variables es difícil de obtener y, en consecuencia, su

omisión conlleva problemas de sesgos en las estimaciones, a no ser que se explote la

naturaleza de los datos panel para eliminar sus efectos.

6) Finalmente, los datos de panel se recogen a nivel de micro-unidades como

individuos, empresas u hogares (familias), eliminándose los sesgos causados

principalmente por la agregación de individuos, empresas o productos (Blundell, 1988,

Klevmarken, 1989 y; Blundell y Meghir, 1990).

Entre las limitaciones de los datos de panel hay que destacar las siguientes:

i) Problemas asociados al diseño y recogida de la información. Kasprzyk y otros

(1989) ofrecen una extensa discusión sobre esta problemática. En cualquier caso, entre

estos problemas podemos citar la posible no representatividad de la muestra elegida, las

posibles no respuestas por falta de cooperación de los entrevistados, el que el

entrevistado no recuerde con exactitud su comportamiento, etc. (Bailar, 1989).

ii) Distorsiones debidas a errores de medida. Kalton y otros (1989) indican que

los errores de medida surgen a causa de respuestas falsas que, por su parte, son fruto de

respuestas ambiguas, errores de memoria, mentiras deliberadas de los encuestados

(sesgo de prestigio) o bien debidos a los sesgos que puede introducir el propio

encuestador.

iii) Una tercera limitación hace referencia a los posibles problemas de selección.

En ocasiones, es el propio investigador el que establece una especie de autoselección,

por ejemplo cuando sólo estamos interesados en aquellos que consumen por encima de

un determinado nivel, con lo que artificialmente estamos truncando la muestra con los

consiguientes problemas que eso puede traer consigo (Hausman y Wise, 1979). Otro

problema asociado con la selección hace referencia a la posible no respuesta debido a

que el encuestado rechaza participar o no está en casa, etc, aunque esto sólo ocurre en la

etapa inicial de la recogida de datos. Finalmente, destacamos el problema de lo que se

8

denomina “atrición” que, en cierto modo, también se puede catalogar como no respuesta

pero una vez que el panel está en funcionamiento. De las personas que originalmente

participan algunos pueden renunciar voluntariamente o bien se desplazan del lugar, o

bien mueren. En estas ocasiones, suelen sustituirse por personas de similares

características. Björklund (1989) y Ridder (1990, 1992) proporcionan una descripción

detallada de las consecuencias de la atrición.

iv) Finalmente, la última limitación hace referencia a que en la mayoría de los

casos la dimensión temporal del panel es generalmente reducida. Ello hace que la mayor

parte de los argumentos asintóticos utilizados en los procedimientos de estimación e

inferencia recaigan casi exclusivamente en el número de individuos encuestados. En la

mayor parte de los casos, la reducida dimensión temporal de los paneles tienen mucho

que ver con el coste de obtención de los datos. Además, incrementar la dimensión

temporal puede aumentar también los problemas de atrición que acabamos de

mencionar.

Un concepto importante en el contexto de datos de panel es lo que se denomina

heterogeneidad y, asociada a ella, sesgo de heterogeneidad. Como en todo tipo de

modelizaciones, un modelo de datos de panel pretende explicar una variable a través de

las variables más importantes, excluyendo ciertas variables cuyo impacto es menos

significativo o peculiar de ciertos individuos. En estas circunstancias, la suposición

típica de que una variable económica y es generada por una función de distribución

probabilística P(y|θ), donde θ es un vector real idéntico para todos los individuos y

períodos puede no ser realista. Es decir, el ignorar efectos específicos de individuos y

tiempo que existen entre las unidades de tiempo o del corte transversal, y que no se

capturan con las variables incluidas en el modelo, puede conducirnos a la presencia de

heterogeneidad de los parámetros del modelo especificado. Es decir, la estimación del

modelo general, sobre la base del total de las NT observaciones:

ititit xy εβα ++= ' Ni ,...,1= ; Tt ,...,1= (4)

puede conducir a importantes sesgos de heterogeneidad si, por el contrario, es

conveniente diferenciar los parámetros en el tiempo o entre individuos.

9

En general, se pueden distinguir las siguientes formulaciones:

1) Los coeficientes de las pendientes son constantes, pero el término

independiente varía entre individuos:

ititiit xy εβα ++= ' Ni ,...,1= ; Tt ,...,1= (5)

Esta formulación dará lugar a los modelos de componentes de error en una

dirección.

2) Los coeficientes de las pendientes son constantes, pero el término

independiente varía entre individuos y tiempo:

itititit xy εβα ++= ' Ni ,...,1= ; Tt ,...,1= (6)

Esta formulación dará lugar a los modelos de componentes de error en dos

direcciones.

3) Todos los coeficientes varían entre individuos:

itiitiit xy εβα ++= ' Ni ,...,1= ; Tt ,...,1= (7)

4) Todos los coeficientes varían entre individuos y tiempo:

ititititit xy εβα ++= ' Ni ,...,1= ; Tt ,...,1= (8)

En todos los casos, se asume que el término de perturbación itε cumple las

hipótesis básicas; es decir, se supone distribuido de forma idéntica e independiente

sobre individuos y sobre el tiempo, con media 0 y varianza 2εσ .

Ilustremos con los siguientes gráficos los posibles sesgos al estimar el modelo

(4) (con parámetros homogéneos), cuando lo correcto habría sido especificar, por

10

ejemplo, el modelo (5) (pendientes constantes y diferentes términos independientes),

suponiendo que consideramos una única variable explicativa:

Donde cada elipse representa la nube de puntos para un individuo en el tiempo y,

la línea recta que la atraviesa representan la regresión individual. Por otro lado, la línea

más gruesa representa la línea de regresión correspondiente al modelo (4).

Sin embargo entre los modelos 5-8, son los dos primeros los que generalmente

son utilizados en el marco de datos de panel. Es decir, lo habitual es incorporar

heterogeneidad a través del término independiente. En consecuencia, el efecto de un

cambio en las variables explicativas es el mismo para todos los individuos y períodos,

x

y

x

y

x

y

11

pero el nivel medio puede variar entre individuos (en 5) o entre individuos y tiempo (en

6).

Como ya se ha indicado, el supuesto básico de estos modelos radica en el hecho

de que el efecto de todas las variables omitidas se recoge a través de tres tipos de

variables:

1. Variables idénticas a lo largo del tiempo para cada individuo, pero que

varían entre individuos. Por ejemplo, los atributos de la dirección de una

empresa, la habilidad, el sexo así como muchas otras variables

sociodemográficas.

2. Variables idénticas para todos los individuos en un período de tiempo, pero

que varían en el tiempo. Dentro de ellas, se podrían considerar variables tales

como los precios, el tipo de interés o el ambiente de pesimismo u optimismo

de una economía en un momento del tiempo.

3. Variables que varían tanto entre individuos como en el tiempo. Algunos

ejemplos podrían ser los beneficios de una empresa, las ventas o el stock de

capital.

Las cuales se pueden ver reflejadas a través del término independiente variable

del modelo especificado.

Concluiremos esta sección mostrando la especificación propuesta por Hoch

(1962) para estimar una función de producción con datos de panel. Se parte de la típica

función de producción de tipo Cobb-Douglas: itkitkitit vxxy ++++= ββμ ...11 , donde y

es el logaritmo del output y x1, ...,xk son los logaritmos de los inputs. A continuación, se

trata de solventar la crítica habitual relativa al hecho de haber ignorado variables que

reflejan diferencias en las estrategias de dirección de las empresas, diferencias en

tecnología, etc., así como otro tipo de variables que afectan a la productividad de todas

12

las empresas pero que fluctúan en el tiempo. En consecuencia, se deberían introducir

dichas variables que podemos denotar, respectivamente, como Mi y Pt en el modelo (9),

obteniendo:

ittikitkitit PMxxy ελαββμ ++++++= ...11 (9)

Sin embargo, dado que las variables definidas como Mi y Pt son habitualmente

no observadas, su efecto se traduce en un término independiente que varía entre

empresas y/o tiempo tal y como se definió en las ecuaciones (5) y (6). De esta forma, se

demuestra en el trabajo mencionado que teniendo en cuenta la heterogeneidad entre

empresas y periodos se mejora la especificación del modelo, dado que se reduce o se

evita el sesgo por omisión de variables relevantes.

Por último, cabe mencionar que los efectos específicos de los individuos y/o del

tiempo recogidos en iα o itα en las ecuaciones (5) y (6), pueden tratarse como fijos o

como aleatorios, dando lugar a dos tipos diferentes de modelos:

• Si se les trata como parámetros desconocidos fijos, se obtiene el modelo de

efectos fijos.

• Si por el contrario, asumimos que, aunque tales términos independientes

difieren entre individuos y/o tiempo, puede considerarse que proceden de una

distribución de media μ y varianza 2ασ , se obtiene el modelo de efectos

aleatorios, donde los efectos individuales iα o itα son tratados como

aleatorios.

El enfoque de efectos fijos está condicionado a los valores de iα o itα ; es

decir, la distribución de la variable endógena se condiciona al valor de dichos

parámetros, los cuales pueden estimarse. Por el contrario, el enfoque de efectos

aleatorios no está condicionado a los valores individuales iα o itα sino que los integra.

En términos formales:

13

Efectos fijos: { } iitiitit xxyE αβα += ' o { } ititititit xxyE αβα += ' (10)

Efectos aleatorios: { } β'ititit xxyE =

Por este motivo los modelos de efectos fijos se obtienen en base al enfoque

condicional del modelo, mientras que los modelos de efectos aleatorios en base al

enfoque incondicional. Además, como ya se ha mencionado para ambos modelos (de

efectos fijos y aleatorios) se habla de modelos de componentes del error en una

dirección (one-way) cuando se incorpora el término iα (ecuación 5, solo variación entre

individuos), mientras que se habla de modelos de componentes del error en dos

direcciones (two-way) cuando se incorpora el término itα (ecuación 6, variación entre

individuos y tiempo). A continuación, procederemos a su definición.

2. ENFOQUE CONDICIONAL: EL ESTIMADOR INTRAGRUPO

El modelo de efectos fijos es simplemente un modelo de regresión lineal cuyos

términos independientes varían entre individuos y/o tiempo. Consideraremos en primer

lugar, el modelo (5) que incorpora, únicamente, la variación entre individuos, y que

recibe el nombre de modelo de componente del error en una dirección, dedicando un

segundo epígrafe más breve al modelo (6) o modelo de componente del error en dos

direcciones.

2.2 MODELO DE COMPONENTE DEL ERROR EN UNA DIRECCIÓN

Como ya se ha indicado, este modelo de efectos fijos es un modelo de regresión

lineal cuyos términos independientes varían entre individuos:

ititiit xy εβα ++= ' ( )2,0~ εσε IIDit (11)

14

donde itx es un vector de variables explicativas de dimensión K (es decir, recoge la

observación it de las K variables explicativas consideradas), que se asumen

independientes de itε ; y donde iα recoge el efecto de aquellas variables propias del

individuo i que permanecen constantes en el tiempo y, que muy probablemente se

encuentran correlacionadas con las variables incluidas en itx .

En notación matricial:

⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

+

⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

+

⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

++

⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

+

⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

=

⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

NN

N

T

T

T

N x

xx

y

yy

ε

εε

βα

ι

αι

α

ι

..

..

..00

...

0.

.

0

0..0

..

2

1

2

1

21

2

1

(12)

siendo:

( )1

.

.

.1

xTy

y

y

iT

i

i

⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

=; ( )

)1(1,...,1,1'

xTT =ι

( )KxTxxx

xxxxxx

x

xx

x

KiTiTiT

Kiii

Kiii

iT

i

i

i

⎥⎥⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢⎢⎢

⎣

⎡

=

⎥⎥⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢⎢⎢

⎣

⎡

=

......

...

...

.

.

.

21

22221

11211

'

'2

'1

;

( )1

.

.

.2

1

KxK ⎥

⎥⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢⎢⎢

⎣

⎡

=

β

ββ

β

15

( ))1(

...,, ,,21'

xTiTiii εεεε =

con [ ] 0=iE ε , [ ] Tii IE 2'εσεε = y [ ] 0' =jiE εε si ji ≠

siendo TI la matriz identidad de orden T (T x T).

Es decir, cada ecuación i-ésima, es de la forma:

iiiTi xy εβαι ++= i=1,...,N

Esto puede escribirse en el marco del modelo de regresión tradicional mediante

la inclusión de una variable ficticia para cada unidad i en el modelo:

itit

N

jijjit xdy εβα ++= ∑

=

'

1 (13)

donde ijd = 1 si ji = y 0, en otro caso. Es decir, se incluyen N variables ficticias en el

modelo, tantas como individuos. Los parámetros Nαα ,...,1 y β pueden estimarse por

mínimos cuadrados ordinarios, a partir de (13). A los estimadores β así obtenidos se

les denomina estimador de variable ficticia de mínimos cuadrados.

Sin embargo, dado que normalmente N (la dimensión transversal) es elevada, la

regresión resultante (13) está constituida por un número muy elevado de regresores, lo

cual resulta poco atractivo. No obstante, afortunadamente los estimadores contenidos en

β pueden obtenerse de forma más sencilla, efectuando una regresión sobre las variables

obtenidas como desviaciones respecto a las medias individuales. Básicamente, esto

equivale a una transformación de los datos que implica la eliminación de los efectos

individuales iα . Para analizar este punto, a partir de las medias temporales de cada

variable se define el modelo:

iiii xy εβα ++= ' (14)

16

donde T

yy

T

tit

i

∑== 1 ,

T

xx

T

tit

i

∑== 1 y

T

T

tit

i

∑== 1

εε .

Restando miembro a miembro las expresiones (5) y (14), se obtiene:

( ) ( )iitiitiit xxyy εεβ −+−=− ' (15)

A este modelo se le denomina trasformación intragrupos. A los estimadores

MCO para β , obtenidos a partir de este modelo transformado en desviaciones con

respecto a las medias individuales se les denomina estimadores intragrupos o

estimadores de efectos fijos (Fixed effect estimators, FE) y, como ya hemos comentado

son idénticos a los obtenidos a partir del estimador de variables ficticias mínimo

cuadrático. Estos estimadores, por tanto, se calculan a partir de la siguiente expresión:

( )( ) ( )( )∑∑∑∑= =

−

= =

−−⎟⎠

⎞⎜⎝

⎛−−=

N

i

T

tiitiit

N

i

T

tiitiitFE yyxxxxxx

1 1

1

1 1

'^β (16)

El procedimiento anterior es equivalente a premultiplicar la ecuación i-ésima:

iiiTi xy εβαι ++= (17)

por una matriz Q de orden (T x T), simétrica e idempotente: '1TTT T

IQ ιι−= :

iiiiiTi QxQQxQQyQ εβεβαι +=++= (18)

matriz, que aplicada a cualquier vector, lo transforma en desviaciones con respecto a su

media (y, aplicado a una matriz, transforma sus columnas en desviaciones con respecto

a su media). De esta forma, se elimina el término iα constante en el tiempo,

eliminándose, de esta forma el problema relativo a su probable correlación con las

variables incluidas en itx . Por ejemplo:

17

⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢

⎣

⎡

−

−

=

iiT

ii

i

yy

yy

yQ...

1

y de forma análoga para ixQ y iQε .

Haciendo uso de la nomenclatura anterior, el estimador de efectos fijos que se

obtiene al aplicar MCO al modelo transformado es igual a:

∑∑=

−

=⎟⎟⎠

⎞⎜⎜⎝

⎛=

N

iii

N

iiiFE yQxxQx

1

'1

1

'^β (18)

Expresión equivalente a la recogida en (16)3.

En consecuencia, a partir de lo indicado, puede comprobarse como el modelo de

efectos fijos se concentra en las diferencias existentes “dentro” de los individuos. Es

decir, se explica hasta qué punto ity se diferencia de la media temporal de esa variable,

iy y, por tanto, no explica porque iy es diferente de jy .

Si se asume que todas las variables contenidas en itx son independientes de

todos los términos itε , los estimadores de efectos fijos son estimadores insesgados de

β . Si además se impone normalidad para los términos de perturbación itε , los

estimadores de efectos fijos, EF

^β , también siguen una distribución normal, por lo que

puede utilizarse los procedimientos de inferencia habituales. Para consistencia se

requiere:

( ){ } 0=− itiit xxE ε (19)

3 Este tipo de estimador es también equivalente al que se obtiene al transformar el modelo en primeras diferencias y después aplicar MCG para corregir el esquema de correlación tipo MA generado en dicha transformación.

18

La condición suficiente para que lo anterior sea cierto es que itx sea

estrictamente exógena, lo cual equivale a que:

{ } 0=isitxE ε para ts,∀ (20)

es decir, que las variables explicativas no dependan ni de valores presentes, ni pasados

ni futuros del término de error.

Esta condición puede resultar muy restrictiva en algunas aplicaciones. Por

ejemplo, excluye la inclusión, como explicativa, de la variable endógena retardada así

como la inclusión de cualquier variable que dependa de la historia de la propia variable

endógena. Un ejemplo de esto último sería el caso de si para explicar la oferta laboral de

un individuo se desea incluir en el modelo los años de experiencia, los cuales dependen

de la propia historia laboral del individuo.

Además, en estas mismas circunstancias (variables explicativas estrictamente

exógenas), los N términos independientes se estiman de forma insesgada como:

FEiii xy^

'^

βα −= Ni ,...,1= (21)

si bien, tales estimadores sólo son consistentes cuando ∞→T .

La matriz de varianzas y covarianzas para los estimadores de efectos fijos FE

^β ,

suponiendo que itε se define de forma idéntica e independiente entre individuos y

tiempo, con varianza 2εσ (es decir, hay homocedasticidad y no autocorrelación), viene

dada por:

( )( )1

1

'21

1 1

'2^

−

=

−

= =⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟

⎠

⎞⎜⎝

⎛−−=

⎭⎬⎫

⎩⎨⎧ ∑∑∑

N

iii

N

i

T

tiitiitFE xQxxxxxV εε σσβ (22)

19

Una estimación consistente de 2εσ se obtiene a partir de la suma de los

cuadrados de los residuos intragrupos dividido entre ( ) KTN −−1 , es decir:

( )

( ) ( ) ( )∑∑

∑∑

= =

= =

⎟⎠⎞

⎜⎝⎛ −−−

−−=

=⎟⎠⎞

⎜⎝⎛ −−

−−=

N

i

T

tFEiitiit

N

i

T

tFEitiit

xxyyKTN

xyKTN

1 1

2^'

1 1

2^'

^2^

11

11

β

βασ ε

(23)

Por último, se debe hacer notar que una formulación alternativa a (11) consiste

en introducir un término independiente medio μ :

ititiit xy εβαμ +++= ' (24)

donde ahora μ y iα son constantes fijas, las cuales no son separadamente identificables

a no ser que se introduzcan restricciones adicionales. Lo habitual es introducir la

restricción 01

=∑=

N

iiα . Entonces el efecto individual iα representa la desviación del

individuo i de la media común μ . El estimador del parámetro β es idéntico al ya

conocido. Los estimadores de μ y iα son, respectivamente:

FExy^

'^

βμ −= ; FEiii xy^

'^^

βμα −−= (25)

donde NT

yy

N

i

T

tit∑∑

= == 1 1 y NT

xx

N

i

T

tit∑∑

= == 1 1

2.2 MODELO DE COMPONENTE DEL ERROR EN DOS DIRECCIONES

20

Como ya se ha indicado, este modelo de efectos fijos es un modelo de regresión

lineal cuyos términos independientes varían entre individuos y tiempo:

itittiitititit xxy εβλαεβα +++=++= '' (26)

En este caso, para obtener los estimadores de efectos fijos, se debe llevar a cabo

una transformación diferente de tal forma que desaparezcan tanto los efectos

individuales iα como los temporales tλ . En este caso, los estimadores resultantes son

los que resultan de aplicar MCO a la siguiente ecuación de variables transformadas:

( ) ( ) ( )εεεεβ +−−++−−=+−− tiittiittiit xxxxyyyy ' (27)

donde, como ya se ha definido con anterioridad:

T

yy

T

tit

i

∑== 1 es la media temporal;

NT

yy

N

i

T

tit∑∑

= == 1 1 es la media total;

y N

yy

N

iit

t

∑== 1 es la media por individuos.

Y ahora los estimadores de los efectos iα y tλ vienen dados por:

( ) ( ) EFiii xxyy^'^βα −−−= (28)

( ) ( ) EFttt xxyy^'^βλ −−−=

21

No obstante, para especificar este tipo de modelo se requiere que tanto T como N

sea elevado. En consecuencia, dado que en la mayor parte se trabaja con micropaneles

(N elevado, pero T pequeño) este modelo es escasamente utilizado. En estos casos, lo

que se suele hacer es incorporar al modelo las correspondientes dummies temporales.

3. ENFOQUE INCONDICIONAL: EL ESTIMADOR GLS

Al igual que en el caso del modelo de efectos fijos consideraremos en primer

lugar, el modelo que incorpora, únicamente, la variación entre individuos (modelo de

componente del error en una dirección), dedicando un segundo epígrafe más breve al

modelo de componente del error en dos direcciones.

3.1 MODELO DE COMPONENTE DEL ERROR EN UNA DIRECCIÓN

Tal y como se ha comentado con anterioridad, en el modelo de efectos aleatorios

los efectos individuales iα son tratados como aleatorios y, además se distribuyen de

forma idéntica e independiente entre individuos, es decir:

itiitit xy εαβμ +++= ' , ( )2,0~ εσε IIDit ; ( )2,0~ ασα IIDi (29)

donde μ denota al término independiente; iti εα + es tratado como un término de error

compuesto de dos componentes: un componente específico individual (invariante en el

tiempo) y otro componente que varía entre individuos y en el tiempo y, que se supone

incorrelado temporalmente. Además, se asume que iα y itε son independientes entre sí

e independientes de jsx , para todo j y s .

Ó en términos matriciales: iiiiTiTi vxxy +=+++= +δεαιβμι (29’)

siendo ( ) ( ) ( ) itiitiTiiiTi vvvvxx εαβμδι +====+ y;,...;,;, 1'''

22

En consecuencia, teniendo en cuenta los anteriores supuestos, los estimadores

MCO de los parámetros μ y β (δ ) en la ecuación (29’):

∑∑=

+

−

=

++

⎟⎟⎠

⎞⎜⎜⎝

⎛=

N

iii

N

iii yxxx

1

'

1

1

'^δ (30)

son insesgados y consistentes.

Sin embargo, la estructura de componentes del error implica que el término de

error iti εα + , presenta una forma particular de autocorrelación (a menos que 02 =ασ ).

En efecto, la matriz de varianzas y covarianzas del término de error para el individuo i,

iiTiv εαι += , es igual a:

( )

⎥⎥⎥⎥⎥⎥⎥

⎦

⎤

⎢⎢⎢⎢⎢⎢⎢

⎣

⎡

+

++

=+=Ω=

2222

2222

2222

'22'

......

...

εααα

αεαα

ααεα

αε

σσσσ

σσσσσσσσ

ιισσ TTTii IvvE (31)

NOTA

Una forma muy cómoda de expresar la matriz anterior Ω es la siguiente:

( )T

TT

I

TTTTII

TTTTT

TTTTTTTTTT

'22

'2

'2

'2

'22'22

ιισσιισ

ιισιισιισσιισσ

εαε

εεαεαε

++⎟⎟⎠

⎞⎜⎜⎝

⎛−=

=−++=+=Ω

ya que dadas las propiedades de TT

I TTTTT

''

y ιιιι⎟⎟⎠

⎞⎜⎜⎝

⎛− se cumple que la potencia r de

dicha matriz es igual a:

23

En consecuencia, las desviaciones típicas estimadas por los procedimientos

habituales aplicado para MCO son incorrectas y, se debe de recurrir a estimadores

mínimo cuadráticos generalizados (Generalized Least Square, GLS) para obtener

estimadores más eficientes.

Como en casos análogos, se utiliza la inversa de la matriz Ω para derivar el

estimador GLS de los parámetros de la ecuación (29’):

∑∑=

−+

−

=

+−+ Ω⎟⎟⎠

⎞⎜⎜⎝

⎛Ω=

N

iii

N

iiiGLS yxxx

1

1'

1

1

1'^δ (32)

siendo:

⎥⎦⎤

⎢⎣⎡ +=⎥

⎦

⎤⎢⎣

⎡+⎟

⎠⎞

⎜⎝⎛ −=

=⎥⎥⎦

⎤

⎢⎢⎣

⎡⎟⎟⎠

⎞⎜⎜⎝

⎛+

−−=

=+

+⎟⎟⎠

⎞⎜⎜⎝

⎛−=Ω−

'2

''2

'

22

2

2

'

22

'

21

11111

11

11

TTTTTTT

TTT

TTTTT

TQ

TTI

TTI

TTTI

ιιψσ

ιιψιισ

ιισσ

σσ

ιισσ

ιισ

εε

αε

ε

ε

εαε

con 22

2

αε

ε

σσσψ

T+=

Por último, teniendo en cuenta que Q transforma los datos en desviaciones con

respecto a las medias individuales y que '1TTT

ιι toma medias individuales, el estimador

GLS para los parámetros del modelo pueden escribirse como (ver Hsiao, 2003):

( )( )

( )( ) ⎟⎠

⎞⎜⎝

⎛−−+

⎟⎠

⎞⎜⎝

⎛−−+=

∑∑

∑∑

==

−

==

N

iiii

N

ii

N

iiii

N

iiGLS

yyxxTyQx

xxxxTxQx

1

'

1

'

1

1

'

1

'^

. ψ

ψβ (33)

24

xy GLSGLS

'^^βμ −=

A partir de la expresión anterior, se puede comprobar fácilmente como si 0=ψ

se obtiene el estimador de efectos fijos. Además, dado que 0→ψ si ∞→T , los

estimadores de efectos fijos y aleatorios son equivalentes para valores elevados de T .

Por otra parte, si 1=ψ , el estimador GLS es simplemente el estimador MCO (y Ω es

diagonal).

Por último, destacar que a partir de la especificación anterior, puede derivarse la

siguiente expresión:

( ) FEKBGLS I^^^βββ Δ−+Δ= (34)

donde ( )( ) ( )( )∑∑=

−

=

−−⎟⎠

⎞⎜⎝

⎛−−=

N

iii

N

iiiB yyxxxxxx

1

1

1

'^β es el estimador entre grupos

(between estimator) de β . En otras palabras, este último estimador es el estimador

MCO en un modelo de medias individuales:

iiii xy εαβμ +++= ' Ni ,...,2,1= (35)

y donde Δ es una matriz de ponderaciones, la cual es proporcional a la inversa de la

matriz de covarianzas de B

^β (ver Hsiao, 2003).

En otros términos, puede observarse como el estimador GLS se obtiene como

una media ponderada entre los estimadores “entre” y “dentro” de los grupos (between y

within group estimadores).

El estimador between ignora cualquier información existente dentro de los

individuos. Por tanto, el estimador GLS, bajos las suposiciones existentes, es la

25

combinación óptima entre los dos estimadores y, por tanto, es más eficiente que

cualquiera de ellos4. Concretamente, si las variables explicativas incluidas en (29) son

independientes de todos los términos itε y iα , el estimador GLS es insesgado. Es un

estimador consistente si además de (19), también se cumple que:

{ } 0=itixE ε y { } 0=iixE α (36)

(Observar que las condiciones anteriores son también el requisito para que sea

consistente el estimador between).

Una forma sencilla de calcular el estimador GLS consiste en estimar por MCO el

siguiente modelo transformado5:

itiitiit uxxyy +⎥⎦⎤

⎢⎣⎡ ⎟

⎠⎞⎜

⎝⎛ −−+⎥⎦

⎤⎢⎣⎡

⎟⎠⎞⎜

⎝⎛ ⎟

⎠⎞⎜

⎝⎛ −−=⎥⎦

⎤⎢⎣⎡ ⎟

⎠⎞⎜

⎝⎛ −− βψψμψ

'2

12

12

11111 (37)

donde uit es un término de perturbación aleatorio que carece de autocorrelación. De

nuevo, observar que si 0=ψ , se obtiene el estimador entre grupos o estimador within y

si 1=ψ , el estimador MCO.

Finalmente, indicar que como es habitual los componentes de la varianza 2ασ y

2εσ son desconocidos en la práctica. En consecuencia, tras estimar dichos términos en

una primera etapa, se derivan, en una segunda etapa, los estimadores GLS factibles. El

estimador de 2εσ se obtiene fácilmente a partir de los residuos de la regresión dentro de

grupos (within), tal y como se muestra en la expresión (23). Por último, un estimador

4 El estimador MCO (obtenido con 1=ψ ) es también una combinación lineal de los dos estimadores, pero no la eficiente.

5 Lógicamente, a este modelo se llega obteniendo la matriz R, tal que RR '2

1 1

εσ=Ω− , la cual es igual a

⎟⎠⎞

⎜⎝⎛

⎟⎠⎞⎜

⎝⎛ −−=Ω

− '21

21 11 TTT T

I ιιψσ ε , y premultiplicando el modelo original (29’) por dicha matriz.

26

consistente de 2ασ se obtiene teniendo en cuenta que la varianza del error de la regresión

entre grupos (between) es igual a 22 1εα σσ

T+ , la cual puede estimarse consistentemente

como:

( ) ∑=

⎟⎠⎞

⎜⎝⎛ −−

+−=

N

iBiBiB xy

KN 1

2^'^2^

11 βμσ (38)

donde B

^μ es el estimador between para μ . En consecuencia:

2^2^2^ 1εα σσσ

TB −= (39)

Al estimador GLS Factible (mínimo cuadrático generalizado factible) se le

conoce como estimadores de efectos aleatorios (random effects estimator) para β y μ

y, se denota como RE

^β .

Bajo ciertas condiciones de regularidad débil, el estimador de efectos aleatorios

es asintóticamente normal y, su matriz de varianzas y covarianzas viene dada por la

siguiente expresión:

( )( )1

1

'

1

'2^

−

==

⎟⎠

⎞⎜⎝

⎛−−+=

⎭⎬⎫

⎩⎨⎧ ∑∑

N

iiii

N

iiRE xxxxTxQxV ψσβ ε (40)

que muestra como el estimador de efectos aleatorios es más eficiente que el de efectos

fijos si se cumple que 0>ψ . La ganancia en eficiencia es debida a la utilización de la

variación entre grupos ( )xxi − .

En resumen, hasta el momento presente, hemos presentado una serie de

estimadores del vector de parámetros β . Los básicos son dos: el estimador entre

grupos (o between) y el estimador de efectos fijos (o within). Los otros dos estimadores

son el estimador MCO y el de efectos aleatorios. Ambos explotan las dos dimensiones

27

de los datos (between y within), pero mientras que el primero lo hace de forma

ineficiente, el segundo lo realiza de forma eficiente.

3.2 MODELO DE COMPONENTE DEL ERROR EN DOS DIRECCIONES

De forma análoga a lo comentado para el caso del modelo de efectos fijos, en

este caso se trata de incorporar los efectos temporales tλ , pero también con la

característica de ser considerados de naturaleza aleatoria, distribuidos de forma idéntica

e independiente:

ittiititititit xxy ελαβμεαβμ ++++=+++= ''

(41)

( )2,0~ ασα IIDi ; ( )2,0~ λσλ IIDt ; ( )2,0~ εσε IIDit

Además, igualmente se asume que iα , tλ y itε son independientes entre sí e

independientes de jsx , para todo j y s .

A partir de aquí puede seguirse un proceso análogo al anterior, aunque más

complejo. (Vease Baltagi, 2001, por ejemplo). En cualquier caso, la estrategia más

sencilla es aplicar MCO al modelo original transformado mediante la premultiplicación

de las distintas variables por la correspondiente matriz R. Dicha transformación es la

siguiente (lo ilustro para la variable dependiente, sería análogo para el resto):

( )yyyyy tiitit 321* θθθ +−−= (42)

siendo 221 1εα

ε

σσσθ

+−=

T;

222 1ελ

ε

σσσθ

+−=

N

1222213 −

++++=

ελα

ε

σσσσθθθNT

28

Sin embargo, como ya se comentó con anterioridad, para especificar este tipo de

modelo se requiere que tanto T como N sea elevado. En consecuencia, dado que en la

mayor parte se trabaja con micropaneles (N elevado, pero T pequeño) este modelo es

escasamente utilizado. Como se comentó con anterioridad, lo que se suele hacer es

incorporar al modelo las correspondientes dummies temporales.

4. ANÁLISIS DE ESPECIFICACIÓN

Tanto el modelo de efectos fijos como el de efectos aleatorios asumen que itε es

incorrelado entre individuos y en el tiempo (no autocorrelación). Sin embargo, como en

el caso de los modelos de regresión conocidos, si tal supuesto no se cumple, aunque los

estimadores estándares siguen siendo consistentes, se invalida la inferencia realizada a

partir de los tradicionales contrastes. Además, los estimadores dejan de ser eficientes.

Además, de forma extensiva, la presencia de heteroscedasticidad en itε (o, para los

modelos de efectos aleatorios en iα ) tiene efectos análogos. Como consecuencia de las

implicaciones señaladas es importante asegurarse de que nuestro modelo no presenta

ninguno de los dos problemas indicados, es decir, ni problema de autocorrelación ni de

heteroscedasticidad.

4.1 MODELO DE EFECTOS FIJOS

En el caso del modelo de efectos fijos, los contrastes son sencillos, dado que es

básicamente un modelo estimado por MCO. Un contraste bastante simple de

autocorrelación en el modelo de efectos fijos está basado en el contraste de Durbin-

Watson (DW). En consecuencia, se contrasta la hipótesis nula de no autocorrelación

29

frente a hipótesis alternativa que el término de perturbación para cada individuo sigue

un esquema AR(1), es decir:

ittiit υρεε += −1, (43)

donde itυ se encuentra idéntica e independientemente distribuido entre individuos y

tiempo.

En consecuencia, se contrasta autocorrelación en el tiempo con la restricción de

que todos los individuos tienen el mismo coeficiente de autocorrelación ρ .

Lógicamente, la hipótesis nula se plantea como 0:0 =ρH , frente a la alternativa de una

cola 0<ρ o 0>ρ .

La generalización del estadístico de Durbin-Watson al caso que nos ocupa fue

propuesta por Bhargava, Franzini y Narendranathan (1982) y, sigue la siguiente

expresión:

∑∑

∑∑

= =

= =

− ⎟⎠⎞

⎜⎝⎛ −

= N

i

T

tit

N

i

T

ttiit

pdw

1 1

2^

1 2

2

1,

^^

ε

εε (44)

donde it

^ε son los residuos de la regresión within.

En este caso, los anteriores autores también derivaron los puntos críticos que,

lógicamente, ahora dependen de los valores de N , T y K . Además, al contrario que en

el caso de series temporales, las zonas de indeterminación para el estadístico de DW

para datos de panel son muy pequeñas, particularmente cuando el número de individuos

en el panel es elevado.

30

De forma análoga, para contrastar heteroscedasticidad en el término de

perturbación itε , se puede utilizar también la serie de residuos de efectos fijos it

^ε para

calcular el contraste de tipo de multiplicadores de Lagrange desarrollado por Breusch-

Pagan. Lógicamente, se contrasta la hipótesis nula de homocedasticidad frente a la

alternativa de que

{ } ( )ασε '2itit zhV = (45)

donde h es una función continuamente diferenciable, desconocida y, que al evaluarla en

0 se obtiene la unidad, ( ) 10 =h . Este último requisito permite que la hipótesis nula se

plantee como 0:0 =αH .

El estadístico de prueba se construye a partir de los resultados de la estimación

de una regresión auxiliar que regresa el cuadrado de los residuos de la estimación de

efectos fijos (o residuos within), 2^

itε , sobre una constante y sobre las J variables itz

que consideramos que pueden estar generando el problema de heteroscedasticidad. Bajo

la hipótesis nula, el estadístico de Breusch-Pagan se calcula como ( )1−TN veces el 2R

de la anterior regresión auxiliar y, se distribuye asintóticamente como una distribución 2χ con J grados de libertad.

No obstante, para este tipo de modelos (modelos de efectos fijos), una estrategia

muy utilizada consiste en utilizar la propuesta de Arellano (1987) consistente en utilizar

la corrección de White que permite obtener una estimación de la matriz de varianzas y

covarianzas asintótica de los estimadores within-groups robusta tanto ante problemas de

heteroscedasticidad y correlación serial de cualquier tipo, para valores fijos de T y N

grande (caso más habitual) que viene dada por la siguiente expresión:

1

1

'

1

^'

^'

1

1

'^^

−

==

−

=⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛=

⎭⎬⎫

⎩⎨⎧ ∑∑∑

N

iii

N

iiiii

N

iiiEF xQxxQQxxQxV εεβ (43)

31

donde FEiii xQyQ^^βε −= son los residuos del modelo within estimado.

No obstante, si uno desea realizar supuestos acerca de ciertas formas de

heterocedasticidad o autocorrelación, es posible derivar estimadores más eficientes

explotando la estructura de covarianzas del error a través del estimador MCGF,

exactamente igual que en los modelos conocidos.

4.2 MODELO DE EFECTOS ALEATORIOS

La mayoría de los contrastes que permiten contrastar los supuestos de

homocedasticidad y no autocorrelación en el marco de modelos de efectos aleatorios

son complicados de realizar. No obstante, como el estimador de efectos fijos es

consistente incluso cuando realizamos el supuesto de que iα se encuentra idéntica e

independientemente distribuido y es independiente de las variables explicativas, los

contrastes para el modelo de efectos fijos pueden ser también utilizados en el caso de

los modelos de efectos aleatorios.

No obstante, la solución en estos casos viene por la estimación por MCGF tras

haber adoptado una forma específica para la matriz de varianzas y covarianzas. Veamos

los casos más generales.

Con respecto a la heterocedasticidad, en estos modelos puede aparecer porque la

varianza de iα varía con i (en consecuencia hemos de hablar de i2ασ en vez de 2

ασ ) o

porque la varianza de itε varía con i (en consecuencia hemos de hablar de 2iεσ en vez de

2εσ ) o ambos a la vez. En consecuencia la matriz de varianzas y covarianzas del término

de perturbación es ahora:

32

( ) iTTTii iiIvvE Ω=+= '22' ιισσ αε (44)

Y la matriz inversa, 1−Ωi , sigue la expresión (32), sin mas que sustituir 2ασ y 2

εσ

por i

2ασ y 2

iεσ , respectivamente. Igualmente, el estimador GLS de δ se obtiene al

sustituir 1−Ω por 1−Ωi , en dicha ecuación. Lógicamente, reemplazando 2iασ y 2

iεσ

(valores desconocidos) por sus estimaciones, se obtiene el estimador GLS Factible, o en

dos etapas.

La estimación de 2iεσ puede efectuarse a partir de la estimación de la estimación

within. La varianza total puede estimarse a través de los residuos MCO ^

itv :

∑=

−

⎟⎟⎟

⎠

⎞

⎜⎜⎜

⎝

⎛−

−=

T

tiitiv vv

T 1

2^^2^

11σ obtenidos a partir de la estimación (30). A partir de aquí, se

puede obtener la estimación para i2ασ como:

2^2^2^

iivi εα σσσ −= .

En el caso de autocorrelación se procede de forma análoga. Tomaremos un

esquema de autorrelación tipo AR(1) como ejemplo. Es decir, supongamos que en el

modelo de efectos aleatorios en una dirección expresado en (29):

itiitit xy εαβμ +++= ' , ( )2,0~ εσε IIDit ; ( )2,0~ ασα IIDi (45)

Ó en términos matriciales:

iiiiTiTi vxxy +=+++= +δεαιβμι (46)

el término de perturbación itε deja de ser independiente y sigue el siguiente proceso

AR(1):

33

ititit u+= −1ρεε (47)

donde itu se distribuye de forma idéntica e independiente con media cero y varianza

u2σ .

La estimación de dicho modelo por MCG se basa en idénticos supuestos que los

de cualquier otro tipo de especificación que presenta un problema de autocorrelación

AR(1). Teniendo en cuenta que el modelo transformado mediante la expresión:

( ) ( ) itiitititit uxxyy +−+−+−=− −− αρβρρμρ 1)1( '11 (48)

presenta una perturbación ruido blanco, se puede efectuar un procedimiento iterativo del

tipo propuesto por Cochrane-Orcutt consistente, como se recordará, básicamente en lo

siguiente. La primera etapa comienza con la estimación de ρ utilizando la ecuación

(47) y los residuos de la regresión within. A continuación, se estima por MCO la

regresión (48) resultante tras utilizar el valor de ρ estimado, obteniendo un vector

inicial de estimadores. En una segunda etapa, se obtienen unos nuevos residuos within,

a partir de tales estimadores, con los que se repite el proceso. Así sucesivamente, hasta

que se alcance la convergencia.

TEMA 4. DATOS PANEL. MODELOS ESTÁTICOS

Documents

Transcript of TEMA 4. DATOS PANEL. MODELOS ESTÁTICOS