Ch1- Introduccion a La Econometria

73

Click here to load reader

description

introduccion a la econometria

Transcript of Ch1- Introduccion a La Econometria

  • CURSO SOBRE MODELOS ECONOMTRICOS Y PRONSTICO

    Oruro, mayo de 2012

    Julio Humrez Quiroz

    Cmara de Comercio de Oruro

  • CURSO SOBRE MODELOS ECONOMTRICOS Y PRONSTICO

    2

    1. Introduccin a la Econometra: Especificacin interpretacin inferencia - verificacin de supuestos - variables ficticias

    2. Contrastes de races unitarias: Tests convencionales - tests endatos con quiebre estructural - tests de raz unitaria en frecuenciaestacional

    3. Pronsticos con modelos univariados: ARIMASARIMA yFunciones de Transferencia

    4. Pronsticos con modelos multivariados: Modelos VAR(Vectores Autorregresivos) - Cointegracin y Modelos deCorreccin de Errores

    CONTENIDO DEL CURSO

  • Cap. 1 Introduccin a la Econometra

    3

    1. Nociones preliminares

    a. Variables aleatorias

    b. Relaciones entre variables

    c. Estadsticos y parmetros

    d. Estimacin de parmetros

    e. Test de hiptesis

    2. Modelo de Regresin Lineal Mltiple

    a. Supuestos

    b. Estimacin por MCO

    c. Propiedades estadsticas de los estimadores MCO

    CONTENIDO

  • 4d. Bondad de ajuste

    e. Inferencia en el MRLM

    f. Verificacin de supuestos

    g. Uso de variables ficticias

    3. Regresin lineal a pedazos (Piecewise Linear Regression)

    Cap. 1 Introduccin a la Econometra

    CONTENIDO

  • NOCIONES PRELIMINARES

    5

    Variables aleatorias

    Discretas: Puede tomar ciertos valores (generalmente valores enteros) dentro de

    un determinado intervalo.

    Puede ser de tipo cuantitativa o cualitativa. Caso especial: variables dicotmicas o del tipo 0 y 1.Continuas: Siempre son de tipo cuantitativa. Puede tomar cualquier valor dentro de un determinado intervalo.

    Es una funcin que mapea del conjunto espacio muestral al conjunto de nmeros reales.

  • NOCIONES PRELIMINARES

    6

    Caractersticas de las variables aleatorias

    Asociado a cada variable aleatoria X existe una funcin f(x) llamada funcin de probabilidad, que determina la probabilidad de ocurrencia de los valores posibles de la variable aleatoria.

    Esperanza Matemtica de X: La esperanza matemtica de una variable aleatoria X es un promedio ponderado de sus valores posibles, donde las ponderaciones corresponde a las probabilidades de ocurrencia de cada valor de X. Se denota por E(X).

    Varianza de X: Es una medida de la dispersin (o variabilidad) de los valores posibles de X.

    2( ) [ - ( )]Var X E X E X

  • NOCIONES PRELIMINARES

    7

    Relaciones entre variables

    La covarianza es til en identificar el sentido de la asociacin entre las variables X e Y pero tiene un serio problema: el resultado numrico depende de la escala en que estn medidas las variables.

    Para evitar esta dependencia de las unidades de medida se usa el coeficiente de correlacin. Este indicador conserva el signo de la covarianza y es una medida que siempre vara entre 1 y -1.

    El signo de la covarianza y del coeficiente de correlacin indica el sentido de la relacin entre las variables.

  • NOCIONES PRELIMINARES

    8

    Es posible que el coeficiente de correlacin sea cero, en ese caso decimos que X e Y no estn correlacionadas.

    Se puede demostrar que el coeficiente de correlacin es igual a 1en valor absoluto si y solo si existe una relacin lineal exacta entre X e Y en cuyo caso diremos que estas variables estn perfectamente correlacionadas.

  • NOCIONES PRELIMINARES

    9

    Estadsticos y parmetros

    Un estadstico es una funcin que depende de los datos muestrales. Cuando se calcula un estadstico, hay que tener presente que est

    sometido a la variabilidad muestral, a diferencia de un parmetroque es constante.

    Los estimadores que veremos a lo largo de esta capacitacin son estadsticos, y analizaremos sus propiedades a travs del muestreo.

  • NOCIONES PRELIMINARES

    10

    Estimacin de parmetros A simple vista puede parecer razonable pensar que una propiedad

    deseable de las estimaciones es que, en promedio, sean igual o al menos parecidas al verdadero (desconocido) parmetro. De la misma manera, tambin parece deseable que el error (estndar) sea lo ms pequeo posible.

    En efecto, la precisin de un estimador de un parmetro desconocido se evala en trminos de estas dos caractersticas.

    Sesgo: El sesgo de un estimador se define como la diferencia entre la media de los valores posibles del estimador (a travs de todas las muestras posibles) y el verdadero valor del parmetro desconocido:

    ( ) [ ( ) ] sesgo E

  • NOCIONES PRELIMINARES

    11

    Un estimador es insesgado si el sesgo es igual a cero. En otras palabras, un estimador es insesgado si la media de su

    distribucin muestral es igual al valor del parmetro que se desea estimar.

    Error Cuadrtico Medio (ECM): se define como la media de las diferencias entre cada valor posible del estimador (a travs de las posibles muestras) y el valor del parmetro, elevadas al cuadrado:

    La diferencia entre el ECM de un estimador y su varianza radica en la presencia (o no) de sesgo.

    2 ( ) [ ] ECM E

    2 ( ) ( ) [ ( ) ] ECM VAR ESesgo

  • NOCIONES PRELIMINARES

    12

    Estimacin de parmetros

    Generalmente se habla de lo deseable que es usar diseos muestrales que produzcan estimaciones vlidas y confiables, por lo tanto es preciso definir que significan estos trminos.

    Confiabilidad: se refiere a cuan reproducible es un estimador si se repite el procedimiento muestral. Asumiendo que no hay errores de medicin, puede analizarse en base a la varianza muestral del estimador.

    Validez: se refiere a cunto difiere la media de un estimador, en repeticiones del procedimiento de muestreo y estimacin, respecto del parmetro que esta siendo estimado. Asumiendo que no hay errores de medicin, puede evaluarse por medio del sesgo del estimador.

    Precisin: se refiere a cuan lejos se encuentra una estimacin particular del verdadero valor poblacional, puede analizarse en base al ECM del estimador.

  • NOCIONES PRELIMINARES

    13

    El trmino estimador se utiliza para referirse a la frmula que nos da un valor numrico del parmetro de inters.

    El valor numrico que se obtiene a partir de una muestra particular se denomina estimacin.

    Tres de los mtodos ms comunes de estimacin son los siguientes: El Mtodo de los Momentos

    El Mtodo de Mnimos Cuadrados Ordinarios.

    El Mtodo de Mxima Verosimilitud

    Dado que existen diversos mtodos de estimacin, Cul es el mejor estimador?. Depende de las propiedades de cada estimador.

  • NOCIONES PRELIMINARES

    14

    Es posible analizar las caractersticas de los estimadores considerando sus propiedades para un tamao de muestra dado o bien de manera asinttica. Las preguntas relevantes son:

    El estimador es insesgado?

    El estimador es eficiente?

    Cul de los estimadores presenta un ECM ms pequeo?

  • NOCIONES PRELIMINARES

    15

    Test de hipotesis

    Un procedimiento muy habitual es la realizacin de test de hiptesis para responder preguntas acerca de los parmetros desconocidos. En trminos generales, los pasos bsicos para testear hiptesis son:

    Formular dos hiptesis opuestas.

    Derivar un test estadstico e identificar su comportamiento probabilstico (distribucin muestral).

    Derivar una regla de decisin y elegir una de las dos hiptesis opuestas en base a la evidencia de una muestra.

    El primer paso consiste en formular dos hiptesis opuestas, que denominaremos hipteses nula (H0) e hipteses alternativa (H1), respectivamente.

  • NOCIONES PRELIMINARES

    16

    Un test estadstico es una regla de decisin, basada en la informacin proveniente de una muestra para elegir entre dos resultados posibles: rechazar / no rechazar H0.

    Se calcula un test estadstico T(x1,,xn) a partir de la muestra de observaciones.

    Conociendo la distribucin de T bajo H0 y en base al valor calculado de T para la muestra se toma una decisin entre las dos posibilidades anteriores.

    El rango de valores de T para los cuales el procedimiento del test recomienda rechazar H0 se denomina regin critica y el rango donde se recomienda no rechazar H0 se denomina regin de no rechazo (regin de aceptacin?).

  • NOCIONES PRELIMINARES

    17

    Para cualquier tipo de test hay 3 resultados posibles: se toma una decisin correcta, es decir se rechaza una hiptesis

    falsa o no se rechaza una hiptesis verdadera.

    se rechaza una hiptesis verdadera.

    no se rechaza una hiptesis falsa.

    El error que se comete al de rechazar H0 cuando es verdadera se denomina Error de Tipo I.

    El error de no rechazar H0 cuando es falsa se denomina Error de Tipo II.

  • NOCIONES PRELIMINARES

    18

    Asociados a cada uno de estos errores hay una probabilidad que indicamos como P(Error Tipo I ) y P(Error Tipo II ). Idealmente, desearamos minimizar la probabilidad de cometer ambos errores pero esto no es posible. Lo habitual es determinar la mxima probabilidad de Error Tipo I que estamos dispuestos a tolerar y derivar una regla de decisin que permita minimizar la probabilidad de Error Tipo II.

    La probabilidad mxima de Error Tipo I cuando H0 es verdadera se denomina nivel de significacin y generalmente se lo expresa con la letra .

    La probabilidad de rechazar H0 cuando es falsa est dada por 1- P(Error Tipo II ) y se llama poder del test.

    En la prctica el procedimiento es encontrar una regla de decisin de mxima potencia sujeto a la restriccin que P(eI ) , donde es constante, generalmente fijado en los valores: 0.10, 0.05 o 0.01.

  • Modelo de Regresin Mltiple

    12 13 11 1 1

    22 23 22 2 2

    32 33 33 3 3

    2 3

    111

    1

    k

    k

    k

    T T TkT K T

    X X XYX X XYX X XY

    X X XY

    1 2 2 3 3 ... ; 1,...,t t t k tk tY X X X t T 1 2 2 3 3 ... ; 1,...,t t t k tk tY X X X t T

    ( 1) ( ) ( 1) ( 1) T T K K TY X 19

    El Modelo de Regresin Simple se puede usar para estudiar la relacin entre 2 variables.

    En general, gran parte del anlisis economtrico empieza con un anunciodel siguiente estilo: X e Y son dos variables que representan alguna poblacin y estamos interesados en explicar Y en funcin de X, o bien estamos interesados en estudiar como vara Y ante cambios en X.

  • 6. Rango(X) = K

    7. E(t, Xit) = 08.

    (Estimacin MCO)

    (Inferencia)2~ (0, ) t Ni, t

    5. E(2t) = 2 (Homocedsticidad)

    20

    Supuestos:

    1. Relacin lineal entre Yt y Xit, i=1,2,...,K

    2. Xit , i=2,...,K

    3. E(t) = 04. E(t, t-s) = 0 (ausencia de autocorrelacin)

    t(Regresores no estocsticos)

    0s

    Modelo de Regresin Mltiple

  • Estimacin por MCO

    Yt

    Xt

    (10, 23)(Xt,Yt)

    (Xt, )tY

    Xt=10

    t t te Y Y

    1 2

    = 1,5 2t t

    t

    Y XX

    21

    Modelo de Regresin Mltiple

  • )1kx(k

    2

    1

    22

    2222

    2

    '

    tkttktk

    tkttt

    tkt

    XXXX

    XXXXXXT

    XX

    tkt

    tt

    t

    XY

    XYY

    YX 2'

    Donde:

    Entonces, el modelo estimado es:

    0 ( )i

    Q CNPO

    ( ) X X X Y (Sist. Ec. Normales)1 ( ' ) 'X X X Y

    1 2 2 3 3 ...t t k tkY X X X X 22

    Modelo de Regresin Mltiple

  • Propiedades estadsticas del estimador MCO

    1. Linealidad: El estimador es una funcin lineal de las observaciones de Yt.

    2. Insesgamiento:

    3. Eficiencia:

    1 ( ' ) 'X X X Y AY

    ( )E

    Teorema de Gauss-Markov : El estimador MCO es de mnima varianza.

    Conjunto estimadores lineales e insesgados

    *( ) ( ) V V

    23

  • 4. Consistencia:

    5. Distribucin muestral:

    Para el vector de parmetros:

    Para un parmetro individual:

    donde 2ajj es el elemento j-simo de la diagonal de 2 1( ) X X

    2 1 ~ ( , ( ) )N X X

    2 ~ ( , ) j j jjN a

    6. Matriz de var-cov: 2 1 2 ( ) ( ) , e eVar X X

    T k

    lim( )P

    11 12 1 2

    1

    ( ) ( )k

    k kk

    a aVar X X

    a a

    24

    Propiedades estadsticas del estimador MCO

  • Bondad de ajuste

    22

    2 2

    ' '1' '

    X Y TY e eRY Y TY Y Y TY

    b -= = -- -

    2 2 2 1(1 ) KR R RT K

    - = - - -

    0 R2 1

    Yt

    Xt

    1 2 t tY X

    Yt

    Xt

    1 2 t tY XYt

    Xt

    1 2 t tY X

    R2 = 1

    0 < R2 < 1

    R2 = 0

    25

    R2 = SCE/SCT = 1- SCR/SCT

  • Inferencia en el MRLM

    Nos interesa verificar si las observaciones muestrales son compatibles con una determinada hiptesis / afirmacin. Por ej.

    Para eso desarrollamos un procedimiento que nos permita decidir si se rechaza o no esa hiptesis en base a la informacin muestral.

    El enfoque ms utilizado es la Prueba de significancia.

    (Prueba de dos colas)0 :

    :

    i

    a i

    HH

    bb

    26

  • Enfoque de prueba de significancia

    .22 .24 .26 .28 .30 .32 .34 .36 .38 .40 .42 .44 .46 .48

    El procedimiento se basa en utilizar un estimador y su distribucin, suponiendo que sta se cumple bajo Ho.

    Se sabe que entonces bajo Ho: ( )

    ~

    i

    iiT kt ( )

    ~b

    i

    iT kt

    La distribucin del estadstico se divide en dos regiones: regin de no rechaza y regin crtica (regin de rechazo).

    /2

    -tc tc

    Bajo Ho:

    No rechazo Ho(1 - )

    Si | t | > | tc | Rechazamos Ho

    ( )

    ~

    i

    iT kt

    b

    /2

    Zona de rechazoZona de rechazo

    27

    Inferencia en el MRLM

    /2 /2

  • Valor-p

    O nivel de significancia emprico del contraste, es el dato obtenido a partir del valor del estadstico del contraste estimado a partir de una muestra y nos informa sobre cul sera el nivel de significancia () ms pequeo que nos hubiera permitido rechazar la H0.

    Si p < (5%), rechazamos HoSI p > (5%), No rechazamos Ho

    Cuanto ms pequeo es valor-p mayor la evidencia en contra de H0.

    28

    Inferencia en el MRLM

  • Significancia conjunta de los parmetros

    Ho: 2 = 3= ...= k = 0Ha: 2 0 ,..., k 0

    a) SCE/2 ~2(k-1)b) e'e/ 2 = SCR/ 2 ~ 2(T- k)c) (a) y (b) son independientes

    (Todos los parmetros pendiente son iguales a cero)

    (Algn parmetro es distinto de cero)

    F()

    No rechazo Ho(1 - )|

    Si valor-p(F) < , RHo2

    ( 1, )2

    /( )1 ~

    / ( 1)

    K T K

    SCET K SCEKF F

    SCR K SCRT K Zona de rechazo

    29

    Inferencia en el MRLM

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0 1 2 3 4 5 6

  • a) Significancia individual

    Ho: 2 = 0 Vs. Ha: 2 0 b) Hiptesis terica (Rendimientos constantes a escala)

    Ho: 2 + 3 = 1 Vs. Ha: 2 + 3 1 c) Significancia conjunta

    Ho: 2 = 3 = 0 Vs. Ha: 2 0, 3 0

    Tests de restricciones lineales

    Sea el modelo: (Funcin de Prod.)1 2 2 3 3 t t t tY X X

    30

    Inferencia en el MRLM

  • Mediante el clculo de residuos libres y restringidos

    Ho: El modelo con restricciones es correcto

    Ha: El modelo sin restricciones es correcto.

    SCRr = suma de cuadrados de los residuos del modelo con restricciones.

    SCRn = suma de cuadrados de los residuos del modelo sin restricciones (libre)

    q = nmero de restricciones.

    Si valor-p(F) < , Rechazamos Ho

    ( ) / ~ ( , )/

    r n

    n

    SCR SCR qF F q T kSCR T k

    31

    Inferencia en el MRLM

  • Distribuciones para tests de diagnstico

    Verificacin de supuestos

    Frecuentemente se dispone de tests: F y 2. El test F requiere de la estimacin de las versiones restringida y no

    restringida de la regresin auxiliar del test y comparar la SCR.

    El test 2 se conoce a veces como el test LM, y tiene solamente un parmetro de grados de libertad: el nmero de restricciones a ser contratado, m.

    Asintticamente, ambos tests son equivalentes dado que la distribucin2 es un caso especial de la distribucin F:

    Para muestras pequeas, es preferible el test F.

    2 , a medida quem F m T k T km

    32

  • -.2

    -.1

    .0

    .1

    .2

    .3

    .4

    .5

    .6

    250 500 750 1000 1250 1500

    E(ut) = 0

    El supuesto dice que la media de las perturbaciones es cero.

    Para todos los tests de diagnstico, no observamos las perturbacionespor lo que aplicamos los contrastes a los residuos de la regresin.

    La media de los residuos siempre ser cero si la regresin incluye al intercepto.

    TRANS = -0.031 + 0.041LOG(TOTEXP) - 5.79910-5AGE - 0.013NK

    16 3.41 10 u

    33

  • Multicolinealidad

    El problema se presenta cuando las variables explicativas no son ortogonales (cuando las variables explicativas estn altamente correlacionadas), lo que impide la identificacin de los efectos de cada Xti sobre Yt.

    Si la multicolinealidad es perfecta rango (X'X)-1 = L < K no se puede estimar .

    Modelo: yt = 1 + 2x2t + 3x3t + 4x4t + utdonde suponemos p.e.. x3 = 2x2

    Si la multicolinealidad es aproximada se pueden estimar los parmetros, pero su precisin disminuye enormemente: var(j)grande:

    Intervalos de confianza muy amplios.

    Los estadsticos-t no son vlidos. 34

  • R2 1 y F grande, pero, t pequeos. Los estimadores de varan enormemente ante cambios pequeos de

    la muestra.

    Signos incorrectos de los parmetros y/o magnitudes de los parmetros inusuales.

    Tests:

    Correr por MCO regresiones para cada una de las variables explicativas en funcin de las restantes variables explicativas.

    1 2 2 1 1, 1 1,... ... t j j t j j t k ktj tt X X X XX0 2 3 1

    j

    : ... 0: algn 0

    k

    a

    HH

    35

    Pautas para detectar el problema:

    Multicolinealidad

  • Y calculamos el estadstico:

    2

    2

    / ( - 2)~ ( - 2, - ( -1))

    (1- ) / ( - ( -1)) jj

    j

    R kF F k T k

    R T k

    Si valor-p(F) < , Rechazamos Ho

    Factor de Inflacin de Varianza (VIF)

    Si VIF > 10 (5), indicios de multicolinealidad

    2

    1( )1

    i iVIF R

    36

    Multicolinealidad

  • Soluciones:

    Aumentar tamao de la muestra: y/o aumentar la frecuencia de los datos.

    Transformar las variables altamente correlacionadas en razones.

    Uso de informacin no muestral: uso de estimacin del parmetro de la variable que causa la multicolinealidad a partir de otra informacin diferente.

    Eliminar la(s) variable(s) explicativa(s) que se supone(n) est(n) correlacionada(s) con otra(s) variable(s) explicativa(s). Sin embargo, este procedimiento puede dar lugar a otro problema mayor, el de especificacin que genera sesgo.

    2

    2( )

    ( )(1 )

    j jt jVar

    T Var X R

    37

    Multicolinealidad

  • Heterocedasticidad

    Incumplimiento del supuesto de la varianza del trmino de error esconstante (Var(t) = 2 t). En este caso Var(t) = 2t , t = 1,2,,T, o loque es lo mismo, la matriz de var-cov tendr valores distintos a lo largode su diagonal principal:

    2 2

    21

    22

    2

    0 00 0

    ( ) ( )

    0 0

    t UU T

    T

    Var u E UU I

    Ejemplos:

    Seccin cruzada: Pautas de consumo en economas domsticas: elerror ser mayor en familias de ingreso ms elevado (un ingreso msalto permite una variabilidad mayor en bienes consumidos y ahorro)

    Series temporales: varianza cambiante en periodos de incertidumbreeconmica.

    38

  • 39

    2te

    jtX

    2te

    jtX

    (Homocedasticidad)

    (Heterocedasticidad)2te

    jtX

    (Heterocedasticidad)

    2te

    -

    tx2

    (Heterocedasticidad)

    Heterocedasticidad

  • Consecuencias de la heterocedasticidad

    Los estimadores MCO continan siendo insesgados, pero ya no sonMELI.

    Esto implica que si continuamos utilizando MCO en presencia deheterocedasticidad, los errores estndar seran inapropiados y por lotanto cualquier inferencia que realicemos sera erroneo.

    Si los errores estndar estimados son muy pequeos o muy grandes,depender de la forma de la heterocedasticidad.

    40

    Heterocedasticidad

  • Contraste de White

    c) Bajo Ho, TR2 ~2(m) (m = N de regresores de la regresin auxiliar).

    Es uno de las tcnicas ms comunes para determinar la presencia de heterocedasticidad.

    Pasos:a) Estimar por MCO el modelo original y obtener los residuos

    b) Estimar por MCO:

    Otros contrastes:

    Park, Glejser, Golfeld Quandt, Breush-Pagan, ARCH

    t2 2

    0t j j jl j i j j tj j l j

    X X X X

    0 : los coeficientes pendiente son conjuntamente nulosH

    0 : algn coeficiente pendiente es distinto de ceroH

    41

    Heterocedasticidad

  • Solucin Transformar el modelo de modelo que el nuevo modelo sea

    homocedstico. Mnimos Cuadrados Ponderados consiste en dividir las variables del modelo por la desviacin tpica de las perturbaciones; de esa manera se asigna una mayor ponderacin a aquellas observaciones cuya varianza sea menor.

    21 2

    1 ... t i ik t

    ki i i i i

    Y X X

    El modelo transformado se expresa como

    * * * * *1 2 2 3 3 ... t t t k tk tY X X X

    Limitacin: debemos conocer la desviacin estndar de las perturbaciones. Ej. 2 2 i tjkX 42

    Heterocedasticidad

  • Otras aproximaciones para tratar la heterocedasticidad

    Otras soluciones incluyen a:1. Transformacin de las variables en logaritmos o reducir mediante

    alguna medida de tamao.

    2. Utilizar las estimaciones de los errores estndar robustos a laheterocedasticidad de White.

    El efecto de usar la correccin de White es que aumentan los erroresestndar de los coeficientes pendiente en relacin a los erroresestndar MCO.

    Esto hace que los tests de hiptesis sean ms conservadores, demodo que podramos requerir ms evidencia en contra de la hiptesisnula antes de rechazar la misma.

    43

    Heterocedasticidad

  • Autocorrelacin

    Las perturbaciones del modelo estn correlacionadas consigo misma en diferentes momentos del tiempo: Cov(t, s) 0, t s

    +

    -

    -

    tu

    +1 tu

    +

    -

    Time

    tu

    Autocorrelacin positiva se caracteriza por el comportamiento cclico a travs del tiempo.

    44

  • +

    -

    -

    tu

    +1 tu

    +

    -

    tu

    Time

    +tu

    -

    -

    +

    1 tu

    +tu

    Autocorrelacin negativa

    Ausencia de autocorrelacin

    45

    Autocorrelacin

  • Ho: DW = 2

    Ha: DW 2

    0 4LI 4 - LS

    ? ?

    LS 4 - LI

    No existe Autocorrel.

    = 0 DW 2

    = +1 DW 0

    = -1 DW 4

    DW

    Estadstico de Durbin-WatsonModelo: 1 2 2 3 3 ...t t t tk tkY X X X 1 t t t

    21

    2

    2

    1

    ( )2(1

    )

    T

    t tt

    T

    tt

    DWEstadstico de contraste:

    462

    Autocorrelacin

    A-A+

  • a) Estimar el modelo y obtener los residuos estimados

    b) Regresin auxiliar:

    c) TR2 ~ 2(p), donde p es nmero de rezagos de las perturbaciones.El estadstico t del coeficiente del residuo rezagado tambin es un contraste vlido.

    Test de Breusch Godfrey (test LM)

    t

    Solucin:

    MCG: transformar las variables para que incluyan la estructura de autocorrelacin y los nuevos errores cumplan Cov(*t, *s)=0, t s

    0 t j j j t j tj j

    X

    47

    Autocorrelacin

  • Si el coeficiente se conoce, una forma de implementar el mtodoMCG es mediante la metodologa de Cochrane-Orcutt.

    Este procedimiento para corregir la autocorrelacin requiere unsupuesto acerca de la forma de autocorrelacin.

    Si este supuesto es invlido, el remedio puede ser ms peligroso quela enfermedad (Hendry and Mizon, 1978).

    Sin embargo, es poco probable que se conozca la forma deautocorrelacin, por lo que un enfoque ms moderno es que laautocorrelacin representa una oportunidad para mejorar la regresin.

    48

    Autocorrelacin

  • Especificacin

    Es un test general para los siguientes tipos de errores de especificacin:

    Variables omitidas

    Forma funcional incorrecta

    Correlacin entre X y (debido a errores de medida en X, sesgo de simultaneidad, combinacin de yt-j y errores autocorrelacionados).

    Test RESET de Ramsey

    Uno de los supuestos de la regresin clsica es forma funcionallineal, supuesto que no siempre se cumple.

    49

  • Ho: ~ N(0, 2I)Ha: ~ N(, 2I), 0

    Ecuacin auxiliar: y = X + + ,

    (Especificacin correcta del modelo)

    (Especificacin incorrecta)

    my

    Ho: = 0

    En muestra pequeas se prefiere el test F.

    m=1,2

    (Modelo correctamente especificado)

    En esencia, el mtodo trabajo aadiendo trminos de valorespredichos de orden (i.e., ) mayor en la regresin auxiliar. , y yt t2 3

    Si el valor del estadstico TR2 es mayor que se rechaza Ho y la forma funcional es correcta.

    2 1( )p

    50

    Especificacin

  • El test RESET no da una gua respecto la mejor especificacin.

    Una posible causa del rechazo de Ho es cuando el verdadero modeloes:

    En este caso la solucin es obvia.

    Otra posibilidad es transformar los datos en logaritmos; estotransforma los modelos multiplicativos en modelos aditivos.

    ttttt uxxxy 324223221

    ln lntut t t t ty Ax e y x u

    51

    Especificacin

  • f(x)

    x

    Normalidad

    3

    31

    ( )1AT

    Tt

    t

    X X

    T

    1t4

    4t )XX(

    T1K

    N(0,2I)Asimetra: A=0

    Curtosis: K=3

    x

    f(x)

    Distribucin normal

    Distribucin asimtrica

    52

    Estadstico Jarque-Bera

  • donde:

    T = tamao de la muestra.

    k = nmero de parmetros estimados

    A = coeficiente de asimetra.

    K = coeficiente de apuntamiento (Curtosis)

    Ho: Normalidad

    Ha: Distribucin distinta a la normal

    22 2

    (2)( 3) ~

    6 4

    T k KJB A

    53

    Normalidad

  • Qu debemos hacer si no encontramos normalidad?

    No es obvio, qu debemos hacer.

    Podramos utilizar un mtodo de estimacin que no requiera delsupuesto de normalidad, pero cules son sus propiedades?

    A menudo la presencia de (pocos) valores extremos llevan a rechazarla Ho de normalidad.

    En este caso una alternativa es utilizar variables dummy pulso,donde sta toma el valor 1 en la fecha en que se observa el valorextremo.

    54

    Normalidad

  • Oct 1987

    +

    -

    Time

    tu

    Creamos una variable dummy pulso: D87M10t = 1 en octubre 1987 y 0 e.o.c.

    Esta variable elimina la observacin en la fecha especificada; pero se requiere de razones tericas para aadir este tipo de variables.

    55

    3 Valor extremo

    Normalidad

  • Omisin de variables importantes o inclusin de variables irrelevantes

    Omisin de variables importantes Consecuencia: Los coeficientes estimados de todas las variables

    sern sesgados e inconsistentes, a menos que la variable excluidaest incorrelacionada con todas las variables incluidas.

    An cuando esta condicin se satisfaga, el estimador del interceptoser sesgado.

    Los errores estndar tambin estarn sesgados.

    Inclusin de una variables irrelevantes Los coeficientes estimados sern insesgados y consistentes, pero

    sern ineficientes.

    56

  • 02,000

    4,000

    6,000

    8,000

    10,000

    1996 1998 2000 2002 2004 2006 2008 2010

    RESERVAS INTERNACIONALES BRUTAS DEL BCB(1996Q1 - 2010Q4)

    9730

    1171

    1 2 322 2

    32

    t t t tY X X

    Estabilidad de Parmetros

    Test de Chow

    321 1 11 2 3 t t t tY X X

    1 2 1 2 1 21 1 2 2, ,...., k kHo: (Estabilidad de parmetros, K restricciones)1 2 1 2 1 21 1 2 2, .... k k Ha: (Ruptura total)

    57

    DficitBoP SupervitBoP

  • Para realizar el contraste es necesario especificar un modelo restringido (una sola regresin para toda la muestra) y un modelo sin restricciones (una regresin para cada sub-muestra).

    Modelo con restricciones (Para toda la muestra)

    32 31 11 1

    12 1,2,...,t t t tY X X Tt

    1 2 3

    2 21

    213 ,...,1t t t tY X X Tt T

    2 2 31 3t t t tY X X Modelo sin restricciones (libre):

    Estadstico de prueba:1 2

    ( , -2 )1 2

    ( )

    ~( )- 2-

    r s r

    q T Ks

    SCR SCR SCR SCR SCRq qF FSCR SCR SCR

    T KT K 58

    Requisito:T1>>kT2>>k

    Estabilidad de Parmetros

  • Contrastes grficos de estabilidad

    222

    21

    210

    ...

    ...:

    T

    kH

    Test Cusum (Contraste de suma acumulada)

    Los valores de las sumas acumuladas, bajo Ho de estabilidad, deberan oscilar entre las lneas de significacin.

    59

    (Modelo estructuralmente estable)

    (Brown, Durbin y Evans, 1975)

  • 60

    -50

    -40

    -30

    -20

    -10

    0

    10

    20

    30

    40

    1965 1970 1975 1980 1985 1990 1995 2000

    CUSUM5% Significance

    Contrastes grficos de estabilidad

  • 61

    -0.2

    0.0

    0.2

    0.4

    0.6

    0.8

    1.0

    1.2

    1965 1970 1975 1980 1985 1990 1995 2000

    CUSUM of Squares5% Significance

    Contrastes grficos de estabilidad

  • N Pasos (Test de Chow recursivo)

    No requiere la especificacin del periodo de quiebre; computa automticamente todos los casos posibles, comenzando con el tamao de muestra mnimo necesario.

    Grafica los residuos recursivos en la parte superior y las probabilidades significativas en la parte inferior.

    62

    .000

    .025

    .050

    .075

    .100

    .125

    .150

    -.04

    -.02

    .00

    .02

    .04

    .06

    1965 1970 1975 1980 1985 1990 1995 2000

    N-Step ProbabilityRecursive Residuals

    Contrastes grficos de estabilidad

  • Coeficientes recursivos Grafica la evolucin de

    las estimaciones de cualquier coeficiente utilizando cada vez tamaos de muestra ms grandes.

    Si muestra variaciones significativas a medida que se utilizan ms observaciones, es una indicacin de inestabilidad.

    El coeficiente experimenta saltos importantes cuando la ecuacin postulada intenta explicar cambios estructurales.

    63

    -.06

    -.04

    -.02

    .00

    .02

    .04

    .06

    .08

    .10

    1965 1970 1975 1980 1985 1990 1995 2000

    Recursive C(3) Estimates 2 S.E.

    Contrastes grficos de estabilidad

  • Tipos de variables independientes (regresores): Variable cuantitativa = f(variables cuantitativas)

    Variable cuantitativa = f(variables cualitativas)

    Binarias / dicotmicas (Sexo, religin, nacionalidad, nivel de educacin,

    estacionalidad, etc.)

    Variable cuantitativa = f( variables cuantitativas, var. cualitativas)

    Uso de variables Ficticias

    64

  • Dt = 0 (periodo normal) E(Qt) = + PtDt = 1 (periodo de crisis) E(Qt) = ( +)+ (+)Pt

    65

    ( ) t t t t t tQ P D D P

    Donde: t0 Periodo normal

    D = 1 Periodo de crisis

    Modelo:

    Uso de variables Ficticias

  • 66

    Caso 1: Ausencia de cambio estructural

    : 0, 0: 0, 0

    o

    a

    HH

    P( | ) t t tE Q P P

    Q

    a) Bajo la hiptesis nula b) Bajo la hiptesis alterna

    P ( | ) t t t tE Q P P

    Q+

    0

    ( | ) ( ) ( ) t t tE Q P P

    Uso de variables Ficticias

  • PQ

    ( | ) t t tE Q P P

    ( ( 0| ) ) , t t tE Q P P

    +

    67

    : 0: 0

    o

    a

    HH

    Caso 2: Interceptos distintos

    Bajo la hiptesis alterna

    Uso de variables Ficticias

  • Caso 3: Pendientes distintas

    68

    ( | ) ( ) 0, t t tE Q P PP

    Q

    ( | ) t t tE Q P P

    : 0: 0

    o

    a

    HH

    Bajo la hiptesis alterna

    Uso de variables Ficticias

  • Variables ficticias estacionales

    1 2 3 2 3 44 1( | , 0, 0, 0, )1t t t t t t ttE M Q Q Q X PQ Y i 1 12 3 4 2 41 3( | , 0, 0, 0,1 ) ( )t t t t t tt tE M Q Q Q X PQ Y i

    2 11 3 4 2 42 3( | , 0, 0, 0,1 ) ( )t t t t t tt tE M Q Q Q X PQ Y i 3 11 2 4 2 43 3( | , 0, 0, 0,1 ) ( )t t t t t tt tE M Q Q Q X PQ Y i

    1 21 2 3 4 1 2 33t t t t t t t tM P Y i Q Q Q

    69

    Caso: Datos trimestrales

    Uso de variables Ficticias

  • Regresin lineal a pedazos (Piecewise Linear Regression)

    70

    Las variables ficticias tambin son tiles para modelar relaciones no lineales que pueden ser aproximadas mediante varias relaciones lineales (Piecewise Linear Regression).

    Supongamos que se quiere aproximar mediante este tipo de regresin la relacin entre impuesto al ingreso, que es progresivo, esto es, a mayor salario mayor impuesto. Asumamos que estamos interesados en describir cmo el impuesto pagado (Y) est relacionado con el ingreso total (bruto) de los hogares (X) y especificamos el siguiente modelo:

    Y A BX U Para transformar (1) en una piecewise linear regression, necesitamos

    definir 2 variables ficticias que describan en cul seccin lineal se encuentra el hogar.

    (1)

  • 71

    1 21

    22

    1 ingreso bruto se halla en el intervalo X0 e.o.c.

    1 Ingreso bruto es mayor que X0 e.o.c.

    X XD

    D

    Regresin lineal a pedazos (Piecewise Linear Regression)

  • 72

    Luego, re-especificamos el intercepto y la pendiente de (1):

    0 1 1 2 2

    0 1 1 2 2

    A A A D A DB B B D B D

    (2)(3)

    Sustituyendo en (1), tenemos0 1 1 2 2 0 1 1 2 2

    0 1 1 2 2 0 1 1 2 2

    ( ) ( )Y A A D A D B B D B D X UA A D A D B X B D X B D X U

    Las relaciones estimadas en los 3 rangos de ingreso son:

    1 0 0

    1 2 0 1 0 1

    2 0 2 0 2

    ( ) ( ) ( ) ( )

    cuando X X Y a b X

    cuando X X X Y a a b b X

    cuando X X Y a a b b X

    Regresin lineal a pedazos (Piecewise Linear Regression)

  • CURSO SOBRE MODELOS ECONOMTRICOS Y PRONSTICO

    Oruro, mayo de 2012

    Julio Humrez Quiroz

    Cmara de Comercio de Oruro