Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio...

69
UNIVERSIDAD NACIONAL AUTÓNOMA DE NICARAGUA UNAN-MANAGUA FAREM CARAZO Unidad de Educación Continua y Postgrado Capacitación a Docentes ¡ Curso de Análisis y Diseño de Modelos E conométricos con el software Gretl Profesor MSc. Julio Rito Vargas Avilés Enero 2011 ¡A la Libertad por la Universidad!

Transcript of Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio...

Page 1: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

UNIVERSIDAD NACIONAL AUTÓNOMA DE NICARAGUA UNAN-MANAGUA FAREM – CARAZO Unidad de Educación Continua y Postgrado

Capacitación a Docentes

¡

Curso de Análisis y Diseño de Modelos

E conométricos con el software Gretl

Profesor MSc. Julio Rito Vargas Avilés Enero 2011

¡A la Libertad por la Universidad!

Page 2: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 3

Índice

I. Introducción

II. Objetivos

III. Conceptos básicos de Econometría.

IV. ¿Qué es la econometría, paraqué sirve?

V. Análisis de Regresión econométrico

VI. Especificación y Estimación

VII. Supuestos del modelo de regresión lineal

VIII. Propiedades de los estimadores de MCO

IX. Test de Hipótesis e Intervalos de Confianza

X. Bondad de Ajuste

XI. Test de significatividad global

XII. Un Ejemplo del Modelo de regresión múltiple

XIII. Técnicas Econométricas

XIV. Clasificación de los Modelos Econométricos

XV. Modelos Econométricos logarítmicos, Semilogarítmicos, Recíprocos y Polinomiales.

XVI. Pronósticos

Page 3: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 4

Introducción Este curso está orientado a los docentes interesados en aprender a interpretar y diseñar información estadística sobre la realidad económica. La herramienta básica es un modelo econométrico que conjuga los esquemas teóricos sobre el funcionamiento de la Economía con las técnicas estadísticas de análisis de datos. Un modelo puede tener una estructura muy compleja, pero en este curso nos centramos en el modelo más sencillo, el modelo de regresión lineal. Este modelo explica el comportamiento de una única variable (dependiente) económica y varias variables explicativas o predictoras. Por otro lado, este curso tiene un carácter totalmente aplicado, en el que los ejemplos prácticos sirven para introducir los conceptos estadístico-econométricos. Así, una parte importante del curso se dedica a estudiar casos prácticos, en los que el participante aprenderá a manejar un software econométrico y a interpretar adecuadamente los resultados obtenidos. El paquete econométrico a utilizar es Gretl; se trata de un software de libre uso, fácil de manejar y que tiene acceso a las bases de datos que se estudian en muchos libros de introducción al análisis econométrico. Este curso se ha organiza de la siguiente forma: En la primera parte se presenta el concepto y la importancia de la disciplina que nos ocupa, la Econometría. En la segunda parte se describen los conceptos econométricos y estadísticas principales para lo cual se parte de ejemplos prácticos para el desarrollo y explicación de los mismos, los cuales se ilustran con gráficos econométricos y tablas de resultados los que son interpretados. Se destacan cuales los elementos que integran un modelo econométrico. En la última parte y central del curso se analiza y construye el modelo de regresión econométrico, sus características y principales estadísticos, contrastes de hipótesis, los supuestos teóricos y las predicciones. A lo largo de todo el curso se estará usando el software Gretl , desde la creación la base de datos, edición de datos, creación de variables, así como la forma de importación de datos desde diferentes fuentes y formatos. A la par de este material se entregarán los libros digitales y software econométricos que se detallan en la bibliografía. El curso lo desarrollarán en un 50%, los participantes con el apoyo del docente, en actividades prácticas en el laboratorio de cómputo, resolviendo los ejercicios propuestos e incluidos en este documento, los que se anexan al final.

Page 4: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 5

Objetivo General

Saber modelar fenómenos económicos a través de ecuaciones de regresión lineal que describan la relación de una variable dependiente (Y), de otra (X) o más variables (X1,X2,X3..XN) independientes o EXPLICTIVAS, considerando el análisis de los supuestos básicos en los diferentes modelos teóricos para realizar análisis económico de:

Estructura Dinamismo Tendencia y estacionalidad Predicción/Planeación

Objetivos Específicos construcción y planteamiento del modelo básico de regresión lineal (especificación,

estimación y contraste del modelo uniecuacional).

Familiarizar a los participantes con un Software econométrico Gretl.

Interpretar los componentes de un modelo econométrico

Obtener valores de predicción a partir del modelo econométrico.

Page 5: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 6

¿Qué es la Econometría? En la toma de decisiones de carácter económico suele ser muy útil disponer de información en forma de datos cuantitativos. Por ejemplo, a la hora de elegir unos estudios universitarios podemos guiarnos por nuestras preferencias personales, pero también por factores como las expectativas de salario en la rama elegida o la facilidad con la que esperamos conseguir un empleo. Si se trata de la compra-venta de un apartamento o vivienda, nos interesa conocer la situación del mercado inmobiliario. Para ello podemos recopilar datos de precios y de algunas características de los apartamentos o viviendas que puedan influir en el precio como, por ejemplo, su tamaño o si es una vivienda usada que necesita reforma. Supongamos que en la sección de anuncios de un periódico local aparecen los siguientes datos sobre 50 apartamentos en venta en el centro de una ciudad:

• Precio de la vivienda o apartamento, en miles de dólares.

• Tamaño de la vivienda o apartamento, en metros cuadrados hábiles. • Estado de la vivienda o apartamento: si necesita reforma o está listo para habitarlo.

La Econometría es una rama de la Economía que utiliza la estadística para medir o cuantificar las relaciones existentes entre variables económicas. Es una materia interdisciplinar que utiliza la teoría económica, la matemática, la estadística y los métodos computacionales. En palabras de Ramanathan (2002): En términos sencillos, la econometría se ocupa de la aplicación de métodos estadísticos a la economía. A diferencia de la estadística económica, que es principalmente datos estadísticos, la econometría se distingue por la unificación de teoría económica, instrumentos matemáticos y metodóloga estadística. En términos más generales, la econometría se ocupa de (1) estimar relaciones económicas, (2) confrontar la teoría económica con los datos y contrastar hipótesis relativas al comportamiento económico, y (3) predecir el comportamiento de variables económicas.

Para qué sirve la Econometría? El objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como resultado, poder realizar predicciones de la evolución futura del fenómeno de interés. El instrumento básico es el modelo, que ayuda a entender las relaciones entre variables económicas y sirve para evaluar los efectos de distintas medidas o políticas económicas. Algunos ejemplos en los que la Econometría puede ser de utilidad son los siguientes:

Un analista del mercado de activos puede estar interesado en analizar y cuantificar la relación entre el precio de un activo y distintas características de la empresa que ofrece ese activo así como del estado general de la economía.

Los directivos de una empresa eléctrica pueden estar interesados en analizar los factores que afectan a la demanda de electricidad.

El grupo de grandes superficies comerciales puede estar interesado en cuantificar el efecto de distintos niveles de publicidad sobre sus ventas y sus beneficios.

Page 6: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 7

El servicio de estudios del Ministerio de Economía y del Banco de España o del Banco Central Europeo quiere analizar el impacto de las políticas monetarias y fiscales sobre el desempleo, la inflación, las exportaciones e importaciones, los tipos de interés, etc.

Analizar la efectividad de las medidas de seguridad vial, como el carnet por puntos, en la reducción del número de muertes en accidentes de tráfico.

Si un organismo quiere implementar políticas para corregir, por ejemplo, la discriminación salarial por sexo, en primer lugar debe conocer cuáles son los principales factores determinantes del problema y, en segundo lugar, analizar las posibles medidas a tomar, estudiando cuales pueden ser los efectos de dichas medidas.

Un gobierno regional puede necesitar previsiones sobre la evolución de la población para planificar la necesidad de servicios sociales y las necesidades de financiación que conllevan. También debe tener información precisa sobre su capacidad de financiación, por lo que le interesa disponer de predicciones relativas a la recaudación impositiva.

Si una persona quiere contratar un préstamo, le interesa conocer cuál va a ser la evolución de los tipos de interés.

En los últimos años hemos asistido a una mayor difusión y utilización de los métodos econométricos gracias, entre otras razones, a la mayor disponibilidad y calidad de los datos y al desarrollo de los métodos de computación. Además, la aplicación de la Econometría no se restringe al ámbito estrictamente económico, sino que proporciona procedimientos de estudio de datos que pueden aplicarse al campo de las Ciencias Sociales. Por ejemplo, para:

Analizar si el endurecimiento de las penas, como la introducción de la pena de muerte, tiene como consecuencia la disminución de la tasa de criminalidad.

Analizar la efectividad de las medidas de seguridad vial, como el carnet por puntos, en la reducción del número de muertes en accidentes de tráfico.

Predecir los resultados de una competición deportiva como, por ejemplo, el número de goles que marcaria la selección de Inglaterra en un mundial de futbol.

Analizar cuál puede ser el efecto sobre los votantes en las próximas elecciones de una determinada medida, por ejemplo, prohibir fumar en lugares públicos, legalizar los matrimonios entre personas del mismo sexo, etc.

Analizar si las medidas restrictivas sobre la publicidad de tabaco y alcohol reducen el consumo de estos productos.

Page 7: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 8

Los comienzos de la Econometría pueden situarse en la década de los treinta del siglo pasado. Su coincidencia en el tiempo con la Gran Depresión no es casual: como consecuencia de esta, los economistas de la época estaban interesados en poder predecir los ciclos económicos que observaban. Entre ellos destaca Keynes, que defendía la intervención del gobierno en la actividad económica para mitigar estas crisis. Así, los primeros económetras se ocuparon de dar respuesta a problemas macroeconómicos con objeto de asesorar a los gobiernos en la implantación de políticas económicas. En la econometría se han desarrollado dos grandes aéreas: la econometría teórica, cuyo objetivo es desarrollar métodos de estudio y análisis de datos y determinar sus propiedades, y la econometría aplicada, que se ocupa de utilizar estos métodos para responder a los problemas de interés en la práctica. En este curso ponemos mayor énfasis en la parte aplicada. Se trata de proporcionar a los participantes las herramientas necesarias para que sea capaz de llevar a cabo un proyecto aplicado. Para ello, es indispensable dedicar tiempo al conocimiento de los métodos e instrumentos básicos del análisis econométrico, ya que son el requisito previo para una buena aplicación práctica.

En la toma de decisiones de carácter económico suele ser muy útil disponer de información en forma de datos cuantitativos. Por ejemplo, a la hora de elegir unos estudios universitarios podemos guiarnos por nuestras preferencias personales, pero también por factores como las Expectativas de salario en la rama elegida o la facilidad con la que esperamos conseguir un empleo, la cobertura de la Canasta básica por sector productivo o el desempleo. Para efectos ilustrativos presentamos la tabla 1.0, con información del período 1991-2009, cuya fuente es el Banco Central de Nicaragua (www.bcn.gob.ni), donde se muestran el valor de la Canasta básica y los salarios promedios a nivel nacional, del sector agropecuario y del gobierno1. Se incluye la inflación de los años 2001-2008. La población en edad laboral en Nicaragua es de 4, 408,100; de los cuales, la población económicamente activa solo son 2, 282,700 los que se distribuyen así; 736,000(afiliados al INSS) con empleo formal, 1,359,700 en empleo informal y 186,200 desempleos. La población económicamente inactiva es de 2, 125,400 lo que representan el 48%. Si a la población económicamente inactiva le adicionamos los desempleos, estos representaron el 52%, en año 2009.

1 Anuario Estadístico Banco Central de Nicaragua, año 2010

Page 8: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 9

Año Valor Canasta

Básica

Salario promedio Nacional

Salario promedio Agropecuario

Salario promedio Gobierno

1991 593.10 671.60 492.10 647.60

1992 730.10 1,050.60 741.40 675.20

1993 887.00 1,171.10 716.10 735.90

1994 970.60 1,289.30 849.40 788.00

1995 1,078.90 1,405.20 936.40 849.10

1996 1,225.60 1,508.50 1,066.50 874.30

1997 1,402.80 1,708.90 1,244.80 971.90

1998 1,577.60 2,008.80 1,392.40 1,462.70

1999 1,694.10 2,322.20 1,675.40 1,842.70

2000 1,852.40 2,607.90 1,891.80 2,141.70

2001 1,980.10 2,808.90 2,046.70 2,506.70

2002 2,078.10 3,023.30 2,297.70 2,732.20

2003 2,208.90 3,240.60 2,532.70 3,098.30

2004 2,464.60 3,437.90 2,633.80 3,531.20

2005 2,682.70 3,771.90 2,718.50 4,233.10

2006 2,937.70 4,204.70 2,769.80 5,103.50

2007 7,539.00 4,570.10 2,962.90 4,994.50

2008 8,413.10 5,260.50 3,279.60 5,198.00

2009 8,430.30 5,770.90 3,635.60 5,729.10

Tabla 1.0 Salarios y costo de la CB en córdobas

Page 9: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 10

Gráfico 1.0

Page 10: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 11

En el gráfico 1.0 se muestran los Valor de la canasta básica del período 19991-2006, que como se aprecia con respecto al salario promedio nacional, se tenía un grado de cobertura hasta el 2005. Los mayores estragos en la capacidad adquisitiva del salario real los trabajadores lo ha venido a sentir de forma más directa durante la crisis Alimentaria que se agravó en el mes de agosto del año 2007, ya para el mes de septiembre el incremento fue del 55.4%, en comparación a los meses anteriores que el incremento oscilaba en promedio en el 1% mensual. A finales del año 2008 en término de dos años el incremento del Costo de la Canasta Básica, sufrió una variación en su tasa anual del 65.5%. Año/M Ene. Feb. Mar. Abr. May. Jun. Jul. Ago. Sep. Oct. Nov. Dic.

2004 2382.4 2395.4 2392.2 2400.5 2421.2 2441.7 2466.7 2473.1 2493.7 2540.9 2602.7 2564.8

2005 2563.7 2565.6 2578.2 2706.4 2666.3 2669.5 2690.8 2699.4 2709.3 2749.6 2798.2 2794.8

2006 2810.1 2812.4 2833.7 2847.2 2954.7 2968.7 2970.7 2987.7 2992.5 2999.0 3029.1 3046.4

2007 3046.1 3081.0 3093.3 3119.0 3115.0 3181.7 3218.2 3254.6 7217.3 7438.5 7786.5 7713.9

2008 7776.9 7874.4 7926.8 8029.6 8331.3 8636.4 8687.4 8674.9 8617.4 8726.5 8857.4 8818.4

Tabla 1.01

Page 11: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 12

Gráfico 1.01 En el gráfico .1.01 se muestran a la izquierda el período 1991-20006, del comportamiento del costo de la canasta básica en comparación con el salario promedio del Sector asalariado agropecuario. Que como se podrá apreciar, en el tramo 1991-1999 el salario promedio era inferior al costo de la canasta básica, a partir del año 2000 hasta el 2005, el salario promedio aparentemente permite a éste a sector de asalariados cubrir el costo de la canasta básica, pero a partir del 2006, el costo de la canasta básica se incrementa sustancialmente estableciéndose una brecha de casi tres veces el salario (año 2009). Es decir la cobertura de un asalariado promedio será de un tercio de la canasta básica. Si buscamos una relación entre el salario nacional y el costo de la canasta básica en el periodo 1991-2006. Nos resulta la siguiente gráfica.

Modelo 1: MCO, usando las observaciones 1991-2006 (T = 16) Variable dependiente: Valor_CBasica

Coeficiente Desv. Típica Estadístico t Valor p

const 147.323 40.347 3.6514 0.00262 ***

SalaNac 0.662606 0.0162 40.9016 <0.00001 ***

Media de la vble. Dep. 1647.769 D.T. de la vble. Dep. 712.5203

Suma de cuad. Residuos 63199.65 D.T. de la regresión 67.18825

R-cuadrado 0.991701 R-cuadrado corregido 0.991108

F(1, 14) 1672.938 Valor p (de F) 5.70e-16

Log-verosimilitud -88.95474 Criterio de Akaike 181.9095

Criterio de Schwarz 183.4547 Crit. De Hannan-Quinn 181.9886

rho 0.551391 Durbin-Watson 0.897239

Tabla 1.02

Page 12: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 13

Gráfico 1.02 En el gráfico 1.02 se muestra la relación lineal entre el Salario promedio nacional y el costo de la canasta básica del período analizado (1991-2006). El estadístico R2 (coeficiente de determinación) mide el grado de relación entre las variables dependiente (Costo de la canasta básica) y la variable exógena (Salario promedio Nacional), donde la variable exógena, explica 99% de la dispersión de la variable dependiente, es decir no se requeriría de mas variables exógenas o explicativas para estimar el costo de la canasta básica.

_ _ 147.323 0.662606*valor canasta basica SalarioNacional

En el gráfico 1.03 se muestra la relación lineal entre el salario promedio agropecuario y el costo de la canasta básica. Siendo el coeficiente de determinación del 97%.

_ _ 217.042 0.880261*valor canasta basica SalarioAgropecuario

Page 13: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 14

Gráfico 1.03

Si se trata de la compra-venta de un apartamento o casa, nos interesará conocer la situación del mercado Inmobiliario. Para ello podemos recopilar datos de precios y de algunas características de los Apartamentos que puedan influir en el precio como, por ejemplo, su tamaño o si es una vivienda usada Que necesita reforma. Supongamos que en la sección de anuncios de un periódico local aparecen: Los siguientes datos sobre 50 apartamentos en venta en el centro de una ciudad:

Precio del apartamento, en miles de dólares.

Tamaño del apartamento, en metros cuadrados hábiles.

Estado del apartamento: si necesita reforma o está para entrar a vivir.

Estos datos aparecen en la Tabla 1.1. En base a esta información, si nos ofrecen un apartamento de 100 m2 reformado a un precio de 525.000 Dólares, diríamos que el apartamento parece caro ya que su precio supera el promedio de precios de los apartamentos de estas características incluidos en la muestra: (402. 6 + 360. 607 + 570 + 480. 809)/4= U$ 453.504 (miles) En la variable A reformar, esta será codificada 1: No 2 :Si ; en la variable precio son miles de U$ (dólares)

Page 14: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 15

Indicador Tamaño Sperficie A reformar Indicador Tamaño Sperficie A reformar

1 55 210.354 No 26 110 476.600 No

2 59 309.520 No 27 110 456.769 No

3 60 366.617 No 28 115 500.643 No

4 60 299.304 Si 29 125 619.000 No

5 60 369.650 No 30 135 645.253 No

6 65 273.460 Si 31 135 625.000 No

7 65 155.000 Si 32 140 522.800 Si

8 70 228.384 No 33 150 390.660 No

9 70 246.415 No 34 150 504.850 Si

10 70 255.000 Si 35 150 715.204 No

11 75 150.253 Si 36 150 570.000 Si

12 77 352.800 No 37 160 751.265 No

13 80 366.000 Si 38 180 583.000 Si

14 80 298.000 Si 39 180 738.000 No

15 80 312.530 No 40 180 552.931 Si

16 83 240.400 No 41 190 691.200 No

17 85 278.569 Si 42 195 811.400 No

18 91 390.658 No 43 200 691.000 Si

19 92 216.364 Si 44 200 1110.000 No

20 100 402.600 No 45 230 961.620 No

21 100 272.300 Si 46 230 661.000 No

22 100 360.607 No 47 240 841.417 No

23 100 570.000 No 48 240 588.992 Si

24 100 480.809 No 49 245 841.400 Si

25 100 186.314 Si 50 250 1051.000 No

Tabla 1.1

Sin embargo, ¿qué podemos decir si se tratara de un apartamento de 90 m2 a reformar?. ¿O de un apartamento de 50 m2 reformado?. No tenemos datos para replicar el procedimiento anterior. Un económetra podría ayudar a dar respuesta a estas cuestiones. En el Gráfico 1.1, que representa conjuntamente el precio y el tamaño de cada apartamento, se ve un patrón o relación estable entre tamaño de un apartamento y su precio. Esta relación se puede trasladar a un modelo útil para responder a las preguntas que planteamos. Las técnicas econométricas nos permiten cuantificar, a partir del modelo y los

datos, la influencia que tiene el tamaño del apartamento o su estado en el precio del mismo. La respuesta podría ser, por ejemplo: La estimación del precio medio de un apartamento a reformar de 90 m2 es de 297,350 dólares, aunque el precio puede oscilar entre 152,711 y 441,989 dólares a un nivel de confianza del 90 %. Además, si se trata de un apartamento reformado, la estimación del precio medio se incrementa en más de 100,000 dólares, siendo factibles precios entre 210,521 y 556,639 dólares.

Page 15: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 16

Un estudio econométrico Uno de nuestros objetivos específicos es que, al final del curso, el estudiante debe ser capaz de estructurar y desarrollar un trabajo de investigación. Hoy dıa, una persona que disponga de un ordenador en su casa puede llevar a cabo un pequeño proyecto econométrico. Así, un estudio econométrico consta de las siguientes etapas, Heij, de Boer, Franses, Kloek & Dijk (2004): • Formulación del problema. Se trata de determinar la cuestión de interés. Debemos plantear de forma precisa las preguntas que nos interesa responder. Por ejemplo, si se trata de conocer la situación del mercado inmobiliario en una ciudad, podemos plantearnos la siguiente pregunta: ¿cuál es el precio de los apartamentos en esa ciudad y qué factores lo determinan? . La teoría económica puede ayudarnos a enfocar el problema, a determinar qué variables están involucradas y cuál puede ser la relación entre ellas. • Recolección de datos estadísticos relevantes para el análisis. En el ejemplo anterior, es fácil recolectar datos sobre el precio de apartamentos, su tamaño y otras características que pueden influir en su precio (ver Tabla 1.1). Los resultados del análisis van a depender en gran medida de la calidad de los datos. Sin embargo, no siempre es sencillo obtener los datos relevantes para el análisis. Podemos encontrar problemas como la ausencia de algún dato, cambios en la definición de una variable, fallos en el método de recogida, tener una cantidad insuficiente de datos o no disponer de información relativa a una variable. • Formulación y estimación del modelo. De la unión de las teorías y cuestiones planteadas en la primera etapa con los datos se llega a un modelo econométrico. Por ejemplo, podemos plantear que, en media, el precio de un apartamento, Y , depende de su tamaño, X. Un posible modelo econométrico que recoge esta teoría es:

𝒀𝑰𝑿~𝑵(∝ +𝜷𝑿,𝝈𝟐)

Page 16: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 17

Es decir, el precio de los apartamentos dado un tamaño, por ejemplo 100 m2, se distribuye alrededor de su

media ∝ +𝜷𝟏𝟎𝟎 según una normal de varianza 𝝈𝟐. Al formular el modelo hemos elegido la forma funcional de la relación entre las variables y la naturaleza estocástica de la variable de interés o endógena, Y . El objetivo es obtener un modelo relevante y útil para dar respuesta a nuestros objetivos. El siguiente paso es la estimación de los parámetros desconocidos de la distribución y que son de interés para el análisis. En el ejemplo del precio de los apartamentos, interesan los parámetros de su media, ∝ y 𝛽. La estimación consiste en utilizar los datos y toda la información relevante para aprender algo sobre los parámetros desconocidos. En la interpretación de los resultados de estimación es importante tener en cuenta que no conocemos el valor de los parámetros, por lo que únicamente vamos a hacer afirmaciones del tipo “con un 95% de confianza, el aumento del impuesto sobre carburantes no afecta al consumo de gasolina”. Existen muchos métodos de estimación. La elección entre uno u otro depende de las propiedades del modelo econométrico seleccionado. Es decir, una mala selección del modelo también influye en la validez de las estimaciones. Un curso introductorio de Econometría, como este, se suele centrar en el estudio del modelo de regresión lineal y su estimación mediante mínimos cuadrados ordinarios, que son instrumentos sencillos y muy ´útiles en la práctica.

Análisis del modelo. Se trata de estudiar si el modelo elegido es adecuado para recoger el comportamiento de los datos. Por ejemplo, si es correcto asumir que el tamaño del piso influye en su precio, si la relación lineal entre ambas variables es correcta, etc. Consiste en una serie de contrastes diagnósticos que valoran si el modelo está correctamente especificado, es decir, si los supuestos realizados son validos. Si es necesario, se modifica el modelo en base a los resultados obtenidos en los contrastes.

Aplicación del modelo. Una vez obtenido un modelo correcto, se utiliza para responder a las cuestiones de interés.

Los datos y su manejo ¿Cómo se obtienen datos económicos? No proceden de experimentos controlados sino que los economistas, al igual que otros investigadores del campo de las Ciencias Sociales, obtienen los datos de la observación de la realidad. En un experimento controlado, como los realizados en laboratorios, el investigador tiene control sobre las condiciones del estudio. Por ejemplo, para analizar el efecto de un fertilizante, podemos aplicar distintas dosis de fertilizante sobre un conjunto de sembrados, controlando también el grado de humedad o la luz que recibe cada planta. Además, se puede repetir el experimento, manteniendo las mismas condiciones o alterando algunas como las dosis o el grado de humedad. obviamente, aunque las cantidades elegidas sean exactamente las mismas, no esperamos que el resultado, por ejemplo, el crecimiento de las plantas, sea idéntico entre experimentos porque las semillas utilizadas son distintas o porque hay pequeños errores de medida. Estas diferencias naturales en los resultados de los experimentos se conocen como variaciones muéstrales. Los datos obtenidos de experimentos controlados son típicos de las Ciencias Naturales y se conocen como datos experimentales. Los datos que son resultado de un proceso que tiene lugar en la sociedad, y que no es controlable por una o varias personas, se conocen como datos no experimentales. Esta característica ha sido un factor importante en el desarrollo de las técnicas econométricas y debemos tenerlo en cuenta en la interpretación de los resultados. Clasificación de los datos económicos. Los datos económicos pueden ser de diferentes tipos, lo que va a determinar el análisis que realicemos. Una primera clasificación distingue entre datos cuantitativos, aquellos

Page 17: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 18

que toman valores numéricos dentro de un rango de valores, como precio o tamaño de un piso, y datos cualitativos, que aparecen como categorías o atributos, como por ejemplo el sexo, la profesión o el estado de un piso. Los seis primeros temas de este curso se centran en el análisis de datos cuantitativos. El tema siete considera situaciones en las que algún factor explicativo es cualitativo. Una segunda clasificación distingue entre datos de series temporales y datos de sección cruzada. Los primeros se refieren a observaciones recogidas en sucesivos momentos de tiempo, normalmente regulares, como años, trimestres o meses. Ejemplos de datos temporales son el Producto Interior Bruto (PIB) de la Contabilidad Nacional trimestral, el número mensual de afiliaciones a la Seguridad Social o el valor diario del IBEX35. Los segundos se refieren a valores que toman diferentes agentes en un momento del tiempo, por ejemplo, la población desempleada en el año 2005 en cada uno de los países de la Unión Europea (UE), el salario medio en cada sector industrial en el 2006 o el gasto realizado en libros de texto por un conjunto de familias en septiembre pasado. También es posible tener una combinación de datos de sección cruzada y series temporales, por ejemplo, las puntuaciones obtenidas por los estudiantes de Econometría en los cursos 2004-05, 2005-06 y 2006-07. Cuando se encuesta a los mismos individuos a lo largo del tiempo, como la tasa de desempleo y el crecimiento del PIB desde 1990 hasta 2006 para los 25 países de la UE, se conocen con el nombre de datos de panel o datos longitudinales. En este curso nos centraremos en el análisis de datos de sección cruzada. Las técnicas que utilicemos también se pueden aplicar en series temporales, aunque en ocasiones su estudio es más complejo.

El software econométrico El desarrollo de los ordenadores ha permitido almacenar una gran cantidad de datos, a la vez que ha facilitado su manejo. Existen en la actualidad un amplio conjunto de paquetes para el análisis econométrico que realizan complejas operaciones mediante unas instrucciones muy sencillas. Si los datos están disponibles en papel, las hojas de cálculo, como EXCEL, son un instrumento sencillo para introducir y preparar los datos y realizar operaciones sencillas. Sin embargo, en general es conveniente utilizar programas econométricos específicos. Algunos de los más populares en los cursos de Econometría son:

EViews, desarrollado por Quantitative Micro Software, contiene una amplia gama de técnicas de

análisis econométrico. Muchos manuales de Econometría contienen un CD con ejemplos prácticos en Eviews. Su página web con la información del programa es http: //www.eviews.com.

SHAZAM, elaborado en la Universidad British of Columbia (Canadá), incluye técnicas para estimar

muchos tipos de modelos econométricos. Más información se puede obtener en http: //shazam.econ.ubc.ca\, donde se puede ejecutar el programa remotamente.

Gretl, acrónimo de Gnu Regression, Econometric and Time Series (Biblioteca Gnu de Regresión

Econometría y Series Temporales), elaborado por Allin Cottrell (Universidad Wake Forest). Es software libre, muy f´acil de utilizar. También da acceso a bases de datos muy amplias, tanto de organismos públicos, como el Banco de España, como de ejemplos recogidos en textos de Econometría.

RATS, acrónimo de Regression Analysis of Time Series. Contiene una amplia gama de técnicas de análisis

econométrico con especial dedicación al Análisis de Series Temporales. Su web es: http: //www.estima.com

Page 18: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 19

R, software libre para cómputo estadístico y gráficos. Consiste en un lenguaje, un entorno de ejecución,

un debugger y la habilidad de correr programas guardados en archivos de tipo script. Su diseño fue influenciado por dos lenguajes existentes: S y Scheme. Página web: http: //www.r − project.org

Un objetivo de este curso es que el estudiante se familiarice con el uso de programas econométricos. Por su sencillez y accesibilidad, en este curso introductorio se utiliza el programa Gretl para estudiar casos prácticos. En la pagina http: //gretl.sourceforge.net/gretl−espanol.html se encuentra toda la información en castellano relativa a la instalación y manejo del programa.

Análisis descriptivo de una variable Una vez incorporados los datos, vamos a obtener una visión general de los mismos. El objetivo del análisis descriptivo es resumir un conjunto de datos, extrayendo las características e información más relevante para el estudio. En primer lugar, sintetizaremos la información de cada una de las variables y en una segunda etapa, obtendremos una primera idea de las relaciones existentes entre las variables. Para ello se utilizan gráficos y números-resumen conocidos como estadísticos descriptivos. El análisis descriptivo de una única variable que proporciona Gretl se encuentra en la opción variable del menú principal; un resumen de este análisis se obtiene en el menú auxiliar que aparece al pinchar con la tecla derecha del ratón sobre la variable. El gráfico más utilizado para resumir datos de sección cruzada de una única variable económica es el histograma, que aparece con la opción del menú auxiliar Gráfico de frecuencias. Se trata de un diagrama de barras que en el eje horizontal o abscisa representa los valores de la variable divididos en intervalos. Sobre cada intervalo se dibuja una barra, cuya superficie refleja el número de observaciones que pertenecen a dicho intervalo. Si, por ejemplo, pinchamos con la tecla derecha del ratón sobre la variable precios y vamos a Gráfico de frecuencias, aparece el cuadro de opciones del histograma en la que fijamos:

Número de intervalos: Por defecto aparecen 7 intervalos, que es un número entero próximo a √N, siendo N el número de observaciones, en este caso 50.

Valor mínimo intervalo izquierdo y grosor del intervalo: todos los intervalos deben tener la misma amplitud. Por defecto, se eligen de manera que el punto central o marca de clase de los intervalos primero y ´ultimo sean, respectivamente, los valores mínimo y máximo que toma la variable en el conjunto de datos.

Page 19: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 20

Gráfico 1.2 Usando las opciones estándar de Gretl obtenemos el Gráfico 1.2. Si pinchamos sobre el gráfico, se despliega un menú auxiliar que permite hacer cambios en el gráfico (editar) o guardarlo en diversos formatos (portapapeles, postcript, etc). La opción guardar a sesión como icono guarda el gráfico a lo largo de la sesión de Gretl. Es decir, una vez cerrada la ventana del gráfico, se recupera pinchando en el cuarto símbolo de la barra de herramientas situada en parte inferior derecha de la ventana principal (vista iconos de sesión) y, a continuación, pinchando dos veces en el icono gráfico 1. Para ver la tabla con la distribución de frecuencias representada en el histograma, hay que marcar la variable correspondiente e ir a la opción Variable →Distribución de frecuencias. Por ejemplo, la tabla de distribución de frecuencias de la variable precio es: Distribución de frecuencias para Precio, observaciones 1-50

número de cajas = 7, media = 488.658, desv.típ.=238.233

intervalo punto medio frecuencia rel acum.

< 230.23 150.25 6 12.00% 12.00% ****

230.23 - 390.19 310.21 15 30.00% 42.00% **********

390.19 - 550.15 470.17 9 18.00% 60.00% ******

550.15 - 710.11 630.13 11 22.00% 82.00% *******

710.11 - 870.06 790.08 6 12.00% 94.00% ****

870.06 - 1030.0 950.04 1 2.00% 96.00%

>= 1030.0 1110.0 2 4.00% 100.00% *

Gráfico 1.3: Distribución de frecuencias del precio de 50 apartamentos

En la primera columna aparecen los intervalos en que se han dividido los valores que toma la variable precio y la segunda incluye el punto medio o marca de clase del intervalo. La columna frecuencia es lo que se conoce como frecuencia absoluta de un intervalo, es decir, el número de apartamentos con precio en ese intervalo. Por ejemplo, en la Tabla 1.1 hay 15 apartamentos cuyo precio se encuentra entre 230,232 y 390,190 dólares. La columna, rel, contiene la frecuencia relativa de cada intervalo, es decir, la fracción de observaciones que hay en cada tramo. Con estas frecuencias se ha construido el histograma anterior. Por ejemplo, los 15 apartamentos con precio en el intervalo [230,232; 390,190) constituyen el 30% del total de los 50 apartamentos. y, como todos los

0

0.05

0.1

0.15

0.2

0.25

0.3

0 200 400 600 800 1000 1200

Frec

uenc

ia r

elat

iva

Precio

Page 20: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 21

intervalos son de igual amplitud, la altura de la segunda barra del histograma es la frecuencia relativa asociada en tanto por uno, es decir, 0,3. Si a la frecuencia relativa de un intervalo se le suman las frecuencias relativas de los anteriores se obtiene la frecuencia relativa acumulada hasta cada intervalo, que aparece en la columna acum. Por ejemplo, en el conjunto de apartamentos que estudiamos, un 42% de ellos tiene un precio inferior a 390,190 dólares. La descripción numérica de una variable se encuentra en la opción del mismo menú auxiliar Estadístico descriptivo o en el menú principal, Variable →Estadísticas principales. El resultado para la variable precio es la Tabla 1.3:

Estadísticos principales, usando las observaciones 1 - 50

para la variable Precio (50 observaciones válidas)

Media Mediana Mínimo Máximo

488.658 466.685 150.253 1110.00

Desv. Típica. C.V. Asimetría Exc. de curtosis

238.233 0.487524 0.681761 -0.210604

Tabla 1.2: Estadísticos descriptivos del precio de 50 apartamentos La media y la mediana son medidas de posición, la desviación t´ıpica y el coeficiente de variación son medidas de dispersión, mientras que la asimetría y exceso de curtosis son medidas de forma de la distribución. Las medidas de posición dan una idea de la situación o centro del conjunto de puntos. La media es el valor promedio. Si disponemos de N datos de una variable x1, x2, . . . , xN, la media, o también momento muestral de primer orden, se define como:

𝑥 =𝑥1 + 𝑥2 + ⋯ + 𝑥𝑁

𝑁=

1

𝑁 𝑥𝑖

𝑁

𝑖=1

La media es un estadístico poco robusto frente a la presencia de valores extremos: observaciones anómalas van a tener una gran influencia en el valor que tome. Por ejemplo, si el piso número 50 tuviera un precio muy alto, por ejemplo, 1350 miles de dólares en lugar de 1051, entonces el precio medio aumentaría en casi 6000 dólares, situándose en 495,84 miles de dólares. En general, interesan estadísticos cuyo valor no varíe mucho ante cambios en los valores de unas pocas observaciones, por muy grandes que sean esas variaciones. La mediana, que es el valor central de la distribución, posee esta propiedad. Así, la mediana del precio es 466, 68 miles de dólares. Las medidas de posición proporcionan un valor representativo del conjunto de datos que debe complementarse con una medida del error asociado. Para valorar la representatividad de este único valor se utilizan las medidas de dispersión, que informan de si las observaciones están poco concentradas (o muy dispersas) alrededor de su centro. Una medida sencilla es la diferencia entre los valores máximo y mínimo que toman los datos en la muestra, lo que se conoce como recorrido. Es decir, Recorrido = Máximo - Mínimo En el ejemplo, tenemos que el recorrido de los precios es 1110-150,25 = 959,75 miles de dólares. Esta medida solo tiene en cuenta dos valores, los extremos. Otras medidas se elaboran con todos los datos, por ejemplo, la desviación típica, que es la raíz cuadrada positiva de la varianza. La varianza de un conjunto de datos se define como un promedio de los cuadrados de las desviaciones de los datos a la media. Gretl calcula la varianza, 𝑆𝑥

2 , como:

Page 21: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 22

𝑆𝑥2 =

𝑥1 − 𝑥 2 + 𝑥2 − 𝑥 2 + ⋯ + (𝑥𝑁 − 𝑥 )2

𝑁=

1

𝑁 − 1 (𝑥𝑖 − 𝑥 )2

𝑁

𝑖=1

La desviación típica estará determinada entonces por:

𝑺𝒙= 𝑥1−𝑥 2+ 𝑥2−𝑥 2+⋯+ 𝑥𝑁−𝑥 2

𝑁 =

1

𝑁−1 (𝑥𝑖 − 𝑥 )2𝑁

𝑖=1

Varianza y desviación típica son medidas de la dispersión de los datos alrededor de la media. Tiene el valor mínimo cero cuando todos los datos de la variable toman el mismo valor. La ventaja de la desviación típica es que tiene las mismas unidades de medida que la variable original. En general, cuanto más próxima a cero esté 𝑺𝒙 más concentrada estarán los datos alrededor de la media y ´esta será más representativa del conjunto de observaciones. Sin embargo, al depender S_ x de las unidades de medida, no es fácil comparar su representatividad en dos conjuntos de datos. Para solucionar este problema se utiliza el coeficiente de variación, C.V., que es una medida adimensional de la dispersión, y se define como:

CV=𝑺𝒙

𝒙 si 𝒙 ≠ 𝟎

En el ejemplo de precios tenemos que C.V. = 0, 485 < 1, la dispersión de los datos es pequeña en relación a su nivel, por lo que consideramos que la media s´ı es bastante representativa del conjunto de datos. Media y desviación típica son los estadísticos-resumen más conocidos. Se acompañan de las medidas de forma, que reflejan otras características del histograma. La asimetría de una distribución se refiere a si los datos se distribuyen de forma simétrica alrededor de la media o no. El coeficiente de asimetría se define como:

Coeficiente de asimetría = 1

𝑁 (

𝑥𝑖−𝑥

𝑆𝑥)3𝑁

𝑖=1 =

1

𝑁 (𝑥𝑖−𝑥 )3𝑁

𝑖=1

𝑆𝑥3

El coeficiente de asimetría es cero cuando los datos se distribuyen simétricamente alrededor de la media, es positivo cuando la cola derecha (asociada a valores por encima de la media) es más larga que la izquierda siendo negativa en caso contrario. En el ejemplo de los precios de los apartamentos, observamos que la

asimetría es positiva, lo que se corresponde con una media mayor que la mediana, es decir, 𝒙 > Mediana(x).

Gráfico 1.4: Tipos de asimetría

El coeficiente de curtosis es una medida del apuntamiento de la distribución y se define:

Page 22: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 23

Curtosis = 1

𝑁 (

𝑥𝑖−𝑥

𝑆𝑥)4𝑁

𝑖=1 =

1

𝑁 (𝑥𝑖−𝑥 )4𝑁

𝑖=1

𝑆𝑥4

Este coeficiente mide la cantidad de observaciones que se encuentran en las colas en relación con las situadas alrededor de la media. El nivel de referencia es tres, que es el valor de la curtosis de la distribución normal. Así, se define el exceso de curtosis como:

Exc. de curtosis =

1

𝑁 (𝑥𝑖−𝑥 )4𝑁

𝑖=1

𝑆𝑥4 − 3

Un exceso de curtosis positivo indica mayor peso de observaciones en la cola y mayor apuntamiento que la distribución normal, mientras que si es negativo indica menor número de observaciones en la cola y menor apuntamiento. Cuando tenemos un conjunto de variables, Gretl permite recoger en una única tabla los estadísticos descriptivos de todas las variables. El proceso es el siguiente: 1. Seleccionar las variables de interés pinchando simultáneamente la tecla izquierda del ratón y la tecla Control. 2. Ir a Ver →Estadísticos principales o utilizar Estadísticos descriptivos en el menú auxiliar que aparece al pinchar la tecla derecha del ratón sobre las variables seleccionadas. Así, con los datos de la Tabla 1.1 se obtiene la siguiente tabla de estadísticos descriptivos:

Estadístico principales, usando las observaciones 1 – 50 Variable Media Mediana Mínimo Máximo Superficie 127.340 105.000 55.0000 250.000 Precio 488.658 466.685 150.253 1110.00 A_reformar 1.62000 2.00000 1.00000 2.00000 Variable D. T. C.V. Asimetría Exc. De curtosis Superficie 59.0478 0.463702 0.670907 -0.779538 Precio 238.233 0.487524 0.681761 -0.210604 A_reformar 0.490314 0.302663 -0.494451 -1.75552

Tabla 1.3: Estadísticos descriptivos del conjunto de datos

Donde D.T. indica desviación típica, MIN es mínimo y MAX denota el máximo. Al interpretar estos resultados, hay que tener en cuenta que la variable Reforma no es una variable cuantitativa continua, sino una variable cualitativa discreta, que sólo toma valores 1 ó 0.

Relaciones entre variables Cuando el conjunto de datos contiene, por ejemplo, dos variables cuantitativas nos interesa estudiar la relación o asociación que existe entre ellas. En general, al analizar dos (o más) variables, podemos establecer una relación de causalidad entre ellas. Por ejemplo, podemos pensar que el precio de un piso puede ser consecuencia del tamaño de la vivienda, pero no al revés. Se llama variable independiente o exógena, x, a la que causa el efecto y variable dependiente o endógena, y, a la que lo recibe. La relación entre estas variables puede estudiarse con gráficos o expresarse numéricamente mediante, por ejemplo, el coeficiente de

Page 23: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 24

correlación. Todos estos elementos del análisis descriptivo de un conjunto de variables se realizan con el menú que se despliega en la opción Ver de Gretl. Representación gráfica. El diagrama de dispersión o scatterplot da una primera idea de la relación entre dos variables. Es el gráfico que representa cada punto (xi, yi), i = 1, . . .N en el plano: la variable x aparece en el eje de abscisas y la variable y en el eje de ordenadas. Por ejemplo, para obtener con Gretl el Gráfico 1.5, precio sobre superficie, podemos seguir uno de los siguientes pasos:

Ver →Gráficos →Gráfico X-Y (scatter) y en el cuadro Definir el gráfico marcar: Variable de eje X Elegir −> superficie Variables de eje Y Añadir −> precio

O bien seleccionar las variables precio y Superficie pinchando simultáneamente la tecla izquierda del ratón y la tecla Control e ir al menú auxiliar, Gráfico de dos variables XY. En el siguiente cuadro, se selecciona la variable de la abscisa, Superficie.

Al pinchar en Aceptar aparece el Gráfico 1.5 que, además de la nube de puntos, incluye una recta-síntesis de la relación, la recta de regresión mínimo cuadrática que veremos más adelante.

Gráfico 1.5: Diagrama de dispersión superficie-precios

El gráfico de dispersión permite distinguir la posible relación, lineal o no, que existe entre las variables. Se dice que hay una relación lineal positiva entre ambas variables cuando al aumentar x, aumenta en promedio el valor de y (figura b en el Gráfico 1.6). Diremos que hay una relación lineal negativa entre ambas variables cuando observamos que al aumentar x, disminuye en promedio el valor de y (figura c). En el ejemplo, se observa una clara relación lineal positiva entre precio y tamaño del piso.

100

200

300

400

500

600

700

800

900

1000

1100

1200

50 100 150 200 250

Prec

io

Superficie

Precio con respecto a Superficie (con ajuste mínimo-cuadrático)

Y = 42.5 + 3.50X

Page 24: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 25

Gráfico 1.6: Diagramas de dispersion

Covarianza y correlación. La covarianza es una medida del grado de asociación lineal entre dos variables. Si se tienen N pares de datos de dos variables, (x1, y1) . . . (xN, yN), la covarianza se denota por Sxy y se define:

Sxy =𝒄𝒐𝒗 𝒙, 𝒚 =𝟏

𝑵 (𝒙𝒊 − 𝒙 )(𝒚𝒊 − 𝒚 )

𝑵

𝒊=𝟏

Siendo 𝑥 e 𝑦 las medias aritméticas de las variables. La covarianza depende de las unidades de medida de las variables, lo que no permite comparar la relación entre distintos pares de variables medidas en unidades diferentes. En estos casos se utiliza el coeficiente de correlación lineal entre x e y, que se define:

rxy = corr(x, y)=𝑺𝒙𝒚

𝑺𝒙𝑺𝒚=

(𝒙𝒊−𝒙 )(𝒚𝒊−𝒚 )𝑵

𝒊=𝟏

(𝑥𝑖−𝑥 )2𝑁

𝑖=1 (𝑦𝑖−𝑦 )

2𝑁𝑖=1

El coeficiente de correlación lineal y la covarianza tienen el mismo signo: son positivos si existe relación lineal directa o positiva (figura b en el Gráfico 1.12), son negativos si existe relación lineal inversa o negativa (figura

Page 25: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 26

c) y toma valor cero si x e y son independientes (figura a) o cuando la relación, si existe, es no lineal (figura d). Además, su valor no depende del orden en que se consideren las variables, es decir, Sxy = Syx y rxy = ryx. A diferencia de la covarianza, el coeficiente de correlación es una medida adimensional de la relación que toma valores entre -1 y 1, −1 ≤ rxy ≤ 1: un coeficiente de correlación igual a uno en valor absoluto indica que las variables están relacionadas linealmente de forma exacta y los datos se sitúan sobre una línea. En Gretl, si se marcan las variables que interesan y se va a Ver →Matriz de correlación se obtiene una tabla (matriz) con los coeficientes de correlación para cada par de variables consideradas. El resultado para los datos de precios, tamaño y reforma de los pisos es:

Coeficientes de correlación, usando las observaciones 1 - 50 valor crítico al 5% (a dos colas) = 0.2787 para n = 50

Superficie Precio A_reformar

1.0000 0.8684 0.0440 Superficie 1.0000 0.2933 Precio 1.0000 A_reformar

Tabla 1.4: Matriz de coeficientes de correlación

Por ejemplo, el coeficiente de correlación entre el precio y el tamaño de los pisos se encuentra en la primera fila, columna tercera, (precio-superficie). Es decir, rprecio,superficie = 0.864, lo que indica que hay una fuerte relación lineal positiva entre estas variables. Hay que tener en cuenta que este coeficiente se define para variables cuantitativas, por lo que no lo aplicamos a la variable Reforma, excepto si se codifica.

Concepto de Linealidad:

Puesto que el objetivo del curso son los modelos lineales como el gráfico 1.5, es esencial entender lo que

significa el término lineal, ya que éste puede ser interpretado de dos formas diferentes.

El primer significado y posiblemente el más común de linealidad es aquel en que las esperanzas condicionales

de Y es una función lineal de Xi como es el caso del ejemplo del gráfico 1.5. Geométricamente, la curva de

regresión es una línea recta. En esta interpretación, una función de regresión como 2

1 2( )i iE Y X X

no es una función lineal porque la variable X aparece elevada a una potencia 2.

La segunda interpretación de linealidad se presenta cuando la esperanza condicional de Y, ( )iE Y X es una

función lineal de los parámetros, los β; pueden ser lineal en la variable X o pueden no serlo. De acuerdo con

esta interpretación 2

1 2( )i iE Y X X es un modelo regresión lineal en los parámetros. Para verlo con

detalle digamos que X asume el valor de 3. Por lo tanto 1 2( 3) (9)iE Y X , ecuación que es

obviamente lineal en 1 2 y , por tanto todos los modelos presentados en el gráfico 1.7 son modelos de

regresión lineal, es decir modelos lineales en los parámetros.

Page 26: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 27

Gráfico 1.7

Ejercicio 1: La siguiente tabla presenta las tasas de inflación para cinco países industrializados durante el

período 1960-1980. Tabla 2.1

Año USA INGLATERRA JAPON ALEMANIA FRANCIA

1960 1.5 1.0 3.6 1.5 3.6

1961 1.1 3.4 5.4 2.3 3.4

1962 1.1 4.5 6.7 4.5 4.7

1963 1.2 2.5 7.7 3.0 4.8

1964 1.4 3.9 3.9 2.3 3.4

1965 1.6 4.6 6.5 3.4 2.6

1966 2.8 3.7 6.0 3.5 2.7

1967 2.8 2.4 4.0 1.5 2.7

1968 4.2 4.8 5.5 1.8 4.5

1969 5.0 5.2 5.1 2.6 6.4

Page 27: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 28

Año USA INGLATERRA JAPON ALEMANIA FRANCIA

1970 5.9 6.5 7.6 3.7 5.5

1971 4.3 9.5 6.3 5.3 5.5

1972 3.6 6.8 4.9 5.4 5.9

1973 6.2 8.4 12.0 7.0 7.5

1974 10.9 16.0 24.6 7.0 14.0

1975 9.2 24.2 11.7 5.9 11.7

1976 5.8 16.5 9.3 4.5 9.6

1977 6.4 15.9 8.1 3.7 9.4

1978 7.6 8.3 3.8 2.7 9.1

1979 11.4 13.4 3.6 4.1 10.7

1980 13.6 18.0 8.0 5.5 13.3

Fuente: Libro de ecometría de Gujarati, 3ra. Edición – pagina 27. Cuestiones a resolver: 1.1 Grafíquese la tasa de inflación para cada país contra el tiempo (utilice el eje horizontal para el tiempo y eje vertical para la tasa de inflación).

(a) (b)

(c) (d)

Page 28: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 29

Gráficos 2.1 €

1.2 ¿Qué conclusiones generales se pueden inferir a cerca de los 5 países?

Gráfico 2.2

Page 29: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 30

1.3 ¿Qué países parecen tener la tasa de inflación más variable? ¿Se puede dar alguna explicación?

Estadísticos principales, usando las observaciones 1960 – 1980

Variable Media Mediana Mínimo Máximo USA 5.12381 4.30000 1.10000 13.6000 INGLATERRA 8.54762 6.50000 1.00000 24.2000 JAPON 7.34762 6.30000 3.60000 24.6000 ALEMANIA 3.86667 3.70000 1.50000 7.00000 FRANCIA 6.71429 5.50000 2.60000 14.0000 Variable Desv. Típica. C.V. Asimetría Exc. De curtosis USA 3.69498 0.721140 0.784310 -0.327139 INGLATERRA 6.32105 0.739510 0.941799 -0.133677 JAPON 4.63299 0.630543 2.60376 7.29502 ALEMANIA 1.67640 0.433553 0.368644 -0.838603 FRANCIA 3.57915 0.533064 0.653541 -0.785142

Tabla 2.2

1.4 Grafique la tasa de inflación para Inglaterra, Japón, Alemania y Francia contra la tasa de inflación de los Estados Unidos. (Utilice el eje horizontal para la tasa de inflación de los Estados Unidos y el eje vertical para las tasas de inflación de los otros cuatro países. Si se prefiere, es posible graficar cuatro diagramas separados)

Gráfico 2.3

Page 30: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 31

1.5 Realice comentarios generales sobre el comportamiento de la tasa de inflación en los cuatro países, en comparación en los Estados Unidos.

Gráfico 2.4

1.6 ¿Se observa algún cambio notorio en el comportamiento inflacionario de cada país en el tiempo y de los cuatro países con relación a Estados Unidos?

Japón parece ser el país que presenta el cambio más notorio, al pasar su inflación en forma creciente desde 1960 hasta el año 1994, cuando alcanza un 24.6%, pero a partir del año 1975, se redujo a menos de la mitad.

Sin embargo es significativo como Alemania mantuvo una inflación inferior al 7% durante todo el período, sin fluctuaciones aparentemente bruscas.

La relación de la inflación con respecto a E.U. según los gráficos 2.5 y 2.6, se aprecia una mejor similitud con Francia que con los otros países. Ambos países tienen rangos aproximados y en sus fluctuaciones son parecidas.

Page 31: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 32

Gráfico 2.6

Page 32: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 33

Gráfico 2.7

Page 33: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 34

Ejercicio 2: Considere los datos de la tabla 2.3, se refieren a la población de 60 familias de una comunidad hipotética, así como a sus ingresos semanales(X) y sus gastos de consumo semanal (Y), dados en dólares. Las 60 familias se dividen en 10 grupos de ingresos (de $80 a $260); así mismo, los gastos semanales de cada familia de los diversos grupos como se muestran en la tabla. Por consiguiente se tienen 10 valores fijos de X y los correspondientes valores Y para cada uno de los valores X; así que hay 10 subpoblaciones Y.

Tabla 2.3

Con los datos de la Tabla 2.3 y la ayuda del Software econométrico Gretl obtenemos el gráfico 2.8 y la tabla

con las medias y los rangos de cada grupo de familias según ingreso.

Page 34: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 35

Gráfico 2.8

Hemos calculado la media condicional E(YIXi)

Los cuales mostramos en la tabla de la izquierda

con su rango respectivo.

El gráfico 2.8 muestra el diagrama de dispersión

con el valor medio de cada consumo medio. Los

valores medios de Y aumentan en la medida que

el Ingreso (X) aumenta. La línea se conoce como

línea de regresión de Y sobre X.

De esta forma, la curva de regresión es

simplemente el lugar geométrico de las medias

condicionales o esperanzas de la variable

dependiente para los valores fijos de la(s)

variable(s) explicativa(s).

E(YIX)=17.0 + 0.60X

Page 35: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 36

2400

2500

2600

2700

2800

2900

3000

3100

3200

3300

3800 4000 4200 4400 4600 4800

Cons

umo

PIB

Consumo observada y estimada

observada

estimada

MODELO CLASICO DE REGRESIÓN LINEAL

SUPUESTOS DETRÁS DEL METODO DE MINIMOS CUADRADOS El modelo de Gauss o método clásico estándar de regresión lineal (MCRL), el cual es el cimiento de la mayor parte de la teoría econométrica, plantea 10 supuestos. Primero estudiaremos estos supuestos en el contexto del modelo de regresión de dos variables y, posteriormente los extenderemos para regresión múltiple (varias variables explicativas o independientes).

Supuesto 1: Modelo de regresión lineal. El modelo de regresión es lineal en los parámetros, como se observa en la ecuación 2.1

1 2 i iy X Ec. 2.1

1 y 2 son los parámetros del modelo, 1 es el intercepto con la variable Y, 2 es la pendiente y

i es conocido como el término de perturbación, o de error es una variable aleatorio (estocástica)

que tiene propiedades probabilísticas claramente definidas. El termino perturbación i puede

representar claramente todos aquellos factores que afectan el consumo pero que no son considerados en el modelo en forma explícita.

Año Consumo PIB

1980 2447.1 3776.3

1981 2476.9 3843.1

1982 2503.7 3760.3

1983 2619.4 3906.6

1984 2746.1 4148.5

1985 2865.8 4279.8

1986 2969.1 4404.5

1987 3052.2 4539.9

1988 3162.4 4718.6

1989 3223.3 4838.0

1990 3260.4 4877.5

1991 3240.8 4821.0

Tabla 3.1

Consumo=-231.795+0.7194*PIB + μ

La tabla 3.1 de la izquierda muestra el gasto de consumo

personal y el Producto Interno Bruto (PIB), del período

1980-1991 en miles de millones de dólares. (EU).

El economista Kenes planteo en lo que se conoce como la

ley sicológica fundamental…los hombres (y las mujeres)

como regla general y en promedio, están dispuestos a

incrementar su consumo a medida que su ingreso aumenta,

pero no en la misma cuantía del aumento en su ingreso.

Vamos a ver como se confirma esta ley económica en

nuestro ejemplo. Donde el consumo será la variable

dependiente y el PIB es el predictor o xplicativa.

Page 36: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 37

Gráfica 3.1 Modelo 1: MCO, usando las observaciones 1980-1991 (T = 12)

Variable dependiente: Consumo

Coeficiente Desv. Típica Estadístico t Valor p const -231.795 94.5275 -2.4521 0.03413 ** PIB 0.719433 0.0217495 33.0781 <0.00001 ***

Media de la vble. dep. 2880.600 D.T. de la vble. dep. 314.4417 Suma de cuad. residuos 9850.106 D.T. de la regresión 31.38488 R-cuadrado 0.990943 R-cuadrado corregido 0.990038 F(1, 10) 1094.160 Valor p (de F) 1.51e-11 Log-verosimilitud -57.28925 Criterio de Akaike 118.5785 Criterio de Schwarz 119.5483 Crit. de Hannan-Quinn 118.2194 rho 0.284603 Durbin-Watson 1.284183

Tabla 3.2 Aplicando el método de mínimos cuadrados ordinarios, para determinar el modelo , obtuvimos La ecuación Consumo = -231.795 + 0.719433*PIB + μ.

Rango de estimación del modelo: 1980 - 1991

Desviación típica de los residuos = 31.3849

Consumo estimada Residuo (μ) 1980 2447.10 2485.00 -37.9015 1981 2476.90 2533.06 -56.1597 1982 2503.70 2473.49 30.2094 1983 2619.40 2578.74 40.6563 1984 2746.10 2752.77 -6.67466 1985 2865.80 2847.24 18.5637 1986 2969.10 2936.95 32.1504 1987 3052.20 3034.36 17.8391 1988 3162.40 3162.92 -0.523681 1989 3223.30 3248.82 -25.5240 1990 3260.40 3277.24 -16.8417 1991 3240.80 3236.59 4.20633

Estadísticos de evaluación de la predicción Error medio 7.5791e-014 Error cuadrático medio 820.84 Raíz del Error cuadrático medio 28.65 Error absoluto medio 23.938 Porcentaje de error medio -0.015052 Porcentaje de error absoluto medio 0.88231 U de Theil 0.34359

Tabla 3.3

Page 37: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 38

Supuesto 2: Los valores de X son fijos en muestreo repetido. Los valores que toma el regresor X son considerados fijos en muestreo repetido. Más técnicamente, se supone no estocásticos. Esto significa que el análisis de regresión es un análisis de regresión condicional, esto es, condicionado a los valores dados del (los) regresor(es) X.

Supuesto 3: El valor medio de la perturbación μ es cero. Dado el valor de X, la media, o el valor esperado del término aleatorio de perturbaciones μi es cero. Técnicamente, el valor de la media condicional de μi es cero. Simbólicamente, se tiene

( / ) ( ) 0i i iE X E Ec. 2.2

En el Modelo de la tabla 3.2 y con los residuos de la tabla 3.3. Vemos que se cumple este supuesto

dado que E(μ)= -0.000000917 este valor es casi cero. Esto implica que 1 2( / )i i iE X X

Supuesto 4: Homoscedasticidad (igual (homo), dispersión(cedasticidad)) o igual varianza de μi . Dado

el valor de X la varianza de μi es igual para todas las observaciones. Esto es La varianza condicional de

μi son idénticas. Simbólicamente se tiene: 2

2

2

( ) ( )

=

=

i i i i i

I i

var X E E X

E X

Gráfica 3.2 Homoscedasticidad Gráfico 3.3 Heterocedasticidad

2var( )i X Ec. 2.3

Esto implica que las varianzas condicionales de Yi también son homoscedoscasticas.

2var( )iY X Ec. 2.4

Supuesto 5: No autocorrelación entre las perturbaciones. Dados dos valores cualesquiera X.

Xi y Xj (i≠ 𝒋), la correlación entre ui y uj para cualquier (i≠ 𝑗) es cero. Simbólicamente.

por el supuesto 3. Esto significa que a

diversos valores de X, se tiene la misma

varianza.

Page 38: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 39

i

var( , , ) ( ) ( )

= E( )( )

=0 por Ec. 2.2

i j i j i i i j j j

i j j

X X E E X E X

X X

Gráfico 3.4

Técnicamente el supuesto 5, plantea la no correlación serial o no autocrrelación. Esto significa que

dado un Xi, las desviaciones de dos valores cualesquiera de Y de su media no muestran patrones

como los dados en la gráfica 3.4(a) y 3.4(b). En la gráfica 3.4(a) se ve que los μ están correlacionados

positivamente, en la gráfica 3.4(b) los μ están correlacionados negativamente mientras que en la

3.4(c) no hay un patrón sistemático para los μ, indicado así cero correlación.

Supuesto 6: La covarianza entre μi y Xi es cero, o E(μi , Xi)=0. Formalmente.

i

i

cov( , ) ( ) ( )

= E ( ( )) puesto que E( ) 0

= E( ( ) ( ) ( ) puesto que E(X ) es no estocástica

= E( )

i i i i i i

i i i

i i i i

i i

X E E X E X

X E X

X E X E

X

i por que E( ) 0

= 0 por supuesto

Este supuesto establece que la perturbación u y la variable X no están correlacionadas.

Page 39: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 40

Gráfico 3.5

Modelo 2: MCO, usando las observaciones 1980-1991 (T = 12) Variable dependiente: Residuos

Coeficiente Desv. Típica Estadístico t Valor p

const -0.0860368 94.5668 -0.0009 0.99929

PIB 2.18138e-05 0.0217586 0.0010 0.99922

Media de la vble. dep. 0.008333 D.T. de la vble. dep. 29.93674

Suma de cuad. residuos 9858.288 D.T. de la regresión 31.39791

R-cuadrado 0.000000 R-cuadrado corregido -0.100000

F(1, 10) 1.01e-06 Valor p (de F) 0.999220

Log-verosimilitud -57.29423 Criterio de Akaike 118.5885

Criterio de Schwarz 119.5583 Crit. de Hannan-Quinn 118.2294

rho 0.284333 Durbin-Watson 1.284891

Tabla 3.4

Supuesto 7: El número de observaciones n debe ser mayor que el número de parámetros por estimar.

Alternativamente el número de observaciones n debe ser mayor que el número de variables explicativas.

Supuesto 8: Variabilidad en los valores de X. No todos los valores de X en una muestra dada deben de ser

iguales. Técnicamente la varianza de X, var(X) debe ser un número positivo finito.

Esto es si todos los valores X son idénticos entonces (Xi=𝑋 ). Los valores de los estimadores de los

parámetros de 𝛽1 𝑦 𝛽2 serían imposible, dado que el denominador de estas ecuaciones sería cero.

2 2

( )( )

( )

i i

i

X X Y Y

X X

y

1 2Y X

1. Supuesto 9: El modelo de regresión está correctamente especificado. Alternativamente, no hay un sesgo

de especificación o errores en el modelo utilizado en el análisis empírico.

Este supuesto es muy importante porque la omisión de variables del modelo o la escogencia de una

forma funcional equivocada, o la consideración de supuestos estocásticos equivocados sobre las variables

del modelo, harán muy cuestionable su validez de la interpretación de la regresión estimada.

El gráfico 3.5 muestra los valores de las

perturbaciones (errores) y la variable

independiente PIB (X) del modelo de la tabla 3.1.

Que como se puede apreciar no están

correlacionada es decir tienen correlación cero.

En la tabla 3.4 se muestra que la correlación

entre los errores y PIB es cero.

Page 40: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 41

Supóngase que se seleccionan los dos modelos siguientes para describir la relación entre la tasa de

cambio de los salarios monetarios y la tasa de desempleo:

1 2i i iY X Ec. I donde Yi = la tasa de cambio de los salarios monetarios y

1 2

1i i

i

YX

Ec. II Xi = la tasa de desempleo.

Gráfica 3.6

El ejemplo ilustra lo que se conoce como el sesgo de especificación o el error de especificación; aquí el

sesgo consiste en escoger la forma funcional equivocada.

Supuesto 10: No hay multicolinealidad perfecta. Es decir, no hay relaciones perfectamente lineales entre

las variables explicativas.

Estos 10 supuestos son referentes, recuérdese que en cualquier estudio científico se hacen ciertos

supuestos porque ellos facilitan el desarrollo de la materia objeto de estudio en pasos graduales, no

porque ellos sean necesariamente realistas en el sentido de que repliquen la realidad exactamente.

Como lo anota su autor “…si la simplicidad es un criterio deseable de una buena teoría, todas las buenas

teorías idealizan y sobresimplifican violentamente”2

Métodos de Mínimos Cuadrados Ordinarios Para la estimación de los parámetros de la ecuación de regresión se pueden usar el método de mínimos

cuadrados ordinarios (MCO) o el método de máxima verosimilitud (MV). Pero estos dos

Métodos producen valores estimados idénticos de los coeficientes de regresión, por lo explicaremos las

ecuaciones del MCO.

Dado el modelo de regresión lineal con k-1 variables explicativa.

1 2 2 3 3 ...i i i k ki iY X X X Ec. 3.0

2 Mark Blaug, The Methodology Economics: Or How Economists Explain, 2da. Ed., Cambridge university press, New York.

El modelo de regresión (I) es lineal en los parámetros al igual

que en las variables, mientras que (II) es lineal en los

parámetros, pero no lo es respecto a la variable.

Vemos la gráfica 3.6, si el modelo (II) es el correcto o

verdadero, el ajuste del modelo (I) a los puntos dispersos

que aparecen en la gráfica 3.6 nos dará predicciones

erróneas: Entre los puntos A y B, para cualquier Xi dado, el

modelo (I) sobreestimará el valor verdadero de la media de

Y, mientras que hacia la izquierda de A (o hacia la derecha de

B) el modelo subestimará (o sobrestimará en términos

absolutos) el valor verdadero de la media de Y.

Page 41: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 42

Donde β1 es el intercepto, β2 a βk son los coeficiente (pendientes) parciales, μ es el término de

perturbación estocástica e i es el iésima observación siendo n el tamaño de las observaciones. La

función de regresión es la media o valor esperado de Y condicionado a los valores fijos de 2 3, ,.., kX X X

es decir, 2 3( , ,.., )kE Y X X X .

La Ec. 3.0 es una expresión abreviada para el siguiente conjunto de n ecuaciones simultáneas:

1 1 2 21 3 31 1 1... k kY X X X

2 1 2 22 3 32 2 2... k kY X X X

………………………………………………………………………………………

1 2 2 3 3 ...n n n k kn nY X X X

El sistema de ecuaciones lineales anterior puede escribirse en una forma alterna aunque más ilustrativa,

donde las letras minúsculas son vectores filas o columnas y las mayúsculas son las matrices.

1 121 31 1

1

22 32 2 2 2

2

2 3

1

1

1

k

k

n n n kn k n

X X XY

X X XY

Y X X X

Y = X β + μ nx1 nxk kx1 nx1

Donde:

y : vector columna nx1, de observaciones sobre la variable dependiente Y

X : matirz nxk, que contiene n observaciones sobre las k-1 variables de X2 a Xk, la primer columna de

números 1 representan el término del intercepto. (Esta matriz es llamada matriz de información)

β :vector columna, k-1, de los parámetros desconocidos β1, β2, …, βk

μ : vector columna nx1, de n perturbaciones μi

Por lo que puede escribirse en forma matricial como

y =Xβ + μ

Page 42: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 43

Para estimar los parámetros de β, por el método MCO aplicamos la ecuación matricial siguiente.

1

' 'X X X y

Donde X’ es la matriz traspuesta de X, (X’X) es el producto de la matriz traspuesta X por la matriz X, (X’X)-1

es la inversa de ese producto, el cual se debe multiplicar por la traspuesta de X y por el vector y

Coeficiente de determinación R2 en notación matricial

El coeficiente de determinación r2 (caso de dos variables) o R2 (regresión múltiple) es una medida resumen

que nos dice que tan bien se ajusta la línea de regresión a los datos. Por lo que 20 1R

En la medida que el coeficiente de determinación se aproxima a 1, el ajuste es casi perfecto y por lo tanto μ

(las perturbaciones) se reducen a casi cero.

1SEC SRC

STC STC

STC SEC SRC

Donde 2 SEC

RSTC

2 1

SRCR

STC

22

2

' '

'

X y nYR

y y nY

Escribiendo en forma matricial el coeficiente de determinación será igual:

22

2

' '

'

X y nYR

y y nY

; Donde β’ es la traspuesta del vector columna de los parámetros, X’ la traspuesta

de la matriz de información, y vector columna de las observaciones sobre la variable Y, y’ la traspuesta del

vector y, n el número de observaciones, 𝑌 2 la media al cuadrado de la variable dependiente Y.

SEC: suma explicada de cuadrados

SRC: suma de residuales cuadrados

STC: suma total de cuadrados.

Page 43: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 44

Ejemplo de Estimación de un modelo de regresión econométrico

Observación Y X1 X2 X3 1993 3 1 8 16

1994 2 2 15 17

1995 4 2.5 10 18

1996 5 3 9 15

1997 5 4 7 17

1998 7 5 6 20

1999 6 7 8 19

2000 8 8 4 21

2001 9 9 3 22

2002 12 15 1 23

Tabla 3.5

I. Marco teórico: Teoría del consumo Con Y: consumo, X1: Ingreso, X2: Inflación, X3: Inversión, con una serie de 10 años para cada una de las variables, haciendo Y=f(X1, X2). Verificar la teoría económica de que el consumo, Y varia en razón directa del ingreso X1, y en razón inversa de la inflación, X2. Lo anterior significa, entre otras cosas, comprobar que el coeficiente del regresor o variable exógena, X1, tiene signo positivo, en tanto que el coeficiente de la otra variable exógena, X2, tiene signo negativo. Con el software Getl estimamos el modelo introduciendo Y (consumo )como variable dependiente y como

variabes exógenas o independientes las variables X1 y X2.

Aparece la siguiente tabla 2.1

Modelo 1: MCO, usando las observaciones 1993-2002 (T = 10) Variable dependiente: Y

Coeficiente Desv. Típica Estadístico t Valor p

const 5.80084 0.976443 5.9408 0.00058 *** X1 0.442193 0.0760173 5.8170 0.00065 *** X2 -0.309751 0.081265 -3.8116 0.00661 *** Media de la vble. dep. 6.100000 D.T. de la vble. dep. 2.998148 Suma de cuad. residuos 2.159601 D.T. de la regresión 0.555441 R-cuadrado 0.973305 R-cuadrado corregido 0.965678 F(2, 7) 127.6122 Valor p (de F) 3.11e-06 Log-verosimilitud -6.526078 Criterio de Akaike 19.05216 Criterio de Schwarz 19.95991 Crit. de Hannan-Quinn 18.05635 Rho -0.374018 Durbin-Watson 2.464587

Tabla 3.6

Page 44: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 45

Resolviendo por Algebra lineal de MCO

3

2

4

5

5

7

6

8

9

12

Y

1 1 8

1 2 15

1 2.5 10

1 3 9

1 4 7

1 5 6

1 7 8

1 8 4

1 9 3

1 15 1

X

0

1

2

0

1 ´

1

2

'X X X Y

1'

1 1 8 1 1 8 1 1 8

1 2 15 1 2 15 1 2 15

1 2.5 10 1 2.5 10 1 2.5 10

1 3 9 1 3 9 1 3 9

1 4 7 1 4 7 1 4 7

1 5 6 1 5 6 1 5 6

1 7 8 1 7 8 1 7 8

1 8 4 1 8 4 1 8

1 9 3 1 9 3

1 15 1 1 15 1

'3

2

4

5 5.800837487

5 0.4421934197

7 -0.3097507477

6

4 8

1 9 3 9

1 15 1 12

Page 45: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 46

0

1

2

5.800837487

0.4421934197

-0.3097507477

1 2Y = 5.800837487 + 0.4421934197*X - 0.3097507477*X

Y X Vamos a calcular Y estimados a partir de la ecuación obtenida con los estimadores.

1 1 8 3.765024925

1 2 15 2.038963110

1 2.5 10 3.808813559

1 3 9 4.339661016 5.800837487

1 4 7 5.401355931 0.4421934197

1 5 6 6.153300099 -0.3097507477

1 7 8 6.41818544

1 8 4

1 9 3

1 15 1

Y X

3

8.099381853

8.851326021

12.12398803

3 3.765024925 -0.765

2 2.038963110

4 3.808813559

5 4.339661016

5 5.401355931

7 6.153300099

6 6.418185443

8 8.099381853

9 8.851326021

12 12.12398803

e Y Y

0249250

-0.0389631109

0.1911864406

0.6603389830

-0.4013559319

0.8466999006

-0.4181854433

-0.0993818538

0.1486739787

-0.1239880347

La sumatoria de los errores e o μ como le

hemos llamado es cero. Es decir ∑e=0

Los valores e o μ son las perturbaciones o

desviaciones. En la medida que las

perturbaciones tienen a cero, el modelo

puede ser un buen predictor, dado que las

variables explicativas o exógenas explicarían

muy bien a la variable dependiente.

Page 46: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 47

10

1

1 1(3 2 4 5 5 7 6 8 9 12) 6.1

10 10i

i

Y y

n=10

´

2

22

2

1 1 8 3

1 2 15 2

1 2.5 10 4

1 3 9 5

1 4 7 55.800 0.442 -0.309 10(6.1)

1 5 6 7

1 7 8 6

1 8 4 8

1 9 3 9

' ' 1 15 1 12

' 3

2

4

5

5

7

6

8

9

12

X y nYR

y y nY

´

2

3

2

4

5

510(6.1)

7

6

8

9

12

2 450.8404534 - 372.1 78.74045340.973305975

453-372.1 80.9R (Coeficiente de determinación)

Los estimadores MCO, bajo los supuestos indicados anteriormente son lineales, insesgados y óptimos, en

el sentido de tener la misma varianza dentro de la clase de estimadores lineales e insesgados (teorema de

Gauss-Markov).

La linealidad no requiere de demostración; es evidente en el cálculo de los coeficientes en

Page 47: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 48

1

' ´X X X Y

, la relación lineal que una al vector de estimadores con la matriz que contiene los

valores observados de las variables.

Para demostrar que el estimador es insesgado se parte de:

1. 1

´ ´X X X Y

2. 1

´ ´( )X X X X e

se sustituyó Y X e en (1)

3. 1 1

´ ´ ´ ´X X X X X X X e

se realizaron los productos planteados en (2)

4. 1

´ ´I X X X e

en el primer término del segundo miembro se sabe que 1

´ ´X X X X I

en (3)

5. 1

´ ´I X X X e

como I es un vector identidad que al multiplicarlo con β no cambia, por lo que

6. 2

1

´T

t

t

SCR e e e

ahora utilizaremos el operador esperanza matemática E, nos quedará

7. 1

´ ´E X X X E e

pero como E(e)=0, dado que la media de los errores es cero.

8. E por lo que queda demostrado que los estimadores β son insesgado.

La varianza de las perturbaciones 2

e se puede estimar mediante la expresión.

2 e eS

T k

´

2

-0.7650249250 -0.7650249250

-0.0389631109 -0.0389631109

0.1911864406 0.19

0.6603389830

-0.4013559319

0.8466999006

-0.4181854433

-0.0993818538

0.1486739787

-0.1239880347S

11864406

0.6603389830

-0.4013559319

0.8466999006

-0.4181854433

-0.0993818538

0.1486739787

-0.12398803470.3085055695

7

Page 48: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 49

Un estimador insesgado de La matriz de varianza y covarianza V es

2 1( ´ )V S X X

1 1 8 1 1 8

1 2 15 1 2 15

1 2.5 10 1 2.5 10

1 3 9 1 3 9 0.9534134450

1 4 7 1 4 70.3085055695

1 5 6 1 5 6

1 7 8 1 7 8

1 8 4 1 8 4

1 9 3 1 9 3

1 15 1 1 15 1

V

-0.06850689645 -0.07542238354

-0.06850689645 0.005778455931 0.005050509921

-0.07542238354 0.005050509921 0.006603803167

1 2 1 3 1

2 1 2 3 2

3 1 3 2 3

V( ) Cov( ) Cov( )

Cov( ) V( ) Cov( )

Cov( ) Cov( ) V( )

V

La suma de los cuadrados de los residuos (SCR o SRC) se puede obtener de la siguiente manera.

2

1

´T

t

t

SCR e e e

´-0.7650249250 -0.7650249250

-0.0389631109 -0.0389631109

0.1911864406 0.1

0.6603389830

-0.4013559319

0.8466999006

-0.4181854433

-0.0993818538

0.1486739787

-0.1239880347

SCR

911864406

0.6603389830

-0.40135593192.159538983

0.8466999006

-0.4181854433

-0.0993818538

0.1486739787

-0.1239880347

Page 49: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 50

Suma explicada de cuadrados o de la regresión SEC se define como:

2

'SEC X Y nY

'

2

1 1 8 3

1 2 15 2

1 2.5 10 4

1 3 9 5 5.800837487

1 4 7 5 0.4421934197 (10)(6.1) 450.8127620-372.1=78.

1 5 6 7 -0.3097507477

1 7 8 6

1 8 4 8

1 9 3 9

1 15 1 12

SEC

71276

La Suma total de cuadrados STC se obtiene por la siguiente fórmula matricial

2'STC y y nY

'

2

3 3

2 2

4 4

5 5

5 5(10)(6.1) 453-372.1=80.9

7 7

6 6

8 8

9 9

12 12

STC

STC SEC SRC Suma de Cuadrados Fórmula Valor

Debido a las variables X1 y X2 SEC = 2

'X Y nY 78.7

Debido a los residuos 2

1

´T

t

t

SCR e e e

2.2

Total 2'STC y y nY

80.9

Page 50: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 51

Tabla 2.1: Estimación del modelo de regresión lineal

Esta ecuación es la que utilizaríamos para “predecir”.

II. Diagnóstico

El modelo de regresión:

𝒚 = 𝜷𝟎 + 𝜷𝟏𝑿𝟏 + 𝜷𝟐𝑿𝟐 + 𝝁

1. La ecuación Y = 5.800837487 + 0.4421934197*X1 - 0.3097507477*X2 +μ , en lo que se refiere

a los signos de los coeficientes de X1 y X2 cumplen con lo especificado por la teoría del consumo.

2. Las pruebas de significación estadísticamente usando α=5% realizadas con t, para β1, β2 y F para R2 tienen una probabilidad de casi cero; 00065,00661 y 3.11e-06 respectivamente, lo cual, corrobora que X1 y X2 explican satisfactoriamente a Y. (para prueba de hipótesis Ho: β1=0 y H1: β1≠ 0)

3. En ese sentido R2= 0.973305 como R2 corregido = 0.965678 muestra que X1, X2 son suficientes para explicar a Y; no se necesita otra variable para determinar el comportamiento presente y futuro de Y. Por lo que error o perturbación 𝜇 es mínimo.

4. Sin embargo, independientemente de verificar si fueron o no violados algunos supuestos del modelo estimado con el método de mínimos cuadrados, digamos la homocedasticidad, la eficiencia, ausencia de autocorrelación o de multicolinealidad entre las variables exógenas, con este ejercicio haremos otras pruebas con el propósito de asegurarnos que la ecuación de regresión múltiple antes descrita sirva para pronósticar y visualizar escenarios futuros, es decir, para hacer planeación sobre el consumo. Dichas pruebas adicionales son:

III. Pruebas de especificación del modelo.

1. Omisión de variables explicativas, digamos X3. Para verificar si omitimos algún regresor explicativo en el modelo aplicamos la X2 (ji) cuadrada en su “razón de verosimilitud” como el estadístico F, que permiten incorporar; uno o varios regresores explicativos y probar si su contribución al modelo es significativo estadísticamente. Así, planteamos con α=5%. Ho: una o varias variable(s) explicativa(s) no es (son) significativa(s) estadísticamente. No debe(n) incorporarse al modelo: en este caso X3. (Ho: La variable explicativa o exógena X3 no es significativa para el modelo de regresión)

Page 51: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 52

Ha: Todo lo contrario de Ho, es decir, que si verificamos que es (son) significativa(s) estadísticamente, entonces debemos incorporarla(s) al modelo, porque también determina(n) el comportamiento de la variable endógena Y. (Ha: La variable explicativa o exógena X3 es significativa para el modelo de regresión) Para contrastar la contribución de las variables explicativas nuevas se requiere que éstas, también llamadas “omitidas”, tengan el mismo tamaño de muestra que Y, X1, X2; además, que el modelo especifique la ordenada al origen; C, y, Y, X1, X2. Así, de la ecuación partimos, de su cuadro, nos colocamos en Gretl/Constrastes/Añadir variables

Modelo 2: MCO, usando las observaciones 1993-2002 (T = 10) Variable dependiente: Y

Coeficiente Desv. Típica Estadístico t Valor p

Const 4.60929 2.90367 1.5874 0.16352 X1 0.407127 0.11358 3.5845 0.01158 ** X2 -0.303439 0.0875832 -3.4646 0.01339 ** X3 0.071535 0.162801 0.4394 0.67575

Media de la vble. dep. 6.100000 D.T. de la vble. dep. 2.998148 Suma de cuad. residuos 2.092274 D.T. de la regresión 0.590519 R-cuadrado 0.974138 R-cuadrado corregido 0.961206 F(3, 6) 75.33212 Valor p (de F) 0.000037 Log-verosimilitud -6.367718 Criterio de Akaike 20.73544 Criterio de Schwarz 21.94578 Crit. de Hannan-Quinn 19.40769 Rho -0.291849 Durbin-Watson 2.324024

Tabla 3.7

La diferencia entre ambas F’s es la siguiente, la F asociada a la prueba de omisión de la variable X3 con un F=127.6122 y el F con X3 que asume un valor de 75.33212 es la evaluación de la regresión Y f(X1,X2) y se construye:

𝑭 =

𝑹𝟐

(𝒌−𝟏)

(𝟏−𝑹𝟐)/(𝒏−𝒌) =

𝟏𝟐𝟕.𝟔𝟏𝟐𝟐

𝟕𝟓.𝟑𝟑𝟐𝟏𝟐 = 1.69399

Donde k es el número de parámetros de la regresión y n el número de observaciones. Como la probabilidad de p de la variable X3 es 0.67575 >5%, aceptamos Ho y decidimos no incluir en el modelo a X3 como variable explicativa. Si hubiéramos aceptado Ha usaríamos la nueva ecuación de regresión sería Y=f(X1, X2, X3). 2. Variables explicativas redundantes, digamos X2.

Page 52: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 53

Hacemos el contrasta de hipótesis para la variable X2, variable exógena, con el fin de cerciorarse de que no sobra o de que es redundantes. Así con α=5% supóngase que Ho: X2 es redundante o no significativa para el modelo Ha: X2 no es redundante

Como en el ejemplo anterior partimos del cuadro de la ecuación de regresión en que Y=f(X1, X2),

Modelo 3: MCO, usando las observaciones 1993-2002 (T = 10)

Variable dependiente: Y

Coeficiente Desv. Típica Estadístico t Valor p

Const 2.26316 0.497606 4.5481 0.00188 ***

X1 0.679087 0.0718046 9.4574 0.00001 ***

Media de la vble. Dep. 6.100000 D.T. de la vble. Dep. 2.998148

Suma de cuad. Residuos 6.641826 D.T. de la regresión 0.911169

R-cuadrado 0.917901 R-cuadrado corregido 0.907638

F(1, 8) 89.44309 Valor p (de F) 0.000013

Log-verosimilitud -12.14339 Criterio de Akaike 28.28679

Criterio de Schwarz 28.89196 Crit. De Hannan-Quinn 27.62292

Rho -0.287563 Durbin-Watson 2.526715

Tabla 3.8 Comparación entre el modelo 1 y el modelo 3: Hipótesis nula: el parámetro de regresión es cero para X2 (X2 redundante) Estadístico de contraste: F(1, 7) = 14.5284, con valor p = 0.00661399 De los 3 estadísticos de selección de modelos, 0 han mejorado. Hipótesis nula: el parámetro de regresión es cero para X2 Estadístico de contraste asintótico: Chi-cuadrado de Wald(1) = 14.5284, con valor p = 0.000138062 Dist. F: F(1, 7) = 14.5284, con valor p = 0.00661399 El modelo se ha desmejorado al omitir a X2, por lo que se acepta a Ha. Lo que se puede apreciar viendo los R2 de los modelos Y(x1,x2) y Y(x1). Los p obtenidos son menores que 5%, por lo que aceptamos Ha y al no ser redundante el X2, la conservamos en el modelo como regresor explicativo de Y.

IV. Pruebas de estabilidad estructural I. Contraste de Chow Se usa cuando se piensa que dentro de la serie de años hay un año en que por razones extremas cambió la trayectoria de la variable endógena; en nuestro caso con 10 años suponga que en el año 6, ocurrió el

Page 53: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 54

desquiciamiento de la economía, es decir, que el año 6 es 1998. Por el desequilibrio económico hay razones de peso para pensar que cambió el valor de Y. Para verificarlo, con α=5% establecemos la hipótesis nula de estabilidad estructural. Ho: Hay un solo modelo para todos los datos (modelo restringido) Ha: Cada subgrupo en que se dividen los datos tiene un comportamiento diferente: no hay un solo modelo hay dos. Luego si no hay diferencias estadísticas significativas entre el modelo restringido y el otro aceptamos Ho: de estabilidad estructural del modelo; en caso contrario, aceptamos Ha y decimos que hubo un cambio estructural en el año 6 que fue 1998, en que todo el sistema económico se trastoco. Para probar Ho dividimos en dos muestras nuestros datos: la primera del año 1993 a 1998 y la segunda del año 1999 a 2002. Como siempre partimos del cuadro que muestra Y=f(X1,X2), de Gretl/Contrastes/Contraste de Chow/1998 damos click y se genera el cuadro:

Modelo 4: MCO, usando las observaciones 1993-2002 (T = 10) Variable dependiente: Y

Coeficiente Desv. Típica Estadístico t Valor p

Const 5.80084 0.976443 5.9408 0.00058 *** X1 0.442193 0.0760173 5.8170 0.00065 *** X2 -0.309751 0.081265 -3.8116 0.00661 ***

Media de la vble. dep. 6.100000 D.T. de la vble. dep. 2.998148 Suma de cuad. residuos 2.159601 D.T. de la regresión 0.555441 R-cuadrado 0.973305 R-cuadrado corregido 0.965678 F(2, 7) 127.6122 Valor p (de F) 3.11e-06 Log-verosimilitud -6.526078 Criterio de Akaike 19.05216 Criterio de Schwarz 19.95991 Crit. de Hannan-Quinn 18.05635 Rho -0.374018 Durbin-Watson 2.464587

Tabla 3.9

Contraste de Chow de cambio estructural en la observación 1998 -

Vemos que podemos aceptar Ho dado que obtenidos un estadístico de contraste de Chow F(3, 4) = 0.96295 con valor p = P(F(3, 4) > 0.96295) = 0.491917 Contraste de razón de verosimilitudes de Quandt para cambio estructural en un punto desconocido, con recorte del 15 por ciento: Contraste QLR de cambio estructural - Hipótesis nula: no hay cambio estructural Estadístico de contraste: máxi F(2, 5) = 4.73123 en la observación 1994 (Valor crítico al 10 por ciento = 5.00) Por tanto

2. Contraste Breusch-Godfrey de autocorrelación de primer orden MCO, usando las observaciones 1993-2002 (T = 10) Contraste LM de autocorrelación hasta el orden 1 -

Page 54: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 55

Hipótesis nula: no hay autocorrelación Ha: hay autocrrelación Estadístico de contraste: LMF = 1.03113, con valor p = P(F(1,6) > 1.03113) = 0.349078, Por lo tanto aceptamos la hipótesis nula de no autocorrelación. 3. Análisis de Heteroscedásticidad Ho: No hay heterocedasticidad Ha: Hay heterocedasticidad Contraste de heterocedasticidad de White Hipótesis nula: No hay heterocedasticidad Estadístico de contraste: LM = 5.62126, con valor p = P(Chi-Square(5) > 5.62126) = 0.344833,.Por lo tanto aceptamos la hipótesis nula de no autocorrelación. 4. Contraste de normalidad de los residuos Hipótesis nula: el error se distribuye normalmente Ha: Los errores no se distribuyen normalmente Estadístico de contraste: Chi-cuadrado(2) = 0.59373 con valor p = 0.743144

Gráfica 3.7

Este gráfico de estabilidad de los errores se obtiene con el Contraste CUSUMSQ de estabilidad de los parámetros 5. Estimación recursiva Es útil cuando se trabaja con datos temporales como estos y se desconoce el año en que se produjo el cambio estructural. Esta prueba consiste en la estimación secuencial del modelo especificado para distintos tamaños muéstrales. Si k=número de parámetros, entonces la primera muestra, su tamaño es k+1, que usamos para estimar el modelo: de 1993 a 1995 porque son dos parámetros. En las siguientes muestras añadimos una a una todas las observaciones hasta agotar el total de la información3. De las Ha: Los estimadores de los parámetros no se mantendrán constantes al ir aumentando las muestras secuencialmente.

3 Carrascal; et al;2000:193

Suma acumulada de los cuadrados de los

residuos. ('*' indica un valor fuera de la banda

de 95% de confianza)

1996 0.004 1997 0.388 1998 0.452

1999 0.957 * 2000 0.976 2001 0.979 2002 1.000

Page 55: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 56

El valor de Rho ( 𝜌) en el modelo final del modelo econométrico es -0.374018, sabemos que 𝜌 es un valor

constante entre -1 y 1. La ecuación de 𝜌 muestra que bajo el esquema AR(1), la varanza de 𝜇𝑡 todavía es

homoscedástica; no obstante, 𝜇𝑡 correlacionada no sólo con su valor inmediato anterior, sino con sus valores

de varios períodos anteriores. Resulta crítico notar que 𝜌 < 1; es decir el valor absoluto de de rho es

menoer que 1. Si reho hubiera sido 1, las varianzas y covarianzas listadas antes no estarían definidas. Como

𝜌 < 1, se dice que el proceso AR(1) es estacionario; es decir, la media, varianza y covarianza de μt no

cambia respecto al tiempo.

6. Predicciones

Con el modelo estimado suficiente comprobado que es eficiente y consistente para predicción, vamos a

estimar las predicciones Y para los años 2003 y 2004, y obtenemos los resultados indicado en la tabla

mostrada esas predicciones se pueden apreciar en forma gráfica.

Para intervalos de confianza 95%, t(7, .0.025) = 2.365

Observaciones Y predicción Desv. Típica Intervalo de confianza 95% 1999 6.00 6.42 2000 8.00 8.10 2001 9.00 8.85 2002 12.00 12.12

2003 12.26 0.773 10.43 - 14.08 2004 11.90 1.045 9.43 - 14.37

Gráfica 3.8

Gráfico de serie temporal Y versus tiempo.

6

7

8

9

10

11

12

13

14

15

1999 2000 2001 2002 2003 2004

Y

predicción

Intervalo de 95 por ciento

Page 56: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 57

Gráfica 3.9

21 2 1 3 4t tt tY X X time

Es consistente el modelo econométrico?

215.05222 0.333559 0.274677 0.202433t tt tY X X time

Modelo 1: MCO, usando las observaciones 1993-2002 (T = 10)

Variable dependiente: Y

Coeficiente Desv. Típica Estadístico t Valor p

const 5.05222 1.17311 4.3067 0.00506 ***

X1 0.333559 0.123067 2.7104 0.03509 **

X2 -0.274677 0.0859379 -3.1962 0.01869 **

time 0.202433 0.182148 1.1114 0.30895

Media de la vble. dep. 6.100000 D.T. de la vble. dep. 2.998148

Suma de cuad. residuos 1.790926 D.T. de la regresión 0.546340

R-cuadrado 0.977862 R-cuadrado corregido 0.966794

F(3, 6) 88.34431 Valor p (de F) 0.000024

Log-verosimilitud -5.590125 Criterio de Akaike 19.18025

Criterio de Schwarz 20.39059 Crit. de Hannan-Quinn 17.85251

rho -0.432706 Durbin-Watson 2.740636

Tabla 3.10

Contraste de omisión de variables - Hipótesis nula: los parámetros son cero para las variables time

(Ho:𝛽4=0)

2

4

6

8

10

12

1993 1994 1995 1996 1997 1998 1999 2000 2001 2002

Y

Page 57: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 58

Estadístico de contraste: F(1, 6) = 1.23514

con valor p = P(F(1, 6) > 1.23514) = 0.308948

Modelo 2: MCO, usando las observaciones 1993-2002 (T = 10) Variable dependiente: Y

Coeficiente Desv. Típica Estadístico t Valor p

const 5.80084 0.976443 5.9408 0.00058 *** X1 0.442193 0.0760173 5.8170 0.00065 *** X2 -0.309751 0.081265 -3.8116 0.00661 ***

Media de la vble. Dep. 6.100000 D.T. de la vble. Dep. 2.998148 Suma de cuad. Residuos 2.159601 D.T. de la regresión 0.555441 R-cuadrado 0.973305 R-cuadrado corregido 0.965678 F(2, 7) 127.6122 Valor p (de F) 3.11e-06 Log-verosimilitud -6.526078 Criterio de Akaike 19.05216 Criterio de Schwarz 19.95991 Crit. De Hannan-Quinn 18.05635 rho -0.374018 Durbin-Watson 2.464587

Tabla 3.11

Comparación entre el modelo 1 y el modelo 2:

Hipótesis nula: el parámetro de regresión es cero para time Estadístico de contraste: F(1, 6) = 1.23514, con valor p = 0.308948 De los 3 estadísticos de selección de modelos, 2 han mejorado.

Modelos de función de regresión Logarítmica, Semilogarítmica, inversa y Polinómica

En la página 25, dimos el concepto de de lo entenderíamos por “linealidad” Señalamos que un modelo

puede ser lineal en los parámetros pero lineal en sus variables. Estudiaremos modelos de regresión más

comúnmente utilizados, que pueden no ser lineales en las variables pero que son lineales en los parámetros o

que pueden ser mediante transformaciones apropiadas de las variables. En particular se analizan los

siguientes modelos.

1. Logarítmica 2

1i iY X

2. Semilogarítmica exp( )t tY a bX

3. Inversa o recíproca 1 2

1i

i

YX

4. Polinómica 2

1 1 2 1tY a b X b X

Page 58: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 59

1. Modelos Logarítmicos:

Considérese el siguiente modelo, conocido como modelo de regresión exponencial: 2

1i

i iY X e

El cual puede ser expresado alternativamente como4:

1 log( )anti En este modelo de regresión β1, β2, recogen las elasticidades de la variable Y respecto al

regresor Xi, respectivamente.5

El componente aleatorio de perturbación debe introducirse multiplicando en el modelo 1)

Si hacemos α=ln β1 el modelo resultante será: 2ln lni i iY X este modelo resulta ser lineal en sus

parámetros, lineal en los logaritmos de las variables Y y X y puede ser estimado por regresión MCO. Debido a

la linealidad, tales modelos se denominan modelos log-log, doble-log, o log-lineales.

Si los supuestos del modelo clásico de regresión lineal se cumplen, los parámetros de

2ln lni i iY X pueden ser estimados por el método de MCO considerando.

1 2ln t t tY X

Donde * lniY Y y * lni iX X , los estimadores MCO obtenidos 2 y serán los mejores estimadores

lineales de 2 y respectivamente.

Una característica importante del modelo log-log, que lo ha hecho muy popular en el trabajo empírico, es

que el coeficiente de la pendiente mide la elasticidad de Y con respecto a X, es decir, el cambio porcentual en

Y en un pequeño cambio porcentual en X dado. Así si Y representa la cantidad demandada de un bien y X su

precio unitario, 𝛽2 mide la elasticidad - precio de la demanda, un parámetro de gran interés en economía.

Pueden observarse dos características especiales del modelo log-lineal: El modelo supone que el coeficiente

de la elasticidad entre Y y X, 𝛽2 permanece constante a través del tiempo de aquí su nombre alterno modelo

de elasticidad constante. 3.10.b, el cambio en el ln Y por unidad de cambio en ln X (es decir, la elastcidad 𝛽2)

permanece igual sin importar en cual ln X medimos la elasticidad. Otro aspecto del modelo es que a pesar de

que 2 y son estimadores de insesgados de 2 y ; 𝛽1 (el parámetro del modelo original) al ser

estimado como 1 log( )anti es, un estimador sesgado. En la mayor parte de los problemas prácticos sin

embargo, el término del intercepto es de importancia secundaria y no es necesario preocuparse por obtener

este estimador insesgado.

4 Recuerde las propiedades de logaritmos Ln(AB)=lnA + lnB; lnA

k=klnA; lne

x=x

5 Donde ln=logaritmo natural (logaritmo de base e, donde e=2.718)

Page 59: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 60

Grafica 3.10

Ejemplo: Con tabla 2.1 del ejercicio 1. Para cada país estime la tasa de crecimiento de la inflación obtenida

del modelo 1 2ln t t tY X

Gráfico 3.11

El coeficiente de determinación para el modelo logarítmico solicitado es R2= 0.867197, con estimadores

siguientes: ln USA = -241.468 + 0.123257*Tiempo + μ (ver grafico 3.11 lado derecho)

Comparándole con el modelo: USA = -1036.67 + 0.528831 *Tiempo + μ con R2= 0.777499 (ver grafico 3.11

lado izquierdo)

2. Modelos Semilogaritmicos: Los economistas, la gente de negocio y los gobiernos frecuentemente

están interesados en encontrar la tasa de crecimiento y los gobiernos frecuentemente están interesados en

encontrar la tasa de crecimiento de ciertas variables economistas, tales como población, PNB, oferta

monetaria, empleo, productividad, déficit comercial etc.

Page 60: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 61

observ 1993:1 1993:2 1993:3 1993:4 1994:1 1994:2 1994:3 1994:4 1995:1 1995:2 1995:3 1995:4

GasSer 2445.3 2445.9 2480.0 2510.9 2510.9 2531.4 2543.8 2555.9 2570.4 2594.8 2610.3 2622.9

…. 1996:1 1996:2 1996:3 1996:4 1997:1 1997:2 1997:3 1997:4 1998:1 1998:2 1998:3 1998:4

…. 2648.5 2668.4 2688.1 2701.7 2722.1 2743.6 2775.4 2804.8 2829.3 2866.8 2904.8

Tabla 3.12

Suponga que se desea saber la tasa de crecimiento del gasto de consumo personal en servicio para los datos

dados en la tabla 3.12. Sea Yt el gasto real en servicios en el tiempo t y Yo el valor inicial del gasto en servicios

(es decir, el valor al final del cuarto trimestre de 1992). Se ha se recordar la muy conocida fórmula del interés

compuesto. (1 )t

t oY Y r

Donde r es la tasa de crecimiento compuesto de Y(es decir, a través del tiempo). Tomando el logaritmo natural, y aplicándolo a la ecuación anterior, podemos escribir la ecuación siguiente.

ln ln ln(1 )t oY Y t r

Ahora hacemos: 1 2ln ln(1 )oY r → 1 2ln tY t al que le agregamos el término de

perturbación. 1 2ln t tY t Este modelo es igual a cualquier otro modelo regresión lineal en cuanto

a que sus parámetros β1, β2, son lineales. La única diferencia es que la variable dependiente es el logaritmo de Y, y la variable explicativa o regresor es el tiempo que adquieres valores de 1,2,3,…etc. Este modelo es lo que se denominan Semilog, porque solamente una de las variables aparece en forma logarítmica. En este modelo el coeficiente de la pendiente mide el cambio proporcional constante o relativo en Y para un cambio absoluto dado en el valor del regresor (en este caso la variable t), es decir,

2

relativo en regresor

cambio relativo absoluto en el regresor

cambio

Si se multiplica el cambio relativo en Y por100 nos dará entonces el cambio porcentual, o la tasa de

crecimiento, en Y ocasionada por un cambio absoluto en X, el regresor. Es decir, 100 por β2 da como

resultado la tasa de crecimiento en Y; 100 por β2 se conoce como la semielasticidad de Y respecto a X.

Tasa de crecimiento instantánea versus compuesta: El coeficiente de la tasa de crecimiento instantánea (en

un punto del tiempo) y no la compuesta (durante un periodo). Pero esta última puede encontrarse

fácilmente a partir de β2 =ln(1-r) simplemente obténgase el anti logaritmo de la β2 , réstele 1 y

multiplíquese la diferencia por 100. Como se indica:

2

2

2

ln(1 )

log 1

log 1 100

r

anti r

r anti x

Page 61: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 62

Por tanto para el ejemplo descrito, el coeficiente de la pendiente estimada es 0.0074661. El

antilogaritmo(0.0074661) – 1 = (0.00749-1)x100= 0.749% que es la tasa compuesta de crecimiento de gastos

de servicios por trimestre.

Modelo SEMILOG: MCO, usando las observaciones 1993:1-1998:3 (T = 23)

Variable dependiente: ln GAS_SER

Coeficiente Desv. Típica Estadístico t Valor p

Const 7.78835 0.00228921 3402.1975 <0.00001 ***

Time 0.0074661 0.000166958 44.7184 <0.00001 ***

Media de la vble. dep. 7.877941 D.T. de la vble. dep. 0.050903

Suma de cuad. residuos 0.000592 D.T. de la regresión 0.005311

R-cuadrado 0.989608 R-cuadrado corregido 0.989113

F(1, 21) 1999.739 Valor p (de F) 2.59e-22

Log-verosimilitud 88.88291 Criterio de Akaike -173.7658

Criterio de Schwarz -171.4948 Crit. de Hannan-Quinn -173.1947

Rho 0.910385 Durbin-Watson 0.389808

En el modelo 1 2ln t tY t introducimos los valores de los parámetros estimados de β1 y β2 y nos

resulta la siguiente ecuación: ln Yt = 7.78835 + 0.0074661t + μt

Calculamos el antilog β1= antilog 7.78835 = 2412.33=YO : 2.412.33(1 0.00749)t

tY

Gráfica 3.12

3. Modelos Recíprocos

La gráfica 3.12 muestra la

relación lineal entre el

logaritmo de los GASTOS

DE SERVICIOS Y el tiempo,

que como puede verse,

esta es aproximadamente

lineal con un R2

=0.989113.

La gráfica muestra la

aproximación lineal en

rojo, con los datos

observados y la línea azul

son los datos ajustados

(totalmente lineales)

Page 62: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 63

Los modelos del siguiente tipo se conocen como modelos recíprocos. 1 2

1i i

i

YX

A pesar de que este modelo es no lineal en la variable X porque entra inversamente o en forma recíproca, el

modelo es lineal en β1 y β2 y por consiguiente es un modelo de regresión lineal.

Este modelo tiene las siguientes características: a medida que X aumenta indefinidamente, el término β2(1/x)

Se acerca a cero. (β2 es una constante) y Y se aproxima al valor limite o asintótico β1. Por tanto los modelos

asintóticos de la gráfica 3.13 contienen un valor asintótico o limite que tomará la variable dependiente

cuando el valor de la variable X aumenta indefinidamente.

Gráfica 3.13 de 1 2

1i

i

YX

Considérese los datos de la tabla 3.13. Estos son datos de 64 países respecto a la mortalidad infantil (MI) Y

PIB per cápita (PIBPC) las que se muestran en la grafican 3.14

Tabla 3.14

Page 63: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 64

Observaciones: de los 64 países. MI: Mortalidad infantil PIBPC: PIB per cápita en 1980. TAF : Tasa de alfabetismo femenino (en porcentaje) TFT : Tasa de fertilidad total, 1980-1985. El promedio de niños nacidos de una mujer en el que se utilizan las tasas de fertilidad para edad específica durante un año determinado. (fuente Libro de econometría, Gujarati-2004)

Page 64: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 65

Modelo Recíproco: MCO, usando las observaciones 1-64

Variable dependiente: MI Coeficiente Desv. Típica Estadístico t Valor p

Const 81.7944 10.8321 7.5511 <0.00001 *** InvPIBPC 27273.2 3760 7.2535 <0.00001 *** Media de la vble. dep. 141.5000 D.T. de la vble. dep. 75.97807 Suma de cuad. residuos 196731.4 D.T. de la regresión 56.33016 R-cuadrado 0.459051 R-cuadrado corregido 0.450326 F(1, 62) 52.61330 Valor p (de F) 7.82e-10 Log-verosimilitud -347.7948 Criterio de Akaike 699.5897 Criterio de Schwarz 703.9074 Crit. de Hannan-Quinn 701.2907

El modelo recíproco antes señalado con las variables MI como dependiente y InvPIBPC (que es 1/PBPB) es el

siguiente:

1 2

2

1

1MI = 81.7944 + 27273.2

PIBPC

(10.8321)(3760)

t=(7.5511)(7.2535)

r 0.45

i i

i

YX

ee

0

50

100

150

200

250

300

350

0 5000 10000 15000 20000

MI

PIBPC

Relación entre Mortaldad infantil y PIB per cápita en 64 países

El Gráfico 3.14 de la

izquierda muestra,

muestra una nube de

puntos que como se

puede ver tienen forma

asintótica con ambos ejes,

en la medida que el PIBPC

tiene a cero se aumenta la

MI y en la medida que el

PIBPC crece la MI tiene a

cero.

Pareciera que la relación

del PIBPC y la MI es

inversa o reciproca.

Page 65: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 66

El valor positivo del coeficiente 1/PIBPC implica que la tasa de cambio de la MI con respecto al PIBPC es

negativa. Una de las aplicaciones importantes de gráfica de 3.13 (b) es la conocida curva de Phillips de

macroeconomía6.

Bibliografía.

1. Econometría, Damodar N. Gujarati , Editorial Mc Graw Hill, Cuarta Edición 2004.

2. Manual de Solución del libro de Econometría, cuarta edición, Damodar N. Gujarati , Editorial Mc

Graw Hill.

3. Econometría: Modelos y pronósticos, Roberts Pindyck, , Editorial Mc Graw Hill, Cuarta Edición 2001.

4. Econometría básica aplicada con Gretl, González, Paz y otros, Facultad de Ciencias Económicas y

Empresariales, Universidad de País Vasco, 2009.

5. Econometrics, Michael Creel, Departments Economics and Economic History, Noviembre 2008

6. Aplicaciones de Algebra Lineal, Stanley Grossman, Grupo Editorial Iberoamericana, 1998

7. Introductory Econometrics, Jeffrey Woodridge. Tercera edición. 2005

8. Modelos Econométricos – Guía para la elaboración de modelos econométricos Eviews, Antono

Pulido, Edición Pirámide.

9. Econometrics Analysis and Cross Section Panel Data. Jeffrey Woodridge. Tercera edición. 2002

10. Econometría Básica, Raimundo Soto, (apuntes de clase) 2006.

11. Economía de Michael Parkin, Octava edición, 2008.

12. El Software Gretl versión 1.9 año 2010

13. El Software Eviews versión 4 a la 7. Año 2008

Nota: Todos los libros y software indicados serán entregados a los participantes del curso de Análisis y Diseño

de Modelos Econométricos con Gretl.

6 Phillips obtuvo una curva parecida a la 3.13b con base a la tasa de cambio porcentual de los salarios nominales y la tasa

porcentual de desempleo para el Reino Unido, durante el periodo 1861 a 1957.

Page 66: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 67

Ejercicios para practicar

Ejercicio 1:

Se quiere analizar los costes acumulados de reparación de los carros Toyota (costo) en función

de la edad del coche (Año). Para realizar este ejercicio debes utilizar los datos contenidos en el

Archivo de muestra en Gretl data3-7.

I Costo Año i Costo Año

1. Con los datos del fichero, rellena los valores del cuadro anterior:

2. ¿Los datos son de sección cruzada o series temporales? ¿Cuál es el tamaño muestral?

3. ¿Cuál es el coste de reparación del cuarto carro? ¿Cuántos años tiene?

4. Obtén los estadísticos principales de las variables costo y año. Coméntalos.

5. ¿Cuál es la edad media maestral de los coches?

6. Especifica un modelo para analizar los costes de reparación de los coches.

Page 67: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 68

7. ¿Cuál es la variable endógena? ¿Y la explicativa? ¿Qué elementos de este modelo son

Aleatorios?

Ejercicio 2: Para estimar la función de regresión lineal, se cuenta con los datos siguientes

Xi Yi

80 65

100 77

120 89

140 101

160 113

180 125

200 137

220 149

240 161

260 173

Use las formulas indicadas de MCO para estimar 𝛽1 y 𝛽2

2 2ˆ i i

i

x y

x

y

21ˆ Y

Donde i iy Y Y , i ix X X , donde iy y ix son las desviaciones de las observaciones cpn

respecto a Y y X respectivamente.

Entonces la ecuación 21Y X , quedaría determinada por la siguiente manera.

Y= + X

Ejercicio 3:

Se dispone de una base de datos para 51 estados de E.E.U.U. sobre el gasto agregado en transporte urbano

(EXPTRAV) y la renta disponible agregada (INCOME) correspondiente al año 1993. Las variables que se

consideran son: los datos contenidos en el Archivo de muestra en Gretl data8-2.

EXPTRAV Gasto agregado en transporte urbano, en billones de dólares, (Rango 0,708 - 42,48).

INCOME Renta disponible agregada, en billones de dólares, (Rango 9,3 - 683,5).

POP Población, en millones, (Rango 0,47 - 31,217).

1. Especifica un modelo para analizar si la renta disponible agregada explica el gasto agregado en transporte

urbano. Interpreta sus coeficientes.

Page 68: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 69

2. Estima el modelo por Mínimos Cuadrados Ordinarios. Comenta los resultados obtenidos en términos de

bondad de ajuste, significatividad y signos de los coeficientes estimados.

Razona si te parecen adecuados los resultados.

3. Obtén e interpreta los siguientes gráficos:

1. Gráfico de la serie de residuos MCO.

2. Gráfico de residuos MCO sobre la variable POP.

4. ¿Podría un aumento de un millón de dólares en la renta disponible agregada producir un aumento, en

media, de un billón de dólares en el gasto en transporte urbano agregado?

5. Define e indica que miden las siguientes variables:

EXPTRAV

EXPOPPOP

Y INCOME

INCPOPPOP

6. Regresa la variable EXPOP sobre la variable INCPOP y un término independiente.

a) Interpreta los coeficientes estimados.

b) Contrasta la significatividad de la variable INCPOP.

c) Compara los resultados de ambos modelos, ¿cuál te parece más razonable?

Ejercicio 4:

Para la realización de este ejercicio utiliza el archivo de muestra greene5-1.gdt disponible en

10 gretl. Este archivo contiene datos de series temporales a frecuencia trimestral desde 1950:1 a

2000:4 de las siguientes variables para la economía americana:

realgdp Producto interior bruto real(en billones de dólares)

realcons Gastos de consumo real

realinvs Inversión real en el sector privado

realgovt Gasto público real

realdpi Renta personal disponible real

cpi_u Índice de precios al consumo

M1 Stock nominal de dinero

Tbilrate Tipo de interés (media trimestral)

unemp Tasa de desempleo

Page 69: Capacitación a Docentes Curso de - JRVARGAS · PDF fileEl objetivo de un estudio econométrico es comprender mejor un fenómeno económico y, como ... Analizar la efectividad de las

Curso de Análisis y diseño de modelos econométricos con Gretl FAREM-Carazo

MSc. Julio Rito Vargas Avilés página 70

pop Población (en miles)

infl Tasa de inflación (primera observación no disponible)

realint Tipo de interés real ex-post = Tbilrate – Infl

Ten en cuenta que la primera observación para la variable infl no está disponible. Ajusta entonces el rango

muestral p ara tener observaciones para todas las variables.

Considera la siguiente especificación para la función de Inversión:

t 1 2 3 t 4 t 5 t trealinvs = ß +ß time+ ß realgdp + ß tbilrate + ß infl + u

1. Muestra los resultados de la estimación del modelo por MCO. Recuerda que antes de estimar tienes que

añadir una nueva variable, una tendencia temporal (time).

2. Utilizando las opciones de Contrastes? Restricciones lineales y Contrastes? Omitir variables, realiza el

contraste de significación individual para la variable realgdp.

3. Verifica que el valor del estadístico F obtenido de esta forma, coincide con el valor del estadístico t al

cuadrado que se muestra en el resultado de la estimación del modelo no restringido.

4. De igual forma que en el segundo apartado, realiza el contraste de significación conjunta. Verifica que el

valor coincide con el que se muestra en los resultados de la estimación del modelo no restringido.

5. Obtén la estimación de los parámetros del modelo para la inversión real bajo la restricción de que los

coeficientes que acompañan al tipo de interés (tbilrate) y a la inflación (infl) suman cero. Para ello estima

directamente el Modelo Restringido incorporando la restricción. Escribe el modelo restringido y muestra

los resultados de su estimación. ¿Qué recoge esta restricción? ¿Para qué sirve la variable realint?

6. Para la hipótesis nula de que los coeficientes que acompañan al tipo de interés (tbilrate) y a la inflación

(infl) suman cero, obtén el valor del estadístico basado en comparar las sumas de cuadrados residuales

del modelo restringido y no restringido. Calcula también el estadístico en funci´on de los coeficientes de

determinación de ambos modelos.

7. Comprueba que el valor obtenido en el apartado anterior del estadístico de contraste, es el mismo valor

que el obtenido con el estadístico equivalente utilizando la opción Contrastes Restricciones lineales.

8. Utilizando los datos del fichero greene5-1.gdt como muestra para el rango de estimación, predice el valor

que tomará la inversión real en el trimestre 2001:1 por punto y por intervalo (al 95% de confianza),

basando esta predicción en las previsiones para el realgdp de 1000 billones de dólares, tipo de interés

tbilrate del 10% e inflación del 4% para 2001:1. Ten en cuenta que los valores que tomará la variable time

en el periodo de predicción vienen determinados por el número correspondiente de observación

posterior al utilizado para estimar.