Post on 25-Jul-2015
description
Año 2010 | by Cinderella
MODELACIÓN Y
SIMULACIÓN 2 GUÍA DE CONTENIDO
Guía de contenido
Modelación y Simulación 2 Página 2
Tabla de contenido
1. Análisis de regresión ........................................................................................................... 4
1.1. Naturaleza de la econometría ..................................................................................... 4
1.2. Modelo de regresión simple........................................................................................ 4
1.3. Modelo de regresión múltiple ..................................................................................... 4
a. Error estándar de estimación ........................................................................................ 5
b. Coeficiente de determinación múltiple......................................................................... 5
c. Coeficiente de determinación corregido...................................................................... 5
d. Evaluación total del modelo como un todo .................................................................. 5
e. Pruebas individuales para los coeficientes ................................................................... 6
Multicolinealidad................................................................................................................... 6
Práctica .................................................................................................................................. 9
1.4. Variables Categóricas ................................................................................................ 11
1.4.1. Dicotómicas ........................................................................................................ 11
1.4.2. Policotomicas ..................................................................................................... 11
1.5. Coeficiente de determinación ................................................................................... 11
1.6. Matriz de correlación ................................................................................................ 11
1.7. Colinealidad................................................................................................................ 11
1.8. Matriz de covarianza y varianza ............................................................................... 11
1.9. Intervalos de confianza para coeficientes ............................................................... 11
1.10. Técnicas de muestreo ............................................................................................ 11
1.10.1. Método aleatorio ................................................................................................ 11
1.10.2. Método Sistemático ........................................................................................... 11
1.10.3. Estratos ............................................................................................................... 11
2. Series de tiempo ................................................................................................................ 11
2.1. Pronósticos ................................................................................................................. 11
2.2. Análisis de tendencia ................................................................................................. 11
2.2.1. Método Gráfico ................................................................................................... 11
2.2.2. Método de Medias Móviles ................................................................................ 11
2.3. Análisis de series temporales ................................................................................... 11
2.4. Componentes de una serie de tiempo. ..................................................................... 11
2.5. Autocorrelación ......................................................................................................... 11
2.6. Coeficientes de autocorrelación ............................................................................... 11
2.7. Correlograma ............................................................................................................. 11
Guía de contenido
Modelación y Simulación 2 Página 3
3. Presupuestos y herramientas gerenciales ....................................................................... 11
3.1. El presupuesto como herramienta para pronosticar .............................................. 11
3.2. Potencial del mercado total ...................................................................................... 11
3.3. Indicador de Factor Múltiple .................................................................................... 12
Guía de contenido
Modelación y Simulación 2 Página 4
1. Análisis de regresión
1.1. Naturaleza de la econometría
1.2. Modelo de regresión simple
1.3. Modelo de regresión múltiple
En el modelo de regresión múltiple se incorporan varias variables independientes las cuales ayudan a explicar la variable dependiente.
𝑌 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + ⋯+ 𝛽𝑘𝑋𝑘 + 𝜀 𝛽𝑖 son los coeficientes de regresión y 𝜀 es el término de error aleatorio.
Estimación del modelo
Se estima el modelo utilizando los datos muestrales así:
𝑌 = 𝑏0 + 𝑏1𝑋1 + 𝑏2𝑋2 + ⋯ + 𝑏𝑘𝑋𝑘
𝑌 es el valor estimado para la variable dependiente y 𝑏𝑖 son los estimados para los coeficientes poblacionales 𝛽𝑖 .
Supuestos de la regresión múltiple
El modelo de regresión múltiple debe cumplir con todos los supuestos establecidos en
el modelo de regresión lineal, además de los dos siguientes:
1. El número de observaciones “n” debe exceder al número de variables
independientes “k”, en por lo menos 2.
2. Ninguna de las variables independientes deben estar linealmente
relacionadas. 1
Evaluación del modelo
Después de haber estimado el modelo, es necesario evaluarlo para determinar si proporciona
un ajuste y explicación satisfactorios para los datos recolectados.
1 Multicolinealidad
Multicolinealidad: Existe multicolinealidad si dos o más variables
independientes están linealmente relacionadas. 1
La multicolinealidad puede hacer que los signos de los coeficientes cambien de
signo con respecto a lo que dicta la lógica real del sistema.
Guía de contenido
Modelación y Simulación 2 Página 5
a. Error estándar de estimación
Mide los grados de dispersión de los valores
𝑌𝑖 alrededor del plano de regresión, entre menos
dispersión más pequeño será el error y más preciso
el modelo.
𝑆𝑒 = 𝑌𝑖 − 𝑌 𝑖 2
𝑛 − 𝑘 − 1
b. Coeficiente de determinación múltiple
Mide la porción del cambio en 𝑌 que es explicada por las variables independientes.
𝑅2 =𝑆𝐶𝑅
𝑆𝐶𝑇
Debido a que 𝑆𝐶𝑇 = 𝑆𝐶𝑅 + 𝑆𝐶𝐸 también se tiene que:
𝑅2 = 1 −𝑆𝐶𝐸
𝑆𝐶𝑇
c. Coeficiente de determinación corregido
Al momento de agregar variables al modelo se debe evaluar este coeficiente, si el valor
disminuye demasiado con respecto al valor anterior, se debe considerar no tomar en cuenta la
variable.
𝑅 2 = 1 − (1 − 𝑅2)𝑛 − 1
𝑛 − 𝑘 − 1
d. Evaluación total del modelo como un todo
Se realizar por medio del análisis de varianza ANOVA, con la siguiente prueba de hipótesis:
𝐻0:𝛽1 = 𝛽2 = 𝛽3 = ⋯ = 𝛽𝑘 = 0
𝐻𝐴: Al menos un β no es 0
Tabla: Análisis ANOVA
Fuente de variación (origen)
Grados de libertad
Suma de cuadrados
(SS)
Cuadrado medio (MS)
F P
Regresión (entre
muestras)
𝑘 𝑆𝐶𝑅 𝑆𝐶𝑅
𝑘
𝐶𝑅𝑀
𝐶𝑀𝐸
%
Residual (error) 𝑛 − 𝑘 − 1 𝑆𝐶𝐸 𝑆𝐶𝐸
𝑛 − 𝑘 − 1
Total 𝑛 − 1 𝑆𝐶𝑇
𝑆𝐶𝑇 = 𝑌𝑖 − 𝑌 2 Suma de cuadrados total
𝑆𝐶𝑅 = 𝑌 𝑖 − 𝑌 2
Suma de cuadrados de la regresión
𝑆𝐶𝐸 = 𝑌𝑖 − 𝑌 𝑖 2
Suma de cuadrados del error
Guía de contenido
Modelación y Simulación 2 Página 6
Se debe verificar la tabla de distribución 𝐹 con un nivel de significancia α y 𝑘 grados de
libertad1 y 𝑛 − 𝑘 − 1 grados de libertad2, este valor será 𝐹 en la tabla.
Si el valor de 𝐹 en el análisis de ANOVA es mayor al 𝐹 en la tabla, se rechaza la Hipotesis Nula,
si es menor se acepta la Hipotesis Nula.
e. Pruebas individuales para los coeficientes
Luego de realizar una prueba total para el modelo, mediante el análisis de la tabla ANOVA, es
necesario realizar una prueba de hipótesis para cada coeficiente.
La prueba se realiza de la misma forma que en el modelo de regresión lineal simple, pero se
debe considerar una prueba por cada coeficiente β, excepto 𝛽0.
𝐻0:𝛽1 = 0
𝐻𝐴: 𝛽1 ≠ 0
Se utiliza la prueba 𝑡 estándar con 𝑛 − 𝑘 − 1 grados de libertad.
𝑡 =𝑏1 − 𝛽1
𝑆𝑏1
Donde 𝑆𝑏1 es el error estándar del coeficiente de regresión.
Tabla: Análisis de regresión
Variable Coeficiente Error estándar T P
Constante 𝛽0 𝑆0 𝑇0 𝑃0
𝑿𝟏 𝛽1 𝑆1 𝑇1 𝑃1
𝑿𝟐 𝛽2 𝑆2 𝑇2 𝑃2
𝑿𝟑 𝛽3 𝑆3 𝑇3 𝑃3 𝑿𝒏 𝛽𝑛 𝑆𝑛 𝑇𝑛 𝑃𝑛
Multicolinealidad
Cuando dos variables independientes están relacionadas linealmente entre sí, todo modelo
tiene algún grado de multicolinealidad, pero se busca que este sea el más bajo posible.
El grado de multicolinealidad aceptado dependerá del criterio del investigador.
Guía de contenido
Modelación y Simulación 2 Página 7
Ejemplo
𝑌 = Nivel de ahorro
𝑋1 = Gastos de hombres en un mes
𝑋2 = Gastos de mujeres en un mes
𝑋3 = Gastos de toda la población en un mes
𝑋 es una combinación lineal de 𝑋1 y 𝑋2 (𝑋3 = 𝑋1 + 𝑋2 ). La correlación 𝑟13 entre
𝑋1 𝑦 𝑋3 y la correlación 𝑟23 entre 𝑋2 𝑦 𝑋3 es muy alta. Esto garantiza la presencia de la
multicolinealidad y crea muchos problemas en el uso de las técnicas de regresión.
Pruebas para detectar multicolinealidad
La forma más directa para probar la multicolinealidad es producir una matriz de correlación
para todas las variables del modelo.
En toda matriz de correlaciones la diagonal siempre tiene valores “1” y la parte
superior es idéntica a la inferior.
𝒀 𝑿𝟏 𝑿𝟐 𝑿𝟑 𝑿𝒏
𝒀 1 𝑟(𝑋1 ,𝑌) 𝑟(𝑋2 ,𝑌) 𝑟(𝑋3 ,𝑌) 𝑟(𝑋𝑛 ,𝑌)
𝑿𝟏 𝑟(𝑌, 𝑋1) 1 𝑟(𝑋2 ,𝑋1) 𝑟(𝑋3 ,𝑋1) 𝑟(𝑋𝑛 ,𝑋1)
𝑿𝟐 𝑟(𝑌, 𝑋2) 𝑟(𝑋1 ,𝑋2) 1 𝑟(𝑋3 ,𝑋2) 𝑟(𝑋𝑛 ,𝑋2)
𝑿𝟑 𝑟(𝑌, 𝑋3) 𝑟(𝑋1 ,𝑋3) 𝑟(𝑋2 ,𝑋3) 1 𝑟(𝑋𝑛 ,𝑋3)
𝑿𝒏 𝑟(𝑌, 𝑋𝑛) 𝑟(𝑋1 ,𝑋𝑛) 𝑟(𝑋2 ,𝑋𝑛) 𝑟(𝑋3 ,𝑋𝑛) 1
Pruebas de hipótesis para las autocorrelaciones
Para las parejas de variables independientes donde se vea una alta correlación, se
debe efectuar una prueba de hipótesis para el coeficiente de correlación de ambas
variables.
𝐻0: 𝜌12 = 0
𝐻𝐴: 𝜌12 ≠ 0
Donde 𝜌12 es el coeficiente de correlación poblacional para 𝑋1 y 𝑋2.
𝑡 =𝑟12
𝑆𝑟
Donde 𝑟12 es la correlación muestral entre 𝑋1 y 𝑋2 y
Matriz de correlación: Es una matriz que muestra todas las posibles parejas de
variables y su coeficiente de correlación asociado.
Guía de contenido
Modelación y Simulación 2 Página 8
𝑆𝑟 = 1 − 𝑟12
2
𝑛 − 2
Hay 𝑛 − 2 (no 𝑛 − 𝑘 − 1) grados de libertad.
Además del análisis de la matriz de correlaciones, una segunda forma es realizar una
comparación de los coeficientes de determinación de cada una de las variables independientes
con la variable dependiente, de tal forma que se pueda apreciar si hay alguna variable que no
aporta suficiente luego de integrarla al modelo.
Si el crecimiento luego de agregar una variable no es significativo, dicha variable puede aportar
problemas de multicolinealidad.
Factor de inflación de la varianza
Un tercer método para detectar multicolinealidad es analizar el Factor de Inflación de la
Varianza (𝐹𝐼𝑉).
El 𝐹𝐼𝑉 para una variable 𝑋, se calcula realizando regresión con respecto al resto de variables,
utilizando el coeficiente de determinación para calcular la influencia de la variable 𝑋 en la
multicolinealidad.
𝐹𝐼𝑉 𝑋𝑖 =1
1 − 𝑅𝑖2
La multicolinealidad produce un incremento en la variación o error estándar del coeficiente de
regresión.
El 𝐹𝐼𝑉 mide el incremento en la varianza del coeficiente de regresión por encima del que
ocurriría si no estuviese presente la multicolinealidad.
Presencia de multicolinealidad
1. Incapacidad para separar el efecto neto de las variables independientes
individuales sobre "𝑌".
2. Un error estándar exagerado para los coeficientes "𝑏".
3. Signos algebraicos en los coeficientes que contradicen la lógica o naturaleza del
sistema real.
4. Alta correlación entre variables independientes y un 𝐹𝐼𝑉 elevado.
FIV: El 𝐹𝐼𝑉 para toda variable independiente es una medida del grado de multicolinealidad en que
contribuye dicha variable.
Criterio para analizar el FIV : La multicolinealidad no se considera un problema
significativo a menos que uno de los valores de los 𝐹𝐼𝑉 sea como mínimo 10, o bien la
suma de todos los 𝐹𝐼𝑉 sea como mínimo 10.
Guía de contenido
Modelación y Simulación 2 Página 9
5. Grandes cambios en los coeficientes o en sus signos, si el numero de
observaciones cambia en una sola observación.
6. Una razón "𝐹" significativa combinada con razones "𝑡" no significativas.
7. Grandes cambios en los coeficientes o en sus signos cuando se adiciona o se quita
una variable.
Corrigiendo la multicolinealidad
La solución evidente será eliminar la variable que provoque el problema de multicolinealidad.
Si dos variables independientes tienen una alta relación entre si, será variable candidata a
eliminar la que menos aporte en la explicación de la variable dependiente.
Al
elimin
ar una
de las
variabl
es
puede conllevar la presencia de un sesgo de especificación.
Si la lógica del sistema real no permite la eliminación del sistema se puede considerar lo
siguiente:
Cambiar de dimensiones la variable.
No incluir valores totales, más bien individuales.
Combinar dos o más variables en una sola.
Práctica
Considere la siguiente tabla de datos:
𝒀 = Pasajeros (miles)
𝑿𝟏= Publicidad (miles de dólares)
𝑿𝟐= Ingreso nacional (billones de dólares)
15 10 2.40 17 12 2.72 13 8 2.08 23 17 3.68 16 10 2.56 21 15 3.36 14 10 2.24 20 14 3.20 24 19 3.84 17 10 2.72 16 11 2.07 18 13 2.33 23 16 2.98
Sesgo de especificación: Especificación errónea de un modelo a causa de la
inclusión o exclusión de ciertas variables que provocan contradicción con los
principios teóricos del sistema real.
Guía de contenido
Modelación y Simulación 2 Página 10
15 10 1.94 16 12 2.17
1. Encuentre el modelo de regresión múltiple.
2. Explique el error estándar de estimación.
3. Explique el coeficiente de determinación.
4. ¿Qué explicación puede dar al coeficiente de determinación corregido?
5. Realice una prueba total del modelo.
6. Dé sus conclusiones.
7. Realice pruebas individuales para los coeficientes.
8. Encuentre la matriz de correlación y explíquela.
9. ¿Hay multicolinealidad?
10. Encuentre el modelo de regresión múltiple.
11. Haga un análisis para los valores 𝐹𝐼𝑉.
12. Realice pruebas para detectar existencia significativa de multicolinealidad.
13. De ser necesario de sus recomendaciones para solucionar un alto grado de
multicolinealidad.
14. Dé sus conclusiones.
Guía de contenido
Modelación y Simulación 2 Página 11
1.4. Variables Categóricas
1.4.1. Dicotómicas
1.4.2. Policotomicas
1.5. Coeficiente de determinación
1.6. Matriz de correlación
1.7. Colinealidad
1.8. Matriz de covarianza y varianza
1.9. Intervalos de confianza para coeficientes
1.10. Técnicas de muestreo
1.10.1. Método aleatorio
1.10.2. Método Sistemático
1.10.3. Estratos
2. Series de tiempo
2.1. Pronósticos
2.2. Análisis de tendencia
2.2.1. Método Gráfico
2.2.2. Método de Medias Móviles
2.3. Análisis de series temporales
2.4. Componentes de una serie de tiempo.
2.5. Autocorrelación
2.6. Coeficientes de autocorrelación
2.7. Correlograma
3. Presupuestos y herramientas gerenciales
3.1. El presupuesto como herramienta para pronosticar
3.2. Potencial del mercado total
Guía de contenido
Modelación y Simulación 2 Página 12
3.3. Indicador de Factor Múltiple