MultiColineAliDad

12
Año 2010 | by Cinderella MODELACIÓN Y SIMULACIÓN 2 GUÍA DE CONTENIDO

description

Uploaded from Google Docs

Transcript of MultiColineAliDad

Page 1: MultiColineAliDad

Año 2010 | by Cinderella

MODELACIÓN Y

SIMULACIÓN 2 GUÍA DE CONTENIDO

Page 2: MultiColineAliDad

Guía de contenido

Modelación y Simulación 2 Página 2

Tabla de contenido

1. Análisis de regresión ........................................................................................................... 4

1.1. Naturaleza de la econometría ..................................................................................... 4

1.2. Modelo de regresión simple........................................................................................ 4

1.3. Modelo de regresión múltiple ..................................................................................... 4

a. Error estándar de estimación ........................................................................................ 5

b. Coeficiente de determinación múltiple......................................................................... 5

c. Coeficiente de determinación corregido...................................................................... 5

d. Evaluación total del modelo como un todo .................................................................. 5

e. Pruebas individuales para los coeficientes ................................................................... 6

Multicolinealidad................................................................................................................... 6

Práctica .................................................................................................................................. 9

1.4. Variables Categóricas ................................................................................................ 11

1.4.1. Dicotómicas ........................................................................................................ 11

1.4.2. Policotomicas ..................................................................................................... 11

1.5. Coeficiente de determinación ................................................................................... 11

1.6. Matriz de correlación ................................................................................................ 11

1.7. Colinealidad................................................................................................................ 11

1.8. Matriz de covarianza y varianza ............................................................................... 11

1.9. Intervalos de confianza para coeficientes ............................................................... 11

1.10. Técnicas de muestreo ............................................................................................ 11

1.10.1. Método aleatorio ................................................................................................ 11

1.10.2. Método Sistemático ........................................................................................... 11

1.10.3. Estratos ............................................................................................................... 11

2. Series de tiempo ................................................................................................................ 11

2.1. Pronósticos ................................................................................................................. 11

2.2. Análisis de tendencia ................................................................................................. 11

2.2.1. Método Gráfico ................................................................................................... 11

2.2.2. Método de Medias Móviles ................................................................................ 11

2.3. Análisis de series temporales ................................................................................... 11

2.4. Componentes de una serie de tiempo. ..................................................................... 11

2.5. Autocorrelación ......................................................................................................... 11

2.6. Coeficientes de autocorrelación ............................................................................... 11

2.7. Correlograma ............................................................................................................. 11

Page 3: MultiColineAliDad

Guía de contenido

Modelación y Simulación 2 Página 3

3. Presupuestos y herramientas gerenciales ....................................................................... 11

3.1. El presupuesto como herramienta para pronosticar .............................................. 11

3.2. Potencial del mercado total ...................................................................................... 11

3.3. Indicador de Factor Múltiple .................................................................................... 12

Page 4: MultiColineAliDad

Guía de contenido

Modelación y Simulación 2 Página 4

1. Análisis de regresión

1.1. Naturaleza de la econometría

1.2. Modelo de regresión simple

1.3. Modelo de regresión múltiple

En el modelo de regresión múltiple se incorporan varias variables independientes las cuales ayudan a explicar la variable dependiente.

𝑌 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + ⋯+ 𝛽𝑘𝑋𝑘 + 𝜀 𝛽𝑖 son los coeficientes de regresión y 𝜀 es el término de error aleatorio.

Estimación del modelo

Se estima el modelo utilizando los datos muestrales así:

𝑌 = 𝑏0 + 𝑏1𝑋1 + 𝑏2𝑋2 + ⋯ + 𝑏𝑘𝑋𝑘

𝑌 es el valor estimado para la variable dependiente y 𝑏𝑖 son los estimados para los coeficientes poblacionales 𝛽𝑖 .

Supuestos de la regresión múltiple

El modelo de regresión múltiple debe cumplir con todos los supuestos establecidos en

el modelo de regresión lineal, además de los dos siguientes:

1. El número de observaciones “n” debe exceder al número de variables

independientes “k”, en por lo menos 2.

2. Ninguna de las variables independientes deben estar linealmente

relacionadas. 1

Evaluación del modelo

Después de haber estimado el modelo, es necesario evaluarlo para determinar si proporciona

un ajuste y explicación satisfactorios para los datos recolectados.

1 Multicolinealidad

Multicolinealidad: Existe multicolinealidad si dos o más variables

independientes están linealmente relacionadas. 1

La multicolinealidad puede hacer que los signos de los coeficientes cambien de

signo con respecto a lo que dicta la lógica real del sistema.

Page 5: MultiColineAliDad

Guía de contenido

Modelación y Simulación 2 Página 5

a. Error estándar de estimación

Mide los grados de dispersión de los valores

𝑌𝑖 alrededor del plano de regresión, entre menos

dispersión más pequeño será el error y más preciso

el modelo.

𝑆𝑒 = 𝑌𝑖 − 𝑌 𝑖 2

𝑛 − 𝑘 − 1

b. Coeficiente de determinación múltiple

Mide la porción del cambio en 𝑌 que es explicada por las variables independientes.

𝑅2 =𝑆𝐶𝑅

𝑆𝐶𝑇

Debido a que 𝑆𝐶𝑇 = 𝑆𝐶𝑅 + 𝑆𝐶𝐸 también se tiene que:

𝑅2 = 1 −𝑆𝐶𝐸

𝑆𝐶𝑇

c. Coeficiente de determinación corregido

Al momento de agregar variables al modelo se debe evaluar este coeficiente, si el valor

disminuye demasiado con respecto al valor anterior, se debe considerar no tomar en cuenta la

variable.

𝑅 2 = 1 − (1 − 𝑅2)𝑛 − 1

𝑛 − 𝑘 − 1

d. Evaluación total del modelo como un todo

Se realizar por medio del análisis de varianza ANOVA, con la siguiente prueba de hipótesis:

𝐻0:𝛽1 = 𝛽2 = 𝛽3 = ⋯ = 𝛽𝑘 = 0

𝐻𝐴: Al menos un β no es 0

Tabla: Análisis ANOVA

Fuente de variación (origen)

Grados de libertad

Suma de cuadrados

(SS)

Cuadrado medio (MS)

F P

Regresión (entre

muestras)

𝑘 𝑆𝐶𝑅 𝑆𝐶𝑅

𝑘

𝐶𝑅𝑀

𝐶𝑀𝐸

%

Residual (error) 𝑛 − 𝑘 − 1 𝑆𝐶𝐸 𝑆𝐶𝐸

𝑛 − 𝑘 − 1

Total 𝑛 − 1 𝑆𝐶𝑇

𝑆𝐶𝑇 = 𝑌𝑖 − 𝑌 2 Suma de cuadrados total

𝑆𝐶𝑅 = 𝑌 𝑖 − 𝑌 2

Suma de cuadrados de la regresión

𝑆𝐶𝐸 = 𝑌𝑖 − 𝑌 𝑖 2

Suma de cuadrados del error

Page 6: MultiColineAliDad

Guía de contenido

Modelación y Simulación 2 Página 6

Se debe verificar la tabla de distribución 𝐹 con un nivel de significancia α y 𝑘 grados de

libertad1 y 𝑛 − 𝑘 − 1 grados de libertad2, este valor será 𝐹 en la tabla.

Si el valor de 𝐹 en el análisis de ANOVA es mayor al 𝐹 en la tabla, se rechaza la Hipotesis Nula,

si es menor se acepta la Hipotesis Nula.

e. Pruebas individuales para los coeficientes

Luego de realizar una prueba total para el modelo, mediante el análisis de la tabla ANOVA, es

necesario realizar una prueba de hipótesis para cada coeficiente.

La prueba se realiza de la misma forma que en el modelo de regresión lineal simple, pero se

debe considerar una prueba por cada coeficiente β, excepto 𝛽0.

𝐻0:𝛽1 = 0

𝐻𝐴: 𝛽1 ≠ 0

Se utiliza la prueba 𝑡 estándar con 𝑛 − 𝑘 − 1 grados de libertad.

𝑡 =𝑏1 − 𝛽1

𝑆𝑏1

Donde 𝑆𝑏1 es el error estándar del coeficiente de regresión.

Tabla: Análisis de regresión

Variable Coeficiente Error estándar T P

Constante 𝛽0 𝑆0 𝑇0 𝑃0

𝑿𝟏 𝛽1 𝑆1 𝑇1 𝑃1

𝑿𝟐 𝛽2 𝑆2 𝑇2 𝑃2

𝑿𝟑 𝛽3 𝑆3 𝑇3 𝑃3 𝑿𝒏 𝛽𝑛 𝑆𝑛 𝑇𝑛 𝑃𝑛

Multicolinealidad

Cuando dos variables independientes están relacionadas linealmente entre sí, todo modelo

tiene algún grado de multicolinealidad, pero se busca que este sea el más bajo posible.

El grado de multicolinealidad aceptado dependerá del criterio del investigador.

Page 7: MultiColineAliDad

Guía de contenido

Modelación y Simulación 2 Página 7

Ejemplo

𝑌 = Nivel de ahorro

𝑋1 = Gastos de hombres en un mes

𝑋2 = Gastos de mujeres en un mes

𝑋3 = Gastos de toda la población en un mes

𝑋 es una combinación lineal de 𝑋1 y 𝑋2 (𝑋3 = 𝑋1 + 𝑋2 ). La correlación 𝑟13 entre

𝑋1 𝑦 𝑋3 y la correlación 𝑟23 entre 𝑋2 𝑦 𝑋3 es muy alta. Esto garantiza la presencia de la

multicolinealidad y crea muchos problemas en el uso de las técnicas de regresión.

Pruebas para detectar multicolinealidad

La forma más directa para probar la multicolinealidad es producir una matriz de correlación

para todas las variables del modelo.

En toda matriz de correlaciones la diagonal siempre tiene valores “1” y la parte

superior es idéntica a la inferior.

𝒀 𝑿𝟏 𝑿𝟐 𝑿𝟑 𝑿𝒏

𝒀 1 𝑟(𝑋1 ,𝑌) 𝑟(𝑋2 ,𝑌) 𝑟(𝑋3 ,𝑌) 𝑟(𝑋𝑛 ,𝑌)

𝑿𝟏 𝑟(𝑌, 𝑋1) 1 𝑟(𝑋2 ,𝑋1) 𝑟(𝑋3 ,𝑋1) 𝑟(𝑋𝑛 ,𝑋1)

𝑿𝟐 𝑟(𝑌, 𝑋2) 𝑟(𝑋1 ,𝑋2) 1 𝑟(𝑋3 ,𝑋2) 𝑟(𝑋𝑛 ,𝑋2)

𝑿𝟑 𝑟(𝑌, 𝑋3) 𝑟(𝑋1 ,𝑋3) 𝑟(𝑋2 ,𝑋3) 1 𝑟(𝑋𝑛 ,𝑋3)

𝑿𝒏 𝑟(𝑌, 𝑋𝑛) 𝑟(𝑋1 ,𝑋𝑛) 𝑟(𝑋2 ,𝑋𝑛) 𝑟(𝑋3 ,𝑋𝑛) 1

Pruebas de hipótesis para las autocorrelaciones

Para las parejas de variables independientes donde se vea una alta correlación, se

debe efectuar una prueba de hipótesis para el coeficiente de correlación de ambas

variables.

𝐻0: 𝜌12 = 0

𝐻𝐴: 𝜌12 ≠ 0

Donde 𝜌12 es el coeficiente de correlación poblacional para 𝑋1 y 𝑋2.

𝑡 =𝑟12

𝑆𝑟

Donde 𝑟12 es la correlación muestral entre 𝑋1 y 𝑋2 y

Matriz de correlación: Es una matriz que muestra todas las posibles parejas de

variables y su coeficiente de correlación asociado.

Page 8: MultiColineAliDad

Guía de contenido

Modelación y Simulación 2 Página 8

𝑆𝑟 = 1 − 𝑟12

2

𝑛 − 2

Hay 𝑛 − 2 (no 𝑛 − 𝑘 − 1) grados de libertad.

Además del análisis de la matriz de correlaciones, una segunda forma es realizar una

comparación de los coeficientes de determinación de cada una de las variables independientes

con la variable dependiente, de tal forma que se pueda apreciar si hay alguna variable que no

aporta suficiente luego de integrarla al modelo.

Si el crecimiento luego de agregar una variable no es significativo, dicha variable puede aportar

problemas de multicolinealidad.

Factor de inflación de la varianza

Un tercer método para detectar multicolinealidad es analizar el Factor de Inflación de la

Varianza (𝐹𝐼𝑉).

El 𝐹𝐼𝑉 para una variable 𝑋, se calcula realizando regresión con respecto al resto de variables,

utilizando el coeficiente de determinación para calcular la influencia de la variable 𝑋 en la

multicolinealidad.

𝐹𝐼𝑉 𝑋𝑖 =1

1 − 𝑅𝑖2

La multicolinealidad produce un incremento en la variación o error estándar del coeficiente de

regresión.

El 𝐹𝐼𝑉 mide el incremento en la varianza del coeficiente de regresión por encima del que

ocurriría si no estuviese presente la multicolinealidad.

Presencia de multicolinealidad

1. Incapacidad para separar el efecto neto de las variables independientes

individuales sobre "𝑌".

2. Un error estándar exagerado para los coeficientes "𝑏".

3. Signos algebraicos en los coeficientes que contradicen la lógica o naturaleza del

sistema real.

4. Alta correlación entre variables independientes y un 𝐹𝐼𝑉 elevado.

FIV: El 𝐹𝐼𝑉 para toda variable independiente es una medida del grado de multicolinealidad en que

contribuye dicha variable.

Criterio para analizar el FIV : La multicolinealidad no se considera un problema

significativo a menos que uno de los valores de los 𝐹𝐼𝑉 sea como mínimo 10, o bien la

suma de todos los 𝐹𝐼𝑉 sea como mínimo 10.

Page 9: MultiColineAliDad

Guía de contenido

Modelación y Simulación 2 Página 9

5. Grandes cambios en los coeficientes o en sus signos, si el numero de

observaciones cambia en una sola observación.

6. Una razón "𝐹" significativa combinada con razones "𝑡" no significativas.

7. Grandes cambios en los coeficientes o en sus signos cuando se adiciona o se quita

una variable.

Corrigiendo la multicolinealidad

La solución evidente será eliminar la variable que provoque el problema de multicolinealidad.

Si dos variables independientes tienen una alta relación entre si, será variable candidata a

eliminar la que menos aporte en la explicación de la variable dependiente.

Al

elimin

ar una

de las

variabl

es

puede conllevar la presencia de un sesgo de especificación.

Si la lógica del sistema real no permite la eliminación del sistema se puede considerar lo

siguiente:

Cambiar de dimensiones la variable.

No incluir valores totales, más bien individuales.

Combinar dos o más variables en una sola.

Práctica

Considere la siguiente tabla de datos:

𝒀 = Pasajeros (miles)

𝑿𝟏= Publicidad (miles de dólares)

𝑿𝟐= Ingreso nacional (billones de dólares)

15 10 2.40 17 12 2.72 13 8 2.08 23 17 3.68 16 10 2.56 21 15 3.36 14 10 2.24 20 14 3.20 24 19 3.84 17 10 2.72 16 11 2.07 18 13 2.33 23 16 2.98

Sesgo de especificación: Especificación errónea de un modelo a causa de la

inclusión o exclusión de ciertas variables que provocan contradicción con los

principios teóricos del sistema real.

Page 10: MultiColineAliDad

Guía de contenido

Modelación y Simulación 2 Página 10

15 10 1.94 16 12 2.17

1. Encuentre el modelo de regresión múltiple.

2. Explique el error estándar de estimación.

3. Explique el coeficiente de determinación.

4. ¿Qué explicación puede dar al coeficiente de determinación corregido?

5. Realice una prueba total del modelo.

6. Dé sus conclusiones.

7. Realice pruebas individuales para los coeficientes.

8. Encuentre la matriz de correlación y explíquela.

9. ¿Hay multicolinealidad?

10. Encuentre el modelo de regresión múltiple.

11. Haga un análisis para los valores 𝐹𝐼𝑉.

12. Realice pruebas para detectar existencia significativa de multicolinealidad.

13. De ser necesario de sus recomendaciones para solucionar un alto grado de

multicolinealidad.

14. Dé sus conclusiones.

Page 11: MultiColineAliDad

Guía de contenido

Modelación y Simulación 2 Página 11

1.4. Variables Categóricas

1.4.1. Dicotómicas

1.4.2. Policotomicas

1.5. Coeficiente de determinación

1.6. Matriz de correlación

1.7. Colinealidad

1.8. Matriz de covarianza y varianza

1.9. Intervalos de confianza para coeficientes

1.10. Técnicas de muestreo

1.10.1. Método aleatorio

1.10.2. Método Sistemático

1.10.3. Estratos

2. Series de tiempo

2.1. Pronósticos

2.2. Análisis de tendencia

2.2.1. Método Gráfico

2.2.2. Método de Medias Móviles

2.3. Análisis de series temporales

2.4. Componentes de una serie de tiempo.

2.5. Autocorrelación

2.6. Coeficientes de autocorrelación

2.7. Correlograma

3. Presupuestos y herramientas gerenciales

3.1. El presupuesto como herramienta para pronosticar

3.2. Potencial del mercado total

Page 12: MultiColineAliDad

Guía de contenido

Modelación y Simulación 2 Página 12

3.3. Indicador de Factor Múltiple