Regresión lineal. Definición del problema Evaluar la capacidad explicativa de un conjunto de...
-
Upload
inigo-bobo -
Category
Documents
-
view
223 -
download
2
Transcript of Regresión lineal. Definición del problema Evaluar la capacidad explicativa de un conjunto de...
Regresión lineal
Definición del problema Evaluar la capacidad explicativa de un
conjunto de características socio demográficas que inciden en los ingresos laborales de los jóvenes.
Evaluar el peso de factores tales como la edad, el sexo, el nivel de instrucción y la categoría ocupacional.
Y (Nivel de Ingresos) =Y (Nivel de Ingresos) =
b0 + b1.X1 (nivel educativo)+ b2.X2
(categoría ocupacional) + b3.x3 (sexo) +
b4.x4 (edad) + u
cuadro resumen variables del modelo
variable Categorías tipo tratamiento
variable dependiente
Nivel de ingresos (p21) métrica logarítmica
variables explicativas
categorías originales
Nivel educativo alcanzado 1 Sin Instrucción
2 Primaria completa
3 Secundaria completa
4 Terciario Univ. Comp.
ordinal
Transformación en variables
dummy (categoría de comparación secundario completo)
1- sin instrucción Dummy 1 sin instrucción
0-resto categórica
1- primaria completa Dummy 2 Primaria completa
0-resto categórica
1- universitario completa Dummy 3 Universitario completo
0-resto categórica
categorías originales
1-patrón o empleador
2-trabajador por cuenta propia
3-obrero o empleado
categoría ocupacional
4-trabajador familiar sin salario
categórica
Transformación en variables
dummy (compara
asalariados contra el resto)
1- asalariado Dummy_as
0-resto categórica
sexo 1- varón
0-mujer categórica
edad métrica
1 varon asalariado interacción entre sexo y categoría ocupacional 0 varon no asalariado y mujeres
categórica
Gráficos de dispersión
Matriz de correlaciones (supuesto de multicolinealidad)
MULTICOLINEALIDADMULTICOLINEALIDAD
Incorporar Incorporar Interacción Interacción entre nivel entre nivel educativo y educativo y
edadedad
Transformación de las variables independientes
NIVEL_ED NIVEL(1) NIVEL(2) NIVEL(3)
1 - Sin Instrucción 1 0 0
2 - Primaria Completa 0 1 0
3 - Secundaria Completa 0 0 0
4 - Universitario Completo y más 0 0 1
Lista de variables y Lista de variables y propiedadespropiedades
Quiero establecer como categoría de Quiero establecer como categoría de comparación el nivel secundario comparación el nivel secundario completo para medir el efecto que completo para medir el efecto que produce tener menores o mayores produce tener menores o mayores credenciales a estascredenciales a estas
Variable de Variable de origenorigen
Variable de Variable de resultadoresultado
NIVEL_ED NIVEL(1) NIVEL(2) NIVEL(3)
1 - Sin Instrucción 1 0 0
2 - Primaria Completa 0 1 0
3 - Secundaria Completa 0 0 0
4 - Universitario Completo y más 0 0 1
NIVEL_ED NIVEL(1) NIVEL(2) NIVEL(3)
1 - Sin Instrucción 1 0 0
2 - Primaria Completa 0 1 0
3 - Secundaria Completa 0 0 0
4 - Universitario Completo y más 0 0 1
Crea variable de Crea variable de interacción interacción edad*nivel educativoedad*nivel educativo
Aplicación del modelo
trabajamos sólo con los trabajamos sólo con los ocupados de entre 15 y 29 ocupados de entre 15 y 29 años que tienen ingresosaños que tienen ingresos
El método más usual es El método más usual es introducir:introducir: incluye todas incluye todas las variables las variables dependientes al mismo dependientes al mismo tiempotiempo
Prueba para Prueba para correlación de correlación de errores entre sí errores entre sí (varía entre 0y4. 2 (varía entre 0y4. 2 es no correlación) es no correlación)
Pruebas correlación Pruebas correlación de errores con la de errores con la
variable Y variable Y (heterocedasticidad)(heterocedasticidad)
Pruebas de Pruebas de normalidad de normalidad de residuosresiduos
Guarda los residuos Guarda los residuos tipificados en tipificados en valores z como valores z como variable. Puede variable. Puede utilizarse como utilizarse como variable filtro de variable filtro de casos raroscasos raros
Pruebas de Pruebas de normalidad de normalidad de residuosresiduos
Pruebas de Pruebas de normalidad de normalidad de residuosresiduos
Pruebas correlación Pruebas correlación de errores con la de errores con la
variable Y variable Y (heterocedasticidad)(heterocedasticidad)
Ajustes del modelo
Transformación de la variable dependiente
Eliminación de casos raros
Transformar Transformar ingresos en variable ingresos en variable logarítmicalogarítmica
Nombre de la nueva Nombre de la nueva variablevariable
Logaritmo de la variable Logaritmo de la variable que se asigne entre que se asigne entre paréntesisparéntesis
Eliminación de casos Eliminación de casos rarosraros