VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población...

18
VI Congreso ALAP Dinámica de población y desarrollo sostenible con equidad DETERMINANTES DE LA INSERCIÓN LABORAL DE LOS MIGRANTES CALIFICADOS DE ORIGEN MEXICANO EN ESTADOS UNIDOS, 1994-2009 Juan Gabino González Becerril Etapa 3

Transcript of VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población...

Page 1: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

VI Congreso ALAP Dinámica de población y desarrollo

sostenible con equidad

DETERMINANTES DE LA INSERCIÓN LABORAL DE LOS MIGRANTES CALIFICADOS DE ORIGEN MEXICANO EN ESTADOS UNIDOS, 1994-2009 Juan Gabino González Becerril

Etapa 3

Page 2: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

DETERMINANTES DE LA INSERCIÓN LABORAL DE LOS MIGRANTES CALIFICADOS DE ORIGEN MEXICANO EN ESTADOS UNIDOS, 1994-2009

Juan Gabino González Becerril

Centro de Investigación y Estudios Avanzados de la Población

Universidad Autónoma del Estado de México

Resumen

En este capítulo se presenta el modelo de regresión logística, apropiado para

predecir una variable categórica dicotómica. Esta situación no es muy común

en la investigación demográfica pero sí en los estudios del mercado de trabajo

y en otras áreas de la Demografía. Este modelo tiene ventajas sobre el análisis

discriminante al no requerir supuestos como el de normalidad o de

homocedasticidad, que en muchos casos son difíciles de cumplir. Por otro lado,

la regresión logística tiene semejanzas con la regresión múltiple: cuenta con

contrastes estadísticos, puede incorporar efectos no lineales y permite realizar

diferentes diagnósticos. En la actualidad este método es ampliamente utilizado

tanto en estudios observacionales como de encuesta y experimentales. Se

presentan de manera sencilla los fundamentos lógicos y estadísticos del

método, ilustrándose con un ejemplo los procedimientos de cálculo e

interpretación de los resultados. Con dicho modelos se busca identificar a los

factores de mayor peso en la inserción laboral de la migración calificada en los

últimos años 1994-2009 en Estados Unidos.

Introducción

Cuando una pregunta de investigación se orienta a conocer cómo inciden

diversas variables independientes sobre una variable dependiente, el modelo

de regresión lineal clásico permite encontrar una respuesta. En ese caso no se

presentan restricciones respecto de las variables independientes o predictoras,

pero sí respecto de la variable dependiente que se supone debe ser continua y

debe medirse al menos en un nivel de intervalo. Sin embargo, en muchas

circunstancias de investigación, como en Demografía, Psicología u otras

disciplinas de las ciencias sociales, la variable dependiente es categórica

(dicotómica o politómica). (Por ejemplo, cuando evaluamos la inserción laboral:

calificado y no calificado; trabajo y busco trabajo; migrar o no migrar, entre

Page 3: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

otros). En estos casos es apropiado el método de regresión logística, que se

caracteriza por ser un modelo de probabilidad lineal.

Este modelo es una generalización del modelo de regresión lineal clásico para

variables dependientes categóricas dicotómicas (Ato y García 1996). Tiene la

ventaja de no requerir supuestos como el de normalidad multivariable y el de

homocedasticidad (igualdad de las varianzas) que son difíciles de verificar.

Además, para algunos es más potente que el análisis discriminante cuando

estos supuestos no se cumplen. Otra ventaja radica en su similitud con la

regresión múltiple, porque permite el uso de variables independientes continuas

y categóricas (estas últimas por medio de su codificación a variables ficticias).

Además cuenta con contrastes estadísticos directos, tiene capacidad de

incorporar efectos no lineales y es útil para realizar diagnósticos (Hair,

Anderson, Tatham y Black, 1999). Tiene una amplia aplicación en estudios

observacionales, de encuesta y experimentales, así como en estudios

demográficos, mercados de trabajo y epidemiológicos (Hair et al, 1999;

Schelesslman, 1982; Ato y López, 1996; García; Alvarado y Jiménez; 2000).

Numerosas investigaciones muestran las ventajas de utilizar el análisis de

regresión logística en la evaluación del Funcionamiento Diferencial del Ítem

(DIF), especialmente en la detección de DIF cuando la muestra no es uniforme

o es mixta y cuando no tiene un tamaño suficiente para trabajar con la

regresión (Alderete, 2006).

Teniendo en cuenta que ha aumentado la aplicación de la regresión logística

en la investigación demográfica y concretamente en temas de migración, este

documento está orientado a lograr un acercamiento (más práctico que teórico

sobre la migración calificada) a los aspectos más importantes relativos a esta

técnica estadística, concentrándose en dos factores fundamentales: i) una

breve revisión teórica de la técnica y ii) un ejemplo del uso de la regresión

logística, prestando atención a los aspectos prácticos que orientan a un uso

más adecuado y a una interpretación más confiable de los resultados.

Fuentes de información

Page 4: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

La fuente de información utilizada en nuestro trabajo es la Encuesta Continua

de Población (CPS por sus siglas en inglés) que desarrolla el Buró del Censo

de Estados Unidos, disponible en https://usa.ipums.org/usa-

action/variables/group y se ha armonizado los datos para que sean

compatibles con el tiempo y con IPUMS-EE.UU. Los datos vienen el número de

registro y por año fusionados desde 1994 a 2009. La CPS proporciona

información que permite apoyar los fundamentos teóricos, así como las

diferentes técnicas y métodos que utilizamos para medir los determinantes de

la inserción laboral de los migrantes calificados mexicanos en Estados Unidos

durante este periodo.

IPUMS-CPS es un conjunto integrado de datos de 48 años (1962-2009) de la

Encuesta de Población Actual de marzo (CPS). El CPS es una encuesta

mensual de los hogares EE.UU. llevado a cabo conjuntamente por la Oficina

del Censo de EE.UU. y la Oficina de Estadísticas Laborales. Iniciado en la

década de 1940 a raíz de la Gran Depresión, la encuesta fue diseñada para

medir el desempleo. Una batería de la fuerza de trabajo y las cuestiones

demográficas, conocida como la "encuesta de base mensual," se le pide cada

mes. Con el tiempo, se han añadido preguntas complementarias sobre temas

especiales para determinados meses. Entre estos estudios complementarios, el

archivo y el Ingreso Suplemento demográfico anual de marzo (en adelante, el

CPS de marzo) es el más utilizado por los científicos sociales y los

responsables políticos, y proporciona los datos para IPUMS-CPS.

Para hacer comparaciones en tiempo cruzada utilizando los datos de la CPS de

marzo más factible, las variables en IPUMS-CPS se codifican de forma idéntica

o "armonizar" para 1962 y 2009. IPUMS-CPS también facilita el estudio de los

cambios a largo plazo, proporcionando la documentación detallada que abarca

las cuestiones de comparabilidad para cada variable y un sistema de extracción

de datos interactiva.

Este conjunto de datos armonizados es también compatible con los datos de

los censos decenales estadounidenses que forman parte de la Serie de

Microdatos de Uso Público Integrado (IPUMS-EE.UU.). Los investigadores

pueden aprovechar el relativamente gran tamaño de la muestra de IPUMS-

Page 5: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

EE.UU. a intervalos de diez años y complete la información para los años

intermedios utilizando IPUMS-CPS. Documentación para las variables

individuales en IPUMS-CPS cubre problemas de comparabilidad entre IPUMS-

CPS y IPUMS-EE.UU.. Consulte las notas de la muestra y diseños de la

muestra para obtener más información general acerca de las CPS y datos

IPUMS-CPS.

IPUMS-CPS se compone de todas las variables sustantivas de las muestras

originales de CPS. Se han excluido varias variables construidas desde las

bases de datos originales.

Como IPUMS-EE.UU., IPUMS-CPS es microdatos - proporciona información

sobre personas individuales y familias. Los investigadores pueden crear

tabulaciones y multivariado adaptados a sus preguntas particulares, utilizando

su conjunto deseado de variables.

Los investigadores pueden acceder a los datos IPUMS-CPS sin cargo

completando el formulario de inscripción. Los datos no son adecuados para el

estudio de áreas geográficas pequeñas o para la investigación genealógica.

Publicaciones basadas en estos datos deben citar adecuadamente la base de

datos y deben ser reportados a IPUMS-CPS.

El proyecto IPUMS-CPS se llevó a cabo por el Centro de Población de

Minnesota. Mayor parte del financiamiento proviene del programa de la

Fundación Nacional de Ciencias en Infraestructura Ciencias Sociales, además

de la financiación suplementaria de la Fundación Robert Wood Johnson.

El modelo de regresión logística La regresión logística, al igual que otras técnicas estadísticas multivariadas,

permite la posibilidad de evaluar la influencia de cada una de las variables

independientes sobre la variable dependiente o de respuesta y controlar el

efecto del resto. Tendremos, por tanto, una variable dependiente, denominada

Y, que puede ser dicotómica o politómica y una o más variables

independientes, llamémoslas X´s, que pueden ser de cualquier naturaleza,

cualitativas o cuantitativas. Si la variable Y es dicotómica, podrá tomar el valor

Page 6: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

"0" si el hecho no ocurre y "1" si el hecho ocurre. Este proceso se denomina

binomial, ya que solo sólo tiene dos posibles resultados y la probabilidad de

cada uno de ellos es constante en una serie de repeticiones.

Un proceso binomial está caracterizado por la probabilidad de éxito,

representada por p y la probabilidad de fracaso se representa por q. En

ocasiones, se usa el cociente p/q que indica cuánto más probable es el éxito

que el fracaso, como parámetro característico de la distribución binomial. Los

modelos de regresión logística permiten estudiar si una variable categórica

depende o no de otra u otras variables. La distribución condicional de la

variable dependiente, al ser categórica, no puede distribuirse normalmente,

toma la forma de una distribución binomial y en consecuencia la varianza no es

constante, por lo que se encuentran situaciones de heterocedasticidad.

El modelo de regresión logística puede ser representado de la siguiente

manera:

Logist (π)= Log(πi/1-πi) Donde: π1, es la probabilidad de observar la categoría o evento por predecir, y

1- π, es la probabilidad de no observar la categoría o evento por predecir. Es

un modelo logístico lineal porque es lineal la escala del logaritmo de la razón de

los productos cruzados (RPC). Varía entre - ∞ y + ∞ . Una ventaja de este

modelo es que puede utilizarse en muestreos prospectivos o retrospectivos

debido a que los efectos se refieren a la razón de los productos cruzados.

Ajuste del modelo logístico para la inserción laboral de los inmigrantes calificados mexicanos A continuación se muestra un ejemplo del uso de la regresión logística con

base en datos de Curren Population Survey sobre la inserción laboral en

trabajo calificado y no calificado de los mexicanos entre 1994 y 2009.

Page 7: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

Se pretende lograr un mayor acercamiento a los determinantes de la inserción

laboral y en este estudio se utilizó la regresión logística para identificar las

variables que mejor predicen el tipo de empleo. La variable dependiente

ocupación es una variable categórica dicotómica: calificado-no calificado. En

función de análisis en capítulos previos se incluyeron como variables

independientes o predictoras las siguientes variables categóricas: nivel

educativo, año de llegada, edad, sexo, estado civil, área metropolitana, estatus

migratorio, año de la encuesta y sector de actividad (variables ordinales

continuas es el porcentaje de inmigrantes). A continuación se presentan los

resultados obtenidos utilizando el paquete estadístico para las ciencias sociales

(Social Package Social Sciences, SPSS 15).

Las primeras dos tablas que ofrece el programa, no incluidas en este trabajo,

presentan el número de casos contenidos en el análisis y la codificación de la

variable dependiente. Es importante tener en cuenta que la categoría a la que

corresponde el código 1 es aquella sobre la que se calcula la probabilidad de

ocurrencia (evento favorable), en este caso es el trabajo calificado. A

continuación se presentan los datos del modelo nulo, es decir, los datos sin

incluir la información de las variables predictoras. Se realiza la predicción con la

única información de los datos observados de la variable dependiente.

Cuadro1. Clasificación de de los casos observados Tabla de clasificación(a,b)

Observado

Pronosticado

Ocupación Porcentaje

correcto Calificado No calificado Paso 0 Ocupación Calificado 1076890 0 100.0

No calificado 1005407 0 .0 Porcentaje global 51.7

a En el modelo se incluye una constante. b El valor de corte es .500 En el cuadro 1 se presenta la clasificación de los casos según su ocurrencia y

según la predicción realizada en función del modelo nulo. Como puede

observarse, habría un 100% de acierto del pronóstico de empleo calificado y

ningún acierto en el pronóstico del no calificado, por lo cual el porcentaje total

de acierto es de 51.7 por ciento.

Cuadro 2. Estadístico estimado del modelo nulo (paso 0) Variables en la ecuación

Page 8: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

B E.T. Wald gl Sig. Exp(B) Paso 0 Constante -.069 .001 2452.984 1 .000 .934

En el cuadro 3 se presentan los parámetros del modelo nulo: B o constante, el

error estándar correspondiente, el estadístico Wald, los grados de libertad del

estadístico, el nivel de significación y el exponencial de B.

El estadístico Wald es significativo, es decir que B difiere significativamente de

0 y por lo tanto se produce cambio sobre la variable dependiente. También el

programa proporciona datos sobre las variables que no fueron incorporadas en

la ecuación. Después se presentan los datos ya sea que el método de

introducción de las variables escogido sea introducir las variables

simultáneamente o por pasos. En este caso se utilizó el método por pasos

hacia delante, utilizando como criterio la significación estadística de los

coeficientes B de las variables introducidas usando el estadístico W de Wald.

Cuadro 3. Pruebas omnibus sobre los coeficientes del modelo Chi-cuadrado gl Sig. Paso 1 Paso 528782.849 5 .000

Bloque 528782.849 5 .000 Modelo 528782.849 5 .000

Paso 2 Paso 52872.608 1 .000 Bloque 581655.457 6 .000 Modelo 581655.457 6 .000

Paso 3 Paso 31419.703 3 .000 Bloque 613075.159 9 .000 Modelo 613075.159 9 .000

Paso 4 Paso 32437.239 2 .000 Bloque 645512.399 11 .000 Modelo 645512.399 11 .000

Paso 5 Paso 26977.808 1 .000 Bloque 672490.207 12 .000 Modelo 672490.207 12 .000

Paso 6 Paso 21641.589 2 .000 Bloque 694131.796 14 .000 Modelo 694131.796 14 .000

Paso 7 Paso 16067.872 4 .000 Bloque 710199.668 18 .000 Modelo 710199.668 18 .000

Paso 8 Paso 10758.644 1 .000 Bloque 720958.312 19 .000 Modelo 720958.312 19 .000

Paso 9 Paso 10179.496 1 .000 Bloque 731137.808 20 .000

Page 9: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

Modelo 731137.808 20 .000 Paso 10 Paso 3236.912 2 .000

Bloque 734374.720 22 .000 Modelo 734374.720 22 .000

En el cuadro 3 se presentan los resultados de las pruebas sobre la disminución

de las desviaciones (-2LL) o lo que es igual la ganancia obtenida en cada

modelo. Recuérdese que cuanto menor es –2LL es mejor el ajuste del modelo.

Se pueden observar para cada paso los valores de las siguientes entradas:

Paso, Bloque y Modelo. El Chi cuadrado correspondiente a la fila modelo es la

diferencia entre el –2LL para el modelo nulo y –2LL para el modelo actual. Se

contrasta la hipótesis nula que postula que los coeficientes de todos los

términos, excepto la constante son igual a 0 (esto es comparable al test F

global para la regresión múltiple). El Chi cuadrado correspondiente a la fila

bloque es la diferencia entre 2l-2LL entre los bloques de entrada sucesivos en

la construcción del modelo. Como en general se introducen variables en un

solo bloque, el Chi cuadrado del modelo coincide con el Chi cuadrado del

bloque. En la fila correspondiente a Paso, el Chi cuadrado es la diferencia entre

el –2LL entre pasos sucesivos.

Se somete a prueba la hipótesis que los coeficientes de las variables

introducidas en el último paso son igual a 0 (comparable al F de cambio en la

regresión múltiple). En el ejemplo en consideración, en todos los caso el Chi

cuadrado es significativo, por lo que se desechan las hipótesis contrastadas.

Cuadro 4. Resumen de los modelos

Paso -2 log de la

verosimilitud R cuadrado de

Cox y Snell

R cuadrado de

Nagelkerke 1 2355440.170(a

) .224 .299

2 2302567.561(a) .244 .325

3 2271147.859(b) .255 .340

4 2238710.620(b) .267 .356

5 2211732.811(b) .276 .368

6 2190091.222(b) .283 .378

7 2174023.350(b) .289 .385

8 2163264.706(b) .293 .390

9 2153085.210(b .296 .395

Page 10: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

) 10 2149848.298(c

) .297 .396

a La estimación ha finalizado en el número de iteración 4 porque las estimaciones de los parámetros han cambiado en menos de .001. b La estimación ha finalizado en el número de iteración 5 porque las estimaciones de los parámetros han cambiado en menos de .001. c La estimación ha finalizado en el número de iteración 20 porque se han alcanzado las iteraciones máximas. No se puede encontrar una solución definitiva.

Obsérvese que hay una disminución del –2LL (segunda columna). En relación

al primer paso, el -2LL menor corresponde al décimo modelo. Recuérdese que

cuando menor es -2 LL, mayor es la verosimilitud y mejor el ajuste del modelo.

Los coeficientes de determinación R2L (tercera columna) no son altos, pero

aumentan a partir del segundo hasta el décimo. El coeficiente de Nagelkerke

del último modelo es .396 y teniendo en cuenta que el valor máximo es 1

podemos decir que es un coeficiente no muy alto, que un importante porcentaje

de la varianza es explicado por las variables predictoras introducidas en el

modelo. El programa proporciona también los resultados de la prueba de

Hosmer y Lemeshow para cada modelo, basado en la comparación entre los

casos observados y los casos pronosticados. Cuadro 5. Prueba de Hosmer y Lemeshow Paso Chi-cuadrado Gl Sig. 1 16056.851 8 .000

Como se observa en cuadro 5, para el primer modelo Chi cuadrado es

significativo, lo cual estaría indicando un mal ajuste del modelo, en el sentido

que la hipótesis que se contrasta es que no existen diferencias entre las

frecuencias de los casos observados y las frecuencias de los casos

pronosticados.

Para analizar el ajuste en la clasificación en cada modelo, el programa

suministra una tabla de clasificación (ver cuadro 6) donde se consignan las

frecuencias en las categorías de la variable dependiente de los diez modelos

según lo observado y lo pronosticado. Los datos proporcionados permiten

analizar la especificidad y sensibilidad del modelo y también las tasas de

inserción favorable y no favorable. En este caso, si bien en el modelo 9 y el

modelo 10 el porcentaje global es el mismo: 74.6 por ciento, en el modelo 10

los favorables y no favorables son menores. Es destacable que aumenta

Page 11: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

significativamente el porcentaje global de clasificación correcta en comparación

con el porcentaje del modelo nulo que era de 51.7 por ciento (véase cuadro 1 y

cuadro 6).

Cuadro 6. Tabla de clasificación(a)

Observado

Pronosticado

Ocupación Porcentaje

correcto Calificado No calificado Paso 1 Ocupación Calificado 872729 204161 81.0

No calificado 379896 625511 62.2 Porcentaje global 72.0

Paso 2 Ocupación Calificado 731674 345216 67.9 No calificado 230238 775170 77.1

Porcentaje global 72.4 Paso 3 Ocupación Calificado 830495 246395 77.1

No calificado 336439 668969 66.5 Porcentaje global 72.0

Paso 4 Ocupación Calificado 797304 279587 74.0 No calificado 307744 697663 69.4

Porcentaje global 71.8 Paso 5 Ocupación Calificado 787801 289089 73.2

No calificado 264455 740952 73.7 Porcentaje global 73.4

Paso 6 Ocupación Calificado 817392 259499 75.9 No calificado 257451 747956 74.4

Porcentaje global 75.2 Paso 7 Ocupación Calificado 824553 252337 76.6

No calificado 265410 739998 73.6 Porcentaje global 75.1

Paso 8 Ocupación Calificado 811384 265507 75.3 No calificado 271105 734302 73.0

Porcentaje global 74.2 Paso 9 Ocupación Calificado 814261 262630 75.6

No calificado 267188 738219 73.4 Porcentaje global 74.6

Paso 10 Ocupación Calificado 814261 262630 75.6 No calificado 267188 738219 73.4

Porcentaje global 74.6 a El valor de corte es .500 En el cuadro 7, denominado “Variables en la Ecuación”, se presentan los

estimadores de los parámetros (coeficientes B), sus errores típicos, el

estadístico W de Wald, sus grados de libertad y su probabilidad asociada, las

estimaciones de las odds ratio (Exp B) para las variables predictoras y la

constante para cada modelo.

Page 12: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

La primera variable que ingresa en el modelo es sector, que presenta el mayor

puntaje del estadístico. Analizando el último paso o último modelo, es posible

apreciar que fueron incorporadas nueve variables predictoras: nivel educativo

(eudca), año de llegada (añom), edad (edad), sexo (sex), estado civil (edocivil),

porcentaje de migrantes (percent2), área metropolitana (metro_r), ciudadanía

(status), año de la CPS (años) y sector de actividad (sector). Las variables que

no aparecen fueron desechadas porque sus coeficientes no difieren

significativamente de 0, vale decir que no aportan a la predicción de la

inserción laboral de los inmigrantes mexicanos en Estados Unidos.

Observando los coeficientes B se puede postular que las variables que más

aportan son años de llegada, sector de actividad y nivel educativo. El cuadro de

regresión logística muestra los valores estimados para los coeficientes del

modelo (β1 =-3.586, β2 =1.946, β3 =1.262, β4 =18.668, β5 =-.156, β6 =.706, β7 =.777, β8= .821,

β9 = -.343, β10 =.624, β11 = -.376, β12= .000, β13= .594, β14= .733, β15 = -.700, β16 = -1.121, β17 =

-1.161, β18 = -.610, β19 = 2.734, β20 = 1.901, β21= .896, β22= .587, β23 =2.135,) junto con sus

p-valores asociados, respectivamente.

Como se ha comentado anteriormente, los coeficientes β2 y β3 ... β23 se pueden

interpretar como el cambio que se produce en el término Logit al incrementarse

en una unidad la variable explicativa asociada (en la mayoría de las variables

presentan coeficientes estadísticamente significativos (p<0,05).

Al utilizar regresión logística, también aparecen los odds-ratio (Exp(β2)= 6.998,

Exp(β3)= 3.533, Exp(β4)= 128049741.183, Exp(β5)=.856, Exp(β6)= 2.026, Exp(β7)= 2.175,

Exp(β8)= 2.274, Exp(β9)=.710, Exp(β10)= 1.866, Exp(β11)=.686, Exp(β12)= 1.000, Exp(β13)=

1.812, Exp(β14)= 2.081, Exp(β15)=.496, Exp(β16)=.326, Exp(β17)=.313, Exp(β18)=.543,

Exp(β19)= 15.390, Exp(β20)= 6.693, Exp(β21)= 2.450, Exp(β22)= 1.799 y Exp(β23)= 8.456,

respectivamente).

Las Exp(betas) de las variables nivel educativo, años en Estados Unidos, edad,

estado civil, sexo, porcentaje de migrantes, residencia en área metropolitana y

la situación del mercado como sector de actividad son mayores a 1, por tanto,

son factores que incrementan la probabilidad de estar trabajando en

ocupaciones calificadas. Para las Exp(betas) que presentan un valor menor a

uno o cercano a cero, disminuye la probabilidad de estar en ocupaciones

calificadas (véase modelo 10).

Page 13: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

Por ejemplo, es posible concluir que el hecho de estar en el sector 5 (codificado

como 5) aumenta aproximadamente 8 veces (OR=4,174) el riesgo de estar en

una ocupación calificada. En conclusión, el hecho de estar en el sector 5 y

tener una licenciatura o posgrado, aumenta el riesgo de tener una ocupación

calificada.

Cuadro 7. Variables en la ecuación B E.T. Wald gl Sig. Exp(B) Paso 1(a)

sector 421649.322 5 .000

sector(1) 3.122 .013 61592.612 1 .000 22.697 sector(2) 2.287 .005 233552.36

8 1 .000 9.842

sector(3) 1.284 .004 83270.692 1 .000 3.610 sector(4) .852 .006 20850.428 1 .000 2.344 sector(5) 2.967 .005 308956.53

9 1 .000 19.435

Constante -1.493 .003 204694.337 1 .000 .225

Paso 2(b)

status(1) -.773 .003 52301.374 1 .000 .462 sector 368160.39

2 5 .000

sector(1) 2.955 .013 54162.982 1 .000 19.206 sector(2) 2.161 .005 202708.19

9 1 .000 8.678

sector(3) 1.192 .005 69709.673 1 .000 3.294 sector(4) .831 .006 19261.653 1 .000 2.295 sector(5) 2.817 .005 271961.06

0 1 .000 16.730

Constante -1.132 .004 98610.813 1 .000 .322

Paso 3(c)

status(1) -.763 .003 50154.976 1 .000 .466 años 30046.511 3 .000 años(1) -1.148 .009 18030.143 1 .000 .317 años(2) -1.168 .009 18889.139 1 .000 .311 años(3) -.642 .009 5653.752 1 .000 .526 sector 270161.56

2 5 .000

sector(1) 2.961 .013 53838.328 1 .000 19.323 sector(2) 2.107 .005 189462.95

0 1 .000 8.224

sector(3) 1.156 .005 64989.562 1 .000 3.178 sector(4) .819 .006 18569.711 1 .000 2.268 sector(5) 2.340 .006 150648.25

0 1 .000 10.379

Constante -.068 .009 58.242 1 .000 .934 Paso 4(d)

educa 26844.355 2 .000 educa(1) 1.877 .017 12599.802 1 .000 6.531 educa(2) 1.230 .017 5040.921 1 .000 3.422

Page 14: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

status(1) -.790 .003 52838.901 1 .000 .454 años 29266.813 3 .000 años(1) -1.119 .009 16956.216 1 .000 .326 años(2) -1.180 .009 19105.763 1 .000 .307 años(3) -.643 .009 5641.112 1 .000 .526 sector 248349.35

9 5 .000

sector(1) 2.918 .013 50014.769 1 .000 18.501 sector(2) 2.029 .005 172201.58

5 1 .000 7.604

sector(3) 1.070 .005 54487.303 1 .000 2.916

B E.T. Wald gl Sig. Exp(B) sector(4) .738 .006 14869.442 1 .000 2.092 sector(5) 2.239 .006 136059.66

1 1 .000 9.381

Constante -1.770 .019 8935.962 1 .000 .170 Paso 5(e)

educa 32028.655 2 .000 educa(1) 1.991 .017 14349.897 1 .000 7.321 educa(2) 1.262 .017 5380.237 1 .000 3.534 sex(1) .616 .004 26801.428 1 .000 1.852 status(1) -.790 .003 51915.681 1 .000 .454 años 22745.797 3 .000 años(1) -.954 .009 12180.706 1 .000 .385 años(2) -1.005 .009 13667.486 1 .000 .366 años(3) -.508 .009 3457.868 1 .000 .602 sector 209117.63

7 5 .000

sector(1) 2.701 .013 41008.178 1 .000 14.887 sector(2) 1.821 .005 131192.49

1 1 .000 6.181

sector(3) .887 .005 35219.536 1 .000 2.428 sector(4) .593 .006 9229.440 1 .000 1.810 sector(5) 2.141 .006 123290.67

9 1 .000 8.505

Constante -2.325 .019 15072.509 1 .000 .098 Paso 6(f)

educa 31162.549 2 .000 educa(1) 1.969 .017 13816.986 1 .000 7.167 educa(2) 1.242 .017 5120.811 1 .000 3.462 sex(1) .618 .004 26487.412 1 .000 1.855 metro_r 20833.832 2 .000 metro_r(1) .666 .006 14356.074 1 .000 1.946 metro_r(2) .801 .006 20754.768 1 .000 2.227 status(1) -.766 .003 48041.215 1 .000 .465 años 23069.816 3 .000 años(1) -.967 .009 12512.379 1 .000 .380 años(2) -.993 .009 13339.730 1 .000 .371 años(3) -.496 .009 3293.093 1 .000 .609 sector 209778.92

5 5 .000

sector(1) 2.848 .013 44530.755 1 .000 17.262 sector(2) 1.842 .005 131992.48

1 1 .000 6.307

sector(3) .869 .005 33121.508 1 .000 2.384 sector(4) .546 .006 7566.312 1 .000 1.726 sector(5) 2.097 .006 117180.94 1 .000 8.140

Page 15: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

0 Constante -2.954 .020 22517.872 1 .000 .052

Paso 7(g)

educa 29321.326 2 .000 educa(1) 1.962 .017 13535.608 1 .000 7.116 educa(2) 1.256 .017 5152.704 1 .000 3.510 edad 14712.031 4 .000 edad(1) .666 .012 3262.138 1 .000 1.946 edad(2) .653 .012 3154.244 1 .000 1.921 edad(3) .735 .012 3772.828 1 .000 2.085 edad(4) -.389 .015 688.619 1 .000 .678 sex(1) .609 .004 25413.882 1 .000 1.839 metro_r 20240.465 2 .000

B E.T. Wald gl Sig. Exp(B) metro_r(1) .685 .006 14978.099 1 .000 1.984 metro_r(2) .790 .006 19960.674 1 .000 2.204 status(1) -.710 .004 39152.158 1 .000 .492 años 26298.131 3 .000 años(1) -1.113 .009 15449.828 1 .000 .329 años(2) -1.148 .009 16505.437 1 .000 .317 años(3) -.635 .009 5032.294 1 .000 .530 sector 204589.33

2 5 .000

sector(1) 2.834 .013 44294.317 1 .000 17.020 sector(2) 1.840 .005 129332.48

5 1 .000 6.299

sector(3) .864 .005 32623.266 1 .000 2.371 sector(4) .554 .006 7691.809 1 .000 1.740 sector(5) 2.097 .006 113706.04

3 1 .000 8.140

Constante -3.446 .023 22402.004 1 .000 .032 Paso 8(h)

educa 29074.541 2 .000 educa(1) 1.915 .017 13025.372 1 .000 6.789 educa(2) 1.200 .017 4747.804 1 .000 3.321 edad 15715.950 4 .000 edad(1) .706 .012 3511.631 1 .000 2.026 edad(2) .780 .012 4270.267 1 .000 2.182 edad(3) .861 .012 4927.382 1 .000 2.364 edad(4) -.277 .015 337.504 1 .000 .758 sex(1) .632 .004 27087.096 1 .000 1.881 edocivil(1) -.386 .004 10692.414 1 .000 .680 metro_r 19060.091 2 .000 metro_r(1) .672 .006 14211.127 1 .000 1.958 metro_r(2) .771 .006 18779.373 1 .000 2.161 status(1) -.704 .004 38260.779 1 .000 .495 años 26493.329 3 .000 años(1) -1.101 .009 15098.861 1 .000 .333 años(2) -1.144 .009 16362.456 1 .000 .318 años(3) -.617 .009 4731.992 1 .000 .540 sector 206798.60

8 5 .000

sector(1) 2.816 .014 43229.534 1 .000 16.714 sector(2) 1.877 .005 132328.76

3 1 .000 6.531

Page 16: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

sector(3) .885 .005 33920.519 1 .000 2.423 sector(4) .537 .006 7173.262 1 .000 1.712 sector(5) 2.107 .006 114093.53

4 1 .000 8.225

Constante -3.249 .023 19645.070 1 .000 .039 Paso 9(i)

educa 28160.149 2 .000 educa(1) 1.950 .017 13369.060 1 .000 7.026 educa(2) 1.261 .018 5185.842 1 .000 3.527 edad 16651.596 4 .000 edad(1) .735 .012 3913.517 1 .000 2.085 edad(2) .805 .012 4687.001 1 .000 2.238 edad(3) .852 .012 4974.380 1 .000 2.345 edad(4) -.317 .015 446.831 1 .000 .729

B E.T. Wald gl Sig. Exp(B) sex(1) .625 .004 26293.875 1 .000 1.869 edocivil(1) -.377 .004 10131.963 1 .000 .686 porcent2 .000 .000 10129.168 1 .000 1.000 metro_r 16756.750 2 .000 metro_r(1) .595 .006 10856.782 1 .000 1.814 metro_r(2) .734 .006 16753.634 1 .000 2.083 status(1) -.696 .004 37194.320 1 .000 .498 años 27108.529 3 .000 años(1) -1.120 .009 15470.082 1 .000 .326 años(2) -1.160 .009 16665.545 1 .000 .314 años(3) -.625 .009 4813.877 1 .000 .535 sector 206945.94

6 5 .000

sector(1) 2.725 .013 40791.825 1 .000 15.249 sector(2) 1.898 .005 134063.22

1 1 .000 6.673

sector(3) .892 .005 34173.979 1 .000 2.440 sector(4) .585 .006 8369.956 1 .000 1.794 sector(5) 2.131 .006 116111.04

9 1 .000 8.422

Constante -3.621 .023 23868.169 1 .000 .027 Paso 10(j)

educa 27840.913 2 .000 educa(1) 1.946 .017 13295.823 1 .000 6.998 educa(2) 1.262 .018 5193.791 1 .000 3.533 añom 301.415 2 .000 añom(1) 18.668 292.282 .004 1 .949 1.183 añom(2) -.156 .009 301.411 1 .000 .856 edad 16324.404 4 .000 edad(1) .706 .012 3652.233 1 .000 2.026 edad(2) .777 .012 4384.982 1 .000 2.175 edad(3) .821 .012 4631.099 1 .000 2.274 edad(4) -.343 .015 522.213 1 .000 .710 sex(1) .624 .004 26142.847 1 .000 1.866 edocivil(1) -.376 .004 10086.477 1 .000 .686 porcent2 .000 .000 9998.071 1 .000 1.000 metro_r 16721.576 2 .000 metro_r(1) .594 .006 10826.140 1 .000 1.812 metro_r(2) .733 .006 16718.393 1 .000 2.081 status(1) -.700 .004 37033.775 1 .000 .496

Page 17: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

años 23362.142 3 .000 años(1) -1.121 .010 13297.385 1 .000 .326 años(2) -1.161 .010 14401.027 1 .000 .313 años(3) -.610 .009 4259.602 1 .000 .543 sector 206107.19

5 5 .000

sector(1) 2.734 .013 41039.785 1 .000 15.390 sector(2) 1.901 .005 134248.11

3 1 .000 6.693

sector(3) .896 .005 34480.646 1 .000 2.450 sector(4) .587 .006 8431.852 1 .000 1.799 sector(5) 2.135 .006 115207.76

0 1 .000 8.456

B E.T. Wald gl Sig. Exp(B) Constante -3.586 .024 22662.547 1 .000 .028

a Variable(s) introducida(s) en el paso 1: sector. b Variable(s) introducida(s) en el paso 2: status. c Variable(s) introducida(s) en el paso 3: años. d Variable(s) introducida(s) en el paso 4: educa. e Variable(s) introducida(s) en el paso 5: sex. f Variable(s) introducida(s) en el paso 6: metro_r. g Variable(s) introducida(s) en el paso 7: edad. h Variable(s) introducida(s) en el paso 8: edocivil. i Variable(s) introducida(s) en el paso 9: porcent2. j Variable(s) introducida(s) en el paso 10: añom. Discusión En síntesis, se podría afirmar que la regresión logística es una adecuada

opción a la regresión lineal cuando lo que se desea predecir es el

comportamiento de una variable dependiente categórica. También ofrece

ventajas frente al análisis discriminante, al no requerir los supuestos de

normalidad y homocedasticidad. Para la estimación del modelo se utiliza el

procedimiento de máxima verosimilitud. El valor teórico presenta coeficientes

que informan el aporte de cada variable predictora en el pronóstico de

ocurrencia de las categorías de la variable dependiente ocupación. Se han

desarrollado varios procedimientos para evaluar la bondad del ajuste del

modelo y también se cuenta con coeficientes de determinación al estilo de R2

en la regresión lineal. La regresión logística tiene una amplia aplicación en la

investigación demográfica y especialmente en los estudios de salud, empleo y

migración.

Bibliografía

Page 18: VI Congreso ALAP - alapop.org€¦Centro de Investigación y Estudios Avanzados de la Población Universidad Autónoma del Estado de México ... mercados de trabajo y epidemiológicos

Alderete, Ana María, Fundamentos del Análisis de Regresión Logística en la

Investigación Psicológica, en Evaluar, 6 (2006), 52 – 67, Argentina, disponible

en: http://revistas.unc.edu.ar/index.php/revaluar/article/view/534/474

Current Population Survey, disponible en

https://international.ipums.org/international/

SPSS Statistics v21.0.0 Multilenguaje (Español), disponible en

http://www.intercambiosvirtuales.org/software/spss-statistics-v21-0-0-

multilenguaje-espanol-winlinuxmacosx-software-de-analisis-estadistico