Editor: José Ramón Zubizarreta Autores: Luis Bendezú ... Social Universidad Alberto Hurtado –...

70
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360 1 La Encuesta Panel CASEN: Metodología y Calidad de los Datos Versión 1.0 Editor: José Ramón Zubizarreta Autores: Luis Bendezú, Angela Denis, Carmen Luz Sánchez, Pamela Ugalde y José Ramón Zubizarreta Director de Proyecto: José Joaquín Prieto Santiago de Chile, Noviembre de 2007 Observatorio Social Universidad Alberto Hurtado

Transcript of Editor: José Ramón Zubizarreta Autores: Luis Bendezú ... Social Universidad Alberto Hurtado –...

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

1

La Encuesta Panel CASEN: Metodología y Calidad de los Datos

Versión 1.0

Editor: José Ramón Zubizarreta

Autores: Luis Bendezú, Angela Denis, Carmen Luz Sánchez,

Pamela Ugalde y José Ramón Zubizarreta

Director de Proyecto: José Joaquín Prieto

Santiago de Chile, Noviembre de 2007

Observatorio SocialUniversidad Alberto Hurtado

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

2

Observatorio Social Universidad Alberto Hurtado

El Observatorio Social de la Universidad Alberto Hurtado (OSUAH) busca crear un

espacio interdisciplinario de observación, reflexión e intervención social que aporten al

desarrollo del país. En particular, busca contribuir de manera concreta al diseño de

políticas sociales que ayuden a superar la pobreza y a avanzar hacia una sociedad más

justa en todos los ámbitos.

El OSUAH a través de sus cuatro unidades –Unidad de Encuestas, Unidad de

Investigación Social Aplicada, Unidad de Desarrollo Social, y Unidad de Comunicación y

Extensión– ha levantado información cuantitativa y cualitativa de calidad, y ha

desarrollado estudios relevantes. En este quehacer el OSUAH se ha especializado en la

producción y análisis de encuestas longitudinales, las cuáles nos permiten medir cambio

de manera más rigurosa y así comprender mejor los fenómenos sociales. Entre otras, el

OSUAH ha realizado la ola 2006 de la encuesta Panel CASEN y la ola 2007 de la

encuesta Panel Sistema de Protección Chile Solidario. Recientemente le ha sido

adjudicada la realización de la nueva encuesta Panel CASEN, que se realizará año a año

con una muestra nacional de más de 7.500 hogares.

En la metodología de encuestas longitudinales el OSUAH cuenta con la asesoría de

investigadores y profesores del Institute of Social and Economic Research (ISER) de la

Universidad de Essex, Inglaterra. En el ISER está radicado el British Household Panel

Survey y, a partir de poco tiempo más, el United Kingdom Longitudinal Household Survey,

que pasará a ser la encuesta de hogares tipo panel más grande del mundo.

El desarrollo de la metodología de encuestas longitudinales en el OSUAH se enmarca en

la Unidad de Investigación Social Aplicada (UISA), cuyo Coordinador es Juan Cristóbal

Prieto ([email protected]). Las bases de datos de la Panel CASEN 1996, 2001, 2006 y su

documentación se encuentran disponibles en http://www.osuah.cl/encuestapanelcasen/

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

3

Tabla de Contenidos

1 Introducción ............................................................................................................... 5 2 Resumen del diseño de la encuesta .......................................................................... 7 3 Diseño muestral ....................................................................................................... 11

3.1 Población objetivo ............................................................................................ 11 3.2 Marco de la muestra......................................................................................... 11 3.3 Tipo de muestreo ............................................................................................. 12

3.3.1 Comunas auto-representadas................................................................... 12 3.3.2 Comunas co-representadas...................................................................... 13 3.3.3 Selección de hogares y personas ............................................................. 13

3.4 Tamaño muestral ............................................................................................. 13 3.5 Variables del diseño muestral en la base de datos........................................... 14

4 La unidad de análisis de la encuesta........................................................................ 15 5 Cuestionario............................................................................................................. 17

5.1 Hoja de Ruta .................................................................................................... 17 5.2 Módulos Temáticos .......................................................................................... 18

5.2.1 Módulo de Residentes .............................................................................. 18 5.2.2 Módulo de Educación ............................................................................... 19 5.2.3 Módulo de Empleo.................................................................................... 20 5.2.4 Módulo de Ingresos y Activos financieros ................................................. 21 5.2.5 Módulo de Salud....................................................................................... 21 5.2.6 Módulo de Historia Laboral ....................................................................... 22 5.2.7 Módulo Participación ................................................................................ 23 5.2.8 Módulo Vivienda ....................................................................................... 23

6 Recolección de los datos ......................................................................................... 24 6.1 Trabajo en Terreno........................................................................................... 24

6.1.1 Equipo de Terreno .................................................................................... 24 6.1.2 Capacitación del Equipo de Terreno......................................................... 25 6.1.3 Pretest ...................................................................................................... 26 6.1.4 Fechas del Trabajo en Terreno................................................................. 27 6.1.5 Procedimientos de terreno........................................................................ 27 6.1.6 Supervisión y control de calidad ............................................................... 28

6.2 Resultados de la etapa de terreno.................................................................... 28 7 Preparación de los datos.......................................................................................... 29

7.1 Digitación ......................................................................................................... 30 7.2 Controles de Calidad........................................................................................ 30

7.2.1 Verificación de la información de cada ola. ............................................... 30 7.2.2 Consolidación Información cada ola. ........................................................ 31 7.2.3 Verificación de la información longitudinal ................................................ 32

8 Magnitud y naturaleza de la atrición......................................................................... 34 8.1 La atrición en la muestra: análisis descriptivo................................................... 34

8.1.1 Algunas definiciones................................................................................. 34 8.1.2 Magnitud de la atrición.............................................................................. 35

8.2 Análisis multivariado......................................................................................... 37 9 Procedimientos de ajuste estadístico ....................................................................... 39

9.1 Construcción de los pesos................................................................................ 39

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

4

9.1.1 Pesos para ola 1....................................................................................... 40 9.1.2 Pesos longitudinales................................................................................. 40 9.1.3 Pesos de corte transversal ....................................................................... 43

9.2 Imputación........................................................................................................ 44 9.2.1 Imputación de ingresos por Ocupación Principal ...................................... 45 9.2.2 Imputación de ingresos por Jubilación y Rentas Vitalicias ........................ 46 9.2.3 Imputación de ingresos por Alquiler .......................................................... 47 9.2.4 Imputación de las variables Sexo, Edad y Nivel Educativo ....................... 47

9.3 Errores de medición ......................................................................................... 47 9.4 Construcción de ingresos y Ajuste por Cuentas Nacionales............................. 48

10 Errores muestrales............................................................................................... 50 11 Acceso a los datos y a su documentación............................................................ 53

11.1 Organización de la bases de datos................................................................... 53 11.2 Documentación ................................................................................................ 54

12 Confidencialidad de los datos............................................................................... 55 13 Seguridad de los datos......................................................................................... 55 Bibliografía....................................................................................................................... 57 Apéndices........................................................................................................................ 58

Tabla 1: Total de Personas Encuestadas en las Tres Olas de la Encuesta .................. 9 Tabla 2: Distribución de la Muestra Inicial (1996) por Regiones ................................. 14 Tabla 3: Distribución del Equipo de Terreno............................................................... 24 Tabla 4: Total de Personas en Cada Ola de la Encuesta ........................................... 36 Tabla 5: Atrición de la Muestra por Regiones ............................................................. 36 Tabla 2: Distribución de la Muestra Inicial (1996) a Nivel Comunal, VIIª Región ........ 58 Tabla 3: Distribución de la Muestra Inicial (1996) a Nivel Comunal, VIIIª Región........ 59 Tabla 4: Distribución de la Muestra Inicial (1996) a Nivel Comunal, XIIIª Región........ 60 Tabla 5: Cuestionario de la encuesta Panel CASEN: Extracto de la Hoja de Ruta ..... 61 Tabla 6: Cuestionario de la encuesta Panel CASEN: Extracto de la Hoja de Ruta ..... 62 Tabla 7: Total de Hogares en Cada Ola de la Encuesta............................................. 64 Tabla 8: Atrición de la Muestra por Región por Zona.................................................. 64 Tabla 9: Muestra Inicial versus Estructura de la Muestra de Casos de Atrición .......... 65 Tabla 10: Distribución de la Muestra Inicial (1996) a Nivel Comunal, XIIIª Región........ 67 Tabla 11: Distribución de los Pesos de la encuesta CASEN 1996................................ 69 Tabla 12: Distribución de los Pesos de la encuesta Panel CASEN, 1996..................... 69 Tabla 13: Distribución de los Pesos de la encuesta Panel CASEN, 2001..................... 69 Tabla 14: Distribución de los Pesos de la encuesta Panel CASEN, 2006..................... 70

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

5

1 Introducción

La ola 2006 de la encuesta Panel CASEN es un proyecto conjunto de la Fundación para

la Superación de la Pobreza (FSP), el Ministerio de Planificación (Mideplan) y el

Observatorio Social de la Universidad Alberto Hurtado (OSUAH). Con esta nueva

medición, el objetivo principal que persiguen las tres instituciones es llevar más allá el

entendimiento de las condiciones de vida de los hogares chilenos y, en particular, de los

problemas de la pobreza y vulnerabilidad para diseñar mejores políticas sociales.

La encuesta Panel CASEN nació en 2001 en Mideplan con el seguimiento a una muestra

representativa de los hogares de las regiones III, VII, VIII y Metropolitana, a partir de la

encuesta CASEN 1996. El aporte que supone la ola 2006 de la encuesta es grande en el

contexto de Chile y de los países menos desarrollados, por el tamaño de su muestra y por

el período de tiempo que abarca: diez años. En efecto, según Yaqub (2000) sólo 5 de 44

países de bajo desarrollo humano y 7 de los 66 países de desarrollo humano intermedio

cuentan con datos de este tipo de encuestas, y ninguna de éstas cubre un período de

este largo. Recuentos similares y más recientes como el de Lawson et al. (2003), del

Institute of Social and Economic Research en la Universidad de Essex,1 en Inglaterra, y

del Institute of Social Research en la Universidad de Michigan,2 en Estados Unidos, no

reflejan un adelanto en estas cifras.

¿Pero cuáles son las ventajas de los datos de las encuestas de hogares tipo panel por

sobre los datos de las de corte transversal? Mediante las encuestas de hogares de corte

transversal es posible obtener una "fotografía" de la población y caracterizar a los hogares

en un determinado momento del tiempo. Al repetir esta fotografía una y otra vez, podemos

determinar cambios brutos en el período y examinar las transformaciones en las

características de los hogares en el estado de interés de estudio. No obstante, esta

información no es suficiente para conocer el cambio neto ni para indagar en las causas

que llevaron a los hogares a salir de ese estado o caer en él. Las encuestas de hogares

tipo panel, en cambio, al tomar una "película" al nivel de la unidad de observación hacen

posible que abordemos estas cuestiones. Con esta información podemos analizar los 1 Keeping Track: A guide to longitudinal resources. 2 Panel Studies Around the World.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

6

factores que provocaron el cambio y obtener un enfoque dinámico de constitución de

procesos más que de caracterización de determinados grupos en un punto del tiempo.

En términos de Jenkins (2003) una encuesta de hogares tipo panel "permite describir

fenómenos que son intrínsecamente longitudinales, entender mejor procesos

socioeconómicos y comportamientos y, como resultado de esto, diseñar mejores

instrumentos de política." Las ventajas de los datos de este tipo de encuestas por sobre

las de corte transversal son varias:

− Estudiar transiciones entre estados;

− Analizar el efecto de determinadas intervenciones;

− Implementar modelos de comportamiento;

− Controlar por variables no observables;

− Controlar por efectos específicos.

No obstante, las encuestas de hogares tipo panel presentan complicaciones adicionales a

las de corte transversal. Entre ellas figura la no respuesta entre ola y ola, que puede

afectar la representatividad de la muestra. Por otra parte, procedimientos de ajustes

estadísticos como la construcción de los pesos e imputación también presentan

características especiales en las encuestas de hogares tipo panel. Dada su relevancia,

estos temas han de ser explicitados en documentos que hagan interlocutor entre las

bases de datos y el investigador. De lo contrario los datos pueden perder sentido y

resultar en una pérdida de tiempo y esfuerzo por parte del investigador, e incluso conducir

a error en el análisis.

El presente documento, “La Encuesta Panel CASEN: Metodología y Calidad de los

Datos”, forma parte de un conjunto más amplio de cinco documentos que intentan

responder a esta problemática. Aparte de éste, los otros documentos son:

− “La encuesta Panel CASEN: Cuestionarios”;

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

7

− “La encuesta Panel CASEN: Libro de Códigos”;

− “La encuesta Panel CASEN: Manual del Usuario”;

− “Análisis de la Atrición en la Muestra de la Encuesta Panel CASEN”.

Este trabajo de documentación es de vital importancia para el logro de los objetivos

planteados entre las instituciones a cargo de este estudio: proveer un mayor acceso a la

información socioeconómica en Chile y a su documentación.

Queremos destacar que este trabajo se ha visto enriquecido por los excelentes

comentarios de los profesores Stephen Jenkins y Peter Lynn del ISER de la Universidad

de Essex, y Steve Heeringa del ISR de la Universidad de Michigan. Por esto les estamos

muy agradecidos.

En el OSUAH, en particular queremos agradecer a Alina Oyarzún y Berta Teitelboim de

Mideplan, y a Leonardo Moreno y Mauricio Rosenbluth de la FSP, sin los cuales este

panel de hogares no se hubiera comenzado en 2001, y no se hubiera continuado en 2006.

Esperamos que las ventajas de las encuestas de hogares tipo panel se maximicen en el

caso de la encuesta Panel CASEN, y que su análisis contribuya al diseño de las políticas

sociales y al debate público en el país.

2 Resumen del diseño de la encuesta

Como se mencionó anteriormente, el principal objetivo de la encuesta Panel CASEN es

entender mejor las dinámicas de cambio de las condiciones de vida de los hogares

chilenos de las regiones III, VII, VIII y Metropolitana y, en particular, los problemas de

pobreza y vulnerabilidad que los aquejan. La encuesta Panel CASEN se plantea como un

instrumento multidisciplinario en el marco de las ciencias sociales, de manera que sirva al

diseño de mejores políticas sociales.

La encuesta Panel CASEN no fue concebida como tal sino hasta su segunda ola en 2001,

cuando se realizó un seguimiento a una muestra de 5.209 hogares de la encuesta CASEN

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

8

1996, de las cuatro regiones en cuestión. Para ahondar en los factores que inciden en la

reproducción y superación de la pobreza, en dicha muestra se sobre-representó a los

hogares de las comunas pobres de 1996. Esto último no implica que la muestra no sea

representativa de la población total de hogares de las cuatro regiones, sino simplemente

que es posible obtener estimaciones más precisas para las personas en hogares con

estas características en 1996.

A través de las reglas de seguimiento, niveles adecuados de respuesta entre ola y ola y la

construcción de pesos, la encuesta se ha mantenido representativa de la población de

residentes en hogares en 1996 al cabo de diez años.

Las reglas de seguimiento proveen un mecanismo para medir el cambio en la muestra y

asegurar que ésta se mantenga representativa, tanto en un sentido longitudinal como de

corte transversal, de la población objetivo en el tiempo. De esta manera, en una encuesta

de hogares tipo panel se puede proveer representación continua de la población, al

capturar cambios como los de los nacimientos, de los jóvenes que dejan el hogar de sus

padres, y divorcios.3

Para explicar en qué consisten las reglas seguimiento, es útil definir antes a los Miembros

Originales de la Muestra (MOM) como a todas las personas en los hogares de la muestra

inicial en 1996, y a los Miembros Temporales de la Muestra (MTM) como a las personas

que en las olas posteriores a las primera pasaron a residir con un MOM en 2001 y/ó 2006.

En la encuesta Panel CASEN las reglas de seguimiento consisten básicamente en

encuestar en las olas posteriores a la primera a todos los MOM –siempre y cuando fuera

dentro de las cuatro regiones de estudio– sin importar si pasaron a residir en un hogar

distinto. Por otro lado, los MTM forman parte del estudio mientras residan con un MOM,

sin seguirlos en caso de que pasen a formar un hogar distinto que no cuente con un

MOM. Esto implica que:

− Si un MOM se traslada a otro hogar con una o más personas nuevas, éstas son

tratadas como MTM y se recoge información de ellas mientras vivan con el MOM.

3 Fenómenos como la inmigración sólo no serían capturados por estas reglas de seguimiento.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

9

− Si una o más personas nuevas se trasladan a vivir con un MOM, éstas se transforman

en MTM, y se recoge información de ellas mientras vivan con el MOM.

Conforme a estas reglas, los totales de personas MOM y MTM que se encuestaron en

cada ola de la encuesta son los siguientes:

Tabla 1: Total de Personas Encuestadas en las Tres Olas de la Encuesta

20.94215.038

10.287

3.819

4.281

0

5.000

10.000

15.000

20.000

25.000

1996 2001 2006

Año

Tota

l

MOM MTM

Un total de 20.942, 18.857 y 14.568 personas fueron encuestadas en 1996, 2001 y 2006

respectivamente. Éstas corresponden a las muestras relevantes para realizar un análisis

de corte transversal de la encuesta. Ahora bien, para conducir un análisis longitudinal las

muestras a considerar son los MOM encuestados en 1996 y 2001, y 1996, 2001 y 2006.

El tamaño total de estas muestras es de 15.038 y 10.287 personas, respectivamente. Esta

disminución en el tamaño de la muestra inicial, se traduce en una atrición de un 28,2%

entre 1996 y 2001, y de un 50,9% entre 1996 y 2006. Un análisis preliminar de la atrición

en la muestra de la encuesta se presenta en la Sección 8.

Con respecto a los cuestionarios, la estructura de éstos es esencialmente la misma a lo

largo de las tres olas de la encuesta. El principal cambio que se introdujo fue en la ola

2006, con la incorporación del Módulo de Historia Laboral con preguntas retrospectivas de

los años 2001 a 2006 inclusive. Los módulos que constituyen el cuestionario son los

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

10

siguientes: Residentes; Educación; Empleo; Ingresos; Salud; Historia Laboral;

Participación; Vivienda.

La recolección de los datos se realizó mediante encuestas proxy a un miembro del hogar.

Preferentemente, este informante fue el jefe de hogar o su cónyuge y, en su defecto, un

miembro del hogar mayor de 18 años. Como se señaló anteriormente, el trabajo en

terreno de la primera ola de la encuesta, correspondió al de la encuesta CASEN 1996.

Tanto este trabajo como la segunda ola fueron realizados por la Unidad de Encuestas del

Departamento de Economía de la Universidad de Chile. El trabajo en terreno de la tercera

ola fue realizado por el Observatorio Social de la Universidad Alberto Hurtado.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

11

3 Diseño muestral

La muestra inicial de la encuesta Panel CASEN fue seleccionada de la encuesta CASEN

1996 y por lo tanto comparte diversos aspectos de su diseño muestral.

Las diferencias entre ambos diseños son esencialmente el tamaño de sus muestras y la

sobre representación de hogares pobres en la encuesta Panel CASEN. En efecto, por una

parte en la encuesta Panel CASEN no hay comunas auto-representadas, y por otra en

esta encuesta se sobre representó a los hogares pobres seleccionando una mayor

cantidad de hogares de las comunas pobres. Como se explica más adelante en la sección

9.1, esto se corrige mediante la construcción de pesos.

Ahora pasaremos revista de los aspectos fundamentales del diseño muestral.

3.1 Población objetivo

La población objetivo de la encuesta Panel CASEN son todas las personas residentes en

hogares privados de las de las regiones III, VII, VIII y Metropolitana, en múltiples

momentos del tiempo, correspondiendo éstos a las olas de recolección de los datos:

1996, 2001 y 2006.

3.2 Marco de la muestra

Al ser la muestra de la encuesta Panel CASEN una muestra aleatoria de la encuesta

CASEN 1996, se puede decir que su marco es el mismo y que corresponde a los

antecedentes del Censo de Población y Vivienda del año 1992. Este marco contempla la

división político-administrativa del país de regiones, provincias y comunas.

Adicionalmente, establece las siguientes subdivisiones al interior de las comunas:

− En las zonas urbanas se distinguen los distritos censales, que se dividen en zonas

censales, que se dividen en manzanas, que se dividen, por último, en sectores de

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

12

empadronamiento (es decir, zonas urbanas: distritos censales > zonas censales >

manzanas > sectores de empadronamiento);

− En las zonas rurales se distinguen los distritos censales, que se dividen en

localidades, que se dividen en entidades y éstas en sectores de empadronamiento (es

decir, zonas rurales: distritos censales > localidades > entidades > sectores de

empadronamiento).

El tipo de muestreo sigue esta estratificación.

3.3 Tipo de muestreo

El tipo de muestreo de la encuesta CASEN 1996 y el de la Panel CASEN es estratificado,

por conglomerados, polietápico. La selección de las unidades muestrales en la encuesta

CASEN 1996 se realizó de las siguientes maneras:

3.3.1 Comunas auto-representadas

Para auto-representar las comunas de interés, se procedió a seleccionar dentro de cada

comuna un sector de empadronamiento censal (conglomerados de viviendas) como

Unidad Primaria de Muestreo (UPM). En las zonas urbanas éstos corresponden a una

manzana o parte de ella. En las zonas rurales éstos corresponden como un conjunto de

viviendas próximas que el encuestador pueda encuestar en un día.

A continuación, dentro de la UPM seleccionada, se procedió a seleccionar como Unidad

Secundaria de Muestreo (USM) una vivienda particular ocupada en forma permanente.

Conforme a la estratificación geográfica descrita anteriormente, se trata de una selección

bietápica en que los conglomerados son, en una primera etapa, una manzana o parte de

ella, y luego una vivienda.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

13

3.3.2 Comunas co-representadas

En las comunas co-representadas, la selección se realizó en tres etapas. Primeramente,

se seleccionó como UPM la zona urbana o rural de las comunas co-representadas.

Posteriormente, dentro de cada una de las UPM seleccionadas, se seleccionó como USM

un sector de empadronamiento censal (conglomerados de viviendas), que al igual que en

las comunas auto-representadas, está definido en las zonas urbanas como una manzana

o parte de ella y en las zonas urbanas como un conjunto de viviendas próximas tal que el

encuestador pueda encuestar en un solo día. A su vez dentro de cada USM, se

seleccionó como UTM una vivienda particular ocupada en forma permanente.

3.3.3 Selección de hogares y personas

Tanto en el caso de las comunas auto-representadas como co-representadas, se

seleccionó a todos los hogares y personas residentes en la dirección. Por consiguiente,

los pesos del hogar y los de las personas son los mismos.

3.4 Tamaño muestral

Para la ola 1 se seleccionaron 5.209 hogares de la encuesta CASEN 1996. Esto se

traduce en una muestra de 20.942 personas. Recordemos que estos son Miembros

Originales de la Muestra (MOM). Según se detalla en Teitelboim (2002) este tamaño de

muestra fue determinado pensando en obtener una muestra de no menos de 4.500

hogares en la ola 2. Dado que no se contaba experiencias previas de encuestas de

hogares tipo panel, se realizó una encuesta piloto para determinar este tamaño inicial. En

las olas posteriores de la encuesta re-encuestaron a todos los MOM independientemente

del hogar en que residieran mientras lo fuera dentro de las cuatro regiones de estudio. La

distribución regional de muestra inicial a nivel de hogares y de personas se detalla en la

Tabla 2 a continuación.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

14

Tabla 2: Distribución de la Muestra Inicial (1996) por Regiones

Región Hogares PersonasIII 307 1.254VII 880 3.524VIII 1.826 7.325

Metropolitana 2.196 8.839Total 5.209 20.942

La distribución de la muestra inicial a nivel comunal por región se detalla en las Tabla 1 a

4 del Apéndice.

3.5 Variables del diseño muestral en la base de datos

Dado este carácter complejo del diseño muestral se hacen relevantes las variables que

reflejan este diseño: pesos, estratos y conglomerados. Los estratos y conglomerados del

diseño corresponden a los heredados de la encuesta CASEN 1996, es decir, los estratos

corresponden a las zonas urbanas y rurales de las comunas autorrepresentadas y

correpresentadas según corresponda, y los conglomerados corresponden a los

segmentos de dicho diseño muestral. Un análisis correcto de los datos utiliza estas

variables en las estimaciones. Si bien el uso de los pesos basta para obtener los

estimadores, el cálculo correcto de las desviaciones estándar necesita las variables

estrato y conglomerado. Los softwares estadísticos son capaces de manejar estas

variables al hacer los cálculos correspondientes. Por ello la base de datos incluye las

variables del diseño muestral complejo.

Sin embargo, en el análisis de sub-poblaciones es posible que no se cumpla el requisito

de tener al menos dos conglomerados por estrato, de modo de poder estimar la varianza

de los estimadores. En este caso, una alternativa posible es colapsar y combinar estratos

de modo de poder hacer el cálculo correspondiente, aunque a costa de una

sobreestimación de la varianza. Si bien las últimas versiones de los softwares permiten

manejar estos casos con otros métodos, por simplicidad para el analista se incluye en la

base de datos una segunda variable de estratos, que corresponde a los estratos

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

15

originales colapsados en 8 estratos (cruce de las 4 regiones de estudio por zona urbano –

rural).

La construcción de pesos y su uso en el análisis se comenta más adelante.

4 La unidad de análisis de la encuesta

Las ventajas de los datos longitudinales por sobre los de corte transversal son conocidas

y se pueden resumir en lo siguiente: medir cambio rigurosamente. No obstante, esta

misma rigurosidad exige entender bien el concepto de hogar en el tiempo. A diferencia de

los individuos, los hogares pueden cambiar de "forma" y surge la pregunta de hasta que

punto un hogar es comparable a otro hogar en dos momentos distintos. Se tiene que la

definición de hogar es lo suficientemente precisa para un punto del tiempo, pero no a lo

largo de él.

En efecto, en el tiempo los hogares pueden cambiar de composición al ganar o perder

miembros, al dividirse o, en el sentido contrario, al dos o más hogares pasar formar uno

sólo. El definir un hogar longitudinal, por ejemplo, hogar longitudinal = hogar que se

mantiene con los mismos miembros que en las olas anteriores, se dejaría fuera un

número importante de casos y de información relevante. Para este ejemplo, la encuesta

Panel CASEN o cualquier otro panel de hogares, pasaría a ser representativo de "los

hogares de 1996 de las regiones III, VI, VII y Metropolitana que en 2001 y 2006 no

cambiaron en absoluto de composición". Esto, sin lugar a dudas restringe mucho el

análisis.

Por otra parte, en el estudio del cambio de variables socioeconómicas de interés, como el

ingreso, definir un hogar longitudinal es todavía menos recomendable si consideramos

que los cambios en los ingresos de los hogares obedecen en una medida a cambios en

los ingresos del trabajo y en otra a cambios demográficos en el hogar. Según Duncan

(1984) una comprensión de la dinámica del bienestar de los hogares depende de la

comprensión de las dinámicas de las personas que componen el hogar.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

16

Al ser los hogares un concepto ambiguo en el tiempo, pero el nivel socioeconómico de

ellos no, la persona es recomendable como unidad de análisis pues no cambia y puede

ser asociada al bienestar socioeconómico de un hogar en el tiempo. Por estas razones se

acostumbra a tomar el individuo como la unidad de análisis y el hogar como una unidad

de medición. Con el individuo como unidad de análisis, los cambios en la composición del

hogar se convierten en variables explicativas en modelos de cambio en el bienestar

socioeconómico de hogares que son observados para esos individuos. Esto es lo que se

sugiere para el análisis de la encuesta Panel CASEN.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

17

5 Cuestionario

Para no perder comparabilidad, el cuestionario de la encuesta Panel CASEN en la ola

2006 fue similar en estructura al cuestionario de las olas 1996 y 2001. El principal cambio

que se introdujo fue la incorporación del Módulo de Historia Laboral, con preguntas

retrospectivas de los años 2001 a 2006 inclusive. Para su incorporación, se eliminó un

número mínimo de preguntas del Módulo de Salud que registraban un bajo rendimiento en

las olas anteriores. Por otro lado, siguiendo las modificaciones en la encuesta CASEN, el

módulo de ingresos también cambió en la tercera ola. Es importante que el investigador

considere que el orden de las preguntas y las alternativas pueden ser distintas al

momento de realizar el análisis.

El cuestionario de la encuesta Panel CASEN se puede dividir adecuadamente en dos

partes: la Hoja de Ruta y los Módulos Temáticos, cuyo contenido describimos a

continuación.

5.1 Hoja de Ruta

La Hoja de Ruta del cuestionario tiene una extensión de dos páginas, y contiene la

información necesaria para ubicar a los MOM e identificarlos correctamente. Para esto, en

una primera parte de la Hoja de Ruta, se encuentra el Nombre, Dirección y Teléfono de

los MOM, y el protocolo para comenzar la encuesta. En una segunda parte de ésta, se

encuentra la información de los MOM y la de las personas con las que vivían en 2001:

Nombre, Relación con el Jefe de Hogar en noviembre de 2001, Sexo, Edad, Núcleo

Familiar, Relación con el Jefe de Núcleo, Estado Civil. Cualquier persona que se haya

incorporado al hogar o el cambio de domicilio de un MOM se registra a continuación,

explicitando los detalles de la incorporación o cambio de domicilio.

Algunos datos de la Hoja de Ruta se transcriben en la Carátula del cuestionario con los

Módulos Temáticos, junto a la Fecha, Hora y Resultado de la entrevista, y el nombre del

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

18

Encuestador.4 Dada la importancia crucial de la información de la Hoja de Ruta para

consolidar la información de las personas en las tres olas, nuestros encuestadores

completaron su información con especial cuidado.

5.2 Módulos Temáticos

La parte de los Módulos Temáticos corresponde al grueso del formulario, en que se

recoge información de tópicos diversos acerca del hogar. Específicamente, el instrumento

de la ola 2006 consta de ocho módulos, según se indica a continuación:

i. Residentes;

ii. Educación;

iii. Empleo;

iv. Ingresos;

v. Salud;

vi. Historia Laboral;

vii. Participación;

viii. Vivienda.

Los objetivos y la duración de cada uno de estos módulos se explicitan a continuación

junto a algunas observaciones relevantes.

5.2.1 Módulo de Residentes

4 En las etapas posteriores de Supervisión, Digitación y Validación de la encuesta, la Carátula se completa con los nombres del Supervisor, Digitador y Codificador, además de los requerimientos de Encuesta Completa, Flujo lógico, Letra Legible e Entrevistado Idóneo.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

19

Objetivos:

− Conocer los cambios en la estructura del hogar;

− Conocer los cambios en la tipología del hogar;

− Indagar en los motivos por cuales se integran nuevos miembros a un hogar;

− Conocer los cambios en el ciclo de vida del hogar;

− Indagar sobre la situación de los hogares en que vivieron los entrevistados durante su

niñez, con el fin de medir su influencia sobre la actual situación socioeconómica que

enfrentan;

− Conocer los cambios en el patrimonio del hogar.

El tiempo promedio de aplicación de este módulo es de aproximadamente 5 minutos.

5.2.2 Módulo de Educación

Objetivos:

− Conocer los principales cambios en los niveles de escolaridad de cada miembro del

hogar;

− Indagar en las trayectorias educativas de los miembros del hogar, considerando la

asistencia a un establecimiento educacional y el nivel educacional alcanzado;

− Indagar en los motivos de no asistencia y expectativas dada esa situación;

− Indagar sobre los cambios que se producen en el acceso a educación y el tipo de

establecimiento al cual se asiste;

− Indagar sobre la relación existente entre el nivel de escolaridad de los padres del jefe

de núcleo y su cónyuge o pareja y el nivel de escolaridad alcanzado por ellos;

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

20

− Indagar sobre la relación existente entre el nivel de escolaridad del jefe de núcleo y su

pareja y sus expectativas acerca del nivel educacional que lograrán sus hijos.

El módulo educación tiene una duración promedio de aplicación de 6 minutos

aproximadamente.

5.2.3 Módulo de Empleo

Objetivos:

− Tasa de participación;

− Número de personas en edad activa por hogar;

− Cantidad de perceptores de ingresos por hogar;

− Tasa de dependencia;

− Número de ocupados por hogar;

− Tasa de desocupación;

− Número de desocupados por hogar;

− Proporción de ocupados en categorías ocupacionales;

− Proporción de los ocupados según grupos ocupacionales;

− Proporción de los ocupados en cada rama de la actividad económica;

− Proporción de ocupados cotizando en sistema previsional;

− Proporción de asalariados con contrato escrito de trabajo;

− Proporción de ocupados en pequeñas empresas;

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

21

− Estudiar el cambio de la situación laboral de la población en el periodo 1996-2006.

Este módulo tiene un tiempo promedio de aplicación de 8 minutos aproximadamente.

5.2.4 Módulo de Ingresos y Activos financieros

Objetivos:

− Conocer la estructura de ingreso de los hogares;

− Ingresos de los asalariados (trabajadores dependientes en ocupación principal);

− Ingresos de empleadores y trabajadores por cuenta propia o independientes;

− Otros ingresos de origen privado;

− Previsión;

− Transferencias del estado;

− Indagar en la percepción de la situación económica de las personas durante el periodo

2001-2006 y para los próximos tres años;

− Conocer la red social a la que acuden las personas frente a un problema económico.

Este módulo se realizó en un tiempo promedio de 12 minutos aproximadamente.

5.2.5 Módulo de Salud

Objetivos:

− Conocer la red social a la que acude y acudiría frente a un problema de salud que

demande gran cantidad de recursos;

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

22

− Estimar gasto de las personas ante enfermedades de alto costo (catastróficas);

− Estimar impacto sobre la capacidad de trabajar;

− Captar la percepción de los encuestados sobre su estado de salud.

Como se señaló anteriormente, el Módulo de Salud fue acortado en 2006. En parte por

esto es que su tiempo de aplicación promedio asciende a 3 minutos.

5.2.6 Módulo de Historia Laboral

Objetivos:

− Identificar la trayectoria laboral del Jefe de hogar y del Primer o Segundo Perceptor de

ingresos;

− Estudiar el cambio de la situación laboral y ocupacional del jefe de hogar y primer ó

segundo perceptor de ingresos en el periodo 2001 – 2006, e identificar ciertos

determinantes laborales de los cambios en la situación de pobreza;

− Analizar los cambios de situación laboral y cómo estos se relacionan con otro tipo de

crisis (hitos familiares, económicos, de salud);

− Analizar la cantidad y duración de periodos de cesantía;

− Analizar cambios de función (movilidad) dentro de una misma ocupación.

Este módulo se aplica al jefe de hogar, y al primer o segundo perceptor de ingresos. Esto

quiere decir que se recolectó la información, en primer lugar, del jefe de hogar, y luego, si

éste era además el primer perceptor de ingresos, se encuestó también al segundo

perceptor, y en los casos (menos comunes) en que el jefe de hogar no fuese el primer

perceptor de ingresos, se identificó al primer perceptor y se le encuestó.

Este módulo tiene una duración promedio de aplicación de 12 minutos aproximadamente.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

23

5.2.7 Módulo Participación

Objetivos:

− Indagar en la participación formal (pertenencia) e informal del Jefe de hogar en

organizaciones públicas y privadas;

− Indagar en las motivaciones de la participación.

El módulo participación se aplica únicamente al jefe de hogar, y consta de 4 preguntas,

por lo que el tiempo promedio de aplicación es de aproximadamente 2 minutos.

5.2.8 Módulo Vivienda

Objetivos:

− Caracterizar el allegamiento funcional;

− Conocer los cambios en la habitabilidad de las viviendas;

− Conocer la capacidad de los hogares de los diferentes estratos socioeconómicos para

mejorar la habitabilidad de sus viviendas;

− Indagar sobre la percepción del entorno de su barrio o localidad.

En el caso de las preguntas que indagan acerca de los aspectos de la vivienda que ocupa

el hogar, el encuestador hace las preguntas al jefe de hogar, y el tiempo de aplicación

promedio alcanza los 4 minutos.

El tiempo total de aplicación del cuestionario de la encuesta Panel CASEN en la ola 2006

fue de aproximadamente 52 minutos.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

24

6 Recolección de los datos

Al igual que en las olas anteriores de la encuesta, en la tercera ola la recolección de los

datos se realizó mediante encuestas proxy. Esto quiere que un sólo miembro del hogar

fue encuestado entregando éste información de todo el hogar. En la medida de lo posible,

este informante fue el jefe de hogar o su cónyuge, y en su defecto lo fue un miembro

mayor de 18 años.

6.1 Trabajo en Terreno

El trabajo en terreno de la encuesta se desarrolló en las regiones Tercera, Séptima,

Octava y Metropolitana. A continuación se describen los principales aspectos del trabajo

en terreno.

6.1.1 Equipo de Terreno

El equipo de terreno está compuesto por Jefes Regionales, Jefes de Grupo,

Encuestadores y Supervisores. La siguiente tabla describe la distribución del equipo de

terreno en las diferentes regiones.

Tabla 3: Distribución del Equipo de Terreno

Región Sede Jefe Regional Jefes de Grupo Encuestadores SupervisoresIII Copiapó 1 - 7 1VII Talca 1 1 12 1VII Linares - 1 12 1VIII Chillan 1 1 13 1VIII Los Ángeles - 1 7 1VIII Concepción - 1 22 3XIII Santiago 1 2 36 4

Total 4 7 109 12

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

25

Todo el equipo de Jefes Regionales y Jefes de Grupo contaba con una vasta experiencia

en trabajo terreno en encuestas sociales.

La primera selección de Encuestadores se realizó a partir de su inscripción en la página

web del OSUAH: http://www.osuah.cl/inscripcion_encuestadores.php. En esta selección

se dio preferencia a aquéllos que contaban con más experiencia en encuestas de hogares

similares a la implementada.

6.1.2 Capacitación del Equipo de Terreno

La capacitación de los Jefes Regionales y Jefes de Grupo se realizó en Santiago, durante

dos días en jornadas de ocho horas diarias.

Una vez terminada esta capacitación, donde se revisaron y aclararon todas las dudas de

los diferentes módulos, se fijaron las fechas de capacitación de los encuestadores en las

cuatro regiones de estudio. Estas capacitaciones quedaron a cargo de cada Jefe Regional

en las diferentes sedes, y se realizaron también durante dos días en jornadas de ocho

horas cada una. En regiones se contó con la asistencia de personal del equipo de planta

del OSUAH, que viajó a prestar colaboración y supervisar que los instructivos fueran

dados de acuerdo a los parámetros establecidos.

Específicamente las capacitaciones se realizaron en las siguientes fechas:

− Región Metropolitana: 30, 31 de Octubre y 1 de Noviembre de 2006.

− III Región: 30, 31 de Octubre y 1 de Noviembre de 2006.

− VII Región: 27, 28 y 29 de Octubre de 2006.

− VIII Región: 30, 31 de Octubre y 1 de Noviembre de 2006.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

26

6.1.3 Pretest

En Septiembre de 2006 se realizó el Pre-Test de 100 casos en Región Metropolitana (70

urbanos y 30 rurales) con la participación de 8 encuestadores.

La fase de desarrollo del Pre Test es la etapa más importante previa a la aplicación del

instrumento final de recolección de información. Para la Encuesta Panel 2006, el objetivo

del Pre Test fue probar el cuestionario en términos de diseño, contenido y aplicación, lo

que se realizó a partir del trabajo en terreno (encuestaje), la Hoja de Reporte, un Focus

Group con encuestadores y análisis de frecuencias y cruces de variables de interés.

Todos los elementos señalados en el objetivo intentan evaluar el diseño y contenido del

instrumento de medición, para luego reparar los errores o dificultades encontradas,

logrando aplicar, en la etapa de terreno final, un cuestionario limpio y depurado, que

permitiera entregar resultados exentos de, en la mayor medida posible, errores de

medición producto del cuestionario.

El objetivo recién planteado se desarrolló a partir de los siguientes objetivos específicos:

− Identificar posibles dificultades de acceso a las viviendas y entrevistados, generando

sugerencias para facilitar este proceso

− Estimar la duración promedio de la aplicación del cuestionario

− Evaluar la actitud, nivel de concentración y retención de los entrevistados al responder

− Identificar las posibles dificultades de comprensión que puedan presentar algunas

preguntas, conceptos o categorías de respuesta para los entrevistados y formular

recomendaciones de reemplazo y/o modificaciones

− Identificar problemas relativos al diseño y diagramación del cuestionario, y realizar

propuestas de reemplazo y/o modificaciones

− Testear aspectos operativos del trabajo en terreno.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

27

6.1.4 Fechas del Trabajo en Terreno

El levantamiento de datos se dividió en 2 etapas: la primera se llevó a cabo desde el 4

Noviembre de 2006 hasta el 30 Diciembre del mismo año, y la segunda etapa se realizó

entre el 18 de Enero y el 10 de Febrero de 2007. En esta segunda etapa del trabajo en

terreno se alcanzaron los niveles de respuesta proyectados.

6.1.5 Procedimientos de terreno

Dado el carácter longitudinal de la encuesta, se procedió a buscar los hogares

efectivamente encuestados en 2001, para lo cuál el encuestador visitó la dirección

disponible del hogar.

Siempre que el hogar mantenía la dirección original se visitaba hasta que se conseguía la

encuesta, en algunos casos se visitó hasta en 4 oportunidades una dirección para lograr

la entrevista, sin embargo hubo otros casos en que después de reiteradas visitas no se

pudo lograr la entrevista pues nunca se encontró a los moradores.

En las viviendas donde se crearon hogares nuevos si estos residían en la misma dirección

se procedía a encuestarlos inmediatamente, si se habían ido a una nueva dirección se

preguntaba en la dirección original el paradero o nueva dirección de este hogar para ir a

realizarle la encuesta, siempre y cuando la nueva dirección se encontrara en la misma

región.

Como estrategia de recuperar datos de hogares (originales o nuevos) que ya no residían

en la dirección del año 2001 se preguntaba a los actuales moradores o vecinos si alguien

conocía la nueva dirección de este hogar. De no obtener información, en algunos casos,

con el nombre del Jefe de hogar se trataba de ubicar en las guías de teléfonos el número,

para poder concertar una entrevista. Si ya agotando estos procedimientos no se podía

obtener información de la nueva dirección del hogar el encuestador informaba a su jefe de

grupo y este procedía a registrar la encuesta como no lograda.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

28

Las encuestas se pagaron a $ 3.800 en la primera etapa y a $ 4.000 en la segunda y

además, como incentivo extraordinario en la primera etapa, cada 5 encuestas se dio un

bono de $ 1.000. En la segunda etapa este bono se incrementó a $ 2.000 por cada 5

encuestas, como método para incentivar a los encuestadores y obtener una tasa mayor

de logro.

6.1.6 Supervisión y control de calidad

El procedimiento de supervisión consiste en la revisión de una parte de las encuestas

aplicadas por cada encuestador. Para esto el Jefe de grupo entrega al supervisor una lista

de direcciones a controlar. Éste, una vez en terreno, aplica un cuestionario reducido en la

dirección que le fue entregada, el cual consiste en sólo algunas preguntas de cada

módulo. Terminado el control hace entrega en la oficina de su trabajo y el Jefe de Grupo

procede a comparar los datos de la encuesta con los del control.

Los controles en la primera etapa se realizaron desde el 11 de Noviembre al 31 de

Diciembre, y en la segunda etapa entre el 20 de Enero y el 12 de Febrero del 2007.

Los resultados de las supervisiones no arrojaron grandes diferencias ni falseos de

encuesta, demostrando así la buena calidad de los encuestadores y el compromiso con

este estudio.

6.2 Resultados de la etapa de terreno

Para informar sobre el avance del trabajo de terreno se confeccionó una página Web

donde los jefes regionales informaban día a día el avance de las encuestas logradas y no

logradas, ingresando un código de resultado de las visitas a cada dirección.

El porcentaje de logro de entrevistas fue alrededor de un 73% de la muestra, que

corresponde a los hogares efectivamente encuestados el año 2001, de acuerdo a las

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

29

reglas de seguimiento utilizadas. Por otro lado la tasa de nacimiento de nuevos hogares

fue de un 10% aproximadamente.

Entre las razones más frecuentes de no logro de encuestas, está que el hogar cambió de

residencia a un lugar desconocido, o que cambió a una región o comuna que no entraba

en la muestra; hay que recordar que se visitó los hogares panel después de 5 años por lo

que el porcentaje de pérdida de entrevistas está de acuerdo a rangos más o menos

predecibles. Además un 4% de la muestra no tenía las direcciones completas, y un poco

más de un 2% de los hogares fueron contactados pero no accedieron a contestar la

encuesta.

Otro problema para ubicar las direcciones, sobre todo en las zonas rurales, fue no contar

con cartografía adecuada de ubicación de las viviendas, sólo disponíamos de croquis de

la encuesta de 2001, los que en algunos casos no eran de mucha ayuda. En algunas

encuestas rurales se ubicó la dirección preguntando en la localidad a encuestar por los

nombres de los habitantes del hogar.

7 Preparación de los datos

Es el conjunto de tareas que se realizaron con posterioridad al término del trabajo de

campo, el objetivo principal de esta actividad consiste en asegurar la disponibilidad de

toda la información consignada en los formularios de encuesta y que dicha información

cumpla con las reglas de completitud y relaciones de consistencia que se establecen

durante la ejecución de esta actividad.

El producto de esta actividad está constituido por un archivo magnético con la información

de las encuestas realizadas.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

30

7.1 Digitación

Para llevar a cabo este proceso se contó con personas de experiencia demostrable, que

se han desempeñado satisfactoriamente en estudios similares tales como CASEN y

versiones anteriores de esta encuesta.

En cuanto a la infraestructura computacional, se contó con computadores personales para

llevar a cabo esta tarea, conectados en red y un computador de características

superiores, que cumple la función de servidor, y en el cual se almacenó la información

digitada en un Motor de Base de Datos.

Además se seleccionó en forma aleatoria un 10% de las encuestas para la realización del

proceso de Re-Digitación, posteriormente se realizó un contraste con la información

digitada en ambas oportunidades y se confeccionó un informe, con el propósito de

conocer la calidad de la labor desempeñada por los digitadores(as).

7.2 Controles de Calidad

Se realizaron todas las tareas de procesamiento de información necesarias con el

propósito de disponer finalmente de información de calidad y paralelamente disponer, en

cualquier instante del período de ejecución del estudio, de información acerca del estado

de avance de cada proceso.

7.2.1 Verificación de la información de cada ola.

Esta tarea consiste en un proceso de contraste entre los formularios de encuesta

recolectados desde terreno, la información consignada en la Base de Datos y lo

efectivamente digitado.

Para la verificación de la información, se debió realizar previamente dos sub-tareas, a

saber, la primera, fue generar un documento que describiera un conjunto de relaciones

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

31

entre las variables de la encuesta que se deben cumplir, y construir con estas relaciones

lo que normalmente se denomina la Malla de Validación.

El programa de validación no es más que el mismo programa de ingreso de la información

que se potencia incorporando el módulo de validación, por lo tanto las funcionalidades

disponibles para el Digitador(a) estuvieron del mismo modo disponibles para el

Validador(a).

Su funcionamiento consiste en la revisión secuencial de cada una de las encuestas antes

digitadas, para las cuales se realiza inicialmente un chequeo de rango o recorrido de

todas las variables y en caso que alguna no cumpla con lo establecido se alerta al

validador, normalmente se indica marcando con un color diferente (rojo) los recuadros de

ingreso de las variables cuestionadas. Una vez contrastada y corregida la respuesta con

lo que indica el formulario de encuesta se procede a ejecutar idéntico proceso.

En el momento en que la encuesta no indica la presencia de errores de rango se procede

automáticamente con la revisión del cumplimiento de las relaciones especificadas en la

Malla de Validación, este proceso normalmente se denomina chequeo de consistencias y

su funcionamiento es similar al anterior. En este caso se genera una lista con todas las

relaciones que no se cumplen, el Validador contrasta la información digitada con la que

está en el formulario de encuesta, corrige en caso que corresponda y procede a ejecutar

nuevamente el mismo proceso, hasta que la encuesta sea aprobada.

7.2.2 Consolidación Información cada ola.

La consolidación de la información para las 2 primeras olas se llevó a cabo por el Centro

de Microdatos de la Universidad de Chile. Sólo la consolidación de las olas 1996, y 2001

con la del 2006 se llevó a cabo por el OSUAH.

El procedimiento consta de 2 partes: primero se identifican los hogares y luego se

identifican individuos.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

32

Para identificar los hogares de las 3 olas se genera un identificador por hogar. En este

procedimiento la unidad de análisis es la encuesta. Mediante ésta se crea la variable que

identifica tanto hogares antiguos (que aparecen en las encuestas anteriores), como los

nuevos (hogares que se formaron a partir de los hogares de olas anteriores). Una vez que

se tiene el identificador del hogar, constituido por un conjunto de variables que

permanecen constantes en el tiempo, se procede a parear la información de las dos

primeras olas con la del '06. Debe quedar claro que éste es un paso intermedio, ya que se

tiene la información pareada por hogares, pero no a nivel de individuos.

La segunda parte busca compaginar la información a nivel individual. Para lograr el

matching perfecto entre los individuos del hogar, se procede a parear la información de

acuerdo a 3 variables de control: nombre, sexo y edad. Para las 2 primeras variables se

busca encontrar una coincidencia exacta entre las 3 olas. El control por edad se realiza

buscando una consistencia en el tiempo, en otras palabras, se busca que la edad vaya

aumentando en el tiempo tomando la primera ola como punto referencial.

Una vez que se cuenta con la información consolidada para las 3 olas se procede al

análisis longitudinal.

7.2.3 Verificación de la información longitudinal

En el proceso de verificación de la información longitudinal se busca corroborar la

existencia de consistencia en el tiempo entre los datos consolidados como también indicar

y corregir errores cuando estos existan.

El procedimiento comienza con la revisión de las partidas de preguntas que exigen una

coherencia en el tiempo (edad, sexo, escolaridad, entre otras). El análisis se limita sólo a

variables que objetivamente no pueden mostrar un cambio sustancial entre diferentes

olas. Por lo tanto se realizan 2 tipos de análisis: primero se abordan variables que no

deben cambiar en el tiempo (sexo) y luego se revisan las qué sólo pueden cambiar dentro

de un rango admisible (edad, escolaridad, entre otras). El criterio para definir el rango

admisible de variación se define en base al tiempo transcurrido entre olas y la variable en

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

33

análisis. Por ejemplo, el rango admisible para la variación de la edad entre olas

adyacentes es de 4 a 6 años y el de escolaridad es de 0 a 7 años.

Una vez identificados los errores se procederá a la creación de banderas (variables

dummy) que le indicarán al investigador donde está presente el error (en que individuo) y

en qué pregunta (por ejemplo, edad). Además para cada variable que se analizó se creó

una nueva variable corregida que presenta la consistencia longitudinal deseada. El criterio

de corrección se hizo en base a las olas restantes. Si una ola presenta error, se corrige

mediante la consistencia que existe entre las olas restantes. Los casos que presenten

incoherencia en las 3 olas se les asigna missing. Debe quedar claro que no se están

corrigiendo los datos de la base original, si no que se crea una nueva variable que

presenta la consistencia longitudinal deseada.

Los resultados de este procedimiento son: el grado de error en la obtención de la

información longitudinal entre una ola y otra, banderas que señalicen inconsistencia

temporal en los datos del individuo y por último la creación de una nueva variable

corregida que presenta consistencia temporal.

Sin embargo, cabe destacar que las fuentes del error pueden ser diversas y están fuera

del análisis de este proceso.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

34

8 Magnitud y naturaleza de la atrición

La atrición en encuestas longitudinales se refiere a la no respuesta, en las olas

posteriores a la primera, de los Miembros Originales de la Muestra (MOM). Desde el

punto de vista del análisis de los datos, la atrición presenta dos problemas: por una parte,

el menor número de observaciones disminuye la eficiencia de los estimadores y, por otra,

si las características de los MOM que no vuelven a ser encuestados difieren

sistemáticamente de las características de los que sí vuelven a serlo, entonces la atrición

es selectiva y las estimaciones pueden resultar además sesgadas. Por este segundo

problema en particular es que la atrición debe ser analizada en todo tipo de encuesta

longitudinal.

En esta primera versión de del documento “La Encuesta Panel CASEN: Metodología y

Calidad de los Datos”, no se pretende abordar de manera exhaustiva el problema de la

atrición. Tal es el objetivo de otro documento que se presentará en compañía a este,

titulado “Análisis de la Atrición en la Encuesta Panel CASEN”. Las conclusiones de este

último documento se incluirán en una segunda versión de este documento.

El resto de la sección se organiza en dos partes: en la primera se presenta un análisis

descriptivo de la atrición en la muestra, y en la segunda se aísla el efecto de cada una de

las variables mediante un análisis multivariado.

8.1 La atrición en la muestra: análisis descriptivo

8.1.1 Algunas definiciones

Antes de comenzar el análisis, cabe precisar bien qué es lo que entenderemos por

atrición, ya que existen distintas maneras de definirla en encuestas longitudinales. En la

tercera ola de la encuesta Panel CASEN se podría haber intentado encuestar a todos los

MOM sin importar si hubieran respondido o no en la segunda ola. Sin embargo, el

intervalo de cinco años entre mediciones y que no se mantuviera contacto alguno con los

MOM durante él, hacía muy poco probable que se justificara la implementación de esa

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

35

política de encuestaje. Por esta razón, la atrición se definió como la no respuesta en una

sola ola (wave non-response).

El análisis de la atrición en este tipo de encuestas se puede realizar de múltiples maneras,

incluyendo comparaciones con fuentes externas como el Censo o encuestas de gran

escala. Otra alternativa es comparar las características de la muestra total de los MOM en

la ola inicial, con las características, también medidas en la ola inicial de la muestra de los

MOM que pasaron a ser casos de atrición. De manera similar a Lynn (2006), en el análisis

de la atrición de la encuesta Panel CASEN optamos por lo último por las siguientes

razones:

− Se aísla el efecto de la atrición. De otra manera otros factores como los errores

muestrales, de cobertura y de medición podrían estar interviniendo, al tratarse de

encuestas con metodologías considerablemente distintas.

− Existe una mayor cantidad de datos disponibles para realizar comparaciones. En

efecto, de otro modo cabe la duda de qué tan comparables son los datos debido a

efectos del cuestionario, del encuestador y de la organización a cargo de la encuesta,

lo que se manifiesta en sus protocolos para velar por la calidad de los datos.

8.1.2 Magnitud de la atrición

En la Tabla 4 a continuación se presenta el total de personas encuestadas en cada ola del

panel.5

5 Una tabla similar al nivel de hogares se presenta es la Tabla 7 de los Apéndices.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

36

Tabla 4: Total de Personas en Cada Ola de la Encuesta

Región 1996 2001 2006III 1.254 1.176 921VII 3.524 3.239 2.815VIII 7.325 6.739 5.205XIII 8.839 7.433 5.627

Total 20.942 18.587 14.568

Total Personas (muestra de corte transversal)

Se aprecia que en 1996, 2001 y 2006 se encuestaron, respectivamente, a 20.948, 18.851

y 14.996 personas. Estos totales corresponden a las muestras de corte transversal, que

son las apropiadas para el análisis de cada uno de estos años por separado. Para el

análisis longitudinal de la encuesta, en cambio, se deben considerar los totales de las

muestras longitudinales. Es decir, de los MOM que volvieron a ser encuestados en 2001,

y en 2001 y 2006. Éstos se exponen en la Tabla 5 a continuación.

Tabla 5: Atrición de la Muestra por Regiones

Región 1996 2001 2006 1996-2001 2001-2006III 1.254 943 653 24,8% 47,9%VII 3.524 2.685 2.024 23,8% 42,6%VIII 7.325 5.480 3.686 25,2% 49,7%XIII 8.839 5.930 3.924 32,9% 55,6%

Total 20.948 15.038 10.287 28,2% 50,9%

Total muestra longitudinal Atrición

A partir de la tabla notamos que la magnitud de la atrición entre 1996 y 2001 alcanzó un

valor de un 28,2%, y entre 1996 y 2006, un valor de 50,9%. La región que presenta las

tasas más altas de atrición es la Metropolitana. Una tabulación similar, pero generada

además por zona se puede encontrar en la Tabla 8 de los Apéndice. De esta se

desprende que la atrición es más grande en las zonas urbanas de las regiones, excepto

en la Tercera Región, donde se observa el patrón opuesto.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

37

En la Tabla 9 de los apéndices se compara el valor de proporciones y medias de algunas

variables de interés, medidas en 1996, para la muestra inicial de todos los MOM y para la

muestra de todos los MOM que fueron casos de atrición. Estos valores están ponderados

con los pesos de la ola 1. Se aprecian diferencias significativas a un nivel del 5% en las

siguientes variables:

− Edad.

− Estado Civil.

− Situación de la Vivienda que Ocupa.

− Región.

− Zona.

− Escolaridad.

− Decil de Ingreso Autónomo.

− Contrato.

8.2 Análisis multivariado

Muchas de las variables asociadas con la atrición están correlacionadas. Por ejemplo, los

adultos jóvenes tienden a ser solteros, y las personas de los deciles más ricos tienden a

tener mayores niveles de escolaridad. Para saber cuál de estos factores es el que

realmente está explicando la atrición, es necesario realizar análisis multivariado. Así es

posible aislar el efecto de cada una de estas variables. El foco de este análisis, luego, es

distinguir qué características de las personas medidas en la ola 1 están asociadas con la

atrición en las olas posteriores de la encuesta.

Los resultados de los distintos modelos lobit que se ajustaron se presentan en la Tabla 10

de los apéndices.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

38

Este análisis sugiere que la atrición fue selectiva en las personas con las siguientes

características en la ola base:

− Edades entre 20 y 29 años; entre 60 y 74 años; y entre 75 años y más.

− Estado Civil: Conviviente; Viudo; Soltero.

− Hogares de mayor tamaño.

− Vivienda Arrendada, Cedida por Servicios, Cedida por Familiar, Usufructo.

− Región: Octava; Metropolitana.

− Zona: Urbano.

− Mayor Escolaridad.

− Decil de Ingreso Autónomo: Decil 7; Decil 8; Decil 9; Decil 10.

Estas diferencias aparecen ser ampliamente corregidas mediante la construcción de

pesos que compensar por la atrición (Sección 9.1).

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

39

9 Procedimientos de ajuste estadístico

9.1 Construcción de los pesos

En las encuestas de hogares en general, los pesos se utilizan para compensar por las

distintas probabilidades de selección o por cierto tipo de datos faltantes. En respuesta al

diseño muestral, en encuestas de hogares de corte transversal los pesos se acostumbran

construir en tres etapas:

− construcción de pesos, que compensan por las distintas probabilidades de selección;

− ajuste por la no respuesta, que compensa por aquellas unidades del diseño muestral

inicial que no fue posible encuestar;

− post estratificación, en que se logra que la muestra ponderada calce con los niveles de

la distribución de la población de estudio para ciertas variables conocidas.

Cabe decir que las dos últimas etapas se pueden resumir en la de post estratificación.

Como es de suponer, la construcción de los pesos en encuestas de hogares tipo panel

presenta complejidades adicionales a las de las encuestas de hogares de corte

transversal. En efecto, los problemas surgen de:

− la cantidad de poblaciones de inferencia, correspondientes a todas las combinaciones

posibles de las n olas realizadas ( 12 −n);

− las diferentes opciones de manejo de la atrición;

− las diferentes opciones de incorporación al análisis de aquellos miembros de un hogar

que no fueron inicialmente muestreados, pero que en olas posteriores a la primera

viven con una persona que sí lo fue.

Notemos que estas complejidades surgen estrictamente de la naturaleza longitudinal de

estas encuestas. Conforme a esto, la construcción de los pesos en encuestas de hogares

tipo panel puede dividirse en dos etapas: una primera que coincide con el desarrollo de

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

40

los pesos de una encuesta de corte transversal, en la primera ola de la encuesta, y otra

en que se toman en cuenta las complejidades anteriores.

Como en la mayoría de las encuestas de hogares tipo panel, para esta encuesta se

desarrollaron pesos tanto para el análisis longitudinal como para el de corte transversal de

la muestra. Como se señala a continuación, estos pesos parten de la construcción de los

pesos para la ola 1.

9.1.1 Pesos para ola 1

Una sobre representación de hogares con una cierta característica, como es el caso de la

encuesta Panel CASEN con los hogares pobres, se compensa mediante el cálculo de un

peso dado por el inverso de la probabilidad de selección del hogar. A continuación, se

ajusta por la no respuesta o por los niveles de la distribución de la población de estudio

para ciertas variables de conocidas.

Como la muestra de la encuesta Panel CASEN se obtuvo a partir de la encuesta CASEN

1996, en que los pesos ya estaban construidos, una alternativa, que tiene implícitos los

procedimientos mencionados, es ajustar estos pesos por un factor que dé cuenta del

proceso de selección de los hogares. Como en la encuesta Panel CASEN se

seleccionaron hogares de todas las comunas de las cuatro regiones en estudio, este

factor está dado por el cuociente entre la suma de los pesos de todas las personas de una

cierta comuna, a partir de la encuesta CASEN 1996, sobre la suma de los pesos de las

personas de la comuna seleccionadas para la encuesta Panel CASEN .

En la Tabla 12 de los apéndices se puede ver un resumen de estadísticos de estos pesos

resultantes para la ola 1

9.1.2 Pesos longitudinales

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

41

Para obtener los pesos para el análisis longitudinal a partir de los pesos de la ola 1, queda

corregir por la atrición en la segunda y tercera ola. Siguiendo a Kalton y Brick (2000),

podemos mencionar cuatro métodos para realizar este ajuste:

− Weighting classes, en que se definen celdas de acuerdo a un conjunto de variables

auxiliares y se calcula un factor de ajuste para cada celda como el inverso de la tasa

de respuesta ponderada (en la celda); el peso anterior se multiplica por este factor de

ajuste.

− Classification tree algorithm, en que no sólo se elijen las variables auxiliares por las

cuales corregir, sino que también las celdas. Las celdas se pueden continuar

extendiendo hasta alcanzar un tamaño mínimo.

− Regresiones logísticas, en que el factor de ajuste se calcula como el inverso de la

probabilidad predicha de respuesta. Señalemos que si todas las variables auxiliares

en un modelo de regresión son categóricas, este procedimiento es análogo a los

anteriores.

− Generalised raking, en que a partir de la definición de distintas funciones de distancia

se minimiza la distancia entre los pesos no ajustados y ajustados. Este método puede

ser aplicado para hacer calzar la distribución marginal de probabilidad de los que

responden en la ola t con la distribución marginal de probabilidad de los que

responden y no responden también en la ola t.

Como la teoría no da razones para preferir un método sobre otro, nos inclinamos por

realizar el ajuste mediante regresiones logísticas para tener mayor comparabilidad con los

estudios internacionales, que tienden a privilegiar este método.

Se construyeron dos pesos longitudinales:

• pesos_long_96_01, que se definen para los miembros originales de la muestra

que se encuestan tanto en 1996 como en 2001. Se incluyen además los niños que

nacieron entre ambas olas que son hijos de miembros originales de la muestra.

Estos pesos se construyen corrigiendo por la probabilidad de respuesta los pesos

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

42

de corte transversal de 1996 y luego postestratificando para reobtener la

distribución de la muestra inicial de ciertas variables de interés.

• Pesos_long_96_01_06, peso definido similarmente al anterior pero que incluye

sólo a las personas encuestadas efectivamente las tres olas, más los hijos de

miembros originales que nacieron entre las olas. Estos pesos se construyen

corrigiendo por la probabilidad de respuesta entre 2001 y 2006, los pesos

longitudinales 96 -01 y luego postestratificando para reobtener la distribución de la

muestra longitudinal 96-01 de ciertas variables de interés.

Los hijos de miembros originales de la muestra se consideran también miembros

originales, y por ello tienen asignado un peso longitudinal (tanto en pesos_long_96_01

como en pesos_long_96_01_06). Éste corresponde al promedio de los pesos

longitudinales de sus padres, en caso que ambos sean MOMs, o al peso longitudinal,

luego de corregir por no respuesta, del padre o madre según corresponda. Existen niños

que nacieron entre olas pero que no son MOMs, y corresponden a niños cuyos padres no

son MOMs, sino que viven con alguno de ellos, y niños que no viven con sus padres.

Para corregir la atrición, se modeló la probabilidad de respuesta mediante modelos probit

que incluyeron las variables región, zona, tramo etáreo, género, estado civil, ocupación,

tipo de contrato, variables dicotómicas para el último nivel de educación alcanzado

(básica, media, técnica o universitaria), años de escolaridad, situación de la vivienda, decil

de ingreso del hogar, ingreso per capita del hogar6, hogar unipersonal, número de

personas del hogar y número de menores de doce años del hogar. En el caso del servicio

doméstico se usó ingreso total de la persona7 en lugar de ingreso per capita del hogar y la

variable decil se construyó para el servicio doméstico usando este ingreso.

En el probit de atrición entre 1996 y 2001 se usaron los pesos de corte transversal de

1996 y en el probit de atrición entre 2001 y 2006 se usaron los pesos longitudinales de

2001 (pesos_long_96_01).

6 Se usaron los ingresos imputados, tanto en ingreso per capita como para la construcción de los deciles. 7 Se usó el ingreso total imputado.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

43

Como se mencionó, se multiplicó el peso de la ola 1 por el inverso de la probabilidad

predicha de respuesta en 2001 y, posteriormente, en 2006. Para evitar valores extremos

en los pesos, se truncaron a un valor de 0,5 aquellas probabilidades de respuesta con un

valor inferior.8 En las Tablas 13 y 14 de los apéndices se puede ver un resumen de

estadísticos de estos pesos resultantes.

9.1.3 Pesos de corte transversal

Las encuestas de hogares tipo panel se suelen comenzar con una muestra representativa

de hogares. A partir de ésta se siguen a todos sus integrantes sin importar si pasan a vivir

en un hogar distinto, mientras estén dentro de las regiones de estudio. Entonces surge la

cuestión de cómo incluir en el análisis a aquellas personas que no integraban el hogar en

la muestra inicial del estudio, pero que en las olas posteriores pasaron a vivir con

personas que sí lo hacían. Lavallée (1995) propuso un esquema de pesos para

incorporarlos en el análisis de corte transversal. Este descansa sobre el supuesto de que

las personas que pasaron a residir con los MOM pudieron haber sido seleccionadas en la

ola inicial con idéntica probabilidad de selecciones a ellos. Por consiguiente la sumatoria

de los pesos longitudinales del los MOMs9 que pertenecen al hogar se reparte en partes

iguales en todos los miembros del hogar, dividiendo esta suma por el número de personas

del hogar que formaban parte de la población al momento de la ola 1, es decir, se

excluyen los nacidos posteriormente a la ola 1. Luego estos pesos fueron post

estratificados de acuerdo a las proyecciones del INE para 2001 y 2006, según variables

región, género y grupo etáreo.10

En las Tablas 13 y 14 de los apéndices se presenta un resumen de estadísticos de estos

pesos.

8 Los pesos longitudinales se ponderan de manera que entreguen el tamaño de la muestra, sin considerar los hijos de los MOMs nacidos luego de la primera ola. 9 Excluyendo los niños hijos de MOMs que aparecen en olas posteriores a la primera. 10 Los pesos de corta transversal para 2001 y 2006 se ponderan de manera que entreguen los totales proyectados por el INE para las cuatro regiones de estudio.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

44

9.2 Imputación

En todo tipo de encuestas existe el riesgo de que un individuo no reporte toda la

información que le es solicitada. El resultado de esto son los llamados datos faltantes.11

De manera análoga a la no respuesta unitaria, en este caso importa la magnitud y

naturaleza de los datos que faltan. En efecto, por una parte la menor cantidad de

observaciones reduce la eficiencia de los estimadores. Por otra parte, en términos

estadísticos hacer nada con estos datos faltantes descansa sobre el supuesto de que

distribuyen aleatoriamente y que, por ende, no se introduce sesgo en las estimaciones.

Ante este problema, surgen dos opciones: la primera consistiría en eliminar al individuo

del análisis posterior a realizar, con lo que también se descartarían las preguntas válidas

que sí respondió el encuestado pero que conduciría estimaciones menos eficientes de los

parámetros de interés, como se señaló. La segunda opción consiste en imputar dicho

dato, es decir, reemplazar el valor faltante por otro que, de acuerdo a una serie de

criterios, debería corresponderle a dicho encuestado.

Las metodologías para hacer esto son bastante numerosas. Sin embargo, la mayoría de

éstas ha sido desarrollada para encuestas de corte transversal. En el caso de las

encuestas de hogares tipo panel, la imputación de corte transversal se restringe a

emplear datos sólo de una ola, mientras que la imputación longitudinal se aprovecha de

las ventajas derivadas de la existencia de distintas fuentes de información para el mismo

hogar a lo largo del tiempo.

Muchos de los métodos de imputación en paneles han sido adaptados a partir de

metodologías diseñadas para encuestas de corte transversal. Por ejemplo, puede

realizarse imputación mediante el metódo Hotdeck, regresiones y Nearest Neighbor. En

cuanto a los métodos diseñados especialmente para encuestas de tipo panel, destaca el

método de Little y Su.

11 Missing data.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

45

Si bien podrían existir diferencias dependiendo del uso de un método u otro, es de

esperar que las diferencias no sean significativas, puesto que el número de valores

imputados en las tres olas fue bastante reducido,.

En el caso de la imputación en la Encuesta Panel CASEN, se optó por seguir el criterio de

comparabilidad con la encuesta a partir de la cual se originó el panel (CASEN 1996). Por

ello, se dejó de lado el criterio de imputación longitudinal por uno de corte transversal. En

vista de ello, se optó por imputar cuatro corrientes de ingreso para las tres olas:

− Ingreso por ocupación principal.

− Ingreso por jubilación y rentas vitalicias.

− Ingreso por alquiler imputado.

Para cada una de ellas, se definieron grupos en base a una serie de variables

provenientes de la misma encuesta. Dentro de cada grupo, si existía un individuo con

valores a ser imputados, se le asignaba el promedio del grupo. Sin embargo, existieron

casos en donde no se pudo encontrar a individuos con valores completos dentro de cada

grupo, por lo que se le asignó el valor correspondiente a los datos perdidos.

Adicionalmente, y como se mencionó anteriormente en la sección 7.2.3 se realizó una

consistencia longitudinal para tres variables: edad, sexo y nivel educativo. De encontrarse

inconsistencias luego de analizar las tres olas, se procedió a crear una nueva variable

imputada. A continuación se describe con mayor detalle el procedimiento seguido para

realizar las imputaciones entre las tres olas.

9.2.1 Imputación de ingresos por Ocupación Principal

En primer lugar, se distinguió entre ingresos por ocupación principal de los asalariados e

independientes. Para cada uno de éstos se construyeron las siguientes variables, a fin de

formar los grupos:

− Región: variable r_x de la base de datos.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

46

− Sexo: variable r2_x de la base de datos.

− Condición de actividad: se crearon catorce categorías para aquellos individuos

mayores de 12 años que se encontraban ocupados o desocupados por algún motivo

(dueña de casa, enfermo, estudiante, jubilado, entre otros).

− Condición de jefe de hogar: variable dicotómica igual a uno si el individuo es jefe de

hogar y cero en otro caso.

− Ocupación principal: definida a partir de la variable o10_x (oficio que desempeña). Se

redujo la clasificación de cuatro dígitos (CIUO-88) a 10 categorías.

− Nivel educativo: se definieron cuatro grupos a partir de la variable e9t_x (tipo de

educación).

− Rama de actividad: definida a partir de la variable o11_x (CIIU a cuatro dígitos). Se

crearon 9 categorías (CIIU a un dígito).

Para cada uno de los grupos creados a partir de la interacción de dichas variables, se

calculó la media, asignándosela a aquellos individuos que también pertenecían al grupo

pero cuyo valor de ingresos por ocupación principal era igual a missing.

9.2.2 Imputación de ingresos por Jubilación y Rentas Vitalicias

Para estas dos corrientes de ingreso, se definieron los grupos a partir de cuatro variables:

− Región;

− Relación con el jefe de hogar;

− Sexo del entrevistado;

− Nivel educativo.

El procedimiento de imputación fue similar al descrito en la corriente anterior.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

47

9.2.3 Imputación de ingresos por Alquiler

Para esta corriente de ingreso, se definieron grupos a partir de dos variables:

− Propiedad de la vivienda: se definieron 3 categorías a partir de la variable v14_x

(situación de la vivienda que ocupa el hogar). Estas categorías fueron propia (pagada

o pagándose), propiedad conjunta y otros.

− Tipo de vivienda: igual a la variable v13_x

El procedimiento de imputación fue similar al descrito en el ingreso por ocupación

principal. Notar que la variable alquiler imputado sólo se construye para los hogares

propietario de su vivienda.

9.2.4 Imputación de las variables Sexo, Edad y Nivel Educativo

En el caso de estas tres variables, se realizó una consistencia longitudinal (ver sección

7.2.3). Para aquellos individuos donde se encontraron inconsistencias, se generaron dos

nuevos conjuntos de variables. El primero de ellos se compone de dummies que toman el

valor de uno si se detectó una inconsistencia: error_esc_ola, error_sexo_ola y

error_edad_ola. El segundo grupo de variables corresponde a las variables imputadas:

r3cor_ola, r2cor_ola y esc1_ola, donde "ola" corresponde a las tres olas del panel.

9.3 Errores de medición

El error de medición es la diferencia entre el valor medido y el valor real (pero

desconocido) de una cierta variable. Existen diversas razones para explicar esta

diferencia:

− El encuestado puede no entender bien la pregunta;

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

48

− El encuestado puede no recordar con exactitud la información necesaria para

responder la pregunta;

− El encuestado puede cometer errores de juicio o de estimación al transformar la

información que recuerda para responder una pregunta;

− El encuestado puede responder de forma inexacta, ya sea de manera intencional o no;

− El encuestador puede confundir al entrevistado al dar más información de la

especificada, leer los ítems en distinto orden, etc.;

− El encuestador puede equivocarse al registrar la respuesta;

− La respuesta registrada en el cuestionario puede ser ilegible en la etapa de digitación;

− Puede ocurrir un error en la etapa de digitación;

− Si la respuesta requiere codificación, puede ser aplicado un código incorrecto;

− También pueden ocurrir otros errores en las etapas de edición y procesamiento de la

información.

Por ende, tanto las encuestas de corte transversal como las de tipo longitudinal están

afectas a este tipo de errores. Ahora bien, en las encuestas longitudinales estos errores

pueden ser más perjudiciales que en las de corte transversal, en particular al estudiar

transiciones entre estados. Por esto se sugiere al investigador definir transiciones más

robustas para estudiar transiciones (por ejemplo, definir salidas de la pobreza como un

cambio en la categoría de pobreza más un incremento del ingreso de al menos un 10%).

9.4 Construcción de ingresos y Ajuste por Cuentas Nacionales

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

49

En cada una de las olas se construyeron los ingresos de las personas y de los hogares a

partir de la información recolectada en la encuesta. En la base de datos se encuentran las

variables de ingresos construidas y las preguntas originales del cuestionario para que el

investigador que lo desee pueda acceder directamente a ellas.

Como se mencionó anteriormente, se realizó la imputación de cuatro partidas de ingresos

siguiendo los lineamientos de la metodología usada en las encuestas CASEN. Estas

variable corregidas por no respuesta, y las que se construyen a partir de ellas, se

distinguen en la base de datos por el sufijo “cor”. En este caso también se encuentran

tanto las variables con y sin corregir en la base de datos.

En las encuesta CASEN se realiza además un ajuste por Cuentas Nacionales a las

variables de ingreso. En líneas generales, este ajuste consiste en comparar los ingresos

agregados de la información de la encuesta con los ingresos agregados reportados por

las Cuentas Nacionales del Banco Central, para cinco partidas de ingresos: ingreso de los

asalariados, ingresos de los independientes, alquiler imputado, seguridad social y rentas

de la propiedad. Con esta información se construyen factores que corresponde al

cuociente entre lo entregado por ambas fuentes y se corrigen los ingresos de la encuesta

de modo que sumen el valor registrado en las Cuentas Nacionales.

En el caso de la encuesta Panel CASEN 1996-2001-2006 esta metodología tiene varios

alcances. Por una parte, se cuenta con factores de ajuste de la CASEN 1996, CASEN

2000 y CASEN 2006, pero sólo la primera de ellas está relacionada con la encuesta

Panel. Usar factores construidos para otra encuesta, con otros hogares encuestados y por

ende otros ingresos registrados, constituye un salto demasiando grande. Más aún, en el

caso de la CASEN 2000, las Cuentas Nacionales correspondientes son también las del

año 2000. Incluso para 1996, los factores que usa la encuesta CASEN se construyeron

usando toda la encuesta, y no sólo una submuestra ni las cuatro regiones de estudio en

este caso. Por otro lado, dado el carácter longitudinal de la encuesta, es cuestionable

pensar que a una misma persona u hogar que es reencuestado en el tiempo, le

corresponda un factor de ajuste distinto por ejemplo, en alquiler, incluso a pesar de que su

vivienda puede ser la misma.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

50

Por estas razones, los ingresos de la encuesta Panel CASEN 1996-2001-2006 se

encuentran sin este ajuste. A pesar de lo anterior, se agrega en la base de datos el

ingreso total de los hogares corregido por imputación y ajustado por cuentas nacionales

con los factores de las encuestas CASEN 1996, 2000 y 2006 para cada ola.12 De estas

manera el investigador que quiera ver la diferencia en los valores reportados con y sin

ajuste puede hacerlo, pero teniendo presente que esta metodología no es correcta de

aplicar en este caso, y que conclusiones de la metodología en esta encuesta no pueden

ser generalizadas directamente a las encuestas CASEN.

10 Errores muestrales

La precisión de las estimaciones obtenidas a partir de una población dada se mide

mediante los errores estándar de las mismas. De manera análoga al error de medición, el

error total de una estimación obtenida es igual a la diferencia entre el estimado y el valor

real. Dicha diferencia se encuentra compuesta por dos partes: el error sistemático y el

error aleatorio. El primer tipo de errores se relaciona con el marco muestral, el

encuestador y la tasa de no respuesta. Por otra parte, el componente aleatorio comprende

el error muestral, que se encuentra estrechamente relacionado con el hecho de que no se

está encuestado a toda la población, sino a un subconjunto de la misma. En líneas

generales, el diseño muestral empleado en una encuesta como la Panel CASEN influye

en la precisión de las estimaciones que se vayan a obtener, sean éstos promedios,

proporciones o totales.

Según Deaton (1989), el diseño muestral ideal sería poder tener una muestra basada en

muestreo aleatorio simple. Sin embargo, existen una serie de factores que impiden lograr

este objetivo. Entre los principales se encuentran:

− Factores presupuestarios;

12 Excepto la imputación de rentas de la propiedad debido a que no consiste en la aplicación de un factor sino

en la creación de una variables para el 20% de la población de mayores ingresos del total de la diferencia entre Cuentas Nacionales y la Encuesta. Imputar el total de la diferencia registrado por otra encuesta a esta, nos parece un supuesto demasiado fuerte de asumir.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

51

− Factores geográficos (grado de dispersión de la población en determinado territorio).

Esto hace que los costos de realizar un muestreo aleatorio simple sean excesivos. Por

consiguiente, en la mayoría de encuestas se emplean diseños muestrales complejos, que

intentan recoger dos factores que pueden resultar contradictorios a primera vista:

aprovechar la homogeneidad de ciertos grupos poblacionales dentro del territorio a

encuestar sin perder la heterogeneidad existente en los mismos. En el caso de la

encuesta Panel CASEN, el diseño muestral fue explicitado en la sección 3.

La influencia de este diseño muestral en el cálculo de los errores estándar puede

corregirse mediante el cálculo de los efectos de diseño. De acuerdo a Kish (1965), el

efecto de diseño es igual al razón de la varianza obtenida mediante el diseño muestral

complejo sobre la varianza que se hubiese obtenido a partir de un muestreo aleatorio

simple. Es decir:

( )( ) ( )( )( )( )

. .

. .c

srs

s e f xdeft f x

s e f x=

Despejando la varianza del diseño muestral complejo, tenemos que:

( )( ) ( )( ) ( )( ). . . .c srss e f x s e f x deft f x= ×

En términos de la homogeneidad de las unidades primarias de muestreo, el deft complejo

puede expresarse de la siguiente forma:

( )( ) ( )1 1deft f x b roh= + − ×

Donde roh, el ratio de homogeneidad, es una aproximación a la correlación intra-

conglomerados, que representa una medida de la agrupación de características similares

dentro de cada unidad primaria de muestreo, mientras que b denota el número promedio

de elementos por unidad primaria de muestreo. La fórmula arriba mencionada muestra la

relación directa existente entre el número de unidades muestrales por conglomerado y la

magnitud de la varianza. Los intervalos de confianza pueden ser obtenidos fácilmente

considerando una distribución normal. En este sentido, puede obtenerse un intervalo al

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

52

95% (o al margen de error que se desee obtener). Los softwares estadísticos incluyen hoy

formas de incluir las variables de diseño muestral, calculan directamente las varianzas y

pueden entregar también los efectos de diseño.

La estimación de la varianza es importante dado que indica la precisión de los

estimadores, llevando a intervalos de confianza que permiten evaluar hipótesis respecto

de una serie de parámetros. Cualquier procedimiento de estimación debe tener en cuenta

cuatro características (Brogan, 1992):

− La mayor parte de los estimadores no son funciones lineales (es común emplear ratios

de dos estimadores lineales).

− Los estimadores están ponderados.

− El plan de muestreo generalmente ha empleado un diseño muestral estratificado

previo a la selección de las unidades primarias de muestreo.

− Los elementos seleccionados por lo general no son independientes dadas las

características de un muestreo por conglomerados.

Estas cuatro características hacen que generalmente no sea posible obtener una forma

cerrada para la varianza estimada con diseños muestrales complejos. Por consiguiente, la

literatura sobre estimación de varianzas en estos contextos contiene distintas

aproximaciones que podrían emplearse.

En el caso de la encuesta Panel CASEN, se ha proporcionado toda la información

necesaria para construir intervalos de confianza asociados a cualquier estimación que

contemplen su diseño muestral complejo. Para ello, en los módulos del 1 al 5 de las bases

de datos se pueden encontrar las variables estrato y conglomerado.

En particular, en el programa computacional Stata, para calcular los errores muestrales

deben llevarse a cabo las siguientes instrucciones:

svyset [pw=varpeso], strata(estrato) psu(conglomerado)

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

53

donde varpeso representa el conjunto de pesos longitudinales o de corte transversal,

dependiendo del análisis que se vaya a realizar, que también están incluidos en dichos

módulos.

Con respecto a las metodologías a usar para el cálculo de los errores estándar, es preciso

mencionar que el Stata puede construir los errores estándar mediante al menos dos

metodologías. La primera consiste en linealizar los errores estándar del estimador a partir

de una aproximación de Taylor, mientras que la segunda implica un proceso de

remuestreo mediante el método de jackknife. La opción por defecto en Stata es la de

linealizar los errores.

11 Acceso a los datos y a su documentación

Un acceso deficiente a la información socioeconómica y a su documentación tiene efectos

negativos en la investigación social y en el diseño de políticas sociales, haciendo que

éstas se orienten a la información disponible y que la calidad de las bases de datos no

mejore ni se exploten a cabalidad. A su vez, estos efectos negativos se traducen en que

sean menos las personas pensando los problemas de la sociedad, y que éstas muchas

veces repliquen sus esfuerzos al no estar claros los procedimientos que se siguieron para

obtener y configurar la información. Desde de nuestra visión, transparentar esta

información es esencial para promover investigación de calidad. Así, a través de

información de fácil acceso y debidamente documentada, esperamos avanzar en este

sentido.

11.1 Organización de la bases de datos

Dado el tamaño de la base de datos con las tres olas de la encuesta, se optó por dividirla

en ocho módulos:

− Módulo 1: Características de los residentes, patrimonio y vivienda.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

54

− Módulo 2: Educación.

− Módulo 3: Empleo, excluye el módulo de historia laboral.

− Módulo 4: Ingresos. Contiene variables imputadas y construidas para hogares.

Asimismo, están los indicadores que identifican a un hogar como indigente, pobre o no

pobre.

− Módulo 5: Salud.

− Módulo 6: Hitos.

− Módulo 7: Participación.

− Módulo 8: Historia Laboral.

Los cinco primeros módulos contienen información de las tres olas del panel, al nivel del

individuo y del hogar. Los módulos 6, 7 y 8 fueron realizados en la ola 2006, por lo que

únicamente contienen la información de dicho corte transversal. De estos módulos, sólo

los dos primeros contienen información al nivel del hogar, mientras que el módulo 8

contiene información para el primer y segundo perceptor de ingresos.

A partir de estos módulos es posible realizar análisis longitudinal y transversal de los

temas que abordan por separado, ya que contienen los identificadores y pesos

necesarios. Para consolidar los distintos módulos, cada uno de ellos cuenta con

identificadores de personas. Los detalles de esta operación, así como otros

procedimientos necesarios para utilizar las bases de datos, se encuentran en el

documento “La Encuesta Panel CASEN: Manual del Usuario”.

11.2 Documentación

Una completa documentación es necesaria para el análisis de todo tipo de encuestas.

Ahora bien, en encuestas de hogares tipo panel esta documentación es todavía más

necesaria por las complejidades adicionales que presentan por sobre sus homólogas de

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

55

corte transversal. De no proveerse un adecuado contexto de los datos e indicaciones

adicionales, es muy fácil que el análisis termine en resultados equivocados.

Por esta razón, en la encuesta Panel CASEN se ha procurado entregar los datos con una

documentación de los más altos estándares. Para esto, se han preparado, además del

presente documento "La Encuesta Panel CASEN: Metodología y Calidad de los Datos",

otros titulados:

− “La encuesta Panel CASEN: Resultados de la Tercera Ola”;

− “La encuesta Panel CASEN: Libro de Códigos”;

− “La encuesta Panel CASEN: Manual del Usuario”;

− “Análisis de la Atrición en la Muestra de la Encuesta Panel CASEN”;

Toda esta información está disponible en la página web del Observatorio Social.

12 Confidencialidad de los datos

Para asegurar que las personas que participaron en la encuesta Panel CASEN no puedan

ser identificadas, se hicieron confidenciales datos de la encuesta como el nombre y la

dirección.

13 Seguridad de los datos

A continuación se exponen algunos requerimientos para asegurar la confidencialidad de

los datos:

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

56

− Si usted cambia de empleador, debe informar a las tres instituciones a través del

OSUAH. Los datos se entregan a un individuo y no a una organización, por lo que los

datos se pueden mover con el individuo dependiendo del proyecto de investigación de

éste. Por lo mismo no se puede dejar los datos con el empleador.

− Si el investigador cambia de proyecto de investigación, debe registrar este en el

OSUAH para seguir empleando los datos. De esta manera es posible saber el uso que

están dando los datos.

− La base de datos de la encuesta Panel CASEN debe ser guardada en un computador

protegido con clave.

− El usuario no debe entregar los datos a una persona que no ha sido autorizada. De lo

contrario será penalizada por la ley.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

57

Bibliografía

Brogan, D. (2005): "Sampling Error Estimation for Survey Data" en Household Sample

Surveys in Developing and Transition Countries, Nueva York: Naciones Unidas.

Deaton et al (1986): "Collecting Panel Data in Developing Countries: Does It Make Sense",

LSMS Working Paper.

Kalton, G., y M. Brick, (2000): “Weighting in household panel surveys” en Rose, D. (ed.),

Researching Social and Economic Change: the uses of household panel studies, 96-111,

London and New York: Routledge.

Lavallée, P. (1995): “Cross-sectional weighting of longitudinal surveys of individuals and

households using the weight share method”, Survey Methodology, 21, 25-32.

Institute of Social and Economic Research, University of Essex: “Keeping Track: A guide

to longitudinal resources”, http://www.iser.essex.ac.uk/ulsc/resources/keeptrack.php.

Institute of Social Research, University of Michigan. “Panel Studies Around the World”,

http://psidonline.isr.umich.edu/Guide/PanelStudies.aspx

Jenkins, S. P. (2003): "The value of longitudinal data",

http://melbourneinstitute.com/hilda/conf/conf2003/pdffiles/SJenkins.pdf.

Kish, L. (1965): Survey Sampling, Nueva York: Wiley.

Lawson, D. A. McKay y K. Moore (2003): “PanelDatasetsVersion1-July%202003”

http://www.chronicpoverty.org/pdfs/PanelDatasetsVersion1-July%202003.pdf.

Yaqub, S. (2000): "Poverty Dynamics in Developing Countries", Development

Bibliography 16, Institute of Development Studies, University of Sussex.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

58

Apéndices

Tabla 1: Distribución de la Muestra Inicial (1996) a Nivel Comunal, IIIª Región Comuna Hogares Personas

Chanaral 47 190Diego de Almagro 18 54Copiapo 63 262Caldera 11 39Tierra Amarilla 19 82Vallenar 99 403Freirina 17 73Alto del Carmen 33 151

Total 307 1.254

Tabla 2: Distribución de la Muestra Inicial (1996) a Nivel Comunal, VIIª Región

Comuna Hogares PersonasCuricó 75 295Teno 54 214Romeral 12 61Molina 69 284Santa Familia 14 50Talca 87 349Pelarco 29 121San Clemente 85 340Constitucion 92 375Curepto 17 66Linares 87 349Colbún 13 55Longaví 18 77Parral 75 305Villa Alegre 14 66San Javier 49 196Cauquenes 90 321

Total 880 3.524

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

59

Tabla 3: Distribución de la Muestra Inicial (1996) a Nivel Comunal, VIIIª Región

Comuna Hogares PersonasChillán 93 368San Carlos 109 405Cohihueco 79 320El Carmen 13 57Yungay 17 75Trehuaco 26 85Quirihue 25 93Los Angeles 89 345Quilaco 23 79Mulchén 66 282Negrete 28 122Nacimiento 58 234Laja 99 408Concepción 104 349Talcahuano 108 426Penco 124 502Tome 110 456Santa Juana 27 97Lota 135 577Coronel 115 469Lebu 90 328Arauco 83 356Curanilahue 100 427Cañete 91 404Contulmo 14 61

Total 1.826 7.325

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

60

Tabla 4: Distribución de la Muestra Inicial (1996) a Nivel Comunal, XIIIª Región

Comuna Hogares PersonasSantiago 66 194Independencia 59 226Conchalí 92 375Recoleta 94 378Providencia 11 48Lo Barnechea 11 37Las Condes 46 209Ñuñoa 49 172La Reina 46 169Macul 77 317Peñalolén 17 66La Florida 70 292La Granja 98 389La Pintana 139 581San Ramón 100 429San Miguel 60 209La Cisterna 75 307El Bosque 96 374Aguirre Cerda 77 297Lo Espejo 21 85Estación Central 89 343Cerrillos 13 49Maipú 62 251Quinta Normal 15 62Lo Prado 79 332Pudahuel 93 376Cerro Navia 96 402Renca 17 67Colina 85 357Puente Alto 87 384San Bernardo 84 363Paine 30 129Calera de Tango 10 40Melipilla 64 261María Pinto 10 52Curacavi 9 29Talagante 21 74Peñaflor 15 53Isla Maipo 13 61

Total 2.196 8.839

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

61

Tabla 5: Cuestionario de la encuesta Panel CASEN: Extracto de la Hoja de Ruta

Buenos días (tardes) señor(a), mi nombre es _____________________ y estoy trabajando en un estudio socioeconómico de hogares que realiza la Universidad Alberto Hurtado con las mismas familias que entrevistamos el año 2001 en esta Región. Necesito saber si vive aquí todavía la familia de don(doña) _______________. Luego usted debe confirmar con la información de 1996 y 2001 a los demás miembros del hogar. Es muy importante que realice este procedimiento, pues podría ocurrir que el Jefe de hogar del año 2001 se llamara Juan Soto, y don Juan Soto se haya cambiado de domicilio y en el año 2006 haya un nuevo Jefe de hogar que se llame Juan Pérez. Ya que en la Hoja de ruta solo se entrega el nombre de pila (sin apellido) el alcance de nombre podría generar un gran error, pues usted encuestaría a un hogar que no debe encuestar. Es por esto que debe verificar con los nombres de los otros miembros del hogar si efectivamente es el hogar que se busca.

1. Si � Pase a Pregunta 1a

2. No � Pase a Pregunta 2a

Pregunta 1a El suyo es uno de los hogares elegidos para continuar nuestro estudio, y no podemos reemplazarlo. Este trabajo nos permitirá obtener información de cómo viven las familias chilenas y con ella diseñar mejores políticas sociales. Sus respuestas no serán conocidas ya que se respetará absolutamente su anonimato. Agradecemos desde ya su gentileza y buena disposición. Específicamente necesito hacerle esta entrevista al Jefe de hogar o a la Dueña de casa.

Pregunta 1b ¿Han llegado nuevos miembros al hogar en los últimos 5 años? Utilizando la Tabla 1 (que aparece en la segunda página de la hoja de ruta) usted debe señalar el nombre de las personas que estaban presentes en el año 2001, y después anotar a los nuevos integrantes en los espacios disponibles en la Tabla. Luego debe preguntar:

¿Qué mes y qué año llegaron al Hogar? Consigne Mes y Año.

¿Cuál fue la razón? Pregunta 1c ¿Se han ido miembros del hogar durante los últimos 5 años? Utilizando la Tabla 1 (que aparece en la segunda página de la hoja de ruta) usted debe señalar el nombre de las personas que estaban presentes en el año 2001, y ahora ya no se encuentran. Luego debe preguntar:

¿Qué mes y qué año se fueron del Hogar? Consigne Mes y Año.

¿Cuál fue la razón? Registre esta información en la columna 11 de la Tabla 1. Si usted ha llegado hasta esta instancia quiere decir que el hogar debe ser encuestado, por lo tanto, inicie la aplicación del cuestionario. Para los casos en que la persona haya respondido “No” en la primera pregunta de indagación usted deberá aplicar la pregunta 2a: Pregunta 2a ¿Sabe usted donde se cambió esta familia o dónde vive algún pariente o amigo que me

pueda indicar dónde residen actualmente? Esta pregunta corresponde realizarla solamente en los casos que la familia que estamos buscando ya no vive en esa dirección.

1. Si � Escriba la información en el recuadro disponible

2. No � Agradecer amablemente y dejar un teléfono por si alguien del barrio tuviera alguna información de la familia de don /doña _________________________.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

62

Tabla 6: Cuestionario de la encuesta Panel CASEN: Extracto de la Hoja de Ruta

Existen ciertas variables o combinación de respuestas que sabemos no pueden darse.

Aquellos casos observados representan casos de estos denominados errores de

medición, que pueden deberse a alguna de las diferentes razones enunciadas

anteriormente.

Algunos de estos errores se observan en los datos de las dos primeras olas:

Sexo: 0,9% de los casos clasificados diferente en ambas ocasiones.

Edad: 10,04% de las personas tienen edades cuya diferencia cae fuera del rango 4 a 6

años (considerando que entre las dos primeras olas el tiempo transcurrido es de 5 años).

Estado civil: casados, separados, divorciados o viudos no pueden pasar al estado soltero,

situación que se observa en un 0,82% de los individuos con respuestas en ambas

ocasiones.

Educación: se encontraron 1.422 casos de inconsistencias, que representan el 9,42% de

los individuos. Las inconsistencias que se consideran son:

Transición de algún nivel de educación a ninguno, 156 casos

Transición a Preparatoria, de algún nivel de educación del sistema nuevo (igual o superior

a básica) o de niveles superiores en el sistema antiguo, 557 casos.

Transición a Básica, de un nivel superior en el sistema nuevo o del equivalente a

Humanidades en el sistema antiguo, 335 casos.

Transición a Humanidades, de un nivel del sistema nuevo igual o superior al equivalente a

Educación Media, 110 casos.

Transición a Educación Media, de un nivel igual o superior a CFT incompleto, 176 casos.

Transición de la Educación Superior a un Técnico del sistema antiguo, 25 casos.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

63

Transiciones dentro de la educación superior completas que pasan a un nivel menor, 63

casos.

Estos análisis son gruesos dado que no incluyen los años de escolaridad, sólo los

cambios de categoría. Un análisis más fino sin duda significaría mayores niveles de error.

Empleo: se registran 10 casos en que la persona declaró en 2001 no tener experiencia

laboral, pero sin embargo declaró en 1996 haber trabajado la semana pasada (6 casos) o

tener experiencia laboral (4 casos). Dado que en 2001, 785 personas respondieron la

pregunta sobre experiencia, estos errores equivalen al 1,3% de los casos.

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

64

Tabla 7: Total de Hogares en Cada Ola de la Encuesta

Región 1996 2001 2006III 307 277 230VII 880 837 774VIII 1.826 1.707 1.369XIII 2.196 1.827 1.396

Total 5.209 4.648 3.769

Total Hogares (muestra de corte transversal)

Tabla 8: Atrición de la Muestra por Región por Zona

Región/Zona 1996 2001 2006III Urbana 853 668 456III Rural 401 275 197

VII Urbana 2.240 1.710 1.213VII Rural 1.284 975 811

VIII Urbana 5.755 4.255 2.864VIII Rural 1.570 1.225 822

XIII Urbana 8.376 5.551 3.660XIII Rural 463 379 264

Total 20.942 15.038 10.287

Total muestra longitudinal

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

65

Tabla 9: Muestra Inicial versus Estructura de la Muestra de Casos de Atrición

Variables 1996 Muestra inicial completa Muestra de casos de atriciónGénero

Hombre 0,483 0,477Mujer 0,517 0,523

EdadEntre 0 y 9 años 0,190 0,201Entre 10 y 19 años 0,180 0,183Entre 20 y 29 años 0,165 0,118Entre 30 y 44 años 0,231 0,250Entre 45 y 59 años 0,130 0,158Entre 60 y 74 años 0,078 0,07975 años y más 0,025 0,010

Estado civilCasado 0,359 0,402Conviviente 0,053 0,050Anulado 0,002 0,001Separado 0,029 0,028Viudo 0,040 0,031Soltero 0,518 0,489

Tamaño del hogar 4,720 4,744Situación de la vivienda que ocupa

Propia pagada 0,522 0,599Propia pagándose 0,147 0,168Propiedad conjunta 0,017 0,022Arrendada 0,165 0,068Cedida por servicios 0,030 0,020Cedida por familiar 0,105 0,109Usufructo 0,007 0,007Ocupación irregular 0,006 0,008

RegiónIII 0,029 0,032VII 0,100 0,117VIII 0,212 0,221Metropolitana 0,659 0,631

ZonaUrbano 0,888 0,865Rural 0,112 0,135

Escolaridad 8,492 7,612Decil de ingreso autónomo

Decil 1 0,102 0,108Decil 2 0,098 0,114Decil 3 0,100 0,104Decil 4 0,101 0,112Decil 5 0,112 0,122Decil 6 0,089 0,110Decil 7 0,100 0,097Decil 8 0,099 0,093

Personas

Continúa

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

66

Continuación Tabla 9

Decil 9 0,101 0,080Decil 10 0,099 0,059

OcupaciónOcupado 0,372 0,358Desocupado 0,628 0,642

ContratoContrato indefinido 0,184 0,164Contrato no indefinido 0,031 0,028No sabe si su contrato es indefinido 0,005 0,003No ha firmado contrato 0,776 0,800No se acuerda 0,005 0,005

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

67

Tabla 10: Distribución de la Muestra Inicial (1996) a Nivel Comunal, XIIIª Región

Variable 1 2 3 5 6 7 8Género (0 = Hombre) -0.012 -0.015 -0.015 -0.014 -0.015 -0.013 -0.018 -0.020

(0.95) (1.23) (1.24) (1.07) (1.19) (1.03) (1.41) (1.42)Edad (0 = Entre 0 y 9 años)

Entre 10 y 19 años 0.016 0.017 0.018 0.041* 0.042** -0.078*** -0.036 -0.036(0.80) (0.85) (0.87) (1.94) (2.00) (3.08) (1.40) (1.39)

Entre 20 y 29 años 0.149*** 0.189*** 0.188*** 0.227*** 0.227*** 0.065** 0.095*** 0.097***(7.48) (8.99) (8.95) (10.94) (10.94) (2.20) (3.21) (3.16)

Entre 30 y 44 años -0.011 0.072*** 0.072*** 0.113*** 0.116*** -0.039 -0.024 -0.020(0.57) (2.99) (2.95) (4.61) (4.74) (1.30) (0.79) (0.63)

Entre 45 y 59 años -0.074*** 0.015 0.014 0.097*** 0.100*** -0.026 -0.049 -0.044(3.37) (0.53) (0.49) (3.45) (3.55) (0.81) (1.46) (1.26)

Entre 60 y 74 años 0.021 0.094*** 0.092*** 0.194*** 0.197*** 0.109*** 0.088** 0.089**(0.79) (3.00) (2.89) (6.12) (6.19) (3.16) (2.48) (2.50)

75 años y más 0.280*** 0.318*** 0.317*** 0.379*** 0.383*** 0.343*** 0.336*** 0.337***(6.35) (6.84) (6.76) (9.05) (9.05) (7.28) (6.79) (6.89)

Estado civil (0 = Casado)Conviviente - 0.072** 0.072** 0.046* 0.046* 0.079*** 0.085*** 0.084***

- (2.47) (2.46) (1.78) (1.79) (3.07) (3.33) (3.30)Anulado - 0.207** 0.205** 0.215** 0.211** 0.193** 0.160 0.161

- (2.16) (2.14) (2.36) (2.29) (2.07) (1.58) (1.59)Separado - 0.065* 0.064* 0.080** 0.075** 0.074** 0.057 0.058

- (1.75) (1.73) (2.22) (2.05) (2.01) (1.51) (1.51)Viudo - 0.087** 0.087** 0.081** 0.081** 0.103*** 0.086** 0.086**

- (2.46) (2.45) (2.46) (2.47) (3.09) (2.51) (2.48)Soltero - 0.114*** 0.114*** 0.151*** 0.154*** 0.158*** 0.124*** 0.123***

- (5.90) (5.90) (7.48) (7.64) (7.86) (6.10) (6.07)Tamaño del hogar - - -0.002 0.006* 0.008** 0.010*** 0.016*** 0.016***

- - (0.55) (1.79) (2.20) (2.83) (4.72) (4.74)Situación de la vivienda que ocupa (0 = Propia pagada)

Propia pagándose - - - 0.037* 0.024 0.026 0.036* 0.036*- - - (1.90) (1.23) (1.31) (1.86) (1.87)

Propiedad conjunta - - - -0.044 -0.033 -0.020 0.014 0.016- - - (0.98) (0.71) (0.44) (0.31) (0.36)

Arrendada - - - 0.353*** 0.346*** 0.346*** 0.359*** 0.359***- - - (17.39) (16.83) (17.00) (18.69) (18.71)

Cedida por servicios - - - 0.233*** 0.269*** 0.274*** 0.285*** 0.285***- - - (10.38) (12.59) (12.73) (13.12) (13.09)

Cedida por familiar - - - 0.085*** 0.089*** 0.104*** 0.142*** 0.142***- - - (4.77) (5.05) (5.79) (7.64) (7.62)

Usufructo - - - 0.136*** 0.174*** 0.187*** 0.211*** 0.212***- - - (2.86) (3.70) (4.00) (4.63) (4.64)

Ocupación irregular - - - -0.029 -0.021 0.000 0.029 0.032- - - (0.26) (0.18) (0.00) (0.26) (0.28)

Región (0 = Metropolitana)III - - - - -0.052** -0.049** -0.039* -0.038*

- - - - (2.26) (2.14) (1.74) (1.74)VII - - - - -0.076***-0.063*** -0.037** -0.037**

- - - - (5.14) (4.21) (2.44) (2.43)

Ajuste

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

68

Continúa

Continuación Tabla 10

VIII - - - - -0.008 0.002 0.029** 0.028**- - - - (0.60) (0.15) (2.15) (2.06)

Zona (0 = Urbano) - - - - -0.078***-0.045*** -0.033** -0.033**- - - - (5.39) (2.98) (2.19) (2.14)

Escolaridad - - - - - 0.017*** 0.011*** 0.011***- - - - - (9.02) (5.15) (5.03)

Decil (0 = Decil 1)Decil 2 - - - - - - 0.001 0.001

- - - - - - (0.06) (0.03)Decil 3 - - - - - - 0.030 0.030

- - - - - - (1.21) (1.21)Decil 4 - - - - - - -0.010 -0.010

- - - - - - (0.35) (0.36)Decil 5 - - - - - - 0.011 0.011

- - - - - - (0.41) (0.42)Decil 6 - - - - - - -0.028 -0.028

- - - - - - (1.06) (1.07)Decil 7 - - - - - - 0.102*** 0.103***

- - - - - - (3.90) (3.95)Decil 8 - - - - - - 0.093*** 0.094***

- - - - - - (3.58) (3.60)Decil 9 - - - - - - 0.152*** 0.153***

- - - - - - (5.31) (5.37)Decil 10 - - - - - - 0.232*** 0.234***

- - - - - - (6.83) (6.92)Ocupación (0 = Desocupado) - - - - - - - -0.015

- - - - - - - (0.69)Contrato (0 = Contrato indefinido)

Contrato no indefinido - - - - - - - 0.042- - - - - - - (1.14)

No sabe si su contrato es indefinido - - - - - - - 0.104- - - - - - - (1.28)

No ha firmado contrato - - - - - - - -0.005- - - - - - - (0.23)

No se acuerda - - - - - - - -0.061- - - - - - - (0.84)

Pseudo-R2 0,0181 0,0222 0,0222 0,0765 0,0804 0,0886 0,1028 0,1031Observaciones 20.992 20.992 20.992 20.992 20.992 20.992 20.992 20.992

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

69

Tabla 11: Distribución de los Pesos de la encuesta CASEN 1996

CASEN 1996Corte transversal

Media 138,6Desviación estándar 180,3Percentil 1 11Percentil 5 25Mediana 91Percentil 95 355Percentil 99 905Observaciones 62.467

Tabla 12: Distribución de los Pesos de la encuesta Panel CASEN, 1996

Panel CASEN 1996Corte transversal

Media 412,7Desviación estándar 623,4Percentil 1 24Percentil 5 56Mediana 246Percentil 95 842Percentil 99 1.133Observaciones 20.942

Tabla 13: Distribución de los Pesos de la encuesta Panel CASEN, 2001

Longitudinal Corte transversalMedia 559,8 540,3Desviación estándar 946,1 830,3Percentil 1 29,9 21,1Percentil 5 69,2 47,2Mediana 306,4 256,6Percentil 95 1641,6 1516,3Percentil 99 4814,6 4310,7Observaciones 16.347 18.587

Panel CASEN 2001

Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360

70

Tabla 14: Distribución de los Pesos de la encuesta Panel CASEN, 2006

Longitudinal Corte transversalMedia 798,4 658,3Desviación estándar 1.419,9 1262,4Percentil 1 39 25,3Percentil 5 94 52,4Mediana 408 307,8Percentil 95 2.461 2.109Percentil 99 7.163 5.604Observaciones 11.976 14.568

Panel CASEN 2006