Estudio longitudinal de supervivencia de la cohorte … · censo de 2001 durante 2002-2013, ......

3
Estudio longitudinal de supervivencia de la cohorte censal andaluza de 2001 F. Viciana 1 V. Montañés 1 R. Cánovas 1 D. Ramiro Fariñas 2 1 Instituto de Estadística y Cartografía de Andalucía 2 Consejo Superior de Investigaciones Científicas http://epidemos.es/Sevilla2016 1/3 Antecedentes La reutilización de la información de los ficheros estadísticos y administrativos para generar nuevas estadísticas es una simple cuestión de coste-eficacia: generar nueva información estadística a partir del enlace de registros preexistentes no solo disminuye el coste y la sobrecarga del informante, sino que en muchos casos es la única manera factible de obtener determinada información estadística. En esta linea, el Instituto de Estadística y Cartográfica de Andalucía (IECA) es- tá desarrollando una nueva fuente: la Base de Datos Longitudinal de Población (BDLP), en la que se está integrando la información, que hasta ahora se encontraba en sistemas independientes, relativa a los individuos que en los últimos años han resi- dido en Andalucía. Con esta nueva fuente se pretende aportar novedosas estadísticas adecuadas para investigar el efecto de los determinantes económicos y sociales sobre los comportamientos demográficos o la salud de las poblaciones. El producto de difusión del IECA: Estadísticas Longitudinales de Supervivencia y Longevidad en Andalucía, que se describe en esta comunicación, muestra algunas de las potencialidades que esta nueva fuente representa para la investigación epidemiológica. Reconstrucción de biografías registrales Objetivos Reconstruir las biografías vitales y residenciales de los individuos incluidos en el censo de 2001 durante 2002-2013, con objeto de reproducir un estudio longitudinal de cohortes usando como categorías de exposición la información contenida en los cuadernillos censales. Con la información generada por esta explotación, diseñar un producto de difusión web, dirigido a investigadores especializados en temas de mortalidad y supervivencia, que maximizando el contenido útil de información suministrada preserve la confidencialidad de la información. Fuentes de la BDLP Fuentes de datos La fuente de este trabajo ha sido la Base de Datos Longitudinal de Población de Andalucía (BDLP), la cual es un sistema de finalidad exclusivamente estadística, que integra la información nominal de diferentes registros estadísticos y administrativos de ámbito poblacional. La BDLP nace a partir del Registro de Población de Andalucía (RPA), creado por la Ley 8/2002 del Plan Estadístico de Andalucía 8/2002. actual Plan Estadístico y Cartográfico de Andalucía ha definido a la BDLP (Articulo 18.b de la Ley 3/2013) como ámbito prioritario de actuación en cuanto a infraestructura de información estadística. En la actualidad, la BDLP integra información proveniente de las siguientes fuentes: Las variaciones continuas de los padrones municipales de población. Los Boletines estadísticos de partos, defunciones y matrimonios del Movimiento Natural de Población (MNP). La información de los Censos de 1991, 2001 y la muestra censal de 2011 Otras fuentes administrativas tales como los datos de cotizaciones y pensiones de la Seguridad Social La BDLP se constituye como un banco de datos histórico que recoja los itinerarios demográficos de los individuos desde el nacimiento hasta su muerte, organizada en forma de base de datos, donde las claves de identificación individual establecen las relaciones entre las diferentes áreas del sistema. Actualmente, la BDLP, integra infor- mación relativa a casi 11 millones de personas distintas, que en algún momento desde 1996 han estado inscritas en alguno de los padrones municipales de Andalucía. Más de 5 millones de estas personas han protagonizado alguna inscripción en el MNP. En casi 8 millones de ellas se cuenta con la información recopilada en los censos de población y en 5,5 millones de ellas se dispone de información socio-económica proveniente de los ficheros de Pensiones y Cotizaciones de la Seguridad Social. Estructura de la BDLP Padrones Censos Población M.N.P. Seguridad Social Pensiones 7,6M(1,7M) ~99% vPersonas Cotizaciones 53,3M(4,3M) ~95% Partos 1,6M ~99% vPersonas Matrimonios 0,7M ~95% Defunciones 1,2M ~95% Variaciones A:33M B:26M vPersonas Extraciones 160M Muestra 2011 0,7M >99% vPersonas 2001 7,4M ~99% 1991 7,0M ~78% Personas 10,7M 5,4M 5,2M 7,8M

Transcript of Estudio longitudinal de supervivencia de la cohorte … · censo de 2001 durante 2002-2013, ......

Page 1: Estudio longitudinal de supervivencia de la cohorte … · censo de 2001 durante 2002-2013, ... integra la información nominal de diferentes registros estadísticos y ... bien directamente

Estudio longitudinal de supervivenciade la cohorte censal andaluza de 2001

F. Viciana 1 V. Montañés 1 R. Cánovas 1 D. Ramiro Fariñas 2

1Instituto de Estadística y Cartografía de Andalucía2Consejo Superior de Investigaciones Científicas

http://epidemos.es/Sevilla2016 1/3

Antecedentes

La reutilización de la información de los ficheros estadísticos y administrativos paragenerar nuevas estadísticas es una simple cuestión de coste-eficacia: generar nuevainformación estadística a partir del enlace de registros preexistentes no solo disminuyeel coste y la sobrecarga del informante, sino que en muchos casos es la única manerafactible de obtener determinada información estadística.En esta linea, el Instituto de Estadística y Cartográfica de Andalucía (IECA) es-tá desarrollando una nueva fuente: la Base de Datos Longitudinal de Población(BDLP), en la que se está integrando la información, que hasta ahora se encontrabaen sistemas independientes, relativa a los individuos que en los últimos años han resi-dido en Andalucía. Con esta nueva fuente se pretende aportar novedosas estadísticasadecuadas para investigar el efecto de los determinantes económicos y sociales sobrelos comportamientos demográficos o la salud de las poblaciones.El producto de difusión del IECA: Estadísticas Longitudinales de Supervivencia yLongevidad en Andalucía, que se describe en esta comunicación, muestra algunas de laspotencialidades que esta nueva fuente representa para la investigación epidemiológica.

Reconstrucción de biografías registrales

Objetivos

• Reconstruir las biografías vitales y residenciales de los individuos incluidos en elcenso de 2001 durante 2002-2013, con objeto de reproducir un estudiolongitudinal de cohortes usando como categorías de exposición la informacióncontenida en los cuadernillos censales.

• Con la información generada por esta explotación, diseñar un producto dedifusión web, dirigido a investigadores especializados en temas de mortalidad ysupervivencia, que maximizando el contenido útil de información suministradapreserve la confidencialidad de la información.

Fuentes de la BDLP

Fuentes de datos

La fuente de este trabajo ha sido la Base de Datos Longitudinal de Población deAndalucía (BDLP), la cual es un sistema de finalidad exclusivamente estadística, queintegra la información nominal de diferentes registros estadísticos y administrativos deámbito poblacional. La BDLP nace a partir del Registro de Población de Andalucía(RPA), creado por la Ley 8/2002 del Plan Estadístico de Andalucía 8/2002. actualPlan Estadístico y Cartográfico de Andalucía ha definido a la BDLP (Articulo 18.bde la Ley 3/2013) como ámbito prioritario de actuación en cuanto a infraestructurade información estadística.En la actualidad, la BDLP integra información proveniente de las siguientes fuentes:

• Las variaciones continuas de los padrones municipales de población.• Los Boletines estadísticos de partos, defunciones y matrimonios del Movimiento

Natural de Población (MNP).• La información de los Censos de 1991, 2001 y la muestra censal de 2011• Otras fuentes administrativas tales como los datos de cotizaciones y pensiones de

la Seguridad SocialLa BDLP se constituye como un banco de datos histórico que recoja los itinerariosdemográficos de los individuos desde el nacimiento hasta su muerte, organizada enforma de base de datos, donde las claves de identificación individual establecen lasrelaciones entre las diferentes áreas del sistema. Actualmente, la BDLP, integra infor-mación relativa a casi 11 millones de personas distintas, que en algún momento desde1996 han estado inscritas en alguno de los padrones municipales de Andalucía. Más de5 millones de estas personas han protagonizado alguna inscripción en el MNP. En casi8 millones de ellas se cuenta con la información recopilada en los censos de poblacióny en 5,5 millones de ellas se dispone de información socio-económica proveniente delos ficheros de Pensiones y Cotizaciones de la Seguridad Social.

Estructura de la BDLP

Padrones Censos PoblaciónM.N.P.Seguridad Social

Pensiones7,6M(1,7M)

~99%

vPersonas

Cotizaciones53,3M(4,3M)

~95%

Partos1,6M~99%

vPersonas

Matrimonios0,7M~95%

Defunciones1,2M~95%

VariacionesA:33MB:26M

vPersonas

Extraciones160M

Muestra 20110,7M>99%

vPersonas

20017,4M~99%

19917,0M~78%

Personas10,7M

5,4M5,2M

7,8M

Page 2: Estudio longitudinal de supervivencia de la cohorte … · censo de 2001 durante 2002-2013, ... integra la información nominal de diferentes registros estadísticos y ... bien directamente

Estudio longitudinal de supervivenciade la cohorte censal andaluza de 2001

F. Viciana 1 V. Montañés 1 R. Cánovas 1 D. Ramiro Fariñas 2

1Instituto de Estadística y Cartografía de Andalucía2Consejo Superior de Investigaciones Científicas

http://epidemos.es/Sevilla2016 2/3

Diseño del estudio

Con la información de la BDLPA se ha diseñado un estudio longitudinal de cohortesusando información de los padrones municipales, el Censo de población y vivien-das de 2001 y los Boletines Estadísticos de Defunción. Esta información ha sidocombinada con objeto de obtener una base de datos de explotación construida con lassiguientes especificaciones:

• Población de partida: Se selecciona a los individuos recogidos en el Censo de2001 (7.357.547), localizados en algún alta padronal en un municipio deAndalucía y de estos se selecionan las altas activas el 1-1-2002 (98,3 % de loscensados).

• Periodo de seguimiento (Ventana de observación): Sobre estapoblación censada y residente en Andalucía el 1-1-2002 se comprueban lasmodificaciones de su situación de residencia o estado vital, recogidas tanto en lasaltas y bajas padronales como en los Boletines de Defunción, desde el 1 enerode 2002 hasta el 31 de Diciembre de 2013 (12 años de seguimiento).

• Condiciones que determinan el fin del seguimiento: El fin deseguimiento de cada uno de los individuos participantes se puede producir poruna de estas tres causas:• Fallecimiento registrado en MNP y/o baja padronal por defunción• Emigración fuera de Andalucía por salida de Andalucía, por emigración informada por una

baja padronal.• Censura por fin de estudio En la gran mayoría de los casos el fin de seguimiento se produce

por llegar vivo y residente en Andalucía a la fecha de cierre de estudio 31-12-2013.

Población de referencia y ventana de seguimiento

1910 1920 1930 1940 1950 1960 1970 1980 1990 2000 2010

05

1015

2025

3035

4045

5055

6065

7075

8085

9095

100

Periodo

Eda

d

●●

●●●

●●

●●

●●

Cie

rre

del s

egui

mie

nto

Com

ienz

o de

l seg

uim

ient

o

Periodoobservación

Observación exposiciónVariables Censo 2001

DefunciónPerdida por emigración

Historia previa al comienzo del seguimientoEn seguimiento del estado vital y residencial

7,2 Millones de personas comienza el seguimiento el 1−Ene−2002

706 Mil fallecidos entre 1−Ene−2002 y 31−Dic−2013

350 Mil perdidas por emigracion fuera de Andalucía entre 1−Ene−2002 y 31−Dic−2013

79,6 Millones de personas−año de exposición a riesgo en el estudio

Resultados

Tres productos diferentes se presentan en la publicación web: Estadísticas Longitudi-nales de Supervivencia y Longevidad en Andalucía

1 Una serie de tablas estadísticas con defunciones y personas-año clasificadas enlas categorías de riesgo definidas con la información del censo de 2001. Sedistribuyen en forma de cubos OLAP, manipulables mediante aplicación web obien directamente descargables en formato pc-axis

2 Unos ficheros de microdatos, con muestras aleatorias de individuos y hogares.Para la selección muestral se han utilizado como estratos las secciones censalesen la muestra de personas y las unidades territoriales del POTA en la deviviendas. En cada estrato se ha realizado un muestreo aleatorio simple con unafracción de muestreo del 10 %. En los microdatos para cada uno de losindividuos seleccionados se ha incluido, además de las variables censales, sutiempo de seguimiento y en su caso las modificaciones de la zonas de residencia.

3 Mapas de mortalidad para área pequeña en celdillas regulares de 250 metros y 1Km de lado, con la mortalidad general y para los grandes grupos de causa.

http://www.juntadeandalucia.es/institutodeestadisticaycartografia/longevidad

Generación de los cubos OLAP de la publicación

Las escalas de tiempo edad y periodo son habituales predictores en los modelos de-mográficos, que están cambiando de un modo continuo desde el inicio al fin del segui-miento. Si bien es posible trabajar con ellas como variables continuas si disponemosde ficheros de microdatos, lo habitual es transformarlas en variables discretas, talescomo años cumplidos o periodos anuales, para facilitar su agregación y la producciónde tablas y resúmenes numéricos con eventos y tiempos de exposición a riesgo.La discretización de las variables temporales es imprescindible para poder poder gene-rar los cubos OLAP con las defunciones y persona-año. Para discretizalas se definenuna serie de puntos de corte en cada escala. A nivel práctico, este paso consiste enasumir que una variable continua (por ejemplo, la edad) se transforma en una funciónescalonada, bajo con la asunción de equivalencia del efecto en los intervalos en quese han discretizado. Estas fronteras dibujan un malla sobre el diagrama de Lexis, quedividen los episodios en sub-episodios en los cuales el efecto edad y periodo se asumeinvariables.

Tabulación de las Defunciones y Personas-año

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015

5152

5354

5556

5758

5960

6162

6364

6566

Periodo

Eda

des

● ●

Cie

rre

del s

egui

mie

nto

Com

ienz

o de

l seg

uim

ient

o

0 Defu19.2 Pers−año

0 Defu4.4 Pers−año

0 Defu4.8 Pers−año

0 Defu6.6 Pers−año

0 Defu5.6 Pers−año

0 Defu6.6 Pers−año

0 Defu15.4 Pers−año

1 Defu13.7 Pers−año

0 Defu7.5 Pers−año

0 Defu7.5 Pers−año

0 Defu5.4 Pers−año

0 Defu4.2 Pers−año

0 Defu4.2 Pers−año

1 Defu3.7 Pers−año

0 Defu3.1 Pers−año

0 Defu3.1 Pers−año

0 Defu4.1 Pers−año

0 Defu4.1 Pers−año

0 Defu4.1 Pers−año

0 Defu1.1 Pers−año

DefuncionesPerdidas por emigración

Page 3: Estudio longitudinal de supervivencia de la cohorte … · censo de 2001 durante 2002-2013, ... integra la información nominal de diferentes registros estadísticos y ... bien directamente

Estudio longitudinal de supervivenciade la cohorte censal andaluza de 2001

F. Viciana 1 V. Montañés 1 R. Cánovas 1 D. Ramiro Fariñas 2

1Instituto de Estadística y Cartografía de Andalucía2Consejo Superior de Investigaciones Científicas

http://epidemos.es/Sevilla2016 3/3

Algunos ejemplos de explotación

Sevilla: Mortalidad 2002-2013 y desempleo en 2001

Tasas de mortalidad por nivel educativo y edad

Hombres Mujeres

10

100

1000

40 60 80 40 60 80edad

Tasa

por

10.

000

pers

onas

y a

ño

EstudiosAnalfabetosMenos de 5 años1º grado2º grado 1º ciclo2º grado 2º cicloSuperiores

Campo de Gibraltar: Mortalidad 2002-20013 y desempleoen 2001

Comparaciones internacionales

e30 por nivel educativo

● ●

●●

●●

●●

●●

●●

● ●

●●

● ●

● ●

● ●

● ●

●●

●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●

Men

os q

ue s

ecun

daria

Sec

unda

ria s

uper

ior

Est

udio

s su

perio

res

Estonia

Hungría

Polonia

República Checa

Dinamarca

EU21 media

Irlanda

Canadá

Portugal

Suecia

Finlandia

Eslovenia

Noruega

Países Bajos

Andalucía

Italia

40 50Expectativa de vida

Zon

a ge

ográ

fica

sexo●

HombresMujeres

La referencia para la Esperanza de vida en otros países es OCDEhttp://www.visualizing.org/datasets/economic-return-education-2012. El periodo de la estimaciones es entorno a la primera decada del siglo XXI. Los niveles educativos utilizados se han agrupado en tres niveles:menos que secundaria superior, secundaria superior y estudios superiores. La intervalos y el punto centralrepresentan, de izquierda a derecha, el indicador de esperanza de vida de menor a mayor nivel educativo

Conclusiones y recomendaciones

1 El estudio longitudinal de supervivencia de la cohorte censal de 2001 ha puesto a disposición pública un extenso y novedoso banco de datos, susceptible de ser utilizado para la investigaciónEpidemiológica y Demográfica

2 El aprovechamiento pleno de la información difundida por este estudio, requiere algunas capacitaciones en metodología y herramientas de tratamiento de datos que hoy no son habituales en loscurrículum formativos universitarios. Quizás este hecho explique una demanda de estos datos inferior a las expectativas originales.

3 El diseño de este estudio, es fácilmente re-utilizable para la investigación de otros fenómenos demográficos. En la actualidad se está trabajando en publicaciones similares para estudiar fecundidad,migraciones o biografias laborales.

4 La integración de la información de la BDLP con los sistemas de información sanitaria desarrollados con una lógica biográfica similar, constituiría un instrumento de excepcional interés para lainvestigación epidemiológica en nuestro medio.