INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general...

19
INFORME TÉCNICO Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001. Versión Fecha Realizado por 2 18/04/2001 José Antonio Perea Yustres Consideraciones generales acerca de la arquitectura informática a emplear, así como la estrategia de reconocimiento óptico a emplear. Se índica la adecuación técnica de la solución propuesta y los sistemas a gestionar en el proceso de producción censal. Documento Word: Resumen del proyecto informático censal 20010418.doc

Transcript of INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general...

Page 1: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

INFORME TÉCNICO

Resumen general del proyecto informático para la realización del

Censo de Población y Viviendas 2001.

Versión Fecha Realizado por

2 18/04/2001 José Antonio Perea Yustres

Consideraciones generales acerca de la arquitectura informática a emplear, así comola estrategia de reconocimiento óptico a emplear. Se índica la adecuación técnica dela solución propuesta y los sistemas a gestionar en el proceso de producción censal.

Documento Word: Resumen del proyecto informático censal 20010418.doc

Page 2: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 2

El Real Decreto Ley 1336/1999, de 31 de julio, dispone la formación de los Censos deEdificios, Locales, Viviendas y Población a realizar en el 2001.

La Orden del Ministerio de la Presidencia, de 9 de agosto de 2000, dicta las instruccionespara la formación de los Censos de Población y Viviendas de 2001.

Esta operación está incluida en el Plan Estadístico Nacional, y mas concretamente en elReal Decreto 1126/2000, de 16 de junio, por el que se aprueba el plan 2001-2004.

Principios estratégicos:

Los objetivos básicos a conseguir se orientan a:

- Maximizar la calidad de la operación

- Optimizar los recursos disponibles

Teniendo como referencia la planificación de las tareas de la operación, los calendarioscontemplados y la necesidad de realizar una explotación exhaustiva de la información apartir de la preimpresión de la misma con los datos del Registro de Población de Padróncontinuo disponible en el INE por su función coordinadora del total de los PadronesMunicipales, el plan de actuación establecido ha sido el siguiente:

- El establecimiento de un convenio de colaboración con la Dirección General delCatastro para la armonización de los callejeros de direcciones postales de los registrosde población y viviendas del INE y de Catastro para la gestión del IBI (Impuesto deBienes Inmuebles), para mejorar el directorio y facilitar la recogida

- La preimpresión de la documentación censal a partir de los directorios referidos

- La gestión de la contratación del personal eventual y de las nóminas del mismo, apartir de las adaptaciones necesarias a los sistemas habitualmente utilizados paraestos fines

- La oferta de cumplimentación del Censo por internet, de forma complementaria a larecogida tradicional por agentes en cuestionarios en papel

- La gestión de la recogida de la información basada en un sistema de seguimiento apartir de la informatización de las Oficinas Comarcales establecidas al efecto, con co-nexiones telemáticas a los centros del INE y con el proveedor de servicios de la cum-plimentación por internet

- La dotación de un centro de atención al usuario, integrado en el centro de proveedorde servicios de cumplimentación por internet, para dar soporte a las consultas delinformante por cualquier medio

- La consideración de las nuevas técnicas asociadas a la captura de la informaciónbasadas en OCR (Reconocimiento Óptico de Caracteres) y de sistemas automáticos decodificación, así como de la gestión documental asociada

- La utilización de las técnicas mas adecuadas para la depuración de la informaciónbasada en los sistemas de imputación automática disponibles en el momento de laexplotación

- La consideración de un plan de difusión orientado a ofrecer al usuario un conjunto deproductos estándar y la posibilidad de realizar peticiones a medida complementarias

Page 3: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 3

- La integración de un conjunto de cartografía digital como apoyo a la recogida asícomo para facilitar la difusión censal a nivel de sección censal para todo el territorio,con los límites de contorno en general y con contenido detallado para las secciones denúcleos para los municipios mayores de 25.000 habitantes disponibles.

Resultados:

Los resultados a obtener en esta operación son los siguientes:

- Recuento de la población y explotación estadística de las variables investigadas, asícomo proponer las rectificaciones a los datos de inscripción padronal correspondien-tes a los Ayuntamientos

- Recuento de los edificios y viviendas y explotación estadística de las variables investi-gadas, así como actualización derivada de los datos de callejero previa notificación delos mismos a los Ayuntamientos

Para ello se partirá de la información recogida en los CR (Cuadernos de Recorrido) decada sección censal, de las HP (Hojas Padronales) y de los CC (Cuestionarios Censales deVivienda/Hogar, e individual en su caso), que se distribuirán preimpresos y con un diseñoorientado a la recogida de las bajas y modificaciones a introducir, complementado con losmodelos de altas correspondientes.

En cuanto al Censo de Edificios y Locales, las tareas informáticas asociadas son lassiguientes:

- Captura de la información, y en especial de las variaciones introducidas en la recogi-da, mediante un proceso de digitalización, OCR y videograbación de los literales ma-nuscritos, generando finalmente los ficheros de variaciones de unidades poblaciona-les, viales, aproximaciones postales y huecos.

- Generación y envío a los Ayuntamientos de las propuestas de variación a los calleje-ros, de acuerdo a los ficheros normalizados de intercambio establecidos con motivode la gestión del Padrón continuo

- Actualización de los callejeros con la información de vuelta procedente de los Ayun-tamientos

- Depuración e imputación de la información recogida, por procedimientos automáticosy a medida

- Generación de los ficheros finales para agregación y difusión de los resultados

- Tabulación de resultados a los niveles de desagregación geográfica que corresponda

En cuanto a los Censos de Población y Viviendas, las tareas informáticas asociadas sonlas siguientes:

- Generación de los ficheros diccionarios para la codificación automática y/o asistida delas variables geográficas y de actividad económica para incluir en el proceso de captu-ra y validación de la información

- Control de la cobertura de la información recogida en comparación con los correspon-dientes resúmenes derivados de los CR

- Captura de la información y en especial de las variaciones introducidas en la recogida,mediante un proceso de digitalización, OCR, codificación y videograbación en su caso,generando finalmente los ficheros de variaciones asociadas, con contratación externa

Page 4: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 4

- Depuración e imputación de la información recogida, por procedimientos automáticosy a medida (metodologías DIA y NIM)

- Generación de los ficheros finales para agregación y difusión de los resultados, conlas medidas necesarias para asegurar la confidencialidad de la información individual

- Tabulación de resultados a los niveles de desagregación geográfica que corresponda

El proceso de las personas y hogares tendrá dos partes diferenciadas: en primer lugar,recoger las variaciones a los datos de inscripción padronal a efectos de aprobación de lascifras de población a la fecha de referencia censal, así como para comunicación a losAyuntamientos, previa comparación con el Padrón nacional para evitar la generación deduplicados. En segundo lugar, depurar el resto de la información personal mediante losprocedimientos que corresponda de acuerdo al calendario establecido (resultadosprovisionales 12 y 18 meses después de la fecha de referencia y resultados detallados 24y 36 meses después).

Visión global del proyecto:

El procesamiento informático de la información se asumirá por el INE con recursospropios, a excepción de las tareas de apoyo a la gestión de la recogida, de la captura ydepuración básica asociada, que son objeto de diferentes contrataciones de suministro yde arrendamiento, así como de diferentes servicios específicos.

Arquitectura de sistemas y de comunicaciones:

La arquitectura de sistemas y de comunicaciones asociada viene determinada de unaparte por los sistemas disponibles en el propio INE, tanto en sus Servicios Centrales comoen sus Delegaciones Provinciales y de otra por las contrataciones de los servicios de lacumplimentación de los censos por Internet y de comunicación telefónica de las OficinasComarcales con el INE. Estos sistemas se completan con los sistemas asociados a losprocesos de captura basados en OCR, que serán explotados por el adjudicatario de unacontratación externa del servicio, en un centro único ubicado en Madrid y dotado de lainfraestructura técnica necesaria que se describe después en este mismo documento.

Además, para asegurar que los intercambios de información se realizan en las debidascondiciones de seguridad y poder asegurar igualmente la confidencialidad de la informa-ción en el caso de ficheros con datos de carácter personal, se ha considerado procedentedefinir una extranet entre las Oficinas Comarcales y el INE, que se ha denominado RedPrivada de los Censos (RPC), y que se contratará mediante un concurso público ad hoc.

La RPC constará del conjunto de equipos físicos y lógicos y del sistema de comunicacio-nes del propio INE, complementado con un conjunto de redes locales, una para cada unade las Oficinas Comarcales.

Las comunicaciones entre dichas redes darán servicio tanto a voz como a datos a travésde telefonía móvil, pasando siempre por los servicios centrales del INE.

El siguiente diagrama representa simplificadamente la red informática del INE.

RED DEL INE:

Page 5: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 5

ServidorAIX

ServidorC

ServidorC

Servidores R/3 yNó i

DD.PP

Castellana, 183Capitan Haya, 51

Cortafuego

IntranetHOST

Otrosid

Router

Router

Router

Router

RouterInternet

RedPrivadaCensos

PasarelaC

ServidorWWW

DMZ

Josefa Valcarcel

OPERACIÓN DE CAPTURA:

La operación de captura de la información documental en papel se realizará en un únicocentro de procesamiento situado en Madrid (San Fernando de Henares), mediante unsistema de reconocimiento óptico de caracteres, codificación automática, control derango y coherencia intra e inter registros, que contempla los siguientes procesos:

• Digitalización mediante escáner óptico• Control de cobertura de la digitalización• Reconocimiento de caracteres• Sistema de mejora de literales y codificación asistida• Videocorrección asociada al reconocimiento y a los controles de coherencia• Control del flujo de trabajo• Control de calidad• Gestión documental

Page 6: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 6

En consecuencia se requerirá dotar a dicho centro de una red de área local de altacapacidad con un sistema de digitalización basado en un número suficiente de escáneresde alta producción, un conjunto de servidores de reconocimiento, base de datos, unida-des de almacenamiento masivo de la información y un conjunto de estaciones de trabajopara realizar las tareas de videocorrección, así como de un sistema de gestión documen-tal de seguimiento y control de los trabajos, según contiene la figura adjunta:

Se ha optado por una red gestionada con WINDOWS 2000 SERVER y SQL/SERVER 2000como base de datos, utilizando una aplicación de captura desarrollada a medida para estaoperación con el producto de reconocimiento óptico de caracteres BELLVIEW SCAN,seleccionada mediante un concurso público previo para este proyecto en base a unensayo de la operación.

El sistema en desarrollo contempla los siguientes procesos:

1. Digitalización mediante escáner óptico:

Mediante este dispositivo de entrada se capturarán las imágenes de los distintoscuestionarios, individuales, del hogar, padronales y cuadernos de recorrido.

En este proceso de digitalización se generarán los ficheros de imágenes a unacompresión estándar, almacenándose en los soportes adecuados con una gran ca-pacidad de almacenamiento y con las facilidades de recuperación que permitan suposterior tratamiento.

Page 7: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 7

2. Control de cobertura de la digitalización:

En este proceso se contrastarán los recuentos de documentos que entran al proce-so de digitalización y los documentos digitalizados por el escáner. Se comprobaráque todos los documentos de los lotes de documentación han sido digitalizados yque se ha realizado una correcta indexación mediante su número de hueco.

3. Reconocimiento de caracteres:

Reconocerá:

• Escritura manual encasillada• Códigos de barra• Omnifont• OMR

Para ello se utilizará software de reconocimiento con motores ICR numéricos y al-fabéticos, motores OMR y motores de BarCode.

Dependiendo de la tipología del campo (preimpreso, manuscrito, OMR, BarCode) ysu importancia descriptiva e identificativa, se utilizarán técnicas asociadas de mejo-ras de literales y codificación asistida, y técnicas de videocorrección.

4. Sistema de mejora de literales y codificación asistida:

Se utilizará para aquellos campos que se requieran, los diccionarios, tablas, pro-gramas de coherencia y sistema de codificación asistida asociados a variablesgeográficas, de actividad y de ocupación.

En función de los índices de fiabilidad y de valores de coherencia, se procederá adar como válido el campo o en su defecto presentarlo en videocorrección.

5. Videocorrección:

El proceso de videocorrección de campos se realizará:

a) Asociado al reconocimiento:

• Índice de fiabilidad de reconocimiento bajo• Índice de fiabilidad de diccionario bajo• Identificaciones en cuestionarios de altas y modificaciones• Campos de especial relevancia• Rechazos directos

b) Asociado a los controles de coherencia:

• Detección y corrección de valores fuera de rango e inconsistencias intra e in-terregistros

En consecuencia, el sistema estará preparado para realizar videocorrección espe-cializada al nivel de campo, y masiva al nivel de carácter. Debe presentarse la ima-gen del cuestionario en pantalla al nivel de carácter, campo, contexto y cuestiona-rio completo.

Page 8: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 8

Si así se requiere, el sistema deberá poder realizar la videograbación completa detodos los cuestionarios.

6. Control del flujo de trabajo:

Se controlará el flujo del trabajo e integrarlo dentro del sistema de Gestión y Reco-nocimiento a desarrollar considerando todas las operaciones y fases por las quepasa cada lote de trabajo y los distintos cuestionarios que lo componen.

7. Control de calidad:

Se integrarán en el sistema aquellos controles que permitan comprobar:

• El nivel de sustituciones producidas en el reconocimiento óptico• El nivel de calidad en la realización de la codificación asistida y el uso de

diccionarios• El nivel de calidad del sistema de videocorrección• El nivel de calidad del flujo de trabajo

Se desarrollarán los resúmenes de control necesarios para la comprobación del ni-vel de calidad de los procesos.Igualmente se realizarán las estimaciones necesarias para la planifición de la reali-zación del trabajo de explotación.

8. Gestión documental:

Se incluirá un sistema de gestión documental aplicado al proyecto censal, quepermita la recuperación de las imágenes y de los datos, de los ficheros resultadode la explotación.

Esquema de producción censal del INE

El esquema de producción censal del INE se divide en las siguiente áreas de gestión:

o Área A - Gestión de entrada / salida de la documentación censal: Esta unidad serála responsable del control de entrada / salida de la documentación censal. Se en-cargará del control y gestión de las áreas de recepción, control de la documenta-ción, almacén de entrada, almacén de salida y expedición. Realizará la preparaciónde la documentación en lotes de trabajo y su distribución para su digitalización.Una vez finalizados los procesos informáticos de producción censal, remitirá la do-cumentación al almacén de salida verificando su integridad.

o Área B - Gestión de la digitalización de la documentación censal. Esta unidad con-tará con personal experto en sistemas de digitalización que se encargarán de reali-zar una correcta digitalización de la documentación censal verificando los nivelesde calidad de las imágenes resultantes. Deberán realizar los mantenimientos pre-ventivos que se especifiquen al principio de cada jornada de trabajo y gestionaránlas incidencias producidas en el proceso de digitalización.

o Área C - Gestión del sistema de Videograbación censal. Esta unidad se encargaráde realizar la entrada de datos de los caracteres no reconocidos por el sistema in-formático censal, así como la corrección de los caracteres interpretados errónea-

Page 9: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 9

mente por el sistema. Estos procesos serán realizados mediante un sistema depresentación en pantalla de la imagen de los distintos cuestionarios censales.

o Área D- Gestión de Validación de datos censales. Será la encargada de realizar ladepuración de los datos censales una vez obtenidos los ficheros de datos corres-pondientes, control de duplicaciones, falsas altas... todo conforme al sistema deprocesamiento informático censal realizado por el INE.

o Área E - Gestión del sistema de tratamiento de los cuadernos de recorrido censa-

les. Serán los encargados de realizar la gestión del tratamiento específico que re-quiere este tipo de documento. Está conformado por personal de digitalización,control , videograbación y validación.

o Área F – Control de backup. Control del sistema de backup

o Área G - Gestión del control informático. Personal responsable de todos los proce-sos, trabajos y personas del sistema de producción censal. Deberá conocer en pro-fundidad aspectos globales del sistema y específicos de los procesos de reconoci-miento, mejora de literales, diccionarios, Videograbación... Deberá controlar todoslos procesos que se realicen a los lotes de trabajo. Deberá controlar la secuenciade los documentos, la cobertura de los lotes con los ficheros de las oficinas comar-cales y con los cuadernos de recorrido. Debe conseguir que los índices de produc-tividad, que en su momento se consideren óptimos, se cumplan.

o Área H - Gestión del control y administración, almacenamiento, comunicaciones y

seguridad física y lógica de los ficheros de imágenes y datos censales. Personalespecializado responsable de todos los sistemas y soportes de almacenamiento deimágenes y datos de la red general de producción censal del INE. También seráresponsable de la seguridad física y lógica de la información ( imágenes y datos).Se encargará también de la exportación de los datos y de las comunicaciones conotros centros censales y /o centros INE. Este personal deberá dar solución a losproblemas de carácter informático que se puedan presentar en la red general deproducción censal. Deberá conocer las aplicaciones y sistemas físicos y lógicosempleados para poder resolver las incidencias que se produzcan (ver anexo co-rrespondiente al equipamiento informático censal) . Deberá mantener y optimizarlos dispositivos físicos y lógicos para que realicen una producción conforme a losobjetivos fijados.

o Área I - Control de calidad. Deberán realizar los procesos de Videocorrección nece-sarios y en el volumen que se determine para testar que los índices de fiabilidad /eficacia del producción censal son los adecuados o por el contrario deben mejorar-se. Un lote de trabajo no será dado por bueno sin la autorización de esta unidad.

o Área J - Gestión del sistema de incidencias. Se encargará de solucionar las inci-dencias que se produzcan en relación a la documentación censal (deterioro físico,incorrectas identificaciones, control de cobertura con las oficinas comarcales...).Ante el posible deterioro físico de algunos cuestionarios, que imposibilite su co-rrecta digitalización, deberán realizar un proceso de entrada de datos tradicionalgenerando un cuestionario virtual que sustituya al dañado. Otras incidencias seránsolucionadas mediante la digitalización personalizada de cada cuestionario y suposterior proceso de Videograbación. Una vez solucionada la incidencia los cues-tionarios, imágenes y datos serán remitidos a donde se generó la incidencia parasu integración en los correspondientes lotes de trabajo.

Page 10: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 10

o Área K - Gestión del control, seguimiento y administración de la red general de

producción censal del INE. Serán los responsables de gestionar y controlar todaslas áreas especificadas anteriormente para la realización de la producción censalen los tiempos previstos y en las condiciones más óptimas. Deberán optimizar losdispositivos, sistemas... con el fin de optimizar la producción censal conforme alplan establecido. Deberán realizar el seguimiento pormenorizado de los flujos detrabajo y presentar al INE informes de los resultados obtenidos y de la planifica-ción prevista. Deberán estar en continuo contacto con la Unidad de Control del INEpara conseguir los índices de calidad que se pretenden.El trabajo finalizará una vez esté en poder del INE los ficheros de datos e imágenesde todo el Censo de Población y viviendas 2001 conforme a los índices de calidadde todos los procesos de producción.La documentación censal será almacenada y controlada por la empresa licitante enlas instalaciones que el INE determine para tal fin hasta que se determine su des-trucción.

El servicio a prestar se realizará en su totalidad en un centro puesto a disposición deladjudicatario, dotado de las condiciones de habitabilidad y seguridad requeridas paradesarrollar esta actividad, ubicado en Madrid.

Los equipamientos físicos y lógicos necesarios también serán puestos a disposicióndel adjudicatario, conforme al modelo de procesamiento establecido, que se repre-senta en los gráficos siguientes:

Page 11: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 11

Page 12: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 12

La documentación en papel se compone de los siguientes tipos de cuestionario:

• Cuadernos de Recorrido.• Hojas Padronales• Cuestionarios Censales

o Viviendao Hogaro Individual

Tipo decuestionario

Previsión delNº total de

Cuestionarios

Previsión deimágenes a

zona deDigitalización

Previsión deimágenes azona ICR 1

Previsión deimágenes a zonavideocorrección 2

Previsión del nºde imágenescompletas a

videograbación3

Padrón 13.000.000 26.000.000 15.000.000 1.500.000 150.000 Hogar 13.000.000 26.000.000 15.000.000 2.250.000 225.000 Individual 18.000.000 18.000.000 18.000.000 3.600.000 360.000 Vivienda 13.000.000 26.000.000 15.000.000 1.500.000 150.000

1 Esta previsión se refiere al número de imágenes que pueden tener algún tipo de dato no preimpreso, yque por tanto irían a zona de ICR.2 Esta previsión se refiere al número de imágenes que tendrían en algún campo datos a videocorregir.3 Esta previsión se refiere al número total de imágenes (A4 - 1 cara) que tendrían que videograbarsecompletamente. Esta cantidad es el resultante de aplicar un porcentaje previsto al dato anterior.

Page 13: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 13

Cuadernosde recorrido

40.000 4.000.000 4.000.000 400.000 40.000

Total 57.040.000 100.000.000 67.000.000 9.250.000 925.000

Tanto las hojas padronales como los cuestionarios censales tienen modelos bilingües para cadauno de los idiomas oficiales del estado. Igualmente tienen diferentes modelos según el número depersonas que componen la unidad familiar.

TIPOS DE CUESTIONARIOS CENSALES

CODIGO TIPO IMPRESIÓN MOD. CUESTIONARIO IDIOMA

0000 Personalizado Vivienda Castellano

0011 Personalizado Vivienda Bilingüe Genérico

0101 Altas Vivienda Castellano

0112 Altas Vivienda Bilingüe Genérico

0303 Personalizado Vivienda colectiva Castellano

0314 Personalizado Vivienda colectiva Bilingüe Genérico

Page 14: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 14

0404 Altas Vivienda colectiva Castellano

0415 Altas Vivienda colectiva Bilingüe Genérico

1001 Personalizado Hoja Padronal Cabecera Castellano

1012 Personalizado Hoja Padronal Cabecera Bilingüe Genérico

1102 Altas Hoja Padronal Castellano

1113 Altas Hoja Padronal Bilingüe Genérico

1304 Personalizado Hoja Padronal Castellano

1315 Personalizado Hoja Padronal Bilingüe Genérico

1405 Altas Hoja Padronal Castellano

1416 Altas Hoja Padronal Bilingüe Genérico

3003 Personalizado Cuest. Hogar cabecera Castellano

3014 Personalizado Cuest. Hogar cabecera Bilingüe Genérico

3036 Personalizado Cuest. Hogar cabecera Gallego-castellano

3047 Personalizado Cuest. Hogar cabecera Vasco-castellano

3093 Personalizado Cuest. Hogar cabecera Catalán-castellano conpreguntas adicionales

3104 Altas Cuest. Hogar cabecera Castellano

CODIGO TIPO IMPRESIÓN MOD. CUESTIONARIO IDIOMA

3115 Altas Cuest. Hogar cabecera Bilingüe Genérico

3137 Altas Cuest. Hogar cabecera Gallego-castellano

3148 Altas Cuest. Hogar cabecera Vasco-castellano

3183 Altas Cuest. Hogar cabecera Catalán-castellano conpreguntas adicionales

3306 Personalizado Cuestionario Hogar Castellano

3317 Personalizado Cuestionario Hogar Bilingüe Genérico

3339 Personalizado Cuestionario Hogar Gallego-castellano

3341 Personalizado Cuestionario Hogar Vasco-castellano

Page 15: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 15

3396 Personalizado Cuestionario Hogar Catalán-castellano conpreguntas adicionales

3407 Altas Cuest. Hogar Siguiente Castellano

3418 Altas Cuest. Hogar Siguiente Bilingüe Genérico

3431 Altas Cuest. Hogar Siguiente Gallego-castellano

3442 Altas Cuest. Hogar Siguiente Vasco-castellano

3497 Altas Cuest. Hogar Siguiente Catalán-castellano conpreguntas adicionales

4105 Altas Cuestionario Individual Castellano

4116 Altas Cuestionario Individual Gallego-castellano

En cuanto a los sistemas de digitalización principal y de digitalización incidencias, una vezrealizados pruebas con los diferentes digitalizadores del mercado, se ha determinado quela velocidad nominal de digitalización base para la digitalización deberá ser de 120 ppm.que se estima se corresponde con producciones reales con velocidades de digitalizaciónde 65 a 85 ppm. para digitalizaciones a 200 dpi.

Una producción real de 16 a 24 horas, está sujeta a incontables interrupciones, algunasprogramadas y otras no programadas.

Interrupciones programadas:

• Dentro de cada turno de trajo (8 horas) hay que dedicar 1 hora a tareas de limpiezay mantenimiento:

o Limpieza de rodillos de alimentación

o Limpieza de rodillos de arrastres

o Limpieza de los sensores ópticos

o Limpieza y revisión de lámparas

o Eliminación (aspirado) del polvo que generan los documentos.

o Limpieza de elementos ópticos

• Cada hora hay que detener el escáner para hacerle una limpieza ligera de las par-tes ópticas y una calibración.

• Cada vez que se termina de digitalizar una caja (lote), el escáner se detiene. El ope-rador deberá retirar los documentos colocarlos en las cajas, coger otra caja, e indi-car al sistema que comienza un nuevo lote.

Interrupciones no programadas:

• Atascos, cada vez que se produce un atasco del papel, hay que detener el escáner,dependiendo el tipo de atasco esta interrupción puede ser de varios minutos.

Page 16: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 16

• Doble alimentación. Cuando se produce una doble alimentación, el sistema avisaal operador y este detiene, el escáner. En esto momento hay que eliminar las pági-nas mal digitalizadas y digitalizarlas de nuevo.

• Página no identificada. El escáner debe identificar la página que esta digitalizandoutilizando para ello unos números de página impresos en los cuestionarios. Si elescáner no está totalmente seguro de la página reconocida, se detiene y el opera-dor se lo indica manualmente.

• Regmarks no identificados. Cada vez que un regmark no es identificado la páginaes rechazada por el escáner para ser digitalizada de nuevo.

• Averías del escáner.

Todo esto hace que la velocidad real de la producción oscile de los 65 a 85 documentospor minuto (duplex A4).

El número de unidades (escáneres y UPC) necesarios para cumplir el calendario derealización del trabajo en un máximo de 4 meses, requiere una producción diaria porunidad de digitalización de 62.400 cuestionarios, de lo que se deduce que es necesario unconjunto de 12 unidades de producción censal (10 UPC de hojas padronales y cuestiona-rios censales y 2 UPC para el procesamiento de los Cuadernos de Recorrido y de backupde incidencias) y 4 unidades de gestión de incidencias.

Dichos equipos de digitalización de las imágenes deberán ser de altas prestaciones, encuanto a fiabilidad, velocidad y resolución y se pondrán a disposición del adjudicatariodel servicio de operación, gestión y control del sistema integral de producción orientado ala captura y depuración de la documentación censal, a fin de asegurar que cumplen contodas las prescripciones técnicas que se exigen en el correspondiente pliego de cláusulasadministrativas y de prescripciones técnicas.

Debido al volumen de la información a capturar y habida cuenta de que este tipo deoperación es de carácter excepcional (cada 10 años en el mejor de los casos), es por loque procede la contratación de un suministro en régimen de arrendamiento de losequipos, amén de la insuficiente disponibilidad presupuestaria para financiar su adquisi-ción.

Censo por Internet y centro de atención al usuario:

A) Ideas claves:

• España es el primer país del mundo que permite la cumplimentación del Censo porInternet a todas las personas previamente empadronadas en la vivienda donde resi-den.

• La cumplimentación por Internet del Censo será totalmente confidencial y fácil derealizar, en función de procedimientos de seguridad acordes con la información acumplimentar.

• El INE agradecerá la cumplimentación por Internet del Censo mediante la entregagratuita de datos estadísticos sobre la distribución geográfica de un apellido que elinformante solicite (salvaguardando la confidencialidad estadística).

• Para cumplimentar el Censo por Internet, será necesario esperar a recibir el sobrecensal en la vivienda donde se reside y seguir las instrucciones que en él se indican.

Page 17: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 17

B) Descripción somera:

• Se trata de establecer un mecanismo que permita la cumplimentación de los cuestio-narios censales por Internet, como una posibilidad añadida al mecanismo tradicionalde recogida en papel.

• Las experiencias análogas anteriores de otros países son sólo tres y de alcance muchomas limitado que el español: Singapur ofreció la posibilidad de cumplimentar el Cen-so por Internet en el 2000 pero sólo al 20% de su población (la parte muestral de sucenso); los EE.UU. ofrecieron también esa posibilidad en su Censo del 2000 pero sóloa una parte limitada de los destinatarios de su llamado cuestionario corto y, finalmen-te, Suiza ha ofrecido la cumplimentación por Internet a aquellas comunas que subcon-traten la realización del Censo con la Oficina Federal Estadística, habiendolo hecho un60% de las comunas (la subcontratación implica un pago a la Oficina Federal) y que-dando fuera de la posibilidad de cumplimentar el Censo por Internet un 10% de lapoblación.

• Según el diseño de la operación censal española, en los cuestionarios en papel que sevan a repartir figura preimpresa determinada información individual de cada ciudada-no, obtenida de la base de datos padronales.

• Se establecerá el cuestionario censal en el servidor web seguro correspondiente,debiendo estar previsto un mecanismo de firma electrónica avanzada para que unusuario pueda modificar sus datos padronales, en el caso en que haya detectado unerror en los datos preimpresos. Si, por el contrario, considera que sus datos padrona-les preimpresos son correctos, podrá proceder a la cumplimentación del censo pro-piamente dicho por Internet, con el procedimiento de autenticación establecido.

• Brevemente descrito y sin entrar en matices ni en la totalidad de la casuística, elmecanismo de autenticación previsto se basa en: 1) el número de hueco (código iden-tificativo incluido en el cuestionario censal); 2) una clave dedicada la cumplimentaciónpor Internet (también incluida en el cuestionario censal); 3) el DNI de una de las per-sonas incluidas en el cuestionario censal (DNI también preimpreso en el cuestionario)y 4) el nombre del padre y de la madre tal y como figuran en el DNI indicado el puntoanterior (esta información no figura preimpresa en el cuestionario censal).

• Relacionado directamente con esta cuestión de la autenticación, se establecerán losprocedimientos necesarios de control de accesos incorrectos, intento de fraude, blo-queos y desbloqueos de cuestionarios, etc., según las especificaciones que se deter-minen.

• El servidor web citado deberá cumplir los requisitos sobre los idiomas a incluir(cooficiales en España y algunos extranjeros), lo que incluye la necesidad de que losficheros o las pantallas de ayuda se incorporen en dichos idiomas y que se establez-can adecuados mecanismos por omisión (de modo que en función de la configuracióndel navegador que esté utilizando el usuario se seleccione un idioma determinado).

• Se incluirá también el conjunto de normas de edición del cuestionario en formatoweb; es decir el conjunto de edits necesario para que se asegure la calidad y consis-tencia de cada uno de los cuestionarios cumplimentados por Internet, debiendo co-

Page 18: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 18

municarse al usuario que esté procediendo a la cumplimentación por Internet de cual-quier problema que impida la aceptación final de dicha cumplimentación, para que elusuario proceda a subsanar los errores correspondientes.

• Se implementará un mecanismo de "pago inmediato" al informante que cumplimenteel censo por Internet, consistente en la obtención automática e inmediata (una vezcumplimentado de forma totalmente correcta el cuestionario por Internet) de un estu-dio de frecuencias del apellido que solicite el informante (sólo uno por cuestionariocensal) a partir de los propios datos padronales, con las normas adecuadas para res-petar la confidencialidad.

• Asimismo, el sistema permitirá que el usuario pueda interrumpir su trabajo decumplimentación del cuestionario, pudiéndolo continuar posteriormente. En el mo-mento en que la cumplimentación se haya finalizado de forma totalmente correcta, elsistema deberá proporcionar al usuario determinado número que pueda actuar derecibo o de comprobante de que dicha cumplimentación completa se ha producido.

• Se implementarán los requisitos necesarios para la creación y mantenimiento de labase de datos, conteniendo los cuestionarios cumplimentados por Internet, lo queincluye la comunicación a establecer con las Oficinas Comarcales, o con las Delega-ciones Provinciales para la actualización (a partir de los datos identificativos de loscuestionarios recogidos por Internet) de sus respectivas bases locales conteniendo losdatos identificativos de los cuestionarios recogidos en papel.

• Esa comunicación con las Oficinas Comarcales considerará diferentes posibilidades:En primer lugar, y como mecanismo básico existirá un procedimiento de envío o dedescarga, de modo que cada Oficina Comarcal y cada Delegación Provincial dispondrásemanalmente de un fichero conteniendo los datos identificativos de los cuestionariosrecogidos por Internet.

• Además, existirá un servidor web de modo que la base de datos conteniendo los datosidentificativos de los cuestionarios cumplimentados por Internet será accesible y per-mitirá consultar y descargar en su caso ficheros compuestos de dichos identificativos,accediendo a la misma por Internet, aquellos usuarios autorizados tanto de las Ofici-nas Comarcales como de las Delegaciones Provinciales y Servicios Centrales, porrangos de fechas. Por último, se implementará un mecanismo para la consulta telefó-nica (automática y autorizada) de dicha base de datos, conteniendo los datos identifi-cativos de los cuestionarios cumplimentados por Internet.

• Existirá un centro de atención telefónica, incluyendo todo aquello que resulte necesa-rio para la resolución de dudas sobre la cumplimentación de un cuestionario censalpor Internet. Se incluye dentro de este centro de atención la necesidad de que se dis-ponga de la posibilidad de plantear cuestiones y resolver dudas por correo electróni-co, debiéndose los dos sistemas apoyarse entre sí para pasar del correo al teléfono demanera casi inmediata y viceversa. En este centro de atención telefónica se contem-plará la existencia del servicio en varios idiomas (según las especificaciones idiomáti-cas que se hayan establecido, de forma análoga a lo que exista en el servidor web quealoje el cuestionario). Este centro de atención telefónica será también el centro dedi-cado a la resolución de dudas para la cumplimentación del cuestionario censal enpapel.

RED DE LAS OFICINAS COMARCALES:

Page 19: INFORME TÉCNICO Resumen general del proyecto informático ... · INFORME TÉCNICO Resumen general del proyecto informático para la realización del ... como base de datos, utilizando

Resumen general del proyecto informático para la realización del Censo de Población y Viviendas 2001 11/09/2001

Instituto Nacional de Estadística 19

Im p r e s o r a

P C E .C o m a r c a l P C E .C o m a r c a l

M o d e m R T C /G S M

Las aplicaciones a explotar en la RPC son las siguientes:

• Gestión de contratación del personal eventual implicado en la operación de recogida.Incluye la generación de las certificaciones de trabajos realizados para trasladar estainformación al sistema de gestión de nóminas.

• Aplicación de gestión de la recogida de la información tanto en Delegaciones Provin-ciales como en los Servicios Centrales, en coordinación con las aplicaciones instala-das en las Oficinas Comarcales.

• Aplicaciones de depuración, imputación y generación de ficheros finales y obtenciónde resultados agregados.