Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística...

17
Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC González Yanes, Jesús Alberto [email protected] Instituto Canario de Estadística (ISTAC) Resumen: El núcleo de metadatos documentales de los recursos de información estadística del ISTAC lo componen 70 metadatos organizados en los siguientes bloques. Versiones Identificadores Idiomas Clasificadores temáticos del contenido Descriptores de contenido Descriptores de clase de recurso Descriptores de producción de un recurso Descriptores de publicación de un recurso Descriptores de relaciones entre recursos Descriptores de propiedad intelectual Descriptores de interacción con los usuarios Una buena parte de los metadatos son mapeables con el estándar de metadatos documentales Dublin Core (DC) en su versión ampliada y con algunos metadatos de Data Documentation Initiative (DDI) tanto en su segunda versión como en la tercera. En la ponencia se abordará la definición y los usos del núcleo de metadatos para facilitar la gestión de los recursos y ayudar a los usuarios a la compresión de los mismos, siguiendo el principio 15 del código de buenas prácticas de las estadísticas europeas que establece que “las estadísticas europeas deberían presentarse de forma clara y comprensible, difundirse de forma adecuada y conveniente y estar disponibles, asimismo se debería permitir el acceso a las mismas de forma imparcial, con metadatos y orientación de apoyo”. Palabras clave: Difusión estadística, metadatos, Data Document Iniciative, Dublin Core, PC- Axis, SDMX.

description

Ponencia presentada en las JECAS 2010

Transcript of Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística...

Page 1: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto [email protected] Instituto Canario de Estadística (ISTAC) Resumen:

El núcleo de metadatos documentales de los recursos de información estadística del ISTAC lo componen 70 metadatos organizados en los siguientes bloques.

› Versiones › Identificadores › Idiomas › Clasificadores temáticos del contenido › Descriptores de contenido › Descriptores de clase de recurso › Descriptores de producción de un recurso › Descriptores de publicación de un recurso › Descriptores de relaciones entre recursos › Descriptores de propiedad intelectual › Descriptores de interacción con los usuarios

Una buena parte de los metadatos son mapeables con el estándar de metadatos documentales Dublin Core (DC) en su versión ampliada y con algunos metadatos de Data Documentation Initiative (DDI) tanto en su segunda versión como en la tercera.

En la ponencia se abordará la definición y los usos del núcleo de metadatos para facilitar la gestión de los recursos y ayudar a los usuarios a la compresión de los mismos, siguiendo el principio 15 del código de buenas prácticas de las estadísticas europeas que establece que “las estadísticas europeas deberían presentarse de forma clara y comprensible, difundirse de forma adecuada y conveniente y estar disponibles, asimismo se debería permitir el acceso a las mismas de forma imparcial, con metadatos y orientación de apoyo”. Palabras clave: Difusión estadística, metadatos, Data Document Iniciative, Dublin Core, PC-Axis, SDMX.

Page 2: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 2

Índice 1. LOS RECURSOS DE INFORMACIÓN ESTADÍSTICA (RIE)..............................................................3 2. LOS METADATOS SOBRE LOS RIE .................................................................................................4

Distinción entre datos y metadatos .....................................................................................................5 Metadatos sobre metadatos ................................................................................................................5 ¿Qué es y para qué sirve un sistema de metadatos estadísticos? .....................................................5 Los metadatos desde la perspectiva de sus usuarios .........................................................................6 Usuarios de datos estadísticos............................................................................................................7 Productores de datos estadísticos ......................................................................................................7 Herramientas software ........................................................................................................................7

3. EL NÚCLEO DE METADATOS DOCUMENTALES DE LOS RIE DEL ISTAC....................................7

Estándares de referencia ....................................................................................................................7 Los metadatos del núcleo....................................................................................................................7

4. EL NUCLEO DE METADATOS EN EL GESTOR DE PUBLICACIONES ESTADÍSTICAS (GPE)....13

El ciclo de vida de un RIE..................................................................................................................13 Tipo de recursos y métodos de documentación soportados por el GPE...........................................15

5. UN EJEMPLO DE USO: EL BUSCADOR WEB. ...............................................................................16 6. BIBLIOGRAFÍA BÁSICA DE REFERENCIA .....................................................................................17

Page 3: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 3

1. LOS RECURSOS DE INFORMACIÓN ESTADÍSTICA (RIE) El Núcleo de Metadatos Documentales de los Recursos de Información Estadística del ISTAC establece el conjunto de metadatos que comparten todos los resultados estadísticos de una operación estadística, independientemente de su tipo o formato. Definimos como operación estadística base al conjunto de tareas estadísticas que tienen como objetivo la obtención de resultados estadísticos inéditos y su posterior publicación. Por lo tanto, tales operaciones son las columnas sobre las que se sostiene el sistema de información estadística pública. El principal resultado de una operación estadística base es la matriz de microdatos estadísticos y a partir de los mismos, a través de métodos de agregación, se pueden obtener otros resultados que denominamos macrodatos estadísticos. Estos macrodatos los podemos clasificar en:

1. Matrices de macrodatos 2. Cubos estadísticos 3. Tablas estadísticas

Y a partir de ellos se obtienen representaciones visuales sintéticas, tales como gráficos o mapas. Una publicación estadística se constituye por la agrupación, ordenación y análisis de diversos resultados estadísticos. Y una noticia estadística no es más que una información sintética surgida de una publicación estadística y que nace con vocación de comunicación generalista. Definimos pues como recurso de información estadística tanto a los resultados estadísticos como a las publicaciones y noticias estadísticas. En definitiva, el presente documento establece el conjunto de metadatos documentales que comparten los siguientes recursos de información estadística:

Recursos estadísticos Tipo Tipo DCMI (1) Código DATASET Dataset DS DATASET > matriz de datos Dataset DSM DATASET > cubo Dataset DSC DATASET > tabla Dataset DST FIGURA Image F FIGURA > gráfico Image FG FIGURA > mapa Image FM COLECCIÓN DE DATOS Y FIGURAS Colecction P COLECCIÓN > datos detallados Colecction PDD COLECCIÓN > análisis y descripción de datos Colecction PAD NOTICIA Collecction N NOTICIA > estadística Collecction NE

Por ahora se excluyen de este núcleo de metadatos los recursos complementarios, tales como:

Recursos complementarios

Tipo Tipo DCMI (1) Código METODOLOGÍA Text M METODOLOGÍA > metodología Text MM METODOLOGÍA > recomendación metodológica Text MRM METODOLOGÍA > normativa metodológica Text MNM METODOLOGÍA > cuaderno de trabajo metodológico Text MCTM METODOLOGÍA > informe de calidad Text MIC METODOLOGÍA > cuestionario Text MC METODOLOGÍA > conceptos y definiciones Dataset, Text MCD VOCABULARIO Dataset, Text V

Page 4: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 4

VOCABULARIO > clasificación o lista de códigos Dataset, Text VCLC VOCABULARIO > tesauro Dataset, Text VCT VOCABULARIO > ontología Dataset, Text VCO INVESTIGACIÓN Text I INVESTIGACIÓN > informe de investigación Text III INVESTIGACIÓN > artículo de investigación Text IAI (1) Se pone a título referencial el tipo principal en Dublín Core. Algunos de los recursos, se podrían asociar a otros tipos.

2. LOS METADATOS SOBRE LOS RIE El Código de Buenas Prácticas de las Estadísticas Europeas en su principio número 15, sobre accesibilidad y claridad, establece que “Las estadísticas europeas deberían presentarse de forma clara y comprensible, difundirse de forma adecuada y conveniente y estar disponibles, asimismo se debería permitir el acceso a las mismas de forma imparcial, con metadatos y orientación de apoyo”. Una definición utilizada con frecuencia nos dice que los metadatos son "datos sobre datos", en general un objeto que describe o dice algo sobre otro objeto de información. De manera formal podríamos decir que un metadato es un dato que se encarga de mantener un registro sobre el significado, contexto o propósito de un objeto informativo, con la pretensión de poder descubrir, entender, extraer y administrar dicho objeto.

Figura 1. Tipos de metadatos

De acuerdo con la W3C Resource Description Framework (RDF) un recurso es un elemento abstracto que representa tanto un objeto físico (por ejemplo una persona o un libro), como un objeto conceptual (por ejemplo un color o la clase de cosas que tienen colores). Asimismo, una propiedad es un aspecto específico, característica, atributo, o relación utilizado para describir un recurso.

Un recurso específico junto con una propiedad determinada, más el valor de dicha propiedad para ese recurso es una sentencia. Estas tres partes individuales de una sentencia se denominan, respectivamente, sujeto, predicado y objeto. Por lo tanto podríamos decir que la suma de predicado y objeto nos aporta el conocimiento asociado a un recurso determinado.

PREDICADO + OBJETO = CONOCIMIENTO

Asociados a los predicados existen conjuntos de estándares que normalizan el qué se debe decir de los recursos. Entre estos estándares se encuentra el Dublin Core como propuesta generalista de documentación de recursos, o dentro del negocio estadístico nos encontramos

Page 5: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 5

con la Data Documentation Initiative (DDI) o con el Statistical Data and Metadata Documentation (SDMX). Asimismo, asociados al objeto existen vocabularios controlados tales como clasificaciones, listas de código armonizadas, tesauros u ontologías que surgen con el objetivo de facilitar la interoperabilidad semántica y la gestión automática del conocimiento. El término metadato se usa habitualmente con dos categorías semánticas:

1. Metadato como predicado: Se usa habitualmente para referirse al conjunto de propiedades de un recurso.

2. Metadato como predicado más objeto: Se usa para referirse al valor de una

propiedad que tiene un determinado recurso. Distinción entre datos y metadatos La mayoría de las veces no es posible diferenciar entre datos y metadatos. Por ejemplo, un poema es un grupo de datos, pero también puede ser un grupo de metadatos si está adjuntado a una canción que lo usa como texto. Muchas veces, los datos son tanto "datos" como "metadatos". Por ejemplo, el título de un texto es parte del texto como a la vez es un dato referente al texto (dato como metadato). Metadatos sobre metadatos Debido a que los metadatos son datos, es posible crear metadatos sobre metadatos. Aunque, a primera vista parece absurdo, los metadatos sobre metadatos pueden ser muy útiles. Por ejemplo, fusionando dos imágenes y sus metadatos distintos puede ser muy importante deducir cuál es el origen de cada grupo de metadatos, registrando ello en metadatos sobre los metadatos. ¿Qué es y para qué sirve un sistema de metadatos estadísticos? De acuerdo con la definición anterior de metadatos, podríamos afirmar que un Sistema de Metadatos Estadísticos ofrece información sobre las colecciones de objetos estadísticos y la relación entre ellos, así como sobre los procesos en los que están involucrados, describiendo cada uno de los eventos, sus componentes y cada una de las restricciones que se les aplican. Asimismo, los metadatos de la información estadística informan a los usuarios sobre los datos existentes describiendo: los conceptos, las fuentes, la calidad, su distribución, el formato, restricciones de seguridad, frecuencia de actualización, etcétera; de tal manera que sirven para describir un conjunto de datos estadísticos, contestando a las preguntas: “de qué”, “de cuándo”, “de dónde”, “de quién son”, “de dónde son” y “el cómo” se han generado los datos. Por tanto, los metadatos estadísticos constituyen la información que permite que los datos estadísticos sean bien entendidos, compartidos y explotados de manera eficaz por todo tipo de usuarios a lo largo del tiempo; y se utilizan para poder identificar, acceder y usar los datos. Los objetivos que se persiguen con la creación de los metadatos son los siguientes:

• Que se pueda buscar y encontrar los conjuntos de datos, es decir, saber qué datos existen, qué datos hay disponibles de una determinada zona y para un tema determinado, a una escala o en general con unas características específicas que el usuario demanda.

• Que se pueda valorar la calidad del conjunto de datos, valoración requerida para ser utilizado como fuente de datos en otros procesos dentro de una misma organización o para el intercambio entre organizaciones.

• Que se pueda elegir cuál es el conjunto de datos más idóneo, comparando los distintos conjuntos de datos entre sí, de modo que se pueda seleccionar cuáles cumplen los requisitos del usuario de manera óptima para el propósito que se persigue.

Page 6: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 6

• Evitar la duplicidad de trabajo, informando sobre la información existente, su ubicación y su disponibilidad.

• Facilitar la utilización de los datos, mediante la descripción de todas las características técnicas relevantes de los datos, del modo más objetivo, más amplio y completo, haciendo posible su explotación y su ayuda a los usuarios de los datos tanto en la obtención de resultados como en su mantenimiento y actualización.

Asimismo, un Sistema de Metadatos Estadísticos puede ser una herramienta que permita a una organización estadística realizar con eficacia las siguientes funciones:

• Facilitar la gestión de todas las fases de la producción estadística de los datos (colección de datos, almacenaje, evaluación y difusión).

• Planificación, diseño, puesta en ejecución de operaciones estadísticas y su evaluación.

• Gestión de actividades metodológicas.

• Gestión de la cooperación con los usuarios finales de los datos.

• Mejora de la calidad de los datos estadísticos.

• Gestión de las fuentes de datos y cooperación estadísticas con los proveedores.

• Difusión de la información estadística a los usuarios finales. Los usuarios finales necesitan metadatos fiables para buscar, navegar e interpretar. Deben haber también metadatos disponibles para facilitar el post-procesado de datos estadísticos.

• Mejorar la integración entre Sistemas de Información Estadística (autonómicos, nacionales o internacionales).

• Mejorar la integración entre Administración y Oficinas estadísticas para el intercambio de registros administrativos para fines estadísticos.

• Gestión, unificación y estandardización de los flujos de trabajo dentro de las oficinas de estadística.

• Base de conocimiento de las oficinas estadísticas que además permite compartir tal conocimiento entre el personal estadístico.

• Unificación de conceptos y de terminología estadística como vehículo para una mejor comunicación y entendimiento entre todos los agentes del Sistema de Información Estadística.

Los metadatos desde la perspectiva de sus usuarios Para describir las capacidades que potencialmente tiene un sistema de metadatos estadístico se va a mostrar las diferentes necesidades que tienen los distintos actores que utilizan este tipo de sistemas. Para ello será necesario categorizar los tipos de usuario de forma que dicha categoría nos ayude a identificar las necesidades de cada colectivo. En primer lugar se encuentran los usuarios de datos estadísticos que necesitan estos datos para analizarlos y estudiarlos, y cuyo objetivo final es obtener ciertas conclusiones que ayuden a realizar de forma efectiva sus tareas y responsabilidades. En segundo lugar están los productores de datos estadísticos que son las personas encargadas de la producción de los distintos datos estadísticos. Por último se ha incorporado un tercer tipo de usuario que son las herramientas software que se utilizan en la producción y utilización de datos estadísticos. Naturalmente, las necesidades de estas herramientas pueden derivarse directamente o indirectamente de las necesidades de los usuarios y los productores de datos estadísticos. Sin embargo, este tipo de herramientas juegan un papel tan importante que parece adecuado prestar especial atención a estas necesidades.

Page 7: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 7

Usuarios de datos estadísticos Las necesidades que un usuario de datos estadístico necesita de un sistema de información estadístico se pueden reflejar describiendo el ciclo de acciones que este tipo de usuarios realiza para llevar a cabo sus tareas. Un usuario con algún tipo de pregunta o problema busca datos estadísticos de relevancia para su problema. Una vez que los identifica, el usuario decide recuperar estos datos. Posteriormente, el usuario analiza e interpreta los datos estadísticos que ha recuperado. Posiblemente, el usuario reitera parte del proceso realizando nuevas búsquedas, recuperaciones y análisis hasta obtener los datos deseados. En cada uno de los pasos que se han descrito, el usuario de datos estadísticos necesita algún tipo de metadatos. La amplitud y profundidad de esos datos dependerán de los conocimientos previos del usuario y de los objetivos a alcanzar.

Productores de datos estadísticos Este tipo de usuarios participan en las distintas actividades definidas en un sistema de producción estadística: diseño, implementación, operación, mantenimiento, monitorización y evaluación. Todas las personas incluidas en este grupo tienen necesidades de metadatos. Un diseñador de estadísticas necesita conocer cuáles son las necesidades del usuario, cómo se han diseñado estadísticas similares en otras agencias, etc. Un proveedor que aporta datos quiere saber el propósito de la estadística y los beneficios y costes de su participación. La persona encargada de producir las estadísticas necesita saber los pasos a seguir para que el resultado sea correcto. Un auditor requiere metadatos relacionados con la funcionalidad del sistema y la retroalimentación de los usuarios.

Herramientas software Este tipo de herramientas necesitan metadatos para poder funcionar correctamente. Necesita descripciones formales de los datos que tiene que procesar; metadatos textuales que posibiliten mostrar información de interés a los usuarios de la herramienta. Además, los usuarios de las herramientas necesitan metadatos sobre la propia herramienta para saber utilizarla apropiadamente y para poder interpretar adecuadamente el resultado de los análisis.

3. EL NÚCLEO DE METADATOS DOCUMENTALES DE LOS RIE DEL ISTAC.

Estándares de referencia En la definición del núcleo de metadatos se han tenido en consideración los siguientes estándares:

1. Dublin Core¸ como estándar genérico para la documentación de recursos, en su versión extendida de elementos refinados compuesta por 40 tipos de metadatos.

2. Data Documentation Initiative (DDI), tanto en su versión 2 como en su versión 3.

3. PC-Axis, en su versión 2008.

Los metadatos del núcleo Los metadatos se agrupan en los once bloques conceptuales que enumeramos a continuación:

1. VERSION 2. IDENTIFICADORES

Page 8: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 8

3. IDIOMAS 4. CLASIFICADORES TEMÁTICOS DE CONTENIDO 5. DESCRIPTORES DE CONTENIDO 6. DESCRIPTORES DE CLASE DE RECURSO 7. DESCRIPTORES DE PRODUCCIÓN DE UN RECURSO 8. DESCRIPTORES DE PUBLICACIÓN DE UN RECURSO 9. DESCRIPTORES DE RELACIONES ENTRE RECURSOS 10. DESCRIPTORES DE PROPIEDAD INTELECTUAL 11. DESCRIPTORES DE INTERACCIÓN CON USUARIOS

Figura 2. Estándares de referencia utilizados en el diseño del núcleo

BLOQUE 1: Metadatos de versión. En este bloque se especifican los metadatos asociados a una versión de un recurso. Previamente se ha definido qué es lo que se entiende por versión, tendiendo en consideración el documento “Policy-making for Research Data in Repositories: A Guide” del que se extrae la siguiente información:

Digital data can be copied, altered or deleted very easily... This makes it very important to be able to demonstrate the authenticity of data, and to prevent unauthorised access to data for ethical, legal and quality reasons. An important related concept is that of the master file, a formalised and checked final copy of the data (or other materials), or copy at a certain stage of development (as opposed to temporary working versions of data and other files) (UKDA, 2008a).

Asimismo en el mismo documento se especifica:

Policy considerations for the deposit of multiple versions of a dataset:

• The repository uses explicit version numbers which are reflected in dataset names. • The repository records version and status e.g. draft, interim, final, internal. • The repository stores multiple copies of a dataset in different formats. • The repository keeps the original copies of data and documentation as deposited. • The repository stores supplemental digital objects with the data file/s. • The repository records relationships between items, such as ‘supercedes’ or is

superceded by’. En ese sentido, se entiende como versión una nueva realización de un recurso que modifica el contenido de la versión anterior y lo inhabilita. Por lo tanto, cuando un recurso se publica en distintos soportes no son distintas versiones, sino distintos recursos y la información sobre la relación entre ellos se debe contemplar en el bloque 9 del núcleo de metadatos. Los metadatos asociados a este bloque son los que a continuación se describen:

Page 9: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 9

› VERSION: Identificación de la versión del recurso.

› VERSION_RATIONALE_TYPE: Información sobre el tipo o la naturaleza del cambio

de versión del recurso. › VERSION_RATIONALE: Información detallada de los cambios que generan la nueva

versión del recurso. › DATE_VERSION: Fecha de modificación del recurso dando lugar a la nueva versión

del mismo. › DATE_NEXTVERSION: Fecha en la que la próxima actualización del recurso estará

disponible internamente. En ella se contempla la fecha en la que el recurso debe estar actualizado dentro del ISTAC para su posterior publicación.

› VERSION_RESPONSIBILITY: Personal responsable de la versión del recurso.

› PROC_STATUS: Estado del ciclo de vida en el que se encuentra una versión de un

recurso. BLOQUE 2: Metadatos de identificación.

› IDENTIFIER: Secuencia de caracteres usados para identificar unívocamente un recurso dentro del ISTAC.

› IDENTIFIER_UNIVERSAL: Identificador universal del recurso.

› TITLE: El nombre dado a un recurso estadístico.

› SUBTITLE: El subtítulo que complementa o especifica el título del recurso.

› TITLE_ALTERNATIVE: Cualquier alternativa al título usada para sustituir al título

formal del recurso. Puede incluir abreviaturas. BLOQUE 3: Metadatos de idiomas.

› LANGUAGE: Identificación del idioma principal del recurso.

› LANGUAGES: Idiomas utilizados en el contenido del recurso. BLOQUE 4: Metadatos de clasificación temática de contenidos

› SURVEY_CODE: Código de la operación estadística a la que se asocia el recurso.

› SURVEY_TITLE: Nombre de la operación estadística a la que se asocia el recurso.

› SURVEY_ALTERNATIVE: Acrónimo de la operación estadística a la que se asocia el recurso.

› SUBJECT_AREAS: Nombres de las áreas temáticas en la que se clasifica el

recurso, según clasificación del ISTAC, tanto las primarias como las secundarias.

Page 10: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 10

› SUBJECT_CODES: Códigos compactos de las áreas temáticas en las que se clasifica el recurso, según clasificación ISTAC, tanto la primaria como las secundarias.

BLOQUE 5: Metadatos de descripción de contenidos

› DESCRIPTION: Una descripción del contenido del recurso.

› ABSTRACT: Una resumen del contenido del recurso.

› KEYWORDS: Palabras claves que describen el recurso en las que se excluyen las espaciales y temporales. Se fomentará el uso de vocabularios controlados como el tesauro Eurovoc.

› COVERAGE_SPATIAL: En este metadato se documentan, mediante literales, las

unidades espaciales sobre las que el recurso aporta información.

› COVERAGE_SPATIAL_CODES: En este metadato se documentan, mediante códigos, las unidades espaciales sobre las que el recurso aporta información.

› COVERAGE_TEMPORAL: En este metadato se documentan, mediante literales, las

unidades temporales sobre las que el recurso aporta información.

› COVERAGE_TEMPORAL_CODES: En este metadato se documentan, mediante códigos, las unidades temporales sobre las que el recurso aporta información.

BLOQUE 6: Metadatos de descripción de clase de recurso

› TYPE: Establece la naturaleza o el género del recurso.

› FORMAT: El formato de datos de un recurso, usado para identificar el software y posiblemente el hardware que se necesitaría para mostrar el recurso. (Ver el punto DATA FILE FORMAT del documento Policy-making for Research Data in Repositories: A Guide).

› FORMAT_EXTENT: El tamaño o duración del recurso. (Ver el punto VOLUMEN AND

SIZE LIMITATIONS del documento Policy-making for Research Data in Repositories: A Guide).

BLOQUE 7: Metadatos de descripción de producción.

› CREATOR: Organización productora de la versión de un recurso.

› CONTRIBUTOR: Organizaciones que han contribuido a la producción del recurso.

› DATE_CREATED: Fecha de la creación del recurso (no de la modificación o actualización del mismo).

› LAST_UPDATE: Fecha de la última actualización de datos del recurso.

› DATE_SUBMITTED: Fecha de solicitud de publicación del recurso por parte de su

productor en el ISTAC.

› DATE_NEXTUPDATE: Fecha pública de la próxima actualización del recurso.

› UPDATE_FREQUENCY: Frecuencia con la que se actualiza un recurso.

Page 11: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 11

› RANGEDATES_VALID: Rango de fechas en el que recurso es válido oficialmente. Si

carece de validez oficial, se especifica a través del texto “Sin validez oficial”.

› CONFORMSTO: Una referencia a un estándar establecido que el recurso cumple. BLOQUE 8: Metadatos de descripción de publicación.

› PUBLISHER: Entidades responsables de la publicación del recurso.

› MEDIATOR: Entidades responsables de la puesta a disposición de un recurso. En este metadato se contempla tanto la publicación por parte del ISTAC como por parte de otras instituciones a las que el ISTAC le proporciona el recurso.

› DATE_ACCEPTED: Fecha de aceptación de un recurso para su publicación. Se

refiere a la fecha en el que el responsable de difusión acepta que un recurso en correcto para su publicación.

› DATE_ISSUED: Fecha de aceptación de la publicación formal del recurso.

› RANGEDATES_AVALIABLE: Rango de fechas en el que recurso estará o estuvo

publicado en la Web.

› AUDIENCE: Público objetivo del recurso.

› EDUCATION_LEVEL: Nivel educativo necesario para comprender el recurso.

› BIBLIOGRAPHIC_CITATION: Forma de citar el recurso. BLOQUE 9: Metadatos de relaciones entre recursos.

› SOURCE: Describe unívocamente los recursos de información, internos o externos, que se han utilizado para la elaboración del recurso actual.

Relación de coexistencia de versiones Hablamos de versiones cuando un recurso es modificado y sustituido por otro recurso. Sin embargo un recurso puede ser modificado y generar otro recurso con el que coexiste. En este caso, el recurso derivado es considerado como un nuevo recurso y en su identificación se trata como tal (por lo tanto no entra dentro de la política de versionado del ISTAC). Existen diferentes posibilidades de coexistencias de recursos que son versiones entre si, como por ejemplo un recurso en distintos idiomas o formatos. La directriz general dentro del ISTAC es evitar en lo posible generar versiones de coexistencia de recursos, pues con ello se aumenta la complejidad del mantenimiento de la coherencia de la información entre los mismos.

› ISVERSIONOF: El recurso documentado es una versión del recurso referido.

› HASVERSION: Los recursos referidos son una versión del recurso documentado. Relación de sustitución

› REPLACES: Identifica los recursos a los que sustituye el recurso descrito.

› ISREPLACEDBY: Identifica el recurso que sustituyó al recurso descrito.

Page 12: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 12

Relación de requerimiento

› REQUIRES: El recurso descrito requiere los recursos referidos para apoyar su función, entrega o la coherencia de contenido. (Estos recursos pueden ser otros recursos de información estadística, pero también pueden ser conceptos, publicaciones metodológicas, etc.)

› ISREQUIREDBY: Identifica los recursos que requieren el recurso descrito, sea física

o lógicamente Relación de parte

› HASPART: El recurso descrito incluye a los recursos referidos física o lógicamente.

› ISPARTOF: El recurso descrito es parte física o lógica del recurso referido Relación de cita

› ISREFERENCEDBY: El recurso descrito es citado por el recurso referido

› REFERENCES: El recurso descrito cita a los recursos referidos Relación de cambio de formato

› ISFORMATOF: El recurso descrito tiene el mismo contenido intelectual del recurso referido, pero está presentado en otro formato.

› HASFORMAT: El recurso descrito preexistió al recurso referido, que es

esencialmente el mismo contenido intelectual presentado en otro formato. BLOQUE 10: Metadatos de relaciones entre recursos.

› RIGHTSHOLDER: Organizaciones que poseen o gestionan los derechos sobre el recurso.

› DATE_COPYRIGHTED: Fecha de copyright del recurso.

› LICENSE: Documento legal que otorga permiso oficial para hacer algo con el

recurso.

› ACCESSRIGHTS: Información sobre quién puede acceder al recurso o una indicación sobre su seguridad. Puede incluir información respecto al acceso o restricciones basadas en la privacidad, seguridad y otras reglas.

BLOQUE 11: Metadatos de descriptores de interacción con usuarios.

› VISIT_COUNT: Número de veces en el que el recurso ha sido visitado por los usuarios.

› VISIT_TIME: Tiempo que los usuarios han dedicado a la visita de un recurso.

› VISIT_LASTDAY: Fecha de la última visita realizada por los usuarios.

Page 13: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 13

› SHARE_COUNT: Número de veces en el que el recurso ha sido compartido entre

usuarios (por ejemplo a través de funcionalidades como “enviar a”, o a través de redes sociales como facebook o agregadores de noticias como menéame).

› DOWNLOAD_COUNT: Número de veces en el que el recurso ha sido descargado o

impreso por los usuarios.

› BOOKMARK_COUNT: Número de veces en el que el recurso ha sido marcado como favorito por los usuarios en acciones tales como “Agregar a favoritos” o agregando a sitios como delicious.

› TAGS: Etiquetado por parte de usuarios.

4. EL NUCLEO DE METADATOS EN EL GESTOR DE PUBLICACIONES ESTADÍSTICAS (GPE).

El ciclo de vida de un RIE El Gestor de Publicaciones Estadísticas (GPE) es una herramienta que permite meta-informar y publicar recursos estadísticos y que tiene como resultado la integración del ciclo de vida de las últimas etapas de la producción y las etapas de la difusión estadística. En este ciclo de vida se consideran los siguientes estados en los que puede encontrarse un RIE:

Figura 3. Estados en el ciclo de vida de un RIE

FASE DE PRODUCCIÓN: Estado de producción: El RIE se encuentra en fase de producción y/o meta-documentación por parte de un técnico de ayuda a la producción o de un técnico de producción. Estado de aceptación de producción: El RIE se ha terminado de producir y documentar y se encuentra pendiente del visto bueno del técnico de producción responsable del mismo. FASE DE DIFUSIÓN:

Page 14: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 14

Estado de aceptación de publicación: Se ha solicitado la publicación del RIE y se encuentra pendiente del visto bueno del técnico de difusión responsable del mismo. Estado de publicando: Se ha aceptado la publicación del RIE y se ha programado la fecha y hora de su publicación. Estado de publicado: Se ha publicado el RIE en la Web del ISTAC. Estado de archivado: Se ha eliminado el RIE de la Web del ISTAC y se ha archivado en el gestor documental. Cuando un RIE no es aceptado tanto en la fase de producción, por parte del técnico de producción responsable del RIE, como en la fase de difusión por parte del técnico de difusión entonces dicho recurso se devuelve al estado de producción; realizándose el aviso oportuno al personal involucrado . Asimismo cuando se produce un fallo en la publicación, por ejemplo por la caída de servidores, entonces se devuelve al estado de publicando. Las fases del ciclo de vida del RIE, con sus estados e incidencias, se esquematizan en el siguiente diagrama de flujo:

Figura 4. Diagrama de flujo del ciclo de vida de un RIE

Page 15: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 15

Tipo de recursos y métodos de documentación soportados por el GPE Los recursos que en estos momentos son gestionados por el GPE son los siguientes:

1. Cubos estadísticos en formato PC-Axis 2. Publicaciones detalladas de datos, entendidas como colección de cubos PC-Axis 3. Cualquier tipo de recurso en formato PDF

La forma de carga de metadatos esta adaptada a cada formato de recurso, según las siguientes características:

1. Fichero PC-Axis: Se aprovecha la metadocumentación de estos ficheros para la carga automática de metadatos en el GPE. Asimsimo, durante las fases de gestión del ciclo de vida se cargan automáticamente otro conjunto de metadatos. El resto de ellos se cargan manualmente.

2. Publicación entendida como colección de PC-Axis: Se heredan algunos de los

metadatos de la colección de ficheros PX. Asimsimo, durante las fases de gestión del ciclo de vida se cargan automáticamente otro conjunto de metadatos. El resto de ellos se cargan manualmente.

3. Cualquier tipo de recurso en formato PDF: Se cargan manualmente todos los

metadatos requeridos y se incrustan al PDF los metadatos que faciliten a los usuarios su futura gestión. Para ello se utiliza Adobe XMP (Extensible Metadata Platform).

Adobe XMP (Extensible Metadata Platform) facilita la captura, preservación e intercambio de metadatos en distintos medios digitales y flujos de trabajos.

XMP usa XML para describir los metadatos. Dado que está diseñada para existir con cualquier formato de archivo, XMP proporciona una solución potente y flexible para gestionar de forma inteligente los medios digitales. Al ser completamente personalizable y ampliable, XMP permite que los grupos de trabajo y las organizaciones personalicen los metadatos necesarios para potenciar su producción y flujos de trabajo de publicación. Adobe XMP permite:

1. Gestionar y automatizar más eficazmente los medios al permitir que los grupos de trabajo definan los metadatos en función de sus necesidades.

2. Expresar los datos en XML, lo que permite que los usuarios y sistemas que dependen

de este lenguaje lo puedan comprender.

3. Mantener los metadatos a lo largo del curso del flujo de trabajo.

Figura 5. Pantalla del GPE de visualización de los metadatos de un RIE

Page 16: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 16

5. UN EJEMPLO DE USO: EL BUSCADOR WEB. El uso más frecuentemente mencionado sobre metadatos es la refinación de consultas en buscadores. En ese sentido, el nuevo buscador de la página Web del ISTAC (actualmente en desarrollo) aprovecha el núcleo de metadatos para facilitar a los usuarios sus búsquedas. Para ello utiliza distintos metadatos del núcleo, entre los que distinguimos los siguientes:

› TYPE: Establece la naturaleza o el género del recurso.

El buscador utiliza este metadato para filtrar automáticamente el tipo de información que busca el usuario; por ejemplo si buscas datos el buscador te permite filtrar esos recursos de otros como metodologías, cuestionarios, etc.

Asimismo, una vez seleccionado el tipo de recurso el buscador ayuda a los usuarios a restringir sus búsquedas mediante el uso de lo que se conoce como facet (facetas). Para ello se usan los siguientes metadatos:

› SURVEY_TITLE: Nombre de la operación estadística a la que se asocia el recurso. › SUBJECT_AREAS: Nombres de las áreas temáticas en la que se clasifica el

recurso, según clasificación del ISTAC, tanto las primarias como las secundarias. › COVERAGE_TEMPORAL: En este metadato se documentan, mediante literales, las

unidades temporales sobre las que el recurso aporta información. › COVERAGE_SPATIAL: En este metadato se documentan, mediante literales, las

unidades espaciales sobre las que el recurso aporta información.

Figura 6. Pantalla del buscador en el que se puede observar el uso de metadatos

Page 17: Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

Diseño y usos del núcleo de metadatos documentales de los recursos de información estadística del ISTAC

González Yanes, Jesús Alberto 17

6. BIBLIOGRAFÍA BÁSICA DE REFERENCIA DATA DOCUMENTATION INICIATIVE (2008), Technical Specification – Version 3.0. Part I: Overview. http://www.ddialliance.org/dtd/#a01 DATA DOCUMENTATION INICIATIVE (2008), Technical Specification – Version 3.0. Part II: User Guide. http://www.ddialliance.org/dtd/#a01 DATA DOCUMENTATION INICIATIVE, Technical Information -Version 2.1: Information on the DTD Elements. http://www.ddialliance.org/DDI/dtd/version2-1-tree.html DATA DOCUMENTATION INICIATIVE, Mapping DDI 2.1 – Dublin Core. http://www.ddialliance.org/related/dc.html DATA DOCUMENTATION INICIATIVE, Mapping DDI 2.1 – DDI 3.0. http://www.ddialliance.org/DDI/ddi3/mapping-spreadsheet.pdf DATA INFORMATION SPECIALISTS COMMITTEE – UK (2009), Policy-making for Research Data in Repositories: A Guide. DUBLIN CORE METADATA INICIATIVE, DCMI Type Vocabulary. http://dublincore.org/documents/dcmi-type-vocabulary/ INSTITUTO CANARIO DE ESTADÍSTICA (2009), Manual de metadatos PC-Axis. INSTITUTO CANARIO DE ESTADÍSTICA (2009), Normas básicas de premigración de tablas a PC-Axis. THE LONDON SCHOOL OF ECONOMICS AND POLITICAL SCIENCE (2008), Version Toolkit for authors, researchers and repository staff. http://www2.lse.ac.uk/library/versions/VERSIONS_Toolkit_v1_final.pdf W3C (1997), Date and Time Formats http://www.w3.org/TR/NOTE-datetime.