2
Datos y metadatos
• Representación fidedigna del objeto original• Representación fidedigna de la copia digital
– Garantizar la vida del objeto digital– Descripción de los procesos realizados
• Derechos de propiedad, acceso y uso• Garantizar las funcionalidades de un sistema de
información • Transmisión de datos y metadatos• Integración de datos y metadatos en un repositorio
3
Representación del objeto original
• Descripciones bibliográficas– Marc 21 (ISO 2709) – MARC XML – MarcXchange (ISO
25577:2008)– Dublin Core sin cualificar– Dublin Core extendido– Metadata Object Description Schema (MODS)
• Funcionalidades– Presentación del objeto– Gestión y mantenimiento de colecciones digitales– Búsqueda y recuperación (SRU)– Recolección de metadatos (OAI-PMH)
4
Conversiones
MARC 21ISO 2709
MarcXchange
MODS
Dublin CoreRDF
Estructuras de metadatos
OAI_DC
MODS Schema
Variantes de expresión XML
oai_marc
MARC XML
5
6
<metadata>
<oai_marc:oai_marc xmlns:oai_marc="http://www.openarchives.org/OAI/1.1/oai_marc" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/1.1/oai_marc http://www.openarchives.org/OAI/1.1/oai_marc.xsd" status="0" type="n" level="t" ctlType="m" encLvl="0" catForm="2" lrRqrd="b">
<oai_marc:fixfield id="1">"BVPB20070010280"</oai_marc:fixfield>
<oai_marc:fixfield id="3">"BVPB"</oai_marc:fixfield>
<oai_marc:fixfield id="5">"20081021115525.0"</oai_marc:fixfield>
<oai_marc:fixfield id="8">"061031q17011800esp |||||||lat d"</oai_marc:fixfield>
<oai_marc:varfield id="35" i1="" i2="">
<oai_marc:subfield label="a">CCPB000789586-0</oai_marc:subfield>
</oai_marc:varfield>
<oai_marc:varfield id="40" i1="" i2="">
<oai_marc:subfield label="a">CCPB</oai_marc:subfield>
<oai_marc:subfield label="b">spa</oai_marc:subfield>
<oai_marc:subfield label="c">CCPB</oai_marc:subfield>
</oai_marc:varfield>
<oai_marc:varfield id="100" i1="0" i2="">
<oai_marc:subfield label="0">BVPB20070030684</oai_marc:subfield>
<oai_marc:subfield label="a">Ramon Llull</oai_marc:subfield>
7
<?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim">
<record>
<leader>00000ntm a22000002b 4500</leader>
<controlfield tag="001">BVPB20070010280</controlfield>
<controlfield tag="003">BVPB</controlfield>
<controlfield tag="005">20081021115525.0</controlfield>
<controlfield tag="008">061031q17011800esp |||||||lat d</controlfield>
<datafield tag="035" ind1=" " ind2=" ">
<subfield code="a">CCPB000789586-0</subfield>
</datafield>
<datafield tag="040" ind1=" " ind2=" ">
<subfield code="a">CCPB</subfield>
<subfield code="b">spa</subfield>
<subfield code="c">CCPB</subfield>
</datafield>
<datafield tag="100" ind1="0" ind2=" ">
<subfield code="a">Ramon Llull</subfield>
<subfield code="c">Beato</subfield>
<subfield code="d">ca. 1232-1315</subfield>
</datafield>•
8
<metadata>
<oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
<dc:type xmlns:dc="http://purl.org/dc/elements/1.1/">Book</dc:type>
<dc:language xmlns:dc="http://purl.org/dc/elements/1.1/">lat</dc:language>
<dc:title xmlns:dc="http://purl.org/dc/elements/1.1/">Dialecta seu logica nova [Manuscrito] ; De venatione medii inter subjectum et praedicatum ; De conversione subjecti et praedicati per medium</dc:title>
<dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Ramon Llull, Beato (ca. 1232-1315)</dc:creator>
<dc:date xmlns:dc="http://purl.org/dc/elements/1.1/">[S. XVIII]</dc:date>
<dc:date xmlns:dc="http://purl.org/dc/elements/1.1/">1701</dc:date>
<dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Ramon Llull</dc:creator>
<dc:identifier xmlns:dc="http://purl.org/dc/elements/1.1/">http://bvpb.mcu.es/es/consulta/registro.cmd?id=397871</dc:identifier>
<dc:identifier xmlns:dc="http://purl.org/dc/elements/1.1/">http://bvpb.mcu.es/es/catalogo_imagenes/grupo.cmd?path=11000987</dc:identifier>
<dc:format xmlns:dc="http://purl.org/dc/elements/1.1/">image/jpeg</dc:format>
</oai_dc:dc>
</metadata>
9
<?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description>
<dc:title>Boletín Oficial de la provincia de Orense Recurso electrónico</dc:title>
<dc:type>text</dc:type>
<dc:publisher>[S.l. s.n.]</dc:publisher>
<dc:date>1834-</dc:date>
<dc:language>spa</dc:language>
<dc:description>Título tomado de la cabecera</dc:description>
<dc:description>Errores de numeración</dc:description>
<dc:description>Con el inicio de cada año comienza la numeración</dc:description>
<dc:description>Algunos n. con suplementos</dc:description>
<dc:description>Copia digital</dc:description>
<dc:description>Índice anual, n. 1 (1838) de las leyes, decretos, reales órdenes y demás superiores determinaciones insertas en el Boletín Oficial de Orense desde 1 de Enero hasta fín de Noviembre del año de 1838</dc:description>
<dc:description>Índice anual general de los decretos, órdenes y demás disposiciones superiores publicadas en los Boletines en los n. 1 de los meses de Enero, Febrero, Marzo y Abril de los años 1841, 1842, 1843, 1844, 1845</dc:description>
<dc:description>Índice anual, n. 1 (1879)</dc:description>
</rdf:RDF>
10
Representación fidedigna de la copia
• Características técnicas de la copia– Garantizar la vida del objeto digital– Descripción de los procesos realizados– Derechos de propiedad, acceso y uso– Transmisión de datos y metadatos
• MIX (Metadata for Still Images in XML) • textMD Technical Metadata for Text
11
Metadata for Still Images in XML
• MIX expresa– Tamaño del fichero– Formato y versión del mismo (TIFF 6.0, JPEG 2000)– Orden de bytes– Compresión (CCITT, LZW, JPEG 2000 lossless)– Ratio de compresión– Fijeza (Algoritmo, Algoritmo original)– Características de la imagen (altura, anchura, color, perfil de
color, etc.) – http://www.loc.gov/standards/mix/
12
textMD: Metadatos técnicos para textos
• textMD expresa– Aspectos técnicos de la generación de un texto, p.e.,
software y hardware utilizado en la obtención de OCR, procesador de texto
– Juego de caracteres– Idioma– Tipos y tamaños– Lenguaje de marcado– Software para impresión y/o visualización– http://www.loc.gov/standards/textMD/
13
METSRights: Derechos de propiedad, acceso y uso
• METSRights expresa– Derechos asociados a una copia digital o a sus
componentes– Identificación del propietario de los derechos– Circunstancias asociadas a permisos y restricciones (p.e.,
acceso a grupos determinados)– Categorías de derechos (dominio público, copyright,
licencia, contrato, etc.)– Permisos (localizar, mostrar, copiar, duplicar, modificar,
imprimir)
14
El ciclo de vida de un objeto digital
• Registro de cambios producidos en un objeto digital a lo largo de su ciclo de vida– Digitalización – Retoque y mejora de imágenes – Reconocimiento óptico de caracteres– Validación
• JHOVE - JSTOR/Harvard Object Validation Environment
• http://hul.harvard.edu/jhove/ – Conversión (migración) de un formato a otro– Agente que realiza el proceso– Fecha en la que se realiza el proceso– Software y hardware utilizado
15
<premis:event>
<premis:eventIdentifier>
<premis:eventIdentifierType>NULREPOS</premis:eventIdentifierType>
<premis:eventIdentifierValue>inu-event-00006</premis:eventIdentifierValue>
</premis:eventIdentifier>
<premis:eventType>conversion-to-jpeg2000</premis:eventType>
<premis:eventDateTime>2006-04-04</premis:eventDateTime>
<premis:eventDetail>Migrate TIFF to JPEG2000</premis:eventDetail>
<premis:linkingAgentIdentifier>
<premis:linkingAgentIdentifierType>lcnaf</premis:linkingAgentIdentifierType>
<premis:linkingAgentIdentifierValue>Northwestern University, University Library, Digital Library Systems Development</premis:linkingAgentIdentifierValue>
</premis:linkingAgentIdentifier>
<premis:linkingObjectIdentifier>
<premis:linkingObjectIdentifierType>NULREPOS</premis:linkingObjectIdentifierType>
<premis:linkingObjectIdentifierValue>inu-afmp-g8850_1729_a5_FG7</premis:linkingObjectIdentifierValue>
</premis:linkingObjectIdentifier>
</premis:event>
16
Transmisión de datos y metadatos
– Metadatos descriptivos– Metadatos administrativos
• Metadatos técnicos (MIX, textMD)• Metadatos de propiedad intelectual (METSRights)• Metadatos de procedencia de un objeto digital
– Relación de ficheros (una copia, varias versiones…)– Estructura de los ficheros– Comportamientos
• Metadata Encoding & Transmission Standard (METS)• Preservation Metadata Implementation Strategies
(PREMIS)
17
Metadatos descriptivos
Metadatos Administrativos
Relación de ficheros
Comportamiento
MARC 21
DC MODS
MIX, textMD
METSRights
METS Extensiones METS
PREMIS
DIGIPROV
Objetos
Eventos
Agentes
Derechos
PREMIS
18
Distintas formas de expresar los mismos datos
– PREMIS <event>– METS <digiprov>
– PREMIS
– METS– PREMIS encapsulados en METS – Metadatos técnicos encapsulados en PREMIS
– Perfiles de METS– http://www.loc.gov/standards/mets/mets-profiles.html
19
20
METS
21
Datos y metadatos
• Representación fidedigna del objeto original• Representación fidedigna de la copia• Garantizar la vida del objeto digital• Descripción de los procesos realizados• Derechos de propiedad, acceso y uso• Transmisión de datos y metadatos• Integración de datos y metadatos en un repositorio• Garantizar las funcionalidades de un sistema de
información