Interoperabilidad en Repositorios Institucionales

48
Interoperabilidad en Repositorios Institucionales Emiliano Marmonti [email protected] / http://emarmonti.com III Encuentro de desarrolladores de las Redes BVS y asociadas. 11 de Octubre de 2012

description

Algunos de los aspectos de interoperabilidad en repositorios institucionales: Protocolos, tecnologías, su conexión con la web semántica y linked open data.

Transcript of Interoperabilidad en Repositorios Institucionales

Page 1: Interoperabilidad en Repositorios Institucionales

Interoperabilidad en Repositorios Institucionales

Emiliano [email protected] / http://emarmonti.com

III Encuentro de desarrolladores de las Redes BVS y asociadas. 11 de Octubre de 2012

Page 2: Interoperabilidad en Repositorios Institucionales

Atributos de los RI.

• Institucionalmente definido.– Oficialmente reconocidos. Depósito

compulsivo.• Científica o académicamente orientado.

– Cubran las áreas de conocimiento de la institución.

• Acumulativo y perpetuo.– Preservación.

• Abierto e interoperable.

– Máxima difusión a través de la colecta. Armonizar derechos de autor.

Page 3: Interoperabilidad en Repositorios Institucionales

Repositorios de acceso abierto

Gestionan, centralizan, facilitan el acceso y preservan sus contenidos.

Los Repositorios de Acceso Abierto, cuyo nombre ha ido en aumento, son un componente importante de la infraestructura de e-investigación. El valor real de los repositorios recae en el potencial de interconexión para crear una red de repositorios, una red que puede proveer un acceso unificado a los resultados de la investigación y son (re-) utilizados por las máquinas y los investigadores.

COAR, 2011

Page 4: Interoperabilidad en Repositorios Institucionales

Tipos de Repositorios

• Repositorio Temático (Subject-based)

– Colaboran varias instituciones.

– Subdivisiones o colecciones por temas, división geográfica o institucional.

– Puede ser multitemático (caso arxiv.org)

• Repositorio Institucional.

– Institucionalmente definido / Oficialmente reconocidos

– Abarcan la áreas de conocimiento de la institución

• Para tipos específicos de material

– Tesis y disertaciones.

– De Datos Básicos insumo de investigaciones científicas

Page 5: Interoperabilidad en Repositorios Institucionales
Page 6: Interoperabilidad en Repositorios Institucionales
Page 7: Interoperabilidad en Repositorios Institucionales
Page 8: Interoperabilidad en Repositorios Institucionales

Repositorios de Acceso Abierto. Interoperabilidad

“…La interoperabilidad se define como la capacidad de intercambiar y compartir datos entre dos sistemas o componentes informáticos sin la intervención de un tercer sistema, de modo que la información o datos compartidos puedan ser utilizados sin requerir una comunicación previa…”

15 niveles!

• Sintáctica• Semántica• Técnica / Estructural• Pragmática• Organizacional• Conceptual• Dinámica• Legal• Social• Esquemática o Estructural• Intracomunitaria• Política-Humana• Internacional• Empírica y Física

The Police InformationTechnology Organisation añade a la definición de interoperabilidad, la capacidad de proporcionar o recibir servicios de otros sistemas

Page 9: Interoperabilidad en Repositorios Institucionales

Areas de servicios que aprovechan interoperabilidad en Repositorios

Institucionales

Interoperabilidad de Repositorios

Cosecha de

metadatos

CosechaObjetos Digitales

compuestos

Identificadorespersistentes Identificación

Unificada de los autores

Autoarchivo“out-of-the-box”

Estadísticas de uso

Conformación de redes de repositorios

Basado en draft grupo de trabajo interoperabilidad COAR

Page 10: Interoperabilidad en Repositorios Institucionales

Interoperabilidad Técnica. Protocolo SWORD.

Simple Web-service Offering Repository Deposit

• Especificación abierta que indica como realizar depósitos en RI y tecnologías similares.

• Creado por las siguientes razones:

– Facilitar la interoperabilidad entre las aplicaciones.– Simplificar el proceso de identificación, hallar la opción

apropiada de contribución, colocación de metadatos mínimos.

– Intentar dotar a las herramientas comunes usadas por el usuario para la creación de materiales digitales, las capacidades de contribución con los RI.

– Actualmente en versión 2.0

Page 11: Interoperabilidad en Repositorios Institucionales

SWORD use cases

• Deposit by lab equipment

http://www.slideshare.net/swordapp/module-2-sword-use-cases

Page 12: Interoperabilidad en Repositorios Institucionales

SWORD use cases

• Repository to repository deposit

Institutional repository National repository

http://www.slideshare.net/swordapp/module-2-sword-use-cases

Page 13: Interoperabilidad en Repositorios Institucionales

SWORD use cases

• Publishing system / publisher to repository deposit

Publishing system (e.g. OJS) Long term storage repository

http://www.slideshare.net/swordapp/module-2-sword-use-cases

Page 14: Interoperabilidad en Repositorios Institucionales

SWORD use cases (me permito agregar)

• Plataformas de E-learning (ex.Moodle)

Moodle Long term storage repository

Page 15: Interoperabilidad en Repositorios Institucionales
Page 16: Interoperabilidad en Repositorios Institucionales
Page 17: Interoperabilidad en Repositorios Institucionales

Desde MS-Word

Page 18: Interoperabilidad en Repositorios Institucionales

Interoperabilidad Sintáctica y Semántica. Metadatos

“Los metadatos o datos representacionales son definidos como el dato sobre los datos,es un conjunto de elementos que poseen una semántica comúnmente aceptada, o sea tratan de representar la información electrónica tan dispersa y representan a la descripción bibliográfica de recursos electrónicos”

Rosa San Segundo Manuel

“Es un conjunto de atributos de catalogación de los documentos que permiten su identificación sin tener que ejecutarlos”

Ana Pavani

Page 19: Interoperabilidad en Repositorios Institucionales

Esquemas de METADATOS -

¿Cuáles existen?¿Para que se usan?

Cs de la SaludHCE / HL7

FotografíaExif / Picasa

Videos / Caso HTML 5

Contenidos Educativos

LOM / IEEE 1484.12.1:2002

De propósito general

Dublin Core, QDCMODS

MicroformatosFOAF

DOACDescription of a Career

Ciencias AgrariasAgris XML

ODRL

Datos BiológicosDarwin Core

ArchivoMETS/AIP

DataCiteMS

Page 20: Interoperabilidad en Repositorios Institucionales

OAI-PMH. Interoperabilidad Técnica

Es un protocolo que permite el intercambio de información referencial (OAI-PMH) texto completo / objeto digital (OAI-ORE / DIDL) acerca de recursos de información libremente disponibles a través de la web.

RI 1 RI 2 RI 3Mi servidor

Harvesting (cosechar)

Funciona usando el protocolo http y devuelve resultados en XML. Puede devolver las referencias en los distintos tipos de metadato admitidos por el servidor

No hay búsqueda completaNo hay búsqueda completa

BúsquedaBúsqueda

Datos & admision protocolo

Page 21: Interoperabilidad en Repositorios Institucionales

Iniciativa Open Archives. Conceptos.

Page 22: Interoperabilidad en Repositorios Institucionales

¿Como es un “registro” OAI?

<dc:title>Limits on the cosmological abundance of supermassive compact objects from a millilensing search in gamma-ray burst data</dc:title> <dc:creator>Nemiroff, Robert J.</dc:creator> <dc:creator>Marani, Gabriela F.</dc:creator> <dc:creator>Norris, Jay P.</dc:creator> <dc:creator>Bonnell, Jerry T.</dc:creator> <dc:description> A new search for the gravitational lens effects of a significant cosmologicaldensity of supermassive compact objects (SCOs) on gamma-ray bursts has yielded...</dc:description> <dc:description>Comment: 14 pages including 3 figures, appeared 2001 January 22</dc:description> <dc:date>2001-01-26</dc:date> <dc:type>text</dc:type>

<dc:identifier>http://arXiv.org/abs/astroph/0101488</dc:identifier>

<dc:identifier>Phys.Rev.Lett. 86 (2001) 580</dc:identifier> </oai_dc:dc></metadata>

Datos para consulta

Datos para acceder al recurso digital

Se puede probar con la URL: http://arxiv.org/oai2?verb=ListRecords&from=2004-06-16&metadataPrefix=oai_dc

Page 23: Interoperabilidad en Repositorios Institucionales

Directrices. ¿Que misión cumplen y cuales existen?

• Un conjunto de “mejores prácticas” para cubrir las interpretaciones que pueden darse a los estándares de interoperabilidad.

– Se cubren dos capas de interoperabilidad (sintáctica en el uso de OAI-PMH y OAI_DC) y semántica, en el uso de vocabularios.

– DRIVER 2.0, OpenAire 1.0, BDCol, SNRD, etc.

• Sirven de orientación a las instituciones que cuentan con un Repositorio o estén el proceso de implementarlo y deseen ofrecer su contenido.

• Permitirá la normalización y estandarización en los metadatos, facilitando la recuperación y ubicación de la producción científica de su institución

Tomado parcialmente de BDCOL y DRIVER

Page 24: Interoperabilidad en Repositorios Institucionales

Directrices. ¿Que misión cumplen y cuales existen?

• DRIVER 2.0. Abarcan desde la demarcación de los metadatos obligatorios, el uso y ejemplos recomendados sobre OAI_DC, recomendaciones para el buen uso del protocolo OAI-PMH, la inclusión de prefijos semánticos para valores controlados como los aplicables a dc:type y dc:rights. Puede aplicar sobre oai_dc y sobre DIDL.

• OpenAire 1.0. Directrices que representan la evolución de DRIVER, entrando en consideración aspectos tales como la fecha de liberación de embargo de los documentos, se incluye información específica para la CEE que permite relacionar los proyectos de investigación de la comunidad económica europea con la información almacenada en los Repositorios Institucionales.

Page 25: Interoperabilidad en Repositorios Institucionales

Directrices. ¿Que misión cumplen y cuales existen?

• Argentina. Directrices MINCyT-SNRD.100% compatibles con DRIVER y OpenAire.

• Colombia. Directrices BDCol. Basadas en DRIVER.

• Otros países de la región: Adhieren por lo general a DRIVER.

Page 26: Interoperabilidad en Repositorios Institucionales

Servicios centralizados. Conformación de Redes de

Repositorios

Como una de las aplicaciones de las características de interoperabilidad de los Repositorios, los servicios centralizados consumen la información de los mismos brindando una interfaz única de acceso para el usuario final.

• Cosechadores• Agregadores• Repositorios centralizados

Page 27: Interoperabilidad en Repositorios Institucionales
Page 28: Interoperabilidad en Repositorios Institucionales
Page 29: Interoperabilidad en Repositorios Institucionales

Ayuda para la interoperabilidad.Validador

de directrices• Validará aspectos de interoperabilidad

estructural o técnica relacionados con el cumplimiento del protocolo OAI-PMH y de las directrices DRIVER o SNRD o OpenAire.

• Validará la existencia de metadatos obligatorios definidos por las directrices.

• Validará algunos aspectos de interoperabilidad semántica tales como vocabularios para los tipos de material, estándar ISO para los idiomas y las fechas, verificación de las URLs indicadas como destino del objeto digital y otras.

Herramienta destinada a facilitar a los RI aplicar para integrar las redes

Page 30: Interoperabilidad en Repositorios Institucionales
Page 31: Interoperabilidad en Repositorios Institucionales
Page 32: Interoperabilidad en Repositorios Institucionales
Page 33: Interoperabilidad en Repositorios Institucionales
Page 34: Interoperabilidad en Repositorios Institucionales

About this Initiative:DataCite is an international organisation founded in 2009 which promotes the use of Digital Object Identifiers (DOIs) for published datasets in order to establish easier access to research data, to increase acceptance of research data as legitimate contributions in the scholarly record, and to support data archiving to permit results to be verified and re-purposed for future study.

Applications of DataCite:DataCite works with data centres around the world to assign persistent identifiers to datasets. Through this work, DataCite is developing an infrastructure that supports simple and effective methods for data citation, discovery, and access, as well as for linking datasets to other related research outputs such as research articles. Citable datasets become contributions to scholarly communication, paving the way for new metrics and publication models that recognise and reward data sharing.

DataCite

Define un schema de metadatos para datasets

http://schema.datacite.org/meta/kernel-2.2/index.html

Page 35: Interoperabilidad en Repositorios Institucionales
Page 36: Interoperabilidad en Repositorios Institucionales

Situación de la Región en relación a los

Repositorios de acceso abierto

Page 37: Interoperabilidad en Repositorios Institucionales

Comparativo región con “mapa-mundi”

No tomar como único indicador número de Repositorios

Page 38: Interoperabilidad en Repositorios Institucionales

Situación en América Latina en relación a los Repositorios

Institucionales. Redes Regionales

Red Regional de Repositorios “La Referencia”

– El proyecto surge de RedClara, OUI Financiado por un proyecto BID.– Creada para generar una estrategia Regional, Marco de acuerdos y

Políticas comunes para la interoperabilidad y la gestión de la información científica, un Modelo Operativo desarrollado en torno al Piloto de la red federada de repositorios en la región y Una estrategia de Capacitación regional.

– Estándar de interoperabilidad:directrices DRIVER. 4 tipos documentales.

– Hasta el momento 9 países (Argentina, Brasil, Chile, Colombia, Ecuador, México, Perú, Venezuela y El Salvador).

– Interacción con otras redes, tales como COLABORA. Comunidad Latinoamericana de Bibliotecas y Repositorios Digitales.

http://lareferencia.redclara.net

Page 39: Interoperabilidad en Repositorios Institucionales

Redondeando.Protocolos de Interoperabilidad habitualmente

soportados por las plataformas más comunes de RI

Solo algunos… y dependiendo de la plataforma…

• OAI-PMH• OAI-ORE• SWORD• Open Search• RSS Channels• APIs de Webservices accesibles a través de REST, http o SOAP (Ex: DSpace-API)• Protocolos de autenticación tales como los usados por LDAP, Shibboleth• PIRUS, SURE, Estadísticas de uso

Aplicaciones de estos protocolos• Servicios centralizados • Front-ends Drupal Islandora, WordPress• Ingesta automatizada a partir de instrumentos de medición• Single Sign On

Page 40: Interoperabilidad en Repositorios Institucionales

RaaS.¿Quien dijo que los RI debían tener

interface?

Aplicaciones que consumen/proveen del RI

CMSRedes y SCent

Browserusuario

Layer de Servicios expuestos por parte del RI

Aplicación Auth global

RSS / OAI / REST

SWORDOAI-PMH / OAI-ORE

Virtual Research

Environment

AplicaciónAdministradora Datos Básicos

Open Search

Shibbolet

RI Core

SOAP

Amazon EC2U otra inf de almacenamiento cloud

PortalAd-Hoc

Colección Específica

RI(Ej: mobile

e-health portal)

OAI-PMH / REST auth

SWORD

Page 41: Interoperabilidad en Repositorios Institucionales

Ultima parada de Interoperabilidad. Web semántica y los Repositorios

InstitucionalesAsistimos a diario a iniciativas importantes que se

desarrollan en paralelo.

– Open Data: Las organizaciones (principalmente gubernamentales) se hallan en el proceso de publicar los datos que generan con la finalidad de posibilitar nuevos servicios y aplicaciones a partir de ellos. Un ejemplo: Periodismo basado en datos.

– Muchas de estas iniciativas liberan sus datos en formatos tales como CSV, texto plano, XML.

– En estos portales comienza a tomar relevancia la utilidad / necesidad de publicar sus instancias de datasets bajo los 4 principios de Linked Open Data (URIS para dataset propio, http, RDF, linkear con otras URIs de datasets externos).

– Se comienza a trabajar con nuevas tecnologías tales como endpoints SPARQL en implementaciones reales de la Web Of Data o Web Semántica.

Page 42: Interoperabilidad en Repositorios Institucionales
Page 43: Interoperabilidad en Repositorios Institucionales

Evolución del Data-Cloud

Page 44: Interoperabilidad en Repositorios Institucionales
Page 45: Interoperabilidad en Repositorios Institucionales

Un ejemplo (hipótético) posible aplicable a los RI. Linked

Open Data

Registro OAI con

esteroides RDF(Artículo)

Datos académicos de

sus autores (ej: CV)Proyectos de investigación financiados

en una disciplina

BDDTerminológica

Específica

RDF

RDF

RDF

Patentespara esa disciplinaDatos geoespaciales

Datos Básicos insumo

o productoInvestigación

Repositorios de datos

RDF

Page 46: Interoperabilidad en Repositorios Institucionales

Conclusiones • Las plataformas de RI son una de las herramientas que permiten

implementar Políticas de Acceso Abierto para la producción intelectual de las instituciones (OJS, CMSs comunes,etc)

• La ventaja de las plataformas de RI, consiste en que avanzan permanentemente en el soporte y perfeccionamiento de protocolos de interoperabilidad. Ex: DSpace 3.0 incorpora grandes mejoras en procesos selectivos de exposicion de metadatos OAI-PMH, permite incluso realizar colecciones virtuales producto de cosecha de otros RIs.

• El Repositorio Institucional tiende a ser una plataforma no-visible con diferentes “caras” que consumen sus servicios. Estas fachadas se implementan con herramientas comunes tales como plataformas de CMSs, aprovechando los protocolos de interoperabilidad.

• En el ámbito científico, las plataformas de e-research serán productoras/consumidoras de los recursos del RI. En el ámbito académico las plataformas virtuales de aprendizaje, serán productoras/consumidoras de sus contenidos.

• En base a los protocolos de interoperabilidad, es posible brindar servicios centralizados especializados y/o temáticos en función de contribuir con la misión de los repositorios en relación a difundir sus contenidos. Buscadores verticales calificados.

Page 47: Interoperabilidad en Repositorios Institucionales

Conclusiones (II)

• La interoperabilidad sintáctica y semántica en relación a los metadatos es el gran desafío de los servicios centralizados.

• Las directrices internacionales vienen a homogeneizar y dar real valor a la interoperabilidad de las plataformas. Las directrices son un servicio directo (aunque no lo parezca) al usuario final. Los servicios de validación ayudan a los gestores de repositorios no solo a ser interoperables, sino a homogeneizar y unificar criterios intra-repositorio.

• En el universo de la web-semántica existe una enorme oportunidad para los RI. Las posibilidades de conexión entre los metadatos con diferentes endpoints SPARQL haría enormemente mas rica la información que es presentada al usuario final.

• En la región se están conformando redes nacionales de repositorios institucionales, realizando esfuerzos en tiempo y recursos en acordar criterios, disponer recursos tecnológicos y generar comunidades en función de elevar los propósitos originales de los RI hacia la región: Liberar, difundir y preservar la producción de conocimientos.

Page 48: Interoperabilidad en Repositorios Institucionales

¿Preguntas?

III Encuentro de desarrolladores de las Redes BVS y asociadas11 de Octubre de 2012

Emiliano [email protected] / http://emarmonti.com