Francisco Pando - GBIF España Métodos y Calidad en la ...

36
Métodos y Calidad en la Digitalización de Colecciones CENPAT Puerto Madryn, Argentina 2012 Francisco Pando - GBIF España

Transcript of Francisco Pando - GBIF España Métodos y Calidad en la ...

Page 1: Francisco Pando - GBIF España Métodos y Calidad en la ...

Métodos y Calidad en la Digitalización de Colecciones

CENPAT Puerto Madryn, Argentina 2012

Francisco Pando - GBIF España

Page 2: Francisco Pando - GBIF España Métodos y Calidad en la ...

• Compartir, para qué

• Estandarizar, qué

• Estandarización, para qué

• Tipos de estándares

• Qué hay

• Qué va a haber

• Consideraciones finales

Sumario

Page 3: Francisco Pando - GBIF España Métodos y Calidad en la ...

Compartir para qué

HEYWOOD, V.H. (1974). Systematics-the stone of Sysyphus. Biol. J. Linn. Soc. 6(2): 169-178.

© The Art of Steven Nelson

Page 4: Francisco Pando - GBIF España Métodos y Calidad en la ...

Estandarizar para qué

• Estandarizar para intercambiar

• Estandarizar para utilizar

• Estandarizar no para producir

Page 5: Francisco Pando - GBIF España Métodos y Calidad en la ...

Estandarizar para intercambiar

Std

Page 6: Francisco Pando - GBIF España Métodos y Calidad en la ...

Estandarizar para utilizar

El herbario digital de México

700.000 registrosde 25 herbarios

En México y E.E.U.U.

J. Soberón, 2004

Page 7: Francisco Pando - GBIF España Métodos y Calidad en la ...

Remib

Red mundial de información sobre biodiversidad (CONABIO)

Page 8: Francisco Pando - GBIF España Métodos y Calidad en la ...

Estandarizar no para producir

Un estándar de intercambio no es una buen guía para

diseñar una base de datos

• ¿Dos sitios para el nombre científico?

• ¿Quién ha hecho la identificación?

• ¿Imágenes?

• ¿Enlaces a datos moleculares?

• ¿Datos de hábitat?

Una base de datos tiene que servir a nuestros fines primero, después viene compartir y diseminar

Page 9: Francisco Pando - GBIF España Métodos y Calidad en la ...

Tipos de estándares

• Vocabularios controlados

(léxicos)

•Que valores son válidos

•(listas de géneros,…)

• Estructurales (sintácticos)

•Como se codifica la información

•(v.gr.: DwC , ABCD)

• Definiciones (semánticos)

•para humanos, para máquinas

•(v.gr.: HISPID)

Page 10: Francisco Pando - GBIF España Métodos y Calidad en la ...

Vocabularios controlados

• ¿Dos sitios para el nombre científico?

• ¿Quien ha hecho la identificación?

• ¿Imágenes?

• ¿Enlaces a datos moleculares?

• ¿Datos de hábitat?

Page 11: Francisco Pando - GBIF España Métodos y Calidad en la ...

Estructurales (sintácticos)

Page 12: Francisco Pando - GBIF España Métodos y Calidad en la ...

Definiciones (semánticos)

Page 13: Francisco Pando - GBIF España Métodos y Calidad en la ...

Qué hay (la situación mundial)

• TDWG

“Taxonomic Databases Working Group”

--Biodiversity Information Standards—

• Ámbitos más reducidos, estándares

más ricos (estándares nacionales,

temáticos,..)

Page 14: Francisco Pando - GBIF España Métodos y Calidad en la ...

TDWG: Biodiversity Information Standards

Page 15: Francisco Pando - GBIF España Métodos y Calidad en la ...

http://www.tdwg.org/standards/

Page 16: Francisco Pando - GBIF España Métodos y Calidad en la ...
Page 17: Francisco Pando - GBIF España Métodos y Calidad en la ...
Page 18: Francisco Pando - GBIF España Métodos y Calidad en la ...

Sobre Darwin Core

Page 19: Francisco Pando - GBIF España Métodos y Calidad en la ...

Darwin Core: Términos h

ttp:/

/rs.td

wg

.org

/d

wc/te

rm

s/

Page 20: Francisco Pando - GBIF España Métodos y Calidad en la ...

DwC: múltiples versiones

Page 21: Francisco Pando - GBIF España Métodos y Calidad en la ...

Estándares temáticos y/o nacionales

http://www.rjb.csic.es/bibmaste/manu_n.html

Page 22: Francisco Pando - GBIF España Métodos y Calidad en la ...

Estándares más ricos, tambíen más restringidos

Darwin Core 1.2

Type: is the specimen a nomenclatural type or not

Estándar proyectos Flora iberica & Flora Mycologica

Iberica

Estándar TDWG & Red de datos del

GBIF

Page 23: Francisco Pando - GBIF España Métodos y Calidad en la ...

La clave: agregar o atomizar de

manera compatible

Page 24: Francisco Pando - GBIF España Métodos y Calidad en la ...

TDWG & GBIF

TDWG proporciona estándares y

comunidad de expertos para las

redes de datos del GBIF

GBIF marca la dirección y las

necesidades de desarrolladores y

usuarios

Page 25: Francisco Pando - GBIF España Métodos y Calidad en la ...

Que va a haber

• Web semántica

• Ontologías

• esquemas xml,

• triple storage

• ...

Page 26: Francisco Pando - GBIF España Métodos y Calidad en la ...

Web semántica: dónde estamos

La compatibilización entre sistemas se hace “a mano”

Page 27: Francisco Pando - GBIF España Métodos y Calidad en la ...

Web semántica: comunicar contenidos

URIs

Las definiciones de las bases de datos

se almacenan (o hacen uso) en un

sistema:

•Accesible vía Web

•Ininteligible por “maquinas”

•Relaciona conceptos, relaciones e

instancias

ontologías

Page 28: Francisco Pando - GBIF España Métodos y Calidad en la ...

Web semántica: Triple storage

URIs

Campo valor

Nmr_ejemplar 25322

genero Inga

especie alba

pais COL

Sujeto Predicado objeto

25322 genero Inga

25322 especie alba

25322 pais COL

COL Pais largo Colombia

Campo valor

Pais COL

Pais largo Colombia

Especimenes

Pais

Page 29: Francisco Pando - GBIF España Métodos y Calidad en la ...

Web semántica: ídentificadores únicos

•Identificadores únicos de objetos

•Identificadores únicos de conceptos (ontología)

Sujeto Predicado objeto

25322 genero Inga

25322 especie alba

25322 pais COL

COL Pais largo Colombia

Page 30: Francisco Pando - GBIF España Métodos y Calidad en la ...

Web semántica: Identificadores globales -> LSID

• Life Science Identifiers (LSID) son un tipo de

identificadores globales

• Facilitar comunicación e intercambio

• Más robustos que URL

• Se pueden resolver (esto es, los entienden las máquinas)

urn:lsid:esa.org:esa:26:3

namespace identifier revision authority

Ver:

Page 31: Francisco Pando - GBIF España Métodos y Calidad en la ...

Web semántica: navegar los datos como el

metro de una ciudad

lugar

•Bases de datos conectadas por ontologías y la Web

•Conseguir que podamos inferir hechos a partir de datos

distribuidos

Page 32: Francisco Pando - GBIF España Métodos y Calidad en la ...

Hacia dónde vamos

La idea es que la web funciona como un único sistema de información

Page 33: Francisco Pando - GBIF España Métodos y Calidad en la ...

Web semántica en acción:

“Linked (open) data”

• http://www.youtube.com/watch?v=uju4wT9uBIA

Page 34: Francisco Pando - GBIF España Métodos y Calidad en la ...

Estándares y web semántica

• Los estándares del TDWG son

compatibles con la Web semántica

• Resolver ontologías

• No nos libramos de los mapeos

• Resolver LSIDs

• Puede haber más de uno…

• Lo que hagamos debe tener en cuenta

el escenario de Web semántica

Page 35: Francisco Pando - GBIF España Métodos y Calidad en la ...

Consideraciones finales

• No inventar la rueda

• Es mejor un estándar

ampliamente usado que uno más

rico de menor implantación

• Un estándar de intercambio no

debe ser tomado como una norma

de implementación en un sistema

de gestión/producción

Page 36: Francisco Pando - GBIF España Métodos y Calidad en la ...

A vuestra disposición

Francisco Pando

Responsable

GBIF España, U. de Coordinación

Real Jardín Botánico-CSIC

Pza. de Murillo, 2

28014 Madrid, España

[email protected]

Tel.: + 34 91 420 3017

Fax: + 34 91 429 2405

www.gbif.es

www.gbif.org