GBIF
Provisión de datos a GBIF
Taller "Provisión de datos colombianos al GBIF en el marco del SIB Colombia“
Pontifica Universidad Javeriana, Bogotá, Colombia. Mayo 27-29 de 2008
Silvia Lusa GBIF.ES, Unidad de Coordinación
GBIF
1. Glosario técnico para esta charla2. Protocolos y estándares en GBIF.
• De dónde vienen• Dónde se integran (arquitectura)• Cuáles son
3. Integración tecnológica en los nodos.4. Implementación en GBIF-España
Provisión de datos a GBIF
Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia
Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.
GBIF
Glosario técnico para esta charla
• Metadatos– Conjunto de datos que definen cada uno de los recursos publicados en la red de
GBIF– Normalmente un recurso corresponde a una colección
• Estándar de datos– Perfil común de datos– Utilizado para intercambio – Darwin Core, ABCD, NCD, TCS
• Protocolo– Conjunto de reglas que van a permitir la comunicación y el transporte de datos
en la red– Utilizan estándares de datos (son capaces de reconocerlos y manejarlos)– Implementados en software – DiGIR (DiGIR provider, DiGIR portal), Biocase (Pywraper), TAPIR (TapirLink,
etc)
Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia
Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.
GBIF
Protocolos y estándares en GBIFDe dónde vienen
• GBIF adopta Estándares y Protocolos desarrollados por el Biodiversity Information Standards-TDWG
• TDWG (Taxonomic Databases Working Group) http://www.tdwg.org-Desarrolla y promueve el uso de estándares y protocolos
- Objetivo: Interoperabilidad en el intercambio de datos + evitar duplicidad de esfuerzos-Evolución de estándares y protocolos:
- adaptándose a las necesidades y nuevos retos que se plantean en el mundo de la biodiversidad
-adaptándose y haciendo uso de las nuevas soluciones tecnológicas
Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia
Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.
GBIF
Protocolos y estándares en GBIFDónde se integran.Arquitectura GBIF
GBIF
Estándares de datos en GBIF
Perfiles de datos utilizados en GBIF:
Darwin Core Darwin Core 1.2
Darwin Core 1.4
MaNIS (original)
MaNIS 1.21
Darwin Core 1.2 plus OBIS extension
ABCD ABCD 1.20
ABCD 1.48
ABCD 2.05
ABCD 2.06
Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia
Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.
GBIF
•Diseñado para facilitar el intercambio de información de datos primarios de biodiversidad a través de internet
•2001-2003 The Species Analyst (Universidad de Kansas). Desde el 2004, TDWG
•Características:
•Para datos de colecciones y datos observacionales
•Mínimo común denominador. Recopila conceptos ampliamente utilizados por diferentes disciplinas que trabajan en biodiversidad
•Información en espacio y tiempo: El qué, el cuando y el dónde
•Simplicidad (minimizando las barreras entre los proveedores de datos+maximizando la disponibilidad para los usuarios)
•Para intercambio, no para modelado de datos
•Versiones: http://wiki.tdwg.org/twiki/bin/view/DarwinCore/DarwinCoreVersions
Darwin Core
Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia
Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.
GBIF
•48 elementos no jerarquizados
•XML Schema: http://digir.net/schema/conceptual/darwin/2003/1.0/darwin2.xsd
•Estructurados en:
Identificación
Preparación y Conservación
Recolección y Notas
El cuándo
El dónde
Darwin Core 1.2
DateLastModified * InstitutionCode * CollectionCode * CatalogNumber *
ScientificName * BasisOfRecord Kingdom Phylum
Class Order Family Genus
Species Subspecies ScientificNameAuthor IdentifiedBy
YearIdentified MonthIdentified DayIdentified TypeStatus
CollectorNumber FieldNumber Collector YearCollected
MonthCollected DayCollected JulianDay TimeOfDay
ContinentOcean Country StateProvince County
Locality Longitude Latitude CoordinatePrecision
BoundingBox MinimumElevation MaximumElevation MinimumDepth
MaximumDepth Sex PreparationType IndividualCount
PreviousCatalogNumber RelationshipType RelatedCatalogItem Notes
Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia
Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.
GBIF
•Formado por un núcleo central de elementos y una serie de extensiones con información adicional (de una disciplina concreto, info extra)•Core: (46 elementos) http://rs.tdwg.org/dwc/tdwg_dw_core.xsd
Elementos a nivel de registro Elementos taxonómicos Elementos de Identificación Elementos referentes a la localidad y localización Elementos referentes al evento de recolección Elementos biológicos Elementos de referencia: ImageURL, RelatedInformation
•Extension Curacional: http://rs.tdwg.org/dwc/tdwg_dw_curatorial.xsd
•Extensión Geoespacial:http://rs.tdwg.org/dwc/tdwg_dw_geospatial.xsd
•Extensión Paleontológica
•Extensión para interacciones entre organismos•Extensión microbiológica•Extensión Observacional /Monitorazación
Darwin Core 1.4
Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia
Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.
GBIF
Protocolos de intercambio en GBIF
Protocolos de intercambio utilizados+ Estándar de datos
Biocase (Biocase Pywrapper) ABCD
DiGIR (DiGIR provider package, DiGIR prov-sourceforge)
Darwin Core
TAPIR (TapirLink, TapirDoNet, Pywrapper)
ABCD
Darwin Core 1.4
Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia
Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.
GBIF
TAPIR (TDWG Access Protocol for Information Retrieval )
• TAPIR es un protocolo para acceso a datos estructurados provenientes de bases de datos distribuidas de estructura lógica y física diferentes
• TAPIR combina las características de los protocolos BioCASe y DiGIR y amplía las posibilidades de comunicación entre aplicaciones cliente y proveedores de datos a través de Internet
• Su potencialidad permite la interoperabilidad no solo entre especimenes u observaciones si no que se puede utilizar en otros dominios (geológico, ecológico, clima, secuenciación genética, geoespacial, etc.)
• Implementaciones:– wrapper applications :
• PyWrapper (phyton)• TapirLink (0.6) (php)• TAPIRdoNet (.net)
– La primera red en implementar TAPIR: Plant Genetic Resources Community – CGIAR (Grupo Consultivo para la Investigación Agrícola Internacional ) – Generation Challenge Programme
Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia
Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.
GBIF
Integración tecnológica en los nodos
Distribuído Centralizado
ParticipantA
ParticipantC
Data Warehouse
ParticipantB
Data Warehouse
GBIFPortal
GBIFRegistry
GBIFIndex
ParticipantB
GBIF
Implementación en GBIF-España
Soporte para instalación/mantenimiento del software requerido para el proveedor de datos
DiGIR/TAPIR provider
Servicio de Alojamiento para bases de datos (futuro: + imágenes digitales)
1. Conexión del software (DiGIR/TAPIR provider) instalado en los servidores de GBIF.es a la/s base/s de datos del proveedor (MySQL, Oracle, Postgree)
2. Espacio fisico para alojamiento de archivos de bases de datos + Conexión
Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia
Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.
GBIF
Problemas técnicos Todo Correcto Sugerencias calidad de datos
Transferencia Subida por SFTP de la Base de datos. Área de pre-producción
Validacióntécnica y calidad de datos
PublicaciónBase de datos pasa al área de producción
http://data.gbif.org[http://es.mirror.gbif.org]
http://www.gbif.es/datos
[(re)Indexación]
Servicio de Alojamiento. Procesos
Reporte[Corrección demorada]
Silvia Lusa Bernal [email protected]ón de datos colombianos al GBIF en el marco del SIB Colombia
Mayo 27-29 de 2008, Pontifica Universidad Javeriana, Bogotá, Colombia.
Top Related