Taller de informatización de colecciones botánicas Valencia Septiembre 2003.
-
Upload
suelo-lascano -
Category
Documents
-
view
8 -
download
1
Transcript of Taller de informatización de colecciones botánicas Valencia Septiembre 2003.
Taller de informatización de colecciones botánicas
Valencia
Septiembre 2003
Objetivos del taller
Adquieran los conocimientos sobre las iniciativas internacionales y nacionales sobre información en biodiversidad que les permita participar en las mismas de manera efectiva y adecuada a sus interesesComprendan el significado del uso de la informática en Botánica, y en general en estudios de BiodiversidadSean capaces de informatizar, gestionar y consultar las colecciones de manera autónoma, utilizando el programa HERBARAdquieran los conocimientos suficientes para abordar proyectos sencillos y para solucionar problemas específicosSean capaces de distinguir un diseño de estructura de datos adecuado de uno que no lo es tanto
1ª sesión: guión
El panorama de la Información en Biodiversidad: CBD, GBIF, ENBI, GBIF GBIF.ES
Las piedras angulares de la información en Biodiversidad: Ejemplares y taxonomía
Base de datos: definición y conceptos
Informatización de colecciones: una visión general
Introducción al programa Herbar: filosofía, estructura, funciones, requerimientos, conectividad
El panorama mundial de la Información en Biodiversidad
CBD GBIF ENBI
CBD: Convention on Biological Diversity
“To promote nature and human well-being”Objetivos:
the conservation of biological diversity, the sustainable use of its components, and the fair and equitable sharing of the benefits from
the use of genetic resources. Relación con el GBIF: include facilitating the development and implementation of approaches, technologies and best practices that will be necessary to access, share and disseminate biodiversity data at the species, ecosystem and genetic levels via the Internet
¿Que es GBIF?
Es una iniciativa internacional a 10 años vista para poner toda la información disponible sobre los organismos vivos conocidos a nivel mundial accesible por Internet (se ha hablado de GBIF como el proyecto “genoma humano de la biodiversidad”). A instancias de la OCDE (1996, MegaScience Forum) Los miembros ordinarios de GBIF son estados Además de pagar, los estados miembros se comprometen a montar un nodo nacional que –entre otras cosas-- será portal de esta información
Global Biodiversity Information Facility
Infraestructura Mundial de Información en Biodiversidad
•Junio de 1999: el Consejo de Ministros de la OCDE acuerda crear GBIF
•Marzo del 2001: GBIF nace oficialmente
•2002: La Secretaría Mundial del GBIF se instala en Copenague
•2003: Primer plan de trabajo anual de GBIF y primeras convocatorias de proyectos y contratos
Breve historia de GBIF
• Países con derecho a voto: 23
• Países asociados (sin voto): 14
• Organizaciones asociadas: 18
http://www.gbif.org/GBIF_org/
participation
Participación en GBIFParticipación en GBIF
“Memorandum of Understanding”; participación sujeta a :
•Contribuir a través de un nodo
•Pagar cuota anual
Organización de GBIFUn Órgano de Gobierno donde están representados todos los países miembros y organismos internacionales asociados.
Una Secretaría Internacional, en Copenague, donde se coordinan las actividades del GBIF y se proporciona apoyo a los Nodos Participantes.
Los Nodos Participantes, establecidos por los países miembros de GBIF y que son los encargados de realizar el grueso de trabajo para hacer realidad los objetivos de GBIF.
www.gbif.net
Hacer disponible, de modo gratuito y general, todos los datos sobre la biodiversidad mundial:
Creando una federación de bases de datos a nivel mundial
Garantizando la ínter-operabilidad entre bases de datos de especies y especímenes y otros tipos de datos sobre biodiversidad
Contribuyendo a la formación de personal para facilitar el acceso y uso de la información
Promoviendo en cada nación participante la creación de un nodo nacional
GBIF, sus objetivos
Principios que rigen GBIF
Los proveedores de datos retienen el control sobre los mismosDiseño a largo plazo, no centralizado y basado en arquitecturas abiertasComplementar sin duplicar redes establecidas
Prioridades de GBIF
Dar primacía al nivel de organismos sobre el ecológico o el genético.Empezar por las colecciones. Los cuatro programas ahora en marcha de GBIF son:
a. Informatización de colecciones de historia natural
b. Tecnología e interoperabilidadc. Catálogo de nombresd. Formación y cooperación
El catálogo electrónico de nombres de organismos conocidos para la ciencia, posibilitará el enlace entre muchos tipos de bases de datos biológicas y no biológicas
ECAT debe servir para interpretar distintos niveles de complejidad: identificaciones, nombres, sinónimos, táxones
ECAT es la herramienta que hace accesible la información taxonómica al no especialista
Diferentes ECATs según los casos
Catálogo Catálogo Electrónico de Electrónico de Nombres (ECAT)Nombres (ECAT)
Mantenimiento y control de las bases de datos queda en manos de sus propietarios
Puede quedar reservado el derecho de bloquear el acceso a determinados datos
La información de las bases de datos afiliadas a GBIF es de dominio público
Se reconocerá expresamente la fuente de los datos
“Los proveedores de datos retienen el control sobre los mismos”
Gobius cruentatus
Nodo Español de GBIF
Museo Nacional
de Ciencias Naturales
Real Jardín Botánico
Pronto: www.gbif.es
BOE 12 de Julio de 2002: resolución del MCYT por la que se “encomienda al CSIC la gestión científico técnica del Nodo Nacional de GBIF.
La Ministra de Ciencia y Tecnología firmó el 26 de febrero de 2001 el «Memorando de Entendimiento» entre el MCYT y el GBIF España se compromete compartir sus datos de bio diversidad con el nodo central del GBIF, con sede en Copenhague (Dinamarca) y a organizar y mantener un «Nodo Nacional de Información en Biodiversidad»
El Nodo comienza su andadura el 2 de junio de 2003
Nodo Español de GBIF
Red de bases de datos (centros, proyectos, departamentos, individuos) con una unidad de coordinación Sistema distribuido de bases de datos Financiación: por una parte se dota la unidad de coordinación y por otra se abre una línea de acciones especiales
El sistema de información del nodo español del GBIF está integrado por una Unidad de Coordinación (UC) y por una federación de bases de datos integrada por los Centros Asociados a la Red (CAR)
Bases de datos locales de las colecciones
Consultas y Resultados
Portal de GBIF
Usuario
Resultados combinados Consulta
Contribución europea a GBIF Red temática
Énfasis en comunicar, reunir cooperar, colaborar, formar, pero no en investigación ni en informatización
Para todos los “actores” de la información en biodiversidad en Europa, coleciones, centros departamentos, asociaciones)65 participantes, 12 paquetes de trabajo, 3 años, 3M €Ha empezado el 1 de enero del 20031ª reunión: Bruselas, marzo 20031ª conferencia electrónica ahora en curso
Más información:http://www.enbi.info
European Network on Biodiversity Information
BioCase:A Biodiversity Collection Access Service for Europe
http://www.biocase.org
Qué es una base de datos
“conjunto de datos almacenados con una estructura lógica. Es decir, tan importante como los datos, es la estructura conceptual con la que se relacionan entre ellos. En la práctica, podemos pensar esto como el conjunto de datos más los programas (o software) que hacen de ellos un conjunto consistente”
Tablas y relaciones
relaciones 1 a N relaciones N a M
Integridad referencial (no nulos, no duplicados, c. primaria, c. candidatas)
modelos extendidos (orientados a objetos): objetos, supertipos, subtipos, procedimientos, atributos
Códigos abreviaciones y estándares
nombres entendibles para campos y tablas; fáciles de recordar y usar; abreviar lo mínimo y de manera consitente.códigos arbitrarios => problemas de compatibilidad y fuente de erroresel coste: Razones para códigos en las claves primarias: cuando la clave primaria es my larga o compleja (¿para salvar espacio en disco? quien se lo cree) estándares => compatibilidad => acceso unificado, interoperabilidad, soluciones comunes
Coste
Normalización y modelo lógico de los datos
Al modelar una base de datos, desearemos evitar puntos que crean confusión, duplicación de la información y por ende, un mal funcionamiento y exploración de la información. Entre las propiedades indeseables en un diseño de bases de datos tenemos:
Redundancia en la información. Incapacidad de representar cierta información. Registrar información que no sea identificable.
Primera forma normal
Una relación está en primera forma normal (1FN) si y sólo si todos los dominios son atómicos. Un dominio es atómico si los elementos del dominio son indivisibles. Es decir, no tenemos grupos de repetición o un conjunto de valores asociados repetidos asociados a una misma tupla. Datos separados en tablas, cada tabla con su clave primaria, no hay grupos repetitivosej. identificaciones separadas del resto -> tabla de identificaciones aparte
Segunda forma normal Una relación está en segunda forma normal (2FN) si y sólo si está en 1FN y todos los atributos que no sean llaves dependen por completo de llave primaria. Quita todos los campos que no dependen de la clave principal o que dependen solo de parte de la clave principalej. nombre vernáculo en registro de pliego -> tabla de nombres vernáculos relacionada con el nombre científico
Tercera forma normal Una relación están en tercera forma normal (3FN) si y sólo si están en 2FN y todos los atributos no llave dependen de manera no transitiva de la llave primaria. Se dice que existe una dependecia transitiva cuando tenemos el par de dependencias funcionales: 78#78 y 79#79, porque de ellas se sigue que 80#80. Elimina todo aquello en las tablas que que no dependa únicamente de la clave principalEj. En una base de datos de pliegos donde para todos ellos disponemos de las coordenadas, los datos del sitio de recolección (pais, provincia, localidad, municipio, ...) en la tabla de especímenes
Informatización de colecciones: una visión general
La elaboración de bases de datos es una labor costosa cuyos resultados no se obtienen sino a largo plazo es mejor proceder a informatizar las colecciones de manera completa por grupos taxonómicos, a informatizarlas parcialmente en su conjunto
Contribuir a explotar de una manera más completa la información que contiene
Proteger el material conservado Contribuir a la gestión del herbario
ligar la informatización de colecciones a proyectos de investigación en curso que, de alguna manera, precisen de la información contenida en las mismas el crecimiento y mantenimiento de la misma en la rutina de trabajo del herbario Keep original information and maintain it clearly distinguishable from derived dataEl valor de la base de datos aumenta con la posibilidad de que los datos se puedan combinar e integrar con otras fuentes (mombre científico, coordenadas)
Herbar: que es y filosofíaFilosofía
Los datos son accesibles directamente y susceptibles de importarse, exportarse y manipularse como se deseéHerbar se organiza en 3 ficheros de MS-Access (datos de colecciones , datos de gestión y configuración, y programación)
Requerimientos: Windows 95 en adelante (Windows 98 recomendado); Access 97 (hasta la versión 3.0), Access 2000 en adelante, xp recomendado
Herbar se ha desarrollado desde el punto de vista del conservador (gestor de la colección): para que este trabaje menos y su trabajo sea más útil.
HERBAR es una aplicación informática para informatizar y gestionar colecciones botánicas
Herbar: funciones y conectividad
De gestión: entrada, edición, etiquetas, prestamos, solicitudes, intercambiosConectividad (vía ODBC): TSA, REMIB, pags. ASP, Darwin Core (GBIF)
DAO y ADO
What is DAO?
Data Access Objects (DAO) is the database engine used by Microsoft Access 97. It consists of a set of DLL files and libraries. DAO 3.51 cannot read Access 2000/2002 databases.
What is ADO?
ActiveX Data Objects (ADO) is a framework for accessing a wide variety of different database types. ADO includes drives (know as Providers) for Microsoft Access 97 and 2000/2002, and can be downloaded from Microsoft as part of the Microsoft data Access Components (MDAC). If you are using an Access 2000 or Access 2002 database, you will need to use the ADO conduit.
Herbarios sin informatizar
Informatizandose con HERBAR
Informatizandose con otros programas
Plataforma para datos botánicos en línea
1
6
11
16
0 5 10 15 20 25
Colecciones Españolas de Botánica
17 Instituciones Datos de c. 400.000 especímenes en Internet en 18 meses50.000 $
Madeira
Componentes del proyecto
Poner en Internet datos ya informatizadosValidación y control de calidadTransformación de datos a sistemas compatiblesFormaciónRepatriación de informaciónEvaluación y documentación de “lessons learned”