Agrovoc cswb training_1
-
Upload
catecara -
Category
Technology
-
view
525 -
download
0
description
Transcript of Agrovoc cswb training_1
Plan para hoy
1. Metadatos e vocabolarios1. Fichas y campo en bibliotecas2. Etiquetado (Tagging)3. Gestores de contenidos (Content Management
Systems, CMS)4. RDF y linked data
2. La familia de herramienta AGROVOC
Metadatos
Metadatos
Algo sobre los dadosen general, algo que describa
Para organizar cosas y recuperarlas
Datos: Libros, paginas web, archivos musicales, … Metadatos: titulo, autor, numero paginas, ultima modifica,
numero de kilobite, argumento, genere musical, …
¿Cosa es dato y cosa metadato? Depende de tu aplicacion y interese
Metadatos in bibliotecas
• Ficha• con campos
• Necesitamos acuerdos sobre• estructura de la ficha• definicion de los campos• valores de campos
Titulo
Autor
Año
Idioma
Tema
….
Ejemplos de estandares para valores de campos
• Nombre de autores: authority files• Idioma: ISO 2, ISO 3 • Tema: vocabolarios controlados, thesauros,
esquema de classificacion • e.g. AGROVOC, NAL thesaurus, ….
Temas y vocabularios
• Vocabolario: un conjunto de termines
• Taxonomia: vocabulario con jerarquia
• Thesauro: vocabulario con jerarquia y relaciones de “similaridad”• pesca con red – pesca con tarraya• pesca con red -- redes de pesca• pesca con red – pesca con red de cerco
• Ontologia: + escructurado, + relaciones
Ejemplo: temas en un AGRIS record
Temas en las AGRIS subject categories
Temas en AGROVOC
Metadatos y vocabolarios fuera las bibliotecas
Tagging, CMS, el formato RDF, Linked Data
Metadatos y vocabolarios en TICs
En cualquier lado!
• En Word docs, music files, web pages, …
• Con aplicaciones: Delicious, Picasa, blogs, web content management system, neswires, content aggregators
Etiquetar (tagging)
• Associar contenido con etiquetas (tags) • Las etiquetas pueden ser cualquiera o pueden
salir de un vocabulario, taxonomia o tesauro
• Delicious, Picasa, blogs, neswires, content management system (CMS)
• La descripcion del contenido es organizacion de objectos
Content management systems y tagging
• Un CMS es un systemas para la organizacion y publicacion de documentos, imagines, learning objects, web content
• Para el web: Drupal, Joomla, Typo3, WordPress, ...
Content management systems y tagging
• El usuario añiade pedazos de informacion, sin pensar a su posicion fisica en file system o database – cada unidad de informacion es un “nodo”
• Cada nodo esta etiquetado (manuale o automaticamente) con terminos de un vocabulario
• El vocabulario puede ser jerarquico la jerarquia se puede cambiar
RDF
RDF es el instrumento fondamental para publicar datos/metadatos en el web
• Modelo de dato justo para affirmaciones como:La autora de esto es Caterina
Subjecto: Esto (el URL de la presetacion)Predicato: autor esObjecto: Caterina
Necesitamos vocabularios para los predicatos!
Vocabolarios para el RDF
• Permiten de utilizar nombres uniformes para predicatos en una tripla RDF
• RDFS, FOAF, SKOS, DC, Creative Commons, …
Linked data
• Es una manera para publicar datos en RDF en el web y linkar datos entre bases de datos distantas
• Con un CMS se pueden organizar relaciones (link) entre los pedazos de informacion
• Se puede imaginar algo parecido en escala mas grande, en el web
Liked data @BBC
Linked data @BBC
1. BBC ya tienia todos su programas y videos etiquetados con temas
• El vocabolario es lo de Wikipedia/Dbpedia 2. Programs son divididos en segmentos,
dependiendo del tema3. Los segmentos son linkeados a Wikipedia
(DBPedia, la version RDF)4. Resultados: nosotros podemos ver (de BBC) y
leer (de Wikipedia) sobre un tema
Liked data @BBC
Ingredientes del linked data
1. Todo es una unidad de informacion • un archivo, un nombre, un numero, …
2. Todo se espresa en RDF3. Hay vocabolarios para el RDF4. Todo tiene una direccion, un URL (HTTP URI)
AGROVOC & Co.
La familia AGROVOC
• AGROVOC thesaurus• AGROVOC Concept Schema (CS)
• semantically revised
• AGROVOC WorkBench (WB)• online tool for editing
• Un thesauro multilengua• 20 idiomas • Nascio el los anios 80, con uso bibliotecario,
para indexar documentos
• Cobiertura: todo lo que pertence al interese de FAO -- agricultura, bosques y manejo forestal, pesca, alimentacion, y cosas relacionadas (e.g. environment)
• ~40.000 terminos en EN, ES
AGROVOC thesaurus
AGROVOC thesaurus 2
• Manejo y publicacion online por FAO• Contenidos en various idiomas por otras
instituciones
http://aims.fao.org/agrovoc/
Uso de AGROVOC
• Bibliotecas: index con un termino (descriptor), retrieve con muchos (non-descriptors, related or BT/NT terms)
• E.g. AGRIS database, FAO docrep
• Con un vocabulario multilengua se puede: hablar del medio ambiente local y hacer busquedas entre idiomas
Uso de AGROVOC 2
• Content management systems: usar las jerarquias de AGROVOC con AgriDrupal
• Desarollo software de tipo open source
AGROVOC y los idiomas
• La estructura es la misma para todo los idiomas
• Imagina el vocabulario como un grafo: cada nodo es un codigo, y cada nodo puede tener version en various idiomas
La estructura del tesauro
1. Hierarchical relations: BT/NT BT Osteoglossidae
NT Arapaima gigas
2. Non-hierarchical relations: USE/UF, NT
Estructura: BT
Estrructura: UF/USE, NT
AGROVOC Concept SchemaAGROVOC CS
• Basado en AGROVOC, pero redefinido
• Nodos radiz mejor orgnaizados
• La relaciones RT estan mas especifica
AGROVOC WorkBench (WB)
AGROVOC WorkBench (WB)
• Herramienta para el manejo de AGROVOC CS
• Mas que un contribudor puede trabajar en el mismo tiempo
• Flujo de trabajo
• Validacion y controlo de integridad
Planes
• AGROVOC WB & CS entrenados May 7.
• RDF SKOS como formato
• AGRIDrupal
• Futuro: linked data
Tareas
• AGROVOC
http://www.fao.org/agrovoc/
• Register en AGROVOC WB
http://202.73.13.50:55234/agrovocdevv10demo/
• Register en la AGROVOC mailing list
http://dgroups.org/fao/agrovoc
Tu contribucion es util!
• Comentarios, sugestiones sobre el sitio, documentacion, el WB
• Mandalos a mi o al mailing list