PUBLICACIÓN DE DATOS ABIERTOS ENLAZADOS EN PUBLICACIÓN DE DATOS ABIERTOS ENLAZADOS EN EL ÁMBITO LEGISLATIVOEL ÁMBITO LEGISLATIVO
TRABAJO DE FIN DE MÁSTER
AutorAutorFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva
22 de Junio de 2011
Universidad de OviedoEscuela de Ingeniería Informática
Máster en Ingeniería Web
DirectorDirectorDr. Jose Emilio Labra GayoDr. Jose Emilio Labra Gayo
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva
IntroducciónIntroducción
22 de junio de 201122 de junio de 2011 22
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
IntroducciónIntroducción
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
La Web
33
La Web como BD
LimitantesLimitantesOrientada al usuarioEnlaces sin significadoDifícil extraer información
Cómo mejorarCómo mejorarAgregar metadatos Leíbles por máquinas
Datos enlazados
Documentos etiquetadoscon metadatos
Cómo mejorarCómo mejorarPublicar datos enFormatos interoperables
Mucha información
Mucha información
MotivaciónMotivación
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
¿Por qué publicar datos enlazados ¿Por qué publicar datos enlazados en el ámbito legislativo?...en el ámbito legislativo?...
O de modo más general... ¿en O de modo más general... ¿en la administración pública?la administración pública?
Generan confianza promoviendo la transparencia en la información.
Facilitan estudios e investigación.
Los datos públicos pertenecen a la nación, son concebidos gracias a los impuestos de los ciudadanos.
Asegurar que la legislación sea conocida (“Certeza jurídica”).
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
44
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
MotivaciónMotivación
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Muy bien, publiquemos datos enlazados, son muy buenos.
Pero...
¿En qué consisten exactamente?
¿Cómo publicar?
¿Qué se necesita?
¿A quién preguntar?
Además, si son datos de interés general y muy consultados ¿es necesaria alguna otra consideración?
55
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
ObjetivosObjetivos
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Desarrollar un estado del arte relacionado a la publicación de datos enlazados.
Definir una arquitectura y proceso de implantación estandarizados que habiliten la implementación de proyectos de datos enlazados en el contexto de la administración pública.
Probar la metodología a través un caso de estudio.
66
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva
Estado del arteEstado del arte
22 de junio de 201122 de junio de 2011 77
Grafo RDF sobre HTTPGrafo RDF sobre HTTP
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
Conceptos previosConceptos previos
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
RDF – Resource Description FrameworkRDF – Resource Description Framework
Datos enlazadosDatos enlazados
Publicados sobre HTTP.
Referenciar mediante URIs
En cada URI, publicar información bajo estándares abiertos.
Incluir enlaces a otras URI, permitir el descubrimiento de nueva información
http://ejemplo.org/Alumno rdf:type
http://universidades.org/Uniovi
http://uniovi.es/alumnos/Francisco
“Universidad de Oviedo”
http://ejemplo.org/perteneceA
http://ejemplo.org/tiene
http://ejemplo.org/tieneNombre
Sujeto Propiedad Objeto
Francisco rdf:type Alumno
Uniovi tieneNombre Universidad de Oviedo
Francisco perteneceA Uniovi
88
Conceptos previosConceptos previos
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
SPARQL – SPARQL – Sparql Protocol And Rdf Query Language
Recomendación W3C Consultar grafos RDF Encaje de patrones
(Pattern matching)
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
99
PREFIX bcnnorms: <http://datos.bcn.cl/ontologies/bcn-norms#>PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>
select distinct ?titulo ?norma ?nombreOrg where {?norma rdf:type ?clase .?norma bcnnorms:createdBy ?org .?org bcnnorms:hasName ?nombreOrg.?norma dc:title ?titulo.?norma bcnnorms:isTreatyWith ?pais.?pais bcnnorms:hasName "España".?norma bcnnorms:type ?tipo .?tipo bcnnorms:hasName "Decreto".?norma bcnnorms:publishDate ?pub_date .FILTER (xsd:dateTime(?pub_date) >= "1990-01-01T00:00:00Z"^^xsd:dateTime && xsd:dateTime(?pub_date) <= "2000-12-31T00:00:00Z"^^xsd:dateTime) . }
Endpoint SPARQLEndpoint SPARQL
Endpoint SPARQLEndpoint SPARQL Cumple SPROT Ejecutar SPARQL Sobre grafo RDF
Mismo recurso, diferentes formatos
Conceptos previosConceptos previos
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Recurso != representación (formatos)
EjemploEjemplo
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
1010
http://ejemplo.org/Franciscohttp://ejemplo.org/Francisco
http://ejemplo.org/Francisco.html
http://ejemplo.org/Francisco.json
http://ejemplo.org/Francisco.rdf
Negociación de contenidoNegociación de contenido
GET /recurso/Francisco.rdfAccept: application/rdf+xml
GET /recurso/FranciscoAccept: application/rdf+xml
303 See OtherLocation:
http://ejemplo.org/recurso/Francisco.rdf
200 OKContent-type:
Application/rdf+xml;charset=utf-8
Casos de éxitoCasos de éxito
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
Legislation.gov.ukLegislation.gov.uk
New York TimesNew York Times
DBPediaDBPedia
DBLPDBLP
1111
Trabajos relacionadosTrabajos relacionados
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
1212
Aproximaciones para publicación
TutorialBizer et al, 2008Debilidades
No define arquitectura No describe componentes
LibroHeath y Bizer, 2011Debilidades
Componentes vagamente No describe fases
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva
Propuesta metodológicaPropuesta metodológica
22 de junio de 201122 de junio de 2011 1313
Contexto de aplicaciónContexto de aplicación
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Características de los datosCaracterísticas de los datos
Gran volumen de datos
Altamente consultados
Contenidos de interés general
Características de la Características de la organizaciónorganización
Sin equipo de especialistas
Nuevos proyectos no deben interferir con proyectos en curso
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
1414
Arquitectura propuestaArquitectura propuesta
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Puntos fuertePuntos fuertess
Escalabilidad
Eficiencia
Completitud
Basada en componentes
Alta cohesión
Bajo acoplamiento
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
1515
Fases de implantaciónFases de implantación
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Proceso de implantación de datos enlazadosProceso de implantación de datos enlazados
Fase por cada componente
Solución automantenible
Incluye documentación para su uso
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
1616
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva
Caso de estudioCaso de estudio
22 de junio de 201122 de junio de 2011 1717
AntecedentesAntecedentes
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Portal Web de normas
Máximos entre 14.000 y 18.000 consultas diarias
Sistema de búsquedas
Servicios Web
Necesidad de extender sistema a datos enlazados
Sitio web LeyChileSitio web LeyChilehttp://www.leychile.cl
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
1818
Biblioteca del Congreso Nacional de Chile - BCNBiblioteca del Congreso Nacional de Chile - BCN
RequisitosRequisitos
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Peticiones de la BCNPeticiones de la BCN
Publicar normas como datos enlazados
Req.1:Req.1: Ontología de Normas
Req.2: Req.2: Grafo RDF sobre HTTP
Permitir consultar las normas a través de un Endpoint SPARQL
Req. 3:Req. 3: Generación y carga de tripletas RDF + Endpoint SPARQL
Mantener el grafo RDF actualizado
Req. 4:Req. 4: Servicio de actualización
Visualizar gráficamente relaciones entre normas
Req. 5:Req. 5: Herramienta de visualización
Finalmente, ¿cómo utilizar el sistema de datos enlazados?
Req. 6:Req. 6: Portal de documentación
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
1919
RequisitosRequisitos
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Consideraciones adicionalesConsideraciones adicionales
Escalable, se agregarán progresivamente más datos
Sistema autónomo a los sistemas existentes
Aproximadamente 300.000 normas y sus relaciones (modificaciones, concordancias, etc.)
Primera etapa solo datos base de las normas (ttulo, fechas, tipos, relaciones), excluyendo el cuerpo (artculos, capítulos)
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
2020
Arquitectura implantadaArquitectura implantada
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
CaracterísticasCaracterísticas
Acceso centralizado Apache 2
MySQL para BD de soporte y cache
Todas las herramientas de código abierto
Componentes intercambiables
TYPO3 CMS como portal web de documentación
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
2121
Fases implantadasFases implantadas
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
ContextualizaciónContextualización
¿Qué datos se van a entregar?
Normas legislativas, Organismos del estado, Organizaciones Internacionales, Países con los que se tiene tratado internacional
¿De qué forma?
¿Quién los va a consumir?
Navegador Web y máquinas de búsqueda (RDFa – SEO)
Herramientas de visualización como Lodviz
Aplicaciones de terceras partes
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
2222
Fases implantadasFases implantadas
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Diseño de ontologíasDiseño de ontologías
Ontología de normas legislativas (OWL+RDFs)
Basada en otros vocabularios (SKOS, FOAF, DC, DBPEDIA, GN)
PREFIX bcnnorms: http://datos.bcn.cl/ontologies/bcn-norms#
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
2323
Fases implantadasFases implantadas
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Diseño del grafo RDFDiseño del grafo RDF
Patrones de URIs
Definición de RDF de salida por cada patrón de URI
Diseño de URIs de normas basado en estándar FRBR para registros bibliográficos
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
2424
Fases implantadasFases implantadas
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Implementación del Endpoint SPARQLImplementación del Endpoint SPARQL
Componente Virtuoso sparql
17 Transformaciones Kettle
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
2525
Fases implantadasFases implantadas
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Requisitos no funcionalesRequisitos no funcionales
Seguridad
Endpoint SPARQL: Basada en permisos de ejecución de usuario
WESO DESH: validación de URIs mediante en expresiones regulares
Administración: Mediante Apache Deny All
Acceso BD producción, usuario con acceso solo lectura
Firewall desde DMZ, solo puerto 80 abierto
Acceso SSH solo desde VPN
Cache
Aun no requerida por configuración de virtuoso optimizada
Monitoreo de rendimiento
Planificado para siguiente iteración
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
2626
Fases implantadasFases implantadas
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Portal de documentaciónPortal de documentación
TYPO3 CMS, desde la fase de contextualización
Herramientas que implementan fasesHerramientas que implementan fases
WESO DESH
WESO RUD
Lodviz
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
Portal de documentación
Impl. Grafo RDF sobre HTTP
Impl. Servicio de actualización
Impl. Herramienta de visualización
2727
WESO DESHWESO DESH
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Negociación de contenido basada en 303 See Other
Delega formatos de salida en Endpoint SPARQL
Salida en HTML+RDFa usando XSLT
Configuración en XML
Definición de URIs basada en expresiones regulares
Ejecuta SPARQL (CONSTRUCT, ASK, DESCRIBE)
Grafo RDF sobre http: WESO DESH – Datos Enlazados Sobre HTTPGrafo RDF sobre http: WESO DESH – Datos Enlazados Sobre HTTP
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
2828
WESO RUDWESO RUD
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Servicio de carga y actualización RDF: WESO RUD – RDF UpdaterServicio de carga y actualización RDF: WESO RUD – RDF Updater
Basado en Pentaho – Kettle ETL
Ejecuta transformaciones en hilos
Configuración en XML
Qué transformaciones ejecutar
Qué directorios utilizar
Datos de conexiones a BD
Otras conexiones e instrucciones como SSH
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
2929
LodvizLodviz
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Herramienta de visualización: Lodviz – Linked Open Data VisualizationHerramienta de visualización: Lodviz – Linked Open Data Visualization
Permite visualizar datos enlazados en RDF como grafos
Basado en HTML5 y Javascript
Orientado a visualizar vinculaciones entre normas
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
3030
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva
Resultados y DiscusiónResultados y Discusión
22 de junio de 201122 de junio de 2011 3131
ResultadosResultados
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Utilizando la propuesta metodológica se obtuvo lo siguiente:Utilizando la propuesta metodológica se obtuvo lo siguiente:
Creación de más de 8 millones de tripletas sin error a partir de 300.000 normas (aprox. 27 tripletas por norma)
Implementación de un grafo de datos vinculados de normas válido bajo estándares W3C (Utilizando validadores W3C: RDF/XML, Vapour y RDFa)
Implementación altamente escalable
No han aparecido nuevos requisitos a lo largo del desarrollo
Planificación ajustada al tiempo de desarrollo, utilizadas 19 de 21 semanas en implementación
Se da cumplimiento a las cinco estrellas de datos enlazados
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
3232
DiscusiónDiscusión
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Comparativa de metodologíasComparativa de metodologías
AspectoAspecto PropuestaPropuesta Bizer et al 2008Bizer et al 2008 Heath y Bizer Heath y Bizer 20112011
Definición de requisitosDefinición de requisitos Contextualización parcial parcial
Definición de arquitecturaDefinición de arquitectura sí parcial sí
Definición de componentesDefinición de componentes sí parcial parcial
Definición de fasesDefinición de fases sí sí difusa
Diseño de URIsDiseño de URIs sí sí sí
Diseño de ontologíasDiseño de ontologías sí sí sí
Servicio de actualizaciónServicio de actualización sí no no
Portal de documentaciónPortal de documentación sí no no
Métodos de generación de Métodos de generación de datos enlazadosdatos enlazados
único múltiples múltiples
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
3333
DiscusiónDiscusión
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
En la propuesta se incorpora una descripción de los componentes de soporte a datos enlazados.
Metodología permite planificar sin dejar fuera elementos importantes.
Se incorporan nuevos componentes útiles.
Adaptabilidad no se hace indispensable por el contexto de aplicación.
8 millones de tripletas al ser un piloto, proyecta enorme incremento al completar normas y agregar datos de otros dominios, por lo que es necesaria la escalabilidad.
Implementación adicional de consultas RESTful.
Implementación cinco estrellas de datos enlazados no ha sido trivial.
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
3434
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva
Conclusiones y Trabajo futuroConclusiones y Trabajo futuro
22 de junio de 201122 de junio de 2011 3535
ConclusionesConclusiones
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
La utilidad de la propuesta es válida de forma integral permitiendo su uso en contextos similares al caso de estudio.
No existe actualmente una metodología general de publicación de datos enlazados que de soporte de forma completa al proceso, sin embargo con esta propuesta es posible dar solución a la problemática presente en las administraciones públicas y posiblemente extender a otros dominios con características similares.
Las herramientas de soporte a datos enlazados existentes en la actualidad no dan cumplimiento total a los requisitos, por lo que es un campo abierto para su desarrollo.
Una referencia en fases y arquitectura para el desarrollo de proyectos de datos enlazados se hacen claves a la hora de planificar un proyecto de este tipo.
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
3636
ConclusionesConclusiones
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Existe gran complejidad para visualizar grandes conjuntos de datos enlazados, principalmente por su granularidad.
La mayor parte de los proyectos de datos enlazados son iniciativas de gobierno, aparentemente el sector privado aun no ha visto el real potencial, por lo que es otra área donde hay mucho trabajo que realizar.
Los datos enlazados se basan en tecnología que no es nueva, sin embargo no ha sido adoptada ampliamente. A partir de esto se puede deducir que además de factores económicos, la baja adopción es producto del desconocimiento.
Este trabajo viene a dar en parte una solución a esta brecha de desconocimiento sobre datos abiertos enlazados.
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
3737
Trabajo futuroTrabajo futuro
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Extender propuesta metodológica
Considere distintos escenarios de aplicación
Arquitectura adaptable
Distintos esquemas de componentes
Trabajar sobre las herramientas
Realizar refactoring sobre el código
Agregar nuevas características
Optimizaciones y comparativas con herramientas similares
Liberar como código abierto bajo autoría del grupo WESO de la Uniovi
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
3838
Trabajo futuroTrabajo futuro
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Sobre WESO DESH
Seguridad en grafos RDF
Perfiles de usuario
GUI para configuración y administración
Sobre Lodviz
Permitir visualización de conjuntos de datos grandes
Implementar descubrimiento progresivo de grafos
Estudios de usabilidad
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
3939
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva
Difusión de los resultadosDifusión de los resultados
22 de junio de 201122 de junio de 2011 4040
Difusión de los resultadosDifusión de los resultados
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Artículos enviados a conferenciasArtículos enviados a conferencias
“Towards an architecture and adoption process for Linked Data technologies in Open Government contexts. A case study for Library of Congress of Chile”
I-Semantics, 7th International Conference on Semantic Systems, 7 al 9 de septiembre de 2011 en Graz, Austria.
“An architecture and process of implantation for Linked Data environments” CAEPIA, Conferencia de la Asociación Española Para la Inteligencia Artificial, 7 al 11
de noviembre de 2011 en San Cristóbal de La Laguna, Tenerife.
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
4141
Difusión de los resultadosDifusión de los resultados
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Trabajo presentadoTrabajo presentado
“Linked Data para la Biblioteca del Congreso Nacional de Chile - BCN” Reunión Red Temática Española de Linked Data, Universidad Politécnica de Madrid, 6
y 7 de junio de 2011
Preparando Preparando abstractabstract para para special issuespecial issue JCR JCR
"Consuming and Producing Linked Data on Real World Applications"International Journal of Software Engineering and Knowledge Engineering (JCR 2009 IF: 0.327)
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
4242
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva
PreguntasPreguntas
22 de junio de 201122 de junio de 2011 4343
PreguntasPreguntas
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Estándar FRBREstándar FRBR
● TrabajoTrabajo: una: una creación intelectual creación intelectual o artstica, la obra original producida por un autor, o artstica, la obra original producida por un autor, por ejemplo el Hamlet de Shakespeare.por ejemplo el Hamlet de Shakespeare.
● Expresión:Expresión: una clara una clara realización intelectual de una obrarealización intelectual de una obra , por ejemplo la película de , por ejemplo la película de Hamlet en 1990 por Zeffirelli.Hamlet en 1990 por Zeffirelli.
● Manifestación: Manifestación: la la encarnación física de una expresión concretaencarnación física de una expresión concreta, por ejemplo, el , por ejemplo, el formato DVD de la película.formato DVD de la película.
4444
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
PreguntasPreguntas
Publicación de datos abiertos enlazados en el ámbito legislativoFrancisco Adolfo Cifuentes SilvaFrancisco Adolfo Cifuentes Silva22 de junio de 201122 de junio de 2011
Por qué se ha seleccionado VirtuosoPor qué se ha seleccionado Virtuoso
4545
Introducción -Motivación -ObjetivosEstado del arte -Conceptos previos -Casos de éxito -Trabajos relacionadosPropuesta metodológica -Contexto de aplicación -Arquitectura propuesta -Fases de implantaciónCaso de estudio -Antecedentes -Requisitos -Arquitectura implantada -Fases implantadas -Herramientas -WESO DESH -WESO RUS -LodvizResultados y DiscusiónConclusiones y Trabajo futuroDifusión de los resultadosPreguntas
Carga de datos
Consulta 1
Consultas 2
Ref:http://www4.wiwiss.fu-berlin.de/benchmarks-200801/