La Web Semantica

29
Tema 15: La Web Semántica Rafael Pedraza Jiménez Departamento de Comunicación Universitat Pompeu Fabra [email protected]

description

 

Transcript of La Web Semantica

Page 1: La Web Semantica

Tema 15: La Web Semántica

Rafael Pedraza JiménezDepartamento de Comunicación

Universitat Pompeu [email protected]

Page 2: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 2

Contenido

1. Problemas de la Web actual.2. La Web semántica.3. Tecnologías de la Web semántica:

1. Lenguajes de descripción2. Ontologías3. Agentes de usuario

4. Web actual vs. Web semántica.5. Problemas de la Web semántica.6. La Ingeniería de ontologías7. Problemas de la Ingeniería de ontologías8. Resumen y conclusiones

Page 3: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 3

Problemas de la Web actual

La Web es un sistema descentralizado y heterogéneo. En la Web se produce un proceso de recuperación de

la información con adversario. La Web carece de un modelo bien definido para la

representación de la información. El método de marcado de la información, html, combina elementos de contenido con otros de presentación.

¿Cómo podemos solucionarlos? …

Page 4: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 4

La Web Semántica

2001: Tim Berners-Lee enuncia la Web Semántica.

“El contenido de la Web será expresado de manera que los ordenadores puedan entenderlo”

Para ello: La información tiene que estar marcada. Son necesarias herramientas que permitan interpretar,

comparar y fusionar datos e informaciones. Estas herramientas son las Ontologías.

Page 5: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 5

Tecnologías de la Web Semántica

Desarrollo de lenguajes de etiquetas con carga semántica XML

1. Marcado: descripciones de las páginas y sitios web compatibles e interoperables para los sistemas informáticos RDF, Dublin Core

2. Interpretar, comparar y/o fusionar datos: lenguajes lógicos que puedan ser interpretados por un ordenador RDFS, SKOS Core, OWL

Page 6: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 6

XML

Permite definir tipos de documentos y los conjuntos de etiquetas necesarias para codificarlos.

Es un meta-lenguaje para la definición de estructuras textuales.

Page 7: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 7

XML<?xml version=“1.0” encoding=”ISO-8859-1” standalone=”no” ?> <!DOCTYPE COLECCION_FOTOGRAFIAS SYSTEM “coleccionFotografias.dtd”> <!-- Documento XML definido para una colección de fotografías --> <COLECCION_FOTOGRAFIAS creador=”Pedro Guzmán”> <FOTOGRAFIA identificador= “_001” formato=“png” tamanoBytes=“21272”> <AUTOR>Saúl Blanco</AUTOR> <TITULO>A mil años luz</TITULO> <FECHA>23-07-2006</FECHA> <DESCRIPCION>Cabeza de una estatua…</DESCRIPCION> <FUENTE nombre=“Bluethinking” uri=“http://www.bluethinking.com/evam”

otrasFotos=”_015, _137” /> </FOTOGRAFIA> <FOTOGRAFIA id=”_002” formato=”jpg” tamanoBytes=”1374”> ... </FOTOGRAFIA> <FOTOGRAFIA id=”_003” formato=”tiff” tamanoBytes=”54312”> ... </FOTOGRAFIA></COLECCION_FOTOGRAFIAS>

Page 8: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 8

RDF

Es el sistema que permite utilizar metadatos para describir recursos.

Su objetivo es expresar el significado de las estructuras descritas mediante lenguajes XML, y facilitar así la interoperabilidad entre diferentes modelos de metadatos.

Todo sistema RDF parte de tres entidades lógicas: Recursos Propiedades Valores

Page 9: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 9

RDF abreviado

<rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#” xmlns:dc=”http://purl.org/dc/elements/1.0”>

<rdf:Description about=”http://www.technobserver.com” dc:title=” Technobserver: Observatorio de las tecnologías para la gestión de la información”>

</rdf:RDF>

Page 10: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 10

RDF Schema (RDFS)

<?xml version="1.0"?><rdf:RDF xmlns:rdf= "http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"xml:base= "http://www.animals.fake/animals#">

<rdf:Description rdf:ID="animal"> <rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/></rdf:Description><rdf:Description rdf:ID="horse"> <rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/> <rdfs:subClassOf rdf:resource="#animal"/></rdf:Description>

</rdf:RDF>

Page 11: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 11

Dublin Core

Es una norma internacional, que establece un conjunto de metadatos para la descripción de recursos.

Aparece en 1995, en un momento en el que el volumen de recursos disponibles en la Web no dejaba de crecer.

Su principal característica es su sencillez. Actualmente Dublin Core (DC) establece dos posibles

usos de sus elementos, posibilitando descripciones tanto mediante el “Simple Dublin Core” como del “Qualified Dublin Core”.

Page 12: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 12

Dublin Core: elementos

Contributor Coverage Creator Date Description Format Identifier Language

Publisher Relation Rights Source Subject Title Type

Page 13: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 13

Dublin Core y RDF

<?xml version="1.0"?><!DOCTYPE rdf:RDF PUBLIC "-//DUBLIN CORE//DCMES DTD 2002/07/31//EN" "http://dublincore.org/documents/2002/07/31/dcmes-xml/dcmes-xml-dtd.dtd">

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc ="http://purl.org/dc/elements/1.1/">

<rdf:Description rdf:about="http://dublincore.org/"> <dc:title>Dublin Core Metadata Initiative - Home Page</dc:title> <dc:description>The Dublin Core Metadata Initiative Web site.</dc:description>

<dc:date>2001-01-16</dc:date> <dc:format>text/html</dc:format> <dc:language>en</dc:language> <dc:contributor>The Dublin Core Metadata Initiative</dc:contributor> <dc:title xml:lang="fr">L'Initiative de métadonnées du Dublin Core</dc:title> <dc:title xml:lang="de">der Dublin-Core Metadata-Diskussionen</dc:title> </rdf:Description></rdf:RDF>

Page 14: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 14

Dublin Core y XHTML<html> <head>

<title>…</title> <meta name=”dc.title” content=”Blog de la Biblioteca Universitaria”> <meta name=”dc.creator” content=”Tapia Flores, Héctor”> <meta name=”dc.subject” content=”004.Ch383 1972″ (ejemplo de un DEWEY) <meta name=”dc.description” content=”Pagina de un blog preparada para …”> <meta name=”dc.publisher” content=”Biblioteca Universidad Arturo Prat”> <meta name=”dc.contributor” content=”Unidad de Medios Digitales”> <meta name=”dc.date” content=”2007-07-04″> <meta name=”dc.type” content=”text”> <meta name=”dc.format” content=”jpg”> <meta name=”dc.identifier” content=”84-999-8888-1 (ISBN)“> <meta name=”dc.source” content=”Colección de artículos …″> <meta name=”dc.language” scheme=“RFC1766″ content=“es”> <meta name=”dc.relation” content=”http://bibliopress.wordpress.com”> <meta name=”dc.coverage” content=”2007-07-04″> <meta name=”dc.rights” content=”http://www.ejemplo.cl/derechos_autor.html”>

</head>…

Page 15: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 15

SKOS Core

SKOS Core (SKOS, 2004) es publicado y mantenido por el W3C Semantic Web Best Practices and Deployment Working Group.

Es un lenguaje formal, sencillo y extensible que permite expresar la estructura básica y el contenido de diferentes esquemas de conceptos.

Es más secillo que OWL, aunque con una capacidad semántica más limitada.

Page 16: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 16

SKOS Core

<rdf:RDFxmlns:rdf=”http://www.w3c.org/1999/02/22-rdf-syntax-ns#”xmlns:skos=”http://www.w3c.org/2004/02/core#”xml:base=”http://www.ukat.org.uk/thesaurus/concept/”>

<skos:Concept rdf:about=”1750”><skos:prefLabel>Economic cooperation</skos:prefLabel><skos:altLabel>Economic co-operation</skos:altLabel><skos:scopeNote>Includes cooperative measures in banking, trade, industry, etc. between and among countries.</skos:scopeNote><skos:broader rdf:resource=”4382” /><skos:narrower rdf:resource=”2108” /><skos:narrower rdf:resource=”9505” /><skos:narrower rdf:resource=”15053” /><skos:narrower rdf:resource=”18987” /><skos:related rdf:resource=”3250” />

</skos:Concept></rdf:RDF>

Page 17: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 17

OWL

Es el lenguaje que permite combinar y comparar documentos con distinta estructura.

A estos lenguajes o herramientas se les denomina ontologías, y básicamente incluyen las definiciones de los conceptos, denominadas “clases”, de un dominio y las relaciones entre ellos.

Owl utiliza rdf para representar y codificar las ontologías. Por tanto, owl es una extensión de rdf que añade elementos.

Page 18: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 18

OWL

<?xml version=”1.0”?><rdf:RDF

xmlns:rdf=”http://www.w3c.org/1999/02/22-rdf-syntax-ns#”xmlns:rdfs=”http://www.w3.org/2000/01/rdf-schema#”xmlns:owl=”http://www.w3.org/2002/07/owl#”><owl:Ontology rdf:about=”http://www.unbuenrestaurante.com/menu”>

<rdfs:label>Menú</rdfs:label><rdfs:comment>Esta ontología describe algunos conceptos

básicos para representar el menú de un restaurante </rdfs:comment></owl:Ontology><owl:Class rdf:ID=”PastelDeChocolate”>

<rdfs:label>Pastel de chocolate</rdfs:label></owl:Class>…

</rdf:RDF>

Page 19: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 19

Agentes inteligentes de usuario

La Web semántica no alcanzará su máximo potencial hasta que se desarrollen agentes inteligentes capaces de buscar contenido en esta nueva Web, procesando la información e intercambiándola con otros programas. Será la eficacia de estos programas la que permita incrementar masivamente el contenido Web realmente procesable de forma automática.

Page 20: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 20

La Web actual

Page 21: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 21

La Web Semántica

Page 22: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 22

Funcionamiento de la Web Semántica

... ...

Recurso: UN

Datos: Iraq, Economía, ...

Recurso: OMS

Datos: Iraq, Demografía, ...

Países

KuwaitIraq

EconomíaDemografía

Ontología

Page 23: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 23

Ejemplo real de Ontología

Periférico

Entrada

Teclado

<?xml version=”1.0” ?><rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”>…<owl:Class rdf:ID=”Perifericos”> <rdf:comment>Los periféricos de ordenador están conectados a la CPU pero no forman parte de ella. </rdf:comment></owl:Class><owl:Class rdf:ID=”Entrada”> <rdf:comment>Los periféricos de entrada son una subclase de periféricos de ordenador. </rdf:comment> <rdfs:subClassOf rdf:resource=”#Perifericos” /></owl:Class><owl:Class rdf:ID=”Teclados”> <rdf:comment>

Los teclados son una subclase de los periféricos de entrada. </rdf:comment> <rdf:subClassOf rdf:resource=”#Entrada” /> <rdf:subClassOf rdf:resource=”#Perifericos” /></owl:Class>…</rdf:RDF>

Page 24: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 24

Problemática de la Web semántica

Elevado coste de su desarrollo: Tiempo Dinero

Ontologías dependientes de un dominio. Ontologías dependientes de objetivos.

¿Solución? Ingeniería de Ontologías.

Page 25: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 25

La Ingeniería de Ontologías

1. Se selecciona un corpus de documentos de un dominio

…2. Se aplican técnicas de procesamiento lingüístico

FotografíaBanco imagen

CineFilm

DiarioPrensaNoticia

GuiónCine

…3. Se utilizan algoritmos de clasificación

Documentación Audiovisual

Fotografía Cine Prensa

Films Guiones

Page 26: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 26

Problemas de la ingeniería de ontologías

1. Elevado coste computacional2. Errores lógicos (categoría inadecuadas, etc.)

Page 27: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 27

Resumen y Conclusiones

Tecnologías básicas de la Web semántica:1. Lenguajes para estructurar los contenidos: estos

lenguajes se crearán utilizando XML.2. Herramienta para extraer el significado de la

estructura de esas informaciones: de esta tarea se encargará RDF (también DC, XHTML, etc.).

3. Lenguajes que permitan comparar y/o combinar informaciones con distinta estructura: OWL.

4. Herramientas que permitan la recuperación eficaz de dichas informaciones: Agentes inteligentes.

Page 28: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 28

Conclusiones

En algún momento del futuro (pero no a corto plazo), la Web estará poblada por un determinado número de ontologías que permitirán a los ordenadores realizar inferencias sobre la información publicada.

Los agentes de usuario (los navegadores del futuro) serán capaces de realizar razonamientos fiables sobre tales ontologías.

No obstante: el coste requerido en tiempo y dinero para la generación de la

infraestructura propia de la web semántica, la ausencia de alicientes que animen a los usuarios a adoptar las

recomendaciones del W3C, y el desinterés de parte de los agentes técnico-comerciales más

importantes de la web actual (como por ejemplo los proveedores de servicios de búsqueda y los fabricantes de navegadores),

hacen augurar que incluso la fecha del 2020 que algunas veces se ha apuntado para este escenario resulte optimista.

En cualquier caso, las tecnologías de la Web semántica ofrecen hoy por hoy importantes soluciones

Page 29: La Web Semantica

Curso 2009/2010 Fundamentos en Redes e Internet 29

Bibliografía

LeeBerners-Lee, T., Hendler, J., and Lassila, O. (2001). The Semantic Web. Scientific American, vol. 284, nº 5, May 2001, pp. 34-43.

Rafael Pedraza-Jiménez, Lluís Codina, Cristòfol Rovira (2007). “Web semántica y ontologías en el procesamiento de la información documental”. El Profesional de la Información, Noviembre-Diciembre 2007, vol.16, nº 6, pp. 569-578.