tema4,Construcción de ontologías

30
Construcción de ontologías [4.1] ¿Cómo estudiar este tema? [4.2] Generación manual de ontologías [4.3] Algunas metodologías [4.4] Methontology TEMA

description

 

Transcript of tema4,Construcción de ontologías

Page 1: tema4,Construcción de ontologías

Construcción de ontologías

[4.1] ¿Cómo estudiar este tema?

[4.2] Generación manual de ontologías

[4.3] Algunas metodologías

[4.4] Methontology

T

EM

A

Page 2: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Esquema

Esquema

Co

nst

rucc

ión

de

on

tolo

gía

s

Gen

era

ció

n m

an

ua

lM

eto

do

log

ías

ME

TH

ON

TO

LO

GY

IDE

F5

Fo

rmal

izac

ión

Esp

eci

fica

ció

n

Co

nce

ptu

aliz

ació

nU

sch

old

y K

ing

On

-To-

Kn

owle

dge

Grü

nin

ger

y F

oxSE

NSU

SN

oyy

Mac

Gu

inn

ess

DIL

IGE

NT

UP

ON

Co

dif

icac

ión

Eva

luac

ión

Page 3: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Ideas clave

4.1. ¿Cómo estudiar este tema?

En el tema anterior se han visto técnicas básicas para la web semántica: lenguajes de

representación, consulta, inferencia, etc. La construcción de una aplicación para la Web

Semántica, comenzando por la construcción de las ontologías utilizadas, es un proceso

altamente complejo. Es por ello por lo que es necesario aplicar metodologías que,

de forma guiada, nos permitan aplicar un proceso sistemático y riguroso

para la construcción de las ontologías.

En primer lugar se presentan aquellas fases que suelen ser incluidas en la construcción

de cualquier ontología, con independencia de que se siga una metodología

determinada. El proceso de construcción de ontologías “de forma manual” es

un arte más que una técnica. Cada ingeniero de conocimiento tiene su propio estilo y

los resultados pueden ser diferentes aún cuando el objetivo es el mismo. Sin embargo

existe un conjunto de actividades que suelen incluirse, en mayor o menor medida, en el

proceso de construcción de una ontología, sea cual sea el estilo para hacerlo.

La aplicación reiterada del mismo estilo de construcción de ontologías, y el éxito de

estos estilos, provoca que acaben convirtiéndose en metodologías. Existen múltiples

metodologías para la construcción de ontologías. De hecho, la Ingeniería de

Conocimiento es un ámbito de investigación vivo, en el que todavía existen múltiples

cuestiones que deben ser resueltas. En este tema presentamos algunas de las

metodologías más empleadas, como Uschold y King, Grüninger y Fox, On-To-

Knowledge, IDEF5, SENSU, Noy y McGuinness, DILIGENT o UPON. No se trata de

métodos completamente ortogonales, sin solape entre ellos. De hecho, la situación es

más bien la contraria. La mayor parte de las metodologías comparten muchas de

sus fases y existen actividades que se repiten en unas u otras. No debe sorprendernos

este hecho cuando todas comparten el mismo objetivo: construir una ontología que

represente de la forma más cercana a la realidad un dominio o ámbito de interés.

Page 4: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Le dedicamos especial atención a una de estas metodologías: METHONTOLOGY. Se

trata de una metodología madura, reconocida internacionalmente e incluso avalada por

la FIPA (Foundation for Intelligent Physical Agents), y con múltiples casos de éxito.

Además es una metodología que tiene su origen en una universidad española, la

facultad de informática de la Universidad Politécnica de Madrid. En esta metodología

se identifican una serie de etapas: especificación, codificación, formalización,

codificación y evaluación. Asimismo, se define con suficiente claridad cuáles son

los objetivos y resultados de cada una de estas fases.

En este tema se presentan algunos de los principios fundamentales para la

construcción de ontologías. Se identifican múltiples alternativas sin profundizar en

demasía en ninguna de ellas. Únicamente se realiza una descripción un poco más

detallada de una de las metodologías más utilizadas: METHONTOLOGY. Se

recomienda al alumno la lectura del tema y, a continuación, consultar alguna de las

referencias, al menos sobre METHONTOLOGY para poder tener una visión

complementaria a la aquí presentada sobre los principios de esta metodología.

El alumno interesado en profundizar tanto en METHONTOLOGY como en alguna de

las otras metodologías identificadas, dispone de las referencias adecuadas en la sección

Lo + Recomendado, las cuales puede incluso, complementar con aquellas incluidas en

+ Información.

El material contenido a continuación debe ser suficiente para conseguir el objetivo

primario de este tema: que el alumno se familiarice con los conceptos y artefactos

básicos del proceso de construcción de ontologías.

4.2. Generación manual de ontologías

La generación manual de ontologías es considerada más un arte que una técnica. Cada

Ingeniero de Conocimiento tiene su propio estilo y ello se refleja en el

resultado final. Existen sin embargo una serie de pasos que podemos considerar

como “recomendables” a la hora de crear una ontología.

Page 5: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Determinar el ámbito de actuación

Reutilización

Enumeración de los términos relevantes

Definición de una taxonomía

Identificar las propiedades de las clases que se identifiquen

Definir facetas

Definición de instancias

Comprobación de anomalías

Pasos “recomendables” a la hora de crear una ontología:

Determinar el ámbito de actuación. El desarrollo de una ontología no es un

objetivo por sí mismo. Es necesario tener muy claro cuál es el objetivo de este

desarrollo, qué es lo que queremos modelar y con qué finalidad. Aclarar estas dos

cuestiones es fundamental para centrar los esfuerzos del Ingeniero de Conocimiento.

Se puede trabajar sobre un mismo dominio y llegar a ontologías completamente

diferentes dependiendo del propósito.

Reutilización. Es importante realizar un esfuerzo importante para localizar

posibles ontologías pre-existentes y que podamos reutilizar, aunque sea

parcialmente, para la construcción de nuestra ontología objetivo.

Enumeración de los términos relevantes. Un primer paso es identificar una lista

de los términos que se utilizan en el dominio de actuación y que, por lo tanto,

pueden ser importantes en nuestra ontología. El orden no es relevante en esta lista.

Definición de una taxonomía. A partir de la lista anterior, y siempre que sea

posible, es conveniente establecer una primera relación entre términos a través de la

identificación de una taxonomía en la que se recojan los términos identificados.

Page 6: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Identificar las propiedades de las clases que se identifiquen. Por ejemplo, una

propiedad de los mamíferos es que nacen del vientre de su madre. Es importante

tener en cuenta a la hora de definir la taxonomía de clases, que todos los “hijos” de

una determinada clase deben heredar todas y cada una de sus propiedades. Eso

significa que si decimos que un oso “es un” mamífero, es decir que está por debajo

en la taxonomía, entonces estamos diciendo que los osos nacen del vientre de sus

madres.

Definir facetas. Consiste en redefinir la propiedades anteriores identificando su:

o cardinalidad

o valores requeridos

o características relacionales, como por ejemplo, simetría, transitividad, etc.

Para incluir facetas es necesario hacer uso de la potencialidad ofrecida por OWL.

Definición de instancias. Las ontologías definen las características de las clases

identificadas en un dominio. La definición de una ontología no es un objetivo por sí

mismo. Se utilizan para modelar los objetos o artefactos de un dominio siguiendo las

directrices que se establecen en la ontología. Este paso consiste en identificar las

instancias para la ontología. Podemos por ejemplo, definir una ontología para

describir el personal que trabaja y estudia en una universidad. Para ese caso, este

paso consistiría en generar una instancia por cada una de las personas concretas que

trabajan y estudian en la universidad.

Comprobación de anomalías. La ontología impone una serie de restricciones

que se pueden comprobar en las instancias que forman parte de la ontología.

Podemos, por ejemplo, verificar que un objeto cumple con las condiciones de

cardinalidad de la clase a la que pertenece, o las características relacionales, o las

restricciones de rango y dominio, etc.

Cada una de las metodologías que se presentan en la siguiente sección profundiza

más o menos en cada uno de los puntos anteriores, redefiniéndolos o extendiéndolos

según el perfil de la metodología. El establecimiento de un conjunto de reglas y

guías para la aplicación de los pasos anteriores, u otros similares, es lo que diferencia

unas metodologías de otras.

Page 7: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

4.3. Algunas metodologías

En la literatura podemos encontrar una cantidad significativa de propuestas

metodológicas para el desarrollo de ontologías. Estas propuestas están basadas, en

mayor o menor medida, en las técnicas y métodos de desarrollo propios del ámbito de

la Ingeniería de Software, tales como el proceso definido en el estándar IEEE 1074, el

Proceso Unificado de Desarrollo Software o incluso en la Programación Extrema

(Extreme Programming).

A pesar de la existencia de distintas propuestas metodológicas para la creación y

desarrollo de ontologías, el desarrollo de modelos semánticos sigue siendo un arte y no

una ciencia. Cada grupo de investigación emplea su propia metodología y no existe

un estándar claro a seguir. No obstante, sí existen propuestas más y menos

maduras y con un mayor o menor apoyo tras ellas. A continuación se describen algunas

de éstas.

Uschold y King

La propuesta realizada por Uschold y King está basada en la experiencia adquirida tras

el desarrollo de la Enterprise Ontology. Constituye una de las primeras propuestas

formales acerca de la necesidad de desarrollar una metodología para abordar el

desarrollo de un modelo semántico. El método Uschold y King se fundamenta en la

definición de un pequeño número de etapas básicas para el proceso,

centradas en la localización e identificación temprana de conceptos y

relaciones clave del dominio.

Identificación del propósito

Construcción de la ontología

Evaluación

Las distintas etapas consideradas son:

Documentación

Page 8: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Identificación del propósito: debe definirse el uso que se le va a dar, el rango

de usuarios potenciales y un conjunto de preguntas de competencia que guíen a los

desarrolladores en el proceso de creación de la ontología.

Construcción de la ontología: mediante la “Captura” de la ontología, su

“Codificación” (representación de la conceptualización en algún lenguaje formal) y

su “Integración” con ontologías existentes.

La identificación de conceptos y relaciones clave, para lo cual se recomienda seguir una estrategia de identificación middle-out, es decir, partir de los conceptos más relevantes y definir los restantes a través de procesos de generalización o especialización

Definiciones textuales precisas de los conceptos y relaciones

Identificación de términos adecuados para definir los conceptos y relaciones

Revisión y evaluación de los pasos anteriores

La Captura de la ontología consta de las siguientes actividades:

Evaluación: no se detalla esta etapa. Simplemente se referencia a la definición de

evaluación como la realización de un juicio técnico de la ontología, su contexto y

documentación asociados, con respecto a un marco de referencia (que pueden ser

especificaciones de requisitos, preguntas de competencia o bien el mundo real).

Documentación: una de las barreras más importantes que imposibilita el uso

compartido de bases de conocimiento y ontologías es la documentación deficiente.

Por ello, se considera fundamental documentar todos aquellos supuestos relevantes,

así como los principales conceptos definidos en la ontología y las primitivas usadas

para expresar las definiciones de ésta. Este modelo metodológico no especifica de

forma concreta cómo debe llevarse a cabo dicha labor de documentación.

Grüninger y Fox

Esta metodología nace a raíz de la experiencia alcanzada en el desarrollo del proyecto

TOVE (TOronto Virtual Enterprise). Considera que el proceso de creación de

ontologías está motivado por los distintos escenarios que surgen a la hora de utilizar

las aplicaciones.

Page 9: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Captura de escenarios motivadores que sirvan como muestra de los problemas a resolver

Formulación de preguntas de competencia en un lenguaje informal

Especificación de la terminología mediante la creación de un glosario de términos de utilidad

Definición de axiomas, que han de ser necesarios y suficientes para expresar las preguntas de competencia y caracterizar sus soluciones

Definición de teoremas de completitud, que describen las condiciones bajo las cuales las soluciones a las preguntas de competencia son completas.

Las distintas etapas contempladas por este método son :

On-To-Knowledge

La definición de la metodología On-To-Knowledge parte de la experiencia de sus

desarrolladores en la utilización del proceso metodológico METHONTOLOGY (ver

apartado siguiente).

Las etapas consideradas en esta metodología son las siguientes:

Estudio de viabilidad del proyecto: son muchos los aspectos, no solo técnicos,

que condicionan el éxito o fracaso de un sistema. Para analizar estos factores se

considera necesario la realización de un estudio de viabilidad. Esta parte de la

metodología está basada en el proceso metodológico CommonKADS y comprende

las actividades:

o Identificación y descripción del problema

o Estudio de viabilidad económica y técnica

o Estudio del modelo de negocio

o Decisión de las medidas organizativas y estudio de integración de la nueva

solución

Arranque: el estudio de viabilidad determina la decisión sobre si continuar o no un

determinado proyecto y sirve como punto de partida para la primera fase de

desarrollo de la ontología, el arranque o kickoff. La finalidad del arranque es la

creación de un documento que contenga información sobre el objetivo, dominio y

ámbito de la ontología, aplicaciones soportadas, fuentes de conocimiento, usuarios

potenciales, escenarios de uso y preguntas de competencia.

Page 10: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Refinamiento: en esta etapa se parte de la definición de una taxonomía base o

raíz, que se irá completando hasta obtener una ontología objetivo mediante labores

iterativas de conceptualización, formalización y refinamiento.

Evaluación: verificación del cumplimiento de los requisitos capturados en el

documento de especificación inicial (se comprueba que se satisfacen las preguntas

de competencia identificadas) y prueba del modelo definido en el entorno propio de

su aplicación.

Mantenimiento: se considera de especial importancia la existencia de una

herramienta que permita el control de distintas versiones de la ontología y la

creación de distintos grupos de desarrollo.

IDEF5

La metodología IDEF5 fue definida por Knowledge Based Systems Inc. en 1994. Su

principal objetivo es facilitar el diseño, desarrollo, modificación y

mantenimiento de ontologías. Es uno de los pocos procesos metodológicos que

tiene en cuenta el sistema entero y sus protocolos. Como los análisis ontológicos son

por necesidad procesos abiertos a múltiples interpretaciones, se considera que no es

prudente adoptar un “recetario” a seguir ciegamente en el desarrollo de ontologías. Por

ello la metodología IDEF5 es un procedimiento general que plantea una serie de

guías o hitos a conseguir.

En IDEF5 se consideran cinco actividades principales:

Organización y definición del proyecto, donde se establece el propósito, el contexto,

los objetivos, los requisitos y los aspectos de gestión del proyecto de construcción de

la ontología

Recolección de datos, donde se realiza el análisis del dominio, se consulta con

expertos y se identifican fuentes de conocimiento

Análisis de datos, donde se define una primera conceptualización informal del

dominio

Desarrollo de una ontología inicial, donde se identifican protoconceptos

Refinamiento y validación de la ontología, donde se refinan, de forma iterativa, los

protoconceptos, añadiendo relaciones y axiomas hasta que se alcanzan los objetivos

de partida

Page 11: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

SENSUS

SENSUS es una ontología definida por el Natural Language Group de la University of

Southern California orientada al desarrollo de aplicaciones de traducción de

textos. Incluye un conjunto de términos organizados en un árbol jerárquico, de tal

forma que cada concepto del árbol corresponde a un sentido determinado de una

palabra. A partir de esta ontología ha surgido una metodología de desarrollo que parte

de los conceptos abstractos definidos en SENSUS para añadirle un conjunto de

términos de nivel más bajo específicos del dominio que se desea modelar. El objetivo es

crear sistemas fácilmente integrables con otras ontologías, donde se facilite la

actualización y refactorización de éstas.

Las distintas etapas consideradas por este método son:

Elección de términos raíz , en la que el experto del dominio identifica y

selecciona una serie de términos imprescindibles

Enlace de términos raíz, donde los términos raíz son insertados bajo la jerarquía

definida por SENSUS;

Inclusión de conceptos, donde aquellos conceptos que se encuentran en la ruta

que va de los nuevos términos añadidos hasta la raíz de SENSUS son añadidos a la

ontología;

Añadido de conceptos, donde se añaden aquellos conceptos relevantes que aún

no hayan sido incluidos;

Añadido de sub-estructuras, donde se incorporan, de forma manual, aquellos

nodos recorridos por numerosas rutas y su subárbol correspondiente; y

Añadido final de conceptos, en la que se incorporan los términos que se

consideran relevantes para el dominio y que aún no hayan sido incluidos.

Noy y McGuinnes

Este método se desarrolló como ejemplo de construcción de ontologías OWL con la

herramienta Protégé. Actualmente es muy popular debido a su sencillez y, sobre todo, a

la popularidad que ha alcanzado Protégé. Considera una ontología como una

descripción explícita y formal de conceptos (clases) en un dominio de

discurso. Estas clases tienen una serie de propiedades (slots o roles), que describen

las características y atributos del concepto, y restricciones sobre los slots (facetas).

Page 12: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

En este método se proponen las siguientes actividades:

Determinación del dominio y alcance de la ontología

Consideración de reutilización de otras ontologías o modelos de metadatos

existentes

Listado de términos fundamentales

Definición de clases y jerarquía taxonómica

Definición de la propiedades de las clases

Definición de restricciones de las propiedades

Creación de instancias

DILIGENT

DILIGENT (Distributed, evolvInG and Loosely-controlled setting) no se centra en el

diseño en la fase inicial de la ontología, sino en su evolución. Considera útiles los

métodos clásicos como METHONTOLOGY u On-To-Knowledge de cara al diseño inicial

y expande estos métodos centrándose fuertemente en la visión de los usuarios y en

el uso que éstos hagan de ella, así como de los cambios que precisen realizar. Se

acentúa de esta forma el papel de una conceptualización compartida entre una amplia

comunidad de usuarios.

DILIGENT comprende cinco actividades principales:

Construcción. Creación de una versión pequeña, consensuada de la ontología a

compartir. No se requiere que esta ontología sea completa.

Adaptación local. Los usuarios trabajan con el núcleo de la ontología y lo adaptan

a sus necesidades.

Análisis. Se analizan las distintas ontologías locales y las peticiones de cambios

sugeridas por los usuarios. Un comité central identifica los patrones comunes y

selecciona los cambios a ser introducidos en la ontología común compartida.

Revisión. El comité de expertos debe revisar la ontología compartida para

garantizar que las ontologías locales no diverjan en exceso del núcleo central.

Actualización local. Los usuarios actualizan su versión local de la ontología a la

nueva versión compartida liberada.

Page 13: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

UPON

UPON (Unified Process for ONtology building) es una metodología de construcción de

ontologías basado en el bien conocido y ampliamente aceptado Proceso Unificado

de Desarrollo Software, que emplea, además, el Lenguaje de Modelado

Unificado (UML) a la hora de generar los distintos diagramas necesarios para

documentar el proceso de creación de la ontología.

El proceso es por naturaleza iterativo, puesto que cada actividad se repite

múltiples veces, centrando la atención en aspectos distintos, e incremental, puesto

que en cada ciclo la ontología es detallada con mayor precisión y extensión, y está

fuertemente orientado al empleo de casos de uso.

La naturaleza incremental de UPON requiere en primer lugar de la identificación de los

términos relevantes de un dominio, agrupados en un “lexicon”. Este lexicon será

progresivamente enriquecido con definiciones para conformar un glosario, al que se le

irán añadiendo en las distintas iteraciones las relaciones ontológicas básicas,

generándose así un “thesaurus”. Los posteriores añadidos y un proceso de

formalización final engendrarán la ontología de referencia buscada. Siguiendo la

filosofía del Proceso Unificado, podemos diferenciar ciclos, fases, iteraciones y

flujos de trabajo o secuencias (workflow).

Cada fase es a su vez dividida en distintas iteraciones, teniendo lugar dentro de cada

una de estas iteraciones, cinco flujos de trabajo distintos: requisitos, análisis,

diseño, implementación y evaluación.

Page 14: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Debe tomarse en consideración el hecho de que los flujos o secuencias de trabajo y las

fases son ortogonales en el sentido de que la contribución de cada flujo de trabajo a

una iteración de una fase puede ser más o menos significativa. Así, en las primeras

iteraciones, se realizan especialmente labores de identificación de requisitos

(identificación del dominio, ámbito de la ontología, etc.) mientras que posteriores

iteraciones se centrarán en realizar añadidos incrementales a la ontología que darán

lugar, eventualmente, a la ontología final.

4.4. Methontology

METHONTOLOGY es una metodología desarrollada por el Laboratorio de

Inteligencia Artificial de la Universidad Politécnica de Madrid, muy madura, de un alto

grado de especificidad en los pasos que plantea y apoyada por la FIPA (Foundation for

Intelligent Physical Agents). Las distintas actividades propuestas para la creación de

una ontología son divididas en las siguientes categorías:

Actividades de gestión: en esta categoría se encuentran las actividades de

planificación de las tareas a realizar y recursos necesarios, control de la realización

de dichos trabajos y verificación de la calidad del producto final.

Actividades técnicas: se orientan al desarrollo de la ontología. En esta categoría

se establecen las siguientes fases:

Especificación

Conceptualización

Implementación

Fases dentro de las actividades técnicas:

Page 15: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

o Especificación: origina un documento en el que se explicita el objetivo de la

ontología, ámbito y nivel de granularidad.

o Conceptualización: se encarga de estructurar y organizar un conjunto de

conocimientos anárquicos, empleando para ello un conjunto de representaciones

intermedias independientes de los lenguajes y entornos a utilizar en la

implementación. METHONTOLOGY presta especial atención a la especificación

de las actividades comprendidas dentro de esta categoría, estableciendo el orden

de ejecución de ésta, entre las que nos encontramos:

o Implementación: la ontología es formalmente representada mediante un

lenguaje de definición de ontologías.

Mantenimiento: en METHONTOLOGY se consideran las labores de

mantenimiento de la ontología desarrollada durante su ciclo de vida, aunque no se

establecen guías al respecto.

Page 16: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Actividades de soporte: estas actividades son efectuadas al mismo tiempo que se

desarrolla la ontología. Se engloban dentro de esta categoría procesos tales como:

adquisición del conocimiento (entrevistas con expertos, análisis de textos, etc.),

labores de integración entre distintas ontologías, gestión de la configuración para

facilitar el mantenimiento y el control de los cambios, y la labor de documentación,

vital a lo largo de todo el proceso de creación de la ontología.

Fase de Especificación

Es importante clarificar por qué se construye un modelo semántico y cuáles son sus

usos intencionados al principio del proceso de construcción El Modelo de

Especificación (es decir, el conjunto de documentos generados en esta etapa) tiene un

doble propósito: por un lado, sirve como punto de partida para las tareas iniciales de

la fase de Conceptualización y, por otro lado, se utilizará, en la fase de

Evaluación, para verificar el modelo construido. En esta fase se utiliza un lenguaje

informal, el lenguaje natural, pero debe ser lo más preciso posible. Consta de las

siguientes tareas:

Concretar el dominio de interés y el ámbito

Definir el propósito

Identificar preguntas de competencia

Identificar fuentes de información externas

Fase de especificación:

Concretar el dominio de interés y el ámbito: es importante clarificar y

delimitar, en la medida de lo posible, el dominio de interés y el ámbito del modelo

semántico desde el principio del proceso de construcción con el fin de concentrarse,

en las fases siguientes, exclusivamente en la parte del mundo (Universo de Discurso)

que se desea modelar.

Definir el propósito: concretar el uso que se le va a dar al modelo semántico en

las etapas iniciales facilita en gran medida el establecimiento de los compromisos

ontológicos adecuados a la finalidad prevista.

Page 17: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Identificar preguntas de competencia: una forma de determinar el alcance del

modelo semántico es bosquejar una lista de preguntas que la Base de Conocimiento

que utilice el modelo semántico construido deberá ser capaz de responder. Estas son

las denominadas preguntas de competencia. Estas preguntas, elaboradas en lenguaje

natural en esta fase, permiten en la fase de Evaluación, una vez formalizadas en un

lenguaje de consultas apropiado, verificar el modelo semántico construido.

Identificar fuentes de información externas: es necesario identificar fuentes

de información, modelos de datos, estándares/especificaciones u otras ontologías

externas que puedan ser de interés.

Fase de Conceptualización

El objetivo de esta fase es organizar y estructurar, de forma semi-formal, el

conocimiento tácito presente en el dominio de interés. Se utilizan en esta etapa

descripciones en lenguaje natural y representaciones gráficas que puedan ser

fácilmente interpretadas por expertos en el dominio que no estén familiarizados con la

notación propia de los formalismos matemáticos y los lenguajes de

Representación del Conocimiento.

La construcción de un modelo conceptual consistente y completo es una

operación compleja que involucra la realización de varias tareas interdependientes

(aquí sólo presentamos las más relevantes):

Construcción de un glosario

Identificación de conceptos y jerarquía de conceptos

Identificación de relaciones binarias

Identificación de reglas lógicas

Tareas dentro de la fase de conceptualización:

Page 18: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Construcción de un glosario: siempre es conveniente disponer de una lista

integral de términos pertenecientes al dominio de interés sin preocuparse

inicialmente de si estos términos representan conceptos o propiedades de conceptos.

La identificación de términos relevantes se realiza fundamentalmente a partir del

estudio de las fuentes externas en el dominio.

Identificación de conceptos y jerarquía de conceptos: a partir del glosario

de términos es necesario extraer un conjunto de conceptos (y, paralelamente, un

conjunto de relaciones entre conceptos), organizados jerárquicamente. Para la

construcción de esta jerarquía de conceptos se procede de forma gradual y evolutiva,

es decir, a partir de unos conceptos base identificados precozmente (extraídos

directamente de los términos identificados), éstos serán refinados utilizando una

estrategia híbrida que combine la técnica top-down y la técnica bottom-up.

Técnica top-down

Se identifican nuevos conceptos

especializando uno dado

Se identifican nuevos conceptos a partir de la generalización de otros

Técnica bottom-up

El resultado de esta tarea es un diccionario de conceptos que incluye su descripción

textual, sus atributos o propiedades asociadas y una representación gráfica de las

relaciones jerárquicas entre conceptos.

Identificación de relaciones binarias: la mera identificación de conceptos

aislados (o simplemente relacionados mediante asociaciones jerárquicas) no

proporciona el suficiente potencial expresivo para satisfacer las preguntas de

competencia. Es necesario identificar las relaciones existentes entre los individuos

pertenecientes a diferentes conceptos. Para estas relaciones se debe establecer,

además de su descripción textual, su dominio y rango, así como su cardinalidad.

Identificación de reglas lógicas: los conceptos y las relaciones binarias entre

conceptos no permiten representar parte del conocimiento tácito presente en el

dominio de interés (o bien es complicado representarlo utilizando exclusivamente

conceptos y relaciones). En muchas ocasiones es más apropiado y sencillo recoger el

conocimiento heurístico como reglas lógicas, que serán enunciadas como

proposiciones con un antecedente y un consecuente.

Page 19: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Fase de Formalización

Una vez obtenido el modelo conceptual del dominio de manera semi-formal, el

siguiente paso es precisarlo utilizando los mecanismos que proporciona la Lógica

Formal. En METHONTOLOGY la fase de formalización es opcional. Algunos

autores no contemplan la fase de formalización de forma independiente, pero sí utilizan

parcialmente los mecanismos de la Lógica Formal en la propia fase de

conceptualización, acompañando las descripciones textuales de los conceptos y

relaciones con descripciones formales basadas en los mecanismos de la Lógica

Descriptiva. Esta fase se descompone en dos tareas:

Definición de un modelo ontológico: los conceptos y relaciones binarias

identificadas en la fase de conceptualización se utilizarán para desarrollar un modelo

ontológico aplicando los formalismos de la Lógica Descriptiva. Asimismo, el modelo

incluirá aquellas reglas heurísticas que puedan ser representadas en Lógica

Descriptiva.

Definición de un modelo heurístico: las reglas lógicas restantes se

representarán utilizando cláusulas tipo Horn.

Fase de Codificación

El modelo formal construido en la fase anterior es necesario codificarlo en alguno de

los lenguajes recomendados por el W3C utilizando las herramientas apropiadas.

La codificación es necesaria para poder utilizar el Modelo Semántico desarrollado

con los motores de inferencia existentes. La herramienta de construcción de ontologías

más apropiada para hacer la codificación es Protégé, por su flexibilidad, versatilidad,

facilidad de uso y amplia difusión. Esta fase se descompone en dos tareas:

Desarrollo de una ontología utilizando OWL.

Definición de un conjunto de reglas utilizando SWRL.

Page 20: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Ideas clave

Fase de Evaluación

Aunque la auténtica capacidad funcional del modelo semántico desarrollado no se

puede juzgar más que tras su empleo en una aplicación determinada, es conveniente

evaluarlo antes de su utilización con el fin de determinar prematuramente

deficiencias potenciales. Los autores de Methontology proponen tres tipos de

evaluación:

La verificación de la ontología se refiere a la correcta construcción de la misma,

asegurándose de que sus definiciones implementan correctamente los requisitos de la ontología y las preguntas de competencia y funciona correctamente en el “mundo real”.

Verificación:

La validación de la ontología se refiere a si las definiciones de la ontología realmente

modelan el mundo real para el cual ha sido creada. El objetivo es probar que el modelo del mundo (si existe y es conocido) es compatible con el mundo modelado formalmente.

Validación:

La valoración de la ontología se enfoca en el enjuiciamiento del contenido de la

ontología desde el punto de vista del usuario. Diferentes tipos de usuarios y aplicaciones requieren diferentes medios de valorar una ontología.

Valoración:

Page 21: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Lo + recomendado

Lo + recomendado

No dejes de leer…

A Semantic Web Primer

Antoniou, G.; van Harmelen, F. The MIT Press. Cambridge, Massachussetts. London,

England. ISBN: 978-0-262-01242-3.

Se trata de una referencia muy complete sobre los principales asuntos tratados en este

tema. Para el estudio de este tema es especialmente relevante el capítulo 7 sobre

Ontology Engineering.

El documento está disponible en el aula virtual y en la siguiente dirección web:

http://cesimo.ing.ula.ve/~jacinto/recuperacion/sw.pdf

METHONTOLOGY: From ontological art towards ontological Engineering

FERNÁNDEZ, M.; GÓMEZ-PÉREZ, A.; JURISTO, N. AAAI Technical Report 1997.

En este artículo de los autores de METHONTOLOGY se presentan los principios

básicos de esta metodología.

El artículo está disponible en el aula virtual y en la siguiente dirección web:

http://www.aaai.org/Papers/Symposia/Spring/1997/SS-97-06/SS97-06-005.pdf

Page 22: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Lo + recomendado

Overview and analysis of methodologies for building ontologies

FERNÁNDEZ, M., & GÓMEZ, A. The Knowledge Engineering Review, 17 (2), 129-156.

En este artículo se realiza una descripción de las principales ontologías para la

construcción de ontologías.

El artículo está disponible en el aula virtual y en la siguiente dirección web:

http://www.civ.utoronto.ca/sect/coneng/i2c/Civ1283/Civ1283-Ref-Final/Civ1283-

Advanced%20Ref/Ontology/onto%20methods.pdf

Towards a Methodology for Building Ontologies

USCHOLD, M., & KING, M.. Workshopon Basic Ontological Issues in Knowledge

Sharing 1995.

En este artículo se describen los principios básicos de la metodología Uschold & King.

El artículo está disponible en el aula virtual y en la siguiente dirección web:

http://citeseer.ist.psu.edu/viewdoc/download?doi=10.1.1.55.5357&rep=rep1&type=pdf

Methodology for the Design and Evaluation of Ontologies

GRÜNINGER, M., & FOX, M. Workshop on Basic Ontological Issues in Knowledge

Sharing, IJCAI-95. Montreal.

Aquí se presenta la metodología Grüninger & Fox.

El artículo está disponible en el aula virtual y en la siguiente dirección web:

http://ibict.phlnet.com.br/anexos/grninger95methodology.pdf

Page 23: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Lo + recomendado

On-To-Knowledge Methodology -Baseline Version

SCHNURR, H., SURE, Y., STUDER, R., & AKKERMANS, H. (2000). OnToKnowledge-

Deliverable Project D15.

Documento en el que se presenta la metodología On-To-Knowledge.

El artículo está disponible en el aula virtual y en la siguiente dirección web:

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.24.3575&rep=rep1&type=p

df

IDEF5 Method Report

BENJAMIN, P., MENZEL, C., MAYER, R., FILLION, F., FUTRELL, M., DEWITE, P., et

al. (1994). Knowledge Based Systems, Inc.

Presentación de la metodología IDEF5.

El artículo está disponible en el aula virtual y en la siguiente dirección web:

http://www.idef.com/pdf/Idef5.pdf

Towards distributed use of largescale ontologies

SWARTOUT, B., RAMESH, P., KNIGHT, K., & RUSS, T. (1997). Symposium on

Ontological Engineering of AAAI.

Artículo en la que se publica la metodología SENSUS.

El artículo está disponible en el aula virtual y en la siguiente dirección web:

http://www.isi.edu/isd/banff_paper/Banff_final_web/Banff_96_final_2.html

Page 24: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Lo + recomendado

Ontology Development 101: A Guide to Creating Your First Ontology

NOY, N., & MCGUINNESS, D. (2001).. Technical Report KSL-01-05, Stanford

Knowledge Systems Laboratory.

Presentación de la metodología Noy & McGuinness.

El artículo está disponible en el aula virtual y en la siguiente dirección web:

http://www-ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noy-

mcguinness.pdf

The DILIGENT knowledge processes

VRANDECIC, D., PINTO, S., & C. TEMPICH, Y. S. (2005). Journal of Knowledge

Management, 9 (5), pp. 85-96.

Presentación de la metodología DILIGENT.

El artículo está disponible en el aula virtual y en la siguiente dirección web:

http://citeseer.ist.psu.edu/viewdoc/download?doi=10.1.1.59.5571&rep=rep1&type=pdf

A proposal for a Unified Process for Ontology building: UPON

NICOLA, A. D., MISSIKOFF, M., & NAVIGLI, R. (2005). Lecture Notes on Computer

Science, 3588, pp. 655-664.

Artículo en el que se presenta la metodología UPON.

El artículo está disponible en el aula virtual y en la siguiente dirección web:

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.154.1324&rep=rep1&type=p

df

Page 25: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Lo + recomendado

No dejes de ver…

Methontology

Presentación en la que se introducen los principios básicos

de esta metodología.

La presentación está disponible en el aula virtual y en la siguiente dirección web:

http://www.slideshare.net/enanas2382/methontology

Page 26: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – + Información

+ Información

Webgrafía

Protege Ontology Editor

Página de la herramienta para la generación de ontologías Protégé.

http://protege.stanford.edu/

Bibliografía

IEEE. (2006). IEEE Standard for Developing a Software Project Life Cycle Process.

IEEE Standard, New York (EE. UU.): Institute of Electrical and Electronics Engineers.

Jacobson, I., Booch, G., & Rumbaugh, J. (1999). The Unified Software Development

Process. Addison Wesley.

Beck, K. (1999). Extreme Programming Explained: Embrace Change. Addison-

Wesley.

Uschold, M., King, M., Moralee, S., & Zorgios, Y. (1998). The Enterprise Ontology. AIAI

Report, Artificial Intelligence Applications Institute.

Grüninger, M., & Fox, M. (1995b). The logic of enterprise modelling. In J. Brown, & D.

O'Sullivan (Eds.), Reengineering the Enterprise (pp. 83-98). Chapman and Hall.

Schreiber, G., Akkermans, H., Anjewierden, A., de-Hoog, R., Shadbolt, N., Van-de-

Velde, W. et al. (1999). Knowledge Engineering and Management: The

CommonKADS Methodology. The MIT Press.

Page 27: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – + Información

Horn, A. (1951). On Sentences Which are True of Direct Unions of Algebras. The

Journal of Symbolic Logic, 16 (1), pp. 14-21.

Baader, F., Calvanese, D., McGuinness, D.L., Nardi, D., & Patel-Schneider, P.F. (Eds.).

(2003). The Description Logic Handbook: Theory, Implementation, Applications.

Cambridge (Reino Unido): Cambridge University Press.

Page 28: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – + Actividades

Actividades

Práctica: Un primer ejemplo con methontology

En esta actividad debes aplicar algunos de los pasos de Methontology. Se trata de

realizar las primeras fases de la construcción de una ontología siguiendo esta

metodología. En particular se pide que se generen los resultados de las siguientes sub-

etapas:

Fase de especificación

o Definición de interés y ámbito

o Definición del propósito

o Identificación de preguntas de competencia

Fase de conceptualización

o Identificación de un glosario de términos

o Identificación de conceptos y jerarquía de términos

Debes elegir un dominio que te resulte familiar y que se limite la complejidad de la

actividad. Por ello únicamente es necesario que se modelen los conceptos y relaciones

más importantes. En caso de ser necesario puede consultarse con el profesor

previamente al comienzo de la actividad para delimitar la complejidad de esta tarea.

Page 29: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Test

Test

1. OWL permite la definición de facetas de una propiedad.

A. Verdadero.

B. Falso.

2. ¿Cuáles de los siguientes pasos suelen formar parte de la creación de una ontología?

A. Enumerar términos.

B. Definir una taxonomía.

C. Definir propiedades.

D. Todas las anteriores.

3. UPON es la metodología que está más fuertemente basada en el Proceso Unificado

de Desarrollo Sofware.

A. Verdadero.

B. Falso.

4. ¿A qué dominio está orientada la metodología SENSUS?

A. Traducción de textos.

B. Medicina.

C. Biología.

D. Ninguna de las anteriores.

5. ¿Cuáles de las siguientes fases forman parte de la metodología On-To-Knowledge?

A. Estudio de viabilidad.

B. Arranque.

C. Refinamiento.

D. Todas las anteriores.

6. ¿Cuáles de las siguientes fases forman parte de la metodología Uschold & King?

A. Identificación del propósito.

B. Construcción de la ontología.

C. Evaluación.

D. Todas las anteriores.

Page 30: tema4,Construcción de ontologías

Web semántica y tecnologías 2.0

TEMA 4 – Test

7. ¿Qué lenguaje se utiliza para definir una pregunta de competencia?

A. Lenguaje Natural.

B. RDF.

C. OWL.

D. Ninguna de las anteriores.

8. Identifique la fase de METHONTOLOGY en la cual se identifican preguntas de

competencia:

A. Fase de especificación.

B. Fase de conceptualización.

C. Fase de formalización.

D. Fase de codificación.

9. Identifique la fase de METHONTOLOGY en la cual se genera el glosario de términos.

A. Fase de especificación.

B. Fase de conceptualización.

C. Fase de formalización.

D. Fase de codificación.

10. Identifique el mecanismo que se utiliza para generar el modelo heurístico de

METHONTOLOGY

A. Lógica descriptiva.

B. Cláusulas tipo Horn.

C. SWRL.

D. OWL.