tema4,Construcción de ontologías
description
Transcript of tema4,Construcción de ontologías
Construcción de ontologías
[4.1] ¿Cómo estudiar este tema?
[4.2] Generación manual de ontologías
[4.3] Algunas metodologías
[4.4] Methontology
T
EM
A
Web semántica y tecnologías 2.0
TEMA 4 – Esquema
Esquema
Co
nst
rucc
ión
de
on
tolo
gía
s
Gen
era
ció
n m
an
ua
lM
eto
do
log
ías
ME
TH
ON
TO
LO
GY
IDE
F5
Fo
rmal
izac
ión
Esp
eci
fica
ció
n
Co
nce
ptu
aliz
ació
nU
sch
old
y K
ing
On
-To-
Kn
owle
dge
Grü
nin
ger
y F
oxSE
NSU
SN
oyy
Mac
Gu
inn
ess
DIL
IGE
NT
UP
ON
Co
dif
icac
ión
Eva
luac
ión
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Ideas clave
4.1. ¿Cómo estudiar este tema?
En el tema anterior se han visto técnicas básicas para la web semántica: lenguajes de
representación, consulta, inferencia, etc. La construcción de una aplicación para la Web
Semántica, comenzando por la construcción de las ontologías utilizadas, es un proceso
altamente complejo. Es por ello por lo que es necesario aplicar metodologías que,
de forma guiada, nos permitan aplicar un proceso sistemático y riguroso
para la construcción de las ontologías.
En primer lugar se presentan aquellas fases que suelen ser incluidas en la construcción
de cualquier ontología, con independencia de que se siga una metodología
determinada. El proceso de construcción de ontologías “de forma manual” es
un arte más que una técnica. Cada ingeniero de conocimiento tiene su propio estilo y
los resultados pueden ser diferentes aún cuando el objetivo es el mismo. Sin embargo
existe un conjunto de actividades que suelen incluirse, en mayor o menor medida, en el
proceso de construcción de una ontología, sea cual sea el estilo para hacerlo.
La aplicación reiterada del mismo estilo de construcción de ontologías, y el éxito de
estos estilos, provoca que acaben convirtiéndose en metodologías. Existen múltiples
metodologías para la construcción de ontologías. De hecho, la Ingeniería de
Conocimiento es un ámbito de investigación vivo, en el que todavía existen múltiples
cuestiones que deben ser resueltas. En este tema presentamos algunas de las
metodologías más empleadas, como Uschold y King, Grüninger y Fox, On-To-
Knowledge, IDEF5, SENSU, Noy y McGuinness, DILIGENT o UPON. No se trata de
métodos completamente ortogonales, sin solape entre ellos. De hecho, la situación es
más bien la contraria. La mayor parte de las metodologías comparten muchas de
sus fases y existen actividades que se repiten en unas u otras. No debe sorprendernos
este hecho cuando todas comparten el mismo objetivo: construir una ontología que
represente de la forma más cercana a la realidad un dominio o ámbito de interés.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Le dedicamos especial atención a una de estas metodologías: METHONTOLOGY. Se
trata de una metodología madura, reconocida internacionalmente e incluso avalada por
la FIPA (Foundation for Intelligent Physical Agents), y con múltiples casos de éxito.
Además es una metodología que tiene su origen en una universidad española, la
facultad de informática de la Universidad Politécnica de Madrid. En esta metodología
se identifican una serie de etapas: especificación, codificación, formalización,
codificación y evaluación. Asimismo, se define con suficiente claridad cuáles son
los objetivos y resultados de cada una de estas fases.
En este tema se presentan algunos de los principios fundamentales para la
construcción de ontologías. Se identifican múltiples alternativas sin profundizar en
demasía en ninguna de ellas. Únicamente se realiza una descripción un poco más
detallada de una de las metodologías más utilizadas: METHONTOLOGY. Se
recomienda al alumno la lectura del tema y, a continuación, consultar alguna de las
referencias, al menos sobre METHONTOLOGY para poder tener una visión
complementaria a la aquí presentada sobre los principios de esta metodología.
El alumno interesado en profundizar tanto en METHONTOLOGY como en alguna de
las otras metodologías identificadas, dispone de las referencias adecuadas en la sección
Lo + Recomendado, las cuales puede incluso, complementar con aquellas incluidas en
+ Información.
El material contenido a continuación debe ser suficiente para conseguir el objetivo
primario de este tema: que el alumno se familiarice con los conceptos y artefactos
básicos del proceso de construcción de ontologías.
4.2. Generación manual de ontologías
La generación manual de ontologías es considerada más un arte que una técnica. Cada
Ingeniero de Conocimiento tiene su propio estilo y ello se refleja en el
resultado final. Existen sin embargo una serie de pasos que podemos considerar
como “recomendables” a la hora de crear una ontología.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Determinar el ámbito de actuación
Reutilización
Enumeración de los términos relevantes
Definición de una taxonomía
Identificar las propiedades de las clases que se identifiquen
Definir facetas
Definición de instancias
Comprobación de anomalías
Pasos “recomendables” a la hora de crear una ontología:
Determinar el ámbito de actuación. El desarrollo de una ontología no es un
objetivo por sí mismo. Es necesario tener muy claro cuál es el objetivo de este
desarrollo, qué es lo que queremos modelar y con qué finalidad. Aclarar estas dos
cuestiones es fundamental para centrar los esfuerzos del Ingeniero de Conocimiento.
Se puede trabajar sobre un mismo dominio y llegar a ontologías completamente
diferentes dependiendo del propósito.
Reutilización. Es importante realizar un esfuerzo importante para localizar
posibles ontologías pre-existentes y que podamos reutilizar, aunque sea
parcialmente, para la construcción de nuestra ontología objetivo.
Enumeración de los términos relevantes. Un primer paso es identificar una lista
de los términos que se utilizan en el dominio de actuación y que, por lo tanto,
pueden ser importantes en nuestra ontología. El orden no es relevante en esta lista.
Definición de una taxonomía. A partir de la lista anterior, y siempre que sea
posible, es conveniente establecer una primera relación entre términos a través de la
identificación de una taxonomía en la que se recojan los términos identificados.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Identificar las propiedades de las clases que se identifiquen. Por ejemplo, una
propiedad de los mamíferos es que nacen del vientre de su madre. Es importante
tener en cuenta a la hora de definir la taxonomía de clases, que todos los “hijos” de
una determinada clase deben heredar todas y cada una de sus propiedades. Eso
significa que si decimos que un oso “es un” mamífero, es decir que está por debajo
en la taxonomía, entonces estamos diciendo que los osos nacen del vientre de sus
madres.
Definir facetas. Consiste en redefinir la propiedades anteriores identificando su:
o cardinalidad
o valores requeridos
o características relacionales, como por ejemplo, simetría, transitividad, etc.
Para incluir facetas es necesario hacer uso de la potencialidad ofrecida por OWL.
Definición de instancias. Las ontologías definen las características de las clases
identificadas en un dominio. La definición de una ontología no es un objetivo por sí
mismo. Se utilizan para modelar los objetos o artefactos de un dominio siguiendo las
directrices que se establecen en la ontología. Este paso consiste en identificar las
instancias para la ontología. Podemos por ejemplo, definir una ontología para
describir el personal que trabaja y estudia en una universidad. Para ese caso, este
paso consistiría en generar una instancia por cada una de las personas concretas que
trabajan y estudian en la universidad.
Comprobación de anomalías. La ontología impone una serie de restricciones
que se pueden comprobar en las instancias que forman parte de la ontología.
Podemos, por ejemplo, verificar que un objeto cumple con las condiciones de
cardinalidad de la clase a la que pertenece, o las características relacionales, o las
restricciones de rango y dominio, etc.
Cada una de las metodologías que se presentan en la siguiente sección profundiza
más o menos en cada uno de los puntos anteriores, redefiniéndolos o extendiéndolos
según el perfil de la metodología. El establecimiento de un conjunto de reglas y
guías para la aplicación de los pasos anteriores, u otros similares, es lo que diferencia
unas metodologías de otras.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
4.3. Algunas metodologías
En la literatura podemos encontrar una cantidad significativa de propuestas
metodológicas para el desarrollo de ontologías. Estas propuestas están basadas, en
mayor o menor medida, en las técnicas y métodos de desarrollo propios del ámbito de
la Ingeniería de Software, tales como el proceso definido en el estándar IEEE 1074, el
Proceso Unificado de Desarrollo Software o incluso en la Programación Extrema
(Extreme Programming).
A pesar de la existencia de distintas propuestas metodológicas para la creación y
desarrollo de ontologías, el desarrollo de modelos semánticos sigue siendo un arte y no
una ciencia. Cada grupo de investigación emplea su propia metodología y no existe
un estándar claro a seguir. No obstante, sí existen propuestas más y menos
maduras y con un mayor o menor apoyo tras ellas. A continuación se describen algunas
de éstas.
Uschold y King
La propuesta realizada por Uschold y King está basada en la experiencia adquirida tras
el desarrollo de la Enterprise Ontology. Constituye una de las primeras propuestas
formales acerca de la necesidad de desarrollar una metodología para abordar el
desarrollo de un modelo semántico. El método Uschold y King se fundamenta en la
definición de un pequeño número de etapas básicas para el proceso,
centradas en la localización e identificación temprana de conceptos y
relaciones clave del dominio.
Identificación del propósito
Construcción de la ontología
Evaluación
Las distintas etapas consideradas son:
Documentación
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Identificación del propósito: debe definirse el uso que se le va a dar, el rango
de usuarios potenciales y un conjunto de preguntas de competencia que guíen a los
desarrolladores en el proceso de creación de la ontología.
Construcción de la ontología: mediante la “Captura” de la ontología, su
“Codificación” (representación de la conceptualización en algún lenguaje formal) y
su “Integración” con ontologías existentes.
La identificación de conceptos y relaciones clave, para lo cual se recomienda seguir una estrategia de identificación middle-out, es decir, partir de los conceptos más relevantes y definir los restantes a través de procesos de generalización o especialización
Definiciones textuales precisas de los conceptos y relaciones
Identificación de términos adecuados para definir los conceptos y relaciones
Revisión y evaluación de los pasos anteriores
La Captura de la ontología consta de las siguientes actividades:
Evaluación: no se detalla esta etapa. Simplemente se referencia a la definición de
evaluación como la realización de un juicio técnico de la ontología, su contexto y
documentación asociados, con respecto a un marco de referencia (que pueden ser
especificaciones de requisitos, preguntas de competencia o bien el mundo real).
Documentación: una de las barreras más importantes que imposibilita el uso
compartido de bases de conocimiento y ontologías es la documentación deficiente.
Por ello, se considera fundamental documentar todos aquellos supuestos relevantes,
así como los principales conceptos definidos en la ontología y las primitivas usadas
para expresar las definiciones de ésta. Este modelo metodológico no especifica de
forma concreta cómo debe llevarse a cabo dicha labor de documentación.
Grüninger y Fox
Esta metodología nace a raíz de la experiencia alcanzada en el desarrollo del proyecto
TOVE (TOronto Virtual Enterprise). Considera que el proceso de creación de
ontologías está motivado por los distintos escenarios que surgen a la hora de utilizar
las aplicaciones.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Captura de escenarios motivadores que sirvan como muestra de los problemas a resolver
Formulación de preguntas de competencia en un lenguaje informal
Especificación de la terminología mediante la creación de un glosario de términos de utilidad
Definición de axiomas, que han de ser necesarios y suficientes para expresar las preguntas de competencia y caracterizar sus soluciones
Definición de teoremas de completitud, que describen las condiciones bajo las cuales las soluciones a las preguntas de competencia son completas.
Las distintas etapas contempladas por este método son :
On-To-Knowledge
La definición de la metodología On-To-Knowledge parte de la experiencia de sus
desarrolladores en la utilización del proceso metodológico METHONTOLOGY (ver
apartado siguiente).
Las etapas consideradas en esta metodología son las siguientes:
Estudio de viabilidad del proyecto: son muchos los aspectos, no solo técnicos,
que condicionan el éxito o fracaso de un sistema. Para analizar estos factores se
considera necesario la realización de un estudio de viabilidad. Esta parte de la
metodología está basada en el proceso metodológico CommonKADS y comprende
las actividades:
o Identificación y descripción del problema
o Estudio de viabilidad económica y técnica
o Estudio del modelo de negocio
o Decisión de las medidas organizativas y estudio de integración de la nueva
solución
Arranque: el estudio de viabilidad determina la decisión sobre si continuar o no un
determinado proyecto y sirve como punto de partida para la primera fase de
desarrollo de la ontología, el arranque o kickoff. La finalidad del arranque es la
creación de un documento que contenga información sobre el objetivo, dominio y
ámbito de la ontología, aplicaciones soportadas, fuentes de conocimiento, usuarios
potenciales, escenarios de uso y preguntas de competencia.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Refinamiento: en esta etapa se parte de la definición de una taxonomía base o
raíz, que se irá completando hasta obtener una ontología objetivo mediante labores
iterativas de conceptualización, formalización y refinamiento.
Evaluación: verificación del cumplimiento de los requisitos capturados en el
documento de especificación inicial (se comprueba que se satisfacen las preguntas
de competencia identificadas) y prueba del modelo definido en el entorno propio de
su aplicación.
Mantenimiento: se considera de especial importancia la existencia de una
herramienta que permita el control de distintas versiones de la ontología y la
creación de distintos grupos de desarrollo.
IDEF5
La metodología IDEF5 fue definida por Knowledge Based Systems Inc. en 1994. Su
principal objetivo es facilitar el diseño, desarrollo, modificación y
mantenimiento de ontologías. Es uno de los pocos procesos metodológicos que
tiene en cuenta el sistema entero y sus protocolos. Como los análisis ontológicos son
por necesidad procesos abiertos a múltiples interpretaciones, se considera que no es
prudente adoptar un “recetario” a seguir ciegamente en el desarrollo de ontologías. Por
ello la metodología IDEF5 es un procedimiento general que plantea una serie de
guías o hitos a conseguir.
En IDEF5 se consideran cinco actividades principales:
Organización y definición del proyecto, donde se establece el propósito, el contexto,
los objetivos, los requisitos y los aspectos de gestión del proyecto de construcción de
la ontología
Recolección de datos, donde se realiza el análisis del dominio, se consulta con
expertos y se identifican fuentes de conocimiento
Análisis de datos, donde se define una primera conceptualización informal del
dominio
Desarrollo de una ontología inicial, donde se identifican protoconceptos
Refinamiento y validación de la ontología, donde se refinan, de forma iterativa, los
protoconceptos, añadiendo relaciones y axiomas hasta que se alcanzan los objetivos
de partida
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
SENSUS
SENSUS es una ontología definida por el Natural Language Group de la University of
Southern California orientada al desarrollo de aplicaciones de traducción de
textos. Incluye un conjunto de términos organizados en un árbol jerárquico, de tal
forma que cada concepto del árbol corresponde a un sentido determinado de una
palabra. A partir de esta ontología ha surgido una metodología de desarrollo que parte
de los conceptos abstractos definidos en SENSUS para añadirle un conjunto de
términos de nivel más bajo específicos del dominio que se desea modelar. El objetivo es
crear sistemas fácilmente integrables con otras ontologías, donde se facilite la
actualización y refactorización de éstas.
Las distintas etapas consideradas por este método son:
Elección de términos raíz , en la que el experto del dominio identifica y
selecciona una serie de términos imprescindibles
Enlace de términos raíz, donde los términos raíz son insertados bajo la jerarquía
definida por SENSUS;
Inclusión de conceptos, donde aquellos conceptos que se encuentran en la ruta
que va de los nuevos términos añadidos hasta la raíz de SENSUS son añadidos a la
ontología;
Añadido de conceptos, donde se añaden aquellos conceptos relevantes que aún
no hayan sido incluidos;
Añadido de sub-estructuras, donde se incorporan, de forma manual, aquellos
nodos recorridos por numerosas rutas y su subárbol correspondiente; y
Añadido final de conceptos, en la que se incorporan los términos que se
consideran relevantes para el dominio y que aún no hayan sido incluidos.
Noy y McGuinnes
Este método se desarrolló como ejemplo de construcción de ontologías OWL con la
herramienta Protégé. Actualmente es muy popular debido a su sencillez y, sobre todo, a
la popularidad que ha alcanzado Protégé. Considera una ontología como una
descripción explícita y formal de conceptos (clases) en un dominio de
discurso. Estas clases tienen una serie de propiedades (slots o roles), que describen
las características y atributos del concepto, y restricciones sobre los slots (facetas).
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
En este método se proponen las siguientes actividades:
Determinación del dominio y alcance de la ontología
Consideración de reutilización de otras ontologías o modelos de metadatos
existentes
Listado de términos fundamentales
Definición de clases y jerarquía taxonómica
Definición de la propiedades de las clases
Definición de restricciones de las propiedades
Creación de instancias
DILIGENT
DILIGENT (Distributed, evolvInG and Loosely-controlled setting) no se centra en el
diseño en la fase inicial de la ontología, sino en su evolución. Considera útiles los
métodos clásicos como METHONTOLOGY u On-To-Knowledge de cara al diseño inicial
y expande estos métodos centrándose fuertemente en la visión de los usuarios y en
el uso que éstos hagan de ella, así como de los cambios que precisen realizar. Se
acentúa de esta forma el papel de una conceptualización compartida entre una amplia
comunidad de usuarios.
DILIGENT comprende cinco actividades principales:
Construcción. Creación de una versión pequeña, consensuada de la ontología a
compartir. No se requiere que esta ontología sea completa.
Adaptación local. Los usuarios trabajan con el núcleo de la ontología y lo adaptan
a sus necesidades.
Análisis. Se analizan las distintas ontologías locales y las peticiones de cambios
sugeridas por los usuarios. Un comité central identifica los patrones comunes y
selecciona los cambios a ser introducidos en la ontología común compartida.
Revisión. El comité de expertos debe revisar la ontología compartida para
garantizar que las ontologías locales no diverjan en exceso del núcleo central.
Actualización local. Los usuarios actualizan su versión local de la ontología a la
nueva versión compartida liberada.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
UPON
UPON (Unified Process for ONtology building) es una metodología de construcción de
ontologías basado en el bien conocido y ampliamente aceptado Proceso Unificado
de Desarrollo Software, que emplea, además, el Lenguaje de Modelado
Unificado (UML) a la hora de generar los distintos diagramas necesarios para
documentar el proceso de creación de la ontología.
El proceso es por naturaleza iterativo, puesto que cada actividad se repite
múltiples veces, centrando la atención en aspectos distintos, e incremental, puesto
que en cada ciclo la ontología es detallada con mayor precisión y extensión, y está
fuertemente orientado al empleo de casos de uso.
La naturaleza incremental de UPON requiere en primer lugar de la identificación de los
términos relevantes de un dominio, agrupados en un “lexicon”. Este lexicon será
progresivamente enriquecido con definiciones para conformar un glosario, al que se le
irán añadiendo en las distintas iteraciones las relaciones ontológicas básicas,
generándose así un “thesaurus”. Los posteriores añadidos y un proceso de
formalización final engendrarán la ontología de referencia buscada. Siguiendo la
filosofía del Proceso Unificado, podemos diferenciar ciclos, fases, iteraciones y
flujos de trabajo o secuencias (workflow).
Cada fase es a su vez dividida en distintas iteraciones, teniendo lugar dentro de cada
una de estas iteraciones, cinco flujos de trabajo distintos: requisitos, análisis,
diseño, implementación y evaluación.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Debe tomarse en consideración el hecho de que los flujos o secuencias de trabajo y las
fases son ortogonales en el sentido de que la contribución de cada flujo de trabajo a
una iteración de una fase puede ser más o menos significativa. Así, en las primeras
iteraciones, se realizan especialmente labores de identificación de requisitos
(identificación del dominio, ámbito de la ontología, etc.) mientras que posteriores
iteraciones se centrarán en realizar añadidos incrementales a la ontología que darán
lugar, eventualmente, a la ontología final.
4.4. Methontology
METHONTOLOGY es una metodología desarrollada por el Laboratorio de
Inteligencia Artificial de la Universidad Politécnica de Madrid, muy madura, de un alto
grado de especificidad en los pasos que plantea y apoyada por la FIPA (Foundation for
Intelligent Physical Agents). Las distintas actividades propuestas para la creación de
una ontología son divididas en las siguientes categorías:
Actividades de gestión: en esta categoría se encuentran las actividades de
planificación de las tareas a realizar y recursos necesarios, control de la realización
de dichos trabajos y verificación de la calidad del producto final.
Actividades técnicas: se orientan al desarrollo de la ontología. En esta categoría
se establecen las siguientes fases:
Especificación
Conceptualización
Implementación
Fases dentro de las actividades técnicas:
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
o Especificación: origina un documento en el que se explicita el objetivo de la
ontología, ámbito y nivel de granularidad.
o Conceptualización: se encarga de estructurar y organizar un conjunto de
conocimientos anárquicos, empleando para ello un conjunto de representaciones
intermedias independientes de los lenguajes y entornos a utilizar en la
implementación. METHONTOLOGY presta especial atención a la especificación
de las actividades comprendidas dentro de esta categoría, estableciendo el orden
de ejecución de ésta, entre las que nos encontramos:
o Implementación: la ontología es formalmente representada mediante un
lenguaje de definición de ontologías.
Mantenimiento: en METHONTOLOGY se consideran las labores de
mantenimiento de la ontología desarrollada durante su ciclo de vida, aunque no se
establecen guías al respecto.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Actividades de soporte: estas actividades son efectuadas al mismo tiempo que se
desarrolla la ontología. Se engloban dentro de esta categoría procesos tales como:
adquisición del conocimiento (entrevistas con expertos, análisis de textos, etc.),
labores de integración entre distintas ontologías, gestión de la configuración para
facilitar el mantenimiento y el control de los cambios, y la labor de documentación,
vital a lo largo de todo el proceso de creación de la ontología.
Fase de Especificación
Es importante clarificar por qué se construye un modelo semántico y cuáles son sus
usos intencionados al principio del proceso de construcción El Modelo de
Especificación (es decir, el conjunto de documentos generados en esta etapa) tiene un
doble propósito: por un lado, sirve como punto de partida para las tareas iniciales de
la fase de Conceptualización y, por otro lado, se utilizará, en la fase de
Evaluación, para verificar el modelo construido. En esta fase se utiliza un lenguaje
informal, el lenguaje natural, pero debe ser lo más preciso posible. Consta de las
siguientes tareas:
Concretar el dominio de interés y el ámbito
Definir el propósito
Identificar preguntas de competencia
Identificar fuentes de información externas
Fase de especificación:
Concretar el dominio de interés y el ámbito: es importante clarificar y
delimitar, en la medida de lo posible, el dominio de interés y el ámbito del modelo
semántico desde el principio del proceso de construcción con el fin de concentrarse,
en las fases siguientes, exclusivamente en la parte del mundo (Universo de Discurso)
que se desea modelar.
Definir el propósito: concretar el uso que se le va a dar al modelo semántico en
las etapas iniciales facilita en gran medida el establecimiento de los compromisos
ontológicos adecuados a la finalidad prevista.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Identificar preguntas de competencia: una forma de determinar el alcance del
modelo semántico es bosquejar una lista de preguntas que la Base de Conocimiento
que utilice el modelo semántico construido deberá ser capaz de responder. Estas son
las denominadas preguntas de competencia. Estas preguntas, elaboradas en lenguaje
natural en esta fase, permiten en la fase de Evaluación, una vez formalizadas en un
lenguaje de consultas apropiado, verificar el modelo semántico construido.
Identificar fuentes de información externas: es necesario identificar fuentes
de información, modelos de datos, estándares/especificaciones u otras ontologías
externas que puedan ser de interés.
Fase de Conceptualización
El objetivo de esta fase es organizar y estructurar, de forma semi-formal, el
conocimiento tácito presente en el dominio de interés. Se utilizan en esta etapa
descripciones en lenguaje natural y representaciones gráficas que puedan ser
fácilmente interpretadas por expertos en el dominio que no estén familiarizados con la
notación propia de los formalismos matemáticos y los lenguajes de
Representación del Conocimiento.
La construcción de un modelo conceptual consistente y completo es una
operación compleja que involucra la realización de varias tareas interdependientes
(aquí sólo presentamos las más relevantes):
Construcción de un glosario
Identificación de conceptos y jerarquía de conceptos
Identificación de relaciones binarias
Identificación de reglas lógicas
Tareas dentro de la fase de conceptualización:
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Construcción de un glosario: siempre es conveniente disponer de una lista
integral de términos pertenecientes al dominio de interés sin preocuparse
inicialmente de si estos términos representan conceptos o propiedades de conceptos.
La identificación de términos relevantes se realiza fundamentalmente a partir del
estudio de las fuentes externas en el dominio.
Identificación de conceptos y jerarquía de conceptos: a partir del glosario
de términos es necesario extraer un conjunto de conceptos (y, paralelamente, un
conjunto de relaciones entre conceptos), organizados jerárquicamente. Para la
construcción de esta jerarquía de conceptos se procede de forma gradual y evolutiva,
es decir, a partir de unos conceptos base identificados precozmente (extraídos
directamente de los términos identificados), éstos serán refinados utilizando una
estrategia híbrida que combine la técnica top-down y la técnica bottom-up.
Técnica top-down
Se identifican nuevos conceptos
especializando uno dado
Se identifican nuevos conceptos a partir de la generalización de otros
Técnica bottom-up
El resultado de esta tarea es un diccionario de conceptos que incluye su descripción
textual, sus atributos o propiedades asociadas y una representación gráfica de las
relaciones jerárquicas entre conceptos.
Identificación de relaciones binarias: la mera identificación de conceptos
aislados (o simplemente relacionados mediante asociaciones jerárquicas) no
proporciona el suficiente potencial expresivo para satisfacer las preguntas de
competencia. Es necesario identificar las relaciones existentes entre los individuos
pertenecientes a diferentes conceptos. Para estas relaciones se debe establecer,
además de su descripción textual, su dominio y rango, así como su cardinalidad.
Identificación de reglas lógicas: los conceptos y las relaciones binarias entre
conceptos no permiten representar parte del conocimiento tácito presente en el
dominio de interés (o bien es complicado representarlo utilizando exclusivamente
conceptos y relaciones). En muchas ocasiones es más apropiado y sencillo recoger el
conocimiento heurístico como reglas lógicas, que serán enunciadas como
proposiciones con un antecedente y un consecuente.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Fase de Formalización
Una vez obtenido el modelo conceptual del dominio de manera semi-formal, el
siguiente paso es precisarlo utilizando los mecanismos que proporciona la Lógica
Formal. En METHONTOLOGY la fase de formalización es opcional. Algunos
autores no contemplan la fase de formalización de forma independiente, pero sí utilizan
parcialmente los mecanismos de la Lógica Formal en la propia fase de
conceptualización, acompañando las descripciones textuales de los conceptos y
relaciones con descripciones formales basadas en los mecanismos de la Lógica
Descriptiva. Esta fase se descompone en dos tareas:
Definición de un modelo ontológico: los conceptos y relaciones binarias
identificadas en la fase de conceptualización se utilizarán para desarrollar un modelo
ontológico aplicando los formalismos de la Lógica Descriptiva. Asimismo, el modelo
incluirá aquellas reglas heurísticas que puedan ser representadas en Lógica
Descriptiva.
Definición de un modelo heurístico: las reglas lógicas restantes se
representarán utilizando cláusulas tipo Horn.
Fase de Codificación
El modelo formal construido en la fase anterior es necesario codificarlo en alguno de
los lenguajes recomendados por el W3C utilizando las herramientas apropiadas.
La codificación es necesaria para poder utilizar el Modelo Semántico desarrollado
con los motores de inferencia existentes. La herramienta de construcción de ontologías
más apropiada para hacer la codificación es Protégé, por su flexibilidad, versatilidad,
facilidad de uso y amplia difusión. Esta fase se descompone en dos tareas:
Desarrollo de una ontología utilizando OWL.
Definición de un conjunto de reglas utilizando SWRL.
Web semántica y tecnologías 2.0
TEMA 4 – Ideas clave
Fase de Evaluación
Aunque la auténtica capacidad funcional del modelo semántico desarrollado no se
puede juzgar más que tras su empleo en una aplicación determinada, es conveniente
evaluarlo antes de su utilización con el fin de determinar prematuramente
deficiencias potenciales. Los autores de Methontology proponen tres tipos de
evaluación:
La verificación de la ontología se refiere a la correcta construcción de la misma,
asegurándose de que sus definiciones implementan correctamente los requisitos de la ontología y las preguntas de competencia y funciona correctamente en el “mundo real”.
Verificación:
La validación de la ontología se refiere a si las definiciones de la ontología realmente
modelan el mundo real para el cual ha sido creada. El objetivo es probar que el modelo del mundo (si existe y es conocido) es compatible con el mundo modelado formalmente.
Validación:
La valoración de la ontología se enfoca en el enjuiciamiento del contenido de la
ontología desde el punto de vista del usuario. Diferentes tipos de usuarios y aplicaciones requieren diferentes medios de valorar una ontología.
Valoración:
Web semántica y tecnologías 2.0
TEMA 4 – Lo + recomendado
Lo + recomendado
No dejes de leer…
A Semantic Web Primer
Antoniou, G.; van Harmelen, F. The MIT Press. Cambridge, Massachussetts. London,
England. ISBN: 978-0-262-01242-3.
Se trata de una referencia muy complete sobre los principales asuntos tratados en este
tema. Para el estudio de este tema es especialmente relevante el capítulo 7 sobre
Ontology Engineering.
El documento está disponible en el aula virtual y en la siguiente dirección web:
http://cesimo.ing.ula.ve/~jacinto/recuperacion/sw.pdf
METHONTOLOGY: From ontological art towards ontological Engineering
FERNÁNDEZ, M.; GÓMEZ-PÉREZ, A.; JURISTO, N. AAAI Technical Report 1997.
En este artículo de los autores de METHONTOLOGY se presentan los principios
básicos de esta metodología.
El artículo está disponible en el aula virtual y en la siguiente dirección web:
http://www.aaai.org/Papers/Symposia/Spring/1997/SS-97-06/SS97-06-005.pdf
Web semántica y tecnologías 2.0
TEMA 4 – Lo + recomendado
Overview and analysis of methodologies for building ontologies
FERNÁNDEZ, M., & GÓMEZ, A. The Knowledge Engineering Review, 17 (2), 129-156.
En este artículo se realiza una descripción de las principales ontologías para la
construcción de ontologías.
El artículo está disponible en el aula virtual y en la siguiente dirección web:
http://www.civ.utoronto.ca/sect/coneng/i2c/Civ1283/Civ1283-Ref-Final/Civ1283-
Advanced%20Ref/Ontology/onto%20methods.pdf
Towards a Methodology for Building Ontologies
USCHOLD, M., & KING, M.. Workshopon Basic Ontological Issues in Knowledge
Sharing 1995.
En este artículo se describen los principios básicos de la metodología Uschold & King.
El artículo está disponible en el aula virtual y en la siguiente dirección web:
http://citeseer.ist.psu.edu/viewdoc/download?doi=10.1.1.55.5357&rep=rep1&type=pdf
Methodology for the Design and Evaluation of Ontologies
GRÜNINGER, M., & FOX, M. Workshop on Basic Ontological Issues in Knowledge
Sharing, IJCAI-95. Montreal.
Aquí se presenta la metodología Grüninger & Fox.
El artículo está disponible en el aula virtual y en la siguiente dirección web:
http://ibict.phlnet.com.br/anexos/grninger95methodology.pdf
Web semántica y tecnologías 2.0
TEMA 4 – Lo + recomendado
On-To-Knowledge Methodology -Baseline Version
SCHNURR, H., SURE, Y., STUDER, R., & AKKERMANS, H. (2000). OnToKnowledge-
Deliverable Project D15.
Documento en el que se presenta la metodología On-To-Knowledge.
El artículo está disponible en el aula virtual y en la siguiente dirección web:
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.24.3575&rep=rep1&type=p
df
IDEF5 Method Report
BENJAMIN, P., MENZEL, C., MAYER, R., FILLION, F., FUTRELL, M., DEWITE, P., et
al. (1994). Knowledge Based Systems, Inc.
Presentación de la metodología IDEF5.
El artículo está disponible en el aula virtual y en la siguiente dirección web:
http://www.idef.com/pdf/Idef5.pdf
Towards distributed use of largescale ontologies
SWARTOUT, B., RAMESH, P., KNIGHT, K., & RUSS, T. (1997). Symposium on
Ontological Engineering of AAAI.
Artículo en la que se publica la metodología SENSUS.
El artículo está disponible en el aula virtual y en la siguiente dirección web:
http://www.isi.edu/isd/banff_paper/Banff_final_web/Banff_96_final_2.html
Web semántica y tecnologías 2.0
TEMA 4 – Lo + recomendado
Ontology Development 101: A Guide to Creating Your First Ontology
NOY, N., & MCGUINNESS, D. (2001).. Technical Report KSL-01-05, Stanford
Knowledge Systems Laboratory.
Presentación de la metodología Noy & McGuinness.
El artículo está disponible en el aula virtual y en la siguiente dirección web:
http://www-ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noy-
mcguinness.pdf
The DILIGENT knowledge processes
VRANDECIC, D., PINTO, S., & C. TEMPICH, Y. S. (2005). Journal of Knowledge
Management, 9 (5), pp. 85-96.
Presentación de la metodología DILIGENT.
El artículo está disponible en el aula virtual y en la siguiente dirección web:
http://citeseer.ist.psu.edu/viewdoc/download?doi=10.1.1.59.5571&rep=rep1&type=pdf
A proposal for a Unified Process for Ontology building: UPON
NICOLA, A. D., MISSIKOFF, M., & NAVIGLI, R. (2005). Lecture Notes on Computer
Science, 3588, pp. 655-664.
Artículo en el que se presenta la metodología UPON.
El artículo está disponible en el aula virtual y en la siguiente dirección web:
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.154.1324&rep=rep1&type=p
df
Web semántica y tecnologías 2.0
TEMA 4 – Lo + recomendado
No dejes de ver…
Methontology
Presentación en la que se introducen los principios básicos
de esta metodología.
La presentación está disponible en el aula virtual y en la siguiente dirección web:
http://www.slideshare.net/enanas2382/methontology
Web semántica y tecnologías 2.0
TEMA 4 – + Información
+ Información
Webgrafía
Protege Ontology Editor
Página de la herramienta para la generación de ontologías Protégé.
http://protege.stanford.edu/
Bibliografía
IEEE. (2006). IEEE Standard for Developing a Software Project Life Cycle Process.
IEEE Standard, New York (EE. UU.): Institute of Electrical and Electronics Engineers.
Jacobson, I., Booch, G., & Rumbaugh, J. (1999). The Unified Software Development
Process. Addison Wesley.
Beck, K. (1999). Extreme Programming Explained: Embrace Change. Addison-
Wesley.
Uschold, M., King, M., Moralee, S., & Zorgios, Y. (1998). The Enterprise Ontology. AIAI
Report, Artificial Intelligence Applications Institute.
Grüninger, M., & Fox, M. (1995b). The logic of enterprise modelling. In J. Brown, & D.
O'Sullivan (Eds.), Reengineering the Enterprise (pp. 83-98). Chapman and Hall.
Schreiber, G., Akkermans, H., Anjewierden, A., de-Hoog, R., Shadbolt, N., Van-de-
Velde, W. et al. (1999). Knowledge Engineering and Management: The
CommonKADS Methodology. The MIT Press.
Web semántica y tecnologías 2.0
TEMA 4 – + Información
Horn, A. (1951). On Sentences Which are True of Direct Unions of Algebras. The
Journal of Symbolic Logic, 16 (1), pp. 14-21.
Baader, F., Calvanese, D., McGuinness, D.L., Nardi, D., & Patel-Schneider, P.F. (Eds.).
(2003). The Description Logic Handbook: Theory, Implementation, Applications.
Cambridge (Reino Unido): Cambridge University Press.
Web semántica y tecnologías 2.0
TEMA 4 – + Actividades
Actividades
Práctica: Un primer ejemplo con methontology
En esta actividad debes aplicar algunos de los pasos de Methontology. Se trata de
realizar las primeras fases de la construcción de una ontología siguiendo esta
metodología. En particular se pide que se generen los resultados de las siguientes sub-
etapas:
Fase de especificación
o Definición de interés y ámbito
o Definición del propósito
o Identificación de preguntas de competencia
Fase de conceptualización
o Identificación de un glosario de términos
o Identificación de conceptos y jerarquía de términos
Debes elegir un dominio que te resulte familiar y que se limite la complejidad de la
actividad. Por ello únicamente es necesario que se modelen los conceptos y relaciones
más importantes. En caso de ser necesario puede consultarse con el profesor
previamente al comienzo de la actividad para delimitar la complejidad de esta tarea.
Web semántica y tecnologías 2.0
TEMA 4 – Test
Test
1. OWL permite la definición de facetas de una propiedad.
A. Verdadero.
B. Falso.
2. ¿Cuáles de los siguientes pasos suelen formar parte de la creación de una ontología?
A. Enumerar términos.
B. Definir una taxonomía.
C. Definir propiedades.
D. Todas las anteriores.
3. UPON es la metodología que está más fuertemente basada en el Proceso Unificado
de Desarrollo Sofware.
A. Verdadero.
B. Falso.
4. ¿A qué dominio está orientada la metodología SENSUS?
A. Traducción de textos.
B. Medicina.
C. Biología.
D. Ninguna de las anteriores.
5. ¿Cuáles de las siguientes fases forman parte de la metodología On-To-Knowledge?
A. Estudio de viabilidad.
B. Arranque.
C. Refinamiento.
D. Todas las anteriores.
6. ¿Cuáles de las siguientes fases forman parte de la metodología Uschold & King?
A. Identificación del propósito.
B. Construcción de la ontología.
C. Evaluación.
D. Todas las anteriores.
Web semántica y tecnologías 2.0
TEMA 4 – Test
7. ¿Qué lenguaje se utiliza para definir una pregunta de competencia?
A. Lenguaje Natural.
B. RDF.
C. OWL.
D. Ninguna de las anteriores.
8. Identifique la fase de METHONTOLOGY en la cual se identifican preguntas de
competencia:
A. Fase de especificación.
B. Fase de conceptualización.
C. Fase de formalización.
D. Fase de codificación.
9. Identifique la fase de METHONTOLOGY en la cual se genera el glosario de términos.
A. Fase de especificación.
B. Fase de conceptualización.
C. Fase de formalización.
D. Fase de codificación.
10. Identifique el mecanismo que se utiliza para generar el modelo heurístico de
METHONTOLOGY
A. Lógica descriptiva.
B. Cláusulas tipo Horn.
C. SWRL.
D. OWL.