REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase...

13
REPORTE FINAL Análisis Espacial basado en representaciones conceptuales de datos geográficos Proyecto SIP 20082480 Dr. Marco Antonio Moreno Ibarra [email protected] Centro de Investigación en Computación Resumen El proyecto consistió en el desarrollo de una metodología para realizar análisis espacial utilizando una representación conceptual (ontología) de los datos geográficos. A diferencia de otros métodos de análisis de datos geográficos, éste evita algunos aspectos que tradicionalmente como la alta especialización que se requiere. El método utiliza un perfil de usuario donde se describen las preferencias para realizar el análisis a los datos e incluye tanto aspectos descriptivos como geo- espaciales. Se utiliza una medida de similitud semántica denominada confusión. En específico se mide la distancia conceptual entre lo que el usuario desea y lo que contiene la base de datos del sistema (las instancias de los conceptos de la ontología), permitiendo ordenar los resultados de acuerdo al grado de similitud con el perfil de cada usuario. Para construir la ontología, nos basamos en una conceptualización realizada por un experto, enfocándonos principalmente en las relaciones espaciales y atributos descriptivos que poseen los componentes del domino. La metodología propuesta se implantó en el entorno de Google Maps y el caso de estudio considerado es la localización del lugar idóneo para colocar una cafetería. Introducción Recientemente los Sistemas de Información Geográfica (GIS) han tenido un desarrollo importante, no obstante existen limitaciones en las representaciones de los datos geográficos, que afectan elementos muy importantes para cualquier sistema de información como la modelación, el análisis y la consulta [20]. Adicionalmente, las operaciones de análisis espacial, presentan algunas dificultades como: requieren alta especialización de los usuarios, dependen de la representación de los datos geográficos y se basan en procesamiento numérico. Esto se debe a que se utilizan elementos de la cartografía tradicional como escalas, proyecciones, sistemas de referencia y primitivas geométricas de representación. Frecuentemente, al interpretar y analizar los datos aparecen ambigüedades, debido a que son generados para propósitos específicos utilizando diferentes estándares. Gran parte de los análisis geográficos se basan en las relaciones espaciales entre las diferentes entidades geográficas [19] y desafortunadamente en las representaciones tradicionales éstas son omitidas y únicamente aparecen de forma implícita, limitando la complejidad de las consultas que pueden implantarse. Adicionalmente, los mecanismos de consulta en los GIS tradicionales se desarrollan sin considerar que cada usuario tiene diferentes necesidades de información. Considerando lo anterior, el presente trabajo aborda los tópicos de representación de los datos geográficos, análisis espacial y las preferencias de los usuarios, abordándolos desde el punto de vista del procesamiento semántico de datos geoespaciales. En particular se utilizan algunas funciones para medir la similitud semántica. La semántica ésta jugando un papel muy importante en las tecnologías de la información [3] ya que puede aplicarse a la representación, integración y análisis de los datos geo- espaciales [1]. A diferencia de trabajos previos en donde la información se manipulaba basándose en mecanismos sintácticos, existe un creciente interés por incrementar en rol de la semántica en la manipulación de información, en donde el significado se asocia con los datos y los términos utilizados en las consultas. Uno de los aspectos más útiles para desarrollar métodos basados en la semántica son las ontologías de dominios específicos. Una ontología puede verse como un tipo de base de conocimiento que describe conceptos por medio de definiciones que son suficientemente detalladas para capturar la semántica de un dominio en particular [15]. El caso de estudio a considerar es la localización del lugar idóneo para colocar un negocio de acuerdo al perfil que tenga cada usuario, considerando tanto aspectos

Transcript of REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase...

Page 1: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

REPORTE FINAL

Análisis Espacial basado en representaciones conceptuales de datos geográficos

Proyecto SIP 20082480

Dr. Marco Antonio Moreno Ibarra [email protected]

Centro de Investigación en Computación Resumen El proyecto consistió en el desarrollo de una metodología para realizar análisis espacial utilizando

una representación conceptual (ontología) de los datos geográficos. A diferencia de otros métodos de análisis de datos geográficos, éste evita algunos aspectos que tradicionalmente como la alta especialización que se requiere. El método utiliza un perfil de usuario donde se describen las preferencias para realizar el análisis a los datos e incluye tanto aspectos descriptivos como geo-espaciales. Se utiliza una medida de similitud semántica denominada confusión. En específico se mide la distancia conceptual entre lo que el usuario desea y lo que contiene la base de datos del sistema (las instancias de los conceptos de la ontología), permitiendo ordenar los resultados de acuerdo al grado de similitud con el perfil de cada usuario. Para construir la ontología, nos basamos en una conceptualización realizada por un experto, enfocándonos principalmente en las relaciones espaciales y atributos descriptivos que poseen los componentes del domino. La metodología propuesta se implantó en el entorno de Google Maps y el caso de estudio considerado es la localización del lugar idóneo para colocar una cafetería.

Introducción Recientemente los Sistemas de Información Geográfica (GIS) han tenido un desarrollo importante, no

obstante existen limitaciones en las representaciones de los datos geográficos, que afectan elementos muy importantes para cualquier sistema de información como la modelación, el análisis y la consulta [20]. Adicionalmente, las operaciones de análisis espacial, presentan algunas dificultades como: requieren alta especialización de los usuarios, dependen de la representación de los datos geográficos y se basan en procesamiento numérico. Esto se debe a que se utilizan elementos de la cartografía tradicional como escalas, proyecciones, sistemas de referencia y primitivas geométricas de representación. Frecuentemente, al interpretar y analizar los datos aparecen ambigüedades, debido a que son generados para propósitos específicos utilizando diferentes estándares. Gran parte de los análisis geográficos se basan en las relaciones espaciales entre las diferentes entidades geográficas [19] y desafortunadamente en las representaciones tradicionales éstas son omitidas y únicamente aparecen de forma implícita, limitando la complejidad de las consultas que pueden implantarse. Adicionalmente, los mecanismos de consulta en los GIS tradicionales se desarrollan sin considerar que cada usuario tiene diferentes necesidades de información.

Considerando lo anterior, el presente trabajo aborda los tópicos de representación de los datos geográficos, análisis espacial y las preferencias de los usuarios, abordándolos desde el punto de vista del procesamiento semántico de datos geoespaciales. En particular se utilizan algunas funciones para medir la similitud semántica. La semántica ésta jugando un papel muy importante en las tecnologías de la información [3] ya que puede aplicarse a la representación, integración y análisis de los datos geo-espaciales [1]. A diferencia de trabajos previos en donde la información se manipulaba basándose en mecanismos sintácticos, existe un creciente interés por incrementar en rol de la semántica en la manipulación de información, en donde el significado se asocia con los datos y los términos utilizados en las consultas. Uno de los aspectos más útiles para desarrollar métodos basados en la semántica son las ontologías de dominios específicos. Una ontología puede verse como un tipo de base de conocimiento que describe conceptos por medio de definiciones que son suficientemente detalladas para capturar la semántica de un dominio en particular [15]. El caso de estudio a considerar es la localización del lugar idóneo para colocar un negocio de acuerdo al perfil que tenga cada usuario, considerando tanto aspectos

Page 2: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

descriptivos como espaciales. La metodología propuesta debe ser implantada en el entorno de Google Maps.

Metodología La metodología que presentamos tiene como propósito mejorar las capacidades analíticas de un

Sistema de Información Geográfica. En este caso, el análisis espacial se realiza sobre una representación conceptual denominada base de datos espacial conceptual (BDEC). La cual describe las relaciones espaciales de los objetos geográficos y se genera a partir de la Base de Datos Espacial (BDE). En la representación conceptual consideramos propiedades y aspectos topológicos de los objetos geográficos. El análisis considera el perfil del usuario, que puede incluir datos personales, intereses y preferencias [18]. En este caso el perfil se compone de requerimientos descriptivos y requerimientos espaciales.

Incorporamos una representación conceptual que contiene tuplas denominadas descripciones semánticas. Estas descripciones representan las relaciones espaciales existentes entre los objetos geográficos de acuerdo a una conceptualización. Utilizándola la teoría de confusión se puede evaluar la similitud semántica entre los requerimientos del usuario y las descripciones semánticas de la BDEC. Con lo que se obtiene un conjunto de valores que permiten interpretar que tan similares son los requerimientos del usuario con la base de datos del sistema. De esta forma, en caso de no encontrar una respuesta exacta de acuerdo con los requerimientos del usuario, se proponen resultados que sean lo más similares a lo que definió el usuario en su perfil, ver Figura 1.

  Fig. 1. Metodología para analizar datos geográficos sobre representaciones conceptuales

Conceptualización del dominio

Para este trabajo el dominio geográfico está interesado en modelado de inmuebles disponibles para

negocios. Con este dominio geográfico obtenemos una conceptualización, dicha conceptualización permite hacer una ontología del dominio geográfico. Definimos la conceptualización con ayuda de un experto, dicho experto consiste en una guía de negocios que define los criterios que deben considerarse para poner un negocio. Con la ontología podemos hacer descripción formal de las relaciones espaciales y atributos descriptivos que poseen los componentes del domino y que también forman parte del perfil de un usuario (ver Figura 2).

Partiendo del concepto <usuario> definimos dos subclases: <caracteristicas_inmueble> y

<características_espaciales>. En este articulo nos centramos en definir la clase <características_espaciales> que esta compuesta de un conjunto de dos relaciones topológicas: >dentro_de< y >conecta_con<. La relación >dentro_de< tiene la jerarquía ordenada [7] <area_con_poder_adquisitivo> y la jerarquía simple [6] <zona_con_tipo_de_suelo>. Por otra parte la relación <conecta_con> cuenta con la clase instanciable <ruta_de_transrporte> y la subclase <vialidad>. La subclase vialidad tiene las jerarquías simples <sentido> y <tipo_de _vialidad>.

Page 3: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

Fig 2. Ontología del perfil de usuario. 

Es posible utilizar el manejador de base de datos MySQL únicamente para almacenar las descripciones

semánticas. Al tener definida la ontología, esta nos proporciona la semántica en la BDEC. De esta manera, Las

mediciones de similitud se hacen sobre la ontología usando la confusión. Con lo cual ésta metodología tenga la capacidad de poder realizar consultas en un sentido semántico; es decir considerar las propiedades de los objetos geográficos y sus relaciones espaciales con otros objetos, por ejemplo:

Base de Datos Espacial Conceptual

La Base de datos espacial Conceptual (BDEC) es una representación conceptual explicita que

almacena las propiedades del inmueble en una tabla y las características espaciales en otra por medio de conceptos [13]. Se compone de tablas de propiedades y tablas de relaciones.

La tabla de propiedades almacena los registros de las propiedades de cada inmueble de la forma R , donde: es el objeto geográfico, R es la entre el objeto y su propiedad y corresponde a la

propiedad del objeto por lo tanto la tabla puede describirse como , Dicha estructura se genera a parir de los atributos de la Tabla 1.

La tabla de relaciones que almacena las características espaciales del inmueble es generada a partir de una representación conceptual, de la siguiente manera (ver Figura 3):

Tabla 1.  Campos de la tabla de características del inmueble.

Atributo Tipo de atributo Descripcion

Id_Obj Integer Representa un identificador del inmueble

Operación String(15) Indica el tipo de operación para adquirir el inmueble.

Costo Money Indica el costo del inmueble

Tipo String (15) Indica que tipo de inmueble (local, casa, piso, edificio, etc.)

Cocina String (15) Indica si el inmueble cuenta con cocina y si ésta está equipada o no

Estacionamiento String (15) Indica si el inmueble cuenta con estacionamiento o no.

Latitud Float Latitud en la que se encuentra ubicado el inmueble

Longitud Float Longitud en la que se encuentra ubicado el inmueble

Direcion String (50) Dirección del inmueble

Page 4: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

En la conceptualización se definen los objetos geográficos de la BDE que se analizan. De este análisis (mediciones a los datos geográficos) se generan las descripciones semánticas de relaciones entre los objetos geográficos, estas descripciones forman parte de la conceptualización.

Fig. 3. Metodología para analizar y generar la representación conceptual entre los objetos Geográficos. 

Posteriormente las descripciones son almacenadas en la tabla de relaciones en registros de la forma

R , donde: es el primer objeto geográfico, es el segundo objeto geográfico y R es la relación

espacial entre y , por lo tanto la tabla puede describirse como , ver Tabla 2. Cada tupla de la tabla representa la descripción de solo una relación topológica entre dos objetos geográficos.  

Tabla 2.  Campos de la tabla de relaciones espaciales. Atributo Descripción

ID#R Identificador de la relación existente entre un par de objetos.

ID_OBJ_1

Índice del primer objeto. Este índice corresponde al índice de la tabla de atributos a la cual pertenece el objeto.

LAYER_BELONG_2 Nombre de la capa de datos a la cual pertenece el primer objeto.

ID_OBJ_2

Índice del segundo objeto. Este índice corresponde al índice de la tabla de atributos a la cual pertenece el objeto.

LAYER_BELONG_1 Nombre de la capa de datos a la cual pertenece el segundo objeto.

RELATION Contiene el símbolo que identifica la relación que existe entre el par de objetos.

 Las siguientes secciones se muestran algunos detalles para generar las tablas de la BDEC. En la

sección 3.2.1 se describen dos de las relaciones utilizadas en este trabajo, y que corresponden a relaciones topológicas. En la sección 3.2.2 se define una forma de calcular el nivel de accesibilidad que puede tener un inmueble, este nivel corresponde a la tercer relación que define las características espaciales de los inmuebles almacenados en la BDEC.

 

Relaciones Topológicas de la BDEC. En particular, en éste trabajo nos enfocamos en las siguientes relaciones topológicas: conecta y dentro, ver Tabla 3.

Page 5: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

Tabla 3.  Conjunto de relaciones topológicas  

Relación Símbolo Descripción

Conecta C

Describe la relación de conexión entre objetos Línea/Área, Línea/Línea y Línea/Punto. Válido para relacionar objeto lineal a otro objeto. Por ejemplo: Una vialidad secundaria se conecta con una vialidad local, un inmueble se conecta con una vialidad primaria.

Dentro I

Válido para relacionar cualquier tipo de objetos, si están dentro de un objeto área. Por ejemplo, un inmueble esta dentro de un área comercial, un inmueble esta dentro de área con nivel de ingresos medio.

Las relaciones espaciales se representan por medio de descripciones semánticas formadas por: un

inmueble (objeto 1), una relación topológica (dentro_de o conecta_con), y el objeto geográfico con el que se relaciona (objeto2). Por ejemplo: Local conecta_con Ruta de Transporte, ver Figura 4.

 RepresentaciónVisual

Representaciones Semántica

Objeto 1 Relación Objeto 2

Piso Área de Comercial

Oficina Área Urbana

Edificio Vialidad muy accesible

 Figura 4. Ejemplos de representaciones semánticas de la BDEC. 

Niveles de análisis (intersección de Vialidades) La última característica espacial al generar nuestra BDEC es la accesibilidad, que se considero ya que un negocio exitoso depende en gran parte de donde esté ubicado y que sea accesible al tipo de cliente al que va dirigido. Por lo tanto, proponemos una forma de calcular que tan accesible resultaría para un cliente llegar a un inmueble. Consideramos la capa temática de vialidades y una matriz de los posibles valores de intersección entre vialidades.

En el contexto de este trabajo definimos a la accesibilidad como el “grado en el que todas las personas puedan llegar a un lugar o servicio, considerando la categoría de las vialidades que los conectan”.

El análisis se basa en las categorías de las vialidades y en la ponderación de las intersecciones. Asimismo se consideran dos niveles de análisis.

Las categorías en las que se clasifican las vialidades se muestran en la tabla 4. La clasificación fue definida por IFE1.

En la Tabla 4 se muestra el nivel de importancia de cada vialidad, y a qué tipo de vialidades se aplica cada uno de estos niveles.

De acuerdo a la categoría se asigna un valor que corresponde al nivel de importancia de la vialidad, estos valores se asignan de la siguiente forma: P=8, E=4 y M=2. Donde P se refiere al valor de una vialidad principal, E es el valor de una vialidad estándar y M corresponde al valor de una vialidad menor.

    

1 No se presenta la referencia debido a que se trata de un documento confidencial

Page 6: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

Tabla 4. Categorías de las Vialidades Categoria Nombre Aplicable a:

1 PRINCIPAL (P)Via Rapida, Periferico, Boulebard, Circuito, Eje Vial, etc.

2 ESTANDAR (E) Vias y/o Calles Ordinarias

3 MENOR (M) Cerrada, Callejon, Andador, Privada, etc

Posteriormente, se realiza una ponderación de las intersecciones entre las vialidades, tal y como se

muestra en la tabla 5.

Tabla 5. Intersecciones entre vialidades.  

Tipos de intersecciones entre vialidades

P E M Ponderación 8 4 2

P 8 16 12 10 E 4 12 8 6 M 2 10 6 4

por ejemplo: el valor de intersección de una vialidad principal con una estándar es de 12, y de una menor con una estándar es de 6.

A continuación se definen los niveles de análisis de las vialidades y sus intersecciones. Para calcular el

valor de accesibilidad del inmueble se consideran básicamente los siguientes niveles.

1. Nivel Calle : Consiste en la evaluación de las dos intersecciones más cercanas a un inmueble que se encuentra a media cuadra, y se evalúan de la siguiente forma:

= ( + ) / Donde: + son las dos intersecciones más cercanas al inmueble.

2. Nivel Esquina : Consiste en la evaluación de las intersecciones de un fragmento de la cuadra donde se encuentra el inmueble, y son evaluadas de la siguiente manera

= ( + … + ) / Donde: es el vértice de la esquina donde se encuentra el inmueble, y representa todos los valores de intersección de los vértices vecinos a , y es el numero de intersecciones analizadas.

El análisis se realiza a cada inmueble en relación a su posición en la cuadra. En la Figura 5 muestra de forma general como realizar el análisis de intersección entre vialidades.

Niveles de análisis de intersecciones

Nivel de importancia de las Vialidades

Principal

Estandar

Menor

Tipo de Accesibilidad

Poco Accesible

Accesible

Muy Accesible

Local

Esquina

Intersección entre vialidades

Valo

r de

Inte

rsec

ción

Fig 5. Análisis de intersección de vialidades. 

Con los resultados de estas funciones se determina el tipo de accesibilidad que tiene el inmueble de

acuerdo a los rangos definidos por la Tabla 6.

Page 7: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

Tabla 6. Análisis entre intersecciones. Tipo de

accesibilidad Nivel Local y

Esquina muy accesible 25 <= 32

accesible 17 <= 24 poco accesible 8 <= 16

 Este tipo de accesibilidad (<muy_accesible>, <accesible> y <poco_accesible>) se integra en la tupla

almacenada en la tabla de características espaciales como un atributo cualitativo. Al generar todos los atributos de las dos tablas mencionadas anteriormente, obtenemos como resultado

tuplas de la forma Obj {características del inmueble, características espaciales}, estas tuplas se almacenan en la BDEC. De forma general, podemos representar las propiedades de los datos en una tupla que almacene todas las propiedades (espaciales y descriptivas) del inmueble, la cual será denominada como tupla característica, que tiene la forma:  

Obj1{es_una compra, es_un local_comercial, tiene cocina_no_equipada, tiene sin_estacionamiento, dentro_de nivel_muy_alto, dentro_de área_urbana, conecta_con vialidad_un_sentdo, conecta_con vialidad_poco_accesible}  Donde el Obj1 (Objeto1) es el identificador del objeto geográfico, y está compuesto de los 

atributos descriptivos y espaciales del Obj1. Utilizando una tupla característica, se almacena el perfil del usuario. Dicha información puede 

ser capturada por medio de un formulario. A continuación se expone como se realiza el análisis a los datos geográficos almacenados en la BDEC.

Análisis a datos geográficos sobre representaciones conceptuales. La metodología de análisis a datos geográficos sobre representaciones conceptuales consiste de una

serie de etapas que se describen a continuación, ver Figura 6. En la primera etapa del análisis, el usuario define su perfil de acuerdo sus necesidades de búsqueda, las

cuales se componen de requerimientos geográficos y requerimientos descriptivos. Este perfil se captura por el propio usuario en un formulario de una página web, y será almacenado en una descripción semántica. Posteriormente este perfil será analizado en la ontología. Esta ontología se encargara de proporcionar la semántica para realizar las evaluaciones y mediciones de similitud entre las descripciones semánticas del perfil y las descripciones semánticas de la BDEC utilizando una medida denominada confusión [11]; con la confusión se mide la distancia conceptual (similitud semántica) entre lo que el usuario desea y lo que contiene la base de datos espacial del sistema.

Para realizar el análisis en los datos geográficos. Estas descripciones semánticas del usuario “s” son extraídas del perfil del usuario y son evaluadas sobre fragmentos de la ontología, que tienen forma de jerarquías [6] con las descripciones semánticas de cada objeto geográfico almacenado en la BDEC “ ”.

Identificar del objeto para evaluar sus descripciones

REQUERIMIENTOS DESCRIPTIVOSID_Usuario: 052

Operación: rentarPresupuesto: 50,000

REQUERIMIENTOS ESPACIALES

Tipo de inmueble: Local ComercialDentro de Área comercial

Conecta con vialidades muy accesiblesDentro de Nivel de ingresos Medio

USUARIO

RESULTADOS

Define Perfil

Mostrar los resultados mas similares de acuerdo al perfil del usuario

Resultados con menor valor total de confusión

Conf(ri,s) = 1+conf (ri,s)

Evaluar descripciones semánticas de “s”

Evaluar descripciones semánticas de “ri”

Calcular valor total de Confusión de tener “ri”en ves de “s” con la ecuación:

Valor de confusión Jerarquía

Simple

JerarquíaOrdenada

0 → Exactamente igual1 → Algo similar2 → Poco Similar3 → Nada Similar

Confusión (L1) = 2Confusión (P14) = 1Confusión (E8) = 3

Valor total de la confusión de cada objeto geográfico evaluado

 

L1L1L1

P14P14P14E8E8E8

dentro_deconecta_conconecta_con

dentro_dedentro_de

conecta_condentro_de

conecta_conconecta_con

Área urbanaRuta de TransporteVialidad accesible

Nivel de ingresos AltoÁrea comercial

Vialidad poco accesibleÁrea industrial

Ruta de transporteVialidad muy accesible

Objeto 1 Objeto 2RelaciónL1

P14E8

CompraRentaRenta

ID_Obj operación150,00018,00010,000

costoLocalPiso

Edificio

tipo

Tabla de atributos

BASE DE DATOS ESPACIAL CONCEPTUALIZADA (BDEC) Fig 6. Arquitectura del Análisis Espacial con Descripciones Semánticas. 

Page 8: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

Para el caso de una jerarquía simple, la ecuación (1) calcula el valor de confusión “conf” de tener

“ ” en vez de “s”.

ecuación (1)

Donde “ ” es una tupla que se va a analizar en la BDEC y “s” es la tupla característica que define el perfil del usuario.

La ecuación (2) calcula el valor de confusión en jerarquías ordenadas.

ecuación (2)

Donde es la distancia conceptual entre el concepto “ ” y el perfil del usuario “s”, y card se refiere a la cantidad de los elementos de la jerarquía ordenada (cardinalidad del padre, número de hijos).

Al tomar la jerarquía simple llamada <tipo> que forma parte de la ontología (ver figura 7), utilizamos la ecuación 1 para analizar la similitud entre la combinación de todas las instancias posibles correspondientes a esta jerarquía y obtenemos la Tabla 7.

Fig 7. Jerarquía simple del tipo de inmueble.

 Tabla 7. Similitud semántica del tipo de inmueble. 

conf a b c d

a 0 1 1 1

b 1 0 1 1

c 1 1 0 1

d 1 1 1 0

De la misma forma se calcula la similitud entre las instancias de la jerarquía

<area_con_poder_adquisitivo>, ver Figura 8. De esta forma obtenemos las métricas de similitud de la Tabla 8.

<area_con_poder_adquisitivo>

<medio><muy_bajo> <alto><bajo> <muy_alto>

f g ihe   Fig 8. Jerarquía ordenada del tipo de área con poder adquisitivo. 

Posteriormente se promedian resultados de similitud de los atributos de los atributos

para proporcionar una métrica de similitud total S de todos los fragmentos de la ontología. La medida total de similitud se calcula con la ecuación (3).

Page 9: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

Tabla 8. Similitud semántica de las de las instancias de la clase <area_con_poder_adquisitivo>. conf e f g H i

e 0 0.25 0.5 0.75 1 f 0.25 0 0.25 0.5 0.75g 0.5 0.25 0 0.25 0.5 h 0.75 0.5 0.25 0 0.25i 1 0.75 0.5 0.25 0

 

ecuación (3)

Donde S es el valor de similitud total de la comparación del objeto ID_Obj

almacenado en la BDEC contra una petición de consulta, n es el número de elementos de la tupla a evaluar, conf(ri, s) es la confusión para la tupla i.

Este valor de similitud permite destacar búsquedas más precisas mediante una descripción semántica.

A continuación se define un ranking de similitud que permite clasificar cada uno de los objetos evaluados de acuerdo a su valor de similitud. Se define un intervalo [0, 1]. Que se interpreta como sigue: si S(ID_Obj)=0 se refiere a que la descripción semántica de la BDEC es idéntica a la petición de consulta del perfil del usuario. Si S(ID_Obj)=1, el registro almacenado en la BDEC es nada similar a la petición.

Utilizando este valor de similitud, podemos definir conceptos que describan la similitud entre los registros de la BDEC y la petición del usuario. Por lo tanto los conceptos que se asignan a cada resultado reemplazando a S(ID_Obj) son: idénticas, muy_similares, similares, algo_similares y nada_similares. La asignación de estos conceptos se interpreta a continuación:

• Si S(ID_Obj) = 0, el inmueble analizado tiene características idénticas a las especificadas en el perfil

del usuario. • Si 0.0 < S(ID_Obj) ≤ 0.25, el inmueble analizado tiene características muy similares al perfil del

usuario. • Si 0.25 < S(ID_Obj) ≤ 0.50, el inmueble analizado tiene características similares al perfil del

usuario. • Si 0.50 < S(ID_Obj) ≤ 0.75, el inmueble analizado tiene características algo similares al perfil del

usuario. • Si 0.75 < S(ID_Obj) ≤ 1.0, el inmueble analizado tiene características nada similares al perfil del

usuario. Estos valores que identifican la similitud pueden llegar a ajustarse dependiendo de los

requerimientos del problema. Finalmente se consideran este valor de similitud para identificar qué conjunto de

inmuebles puede utilizar el usuario para establecer su negocio. Utilizando la API de Google Maps se presentan gráficamente los resultados indicando el grado de similitud mediante un color, descartando así presentar al usuario resultados que no le resulten útiles.

Page 10: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

Resultados

El caso de estudio para este trabajo es considerar la localización del lugar idóneo para colocar una cafetería, de acuerdo al perfil del usuario. Los objetos geográficos contenidos en la BDEC son clasificados en cuatro capas temáticas de datos: Vialidades, Inmuebles, Nivel de ingresos y Uso de Suelo. La Figura 9 muestra en área de estudio en donde se muestran las capas temáticas de los inmuebles a analizar.

Fig 9. Área de estudio para el análisis de inmuebles (Capa temática de vialidades y Capa temática de Inmuebles) 

Al realizar el análisis de intersecciones entre vialidades en las que se encuentran los

objetos geográficos ( ) de la capa temática inmuebles, se obtuvo lo siguiente, ver Tabla 9.

Tabla 9. Niveles de análisis de intersecciones entre vialidades. 

Od_Obj  Formula Valor de 

accesibilidadNivel de analisis 

L1 = (P1 + P2 + … + Pn)/n 16 local

L2 = (P8 + P13) 20 local

L3 = (P6+P9+P10+P11+P12) /5 11.2 esquina

L4 = (P1+P2 + P3 + P7)/4 8 esquina

El valor de accesibilidad calculado se integra en las tuplas de la tabla de relaciones de

cada objeto geográfico se la siguiente manera, ver Tabla 10.

Tabla 10. Tabla de Características del inmueble. ID_Obj operación tipo cocina estacionamiento

compra local no equipada

sin estacionamiento

renta piso sin cocina con estacionamiento

renta casa equipada con estacionamiento

compra local equipada sin estacionamiento

Para realizar un análisis de los datos geográficos sobre la representación conceptual, el usuario define

el perfil siguiente:

U1 = s{es_una renta, es_un local_comercial, es_un cocina_equipada, es_un con_estacionamiento, dentro_de nivel_medio, dentro_de area_comercial, conecta_con vialidad_doble_sentido, conecta_con vialidad_muy accesible}

Posteriormente se obtienen los requerimientos descriptivos y espaciales esté perfil. Utilizando

fragmentos de las jerarquías de la ontología propuesta, se calcula la similitud semántica entre los requerimientos del usuario y las tuplas de la BDEC, ver Figura 10.

Page 11: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

<operación>

<compra> <renta> <edificio><local> <casa>

<tipo>

<piso>

L1 {es_una compra, es_un local_comercial, tiene cocina_no_equipada, tiene sin_estacionamiento } L2 {es_una renta, es_un piso, tiene sin_cocina, tiene con_estacionamiento } L3 {es_una renta, es_un edificio, tiene cocina_equipada, tiene con_estacionamiento } L4 {es_una compra, es_un casa, tiene cocina_equipada, tiene sin_estacionamiento }

U1 {es_una renta, es_un local_comercial, es_un cocina_equipada, es_un con_estacionamiento}

A BC

<equipamiento>

<cocina> <estacionamiento>

<equipada>

<no_equipada>

<sin_cocina>

<sin_estacionamiento> <con_estacionamiento>

Tuplas de la BASE DE DATOS ESPACIAL CONCEPTUALIZADA

Evaluar descripciones semánticas de “s”

D

Fig 10. Analisis de similitud entre la petición de consulta del usuario y las tuplas de la BDEC, utilizando las jerarquías de la 

ontología.  Al analizar la similitud entre la petición de consulta del usuario U1 y las tuplas del objeto geográfico

L1 almacenado en la BDEC se obtiene lo siguiente: conf (compra, renta) = 1 conf (local, local) = 0 conf (cocina_no_equipada, cocina_equipada) = 0.5 conf (sin_estacionamiento, con_estacionamiento) = 1 conf (nivel_muy_alto, nivel_medio) = 0.5 conf (ara_urbana, area_comercial) = 1 conf (un_sentido, doble_sentido) = 1 conf (poco_accesible, muy_accesible) = 1 Al calcular la métrica de similitud total (S), se obtuvo lo siguiente:

Por lo tanto el objeto L1 es algo similar a la petición de consulta del perfil del

usuario, de esta forma, al evaluar la similitud de cada uno de los objetos geográficos obtenemos lo siguiente:

Estos resultados se ordenan de acuerdo a su clasificación. De esta forma se muestra al

usuario los inmuebles más similares de acuerdo a su perfil.

L2 es “similar” a U1 L3 es “similar” a U1 L1 es “algo similar” a U1 L4 es “nada similar” a U1

Page 12: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

Conclusiones

El objetivo de este trabajo es desarrollar un método donde el usuario obtenga resultados útiles para auxiliar la toma de decisiones. Entre los aspectos que se incluyen, se encuentra, evitar que el sistema arroje No mach found que frecuentemente aparece cuando el sistema no cuenta con los datos tal y como han sido solicitados que solicitamos.

Una forma de mejorar capacidad analítica de un SIG para en análisis de los datos geográficos es incluir una representación conceptual en una BDEC y el perfil de los usuarios, de esta forma es posible un cálculo rápido de las características en que se disponen los inmuebles.

Al analizar los datos geográficos con la metodología propuesta en este trabajo, se obtienen gráficamente en Google Maps resultados lo mas similares de acuerdo al perfil de cada usuario. Esto se logra extrayendo los requerimientos descriptivos y los requerimientos espaciales del perfil del usuario para compararlos con las descripciones semánticas contenidas de la BDEC. Para realizar esta comparación utilizamos una ontología compuesta de jerarquías simples y jerarquías ordenadas, las cuales son evaluadas para obtener la similitud semántica entre la petición de consulta del perfil del usuario y las tuplas almacenadas en la BDEC.

Actualmente la capacidad de visualización de datos geográficos que nos proporciona la API de GoogleMaps y la capacidad del manejador de base de datos de MySQL resultan una buena herramienta para la visualización de los resultados. Al realizar el análisis en la BDEC será posible refinar las consultas, obtener resultados más precisos y simplificar consultas utilizando el perfil, preferencias y criterios de ubicación del usuario. Con los resultados de esta metodología se pretende implementar una herramienta que permita al SIG hacer la interacción entre las necesidades del usuario y la BDEC para el apoyo a la toma de decisiones.

En trabajos futuros podremos hacer análisis considerando un mayor número de relaciones como cerca_de, lejos_de, al_norte_de. Con esto, se enriquecerá la ontología y se pueden realizar análisis más precisos. De igual forma, se podrá realizar un análisis de la accesibilidad considerando factores adicionales como el nivel de importancia y el sentido de las vialidades.  Referencias [1] Arpinar, I.B., Sheth, A., Ramakrishnan, C, Usery, E., Azami, E. L., Kwan, M., (2006) “Geospatial Ontology Development and Semantic Analytics” Transactions in GIS, 2006 - Blackwell Synergy, Vol. 10 No. 4, pp. 551-575. [2] Egenhofer, M. and J. Henrring. 1990. “A mathematical Framework for the Definition of Topological Relationships”. In Proceedings of the Fourth International Symposium on Spatial Data Handing, Zurich, Switzerland. 803-813. [3] Fonseca F, Egenhofer M, Agouris P, and Câmara G 2002 “Using ontologies for integrated geographic information systems”. Transactions in GIS 6: 231–57. [4] Fonseca F. (2001), “Ontology-Driven Geographic Information Systems, in Spatial Information Science and Engineering”. Orono: University of Maine, pp. 118. [5] Gahegan M. (1995) “Proximity operators for qualitative spatial reasoning”. In Frank A U and Kuhn W (eds) Spatial Information Theory: A Theoretical Basis for GIS. Berlin, Springer-Verlag: 31–44. [6] Guzman Arenas A. and S. Levachkine. “Hierarchies Measuring Qualitative Variables”. Lecture Notes in Computer Science LNCS 2945 (Computational Linguistics and Intelligent Text Processing), (Springer-Verlag 2004). 262-274.

Page 13: REPORTE FINAL Análisis Espacial basado en …sappi.ipn.mx/cgpi/archivos_anexo/20082480_6128.pdfBase de Datos Espacial Conceptual La Base de datos espacial Conceptual (BDEC) es una

[7] Guzman Arenas A. and S. Levachkine. “Graduated errors in approximate queries using hierarchies and ordered sets”. Lecture Notes in Artificial Intelligence LNAI 2972, (Springer-Verlag 2004). 139-148. ISSN 0302-9743. [8] Hirtle, S. (2007) “Similarity Matching for Emergency Evacuation Workshop on Semantic Similarity Measurement at the Conference on Spatial Information Theory” (COSIT 2007), Melbourne, Australia, September 19, 2007. [9] Janowicz, K., Keßler,C. , Schwarz, M. , Wilkes, M. , Panov, I. , Espeter, M. and Bäumer, B. (2007) “Algorithm, Implementation and Application of the SIM-DL Similarity Server”. Second International Conference on GeoSpatial Semantics (GeoS 2007). Lecture Notes in Computer Science, Springer. Mexico City, Mexico. [10] Klippel, A. (2007) “Similarity Measures for Geographic Events”. Workshop on Semantic Similarity Measurement at the Conference on Spatial Information Theory (COSIT 2007), Melbourne, Australia, September 19, 2007. [11] Levachkine, S., Guzmán-Arenas, A.: (2007) “Hierarchy as a new data type for qualitative variables”. Expert Systems with Applications: An International Journal, 32(3), 899-910. [12] Mark D. M., Turk A. and Stea D., “Does the Semantic of Geospatial Entity Types Vary Across Languajes and Cultures?”, Workshop on Semantic Similarity Measurement at the Conference on Spatial Information Theory (COSIT 2007), Melbourne, Australia, September 19, 2007. [13] Moreno-Ibarra, M. (2007) “Semantic Similarity Applied to Generalization of Geospatial Data”, Second International Conference on Geospatial Semantics (GeoS 2007). Lecture Notes in Computer Science, Springer-Verlag, Berlin Heidelberg New York. [14] Nedas, K., Egenhofer, M., Wilmsen D.: (2007) “Metric Details of Topological Line-Line Relations”. International Journal of Geographical Information Science, 21(1), 21–48. [15] Rodríguez A. y Egenhofer M. (2004) “Comparing Geospatial Entity Classes: An Asymmetric and Context-Dependent Similarity Measure”, International Journal of Geographical Information Science, Vol. 18 (3), 229-256. [16] Torres Ruiz, Miguel Jesús (2007) “Representación ontológica basada en descriptores semánticos aplicada a objetos geográficos”, Tesis de doctorado, Centro de Investigación en Computación, México. [17] Unwin, D (1981). ”Introductory Spatial Analysis”, Methuen, London. [18] Weißenberg et al 2008 Weißenberg, Norbert, Voisard Agnès, Gartmann Rüdiger, “Using Ontologies in Personalized Mobile Applications”, Dortmund, Berlin, Germany. [19] Worboys M.F.: (1996). “Metrics and topologies for geographic spatial”. Advances in GIS research II : proc. of 7th International Symposium on Spatial Data Handling, Kraak and Molenaar (eds), Taylor and Francis, 365-375. [20] Yuan, M., D. M. Mark, M. J. Egenhofer, and D. J. Peuquet (2004). “Extensions to Geographic Representations”. Chapter 5 in R. B. McMaster and E. L. Usery (eds.), A Research Agenda for Geographic Information Science, Boca Raton, Florida: CRC Press, 129-156.