Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco...

14
Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS

Transcript of Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco...

Page 1: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

Facultad de Ingeniería y Tecnologías

Memoria de Grado

Geolocalización de documentos en el marco GIS

Page 2: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

Agenda

1. Introducción

2. Conceptos previos

3. Objetivos

4. Alcance

5. Motivación

6. A que se desea llegar

Page 3: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

1 Introducción

La localización de información a nivel geográfico en Internet es cada vez más

utilizada a todo nivel, ya que esta nos permite visualizar con facilidad la

procedencia de la misma

Según indica el presidente de Google el 70% de la información que tienen

indexada es geolocalizable, quedando por fuera un 30% que no lo es.

Por lo tanto, el objetivo de este documento es atacar una pequeña parte de ese

30% de información no geolocalizable, centrándonos en particular en los paper

académicos..

Page 4: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

2 Conceptos previos 1/6 La georeferenciacion de información tiene una serie de conceptos

relacionados que se importante mencionar. Los mismos son :

GIS

Metadatos

Geoetiquetado (Geotagging o Georeferenciacion)

Paper

Algoritmos de búsqueda de patrones en un texto.

Page 5: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

GIS: Un Sistema de Información Geográfica (SIG o GIS, en su acrónimo inglés) es

una integración organizada de hardware, software y datos geográficos diseñado para capturar, almacenar, manipular, analizar y desplegar en todas sus formas la información geográficamente referenciada con el fin de resolver problemas complejos de planificación y gestión.

Conceptos previos 2/6

Page 6: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

Metadatos:

El término metadatos no tiene una definición única. Literalmente significa “sobre

datos”, y tiene la función de describir otros datos, es decir proporcionan la

información mínima necesaria para identificar un recurso. En éstos se puede

incluir información descriptiva sobre el contexto, calidad y condición o

características del dato.

Conceptos previos 3/6

Page 7: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

Geoetiquetado (Geotagging o Georeferenciacion) :

Se define como geoetiquetado (o geotagging en inglés) al proceso de agregar

información geográfica en los metadatos de archivos de imágenes, vídeos,

sonido, sitios Web, texto, etc. que sirva para su georeferenciación .

Conceptos previos 4/6

Page 8: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

PAPER Académico:

En la actualidad todos conocemos el concepto de paper para referirnos a

trabajos de investigación académica. Los mismos presentan información

referente a un tema, en particular tomando conceptos, técnicas y prácticas de

otras áreas relacionadas al tema en cuestión. Estos no deben ser muy

extensos ni profundos en los temas, sino que todo lo contrario deberán ser

prácticos y concisos para lograr transmitir el tema investigado de una forma

rápida y entendible.

Por lo tanto podemos decir que un paper podría ser, por ejemplo el resumen

de una tesis, o investigación de grado.

Conceptos previos 5/6

Page 9: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

Algoritmos de búsqueda de patrones en texto:

La búsqueda de patrones en un texto es un problema muy importante en la

práctica. Sus aplicaciones en la informática son variadas, van desde la

búsqueda de una palabra en un archivo de texto como hasta problemas

relacionados con biología computacional, en donde se requiere buscar

patrones dentro de una secuencia de ADN, la cual puede ser modelada como

una secuencia de caracteres.

Los algoritmos a estudiar son:

1. Algoritmo de fuerza bruta

2. Algoritmo Knuth-Morris-Pratt (KMP)

3. Algoritmo Boyer-Moore:

Conceptos previos 6/6

Page 10: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

El objetivo general de este trabajo es determinar la procedencia de un

documento (paper) a partir del contenido del mismo (Texto)

El trabajo se divide en 4 partes fundamentales:

Evaluar los diferentes estándares de formato de papers que existen.

A partir de los dichos formatos se determinaran patrones que nos permita

identificar lugares geográficos.

Investigar los diferentes algoritmos de búsqueda de patrones en texto para

poder determinar la procedencia del paper a partir de los patrones

mencionados.

Por ultimo, desarrollar un prototipo que nos permita bajar a tierra lo

estudiado en los puntos anteriores, para en una segunda instancia realizar

las pruebas correspondientes

3 Objetivos

Page 11: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

Podemos decir que el trabajo tiene bien determinado su alcance, ya que el

mismo intenta investigar la problemáticas de forma concreta y específica

basándose directamente en los objetivos marcados.

El alcance del trabajo se puede visualizar claramente en los siguientes 3

puntos:

La búsqueda y definición de patrones en las diferentes plantillas de

documentos académicos (Papers).

La búsqueda de algoritmos que a partir de los patrones encontrados,

procesen el texto del documento y nos proporcionen información

relacionada a la procedencia del mismo .

La utilización propiamente dicha de la información recolectada para la

localización del documento en el mapa .

4 Alcance

Page 12: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

La motivación principal para realizar este trabajo esta dada por el

hecho de investigar un área que hoy en día esta muy poco madura, y

de este modo poder aportar como estudiante y futuro profesional un

trabajo tangible desde el punto de vista práctico.

Asimismo, cabe destacar que el trabajo apuntará mayormente a los

aspectos técnico-prácticos del tema, proporcionando una dinámica

de trabajo muy motivante y atractiva, desde el punto de vista

académico.

Por esta razón es que creemos que el trabajo presenta un desafío

desde todo punto de vista, poniendo en práctica todos nuestros

conocimientos.

5 Motivación

Page 13: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

En términos generales se desea llegar a realizar un sistema que nos brinde

la entrada a documentos académicos (papers), proporcionados por la

Universidad para generar a partir de estos últimos, un resultado como el

que se muestra en la siguiente imagen:

6 A que se desea llegar

Page 14: Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco GIS.

¡Gracias!

¿preguntas?