Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco...
-
Upload
maria-mercedes-espejo-moya -
Category
Documents
-
view
222 -
download
0
Transcript of Facultad de Ingeniería y Tecnologías Memoria de Grado Geolocalización de documentos en el marco...
Facultad de Ingeniería y Tecnologías
Memoria de Grado
Geolocalización de documentos en el marco GIS
Agenda
1. Introducción
2. Conceptos previos
3. Objetivos
4. Alcance
5. Motivación
6. A que se desea llegar
1 Introducción
La localización de información a nivel geográfico en Internet es cada vez más
utilizada a todo nivel, ya que esta nos permite visualizar con facilidad la
procedencia de la misma
Según indica el presidente de Google el 70% de la información que tienen
indexada es geolocalizable, quedando por fuera un 30% que no lo es.
Por lo tanto, el objetivo de este documento es atacar una pequeña parte de ese
30% de información no geolocalizable, centrándonos en particular en los paper
académicos..
2 Conceptos previos 1/6 La georeferenciacion de información tiene una serie de conceptos
relacionados que se importante mencionar. Los mismos son :
GIS
Metadatos
Geoetiquetado (Geotagging o Georeferenciacion)
Paper
Algoritmos de búsqueda de patrones en un texto.
GIS: Un Sistema de Información Geográfica (SIG o GIS, en su acrónimo inglés) es
una integración organizada de hardware, software y datos geográficos diseñado para capturar, almacenar, manipular, analizar y desplegar en todas sus formas la información geográficamente referenciada con el fin de resolver problemas complejos de planificación y gestión.
Conceptos previos 2/6
Metadatos:
El término metadatos no tiene una definición única. Literalmente significa “sobre
datos”, y tiene la función de describir otros datos, es decir proporcionan la
información mínima necesaria para identificar un recurso. En éstos se puede
incluir información descriptiva sobre el contexto, calidad y condición o
características del dato.
Conceptos previos 3/6
Geoetiquetado (Geotagging o Georeferenciacion) :
Se define como geoetiquetado (o geotagging en inglés) al proceso de agregar
información geográfica en los metadatos de archivos de imágenes, vídeos,
sonido, sitios Web, texto, etc. que sirva para su georeferenciación .
Conceptos previos 4/6
PAPER Académico:
En la actualidad todos conocemos el concepto de paper para referirnos a
trabajos de investigación académica. Los mismos presentan información
referente a un tema, en particular tomando conceptos, técnicas y prácticas de
otras áreas relacionadas al tema en cuestión. Estos no deben ser muy
extensos ni profundos en los temas, sino que todo lo contrario deberán ser
prácticos y concisos para lograr transmitir el tema investigado de una forma
rápida y entendible.
Por lo tanto podemos decir que un paper podría ser, por ejemplo el resumen
de una tesis, o investigación de grado.
Conceptos previos 5/6
Algoritmos de búsqueda de patrones en texto:
La búsqueda de patrones en un texto es un problema muy importante en la
práctica. Sus aplicaciones en la informática son variadas, van desde la
búsqueda de una palabra en un archivo de texto como hasta problemas
relacionados con biología computacional, en donde se requiere buscar
patrones dentro de una secuencia de ADN, la cual puede ser modelada como
una secuencia de caracteres.
Los algoritmos a estudiar son:
1. Algoritmo de fuerza bruta
2. Algoritmo Knuth-Morris-Pratt (KMP)
3. Algoritmo Boyer-Moore:
Conceptos previos 6/6
El objetivo general de este trabajo es determinar la procedencia de un
documento (paper) a partir del contenido del mismo (Texto)
El trabajo se divide en 4 partes fundamentales:
Evaluar los diferentes estándares de formato de papers que existen.
A partir de los dichos formatos se determinaran patrones que nos permita
identificar lugares geográficos.
Investigar los diferentes algoritmos de búsqueda de patrones en texto para
poder determinar la procedencia del paper a partir de los patrones
mencionados.
Por ultimo, desarrollar un prototipo que nos permita bajar a tierra lo
estudiado en los puntos anteriores, para en una segunda instancia realizar
las pruebas correspondientes
3 Objetivos
Podemos decir que el trabajo tiene bien determinado su alcance, ya que el
mismo intenta investigar la problemáticas de forma concreta y específica
basándose directamente en los objetivos marcados.
El alcance del trabajo se puede visualizar claramente en los siguientes 3
puntos:
La búsqueda y definición de patrones en las diferentes plantillas de
documentos académicos (Papers).
La búsqueda de algoritmos que a partir de los patrones encontrados,
procesen el texto del documento y nos proporcionen información
relacionada a la procedencia del mismo .
La utilización propiamente dicha de la información recolectada para la
localización del documento en el mapa .
4 Alcance
La motivación principal para realizar este trabajo esta dada por el
hecho de investigar un área que hoy en día esta muy poco madura, y
de este modo poder aportar como estudiante y futuro profesional un
trabajo tangible desde el punto de vista práctico.
Asimismo, cabe destacar que el trabajo apuntará mayormente a los
aspectos técnico-prácticos del tema, proporcionando una dinámica
de trabajo muy motivante y atractiva, desde el punto de vista
académico.
Por esta razón es que creemos que el trabajo presenta un desafío
desde todo punto de vista, poniendo en práctica todos nuestros
conocimientos.
5 Motivación
En términos generales se desea llegar a realizar un sistema que nos brinde
la entrada a documentos académicos (papers), proporcionados por la
Universidad para generar a partir de estos últimos, un resultado como el
que se muestra en la siguiente imagen:
6 A que se desea llegar
¡Gracias!
¿preguntas?