congresos.adeituv.es · Web viewPropuesta escalable para el cálculo de métricas del paisaje a...

14
PROPUESTA ESCALABLE PARA EL CÁLCULO DE MÉTRICAS DEL PAISAJE A PARTIR DEL SIOSE B. Zaragozí 1 , A. Rosado Abad 2 , J. T. Navarro Carrión 3 , J. Torres Prieto 4 , A. Belda Antolí 5 , A. Ramón Morte 6 1 Departamento de Geografía, Universitat Rovira i Virgili. [email protected] 2 Departamento de Geografía, Universidad de Zaragoza. [email protected] 3 Instituto Interuniversitario de Geografía, Universidad de Alicante. [email protected] 4 Instituto Interuniversitario de Geografía, Universidad de Alicante. [email protected] 5 Dpto. Ciencias de la Tierra y Medio Ambiente, Universidad de Alicante. [email protected] 6 Instituto Interuniversitario de Geografía, Universidad de Alicante. [email protected] RESUMEN El cálculo de métricas del paisaje a partir de bases de datos de ocupación del suelo permite analizar la estructura del paisaje y otros fenómenos relacionados. En la última década han surgido decenas de aplicaciones para su cálculo, al mismo tiempo que aumentaba enormemente el volumen de información disponible. Sin embargo, dada la gran diversidad de métricas posibles, ningún software permite calcularlas todas, ni está pensado para trabajar con bases de datos geográficas tan complejas y voluminosas como las actuales. En este trabajo se presenta una extensión desarrollada sobre PostgreSQL/PostGIS para el cálculo de métricas del paisaje. Esta extensión, denominada pg_landmetrics, amplía las funcionalidades de SQL para calcular métricas del paisaje mediante nuevos tipos de datos, operadores, funciones y agregados, y permite el procesamiento distribuido de dichos cálculos en caso necesario. Exponemos aquí una experiencia computacional de pg_landmetrics sobre la base de datos del Sistema de Información sobre Ocupación del Suelo de España (SIOSE) que demuestra que, gracias a una gestión eficiente de la memoria, la extensión permite responder en pocos segundos a baterías de consultas sobre métricas del paisaje en ordenadores de sobremesa con capacidad de proceso limitada. En línea con los objetivos del proyecto SIOSE- INNOVA (CSO2016-79420-R AEI/FEDER UE) estos resultados confirman la viabilidad de servicios web de métricas del paisaje sobre bases de datos masivas de ocupación del suelo. Palabras clave: métricas del paisaje; usos del suelo; bases de datos; SIOSE; PostGIS 1

Transcript of congresos.adeituv.es · Web viewPropuesta escalable para el cálculo de métricas del paisaje a...

Page 1: congresos.adeituv.es · Web viewPropuesta escalable para el cálculo de métricas del paisaje a partir del SIOSE B. Zaragozí1, A. Rosado Abad2, J. T. Navarro Carrión3, J. Torres

PROPUESTA ESCALABLE PARA EL CÁLCULO DE MÉTRICAS DEL PAISAJE A PARTIR DEL SIOSE

B. Zaragozí1, A. Rosado Abad2, J. T. Navarro Carrión3, J. Torres Prieto4, A. Belda Antolí5, A. Ramón Morte6

1Departamento de Geografía, Universitat Rovira i Virgili. [email protected] 2Departamento de Geografía, Universidad de Zaragoza. [email protected] 3Instituto Interuniversitario de Geografía, Universidad de Alicante. [email protected] Interuniversitario de Geografía, Universidad de Alicante. [email protected] 5 Dpto. Ciencias de la Tierra y Medio Ambiente, Universidad de Alicante. [email protected] Instituto Interuniversitario de Geografía, Universidad de Alicante. [email protected]

RESUMEN

El cálculo de métricas del paisaje a partir de bases de datos de ocupación del suelo permite analizar la estructura del paisaje y otros fenómenos relacionados. En la última década han surgido decenas de aplicaciones para su cálculo, al mismo tiempo que aumentaba enormemente el volumen de información disponible. Sin embargo, dada la gran diversidad de métricas posibles, ningún software permite calcularlas todas, ni está pensado para trabajar con bases de datos geográficas tan complejas y voluminosas como las actuales. En este trabajo se presenta una extensión desarrollada sobre PostgreSQL/PostGIS para el cálculo de métricas del paisaje. Esta extensión, denominada pg_landmetrics, amplía las funcionalidades de SQL para calcular métricas del paisaje mediante nuevos tipos de datos, operadores, funciones y agregados, y permite el procesamiento distribuido de dichos cálculos en caso necesario. Exponemos aquí una experiencia computacional de pg_landmetrics sobre la base de datos del Sistema de Información sobre Ocupación del Suelo de España (SIOSE) que demuestra que, gracias a una gestión eficiente de la memoria, la extensión permite responder en pocos segundos a baterías de consultas sobre métricas del paisaje en ordenadores de sobremesa con capacidad de proceso limitada. En línea con los objetivos del proyecto SIOSE-INNOVA (CSO2016-79420-R AEI/FEDER UE) estos resultados confirman la viabilidad de servicios web de métricas del paisaje sobre bases de datos masivas de ocupación del suelo.

Palabras clave: métricas del paisaje; usos del suelo; bases de datos; SIOSE; PostGIS

ABSTRACT

Landuse/landcover databases are a suitable data source for landscape structure analysis through landscape metrics calculation. Many software packages and tools targeting landscape metrics have been released in recent times, while available information volumes simultaneously increased. Nevertheless, landscape metrics packages are not comprehensive nor designed with massive and complex spatial databases in mind. We introduce pg_landmetrics, a PostGIS-based extension for running landscape metric calculations on a PostgreSQL database server. The extension provides several new types, operators, functions and aggregates which widen the typical SQL facilities and may leverage the parallel processing capabilities of the database engine. We conducted a computational experiment using the Information System for Land Occupation in Spain (SIOSE) as a data source. The outcomes showed that the efficient memory management enforced by the database instance allows pg_landmetrics to process large sets of queries in a few seconds using an average desktop computer. In accordance with the main goals of the SIOSE-INNOVA research project (CSO2016-79420-R AEI/FEDER UE), the experiment results confirm that providing landscape metrics web services over massive landuse/landcover databases is feasible.

Keywords: landscape metrics; landuse; landcover; databases; SIOSE; PostGIS

1

Page 2: congresos.adeituv.es · Web viewPropuesta escalable para el cálculo de métricas del paisaje a partir del SIOSE B. Zaragozí1, A. Rosado Abad2, J. T. Navarro Carrión3, J. Torres

1. INTRODUCCIÓN

Las métricas de paisaje se utilizan para cuantificar y describir la estructura del paisaje. Los esfuerzos para desarrollar métodos para cuantificar estos patrones espaciales comenzaron hace más de tres décadas (Blaschke y Petch, 1999) y se han incrementado, de modo que ahora hay centenares de medidas cuantitativas de patrones de paisaje (Gustafson, 1998) y numerosas herramientas para facilitar su cálculo a partir de la información disponible en cada caso (Zaragozí et al., 2012). La aplicabilidad de estas métricas es tan amplia que son aplicadas en estudios sobre biodiversidad, hábitats, gestión de recursos hídricos, cambios en los usos del suelo, estructura urbana, infraestructura vial, riesgos naturales, estética del paisaje, planificación territorial, entre otros ejemplos (Uuemaa et al., 2009).

Dada su importancia, existen cientos de métricas de paisaje, muchas de ellas correlacionadas entre sí, pero no todas las métricas tendrán significado en todos los contextos. Por ejemplo, Uuemaa (2017) investiga aquellas métricas que pueden ser de mayor interés en estudios forestales. Esto deja entrever la importancia de facilitar el cálculo de un gran número de métricas para cada paisaje, sobre las cuales aplicar criterios de selección y así determinar cuáles son las variables más explicativas en cada paisaje (Aguilar y Botequilha-Leitão, 2012).

Las métricas de paisaje son calculadas habitualmente mediante aplicaciones de escritorio, por lo que existen distintos programas específicos para su cálculo, destacando entre ellos FRAGSTATS (McGarigal y Marks, 1994), aunque existen también otros programas con características diversas como Conefor Sensinode, Patch Analyst o varios módulos de GRASS GIS (Zaragozí et al., 2012). Más recientemente, han aparecido nuevos programas como LecoS (Jung, 2016) o ZonalMetrics (Adamczyk y Tiede, 2017), que facilitan la aplicación de las métricas del paisaje en distintos contextos. Evidentemente, no es fácil completar esta lista, ya que hay muchos otros programas que pueden ser utilizados para calcular métricas del paisaje, aun cuando no llegan a referirse a ellas por ese nombre. Por ejemplo, es posible calcular fácilmente determinadas métricas con herramientas típicas de un SIG de escritorio, como la calculadora de campos o la calculadora ráster, entre otras posibilidades.

A pesar del abanico de programas disponibles, no existe ninguna aplicación específica que sea escalable y extensible (Zaragozí et al., 2012), o que esté diseñada para realizar análisis sobre bases de datos de ocupación del suelo tan voluminosas y complejas como las actuales. Por ejemplo, según sus especificaciones técnicas, FRAGSTATS 4.0 es un software de 32 bits, lo cual significa que puede utilizar un máximo de 2GB de memoria y tampoco está diseñado para procesamiento distribuido o con geometrías vectoriales. Por todo ello, si se requiere integrar las métricas del paisaje en proyectos con grandes bases de datos espaciales, se hace necesario continuar desarrollando las distintas alternativas.

El objetivo principal de este trabajo consiste en crear una extensión de base de datos sobre PostgreSQL/PostGIS que calcule métricas del paisaje, haciendo énfasis en aspectos relacionados con la reproducibilidad de la investigación y la escalabilidad del software. La pregunta central de este trabajo es si esta extensión, denominada pg_landmetrics, permite afrontar los problemas de usabilidad que afectan a las grandes bases de datos de ocupación del suelo que hay en la actualidad, así como las que serán utilizadas en los próximos años (Fernández-Villarino et al., 2012; Navarro-Carrión et al., 2016). A modo de ejemplo, en la Figura 1 se muestra un modelo o mock up de un tipo de aplicación de las métricas del paisaje que se beneficiaría de una extensión como pg_landmetrics. Consistiría en una aplicación web que facilitase la comparación de las métricas del paisaje en dos áreas geográficas, a partir de grandes bases de datos de ocupación del suelo.

2

Page 3: congresos.adeituv.es · Web viewPropuesta escalable para el cálculo de métricas del paisaje a partir del SIOSE B. Zaragozí1, A. Rosado Abad2, J. T. Navarro Carrión3, J. Torres

2. DESARROLLO COLABORATIVO E INTEGRADO

Este trabajo aplica una metodología reproducible basada en un flujo de trabajo de integración continua y desarrollo colaborativo, todo ello de acuerdo con los objetivos del proyecto SIOSE-INNOVA (Zaragozi et al., 2017). Dentro de los objetivos del proyecto SIOSE-INNOVA, de forma general, destaca el análisis del uso de los datos del SIOSE y las innovaciones técnicas encaminadas a potenciar su utilidad para los usuarios de las Tecnologías de Información Geográfica (TIG). Esta sección se subdivide en cinco apartados relevantes desde el punto de vista metodológico: reproducibilidad, extensibilidad, selección de métricas, desarrollo de funciones y base de datos objetivo.

Figura 1. Mock up de una aplicación web para la comparación de las métricas del paisaje de dos áreas geográficas.

2.1. Reproducibilidad de la investigación

La preocupación por la investigación reproducible es un tema que gana cada vez más importancia en una amplia gama de disciplinas científicas. Por ejemplo, hay trabajos que tratan esta cuestión desde campos diversos como la bioinformática, el procesamiento de señales, la investigación médica o incluso la economía (Singleton et al., 2016). Más recientemente, también hay trabajos destacados sobre la aplicación de metodologías reproducibles en las Ciencias de la Información Geográfica (Singleton et al., 2016). En este trabajo se aplica una metodología reproducible basada en flujos de trabajo colaborativos (Zaragozí et al., 2017).

El flujo de trabajo de desarrollo de una extensión de base de datos y su despliegue para distinto tipo de aplicaciones se logra con el uso combinado de distintas tecnologías. En este caso se ha utilizado Git (https://git-scm.com/) para el control de versiones y Docker para la contenerización (Boettiger, 2015). Estas tecnologías cuentan con plataformas de repositorio remoto que facilitan enormemente el trabajo colaborativo. Concretamente, este proyecto se ha apoyado en las plataformas GitHub (https://github.com/) y DockerHub (https://hub.docker.com/). Precisamente, el objetivo principal de este trabajo ha consistido en

3

Page 4: congresos.adeituv.es · Web viewPropuesta escalable para el cálculo de métricas del paisaje a partir del SIOSE B. Zaragozí1, A. Rosado Abad2, J. T. Navarro Carrión3, J. Torres

el desarrollo de una extensión de base de datos, denominada pg_landmetrics, que se encuentra alojada en un repositorio público en GitHub (https://github.com/siose-innova/pg_landmetrics) y que hace servir varias imágenes de contenedores alojadas en DockerHub.

El uso de contenedores o dockers permite aplicar una metodología de integración continua a la hora de desarrollar e implementar una extensión como pg_landmetrics. Además, gracias a la utilidad de orquestación docker-compose, las pruebas de la extensión se pueden realizar con un número mínimo de comandos: docker-compose build, up y down, facilitando enormemente el desarrollo de la extensión, así como su despliegue en distintos tipos de aplicaciones.

2.2. Extensibilidad en PostgreSQL

Este trabajo se ha desarrollado sobre dockers, empleando las últimas versiones estables de PostgreSQL (v.9.6) y PostGIS (v.2.3) en el momento de realizar los experimentos. Entre las muchas virtudes de estas tecnologías, hay que destacar la extensibilidad de PostgreSQL como una de sus características más notables.

La extensibilidad se define como la capacidad operativa de un software ante la introducción de nuevos cambios y funcionalidades. PostgreSQL es un Sistema Gestor de Bases de Datos (SGBD) altamente extensible, ya que toda su funcionalidad se gestiona mediante un catálogo en el que se registran los diversos componentes con los que el planificador de consultas relacionales puede operar. El sistema de tipos, las funciones, los métodos de acceso, los operadores o las funciones de agregado, son solo algunas de las características que pueden ser extendidas en PostgreSQL. A modo de ejemplo, cabe destacar que este diseño extensible es sobre el que se sustenta PostGIS, que es la extensión para datos espaciales de PostgreSQL. Así pues, una extensión de Postgres es un conjunto de nuevos componentes interrelacionados que se puede integrar como un paquete en una base de datos. Físicamente, una extensión de PostgreSQL consiste en varios ficheros que automatizan la instalación de esos nuevos tipos de datos, funciones, operadores o agregados en la base de datos, entre otros objetos posibles.

La tecnología de contenerización descrita anteriormente automatiza muchas tareas de instalación y configuración. Entre estas tareas, la más significativa consiste en la instalación de la última versión de la extensión en desarrollo (pg_landmetrics) a partir de un sencillo fichero de reglas de compilación. Esta combinación resulta altamente productiva para otros usuarios que quieran ver la extensión en funcionamiento.

2.3. Selección de métricas

Como se ha indicado anteriormente, existen cientos de métricas de paisaje que no siempre tienen significado en todos los ámbitos o zonas de estudio. Por este mismo motivo, y según los objetivos de este trabajo, se han desarrollado unas métricas del paisaje representativas y que aparecen frecuentemente en la bibliografía consultada. Sin embargo, dadas las características de la extensión desarrollada, el listado de métricas puede ser ampliado según sea necesario.

En la Tabla 1 se listan las métricas escogidas para esta primera versión de pg_landmetrics. Se han incluido tanto métricas simples (p. ej. el área o el perímetro), como también otras más complejas (p. ej. la distancia al vecino más próximo o la densidad), con el fin de experimentar con niveles de dificultad diversos durante el desarrollo de nuevas métricas. En este sentido, las métricas a nivel de parche han sido implementadas con funciones SQL simples, mientras que las métricas a nivel de clase o paisaje han requerido el desarrollo de funciones de agregado.

4

Page 5: congresos.adeituv.es · Web viewPropuesta escalable para el cálculo de métricas del paisaje a partir del SIOSE B. Zaragozí1, A. Rosado Abad2, J. T. Navarro Carrión3, J. Torres

2.4. Desarrollo de funciones en PostgreSQL

Las ecuaciones de las métricas fueron consultadas en la documentación de FRAGSTATS e implementadas como consultas SQL. Los resultados de cada consulta SQL fueron validados manualmente sobre un conjunto de datos de ejemplo. Finalmente, las consultas SQL fueron escritas como funciones de PostgreSQL. Cabe mencionar que todas las funciones se crearon por duplicado (funciones sobrecargadas), para poder calcular las métricas a partir de geometrías proyectadas (geometry) o en coordenadas esféricas (geography).

Dadas sus características, no todas las métricas pueden ser calculadas como funciones simples de PostgreSQL. Las funciones simples son las que aplican un cálculo a cada fila o polígono de la base de datos. Sin embargo, cuando una métrica implica un sumatorio u operaciones entre varias filas o polígonos (diversidad, vecindad, etc.), es necesario utilizar funciones de agregado. Se puede anticipar que las métricas a nivel de categoría o a nivel de paisaje serán normalmente funciones de agregado (Tabla 1). Es posible extender PostgreSQL tanto con funciones simples como con agregados.

Tabla 1. Métricas del paisaje incluidas o pendientes de desarrollo en la extensión pg_landmetrics.

Nivel Métrica

Patch Patch Area, Patch Perimeter, Perimeter-Area Ratio, Shape Index, Core Area, Number of Core Areas, Core Area Index, Euclidean Nearest Neighbour Distance

Class Total (Class) Area, Percentage of Landscape, Total Edge, Edge Density, Total Core Area, Core Area % of Landscape, Number of Patches, Patch Density

Landscape

Total Area, Total Edge, Edge Density, Number of Patches, Patch Density, Patch Richness, Patch Richness Density, Shannon’s Diversity Index, Simpson’s Diversity Index

2.5. Base de datos SIOSE-2011 y datos de referencia

En esta sección se describe el conjunto de datos utilizados para poner a prueba la extensión pg_landmetrics (ver Tabla 2). La base de datos SIOSE-2011 ha sido facilitada por el Servicio de Ocupación del Suelo del Instituto Geográfico Nacional (IGN). Cabe decir que esta base de datos contiene más información y es más compleja que la versión descargable desde el Centro de Descargas del Centro Nacional de Información Geográfica.

El núcleo de la base de datos SIOSE-2011 se compone de las tablas t_poli_geo y t_valores. La tabla t_poli_geo contiene la identificación y geometría de cada polígono mientras que la tabla t_valores es una lista de adyacencia que registra cada observación de cobertura y uso del suelo codificado y asociado a su correspondiente polígono, así como también la superficie en Hectáreas.

Los polígonos del SIOSE pueden ser representados por coberturas simples o compuestas. Dentro de estas últimas se encuentran las coberturas no predefinidas, es decir, un mismo polígono puede contener varias coberturas de suelo en diferente proporción. Para evitar las dificultades que genera esta característica, se ha realizado una reclasificación de los polígonos a partir de la cobertura prevalente que presenta la jerarquización de la clasificación de los usos y coberturas del suelo del SIOSE. Con ello se ha obtenido una nueva tabla con 85 coberturas prevalentes asignadas a cada uno de los polígonos que se encuentran en la tabla t_poli_geo. Esta reclasificación es necesaria ya que trabajar con descripciones “multietiqueta” de usos y

5

Page 6: congresos.adeituv.es · Web viewPropuesta escalable para el cálculo de métricas del paisaje a partir del SIOSE B. Zaragozí1, A. Rosado Abad2, J. T. Navarro Carrión3, J. Torres

coberturas del suelo es un problema más amplio que no se pretende abordar en este trabajo (Fernández-Villarino et al., 2012; Navarro-Carrión et al., 2016).

Por otra parte, también se descargaron varios grids regulares del Centro de Descargas del Instituto Geográfico Nacional (CNIG). A partir del grid 1:500.000 se escogieron dos celdas a modo de zonas de estudio en las que calcular algunas métricas de paisaje. Estas dos zonas de estudio contienen la mayor parte de las provincias de Alicante y Zaragoza respectivamente, así como los alrededores de cada una. A continuación, para estas zonas se extrajeron todas las celdas con escalas de referencia 1:25.000, 1:50.000 y 1:100.000.

Tabla 2. Características de los conjuntos de datos utilizados.

Tipo Tablas Cardinalidad Tamaño total

SIOSE-2011 t_poli_geo 2.562.800 3981 MB

t_valores 10.932.639 1041 MB

Grids grid_25k 756 232,3 kB

grid_50k 192 57,8 kB

grid_100k 48 13,8 kB

grid_500k 2 677bytes

3. EXPERIENCIA COMPUTACIONAL

Para evaluar la posibilidad de ofrecer servicios de consulta sobre el SIOSE similares al descrito en la (Figura 1) de este trabajo, se ha llevado a cabo una experiencia computacional que pone a prueba el rendimiento de la extensión pg_landmetrics.

Este experimento simula las consultas que un usuario podría realizar en un visor web que calculase métricas del paisaje de un modo interactivo, a partir de datos del SIOSE, tal como se ilustra en la Figura 2. Se parte de la premisa de que, cada vez que el usuario hace zoom o se desplaza en un visor web de mapas, se envían consultas al SGBD sobre las métricas del paisaje para el área visible del mapa en ese momento. En la práctica, la actividad del usuario se simula mediante la ejecución de la misma secuencia de consultas sobre cada uno de los grids regulares descritos en la sección anterior, que juegan el papel de áreas visibles.

El experimento se ejecutó en un ordenador de sobremesa, con Sistema Operativo Ubuntu 17.10 (64 bits), 7,7 GB de memoria, un procesador Intel Core i7-7700 CPU @ 6.60 GHz x 8 y con un disco duro de 1,2 TB. No se realizó ninguna configuración fuera de las opciones estándar de PostgreSQL. Sin embargo, independientemente de las características del PC utilizado, cabe recordar que la tecnología Docker permite desplegar pg_landmetrics en un servidor o de manera distribuida entre varias máquinas. De este modo, sería factible reducir el tiempo de cálculo de pg_landmetrics mediante una arquitectura de procesamiento paralelo adecuada.

En este experimento se calcularon únicamente 3 métricas de las implementadas en pg_landmetrics: Patch Area, Total (Class) Area y Total Area. En la Figura 2 se observan las dos zonas de estudio escogidas (Alicante y Zaragoza). Cada celda representada simula una operación de zoom o desplazamiento de un usuario dentro de un visor web.

6

Page 7: congresos.adeituv.es · Web viewPropuesta escalable para el cálculo de métricas del paisaje a partir del SIOSE B. Zaragozí1, A. Rosado Abad2, J. T. Navarro Carrión3, J. Torres

4. RESULTADOS Y DISCUSIÓN

La última versión de la extensión pg_landmetrics reúne un total de 25 funciones que calculan métricas del paisaje de distintos tipos (a nivel de polígono, categorías y paisaje). Todas ellas están sobrecargadas de forma que pueden operar tanto con sistemas de coordenadas planas como con coordenadas geográficas. La necesidad de trabajar sobre bases de datos con cobertura estatal, como en el caso del SIOSE, determinó esta decisión de diseño. El problema que se plantea es cómo abordar cálculos simultáneos sobre polígonos cuyos husos o sistemas de referencia espacial no coinciden. El uso de coordenadas esféricas permite trabajar con una base de datos geográfica en sistema de referencia común independientemente de la extensión cubierta. Si bien es cierto que esta opción limita el número funciones disponibles en PostGIS, en el caso de las métricas actualmente implementadas en pg_landmetrics, todas ellas permiten operar con el tipo geography para coordenadas geográficas de PostGIS. Por tanto, pg_landmetrics puede procesar los datos del SIOSE-2011 en toda su extensión, sin necesidad de dividir la base de datos por zonas UTM o comunidades autónomas.

El desarrollo y despliegue de pg_landmetrics es fácilmente reproducible. Resulta especialmente significativo el modo en que se han simplificado todas las tareas de desarrollo y cálculo de las métricas del paisaje. Los miembros del equipo de trabajo pueden disponer, en cuestión de minutos, de una versión actualizada de la extensión pg_landmetrics con los últimos cambios realizados por otro colaborador. Esta versión actualizada se obtiene mediante la ejecución de un único comando de orquestación (docker-compose up) y viene acompañada de todo el software necesario para trabajar, incluyendo las mismas opciones de configuración utilizadas por todo el equipo. Los usuarios finales de pg_landmetrics o de la base de datos del SIOSE, también verán facilitado su trabajo, ya que las 25 métricas implementadas simplifican en gran medida las consultas necesarias para realizar este tipo de análisis. Por ejemplo, una métrica en apariencia tan sencilla como Total Core Area pasa a calcularse con una única línea de SQL, frente a las más de 20 líneas que serían necesarias sin esta extensión.

Figura 2. Resultado de la experiencia computacional con la métrica Patch Area (AREA) en la zona de Alicante y Zaragoza a partir de tres grids con escalas de referencia 1:25.000, 1:50.000 y 1:100.000.

7

Page 8: congresos.adeituv.es · Web viewPropuesta escalable para el cálculo de métricas del paisaje a partir del SIOSE B. Zaragozí1, A. Rosado Abad2, J. T. Navarro Carrión3, J. Torres

En la Figura 2, se representan los resultados del cálculo de la métrica Patch Area para todos los grids de las dos zonas de estudio. Los objetivos de este trabajo no incluían realizar un análisis de la estructura del paisaje de ambas zonas. Sin embargo, se puede apreciar que al noreste de la zona de Zaragoza hay celdas que presentan valores significativamente por encima de la media de la zona. Esto se debe a que la intersección de la celda con los polígonos del SIOSE afecta a 6 polígonos de una considerable extensión en la zona de Zaragoza. Sin embargo, en la zona de Alicante las intersecciones de cada celda afectan a muchos más polígonos, pero de superficie menor. De este modo, el cálculo de la métrica Patch Area a nivel de polígono puede utilizarse para interpretar la estructura del paisaje de un modo rápido y visual.

El tiempo de ejecución que conllevan las consultas SQL es una cuestión del mayor interés en este trabajo. Una vez realizado el experimento, se observa que el número de polígonos que intersectan en la zona de estudio siempre influye en el tiempo que puede tardar en ejecutarse una función. Los tiempos también dependen directamente del número de observaciones (celdas) que tenga la zona de estudio y de la complejidad de la métrica calculada. Finalmente, como era de esperar, las métricas implementadas como funciones de agregación resultan ligeramente más costosas.

Los resultados del experimento para el cálculo de la métrica Patch Area quedan resumidos en la Figura 2, donde se aprecia que son necesarios entre 10 y 20 segundos para obtener los polígonos que intersectan con cada ventana de mapa y calcular las superficies. Las métricas de agregación (Total (Class) Area y Landscape Area) ofrecieron resultados similares, entre 5 y 8 segundos para el cálculo de Total Class Area y entre 15 y 22 segundos en el caso de Total Area.

Evidentemente, las métricas calculadas son algunas de las más sencillas de cada nivel de agregación (patch, class, landscape), pero resulta significativo que ninguna de las consultas, tomadas individualmente, conlleve más de un segundo de tiempo de proceso en un PC sin distribuir los cálculos. Estos resultados hacen pensar que, tomando ciertas precauciones, es viable desarrollar un prototipo de aplicación como la descrita en la Figura 1.

5. AGRADECIMIENTOS

Este trabajo se realiza dentro del Proyecto de Investigación SIOSE-INNOVA (CSO2016-79420-R AEI/FEDER UE) gracias a la subvención económica del Plan Estatal de Investigación Científica y Técnica de Innovación del Ministerio de Economía y Competitividad.

6. BIBLIOGRAFÍA

Adamczyk, J., & Tiede, D. (2017). ZonalMetrics - a Python toolbox for zonal landscape structure analysis. Computers and Geosciences, 99(October 2016), 91-99. https://doi.org/10.1016/j.cageo.2016.11.005

Aguilera, F. y Botequilha-Leitão, A. (2012): Selección de métricas de paisaje mediante análisis de componentes principales para la descripción de los cambios de uso y cobertura del suelo del Algarve, Portugal. GeoFocus, 12, 93–121.

Boettiger, C. (2015): An introduction to Docker for reproducible research. ACM SIGOPS Operating Systems Review, 49(1), 71–79. https://doi.org/10.1145/2723872.2723882

Fernández Villarino, X., Delgado Hernández, J., Valcárcel Sanz, N., Caballero, M. E., Benito Saz, M. A. y Porcuna Fernández-Monasterio, A. (2012). Geoservicios web SIOSE: un sistema de información como servicio público. VI Jornadas de SIG Libre (p. 8). Girona: Servei de Sistemes d’Informació Geográfica i Teledetecció (SIGTE). Universitat de Girona. http://www.sigte.udg.edu/jornadassiglibre2012/uploads/articulos_12/art17.pdf

8

Page 9: congresos.adeituv.es · Web viewPropuesta escalable para el cálculo de métricas del paisaje a partir del SIOSE B. Zaragozí1, A. Rosado Abad2, J. T. Navarro Carrión3, J. Torres

Gustafson, E. J. (1998). Quantifying Landscape Spatial Pattern: What Is the State of the Art? Ecosystems, 1(2), 143–156. https://doi.org/10.1007/s100219900011

Jung, M. (2016): LecoS - A python plugin for automated landscape ecology analysis. Ecological Informatics, 31, 18–21. https://doi.org/10.1016/j.ecoinf.2015.11.006

McGarigal, K. y Marks, B. J. (1994): FRAGSTATS: spatial pattern analysis program for quantifying landscape structure. General Technical Report PNW-GTR-351. U.S. Department of Agriculture, Forest Service, Pacific Northwest Research Station. Portland, OR, 97331(503), 134. https://doi.org/10.1061/(ASCE)0733-9437(2005)131:1(94) CE

Navarro-Carrión, J. T., Zaragozí, B., Ramón-Morte, A. y Valcárcel-Sanz, N. (2016). Should EU land use and land cover data be managed with a NOSQL document store? International Journal of Design & Nature and Ecodynamics, 11(3), 438–446. https://doi.org/10.2495/DNE-V11-N3-438-446

Singleton, A. D., Spielman, S. y Brunsdon, C. (2016). Establishing a framework for Open Geographic Information science. International Journal of Geographical Information Science, 8816(February), 1–15. https://doi.org/10.1080/13658816.2015.1137579

Uuemaa, E., Antrop, M., Roosaare, J. y Marja, R. (2009): Landscape Metrics and Indices: An Overview of Their Use in Landscape Research Living Reviews in Landscape Research. Living Reviews in Landscape Research, 3, 1–28. https://doi.org/10.12942/lrlr-2009-1

Uuemaa, E. (2017): Mapping Forest Landscape Patterns. https://doi.org/10.1007/978-1-4939-7331-6

Zaragozí, B., Belda, A., Linares, J., Martínez-Pérez, J. E., Navarro, J. T. y Esparza, J. (2012). A free and open source programming library for landscape metrics calculations. Environmental Modelling & Software, 31, 131–140. https://doi.org/10.1016/j.envsoft.2011.10.009

9