Desarrollo de un Método de Clasificación Automático de...

Desarrollo de un Método de Clasificación Automático de

Elementos Urbanos y Segmentación en Zonas Agrícolas

en Imágenes Satelitales WorldView-2

Pavel Mendoza Villafane, Joel Telles Castillo y Daniel Diaz Ataucuri.

Dirección de Investigación y Desarrollo Tecnológico

INICTEL-UNI

Lima, Perú

Abstract—El problema de clasificación en teledetección

basado en imágenes satelitales implica muchos desafíos debido la

variabilidad de contenido en una escena y la poca resolución

espacial y espectral necesarios para distinguir distintas clases,

debido a ello, diversos algoritmos de clasificación supervisada y

no supervisada han sido extensamente estudiados. El presente

trabajo propone un método de clasificación no supervisada para

elementos urbanos basado en el uso de índices espectrales sobre

imágenes multiespectrales probado sobre una escena WorldView-

2, el cual es comparado con un clasificador clásico de red

neuronal. También se propone un método de segmentación de

parcelas en zonas agrícolas haciendo uso solo de las bandas roja e

infrarroja cercana. Las pruebas realizadas empleando todas las

bandas espectrales de la escena para la clasificación muestran un

rendimiento de 85.67% y de 87.59% de asertividad empleando

una red neuronal y el clasificador propuesto respectivamente.

Por otro lado, el método de segmentación desarrollado permitió

una clara delimitación entre parcelas y caminos en regiones

agrícolas empleando solo las bandas roja e infrarroja cercana.

Palabras claves— WorldView-2; clasificación; agrupamiento;

red neuronal; índices espectrales; convex hull.

I. INTRODUCCIÓN

El problema de clasificación en teledetección basado en imágenes multiespectrales satelitales ha sido extensamente estudiado debido a su complejidad reflejada en el nivel de error en los mapas de clasificación resultantes, siendo tema estudio algoritmos de clasificación supervisados y no supervisados que buscan resolver el problema descrito. La elección del algoritmo y el nivel de pre-procesamiento sobre los datos de entrada influirán en el nivel de precisión de los resultados.

La fase de pre-procesamiento para la calibración de escenas WorldView-2 de valores de nivel digital (ND) a valores de radiancia y luego a reflectancia pueden ser hallados en [1], y son usados con la finalidad de trabajar con valores que contengan un significado físico como la radiancia y reflectancia.

Los resultados de [2] muestran cómo solo el uso de índices espectrales, tal como el Índice Espectral de Vegetación Normalizada (NDVI, por sus siglas en inglés), pueden ser empleados para obtener una segmentación aproximada del contenido en una escena WV-2. En [3], diferentes índices espectrales de vegetación, suelo y agua son utilizados para realizar una clasificación de elementos en zonas urbanas

basados en árboles de decisión. Sin embargo, muchas veces el contenido espectral entre diferentes elementos es similar conllevando a un alto nivel de error en la segmentación y clasificación. Por otro lado, una adecuada selección de bandas puede ayudar a reducir el tiempo de procesamiento, [4] muestra como una clasificación empleando solo las bandas RE y NIR-2 de WV-2 obtienen resultados relativamente menor al caso de uso de todas las bandas. En [5] se muestra como el uso de Análisis de Componentes Principales (PCA, por sus siglas en inglés) para la eliminación de redundancia de datos puede perjudicar la exactitud de la clasificación y muestra como una combinación adecuada de las bandas puede llegar a mejorar los resultados.

II. ÁREA DE ESTUDIO

Se seleccionaron 2 áreas de estudio en el presente trabajo. El área de estudio 1 es una imagen WorldView-2 (WV-2) de 1001x896 píxeles, que representa un área total de 3.59km

2 y

corresponde a un sector de Pantanos de Villa, Lima-Perú, con coordenadas esquina izquierda latitud 12°12'33.39"S y longitud 77° 0'29.53"O del 04 de diciembre del 2012, la cual es mostrada en la figura 1.

El área de estudio 2, es una imagen WV-2 de 480x1095

Fig. 1. Imagen WV-2 en color verdadero (bandas RGB-532) del área de

estudio.

ISSN 2447-8326. V.1. © 2015 BTSYM

2015 Brazilian Technology Symposium

Fig. 3. Proceso de clasificación de elementos en zonas urbanas.

Fig. 4. Proceso de clasificación de elementos en zonas urbanas.

píxeles con 2.1km2 con coordenadas latitud 6°43'51.71"S

longitud 79°48'8.27"O del Instituto Nacional de Innovación Agraria de Chiclayo, Lima-Perú, del 10 de setiembre del 2015, mostrada en la figura 2.

El satélite comercial WorldView-2 ofrece imágenes de alta resolución desde octubre del 2009, con una resolución espacial de 1.85m en cada banda multiespectral (MS) y 0.46m en la banda pancromática (PAN), además de una resolución espectral de 8 bandas [6].

III. METODOLOGÍA

Una adecuada segmentación permite delimitar diferentes

clases en una imagen satelital, para ello, se han seleccionado

un conjunto de índices espectrales que permitan realzar

elementos de un tipo dado en una escena, sin embargo, la

escasa mixtura del contenido en esta puede degradar el

resultado de la segmentación. El contenido de la escena 1

(jardines, tipos de construcciones, carreteras entre otros) es

mayor a la segunda escena (suelo y vegetación), lo cual

permite una mayor diferenciación entre clases, por este motivo

fue conveniente aplicar procesos diferentes, los cuales pueden

verse en las figuras 3 y 4.

La figura 3 muestra el proceso aplicado al área de estudio 1, en este se aplicó la fusión de imágenes para mejorar el nivel de detalle y se aplicó una segmentación espectral basada en los índices NDVI, NDWI y NDBSI. Los elementos de entrenamiento fueron seleccionados de forma automática a partir de 3 conjuntos obtenidos en el proceso de segmentación aplicando el algoritmo K-means los cuales fueron ingresados a una red neuronal.

Por otro lado, en el proceso de segmentación de elementos en zonas agrícolas en el área de estudio 2, mostrado en la figura 4, la escena presenta únicamente suelo y vegetación por lo que solo fue empleado el NDVI en la segmentación espectral y fue aplicado una segmentación espacial utilizando un algoritmo Convex Hull sobre la segmentación espectral.

En ambas zonas de estudio fue necesario aplicar un paso previo de calibración. En las siguientes sub-secciones se detallan los pasos empleados en cada proceso.

A. Pre-procesamiento

Las imágenes WV-2 son adquiridas en formato GeoTIFF y

se encuentran en Niveles Digitales (ND), por lo que es

necesario realizar un proceso de calibración sobre ellas. Los

valores ND son convertidos a valores de radiancia percibidos

en el sensor usando (1).

(1)

Donde es la radiancia por pixel [ ], es el factor de calibración radiométrica absoluta

[ ], ND es el valor del pixel y es el ancho

de banda efectiva [ ]. El valor y pueden ser obtenidos

a partir de la metadata XML de la escena con los campos

ABSCALFACTOR y EFFECTIVEBANDWIDTH respectivamente.

Ignorando los efectos de la atmósfera es posible determinar

los valores de reflectancia usando (2), esta es conocida como

reflectancia sobre la atmósfera (TOA, por sus siglas en inglés)

debido a que ignora los efectos de la atmósfera sobre la señal

recibida.

(2)

Donde es la reflectancia TOA, es la radiancia, es la Irradiancia Espectral Solar Media [ ], es

el ángulo solar Zenith y es la distancia Tierra-Sol [AU]. El

valor para cada longitud de onda puede hallarse en

[1], el valor se determina a partir del día del año en el que

fue adquirida la escena y es calculado a partir de (3)

empleando el ángulo de elevación solar, el cual es hallado en

la metadata XML en el campo MEANSUNEL.

(3)

Donde es el ángulo Zenith y el ángulo de

elevación solar, ambos en grados sexagesimales.

La figura 5 muestra las firmas espectrales obtenidas a partir

de las 8 bandas calibradas en reflectancia en el área de estudio

1. Algunos materiales pueden ser fácilmente diferenciados, sin

embargo, algunas firmas como suelo y carretera pueden llegar

Fig. 2. Imagen WV-2 en color verdadero (bandas RGB-532) del área de

estudio 2.

ISSN 2447-8326. V.1. © 2015 BTSYM


Fig. 5. Firmas espectrales de algunos materiales obtenidos a partir de la

escena WV-2 mostrada en la Fig.1 luego de aplicar la calibración sobre ella.

a ser muy similares.

B. Fusión de Bandas

Existen diversos algoritmos para realizar la fusión entre

imágenes con el propósito de mejorar la resolución espacial de

las bandas multiespectrales basados en la idea de ingresar los

detalles de la panda PAN dentro de cada banda MS, por

ejemplo: Brovey, PCA, Wavelet entre otros [7]. Sin embargo,

en cualquier caso, los valores radiométricos de la escena

siempre serán afectados, por este motivo se ha elegido el

algoritmo de Brovey por tener una rápida implementación

basada en (4).

∑

(4)

Donde y son los valores nuevo y antiguo en la

posición en la imagen, es el número de bandas y

es el valor en en la pancromática. Para aplicar el

algoritmo de Brovey, primero es necesario re-escalar las

bandas MS al mismo tamaño que la pancromática. La figura 6

muestra el resultado de la fusión de imágenes.

C. Segmentación Espectral

Los índices espectrales fueron empleados para realizar una

primera separación entre clases básicas. El NDVI (5), es el

índice de vegetación más popular para segmentar vegetación,

el cual entrega valores en el intervalo [-1, 1] y usualmente se

considera como vegetación vigorosa a valores con NDVI>0.6,

se ha considerado valores de NDVI en [0.5-1.0] con el

propósito de tomar en cuenta zonas donde la vegetación es

escaza.

(5)

Donde y son las bandas roja e infrarroja cercana-1 en

WV-2 respectivamente.

Por otro lado, el NDWI (6), con la misma escala que el

NDVI, permite una rápida segmentación de cuerpos de agua y

sombras en el intervalo [0, 1], pudiendo crear confusión entre

estos.

(6)

Aunque es posible segmentar suelo y edificios a partir del

NDVI, se obtuvo mejores resultados empleando el Índice

Espectral de Suelo Desnudo Normalizado (NDBSI, por sus

siglas inglés) obtenido a partir de (7).

(7)

D. Agrupamiento de datos

A pesar de que los índices espectrales están diseñados con

el propósito de realzar información específica, estos suelen dar

valores erróneos, por ejemplo el NDWI confunde agua con

sombra. Es posible usar sub-intervalos en cada índice para

segmentar distintas clases, sin embargo, esto no es tan práctico

ya que requiere establecer intervalos de cada clase para una

correcta distinción. Trabajos como [2, 3] emplean arboles de

decisión basados en índices espectrales y otros parámetros

adicionales que deben establecerse a-priori por cada clase a

diferenciar.

Algoritmos de agrupamiento, tales como ISODATA y K-

means [8], permiten una rápida segmentación sin requerir

información sobre las clases. Dado un conjunto de vectores

, K-means separa cada vector al establecer

K centroides (vectores que caracterizan a cada clase). Cada

es asignado a un grupo, en base a la distancia entre este y el

centroide más cercano. Luego, se determina un nuevo

centroide para cada grupo y se repite el procedimiento hasta

encontrar los centroides óptimos, los cuales calculados como

los centros de masa de cada grupo según (8).

∑

(8)

Donde es un grupo, ,

y

es el centroide

actual y nuevo de respectivamente.

ISODATA es una variación del K-means, pero no requiere

establecer el número de grupos que serán formados, estos son

determinados en base a divisiones y fusiones entre clases

durante la actualización de los centroides.

E. Segmentación Espacial

Debido a la poca homogeneidad en una zona agrícola (zona

de estudio 2), una parcela específica, que puede contener o no

un cultivo, no puede ser descrito por un valor puntual de

índice espectral (NDVI en este caso). Sin embargo, puede

Fig. 6. Combinación RGB-532 luego de aplicar el algoritmo de Brovey, (a)

Imagen original (b) Imagen fusionada.

ISSN 2447-8326. V.1. © 2015 BTSYM


emplearse un intervalo para describir el contenido de las

parcelas, en este caso, se consideró una segmentación en 3

partes. Primero, se establecieron intervalos automáticos de

NDVI que separen gradualmente las parcelas en bloques.

Luego, siempre que un bloque fuese mayor a un máximo

fijado, este es dividido empleando K-means hasta en 3

bloques. Por último, debido a que en la primera segmentación

pudo quedar zonas sin segmentar, se aplicó el paso 1 y 2 sobre

la zona sin segmentar en la primera etapa con el doble de

intervalos de NDVI respecto a los iniciales. En cada paso,

cada bloque fue delimitado empleando un algoritmo Convex

Hull [9] para obtener un bloque convexo que encierre todos

los elementos del mismo y fueron eliminados aquellos bloques

cuya área fuese muy similar a su perímetro o no cumplan con

un área mínima.

F. Selección de elementos de entrenamiento

Es posible realizar la separación entre clases empleando un algoritmo de agrupamiento, sin embargo, estos no obtienen buenos resultados cuando el conjunto de vectores es demasiado grande. Por ello, primero se realiza la segmentación basado en índices espectrales, NDVI, NDWI y NDBSI en una zona urbana. Luego se emplea un algoritmo de agrupamiento (K-means) empleando todas las bandas espectrales, para separar las clases sobre cada conjunto de la segmentación.

Por otro lado, debido a que los conjuntos de vectores producto de la segmentación pueden incluir elementos que no corresponden a una sola clase, por ejemplo, la sombra de un edificio al lado de vegetación podría ser incluida erróneamente en cualquiera de estos 2 conjuntos iniciales (vegetación o construcción) se hace uso de operaciones de morfología matemática (erosión) para eliminar los elementos de los límites entre clases y mantener solo los que sean representativos en la segmentación y cada uno de estos 3 conjuntos son ingresados al algoritmo de agrupamiento, el cual producirá un mayor número de clases. Por ejemplo, Si se establecen , y

grupos para la segmentación de NDVI, NDWI y NDBSI respectivamente, se obtendrán clases distintas. La figura 7 muestra el resultado de la segmentación basado en índices espectrales luego de aplicar erosión.

G. Proceso de entrenamiento

Dado un conjunto de N clases obtenidas a

partir del proceso de agrupamiento, es posible que alguno de

los conjuntos sea mucho más grande que otro. Sea el

cardinal del y se extraen elementos

de cada de forma aleatoria obteniéndose las clases

con un total del vectores de

entrenamiento, los cuales son ingresados a una red neuronal, la

cual consiste de 3 capas, la capa de entrada con 8 neuronas, la

capa oculta con 24 neuronas y 7 en la capa de salida. En la

capa 2 y 3 se usó la función de transferencia sigmoidea

tangente hiperbólica mostrado en (9).

(9)

IV. RESULTADOS OBTENIDOS

Todas las pruebas realizadas fueron desarrolladas en el entorno de Matlab. En la zona de estudio 1, en la segmentación de NDVI se consideró 2 clases: césped y árboles, en la segmentación de NDWI solo 1 clase: agua, debido a la poca presencia de sombras y en la segmentación basado en NDBSI 4 clases: carretera, suelo y 2 tipos de construcciones, debido a que un alto porcentaje de techos de edificios están cubiertos con tejas, dando un total de 7 clases.

El algoritmo propuesto fue comparado con una red neuronal clásica, cuyos elementos de entrenamiento fueron seleccionados de forma manual y son mostrados en la figura 8.

Se empleó la misma configuración en la red neuronal en ambos casos. Los elementos de entrenamiento para la red neuronal clásica fueron 7795 vectores y para el algoritmo propuesto 6000 vectores. Los vectores en el entrenamiento están compuestos de todas las bandas espectrales de la imagen WV-2 en ambos casos.

La figura 9 muestra la matriz de confusión en ambos casos y fueron determinados el coeficiente Kappa los cuales fueron 0.85 y 0.83 con un porcentaje de asertividad de 85.67% y 87.59% para la clasificación manual y el método propuesto respectivamente. Fig. 7. Resultado de segmentación basado en índices espectrales luego de

aplicar erosión y dilatación. (a) NDBSI. (b) NDWI. (c) NDVI.

Fig. 8. Selección manual de 7 clases.

ISSN 2447-8326. V.1. © 2015 BTSYM


La figura 10 muestra los mapas de clasificación obtenidos empleando la red neuronal con selección manual y el algoritmo propuesto.

Por último, la figura 11 muestra el resultado de la segmentación de la zona de estudio 2 empleando la segmentación espectral y espacial. Se repitió la prueba sobre 4 zonas agrícolas en total obteniéndose resultados similares.

V. CONCLUSIONES Y TRABAJO FUTURO

En este trabajo de investigación se desarrolló un nuevo método de clasificación automática de elementos urbanos en escenas de satélite WorldView-2 que une las ventajas de los índices espectrales, algoritmos de agrupamiento y redes

neuronales, y se realizó una comparación con un método clásico basado en redes neuronales como clasificador supervisado, obteniéndose un 1.92% mayor de asertividad en el método propuesto sobre la imagen trabajada al usar las 8 bandas y el coeficiente Kappa en el clasificador manual fue solo 0.02 mayor que el clasificador propuesto. También fue desarrollado un método de segmentación sobre regiones agrícolas que hace uso solamente de las bandas roja e infrarroja cercana-1 por medio del NDVI de la WV-2, que delimita las parcelas con contenido diferenciado en bloques convexos.

En el presente trabajo solo se consideraron 3 tipos de índices espectrales (NDVI, NDWI y NDBSI) en la clasificación, por lo que queda pendiente explorar otros índices que refinen la segmentación espectral. Por otro lado, el número de clases para cada segmentación fue seleccionado de forma manual, sin embargo, algoritmos como el ISODATA o ISOCLUS permiten establecer este parámetro de forma automática. De igual manera, no se ha discutido los efectos de la segmentación espacial propuesta sobre zonas urbanas.

REFERENCIAS

[1] Radiometric Use of WorldView-2 Imagery. DigitalGlobe, 2010, pp. 06-16.

[2] Ahmed Elsharkawy et al, “Inprovement in the detection of land cover classes using the WorldView-2 imagery” in American Society for Photogrammetry & Remote Sensing, Sacramento, CA, 2012, p. 11.

[3] Xiaocheng Zhou et al, “Urban land cover mapping based on Object oriented classification using WorldView- 2 satellite remote sensing images” in Proceedings of International Scientific Conference on Sustainable Development & Ecological Footprint, Sopron, Hungary, 2012.

[4] Ulisse D. V Souza and Hermann J. H, “Contribution of the new WorldView-2 spectral bands for urban mapping in coastal areas: Case study Sao Luis (Maranhao state, Brazil)” in XXII International Society for Photogrammetry and Remote Sensing Congress, Melbourne, Australia, 2012, pp 171-176.

[5] Laxmi Narayana Eeti et al, “A single classifier usiing Principal Components vs Multi-classifier system: in landuse-landcover classification of WorldView-2 sensor data” in VIII International Society for Photogrammetry and Remote Sensing Symposium, Hyderabad, India, 2014, pp 91-95.

[6] DigitalGlobe, “WorldView-2” WorldView-2 datasheet, June 2013.

[7] Guoming Li et al, “The fusion and evaluation of WorldView-2 images – A case study of general survey project of geographic national conditions in Sichuan, China” in 21st International Conference on Geoinformatics, Kaifeng, China, 2013.

[8] D. Manning Christopher et al, “Introduction to Information Retrieval”, http://nlp.stanford.edu/IR-book/html/htmledition/k-means-1.html [September 16, 2015].

[9] Hang Thi A. P., “Quick Hull algorithm”, http://www.cse.yorku.ca/~aaw/ Hang/quick_hull/Algorithm.html [October 01, 2015].

Fig. 9. Matriz de confusión de método (a) manual y (b) propuesto.

Fig. 10. Resultados de clasificación empleando método (a) manual y (b)

propuesto.

Fig. 11. Resultados de segmentación espectral y espacial en una zona

agrícola

ISSN 2447-8326. V.1. © 2015 BTSYM


Desarrollo de un Método de Clasificación Automático de...

Documents

Transcript of Desarrollo de un Método de Clasificación Automático de...