Desarrollo de un Método de Clasificación Automático de...
Transcript of Desarrollo de un Método de Clasificación Automático de...
Desarrollo de un Método de Clasificación Automático de
Elementos Urbanos y Segmentación en Zonas Agrícolas
en Imágenes Satelitales WorldView-2
Pavel Mendoza Villafane, Joel Telles Castillo y Daniel Diaz Ataucuri.
Dirección de Investigación y Desarrollo Tecnológico
INICTEL-UNI
Lima, Perú
Abstract—El problema de clasificación en teledetección
basado en imágenes satelitales implica muchos desafíos debido la
variabilidad de contenido en una escena y la poca resolución
espacial y espectral necesarios para distinguir distintas clases,
debido a ello, diversos algoritmos de clasificación supervisada y
no supervisada han sido extensamente estudiados. El presente
trabajo propone un método de clasificación no supervisada para
elementos urbanos basado en el uso de índices espectrales sobre
imágenes multiespectrales probado sobre una escena WorldView-
2, el cual es comparado con un clasificador clásico de red
neuronal. También se propone un método de segmentación de
parcelas en zonas agrícolas haciendo uso solo de las bandas roja e
infrarroja cercana. Las pruebas realizadas empleando todas las
bandas espectrales de la escena para la clasificación muestran un
rendimiento de 85.67% y de 87.59% de asertividad empleando
una red neuronal y el clasificador propuesto respectivamente.
Por otro lado, el método de segmentación desarrollado permitió
una clara delimitación entre parcelas y caminos en regiones
agrícolas empleando solo las bandas roja e infrarroja cercana.
Palabras claves— WorldView-2; clasificación; agrupamiento;
red neuronal; índices espectrales; convex hull.
I. INTRODUCCIÓN
El problema de clasificación en teledetección basado en imágenes multiespectrales satelitales ha sido extensamente estudiado debido a su complejidad reflejada en el nivel de error en los mapas de clasificación resultantes, siendo tema estudio algoritmos de clasificación supervisados y no supervisados que buscan resolver el problema descrito. La elección del algoritmo y el nivel de pre-procesamiento sobre los datos de entrada influirán en el nivel de precisión de los resultados.
La fase de pre-procesamiento para la calibración de escenas WorldView-2 de valores de nivel digital (ND) a valores de radiancia y luego a reflectancia pueden ser hallados en [1], y son usados con la finalidad de trabajar con valores que contengan un significado físico como la radiancia y reflectancia.
Los resultados de [2] muestran cómo solo el uso de índices espectrales, tal como el Índice Espectral de Vegetación Normalizada (NDVI, por sus siglas en inglés), pueden ser empleados para obtener una segmentación aproximada del contenido en una escena WV-2. En [3], diferentes índices espectrales de vegetación, suelo y agua son utilizados para realizar una clasificación de elementos en zonas urbanas
basados en árboles de decisión. Sin embargo, muchas veces el contenido espectral entre diferentes elementos es similar conllevando a un alto nivel de error en la segmentación y clasificación. Por otro lado, una adecuada selección de bandas puede ayudar a reducir el tiempo de procesamiento, [4] muestra como una clasificación empleando solo las bandas RE y NIR-2 de WV-2 obtienen resultados relativamente menor al caso de uso de todas las bandas. En [5] se muestra como el uso de Análisis de Componentes Principales (PCA, por sus siglas en inglés) para la eliminación de redundancia de datos puede perjudicar la exactitud de la clasificación y muestra como una combinación adecuada de las bandas puede llegar a mejorar los resultados.
II. ÁREA DE ESTUDIO
Se seleccionaron 2 áreas de estudio en el presente trabajo. El área de estudio 1 es una imagen WorldView-2 (WV-2) de 1001x896 píxeles, que representa un área total de 3.59km
2 y
corresponde a un sector de Pantanos de Villa, Lima-Perú, con coordenadas esquina izquierda latitud 12°12'33.39"S y longitud 77° 0'29.53"O del 04 de diciembre del 2012, la cual es mostrada en la figura 1.
El área de estudio 2, es una imagen WV-2 de 480x1095
Fig. 1. Imagen WV-2 en color verdadero (bandas RGB-532) del área de
estudio.
ISSN 2447-8326. V.1. © 2015 BTSYM
2015 Brazilian Technology Symposium
Fig. 3. Proceso de clasificación de elementos en zonas urbanas.
Fig. 4. Proceso de clasificación de elementos en zonas urbanas.
píxeles con 2.1km2 con coordenadas latitud 6°43'51.71"S
longitud 79°48'8.27"O del Instituto Nacional de Innovación Agraria de Chiclayo, Lima-Perú, del 10 de setiembre del 2015, mostrada en la figura 2.
El satélite comercial WorldView-2 ofrece imágenes de alta resolución desde octubre del 2009, con una resolución espacial de 1.85m en cada banda multiespectral (MS) y 0.46m en la banda pancromática (PAN), además de una resolución espectral de 8 bandas [6].
III. METODOLOGÍA
Una adecuada segmentación permite delimitar diferentes
clases en una imagen satelital, para ello, se han seleccionado
un conjunto de índices espectrales que permitan realzar
elementos de un tipo dado en una escena, sin embargo, la
escasa mixtura del contenido en esta puede degradar el
resultado de la segmentación. El contenido de la escena 1
(jardines, tipos de construcciones, carreteras entre otros) es
mayor a la segunda escena (suelo y vegetación), lo cual
permite una mayor diferenciación entre clases, por este motivo
fue conveniente aplicar procesos diferentes, los cuales pueden
verse en las figuras 3 y 4.
La figura 3 muestra el proceso aplicado al área de estudio 1, en este se aplicó la fusión de imágenes para mejorar el nivel de detalle y se aplicó una segmentación espectral basada en los índices NDVI, NDWI y NDBSI. Los elementos de entrenamiento fueron seleccionados de forma automática a partir de 3 conjuntos obtenidos en el proceso de segmentación aplicando el algoritmo K-means los cuales fueron ingresados a una red neuronal.
Por otro lado, en el proceso de segmentación de elementos en zonas agrícolas en el área de estudio 2, mostrado en la figura 4, la escena presenta únicamente suelo y vegetación por lo que solo fue empleado el NDVI en la segmentación espectral y fue aplicado una segmentación espacial utilizando un algoritmo Convex Hull sobre la segmentación espectral.
En ambas zonas de estudio fue necesario aplicar un paso previo de calibración. En las siguientes sub-secciones se detallan los pasos empleados en cada proceso.
A. Pre-procesamiento
Las imágenes WV-2 son adquiridas en formato GeoTIFF y
se encuentran en Niveles Digitales (ND), por lo que es
necesario realizar un proceso de calibración sobre ellas. Los
valores ND son convertidos a valores de radiancia percibidos
en el sensor usando (1).
(1)
Donde es la radiancia por pixel [ ], es el factor de calibración radiométrica absoluta
[ ], ND es el valor del pixel y es el ancho
de banda efectiva [ ]. El valor y pueden ser obtenidos
a partir de la metadata XML de la escena con los campos
ABSCALFACTOR y EFFECTIVEBANDWIDTH respectivamente.
Ignorando los efectos de la atmósfera es posible determinar
los valores de reflectancia usando (2), esta es conocida como
reflectancia sobre la atmósfera (TOA, por sus siglas en inglés)
debido a que ignora los efectos de la atmósfera sobre la señal
recibida.
(2)
Donde es la reflectancia TOA, es la radiancia, es la Irradiancia Espectral Solar Media [ ], es
el ángulo solar Zenith y es la distancia Tierra-Sol [AU]. El
valor para cada longitud de onda puede hallarse en
[1], el valor se determina a partir del día del año en el que
fue adquirida la escena y es calculado a partir de (3)
empleando el ángulo de elevación solar, el cual es hallado en
la metadata XML en el campo MEANSUNEL.
(3)
Donde es el ángulo Zenith y el ángulo de
elevación solar, ambos en grados sexagesimales.
La figura 5 muestra las firmas espectrales obtenidas a partir
de las 8 bandas calibradas en reflectancia en el área de estudio
1. Algunos materiales pueden ser fácilmente diferenciados, sin
embargo, algunas firmas como suelo y carretera pueden llegar
Fig. 2. Imagen WV-2 en color verdadero (bandas RGB-532) del área de
estudio 2.
ISSN 2447-8326. V.1. © 2015 BTSYM
2015 Brazilian Technology Symposium
Fig. 5. Firmas espectrales de algunos materiales obtenidos a partir de la
escena WV-2 mostrada en la Fig.1 luego de aplicar la calibración sobre ella.
a ser muy similares.
B. Fusión de Bandas
Existen diversos algoritmos para realizar la fusión entre
imágenes con el propósito de mejorar la resolución espacial de
las bandas multiespectrales basados en la idea de ingresar los
detalles de la panda PAN dentro de cada banda MS, por
ejemplo: Brovey, PCA, Wavelet entre otros [7]. Sin embargo,
en cualquier caso, los valores radiométricos de la escena
siempre serán afectados, por este motivo se ha elegido el
algoritmo de Brovey por tener una rápida implementación
basada en (4).
∑
(4)
Donde y son los valores nuevo y antiguo en la
posición en la imagen, es el número de bandas y
es el valor en en la pancromática. Para aplicar el
algoritmo de Brovey, primero es necesario re-escalar las
bandas MS al mismo tamaño que la pancromática. La figura 6
muestra el resultado de la fusión de imágenes.
C. Segmentación Espectral
Los índices espectrales fueron empleados para realizar una
primera separación entre clases básicas. El NDVI (5), es el
índice de vegetación más popular para segmentar vegetación,
el cual entrega valores en el intervalo [-1, 1] y usualmente se
considera como vegetación vigorosa a valores con NDVI>0.6,
se ha considerado valores de NDVI en [0.5-1.0] con el
propósito de tomar en cuenta zonas donde la vegetación es
escaza.
(5)
Donde y son las bandas roja e infrarroja cercana-1 en
WV-2 respectivamente.
Por otro lado, el NDWI (6), con la misma escala que el
NDVI, permite una rápida segmentación de cuerpos de agua y
sombras en el intervalo [0, 1], pudiendo crear confusión entre
estos.
(6)
Aunque es posible segmentar suelo y edificios a partir del
NDVI, se obtuvo mejores resultados empleando el Índice
Espectral de Suelo Desnudo Normalizado (NDBSI, por sus
siglas inglés) obtenido a partir de (7).
(7)
D. Agrupamiento de datos
A pesar de que los índices espectrales están diseñados con
el propósito de realzar información específica, estos suelen dar
valores erróneos, por ejemplo el NDWI confunde agua con
sombra. Es posible usar sub-intervalos en cada índice para
segmentar distintas clases, sin embargo, esto no es tan práctico
ya que requiere establecer intervalos de cada clase para una
correcta distinción. Trabajos como [2, 3] emplean arboles de
decisión basados en índices espectrales y otros parámetros
adicionales que deben establecerse a-priori por cada clase a
diferenciar.
Algoritmos de agrupamiento, tales como ISODATA y K-
means [8], permiten una rápida segmentación sin requerir
información sobre las clases. Dado un conjunto de vectores
, K-means separa cada vector al establecer
K centroides (vectores que caracterizan a cada clase). Cada
es asignado a un grupo, en base a la distancia entre este y el
centroide más cercano. Luego, se determina un nuevo
centroide para cada grupo y se repite el procedimiento hasta
encontrar los centroides óptimos, los cuales calculados como
los centros de masa de cada grupo según (8).
∑
(8)
Donde es un grupo, ,
y
es el centroide
actual y nuevo de respectivamente.
ISODATA es una variación del K-means, pero no requiere
establecer el número de grupos que serán formados, estos son
determinados en base a divisiones y fusiones entre clases
durante la actualización de los centroides.
E. Segmentación Espacial
Debido a la poca homogeneidad en una zona agrícola (zona
de estudio 2), una parcela específica, que puede contener o no
un cultivo, no puede ser descrito por un valor puntual de
índice espectral (NDVI en este caso). Sin embargo, puede
Fig. 6. Combinación RGB-532 luego de aplicar el algoritmo de Brovey, (a)
Imagen original (b) Imagen fusionada.
ISSN 2447-8326. V.1. © 2015 BTSYM
2015 Brazilian Technology Symposium
emplearse un intervalo para describir el contenido de las
parcelas, en este caso, se consideró una segmentación en 3
partes. Primero, se establecieron intervalos automáticos de
NDVI que separen gradualmente las parcelas en bloques.
Luego, siempre que un bloque fuese mayor a un máximo
fijado, este es dividido empleando K-means hasta en 3
bloques. Por último, debido a que en la primera segmentación
pudo quedar zonas sin segmentar, se aplicó el paso 1 y 2 sobre
la zona sin segmentar en la primera etapa con el doble de
intervalos de NDVI respecto a los iniciales. En cada paso,
cada bloque fue delimitado empleando un algoritmo Convex
Hull [9] para obtener un bloque convexo que encierre todos
los elementos del mismo y fueron eliminados aquellos bloques
cuya área fuese muy similar a su perímetro o no cumplan con
un área mínima.
F. Selección de elementos de entrenamiento
Es posible realizar la separación entre clases empleando un algoritmo de agrupamiento, sin embargo, estos no obtienen buenos resultados cuando el conjunto de vectores es demasiado grande. Por ello, primero se realiza la segmentación basado en índices espectrales, NDVI, NDWI y NDBSI en una zona urbana. Luego se emplea un algoritmo de agrupamiento (K-means) empleando todas las bandas espectrales, para separar las clases sobre cada conjunto de la segmentación.
Por otro lado, debido a que los conjuntos de vectores producto de la segmentación pueden incluir elementos que no corresponden a una sola clase, por ejemplo, la sombra de un edificio al lado de vegetación podría ser incluida erróneamente en cualquiera de estos 2 conjuntos iniciales (vegetación o construcción) se hace uso de operaciones de morfología matemática (erosión) para eliminar los elementos de los límites entre clases y mantener solo los que sean representativos en la segmentación y cada uno de estos 3 conjuntos son ingresados al algoritmo de agrupamiento, el cual producirá un mayor número de clases. Por ejemplo, Si se establecen , y
grupos para la segmentación de NDVI, NDWI y NDBSI respectivamente, se obtendrán clases distintas. La figura 7 muestra el resultado de la segmentación basado en índices espectrales luego de aplicar erosión.
G. Proceso de entrenamiento
Dado un conjunto de N clases obtenidas a
partir del proceso de agrupamiento, es posible que alguno de
los conjuntos sea mucho más grande que otro. Sea el
cardinal del y se extraen elementos
de cada de forma aleatoria obteniéndose las clases
con un total del vectores de
entrenamiento, los cuales son ingresados a una red neuronal, la
cual consiste de 3 capas, la capa de entrada con 8 neuronas, la
capa oculta con 24 neuronas y 7 en la capa de salida. En la
capa 2 y 3 se usó la función de transferencia sigmoidea
tangente hiperbólica mostrado en (9).
(9)
IV. RESULTADOS OBTENIDOS
Todas las pruebas realizadas fueron desarrolladas en el entorno de Matlab. En la zona de estudio 1, en la segmentación de NDVI se consideró 2 clases: césped y árboles, en la segmentación de NDWI solo 1 clase: agua, debido a la poca presencia de sombras y en la segmentación basado en NDBSI 4 clases: carretera, suelo y 2 tipos de construcciones, debido a que un alto porcentaje de techos de edificios están cubiertos con tejas, dando un total de 7 clases.
El algoritmo propuesto fue comparado con una red neuronal clásica, cuyos elementos de entrenamiento fueron seleccionados de forma manual y son mostrados en la figura 8.
Se empleó la misma configuración en la red neuronal en ambos casos. Los elementos de entrenamiento para la red neuronal clásica fueron 7795 vectores y para el algoritmo propuesto 6000 vectores. Los vectores en el entrenamiento están compuestos de todas las bandas espectrales de la imagen WV-2 en ambos casos.
La figura 9 muestra la matriz de confusión en ambos casos y fueron determinados el coeficiente Kappa los cuales fueron 0.85 y 0.83 con un porcentaje de asertividad de 85.67% y 87.59% para la clasificación manual y el método propuesto respectivamente. Fig. 7. Resultado de segmentación basado en índices espectrales luego de
aplicar erosión y dilatación. (a) NDBSI. (b) NDWI. (c) NDVI.
Fig. 8. Selección manual de 7 clases.
ISSN 2447-8326. V.1. © 2015 BTSYM
2015 Brazilian Technology Symposium
La figura 10 muestra los mapas de clasificación obtenidos empleando la red neuronal con selección manual y el algoritmo propuesto.
Por último, la figura 11 muestra el resultado de la segmentación de la zona de estudio 2 empleando la segmentación espectral y espacial. Se repitió la prueba sobre 4 zonas agrícolas en total obteniéndose resultados similares.
V. CONCLUSIONES Y TRABAJO FUTURO
En este trabajo de investigación se desarrolló un nuevo método de clasificación automática de elementos urbanos en escenas de satélite WorldView-2 que une las ventajas de los índices espectrales, algoritmos de agrupamiento y redes
neuronales, y se realizó una comparación con un método clásico basado en redes neuronales como clasificador supervisado, obteniéndose un 1.92% mayor de asertividad en el método propuesto sobre la imagen trabajada al usar las 8 bandas y el coeficiente Kappa en el clasificador manual fue solo 0.02 mayor que el clasificador propuesto. También fue desarrollado un método de segmentación sobre regiones agrícolas que hace uso solamente de las bandas roja e infrarroja cercana-1 por medio del NDVI de la WV-2, que delimita las parcelas con contenido diferenciado en bloques convexos.
En el presente trabajo solo se consideraron 3 tipos de índices espectrales (NDVI, NDWI y NDBSI) en la clasificación, por lo que queda pendiente explorar otros índices que refinen la segmentación espectral. Por otro lado, el número de clases para cada segmentación fue seleccionado de forma manual, sin embargo, algoritmos como el ISODATA o ISOCLUS permiten establecer este parámetro de forma automática. De igual manera, no se ha discutido los efectos de la segmentación espacial propuesta sobre zonas urbanas.
REFERENCIAS
[1] Radiometric Use of WorldView-2 Imagery. DigitalGlobe, 2010, pp. 06-16.
[2] Ahmed Elsharkawy et al, “Inprovement in the detection of land cover classes using the WorldView-2 imagery” in American Society for Photogrammetry & Remote Sensing, Sacramento, CA, 2012, p. 11.
[3] Xiaocheng Zhou et al, “Urban land cover mapping based on Object oriented classification using WorldView- 2 satellite remote sensing images” in Proceedings of International Scientific Conference on Sustainable Development & Ecological Footprint, Sopron, Hungary, 2012.
[4] Ulisse D. V Souza and Hermann J. H, “Contribution of the new WorldView-2 spectral bands for urban mapping in coastal areas: Case study Sao Luis (Maranhao state, Brazil)” in XXII International Society for Photogrammetry and Remote Sensing Congress, Melbourne, Australia, 2012, pp 171-176.
[5] Laxmi Narayana Eeti et al, “A single classifier usiing Principal Components vs Multi-classifier system: in landuse-landcover classification of WorldView-2 sensor data” in VIII International Society for Photogrammetry and Remote Sensing Symposium, Hyderabad, India, 2014, pp 91-95.
[6] DigitalGlobe, “WorldView-2” WorldView-2 datasheet, June 2013.
[7] Guoming Li et al, “The fusion and evaluation of WorldView-2 images – A case study of general survey project of geographic national conditions in Sichuan, China” in 21st International Conference on Geoinformatics, Kaifeng, China, 2013.
[8] D. Manning Christopher et al, “Introduction to Information Retrieval”, http://nlp.stanford.edu/IR-book/html/htmledition/k-means-1.html [September 16, 2015].
[9] Hang Thi A. P., “Quick Hull algorithm”, http://www.cse.yorku.ca/~aaw/ Hang/quick_hull/Algorithm.html [October 01, 2015].
Fig. 9. Matriz de confusión de método (a) manual y (b) propuesto.
Fig. 10. Resultados de clasificación empleando método (a) manual y (b)
propuesto.
Fig. 11. Resultados de segmentación espectral y espacial en una zona
agrícola
ISSN 2447-8326. V.1. © 2015 BTSYM
2015 Brazilian Technology Symposium