Clasificación Digital de imágenes: Métodos

12
 1 Clasificación Digital Métodos  Novie mbre de 20 07 Muchosde los materiales utiliza dos en esta prese ntació n han sid o elab orad os y facilita dos por el Dr. H éctor del Valle F unda m e nto s de la clasif i ca ci ón La clasificación multiespectral es el proceso de ordenar los p íxeles de una imagen en un número finito  y defini do de clases en base a características comunes Mas espec í ficamente, es el reconocimiento de patrones espectrales, que categoriza los números digitales (ND) de los píxeles de una imagen continua (cuantitativa), en un número determinado de clases El resultado es una capa temática (cualitativa), que representa categorías (clases) específicas, basado en propiedades espectrales, datos auxiliares, trabajo de campo, etc. F as e s de la cla si fi ca ci ón Entrenamiento (definir numéricamente las categorías): Supervisado No supervisado  Asignación (categorizar los píxeles de la imagen)  Verific ación de resultados E ntrenam i e nto Tipo de la leyenda: Jerárquicas (Anderson, LCCS , USGS; Corine) No jerárquicas Propiedades de la leyenda: Clases mutuamente excluyentes Clases Exhaustivas  A tene r en cuenta: evitar mezcla de cr iterios, ajustarse a los datos disponibles v Un esquema de clasificación define la leyenda v Hay distintos esquemas de clasificación disponibles: v Los esquemas de clasificación pueden ser jerárquicos y no  jerárqui cos v Otros atributos que pueden ser mapeados incluyen: estructura de la vegetación, disturbios de la cobertura terrestre, edad de la vegetación (primarias y secundarias), distribuci ón de taxa, uso de la tierra, etc. http://www.africover.org/LCCS.htm FAO Land Cover Classification System http://landcover.usgs.gov/classes.asp National Land Cover Data http://landcover.usgs.gov/pdf/anderson .pdf  Anderson URL Clasificación

description

Métodos para clasificar digitalmente las imágenes.

Transcript of Clasificación Digital de imágenes: Métodos

  • 1Clasificacin DigitalMtodos

    Noviembre de 2007

    Muchos de los materiales utilizados en esta presentacin han sido elaborados y facilitados por el Dr. Hctor del Valle

    Fundamentos de la clasificacinLa clasificacin multiespectral es el proceso de ordenar los pxeles de una imagen en un nmero finito y definido de clases en base a caractersticas comunes

    Mas espec ficamente, es el reconocimiento de patrones espectrales, que categoriza los nmeros digitales (ND) de los pxeles de una imagen continua (cuantitativa), en un nmero determinado de clases

    El resultado es una capa temtica (cualitativa), que representa categoras (clases) especficas, basado en propiedades espectrales, datos auxiliares, trabajo de campo, etc.

    Fases de la clasificacin

    Entrenamiento (definir numricamente las categoras):

    SupervisadoNo supervisado

    Asignacin (categorizar los pxeles de la imagen)Verificacin de resultados

    EntrenamientoTipo de la leyenda:

    Jerrquicas (Anderson, LCCS, USGS; Corine)No jerrquicas

    Propiedades de la leyenda:Clases mutuamente excluyentesClases ExhaustivasA tener en cuenta: evitar mezcla de criterios, ajustarse a los datos disponibles

    v Un esquema de clasificacin define la leyendav Hay distintos esquemas de clasificacin disponibles:

    v Los esquemas de clasificacin pueden ser jerrquicos y no jerrquicos

    v Otros atributos que pueden ser mapeados incluyen: estructura de la vegetacin, disturbios de la cobertura terrestre, edad de la vegetacin (primarias y secundarias), distribucin de taxa, uso de la tierra, etc.

    http://www.africover.org/LCCS.htmFAO Land Cover Classification System

    http://landcover.usgs.gov/classes.aspNational Land Cover Data

    http://landcover.usgs.gov/pdf/anderson.pdf

    Anderson

    URLClasificacin

  • 2Entrenamiento supervisado

    Pastizal

    Agua reasforestales

    Cultivos de riego

    Sealar reas caractersticasen la imagen

    Apoyo de radiometrade campo

    Fuente: Chuvieco(1996)

    Caractersticas de las reasde entrenamiento

    Bien identificados:LocalizacinActualizacin

    Suficientemente homogneos:Ruido de la escenaAuto-correlacin espacial

    Que cubran todas las clases

    Cmo obtener estadsticas de entrenamiento?

    Muestreando pxeles:Se asume mxima variabilidadPueden seleccionarse p xeles aislados o pxeles en el interior de polgonosMtodos estandarizados

    Segmentando la imagen en manchas:Se asume coherencia espacialMs ajustado a cartografa convencional

    A partir de p xeles

    Digitalizar polgonos:Tamao: autocorrelacinEfecto de bordeForma: Figuras geomtricas regulares Trazado irregular

    Semillado:Distancia espectralDistancia espacial

    Fuente: Chuvieco(1996)

    A partir de manchas: Segmentacin de imgenes

    Clasificacin sobre manchas:Criterio espectral (dispersin)Criterio espacial (contigidad)

    Fuente: Chuvieco(1996)

    Anlisis de estadsticas

    Medidas de centralidad y dispersinGrficos de valores promedioGrficos de separabilidadMedidas estadsticas de separabilidad

    Distancia normalizadaDivergencia

  • 3Valores estadsticos

    Banda

    Urbano

    Pastizal

    Matorral

    Pinar-Encinar

    Suelo

    Cultivo

    Agua

    ETM X DT X DT X DT X DT X DT X DT X DT 1 10,45 2,20 5,57 0,77 5,31 1,95 1,35 0,61 13,16 5,03 4,49 0,83 2,82 0,41 2 11,12 1,93 7,51 0,68 6,29 2,32 2,49 0,79 15,74 5,66 5,39 1,08 3,21 0,29 3 15,65 2,66 9,44 1,12 9,52 3,94 3,32 0,83 22,76 7,64 5,84 1,28 3,29 0,38 4 19,33 2,5428,80 3,85 16,80 4,02 17,53 3,86 25,71 4,77 30,84 3,28 1,60 0,19 5 21,88 2,5926,50 1,26 22,62 6,67 9,39 1,75 34,34 8,71 14,87 2,11 2,95 0,18 7 17,04 2,7015,54 1,54 15,18 4,73 5,42 0,94 26,76 8,15 7,75 1,15 2,65 0,27

    Fuente: Chuvieco(1996)

    Grficos de signaturas

    0

    5

    10

    15

    20

    25

    30

    35

    40

    1 2 3 4 5 7

    urbano

    pastizal

    matorral

    pinar-enc

    suelo

    cultivo

    agua

    Fuente: Chuvieco(1996)

    Separabilidadgrfica

    0

    5

    10

    15

    20

    urbano pastizal matorral pinar-enc suelo cultivo agua

    Banda 1

    Banda 5

    Banda 4

    0

    5

    10

    15

    20

    25

    30

    35

    40

    urbano pastizal matorral pinar-enc suelo cultivo agua

    05

    10

    15

    2025

    30

    35

    40

    4550

    urbano pastizal matorral pinar-enc suelo cultivo agua

    Fuente: Chuvieco(1996)

    Separabilidad grfica

    Banda 3 Banda 4

    Fuente: Chuvieco(1996)

    Elipses de dispersin

    Banda 3

    Foresta

    Banda 4

    Pastizal

    Cultivo

    Matorral

    Urbano

    Suelo

    Agua

    Fuente: Chuvieco(1996)

    Separabilidad estadstica

    Distancia normalizada:

    Divergencia:DivAB = 0,5 Tr [(VA - VB) (VB-1 - VA-1)] + 0,5 Tr

    [(VA-1 + VB-1) (MA - MB)(MA - MB)T]

    Divergencia transformada:DTAB = c (1 - exp (-DivAB /8))

    Bs

    ND

    +A

    BA

    BA, s

    ND - = dn

  • 4Ejemplo de separabilidad

    Urbano Pastizal Matorral Pinar-Enc Agua Suelo Pastizal 2.000 Matorral 1.998 1.999 Pinar-Encinar 2.000 2.000 2.000 Agua 2.000 2.000 2.000 2.000 Suelo 1.942 2.000 1.999 2.000 2.000 Cultivo 2.000 2.000 2.000 1.993 2.000 2.000

    Fuente: Chuvieco(1996)

    Inters de las medidas de separabilidad

    Determinar las clases problemticasRevisar el proceso de entrenamientoRevisar las bandas seleccionadas

    Seleccionar las bandas con mayor poder discriminante

    Evaluacin rea de entrenamiento

    Las muestras de entrenamiento que han sido creadas pueden sen modificadas, renombradas, eliminadas, y fusionadas, segn sea necesario luego de haber sido evaluadas

    Criterios de asignacin

    Mnima distanciaParaleleppedosMxima probabilidadrboles de decisinRedes neuronales

    Asignacin: Mnima distancia

    R

    IRCa

    c

    b

    ?

    Fuente: Chuvieco(1996)

    La regla de decisin de la mnima distancia calcula la distancia espectral entre el valor del p xel candidato y el valor media de cada firma, en cada banda.El clculo de la distancia se hace a travs de la ecuacin de la distancia euclidiana.

    Asignacin: Mnima distancia

    Ventajas:Rpido de ejecutarTodos los pxeles son clasificados

    Inconvenientes:No considera varianzaProclive a errores de comisin

  • 5Asignacin: Paraleleppedos

    R

    IRC a

    c

    b

    ?

    ?

    Fuente: Chuvieco(1996)

    En la regla de decisi n del paraleleppedo los niveles digitales del pxel candidato se comparan con los lmites superior e inferior de la firma. Estos lmites pueden ser: los valores mnimo y mximo de los ND para cada banda; la media de cada banda +/- n desviaciones estndar, u otros lmites definidos por el usuario en base a las distintas tcnicas de evaluacin de firmas espectrales.Considera reglas de no-clasificacin y de superposici n.

    Asignacin: Paraleleppedos

    Criterio de inclusin: si Inf < ND < Sup

    Problemas:Pxeles en dos gruposPxeles sin clasificar

    Ventajas:RpidoConsidera dispersin

    Asignacin: Mxima probabilidad

    R

    IRC a

    c

    b

    ? La regla de decisi n de la mxima verosimilitud o mxima probabilidad est basada en la probabilidad que un pxel pertenezca a una clase en particular.La ecuacin bsica asume que estas probabilidades son iguales para todas las clases y que las bandas de entrada tiene distribuciones normales.La modificaci n Bayesiana permite asignar factores de peso para clases particulares, basado en conocimientos a priori.

    Asignacin: Mxima probabilidad

    Criterio bayesiano:p (x/A) p (x/B)

    Problemas:Lento de c lculo

    Ventajas:Considera dispersinPueden introducirse lmites

    Clasificacin No-Supervisada

    Clasificacin No-SupervisadaEs un proceso automatizado que le permite al usuario especificar algunos parmetros que se utilizan para revelar patrones estadsticos inherentes a los datos Estos patrones son conglomerados de pxeles con caracter sticas espectrales similares que ordenan los pxeles en categoras

    Clasificacin No-Supervisada

    La clasificacin no supervisada es un proceso iterativo que utiliza la distancia espectral para asignar pxeles a un n mero definido de categoras o clasesEn cada iteracin, las estadsticas se re-calculan, y las agrupaciones van cambiando, hasta que se cumplan ciertas condiciones definidas por el usuario

  • 6Imagen Digital

    El analista pide a la mquina que revise la imagen y extraiga un nmero de clusters espectralmente distintos

    Clusters Espectralmente Distintos

    Cluster 3

    Cluster 5

    Cluster 1

    Cluster 6

    Cluster 2

    Cluster 4

    Clusters Guardados

    Cluster 3

    Cluster 5

    Cluster 1

    Cluster 6

    Cluster 2

    Cluster 4

    Imagen de salida clasificada

    Desconocido

    Pxel a ser Clasificado

    El resultado de la Clasificacin no supervisada no es todava informacin hasta que

    el analista determina la cobertura del suelo para cada uno de los clusters

    ??? Agua

    ??? Agua

    ??? Confera

    ??? Confera

    ??? Algarrobo

    ??? Algarrobo

    ???

    ???

    ???

    ???

    ???

    ???

    Conif .

    Algarr.

    Agua

    Mapa de cobertura Leyenda

    Agua

    Agua

    Conferas

    Conferas

    Algarrobos

    Algarrobos

    Etiquetas

    Es un simple proceso de reagrupar (recodificar) los clusters en clases de informacin significativa (leyenda).

    El resultado es esencialmente idntico al de la clasificacin supervisada:

    Ventajas:Saca la mxima ventaja de la variabilidad espectral de la imagen

    Desventajas:Los clusters ms separables en el espacio espectral pueden no concordar con nuestra percepcin de las clases importantes en la escena

    Clasificacin No Supervisada Otros criterios de asignacin

    Clasificadores en rbolIncorporar el contexto espacial:

    AntesDuranteDespus

    Clasificadores borrososClasificacin orientada a objetosRedes neuronales

  • 7Clasificacin en rbol

    Establecer reglasde decisin:

    Si rx > 0.3 y ry < 0.2 y altitud < 900 m

    - Complejo de entrenar+ Independiente del tipo de variables

    < 10%

    Agua

    Regado

    MDE

    Caducifolios

    < 40% > 40%

    > 30% Urbano Cereal(muy probable) (probable)

    < 30% Urbano Cereal(probable) (muy probable)

    ROJO

    SWIR

    IRC

    > 10%

    Verde

    > 30% < 30%

    < 800m > 800m

    Fuente: Chuvieco(1996)

    Suavizacin de resultados

    Fuente: Chuvieco(1996)

    Suavizacin de resultados

    Fuente: Chuvieco(1996)

    Suavizacin de resultados

    original 3 x 3 7 x 7

    Imagen de Rapel , Chile, 1998Fuente: Chuvieco(1996)

    Productos de la clasificacin

    Archivo:Correccin geomtricaTabla de colorInformacin auxiliar (leyenda, escala grfica, vectores, rtulos, etc.)

    Inventario:Superficie ocupada por cada categora.Pureza de reas de entrenamiento

  • 8Correccin geomtrica

    Fuente: Chuvieco(1996)

    Generacin tabla de color

    Fuente: Chuvieco(1996)

    Ejemplo de tabla de color

    Clase Red Green Blue ColorAgua 0 0 255AzulRegado 0 255 0Verde claroSuelo 255 255 0AmarilloHerbceas 255 180 0NaranjaMatorral 150 75 0MarrnConferas 0 125 0Verde oscuroUrbano 255 0 0RojoResidencial 255 0 255Magenta

    Fuente: Chuvieco(1996)

    Suavizacin de resultados

    Fuente: Chuvieco(1996)

    Vectorizacin

    Fuente: Chuvieco(1996)

    Leyenda temtica

    Fuente: Chuvieco(1996)

  • 9Inclusin de elementos cartogrficosCarreteraRo

    Arganda

    Velilla

    Rivas- UrbJa

    ram

    a

    N-III

    Fuente: Chuvieco(1996)

    Resultado final

    Fuente: Chuvieco(1996)

    Inventario de la clasificacin

    Fuente: Chuvieco(1996)

    Validacin de resultados

    vNecesidades:

    Comprobar cumplimiento de objetivos

    Probar la validez de una metodologa

    v Inconvenientes:

    Muestreo adicional: costo y tiempo

    Dificultad de obtener una estimacin NO

    sesgada

    Consideraciones

    vDisear el muestreo: cuntas?, dnde?

    vRecolectar datos de referencia

    v Comparar datos realidad y resultados (test

    estadsticos y matr iz de confusin)

    v Analizar los errores encontrados

  • 10

    Mtodos

    v Comparar estadsticas

    v Verificacin sobre las reas de

    entrenamiento:

    estimacin sesgada (muestras

    dependientes)

    v Indicar reas de verificacin y tipos de

    muestreo

    Fuentes de errorv Limitaciones del sensor

    Leyenda, escala, resolucin

    vMtodos de anlisis:

    Tipo de interpretacin

    v Estructura del rea de estudio:

    Pxeles de borde (+resolucin espacial de las imgenes)

    Mezcla de coberturas

    v Proceso de verificacin

    Criterios de toma de datos, sensores terrestres...

    Pxelesde borde

    Presencia de p xeles mixtos

    Tipos de muestreo

    Obtencin de la informacin

    v En campo:

    Costosa precisa

    Calibrar bien el instrumental

    homogeneizar criterios

    Geo-referenciacin

    v Fotografa area - cartografa:

    Actualizacin - interpretacin

    Matriz de confusin

    Referencia

    Clase 1 Clase 2 Clase 3 Clase n Total Exactitud Usuario

    Error Comisin

    Clase 1 X11 X1+ X 11/X1+ 1-X11/X 1+ Clase 2 X 22 X2+ X 22/X2+ 1-X22/X 2+

    Clase 3 X33 X3+ X 33/X3+ 1-X33/X 3+ Clase n X nn Xn+ X nn/Xn+ 1-Xnn/X n+ Total X+1 X +2 X+3 X +n S Xi j

    Exactitud Productor

    X11/X+1 X22/X +2 X33/X+3 X nn/X+n

    Cla

    sifi

    caci

    n

    Error Omisin

    1-X11/X+1 1-X 22/X+2 1-X33/X+3 1-X nn/X+n

    Bien clasificados

    Errores de comisin

    Errores de omisin

  • 11

    Medidas de fiabilidad

    v Fiabilidad global:

    v Fiabilidad por categor as:Usuario: Error comisin:

    Productor: Error omisin:

    ijnjni

    iini

    xx

    F,1,1

    ,1==

    =

    SSS

    =

    i

    iiip X

    XF

    +

    =,

    +

    =i

    iiiu X

    XF ,

    F = F z*ESnpqES =

    i

    iiiio X

    XXE

    +

    + -=,

    +

    + -=i

    iiiic X

    XXE ,

    Medidas de fiabilidad

    vGrado de acuerdo (Kappa):

    v Significacin:

    iinii

    iiniiiini

    XXnXXXn

    ++=

    ++==

    S-S-S

    =,

    2,,1k

    22

    12

    21

    kk ss

    kk

    +

    -=z

    ANALISIS CATEGORICO MULTIVARIANTE

    INDICE KAPPA K

    K = 0 -> es ajuste al azar

    K = 1 -> ajuste plano entre realidad y mapa