Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación...

26
Trabajo fin de grado: Segmentación de imágenes basada en la textura. Aplicación de CRF densos como técnica de mejora Diego Rodríguez Mulió Grado en Ingeniería Electrónica Industrial y Automática Grado en Ingeniería Electrónica y Automática Industrial Escuela Técnica Superior de Ingeniería y Diseño Industrial Universidad Politécnica de Madrid 15 de Septiembre de 2015

Transcript of Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación...

Page 1: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Trabajo fin de grado:Segmentación de imágenes basada en la textura. Aplicación de CRF densos como 

técnica de mejora

Diego Rodríguez MulióGrado en Ingeniería Electrónica Industrial y

Automática

Grado en Ingeniería Electrónica y Automática Industrial

Escuela Técnica Superior de Ingeniería y Diseño IndustrialUniversidad Politécnica de Madrid

15 de Septiembre de 2015

Page 2: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Objetivos• Segmentación multi-clase en dos dimensiones

Objetivo de análisis

Page 3: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Objetivos• Segmentación binaria en tres dimensiones

Región de interés de una resonancia magnética

Page 4: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Segmentación en dos dimensiones

Page 5: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Métodos y referencias

• Segmentación en dos fases:

Segmentación basada en la textura

Modelos de apariencia y 

reducción de ruido

Textonboost de Shotton et al.

(Cambridge‐Microsoft)

CRF densos deKrähenbühl y Koltun

(Stanford)

Page 6: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Segmentacióntextonboost

Hierba      Árbol       Cielo

Page 7: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Segmentación textonboost• Textonización

o Textura = irregularidades de la imageno Se crean regiones de textura uniforme: textones

Mapa de textonesImagen original

Page 8: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Segmentación textonboost

ÁRBOL

CIELO

i

Page 9: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Segmentación textonboost• Clasificación

o Evaluación de característicaso Se obtienen mapas de probabilidad: potenciales unitarios

Page 10: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

CRF

CRF definido sobre la imagen

Clasificación

Page 11: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

CRF

Page 12: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

CRF denso

Page 13: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Implementaciones• Códigos fuente proporcionados en las referencias

o Textonboost en dos dimensiones implementado en C++ por Krähenbühl P. (Stanford University)

o CRF densos en dos dimensiones implementado en C++ por Krähenbühl P. (Stanford University)

• Programas desarrollados

o Generador de imágenes *.pgm para visualizar potenciales unitarios de textonboost

o Adaptación de CRF densos en dos dimensiones para incorporar los potenciales unitarios de textonboost

Page 14: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Experimentos MSRC• Banco de imágenes MSRC (Microsoft) • Segmentación textonboost + CRF denso• Resultados precisos en el 81,11%

Page 15: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Experimentos nidos de cigüeña

• Banco de imágenes para reconocimiento de : nido, cigüeña, cielo y edificio

Page 16: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Experimentos nidos de cigüeña

• Textonboost detecta el 100% • Textonboost + CRF denso segmentan de forma

precisa el 67%

Page 17: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Conclusiones• El sistema de segmentación textonboost + CRF

denso otorga precisión suficiente para la detecciónde zonas de nidificación de aves

• Los CRF densos mejoran notablemente la precisión en la segmentación multi-clase bidimensional

Page 18: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Segmentación en tres dimensiones

Page 19: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Métodos y referencias• Segmentación en dos fases:

Segmentación basada en fusión de etiquetas y registro 

no rígido

Modelos de apariencia y 

reducción de ruido

LabelFusion de Platero y Tobar (UPM)

Adaptación a 3D de los CRF densos de Krähenbühl y 

Koltun (Standford)

Page 20: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Implementaciones• Códigos fuente proporcionados en las referencias

o Segmentación LabelFusion basada en patches implementada en MATLAB por Platero C. (ETSIDI-UPM)

o CRF densos en dos dimensiones implementado en C++ por Krähenbühl P. (Stanford University)

• Programas desarrolladoso Conversores de imágenes MATLAB -> C++o CRF densos en tres dimensiones en C++o CRF densos en mexFunction para su ejecución en MATLAB

Page 21: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

CRF densos 3D en C++• Pruebas sobre IBSR (Internet Brain Segmentation

Repository)

Page 22: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

MexFunction• Implementa CRF denso y min-cut 3D• Biblioteca dinámica, con extensión *.mexw64• Desde MATLAB, se interpreta como un comando

Page 23: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Resultados IBSR• Comparativa de valores DICE

(promedio de los 18 pacientes)

o Potenciales unitarios: 0,8301 0,8372

o Potenciales unitarios + potenciales de adyacencia de Song:0,8334 0,8414

o Potenciales unitarios + potenciales densos:0,8340 0,8420

Page 24: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Conclusiones

Page 25: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Software público• Los programas empleados en este Trabajo Fin de

Grado se encuentran disponibles en el siguiente enlace:http://www.ieef.upm.es/joomla/index.php/grupos-

inv/vision-artificial

Page 26: Segmentación multi-clase en dos dimensiones · • Segmentación en dos fases: Segmentación basada en la textura Modelos de apariencia y reducción de ruido Textonboost de Shotton

Gracias por su atención