Diapositivas Visión por Computador: Visión 3D

404
Div. Ingeniería de Sistemas y Automática Universidad Miguel Hernández GRUPO DE TECNOLOGÍA INDUSTRIAL

description

ATENCIÓN!! La conversión que SlideShare hace no es muy buena. Por eso lo he subido a uploaded.net para que podáis descargar el fichero original. Sigue el link: http://ul.to/rfkp14y6 La visión artificial constituye uno de los temas de investigación que posee en la actualidad un espectro más amplio de posibles aplicaciones industriales, y que en un futuro adquirirá todavía una mayor relevancia. Muestra de ello son tanto los esfuerzos que dedican al tema los principales centros de investigación del mundo entero como el interés que demanda la industria en estas aplicaciones. La mayor parte de las realizaciones prácticas existentes, trabajan sobre imágenes bidimensionales, bien por manejar objetos planos, o bien por considerar que la información del objeto a analizar está suficientemente condensada en una o varias proyecciones. Esto supone una fuerte restricción en la gama de productos a analizar y en sus resultados. En la actualidad, el desarrollo de nuevas técnicas de procesamiento de imágenes, así como la espectacular evolución de los equipos informáticos, permite incluir la tercera dimensión como un objetivo adicional, permitiendo una adecuada adquisición y un correcto tratamiento de la información tridimensional de los objetos. Docente: REINOSO GARCÍA, ÓSCAR Formato: DIAPOSITIVAS Temas tratados: 01 Introducción 02 Proceso de Formación de Imágenes 03 Modelo de Cámara 04 Caracteristicas de Imágenes 05 Transformaciones de Imágenes 06 Detección de Bordes 07 Segmentación 08 Formatos de Almacenamiento

Transcript of Diapositivas Visión por Computador: Visión 3D

  • 1. Div. Ingeniera de Sistemas y Automtica Universidad Miguel Hernndez GRUPO DE TECNOLOGA INDUSTRIAL

2. Definicin Transformacin Informacin Luminosa Imagen Digital Sistema Humano Visin Sistema Visin Artificial Aplicaciones de la Visin por Computador Etapas en un Sistema de Visin Componentes de un SVA 3. Visin por Computador: Proceso de extraccin de informacin del mundo fsico a partir de imgenes utilizando para ello un computador Ciencia que estudia la interpretacin de imgenes mediante computadores digitales 4. Definicin Transformacin Informacin Luminosa Imagen Digital Sistema Humano Visin Sistema Visin Artificial Aplicaciones de la Visin por Computador Etapas en un Sistema de Visin Componentes de un SVA 5. La formacin de imgenes es un proceso mediante el cual una informacin 3D (la escena) es proyectada en un plano 2D (la imagen). Las cmaras imitan el proceso que tiene lugar en el ojo humano. Mundo 3D 6. Modelo de cmara simplificado. El propsito del modelo es que cada punto de la escena sea proyectado en un solo punto del plano de imagen. De esa manera la imagen estar enfocada. Eje ptico Apertura Sistema ptico Mundo 3D 7. Modelo ideal de cmara (pinhole). Una superficie mate emite luz en todas las direcciones. Cuando la apertura es muy pequea, desde cualquier punto slo pasa luz con una direccin. Todos los puntos estn bien definidos: imagen enfocada. Eje ptico Apertura Plano de imagen (fotodetector) P P Distancia focal Mundo 3D 8. Comparar con lo que ocurre a medida que aumenta el tamao de la apertura. Los puntos se difuminan. P P P P P Crculosde confusin P 9. Definicin Transformacin Informacin Luminosa Imagen Digital Sistema Humano Visin Sistema Visin Artificial Aplicaciones de la Visin por Computador Etapas en un Sistema de Visin Componentes de un SVA 10. 47 54 77 64 70 68 72 80 78 65 100 104 110 90 101 135 124 120 138 112 165 170 165 163 160 11. Definicin Transformacin Informacin Luminosa Imagen Digital Sistema Humano Visin Sistema Visin Artificial Aplicaciones de la Visin por Computador Etapas en un Sistema de Visin Componentes de un SVA 12. Comparacin entre sistemas Sistema Humano Mejor capacidad de reconocimiento Mejor adaptacin a situaciones imprevistas Utilizacin de conocimiento previo Sistema Artificial Mejor evaluacin de magnitudes fsicas Buen desempeo de tareas rutinarias 13. Proyeccin de Perspectiva Ventaja Sistema Humano de Visin Imagen Resultante Posibles orgenes 14. Dificultad para medir magnitudes de intensidad Ventaja Sistema Visin Artificial 15. Si sus ojos siguen el movimiento del punto rotativo rosado, slo ver un color: rosado. Si su mirada se detiene en la cruz negra del centro, el punto rotativo se vuelve verde. Ahora, concntrese en en la cruz del centro. Despus de un breve periodo de tiempo, todos los puntos rosados desaparecern y slo ver un nico punto verde girando. Es asombroso como nuestro cerebro trabaja. En realidad no hay ningn punto verde, y los puntos rosados no desaparecen. Esto debera ser prueba suficiente de que no siempre vemos lo que creemos ver... 16. Dificultad mediciones geomtricas Ventaja Sistema de Visin Artificial 17. Creacin de Contornos ilusorios 18. Reconocimiento de informacin compleja Ventaja Sistema Humano de Visin 19. Efectos ilusorios 20. Influencia del entorno (1) Ilusin de Muller-Lyer 21. Influencia del entorno 22. Influencia del entorno Ilusin de Ponzo 23. Diferencia en el anlisis de objetos Ventaja Sistema Visin Artificial 24. Efectos pticos ilusorios Ventaja Sistema de Visin Artificial 25. Definicin Transformacin Informacin Luminosa Imagen Digital Sistema Humano Visin Sistema Visin Artificial Aplicaciones de la Visin por Computador Etapas en un Sistema de Visin Componentes de un SVA 26. Aplicaciones de la visin por computador Procesos industriales Apoyo al diagnstico mdico Percepcin remota Guiado de vehculos mviles Gestin de la informacin visual Control de calidad de productos y procesos 27. Objetivos de las aplicaciones industriales de la visin por computador Mejora en la calidad de la inspeccin Mejora en la cantidad de la inspeccin Sustitucin de los operarios Integracin en el entorno automatizado Incremento de la fiabilidad 28. Limitaciones de las aplicaciones industriales de la visin por computador Adaptacin a situaciones imprevistas Utilizacin de mtodos indirectos en la determinacin de las caractersticas 29. Definicin Transformacin Informacin Luminosa Imagen Digital Sistema Humano Visin Sistema Visin Artificial Aplicaciones de la Visin por Computador Etapas en un Sistema de Visin Componentes de un SVA 30. Deteccin Bordes Interpretacin Escena Adq. Imagen Muestreo DiscretizacinPreprocesamiento Realce, suavizado, etc. Segmentacin Extraccin de objetos de la imagen Extraccin Caractersticas Representacin matemtica Reconocimiento y Localizacin Objetos Qu son y dnde estn 31. Definicin Transformacin Informacin Luminosa Imagen Digital Sistema Humano Visin Sistema Visin Artificial Aplicaciones de la Visin por Computador Etapas en un Sistema de Visin Componentes de un SVA 32. Iluminacin Cmara Digitalizador Computador Escena Matriz 2D de niveles de gris o color Seal Analgica Luz reflejada o emitida 33. Caractersticas de las cmaras de VA Tamao del elemento sensor Resolucin Sensibilidad y relacin seal/ruido Respuesta espectral Uniformidad de blanco y negro Estabilidad en funcin de la temperatura Margen dinmico Blooming, smearing, lag. Obturador electrnico Montura de objetivos Tamao, peso, etc. 34. Propsito: Conversin de una seal analgica a seal discreta almacenable en un computador Algunos Fabricantes: MATROX IMAGING TECHNOLOGY DATACUBE NATIONAL INTSTRUMENTS ... 35. Caractersticas: Seales de entrada Tipo de seal: Video compuesto, Seal estndar (PAL, NTSC, ...) B/N o Color, Entrada de video digital N Canales de entrada Velocidad de transferencia Bus de conexin Memoria disponible en el digitalizador Capacidad de procesamiento Software de programacin ... 36. Definicin Proceso de conversin a digital de la seal analgica transmitida por la cmara. Se realiza un muestreo o digitalizacin de las coordenadas espaciales y una cuantificacin o digitalizacin en niveles de gris. 37. Original 8 puntos4 puntos 2 puntos Muestreo espacial 38. 256 248 1664 Cuantificacin 39. Matriz de valores Imagen digitalizada con 256 niveles de gris 40. Sustitucin de los operarios Evitar su presencia en entornos peligrosos Trmicos, riesgo fsico, lumnico, nuclear, ruidoso,... Abaratar costes de produccin Incremento de la fiabilidad Eliminacin de criterios subjetivos Por ejecucin de tareas rutinarias Por cambio de turno 41. Mejora en la calidad de los productos y de los procesos involucrados Deteccin de defectos ms pequeos, manipulado ms preciso de piezas, ... 42. Mejora en la cantidad de los productos y de los procesos involucrados Mayor rapidez en la inspeccin Aumento de la cadencia de produccin 43. Integracin en el entorno automatizado Dotacin de integracin sensorial en un proceso automatizado 44. Inspeccin Visual Automatizada o Control de Calidad de Productos Proceso automtico para decidir si un determinado producto cumple con un conjunto de especificaciones previamente establecidas, definidas como estndar de calidad. 45. Control de los Procesos de Automatizacin Estn ntimamente ligados a los elementos mecnicos o de control que intervienen en el proceso Robot Manipulador etc 46. Inspeccin de forma, apariencia y presencia producto. El control se realiza determinando caractersticas globales del producto. 47. Inspeccin de defectos en productos discretos. El control se realiza determinando caractersticas locales del producto. Forma, tamao o acabado. 48. Inspeccin de defectos en productos continuos. El control se realiza determinando caractersticas locales del producto. Forma, tamao o acabado. 49. Inspeccin dimensional de productos. Unidimensional, Bidimensional o Tridimensional Por la naturaleza del producto (p.ej. grosor de una plancha de aluminio) Por existir ejes de simetra (p.ej. dimetro de una pieza de revolucin) 50. Industria del automvil: Componentes y acabado Industria de los electrodomsticos: componentes y acabado Industria de transformacin y empaquetado de alimentos Industria farmacutica y de cosmticos Sistemas de embalaje y empaquetamiento Tarjetas de circuito impreso y circuitos cableados Impresin de documentos Industria bsica de transformacin (madera, aluminio, acero, papel, ...) Industria de la cermica y el mrmol Industria textil 51. Va a estar ntimamente ligado a los elementos mecnicos o de control que intervienen en el proceso de automatizacin Robot Manipulador 52. Control de presencia de un producto. La presencia activa el comienzo de un proceso Manipulado de piezas paletizadas El objetivo es determinar la posicin para el posterior manipulado Manipulado de piezas apiladas (Bin-Picking) Mecanizado de piezas Realizado con la ayuda de la informacin visual Ajuste de aparatos Ensamblado y desensamblado automtico Fusin sensorial con ms sensores (fuerza, tacto, etc.) Intervienen movimientos acomodaticios Seguimiento de objetos en movimiento 53. Cristalera Espaola 54. Div. Ingeniera de Sistemas y Automtica Universidad Miguel Hernndez GRUPO DE TECNOLOGA INDUSTRIAL 55. La formacin de imgenes es un proceso mediante el cual una informacin 3D (la escena) es proyectada en un plano 2D (la imagen). Las cmaras imitan el proceso que tiene lugar en el ojo humano. Mundo 3D 56. Modelo de cmara simplificado. El objetivo del modelo es que cada punto de la escena sea proyectado en un solo punto del plano de imagen. De esa manera la imagen estar enfocada. Eje ptico Apertura Sistema ptico Mundo 3D 57. Modelo ideal de cmara (pinhole). Una superficie mate emite luz en todas las direcciones. Cuando la apertura es muy pequea, desde cualquier punto slo pasa luz con una direccin. Todos los puntos estn bien definidos: imagen enfocada. Eje ptico Apertura Plano de imagen (fotodetector) P P Distancia focal Mundo 3D 58. Comparar con lo que ocurre a medida que aumenta el tamao de la apertura. Los puntos se difuminan. P P P P P Crculosde confusin P 59. La imagen estar enfocada cuando el tamao del crculo de confusin sea menor que el tamao de cada celda del fotodetector. Sin embargo, el modelo pinhole tiene muchas limitaciones y es poco usado. Apertura muy pequea Entra muy poca luz La imagen sale muy oscura. http://www.pinhole.org/ 60. Solucin 1: aumentar el tiempo de exposicin, manteniendo el tamao de la apertura. No funciona bien si hay movimiento. Aunque, se puede usar para acumular movimiento. 61. Solucin 2: aumentar el tamao de la apertura y utilizar unas lentes que realicen el enfoque. Por las limitaciones fsicas de las lentes, slo se pueden enfocar los objetos en cierta distancia. Profundidad de campo: rango de distancias (en la escena) en la que los objetos aparecen enfocados. Prof.campo(aprox.) deunospocoscm. Prof.campo(aprox.) desde3m.ainfinito 62. Solucin 3: manteniendo reducidos el tiempo de exposicin y el tamao de la apertura, aumentar la sensibilidad de los fotodetectores. Usando pelculas ms sensibles o ajustando la sensibilidad (o ganancia) en la cmara. Problema: con ms sensibilidad aumenta el ruido. Mucha luz, baja sensibilidad Poca luz, alta sensibilidad 63. Realmente, los cuatro factores no son contradictorios, sino que estn presentes a la vez en todos los sistemas fotogrficos: Tamao de apertura (o abertura del diafragma). Tiempo de exposicin (o velocidad de obturacin). Sensibilidad de los fotodetectores (o valor ISO). ptica utilizada (sistema de lentes). Dos funciones: Enfoque: su ajuste, junto con la apertura, determina la profundidad de campo. Aumento (zoom): establece el ngulo de visin y la distancia focal. Los distintos elementos se ajustan para conseguir dos objetivos: Que entre la cantidad de luz suficiente. Que los objetos de inters estn enfocados. 64. Abertura del diafragma El diafragma es una imitacin del iris de un ojo humano. Cuanto menor es la apertura, ms profundidad de campo pero entra menos luz. En el lmite, tiende al modelo pinhole, y la profundidad de campo abarcara, tericamente, desde 0 hasta el infinito. La apertura se expresa en relacin a la constante f. Valores tpicos entre f/1,4 y f/22. A mayor nmero, menor tamao de apertura. Suele mantenerse fija en cmaras de vdeo. http://www.fotonostra.com/fotografia/ 65. Velocidad de obturacin Es el tiempo durante el cual se deja pasar la luz al fotodetector. Se mide en segundos. Normalmente entre 1/8000 y 30 segundos. Lo habitual en fotografa es ~1/125 s. Junto con la apertura, determina la cantidad de luz que entra. Otro problema es el movimiento. Si el tiempo es muy grande, la imagen puede aparecer movida. Objetos que se mueven rpido en condiciones normales. Movimiento involuntario en escenas nocturnas u oscuras. 66. Sensibilidad de los fotodetectores En fotografa analgica, est relacionada con la composicin y grosor de la pelcula. Existen distintos estndares ISO de pelcula, clasificados segn el nivel de sensibilidad. Desde 3200 ISO (muy sensible) hasta 50 ISO (poco sensible). Cuanto ms sensible, ms ruido por la cuantizacin de la luz (efecto de granularidad). En fotografa digital, la sensibilidad est relacionada con la ganancia (voltaje en relacin al nmero de fotones entrantes). En digital, a veces se asigna a la ganancia un valor ISO, correspondiente al nivel analgico equivalente. 67. ptica de enfoque Junto con el tamao de apertura determina la profundidad de campo. Cuanto ms amplia mejor. La p.c. es un rango definido por dos valores: la distancia ms prxima enfocada y la ms lejana. Suele estar entre unos pocos centmetros (modo macro) e infinito (paisajes, astronoma, etc.). Tipos de sistemas de enfoque: Enfoque fijo (sin lentes de enfoque): cmaras pinhole, video-vigilancia,..., no muy habitual. Enfoque manual: controlado por el usuario. Enfoque automtico: requiere un motor y una lgica de control. Normalmente basado en el punto central. 68. ptica de aumento (zoom) Los conceptos de aumento, zoom, campo visual y distancia focal estn estrechamente relacionados entre s. Campo visual: cantidad (angular) de una escena que aparece visible en la imagen. Se distingue entre gran angular (ngulo grande, >60) y teleobjetivo (ngulo pequeo, 2 arctan(35/70) = 53,1 Teleobjetivo df > 70 mm < 2 arctan(35/140) = 28,1 El equivalente del ojo humano es de unos 45. En fotografa digital, se debera medir en pxeles... pero se mide tambin en mm. Por lo tanto, es necesario conocer el ancho del chip CCD. 74. Ojo: la distancia focal tambin influye en la cantidad de luz entrante y en la profundidad de campo. Cantidad de luz: a menor distancia focal, entra ms luz. df df df Foco k Foco k Foco k Razn: la misma cantidad de luz se distribuye en un espacio mayor Profundidad de campo: mejor enfoque con un gran angular. df df df Punto k Punto k Punto k Razn: a igual distancia aumenta el tamao del crculo de confusin 75. Matemticamente, el proceso de formacin de imgenes es modelado como una proyeccin perspectiva. Elementos del modelo de proyeccin perspectiva: Centro de proyeccin (equivale a la apertura del pinhole). Plano de proyeccin (plano de la imagen). Centro de Proyeccin Plano de Proyeccin Distancia focal X, Y ZEje ptico Punto principal P P La imagen de un punto P viene dada por la interseccin de la recta P-C.P. con el plano de proyeccin. 76. Si el centro de proyeccin es el punto (0, 0, 0) y la distancia focal es 1, y el punto principal (0, 0, 1), la proyeccin en la imagen de un punto P= (x, y, z) ser: (u, v) = (x/z, y/z) Centro de Proyeccin Plano de Proyeccin Distancia focal X, Y Z P P Q Q R R Por eso los objetos lejanos se ven ms pequeos que los cercanos! S S 77. Pero el modelo proyectivo no es completo. No explica algunos fenmenos como el desenfoque, la distorsin radial y las aberraciones cromticas. Conclusiones: El proceso de formacin est en la parte analgica del mbito de procesamiento de imgenes. Para nosotros las imgenes sern simples matrices de nmeros, pero... Es importante conocer los elementos, factores y parmetros que intervienen en los dispositivos de captura. Por suerte (o por desgracia), muchas cmaras no permiten ajustar los parmetros, lo hacen automticamente. 78. Visin Tridimensional UPM DISAM 1 Modelo de Captacin de Imgenes Div. Ingeniera de Sistemas y Automtica Grupo de Tecnologas Industriales Universidad Miguel Hernndez Dpto. Automtica, Ingeniera Electrnica e Informtica Industrial Universidad Politcnica de MadridUPM DISAM Grupo de Visin 79. Visin Tridimensional UPM DISAM 2Tabla de Contenidos Modelo de lentes: Pinhole, Delgada y Gruesa Parmetros del Modelo de Captacin Sistemas de Coordenadas involucradas Proceso de Calibracin 80. Visin Tridimensional UPM DISAM 3Modelo de Lente Pinhole P(xw , yw , zw ) Centro ptico Eje ptico P(X,Y) Plano Focal Plano Imagen f La informacin 3D del mundo se proyecta en el plano de la imagen a travs del Centro ptico situado a una distancia igual a la Distancia Focal del plano de la imagen. El Eje ptico es la lnea perpendicular al plano de la imagen y que pasa por el centro ptico. El Plano Focal es el plano que pasa por el centro ptico y cuyos puntos no tienen proyeccin en el plano de la imagen. 81. Visin Tridimensional UPM DISAM 4Modelo de Lente Pinhole P(xw, yw, zw) Centro ptico Eje ptico P(X,Y) Plano Focal Plano Imagen f La informacin 3D del mundo se proyecta en el plano de la imagen a travs del Centro ptico situado a una distancia igual a la Distancia Focal del plano de la imagen. El Eje ptico es la lnea perpendicular al plano de la imagen y que pasa por el centro ptico. El Plano Focal es el plano que pasa por el centro ptico y cuyos puntos no tienen proyeccin en el plano de la imagen. 82. Visin Tridimensional UPM DISAM 5Modelo de Lente Pinhole c c c c Z Y f Y Z X f X = = = 1 0100 0010 0001 c c c Z Y X f n Yn Xn P(xw, yw, zw) Yc Xc zc f(Cx,Cy) X Y P(x, y) Eje ptico Centro ptico Plano Imagen xc yc Zc 83. Visin Tridimensional UPM DISAM 6Modelo Ideal o de Lente Delgada f f P(xw, yw, zw) P(X, Y) d in dout Cuando se tiene una irradiacin finita en el plano de la imagen. Produce las mismas ecuaciones de proyeccin. Ley de Gauss fdd outin 111 =+ Magnificacin m d dout = int 84. Visin Tridimensional UPM DISAM 7Modelo Ideal o de Lente Delgada Los Rayos pticos que pasan por el centro de la lente no sufren ninguna deflexin. Los Rayos que entran paralelos al eje ptico de la lente convergen en un punto del eje ptico a una distancia igual a la distancia focal del centro de la lente. f f P(xw, yw, zw) P(X, Y) d in dout 85. Visin Tridimensional UPM DISAM 8Modelo Ideal o de Lente Delgada Profundidad de Campo. confusion lente out campo circulo apertura d dprofundida = 2 f f P(xw, yw, zw) P(X, Y) Profundidad de campo Crculo de confusin Apertura de la lente d A dout din d2 out d1 out 86. Visin Tridimensional UPM DISAM 9Modelo de Lente Gruesa Puntos de referencia Nodales Principales Focales P(X, Y) P(xw, yw, zw) L.F. Posterior Espesor f f P. F. Imagen P.F. Objeto L F. Frontal dout din PN 87. Visin Tridimensional UPM DISAM 10Modelo de Lente Gruesa Puntos de referencia Nodales Principales Focales Para reducir las aberraciones que se producen en una lente, los sistemas de lentes constan de varios juegos de lentes coaxiales. Produce la misma proyeccin que el modelo ideal de lente, excepto por un offset adicional. El centro ptico es reemplazado por los puntos nodal delantero y trasero de la lente. Cualquier rayo luminoso que alcanza el punto nodal delantero, contina su propagacin emergiendo del punto nodal trasero sin cambiar su direccin. P(X, Y) P(xw, yw, zw) L.F. Posterior Espesor f f P. F. Imagen P.F. Objeto L F. Frontal dout din PN 88. Visin Tridimensional UPM DISAM 11Modelo de Lente Gruesa Puntos de referencia Nodales Principales Focales Los puntos principales son dos puntos conjugados situados sobre el eje ptico, interseccin sobre ste de los planos con magnificacin unidad. Los puntos focales son dos puntos situados sobre el eje ptico y conjugados a puntos del infinito. Cuando el medio entre el objeto y la lente tiene el mismo ndice de refraccin que el medio entre la imagen y la lente, las distancias focales delantera y trasera son iguales y los puntos principales coinciden con los puntos nodales. La apertura del diafragma tiene como misin reducir las aberracciones pticas. P(X, Y) P(xw, yw, zw) L.F. Posterior Espesor f f P. F. Imagen P.F. Objeto L F. Frontal dout din PN 89. Visin Tridimensional UPM DISAM 12Modelo de Lente Gruesa Para reducir las aberraciones que se producen en una lente, los sistemas de lentes constan de varios juegos de lentes coaxiales. Produce la misma proyeccin que el modelo ideal de lente, excepto por un offset adicional. El centro ptico es reemplazado por los puntos nodal delantero y trasero de la lente. Cualquier rayo luminoso que alcanza el punto nodal delantero, contina su propagacin emergiendo del punto nodal trasero sin cambiar su direccin. 90. Visin Tridimensional UPM DISAM 13Modelo de Lente Gruesa Los puntos principales son dos puntos conjugados situados sobre el eje ptico, interseccin sobre ste de los planos con magnificacin unidad. Los puntos focales son dos puntos situados sobre el eje ptico y conjugados a puntos del infinito. Cuando el medio entre el objeto y la lente tiene el mismo ndice de refraccin que el medio entre la imagen y la lente, las distancias focales delantera y trasera son iguales y los puntos principales coinciden con los puntos nodales. La apertura del diafragma tiene como misin reducir las aberracciones pticas. 91. Visin Tridimensional UPM DISAM 14Tabla de Contenidos Modelo de lentes: Pinhole, Delgada y Gruesa Parmetros del Modelo de Captacin Parmetros intrnsecos. Distorsiones Parmetros extrnsecos Sistemas de Coordenadas involucradas Proceso de Calibracin 92. Visin Tridimensional UPM DISAM 15Parmetros del Modelo de Captacin Parmetros Intrnsecos. Son los que describen la geometra y ptica del conjunto cmara y Tarjeta de Adquisicin de Imgenes. Afectan al proceso que un rayo luminoso sigue desde que alcanza la lente del objetivo hasta que impresiona un elemento sensible. Parmetros Extrnsecos. Son aquellos que definen la orientacin y la posicin de la cmara, respecto a un Sistema de Coordenadas conocido, al que se llamar Sistema de Coordenadas del Mundo. 93. Visin Tridimensional UPM DISAM 16Parmetros Intrnsecos Distancia focal. Se define como la distancia que separa el centro ptico del plano de la imagen y est dada en mm. Factores de Escala. Relacionan las coordenadas en mm. del plano de la imagen, con las coordenadas en pxeles de la memoria de almacenamiento. Punto Principal. Es el Punto de interseccin entre el eje ptico de la cmara y el plano de la imagen. 94. Visin Tridimensional UPM DISAM 17Parmetros Intrnsecos Coeficientes de Distorsin. La distorsin geomtrica afecta a los puntos en el plano de la imagen; como resultado de una serie de imperfecciones en la fabricacin y el montaje de las lentes que forman el sistema ptico. La cantidad de error de posicin depende de la posicin del punto en el plano de la imagen. Tres tipos de distorsin. Distorsin Radial. Distorsin Descentral. Distorsin Prismtica. 95. Visin Tridimensional UPM DISAM 18Parmetros Intrnsecos. Distorsiones Distorsin Radial. Provocada por defectos en la curvatura de las lentes. ( ) ( )[ ] ( ) ( )[ ] d k X X Y O X Y d k Y X Y O X Y Xr d d d d d Yr d d d d d = + + = + + 1 2 2 5 1 2 2 5 , , 96. Visin Tridimensional UPM DISAM 19Parmetros Intrnsecos. Distorsiones Imagen sin Distorsin Imagen con Distorsin Radial k1=-0.04 Imagen con Distorsin Radial k1=0.04 97. Visin Tridimensional UPM DISAM 20Parmetros Intrnsecos. Distorsiones Distorsin Descentral. Provocada por la falta de colinealidad de los centros pticos. Produce desplazamientos radiales y tangenciales. ( )[ ] ( )[ ]422 21 4 2 22 1 ,32 ,23 ddddddYd ddddddXd YXOYXpYXpd YXOYXpYXpd + ++= ++ += 98. Visin Tridimensional UPM DISAM 21Parmetros Intrnsecos. Distorsiones Imagen sin Distorsin Imagen con Distorsin Descentral p1=0.0 ; p2=-0.04Imagen con Distorsin Descentral p1=0.0 ; p2=0.04 99. Visin Tridimensional UPM DISAM 22Parmetros Intrnsecos. Distorsiones ( ) ( )[ ] ( ) ( )[ ] d s X Y O X Y d s X Y O X Y X p d d d d Y p d d d d = + + = + + 1 2 2 4 2 2 2 4 , , Distorsin Prismtica. Se origina por las imperfecciones en las lentes durante su diseo y fabricacin, as como en el montaje de la ptica en la cmara. Causa desplazamientos radiales y tangenciales. 100. Visin Tridimensional UPM DISAM 23Parmetros Intrnsecos. Distorsiones Distorsin Total. Aunque la distorsin descentral y la distorsin prismtica tienen unos coeficientes similares, modelan dos tipos diferentes de distorsiones. Las dos tienen diferentes ejes de mxima distorsin tangencial. ( ) ( ) ( ) ( ) ( ) ( ) d X Y s X Y p X p Y p X Y k X X Y d X Y s X Y p X Y p X p Y k Y X Y X d d d d d d d d d d d Y d d d d d d d d d d d , , = + + + + + + = + + + + + + 1 2 2 1 2 1 2 2 1 2 2 2 2 2 1 2 2 2 2 1 2 2 3 2 2 3 Prismtica Descentral Radial 101. Visin Tridimensional UPM DISAM 24Parmetros Extrnsecos de la Cmara Parmetros Extrnsecos. Son aquellos que definen la orientacin y la posicin de la cmara, respecto a un Sistema de Coordenadas conocido, al que se llamar Sistema de Coordenadas del Mundo. Tres parmetros definen el desplazamiento y otros parmetros definen la orientacin. 102. Visin Tridimensional UPM DISAM 25Tabla de Contenidos Modelo de lentes: Pinhole, Delgada y Gruesa Parmetros del Modelo de Captacin Sistemas de Coordenadas involucradas Proceso de Calibracin 103. Visin Tridimensional UPM DISAM 26Sistemas de Coordenadas Zw Xw Yw Yc Xc Zc f Yf Xf (Cx,Cy) Xu Yu P(xf, yf) Eje ptico Centro ptico P(xw, yw, zw) Plano Imagen xc yc ( ) ( ) ( ) ( )fff uuyx cccc www YXO YXCC ZYXO ZYXO ,;imagenladelateralessCoordenada ,;,imagenladecentralessCoordenada ,,;cmaraladesCoordenada ,,;mundodelsCoordenada 104. Visin Tridimensional UPM DISAM 27Sistemas de Coordenadas Relacin entre: las coor- denadas del mundo y de la cmara = 110001 333231 232221 131211 w w w z y x c c c z y x trrr trrr trrr z y x Zw Xw Yw Yc Xc Zc f Yf Xf (Cx,Cy) Xu Yu P(xf, yf) Eje ptico Centro ptico P(xw, yw, zw) Plano Imagen xc yc 105. Visin Tridimensional UPM DISAM 28Sistemas de Coordenadas Relacin entre las coor- denadas de la cmara y las centrales de la imagen = 1 0100 0010 0001 c c c u u z y x f n yn xn Zw Xw Yw Yc Xc Zc f Yf Xf (Cx,Cy) Xu Yu P(xf, yf) Eje ptico Centro ptico P(xw, yw, zw) Plano Imagen xc yc 106. Visin Tridimensional UPM DISAM 29Sistemas de Coordenadas Relacin entre las coordenadas centrales de la imagen: Las tericas (sin distorsin) Las reales (con distorsin) ( ) ( )uuyud uuxud yxDyy yxDxx , , += += Zw Xw Yw Yc Xc Zc f Yf Xf (Cx,Cy) Xu Yu P(xf, yf) Eje ptico Centro ptico P(xw, yw, zw) Plano Imagen xc yc 107. Visin Tridimensional UPM DISAM 30Sistemas de Coordenadas Relacin entre las coordenadas laterales y centrales de la imagen ydyf xdxf CyKy CxKx += += Zw Xw Yw Yc Xc Zc f Yf Xf (Cx,Cy) Xu Yu P(xf, yf) Eje ptico Centro ptico P(xw, yw, zw) Plano Imagen xc yc 108. Visin Tridimensional UPM DISAM 31Sistemas de Coordenadas = 110001 333231 232221 131211 w w w z y x c c c z y x trrr trrr trrr z y x = 1 0100 0010 0001 c c c u u z y x f n yn xn ( ) ( )uuyud uuxud yxDyy yxDxx , , += += ydyf xdxf CyKy CxKx += += Zw Xw Yw Yc Xc Zc f Yf Xf (Cx,Cy) Xu Yu P(xf, yf) Eje ptico Centro ptico P(xw, yw, zw) Plano Imagen xc yc 109. Visin Tridimensional UPM DISAM 32Sistemas de Coordenadas Coordenadas centrales de la cmara en funcin de las coordenadas del mundo y de los parmetros del modelo = 110001 333231 232221 131211 w w w z y x c c c z y x trrr trrr trrr z y x = 1 0100 0010 0001 c c c u u z y x f n yn xn = 1 333231 232221 131211 w w w z y x u u z y x trrr trrr trrr fn yn xn +++ +++ = +++ +++ = zwww ywww u zwww xwww u tzryrxr tzryrxr fy tzryrxr tzryrxr fx 333231 232221 333231 131211 110. Visin Tridimensional UPM DISAM 33Sistemas de Coordenadas +++ +++ ++= +++ +++ ++= zwww ywww yyyyf zwww xwww xxxxf tzryrxr tzryrxr fKDKCy tzryrxr tzryrxr fKDKCx 333231 232221 333231 131211 Coordenadas laterales de la cmara en funcin de las coordenadas del mundo y de los parmetros del modelo ++= ++= uyyyyf uxxxxf yKDKCy xKDKCx ( ) ( )uuyud uuxud yxDyy yxDxx , , += += ydyf xdxf CyKy CxKx += += 111. Visin Tridimensional UPM DISAM 34Sistemas de Coordenadas Relacin matricial entre las coordenadas del mundo y las coordenadas laterales de la cmara (sin distorsin ). Matriz de Proyeccin. ( ) ( ) + + = 110000100 00 00 333231 232221 131211 w w w z y x yyy y xxx x f f z y x trrr trrr trrr f f DKC K f DKC K n yn xn = 1 w w w f f z y x M n yn xn = 11000 0100 00 00 333231 232221 131211 w w w z y x yy xx f f z y x trrr trrr trrr CfK CfK n yn xn 112. Visin Tridimensional UPM DISAM 35Sistemas de Coordenadas Relacin matricial entre las coordenadas del mundo y las coordenadas laterales de la cmara (sin distorsin ). Matriz de Proyeccin. ++++ ++++ = 1 333231 332332223121 331332123111 w w w z zyyyyyyyyy zxxxxxxxxx f f z y x trrr tCtfKrCrfKrCrfKrCrfK tCtfKrCrfKrCrfKrCrfK n yn xn [ ] [ ] [ ] = = = 3332313 2322212 1312111 Si rrrr rrrr rrrr ++ ++ = 1 3 32 31 w w w z zyyyyy zxxxxx f f z y x tr tCtfKrCrfK tCtfKrCrfK n yn xn 113. Visin Tridimensional UPM DISAM 36Sistemas de Coordenadas Relacin matricial entre las coordenadas del mundo y las coordenadas laterales de la cmara (sin distorsin ). Matriz de Proyeccin. = ++ ++ = 11 343 242 141 3 32 31 w w w w w w z zyyyyy zxxxxx f f z y x mm mm mm z y x tr tCtfKrCrfK tCtfKrCrfK n yn xn [ ] [ ] [ ] = = = 3332313 2322212 1312111 Si mmmm mmmm mmmm = 1 34333231 24232221 14131211 w w w f f z y x mmmm mmmm mmmm n yn xn 114. Visin Tridimensional UPM DISAM 37Tabla de Contenidos Modelo de lentes: Pinhole, Delgada y Gruesa Parmetros del Modelo de Captacin Sistemas de Coordenadas involucradas Proceso de Calibracin 115. Visin Tridimensional UPM DISAM 38Proceso de Calibracin CALIBRACIN: Determinacin de los parmetros involucrados en el proceso de captacin: Parmetros intrnsecos: Factores de escala: Kx, Ky Distancia focal: f Punto principal: Cx, Cy Distorsin: Dx, Dy Parmetros extrnsecos: Vector de traslacin: T Matriz de rotacin: R 116. Visin Tridimensional UPM DISAM 39Proceso de Calibracin Etapas del proceso de calibracin Ecuaciones del sistema: Modelo matemtico Obtencin de datos de campo : Proyeccin sobre la imagen de puntos 3D conocidos Determinacin de los parmetros: Resolucin de las ecuaciones con los datos de campo 117. Visin Tridimensional UPM DISAM 40Proceso de calibracin Elemento de calibracin 118. Visin Tridimensional UPM DISAM 41Proceso de Calibracin Tcnicas aplicadas a la Fotogrametra. Son necesarios mtodos de calibracin muy exactos. Se emplean pticas profesionales sin problemas de distorsiones. Conocimiento a priori de los parmetros intrnsecos. Tcnicas aplicadas a la Robtica y Automatizacin. Son necesarios mtodos rpidos y autnomos. Imgenes con menor resolucin. Se ven afectadas por muchos factores que de forma sistemtica causan errores. MTODOS DE CALIBRACIN 119. Visin Tridimensional UPM DISAM 42Proceso de Calibracin Tcnicas basadas en Modelos con significado fsico Aproximacin clsica de la fotogrametra Transformacin Lineal Directa (DLT) Restriccin de Alineamiento Radial (RAC) Punto de Desvanecimiento Tcnicas basadas en Modelos matemticos MTODOS DE CALIBRACIN 120. Visin Tridimensional UPM DISAM 43Proceso de Calibracin Tcnicas basadas en Modelos con significado fsico. Aproximacin clsica de la fotogrametra. Tienen en cuenta las ecuaciones convencionales de colinealidad del modelo pinhole de cmaras. Resuelve el problema planteado realizando una optimizacin no lineal, para ello son necesarios buenos datos iniciales. Transformacin Lineal Directa (DLT) Se realiza una calibracin en dos pasos. En primer lugar se calculan los elementos de la Matriz de Proyeccin. A partir de ella se obtienen los parmetros intrnsecos y extrnsecos. 121. Visin Tridimensional UPM DISAM 44Proceso de Calibracin Tcnicas basadas en modelos con significado fsico. X Y X Y u u d d = Restriccin de Alineamiento Radial (RAC) Incorpora nicamente la distorsin radial, manteniendose la relacin. Se necesita conocer inicialmente una serie de parmetros del conjunto cmara/tarjeta. El resto de los parmetros se obtiene de forma lineal. Punto de Desvanecimiento Calcula separadamente los parmetros intrnsecos y los extrnsecos. Mediante optimizacin no lineal se puede incorporar cualquier modelo de distorsin. 122. Visin Tridimensional UPM DISAM 45Proceso de Calibracin Tcnicas basadas en un modelo matemtico. No se tiene ningn significado fsico de la cmara. X c x y c x y Y c x y c x y f ij w i w j i j ij w i w j i j f ij w i w j i j ij w i w j i j 1 1 1 1 0 3 3 1 1 0 3 1 2 1 1 0 3 3 1 1 0 3 = = + + + + ( ) ( ) ( ) ( ) La idea bsica es la relacin entre un punto del espacio 3D y la proyeccin de ese punto en la imagen 2D. La distorsin se compensa mediante interpolacin. Como inconveniente destacar la poca utilidad cuando se desarrollan sistemas activos de visin. 123. Visin Tridimensional UPM DISAM 46Proceso de Calibracin Transformacin Lineal Directa (DLT) Obtencin de los elementos de la matriz de proyeccin. Sin considerar las restricciones Considerando restricciones Clculo de los parmetros intrnsecos y extrnsecos a excepcin de la distorsin. Clculo de la distorsin (si se modela). Clculo de otros errores sistemticos. = = = 111 343 242 141 34333231 24232221 14131211 w w w w w w w w w f f z y x mm mm mm z y x mmmm mmmm mmmm z y x M n Yn Xn 124. Visin Tridimensional UPM DISAM 47Proceso de Calibracin Transformacin Lineal Directa (DLT) Obtencin de los elementos de la matriz de proyeccin =+++ =+++ +++ +++ = +++ +++ = = 0 0 1 1423222134333231 1413121134333231 34333231 14232221 34333231 14131211 34333231 24232221 14131211 mzmymxmYmYzmYymYxm mzmymxmXmXzmXymXxm mzmymxm mzmymxm Y mzmymxm mzmymxm X z y x mmmm mmmm mmmm n Yn Xn wwwffwfwfw wwwffwfwfw www www f www www f w w w f f 0TrivialSolucin0Sistema == mmA 125. Visin Tridimensional UPM DISAM 48Mtodo de Transformacin Lineal Directa Calculo de la Matriz de Proyeccin sin considerar las restricciones. 1 1 1 34 11 34 12 34 13 34 14 34 21 34 22 34 23 34 24 34 31 34 32 34 33 34 1 2 3 4 5 6 7 8 9 10 11 m M m m m m m m m m m m m m m m m m m m m m m m L L L L L L L L L L L L = = X x L y L z L L x L y L z L Y x L y L z L L x L y L z L f w w w w w w f w w w w w w = + + + + + + = + + + + + + 1 2 3 4 9 10 11 5 6 7 8 9 10 11 1 1 Transformacin Lineal Directa (DLT) 126. Visin Tridimensional UPM DISAM 49Proceso de Calibracin = fi fi fiwifiwifiwiwiwiwi fiwifiwifiwiwiwiwi Y X L L L L L L L L L L L YzYyYxzyx XzXyXxzyx 11 10 9 8 7 6 5 4 3 2 1 10000 00001 Transformacin Lineal Directa (DLT) Calculo de la Matriz de Proyeccin sin considerar las restricciones. Con n puntos (conocidos xwi , ywi , zwi , Xfi , Yfi ) se obtiene un sistema con 11 incgnitas y 2n ecuaciones 127. Visin Tridimensional UPM DISAM 50Proceso de Calibracin A partir de los parmetros L y considerando el significado fsico de la matriz M se obtienen sus elementos. M L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L L = + + + + + + + + + + + + + + + + + + + + + + + 1 9 2 10 2 11 2 2 9 2 10 2 11 2 3 9 2 10 2 11 2 4 9 2 10 2 11 2 5 9 2 10 2 11 2 6 9 2 10 2 11 2 7 9 2 10 2 11 2 8 9 2 10 2 11 2 9 9 2 10 2 11 2 10 9 2 10 2 11 2 11 9 2 10 2 11 2 9 2 1 10 2 11 2 + L Transformacin Lineal Directa (DLT) 128. Visin Tridimensional UPM DISAM 51Proceso de Calibracin Clculo de la matriz de perspectiva considerando las restricciones a que est sujeta. ( ) ( ) 0 1 nesrestricciolasasujeto 1 3231 3 343 242 141 = = = mmmm m z y x mm mm mm n nYf nXf w w w Transformacin Lineal Directa (DLT) Al emplear la segunda restriccin se tiene que resolver un sistema no lineal que es algo que se pretende evitar con este mtodo. 129. Visin Tridimensional UPM DISAM 52Proceso de Calibracin Se utiliza exclusivamente la primera restriccin. Se resuelve el problema de optimizacin dividiendo el conjunto de variables en dos, las que estn sujetas a restriccin y las que no, y empleando las tcnicas de multiplicadores de Lagrange. ( ) min Cy Dz z minR Cy Dz z y z y z , , + = = + + 2 2 2 2 1 1 sujeto a Transformacin Lineal Directa (DLT) 130. Visin Tridimensional UPM DISAM 53Proceso de Calibracin Calculo de los parmetros intrnsecos y extrnsecos. = ++ ++ = 343 242 141 3 32 31 mm mm mm tr tCtfKrCrfK tCtfKrCrfK M z zyyyyy zxxxxx ( ) ( ) y T y T y T yy T x T x T x T xx T CrrCrrfKrrCrfKmm CrrCrrfKrrCrfKmm =+=+= =+=+= 333233232 333133131 Transformacin Lineal Directa (DLT) Clculo inmediato de r3 y de tz Coordenadas del Punto Principal 131. Visin Tridimensional UPM DISAM 54Mtodo de Transformacin Lineal Directa Calculo de las distancias focales en x e y. ( ) ( ) ( )[ ] [ ] =+++ =+++= 2 333133311311 2 3313131 2 3111 T x T x T xx T xx T xx T xx T xx T xxxx TT rrCrrfKrCrCrCrfKrfKrCrfKrfK rrCrfKrCrfKrCrfKmmmm Transformacin Lineal Directa (DLT) Calculo de los parmetros intrnsecos y extrnsecos. xxxxxx ffKfCCKf ==+= 2222222 ( ) ( ) ( )[ ] [ ] =+++ =+++== 2 333233322322 2 3323232 2 3222 T y T y T yy T yy T yy T yy T yy T yyyy TT rrCrrfKrCrCrCrfKrfKrCrfKrfK rrCrfKrCrfKrCrfKmmmm yyyyyy ffKfCCKf ==+= 2222222 132. Visin Tridimensional UPM DISAM 55Mtodo de Transformacin Lineal Directa Transformacin Lineal Directa (DLT) Calculo de los parmetros intrnsecos y extrnsecos. Calculo de los parmetros extrnsecos restantes. y zy yzyyy x zx xzxxx y y yy x x xx fK tCm ttCtfKm fK tCm ttCtfKm fK rCm rrCrfKm fK rCm rrCrfKm =+= =+= =+= =+= 24 24 14 14 32 2322 31 1311 133. Visin Tridimensional UPM DISAM 56Proceso de Calibracin Calculo de la Distorsin Un modelo mas completo al utilizado hasta el momento es el siguiente. X D dX n x m y m z m m x m y m z m m Y D dY n x m y m z m m x m y m z m m fsindistorsion X f X w w w w w w fsindistorsion Y f Y w w w w w w f f + + + = + + + + + + + + = + + + + + + + 11 12 13 14 31 32 33 34 21 22 23 24 31 32 33 34 X X D Y Y D f fs in d is to r s io n x f fs in d is to r s io n y = = Transformacin Lineal Directa (DLT) Despreciando todos los errores salvo la distorsin. 134. Visin Tridimensional UPM DISAM 57Proceso de Calibracin Calculo de otros errores sistemticos. ( ) ( ) X X D p p X p Y p X p X Y p Y p X Y p X Y p X p Y Y Y D q qY q X q Y q X Y q X q Y X q Y X q Y q X f fsindistorsion X f f f f f f f f f f f f f fsindistorsion Y f f f f f f f f f f f f + = + + + + + + + + + + = + + + + + + + + + 0 1 2 3 2 4 5 2 6 2 7 2 8 3 9 3 0 1 2 3 2 4 5 2 6 2 7 2 8 3 9 3 Transformacin Lineal Directa (DLT) Es conveniente calcular en pasos distintos los parmetros intrnsecos y extrnsecos, los coeficientes de distorsin y los coeficientes de otros errores sistemticos para evitar inestabilidades. 135. Visin Tridimensional UPM DISAM 58Proceso de Calibracin Emplea un modelo de distorsin que solamente tiene en cuenta la distorsin radial. ( ) ( ) D X k r k r D Y k r k r x d y d = + + = + + 1 2 2 4 1 2 2 4 .... .... Restriccin de Alineamiento Radial (RAC). Mtodo Tsai Al existir solamente distorsin Radial se obtiene ywww xwww u u d d tzryrxr tzryrxr y x y x +++ +++ == 232221 131211 136. Visin Tridimensional UPM DISAM 59Proceso de Calibracin Se supone conocido Cx , Cy , Ky Determinacin de |R| , tx , ty Clculo de coordenadas centrales con distorsin Clculo de incgnitas intermedias (aj) Clculo de |ty| Determinacin del signo de ty Clculo de Sx Clculo de |R| , tx Determinacin de f , k1 , tz Aproximacin inicial de f , tz Clculo iterativo de f , k1 , tz Restriccin de Alineamiento Radial (RAC). Mtodo Tsai 137. Visin Tridimensional UPM DISAM 60Proceso de Calibracin Clculo de coordenadas centrales con distorsin Restriccin de Alineamiento Radial (RAC). Mtodo Tsai ( ) ( ) ( ) y x x i u i ux i dy i dx i d i d i dyy i f i d i dxx i f i d i f i f K K S y xS yK xK y x yKCyy xKCxx yx = == == == con :cocienteelformaseSi obtieneSe ,:puntoslosdepartirA 138. Visin Tridimensional UPM DISAM 61Proceso de Calibracin Clculo de incgnitas intermedias (aj) Restriccin de Alineamiento Radial (RAC). Mtodo Tsai { { { i d a xxy i d i w a xy i d i w a xy i d i w a xy i d i w a y i d i w a y i d i w a y i d y y i w i w i w x i w i w i w xi u i u xi d i d ytStyzrStyyrStyxrSt xzrtxyrtxxrtx t tzryrxr tzryrxr S y x S y x 0Si cocienteelendoSustituyen 7321 654 1 13 1 12 1 11 1 23 1 22 1 21 1 232221 131211 321321321321 +++ =+++ +++ +++ == 139. Visin Tridimensional UPM DISAM 62Proceso de Calibracin Clculo de incgnitas intermedias (aj) Restriccin de Alineamiento Radial (RAC). Mtodo Tsai i d i d i w i d i w i d i w i d i w i d i w i d i w i d yaxzaxyaxxayzayyayxax n incgnitas7yecuacionesconsistemaunobtieneSe 7654321 +++= Clculo de |ty| Determinacin del signo de ty 2 6 2 5 2 4 1 aaa t y ++ = Para un punto cualquiera (alejado del centro de la imagen) se calcula su proyeccin sin distorsin, ensayando con el valor positivo y el valor negativo 140. Visin Tridimensional UPM DISAM 63Proceso de Calibracin Clculo de Sx Restriccin de Alineamiento Radial (RAC). Mtodo Tsai Clculo de |R| , tx ( )2 3 2 2 2 1 2 aaatS yx ++= x y x yyy x y x y x y S t at rrrrrrrrr tartartar S t ar S t ar S t ar 7 2 23 2 1333 2 22 2 1232 2 21 2 1131 623522421 313212111 111 = === === === 141. Visin Tridimensional UPM DISAM 64Proceso de Calibracin Determinacin de f , k1 , tz Aproximacin inicial de f , tz Se obtiene f , tz con distorsin nula, mediante mnimos cuadrados Restriccin de Alineamiento Radial (RAC). Mtodo Tsai Clculo iterativo de f , k1 , tz Optimizacin no lineal del sistema ( ) ( )[ ] ( ) ( )[ ] z i w i w i w x i w i w i w y i d i dy i d z i w i w i w x i w i w i w x i d i dx i d tzryrxr tzryrxr fKyxkKy tzryrxr tzryrxr fKyxkKx +++ +++ ++= +++ +++ ++= 333231 23222122 1 333231 13121122 1 142. Visin Tridimensional UPM DISAM 65Proceso de Calibracin Causas posibles Modelo matemtico incompleto Errores en la adquisicin de los datos Mal comportamiento de los algoritmos de calibracin Consecuencia Mala precisin en las aplicaciones de visin tridimensional El proceso de calibracin produce parmetros poco robustos, con alto grado de inestabilidad 143. Visin Tridimensional UPM DISAM 66Proceso de Calibracin Emplea un modelo de distorsin que solamente tiene en cuenta la distorsin radial. ( ) ( ) D X k r k r D Y k r k r x d y d = + + = + + 1 2 2 4 1 2 2 4 .... .... X Y x y X Y X Y X Y x y X Y r x r y r z t r x r y r z t u u u u d d d d d d w w w x w w w y = = = = + + + + + + 11 12 13 21 22 23 Restriccin de Alineamiento Radial (RAC). Mtodo Tsai Al existir solamente distorsin Radial se obtiene 144. Visin Tridimensional UPM DISAM 67Proceso de Calibracin Poniendo la expresin anterior en funcin de las coordenadas en pxeles del plano de la imagen. ( ) ( ) ywww xwwwx fx cxx x yfyd xfxxxd tzryrxr tzryrxr Y Xs N Nd d CYdYY CXdSXSX +++ +++ = = == == 232221 131211 1 11 ' ' s X Y r x r y r z t r x r y r z t s X Y r t x r t y r t z t t r t x r t y r t z x w w w x w w w y x y w y w y w x y y w y w y w = + + + + + + = + + + + + + 1 11 12 13 21 22 23 1 11 1 12 1 13 1 1 21 1 22 1 23 1 1 Restriccin de Alineamiento Radial (RAC). Mtodo Tsai Dividiendo ahora por ty queda la expresin que ser necesario desarrollar. 145. Visin Tridimensional UPM DISAM 68Proceso de Calibracin Calibracin coplanar de cmaras. Suponiendo conocido a priori el factor de incertidumbre de escala pueden calcularse los valores intermedios ai ( ) ( ) Y x Y y Y X x X y r t r t t t r t r t X Y x Y y Y X x X y a a a a a X di wi di wi di di wi di wi y y x y y y di di wi di wi di di wi di wi di = = 11 1 12 1 1 21 1 22 1 1 2 3 4 5 Restriccin de Alineamiento Radial (RAC). Mtodo Tsai 146. Visin Tridimensional UPM DISAM 69Proceso de Calibracin Calculo de ty. t S S D D S a a a a D a a a a y 2 2 2 2 1 2 2 2 4 2 5 2 1 5 2 4 4 2 = = + + + = ( ) ( ) ( ) ( ) ( ) r t r t r t r t r t r t r t r t t t t t y y y y y y y y x y x y 11 1 11 12 1 12 21 1 21 22 1 22 1 = = = = = Restriccin de Alineamiento Radial (RAC). Mtodo Tsai Calculo de la matriz de rotacin R y de tx, el resto de los elementos de R, se obtienen aplicando las propiedades de las matrices de rotacin. 147. Visin Tridimensional UPM DISAM 70Proceso de Calibracin Calculo de la distancia focal, coeficiente de distorsin y tz ++ ++ = ++ ++ = zwiwi ywiwi di zww xww di tyrxr tyrxr fY tyrxr tyrxr fX 3231 2221 3231 1211 Restriccin de Alineamiento Radial (RAC). Mtodo Tsai ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) + + = ++ ++ +=++ +=++ diwiwi diwiwi zdiywiwi dixwiwi diwiwizdiywiwi diwiwizdixwiwi Yyrxr Xyrxr t f Ytyrxr Xtyrxr YyrxrtYftyrxr XyrxrtXftyrxr 3231 3231 2221 1211 32312221 32311211 148. Visin Tridimensional UPM DISAM 71Proceso de Calibracin Calibracin de cmaras con un conjunto de puntos no coplanares. ( ) ( ) Yx Yy Yz Y Xx Xy Xz r t s r t s r t s t t s r t r t r t X Yx Yy Yz Y Xx Xy Xz a a a a a a a X w w w d w w w y x y x y x x y x y y y w w w d w w w = = 11 1 12 1 13 1 1 21 1 22 1 23 1 1 2 3 4 5 6 7 Restriccin de Alineamiento Radial (RAC). Mtodo Tsai 149. Visin Tridimensional UPM DISAM 72Proceso de Calibracin Calculo de ty a a a ty 5 2 6 2 7 2 2 1 + + = a a a s t x y 1 2 2 2 3 2 2 2+ + = r a t s r a t s r a t s r a t r a t r a t t a t y x y x y x y y y x y 11 1 12 2 13 3 21 5 22 6 23 7 4 = = = = = = = Restriccin de Alineamiento Radial (RAC). Mtodo Tsai Determinacin de sx Calculo de la matriz de Rotacin y de tx 150. Visin Tridimensional UPM DISAM 73Proceso de Calibracin Calculo de la distancia focal, coeficiente de distorsin y tz ( ) ( ) ( ) X f r x r y r z t r x r y r z t Y f r x r y r z t r x r y r z t r x r y r z t f X t r x r y r z X r x r y r z t f Y t r di wi wi wi x wi wi wi z di wi wi wi y wi wi wi z wi wi wi x di z wi wi wi di wi wi wi y di z = + + + + + + = + + + + + + + + + = + + + + + = 11 12 13 31 32 33 21 22 23 31 32 33 11 12 13 31 32 33 21 22 23 31( ) ( ) ( ) ( ) ( ) x r y r z Y r x r y r z t X r x r y r z t Y f t r x r y r z X r x r y r z Y wi wi wi di wi wi wi x di wi wi wi y di z wi wi wi di wi wi wi di + + + + + + + + = + + + + 32 33 11 12 13 21 22 23 31 32 33 31 32 33 Restriccin de Alineamiento Radial (RAC). Mtodo Tsai 151. Visin Tridimensional UPM DISAM 74Proceso de Calibracin Causas posibles Modelo matemtico incompleto Errores en la adquisicin de los datos Mal comportamiento de los algoritmos de calibracin Consecuencia Mala precisin en las aplicaciones de visin tridimensional El proceso de calibracin produce parmetros poco robustos, con alto grado de inestabilidad 152. Div. Ingeniera de Sistemas y Automtica Universidad Miguel Hernndez GRUPO DE TECNOLOGA INDUSTRIAL 153. Histograma Nivel de Ruido Brillo Contraste Nitidez Color Vecindad 154. Histograma Distribucin de Niveles de Gris en una imagen Funcin de densidad de probabilidad de niveles de gris Coordenadas Abscisas: rango posible de intensidades de gris Ordenadas: nmero de pixeles para cada nivel de gris 155. Algoritmo. Clculo de un histograma. Entrada. A: imagen de maxX x maxY Salida. Histograma: array [0,...,255] de entero Algoritmo: Histograma[]:= 0 para y:= 1, ..., maxY hacer para x:= 1, ..., maxX hacer Histograma[A(x,y)]:= Histograma[A(x,y)]+1 156. Los histogramas son una herramienta importante en anlisis de imgenes: es buena la calidad de una imagen?, sobra luz?, falta contraste? Ayudan a decidir cul es el procesamiento ms adecuado para mejorar la calidad de una imagen... Tanto cualitativamente (qu operacin aplicar), Como cuantitativamente (en qu cantidad). En principio, una buena imagen debe producir un histograma ms o menos uniforme y repartido en todo el rango de valores. 0 255127 Nivel de gris Frecuencia 157. Ejemplo 1. La imagen es muy oscura. Falta luz. 0 255127 Frecuencia Ejemplo 2. La imagen es muy clara. Sobra brillo. 0 255127 Frecuencia 158. Ejemplo 3. La imagen tiene poco contraste. 0 255127 Frecuencia Ejemplo 4. Hay mucho contraste, pocos medios tonos. 0 255127 Frecuencia 159. Histogramas de color. En imgenes multicanal podemos obtener un histograma de cada canal por separado. Canal Rojo Canal Verde Canal Azul 0 255127 0 255127 0 255127 160. O, tambin, podemos calcular histogramas conjuntos, en 2 3 dimensiones. Canales R y G Canales G y B Canales R y B Estos histogramas aportan informacin sobre los rangos de colores ms frecuentes en la imagen. En teora, el histograma es de 256x256 celdas (bins). Pero, para obtener buenos resultados, mejor usar un nmero reducido de celdas. Por ejemplo 64x64 32x32. 161. Uso de histogramas para mejorar la calidad de las imgenes. Ejemplo. El histograma indica tonos muy oscuros. Solucin. Aplicar un operador que estire el histograma. 162. Histograma Nivel de Ruido Brillo Contraste Nitidez Color Vecindad 163. Nivel de ruido Variacin en el nivel de gris que sufre un pixel no debida a la aportacin lumnica de la escena Tipos Correlados: La variacin del nivel de gris depende de la posicin espacial del pixel afectado Imagen sin ruido Imagen con ruido correlado 164. Tipos No correlados: La variacin del nivel de gris no depende de la posicin espacial del pixel afectado Gaussiano: La distribucin del ruido se asemeja a una distribucin gaussiana de una determinada media y varianza Imagen sin ruido Ruido Gaussiano M=0 =25 165. Tipos No correlados: La variacin del nivel de gris no depende de la posicin espacial del pixel afectado Gaussiano Aleatorio: Tambin llamado de sal y pimienta. El nmero de pixeles afectados y la intensidad del mismo son variables aleatorias independientes Imagen sin ruido Ruido Aleatorio 166. Histograma Nivel de Ruido Brillo Contraste Nitidez Color Vecindad 167. Brillo Nivel de gris medio en una imagen Brillo 104 Brillo 56 168. Histograma Nivel de Ruido Brillo Contraste Nitidez Color Vecindad 169. Contraste El contraste de una imagen define la variacin del nivel de gris en los pixel de la misma Estimacin: 170. Histograma Nivel de Ruido Brillo Contraste Nitidez Color Vecindad 171. Nitidez Respuesta en nivel de gris de la imagen ante cambios bruscos en la iluminacin de la escena captada. Alta nitidez frente a baja nitidez 172. La baja nitidez puede estar provocada por: Objetos fuera del rango de enfoque de la ptica Deficiencias del elemento sensor Efectos de algoritmos de tratamiento de imgenes La medicin de la nitidez es una tarea compleja, pues depende de: Los objetos presentes en la imagen La presencia de ruido Dn:derivada en la direccin de mximo cambio 173. Nitidez: 18.24%Nitidez: 11.97% 174. Histograma Nivel de Ruido Brillo Contraste Nitidez Color Vecindad 175. Teora bsica del color Fuente de luz emite radiacin con diferentes long. de onda El objeto refleja otra distribucin de longitudes de onda Los fotoreceptores del ojo son sensibles a determinadas distribuciones Los estmulos se envan al cerebro y se percibe el color 176. Naturaleza de la Luz y Color Luz es una radiacin Electromagntica (Dualidad): Se comporta como corpsculo Compuesta por fotones Emiten y absorben energa Se comporta como onda en su propagacin Campo elctrico y campo magntico Senoides vibrando en perpendicular 177. Luz como onda: Espectro Electromagntico Espectro visible: Entre 780 nm y 380 nm 178. Interaccin entre la Luz y la Materia El color en los objetos viene provocado por la interaccin de una luz emitida sobre el mismo. Si la luz impacta sobre un objeto: Ser completa o parcialmente transmitida Ser completa o parcialmente reflejada Ser completa o parcialmente absorbida Transmisin 179. Indice Refractivo (RI): relacin entre la velocidad de la luz en un medio y el vaco. Refraccin: Cambio en la direccin de la luz al atravesar dos medios con RI diferentes El RI de una sustancia se ve afectado por la longitud de onda de la fuente de luz 180. Reflexin: Superficies que reflejan la luz con una intensidad y con un ngulo igual que la incidente. Absorcin: La luz incidente se absorbe en funcin de la pigmentacin del objeto 181. Reflectancia Espectral: Cantidad de luz en cada longitud de onda que es reflejada por un objeto en comparacin con la reflexin pura (objeto blanco) 182. Visin Humana El color que percibe el ser humano es una combinacin de tres estmulos distintos de la retina Bastones: No sensibles al color Conos: Tres tipos sensibles al color rojo verde y azul 183. Sensibilidad Espectral: similares a las curvas de reflectancia espectral. Estmulos: Es lo que llega al cerebro como consecuencia de todo el proceso. 184. Radiacin Cantidad total de energa que fluye desde una fuente luminosa (watios) Luminancia Cantidad de energa que un observador percibe de una fuente luminosa (lmenes) Brillo Sensacin acromtica de la intensidad de la luz Tinte (Hue) Longitud de onda dominante en el color Saturacin Pureza relativa entre el blanco y la longitud de onda dominante (tinte). El blanco puro posee una saturacin nula 185. Modelos de representacin del color Modelo RGB Estmulos principales para la percepcin del color en el ser humano Colores aditivos primarios 186. Una imagen en RGB est representada por 3 planos distintos, uno por cada color primario Cuando llegan al monitor RGB, estas tres imgenes se combinan en la pantalla fosforescente para producir una imagen compuesta en color Para un sistema que digitaliza la imagen con 24 bits de resolucin, los valores mximos de R, G y B sern igual a 255 Espacio eucldeo, en el que cada componente primario se corresponde con un eje ortogonal 187. Negro (0,0,0) Blanco (1,1,1) Grises (n,n,n) Rojo (1,0,0) Verde (0,1,0) Azul (0,0,1) 188. Modelo CMY (Cian-Magenta-Yellow) Es el modelo tpico para impresoras de color Utiliza los colores Cian (C), Magenta (M) y Yellow (Y), que son los colores secundarios de luz o primarios de los pigmentos 189. Modelo YIQ (Luminancia - Fase - Cuadratura) Es una recodificacin del RGB ms eficaz en la transmisin para TV en color, y que adems es compatible con los estndares de TV en blanco y negro La informacin del color (I+Q) y la informacin de la luminancia estn desacopladas Conversin RGB - YIQ: 190. Modelo HSI (Hue (tono)- Saturacin - Intensidad) La informacin de intensidad (I) est desacoplada de la informacin del color (H,S) H y S estn ntimamente relacionadas con la forma en que los humanos percibimos el color. Transformacin RGB - HSI 191. Descomposicin 3 canales RGB Canal Rojo Canal AzulCanal Verde 192. Histograma Nivel de Ruido Brillo Contraste Nitidez Color Vecindad 193. Vecindad: Vecindad a 4 Vecindad a 8 X X O X X X X X X O X X X X 194. Div. Ingeniera de Sistemas y Automtica Universidad Miguel Hernndez GRUPO DE TECNOLOGA INDUSTRIAL 195. Pregunta: Cul es la base terica del procesamiento de imgenes? Qu operaciones aplicar? Recordatorio: una imagen digital no es ms que una matriz, o array bidimensional, de nmeros! Podemos aplicar las mismas operaciones que sobre cualquier nmero: sumar, restar, multiplicar, dividir, aplicar and, or, mximo, mnimo, integrales, derivadas... Cada operacin tendr un significado propio. 90 67 68 75 78 92 87 73 78 82 63 102 89 76 98 45 83 109 80 130 39 69 92 115 154 196. Operaciones Puntuales Operaciones Locales Operaciones Globales Operaciones Geomtricas 197. Caracterstica El resultado de aplicarlas a un pixel depende nicamente del valor de intensidad de ese pixel Pueden ser: Independiente de las caractersticas globales Con una sola imagen Transformaciones de una imagen segn una funcin Entre varias imgenes Dependiente de la imagen 198. Independientes de las Caractersticas Globales Operaciones de UNA imagen con una CONSTANTE Suma Resta Multiplicacin Divisin Mximo Mnimo Umbralizacin Inversa 199. Ejemplo Original Inversa 200. Sumar una constante: R(x, y):= A(x, y) + a Significado: incrementar el brillo de la imagen en la cantidad indicada en a. El histograma se desplaza a la derecha en a pxeles. a 201. Ojo: la suma puede ser mayor que 255... La operacin debera comprobar el overflow: si A(x, y) + a > 255 entonces R(x, y):= 255 sino R(x, y):= A(x, y) + a Esto se debe hacer tambin en las dems operaciones, comprobando si el valor es 255. Coloquialmente, un pxel por encima de 255 o por debajo de 0 se dice que est saturado. La saturacin supone una prdida de informacin. Ejemplodeimagen muysaturada 202. En imgenes en color, la suma se realiza sobre los tres canales (R, G y B) y con el mismo valor. R(x, y).R:= A(x, y).R + a R(x, y).G:= A(x, y).G + a R(x, y).B:= A(x, y).B + a Qu ocurre si se suma un valor distinto a cada canal? 203. Restar una constante: R(x, y):= A(x, y) - a Significado: decrementar el brillo de la imagen en la cantidad indicada en a. El histograma se desplaza a la izquierda en a pxeles. a 204. Multiplicar por una constante: R(x, y):= bA(x, y) Significado: aumentar la intensidad de la imagen en b. El histograma se estira hacia la izquierda. 205. Tanto en la suma como en la multiplicacin, se aumenta el nivel de gris de los pxeles, pero de forma distinta. En la suma, el parmetro a (entero) indica el nmero de niveles de gris a aumentar: de -255 a 255. En el producto, el parmetro b (real) indica el factor a multiplicar. b=1 Ningn cambio b=2 Se duplica el valor de gris. Los px. >127 se saturan. b=0,5 Se encoge a la mitad el histograma. Suma Multiplicacin 0 + a 0*b 206. Dividir por una constante: R(x, y):= A(x, y) / b = Multiplicar por 1/b ... obviamente! El histograma se encoge. 207. Independientes de las Caractersticas Globales Transformaciones segn una FUNCIN racional o irracional Valor absoluto de una imagen con signo Transformacin logartmica Transformacin exponencial Operaciones entre varias imgenes suma, resta, multiplicacin, divisin mximo, mnimo AND, OR, XOR 208. Ejemplo Original Original con Ruido Gaussiano Resta Resta X 6 209. Ejemplo Original Umbralizada 128 Mnimo: Original Umbr. 128 210. Dependientes de las Caractersticas Globales Manipulacin del Histograma Autoescalados de la imagen Original Ecualizacin Histograma 211. Origen Mx: 182 Mn: 55 Origen - 55 Escalada 212. Las transformaciones elementales se pueden ver como funciones f: N N. Interpretacin: para cada valor de gris de entrada hay un valor de salida. 0 25512864 192 025512864192 Valor de entrada Valordesalida f: curva tonal Se puede usar cualquier funcin f. La transformacin hace que se modifique el histograma. 213. 0 25512864 192 025512864192 Identidad: f(v):= v 0 25512864 192 025512864192 Suma: f(v):= v + a 0 255 12864 192 025512864192 Resta: f(v):= v - a a a 0 25512864 192 025512864192 Multiplicar 2: f(v):=2v 0 25512864 192 025512864192 Dividir 2: f(v):= v/2 0 255 12864 192 025512864192 Por 3: f(v):= 3v 214. En general, podemos definir una transformacin lineal genrica de la forma: f(v):= bv + a 0 25512864 192 025512864192 Ej. Inversa: f(v):= 255 - v Pero la transformacin tambin puede ser no lineal: cuadrtica, polinomial, exponencial, logartmica, escalonada, etc. Cmo decidir cul es la transformacin ms adecuada? Usar el histograma. 215. Normalmente, interesa estirar el histograma, para conseguir que aparezca todo el rango de valores. Idea: definir una transformacin lineal tal que el histograma resultante vaya de 0 a 255. Ajuste lineal o estiramiento (stretch) del histograma: Buscar el valor mnimo del histograma: m Buscar el valor mximo: M f(v):= (v-m)*255/(M-m) m M Nota: Esto es una simple regla de 3 216. 0 25512864 192 025512864192 Ejemplo. m= 86, M= 214 R(x,y):= (A(x,y)-86)*1,99 A R Histograma de A HistogramadeR Ojo: no necesaria- mente el mximo Para imgenes en color, se aplica la misma funcin a los tres canales (R,G,B) 217. Cuidado: un simple pxel con valor muy alto o muy bajo puede hacer que el ajuste del histograma sea muy malo. Por ejemplo, si hay un pxel con valor 0 y otro con 255, la transformacin sera la identidad (la imagen no cambia). Solucin: en lugar de mnimo y mximo, ajustar usando dos percentiles del histograma (p. ej. 10%-90%, 5%-95%). Histograma de A 5% 5% 218. Ms ejemplos de estiramiento lineal del histograma. 219. La transformacin de histograma puede tomar cualquier forma (no necesariamente lineal). Ejemplos. 0 25512864 192 025512864192 Valor de entrada Valordesalida Resultado: oscurecer los medios tonos. Parbola: c1v2 + c2v + c3 0 25512864 192 Valor de entrada Resultado: aclarar los medios tonos. Raz: c1v0.5 + c2 025512864192 0 25512864 192 Valor de entrada Resultado: aclarar tonos oscuros y oscurecer los claros. Dos trozos de curva (parbola y raz) 025512864192 220. Elevar a 2, elevar a 1/2, ... Se define la transformacin de gama como: f(v):= 255(v/255)1/GAMA Gama 1 Gama 2 Gama 4Gama 0,75Gama 0,5 0 25512864 192 025512864192 221. Otra transformacin habitual es la ecualizacin del histograma (del latn aequalis = igual). Ecualizacin del histograma: es una transformacin definida de forma que el histograma resultante se reparte uniformemente en todo el rango de grises. 0 255127 0 255127 0 25512864 192 025512864192 ? En este caso se usa una funcin escalonada: f: array [0..255] de byte 222. Cmo definir f para conseguir la ecualizacin? Idea: suponer que a la salida hay 5 niveles de gris. 0 255127 0 25512864 192 04213 20% 20% 20% 20% 20% para todo pxel (x,y) de R hacer R(x,y):= f[A(x,y)] 0 421 3 223. Algoritmo. Clculo de la funcin de ecualizacin del histograma. Entrada. Histograma: array [0,...,255] de entero np: entero (nmero total de pxeles = mx*my) Salida. f: array [0,...,255] de byte Algoritmo: f[0]:= 0 acumulado:= Histograma[0] para i:= 1, ..., 254 hacer f[i]:= acumulado*255/np acumulado:= acumulado + Histograma[i] finpara f[255]:= 255 La funcin de ecualizacin es la integral del histograma, escalada por el factor 255/np. 224. Imagen de entrada (A) Imagen ecualizada (R) Histograma de A Histograma de RFuncin f 225. Ejemplos. Ecualizacin del histograma. Cuidado, en algunos casos los resultados pueden ser artificiosos. Cada canal (R,G,B) es ecualizado por separado 226. Inciso: ecualizacin local del histograma. Tanto la ecualizacin como el estiramiento se pueden aplicar localmente. Para cada pxel (x, y) de la imagen, calcular el histograma de una regin vecina de tamao nxn. Aplicar la transformacin correspondiente a (x, y). 227. Ejemplos. Operadores booleanos. Imagen de entrada A Imagen de entrada B A AND B A OR B A XOR B 228. En imgenes no binarias no tienen mucho sentido... Cmo se interpretan? Las operaciones binarias aparecen en anlisis de imgenes, y tambin para trabajar con mscaras y recortes de objetos. AGrisANDBGris ARGBANDBRGB 229. Imgenes de entrada. A B C Cmo conseguir el montaje de la pgina anterior? R:= (B AND NOT C) OR (AAND C) 230. 1. T1:= B AND NOT C B NOT C T1 2. T2:= AAND C 3. R:= T1 OR T2 A C T2 T1 T2 R 231. La imagen binaria (C) se suele denominar mscara. La mscara permite segmentar el objeto de inters. C Cuestiones: Cmo crear la mscara de forma automtica? La zona del pelo no se mezcla bien con el fondo. Cmo evitar este problema? R !? 232. Sumar dos imgenes: R(x, y):= A(x, y) + B(x, y) Significado: mezclar las dos imgenes. Ojo: [0..255] + [0..255] = [0..510] B A R 233. Para evitar la saturacin se puede usar la media. Media de 2 imgenes: R(x, y):= (A(x,y)+B(x,y))/2 Significado: las imgenes son semitransparentes (al 50%). B A R 234. De forma similar, se puede definir la media ponderada. Media ponderada: R(x,y):= aA(x,y) + (1-a)B(x,y) La media ponderada se puede usar para crear una transicin suave entre imgenes (o vdeos). a = 0,25 a = 0,5 a = 0,75 235. La media de imgenes se puede usar para acumular imgenes de un vdeo. Ejemplo 1. Combinar imgenes con mucho ruido de una escena, para obtener una mezcla con menos ruido. Imgenes capturadas de TV Imagen acumulada 236. Ejemplo 2. Crear un modelo de fondo de una escena, acumulando varias imgenes. Idea: si adems de la media en cada pxel calculamos tambin la varianza, podramos tener un modelo gaussiano del fondo (N(,)). Imgenes de Quickcam Modelo de fondo 237. Restar dos imgenes: R(x, y):= A(x, y) - B(x, y) Significado: obtener diferencia entre imgenes. B A A-B [0..255] - [0..255] = [-255..255] La mitad de los pxeles se saturan a 0 B-A 238. Restar dos imgenes, manteniendo el rango de salida: R(x, y):= (A(x, y) - B(x, y))/2 + 128 B A (A-B)* (B-A)* 239. Muchas veces lo que interesa es conocer la diferencia entre las imgenes. Solucin: tomar valor absoluto de la resta. Diferencia: R(x, y):= abs(A(x, y) - B(x, y)) Pxel negro: las dos imgenes son iguales en ese pxel. Cuando ms clara es una zona, ms se diferencian las imgenes. B A R ? Son muy distintas... 240. Aplicaciones de la diferencia: encontrar variaciones entre imgenes que, en principio, deberan ser parecidas. Ejemplo 1. Analizar la prdida de informacin al comprimir una imagen. Por ejemplo, con JPEG. Dif. x16 Dif. x16 241. Ejemplo 2. Segmentacin del fondo de una escena. Tenemos un fondo (imagen media) y una nueva imagen. x2 x2 Modelo de fondo Frame 1 Frame 2 Idea: esto se puede usar para crear la mscara... Cmo? 242. Proceso. 1. Obtener el modelo de fondo M. 2. Para cada imagen A del vdeo. 3. Calcular la diferencia: D = abs(M-A). 4. Umbralizar la imagen con un valor adecuado. U = umbralizar(D, x). 5. Sea F el nuevo fondo. 6. R:= (F AND NOT U) OR (A AND U) M A D U F R Cmo arreglar eso? 243. Ejemplo 3. Deteccin de movimiento en vdeo. Dada una secuencia de vdeo, queremos saber si se ha producido alguna modificacin, y en qu zonas de la imagen (encuentra las 7 diferencias). Frame 1 Frame 2 Diferencia x2 Qu objetos se han movido y en qu direccin? 244. Producto imgenes: R(x, y):= A(x, y)B(x, y)/255 B A AB Necesario escalar el resultado (dividir por 255). Efecto de mezcla, similar a la suma, pero conceptualmente ms prximo a un AND... 245. Divisin imgenes: R(x, y):= 255A(x, y)/B(x, y) B A A/B Tambin es necesario escalar el resultado (multiplicar por 255). Cul es interpretacin del resultado? 246. Ejemplo 1. Realizar una transformacin de intensidad distinta para cada pxel. A B1 B2 A*B1 A*B 2 247. Estos mismos tipos de imgenes se pueden usar para hacer sumas, restas, divisiones, etc. Ejemplo. R(x, y):= A(x, y)B(x, y)/128 Si B(x, y) = 128 el pxel de A no cambia. Si B(x, y) < 128 el pxel se oscurece. Si B(x, y) > 128 el pxel se aclara. El producto es tambin la base en la idea de mscara o seleccin difusa. Idea: una imagen se compone de distintos elementos o capas, que tienen definido cierto nivel de transparencia. 248. Ejemplo 2. Mezcla y combinacin de imgenes. Queremos combinar dos imgenes, por ejemplo, para poner una etiqueta descriptiva en una foto. Una imagen binaria sirve de mscara: 0 = fondo, 1 = etiqueta. A B M Resultado: R:= (AAND NOT M) OR (B AND M) No me convence... mejor un reborde suave (difuminado) R 249. Solucin. Usar una mscara suave, una imagen en gris: 0 = transparente, 255 = opaco. Combinar: sumas y productos. M Resultado: R:= A(255-N)/255 + BN/255 N Producto de imgenes 250. Indicaciones sobre el ejemplo 2. La mascara suave es la idea del canal alfa. RGB RGBA, donde el canal A indica el grado de opacidad de un pxel (0= transparente, 255= opaco). Uso: definimos imgenes, con sus canales alfa, y las componemos poniendo unas sobre otras. La composicin de imgenes con canal alfa es bsicamente una media ponderada como hemos visto. En el modo binario, muchas herramientas incorporan las ideas de mscara, seleccin, regin de inters (cuando es rectangular) o canal de inters (en multicanal). No necesitamos trabajar con operaciones booleanas, aunque implcitamente es lo que hay subyacente. 251. Otras operaciones no lineales Mnimo de 2 imgenes. R(x, y):= min(A(x, y), B(x, y)) Mximo de 2 imgenes. R(x, y):= max(A(x, y), B(x, y)) A A B B R R 252. Ejemplo. Una alternativa para crear modelos de fondo es usar mximos y mnimos. En lugar de tener media y varianza, tenemos mximo y mnimo del fondo en cada pxel. Dada una imagen nueva, para cada pxel, comprobar si su valor est entre el mximo y el mnimo. Si lo est: fondo; si no lo est: objeto. Fondo mnimo Fondo mximo 253. Con esto tenemos otra forma de hacer la segmentacin de los objetos. Modelo de fondo Frame 1 Frame 2 La mscara ya est binarizada 254. Operaciones Puntuales Operaciones Locales Operaciones Globales Operaciones Geomtricas 255. La imagen se transforma en funcin de los niveles de gris de cada pxel considerado y de los de su entorno (Filtro) Pueden ser: Lineales No lineales: Estadsticas Analticas Media geomtrica Media armnica .... Morfolgicas 256. Convolucin g(x,y) = w1*f(x-1,y-1)+ w2*f(x,y-1)+ w3*f(x+1,y-1)+ w4*f(x-1,y)+ w5*f(x,y)+ w6*f(x+1,y)+ w7*f(x-1,y+1)+ w8*f(x,y+1)+ w9*f(x+1,y+1) 3,5 4,5 5,5 3,4 4,4 5,4 3,3 4,3 5,3 0,5 1,5 2,5 0,4 1,4 2,4 0,3 1,3 2,3 0,2 1,2 2,2 0,1 1,1 2,1 0,0 1,0 2,0 3,2 4,2 5,2 3,1 4,1 5,1 3,0 4,0 5,0 w7 w8 w9 w4 w5 w6 w1 w2 w3 Mscara Imagen 257. Convolucin 3,5 4,5 5,5 3,4 4,4 5,4 3,3 4,3 5,3 0,5 1,5 2,5 0,4 1,4 2,4 0,3 1,3 2,3 0,2 1,2 2,2 0,1 1,1 2,1 0,0 1,0 2,0 3,2 4,2 5,2 3,1 4,1 5,1 3,0 4,0 5,0 w7 w8 w9 w4 w5 w6 w1 w2 w3 G(2,2) = f(3,2)*w6+ f(1,3)*w7+ f(2,3)*w8+ f(3,3)*w9 s7 s8 s9 s6 f(1,2)*w4+s4 f(2,2)*w5+ s5 f(1,1)*w1+ s1 f(2,1)*w2+ s2 f(3,1)*w3+s3 258. 1 1 1 1 1 1 1 1 1 1/9 -1 -1 -1 0 0 0 1 1 1 259. No Lineales Estadsticas Original + Ruido Aleatorio Filtro Mediana 260. No Lineales Analticas Media Geomtrica Media Armnica ... 261. No Lineales Morfolgicas Relacionadas con la estructura geomtrica de los objetos Depende del elemento estructurante En imgenes binarias: Erosin Dilatacin Adelgazamiento y esqueletizacin Opening Closing En imgenes multinivel: Extensin de las mismas operaciones 262. Erosin y dilatacin: Dependen de la forma del elemento estructurante y de la imagen Elemento estructurante 3,5 4,5 5,5 3,4 4,4 5,4 3,3 4,3 5,3 0,5 1,5 2,5 0,4 1,4 2,4 0,3 1,3 2,3 0,2 1,2 2,2 0,1 1,1 2,1 0,0 1,0 2,0 3,2 4,2 5,2 3,1 4,1 5,1 3,0 4,0 5,0 Imagen 263. Erosin de imgenes binarias 264. Dilatacin de imgenes binarias 265. Erosin de una imagen multinivel 266. Dilatacin de una imagen multinivel 267. Operaciones Puntuales Operaciones Locales Operaciones Globales Operaciones Geomtricas 268. Operaciones globales La imagen se transforma globalmente sin considerar los pixeles de forma individual, realizndose un cambio de dominio Entre las ms empleadas: Transformada de Fourier Transformada de Hadamard-Walsh Transformada de Karhunen-Leve Transformada discreta del coseno Transformada de Hough Cambio entre modelos de color Tambin se definen sus transformadas inversas 269. Transformada de Fourier f(x,y) Dominio Frecuencia Dominio Espacio F(u,v) TF G(u,v) H(u,v) g(x,y) TF-1 h(x,y) 270. Operaciones Puntuales Operaciones Locales Operaciones Globales Operaciones Geomtricas 271. Operaciones geomtricas La posicin de cada pixel en la imagen resultado depende de la posicin en la imagen origen Las ms usadas: Homotecia, zoom Traslacin Rotacin, transformada de Hotelling Warping, correccin de distorsiones Morphing 272. Warping Correspondencia entre las posiciones de los pixels en la imagen de entrada y posiciones de los pixels en la imagen de salida I(r,c) D(r, c) Transformacin Geomtrica r = R(r,c) c = C(r,c) Para determinar las ecuaciones es necesario identificar un conjunto de puntos de la imagen de entrada que tengan correspondencia con un conjunto de puntos de la imagen de salida (tiepoints) Estas ecuaciones suelen ser bilineales 273. 1. Definir los cuadrilateros sobre la imagen con unos puntos tiepoints conocidos 2. Encontrar las ecuaciones R(r,c) y C(r,c) para estos puntos 3. Establecer una correspondencia entre los puntos dentro de este cuadrilatero y la imagen final I(r,c) 274. Warping 275. Morphing 276. Div. Ingeniera de Sistemas y Automtica Universidad Miguel Hernndez 277. Definicin de Borde Extraccin de Bordes Operadores Derivada Comparacin de Funciones Locales Comparacin con Mscaras Orientadas Umbralizacin 278. Cualquier discontinuidad que sufre alguna funcin de intensidad sobre los puntos de la misma Tipos de bordes: Cambio brusco en la distancia cmara-objeto (dc) Cambio en la normal del objeto (n) Cambio en la reflectancia del objeto (r) Cambio en la proyeccin de la luz incidente (s) dc dc dc dc n n r s 279. Definicin de Borde Extraccin de Bordes Operadores Derivada Comparacin de Funciones Locales Comparacin con Mscaras Orientadas Umbralizacin 280. Filtrado + Extraccin = Deteccin de bordes Umbralizacin: Selecciona pixeles etiquetados como bordes Localizacin: Suministra informacin exacta de la posicin y orientacin del borde Filtrado Extrac. Umbral Local. f(x,y) f1(x,y) g(x,y) b(x,y) y=p(x) 281. En el dominio espacial Operadores derivada de los niveles de intensidad Comparaciones de funciones locales de intensidad Comparacin con mscaras orientadas, previamente definidas (template matching) Caractersticas Exigibles Precisin Robustez Calidad del etiquetado 282. Definicin de Borde Extraccin de Bordes Operadores Derivada Comparacin de Funciones Locales Comparacin con Mscaras Orientadas Umbralizacin 283. Efecto La primera derivada produce un resalte de las zonas en que la intensidad no es homognea. La segunda derivada origina un cambio de signo en la posicin de borde. Zero -crossing" (paso por cero) Perfil de Intensidad 1 Derivada 2 Derivada 284. Vector Gradiente Vector unitario en la direccin del gradiente 285. Discretizacin del Vector Gradiente Desplazamiento de los bordes en una cantidad positiva de 0.5 pxels -1 1 286. Discretizacin del Vector Gradiente (Eje Y) -1 1 287. Aproximaciones (Vector Gradiente) siendo -1 0 0 1 0 1 -1 0 288. Primera Derivada Direccional Derivada de la funcin f(x,y) en la direccin Derivada de la funcin f(x,y) en la direccin del gradiente Escogiendo el propio gradiente como vector 289. Primera Derivada Direccional (Ejemplo) Isotrpico (v) No Lineal (i) Primera Derivada Direccional 290. Gradiente de Roberts Detector horizontal Detector vertical Detectores diagonales 0 1 -1 0 1 0 0 -1 1 1 1 0 0 0 -1 -1 -1 -1 0 1 -1 0 1 -1 0 1 0 -1 -1 1 0 -1 1 1 0 -1 -1 0 -1 0 1 0 1 1 fx fy 291. Operador de Prewitt Operador de Sobel Mscaras de Kirsch -1 0 1 -1 0 1 -1 0 1 1 2 1 0 0 0 -1 -2 -1 -1 0 1 -2 0 2 -1 0 1 1 1 1 0 0 0 -1 -1 -1 -3 -3 5 -3 0 5 -3 -3 5 -3 -3 -3 -3 0 5 -3 5 5 -3 -3 -3 -3 0 -3 5 5 5 -3 -3 -3 5 0 -3 5 5 -3 5 -3 -3 5 0 -3 5 -3 -3 5 5 -3 5 0 -3 -3 -3 -3 5 5 5 -3 0 -3 -3 -3 -3 -3 5 5 -3 0 5 -3 -3 -3 K0 0 K1 45 K2 90 K3 135 K4 180 K5 235 K6 270 K7 315 Mdulo del Gradiente = Mximo de estos valores Direccin = Correspondiente al mximo 292. Ejemplos de operadores derivada Detector horizontal Detector vertical Detector de Sobel 293. Algoritmo de Canny Obtencin del gradiente Supresin no mxima al resultado del gradiente Histresis de umbral a la supresin no mxima Cierre de contornos abiertos 1. Obtencin del gradiente: Gaussiana Gradiente I Suavizado Derivada J Em Ea 294. 2. Supresin no mxima al resultado del gradiente a. Para todo punto se obtiene la direccin ms cercana dk a 0, 45, 90 y 135 en Ea(i,j) b. Si Em(i,j) es menor que uno de sus dos vecinos en la direccin dk, IN(i,j)=0. Si no IN(i,j)=Em(i,j) 3. Histresis de umbral a la supresin no mxima Permite eliminar mximos procedentes de ruido, etc. a. Entrada IN, Ea, y dos umbrales T1 y T2 (T2>T1) b. Para todo punto en IN, y explorando en un orden: a. Localizar el siguiente punto tal que IN(i,j) > T2 b. Seguir las cadenas de mximos locales a partir de IN(i,j) en ambas direcciones perpendiculares a la normal al borde siempre que IN>T1. Marcar los puntos explorados. c. La salida es un conjunto de bordes conectados de contornos de la imagen, as como la magnitud y orientacin. 295. 4. Cierre de contornos abiertos (Algoritmo de Deriche y Cocquerez) a. La imagen de entrada es una imagen de contornos binarizada (1= borde; 0=no borde) b. Para cada punto de borde de un extremo abierto se le asigna un cdigo que determina las direcciones de bsqueda para el cierre del contorno c. Para los pixels marcados con este cdigo se marca como pixel de borde el de mximo gradiente en las tres direcciones posibles. d. Se repiten los pasos hasta que se cierren todos los contornos. 26 25 24 27 0 23 20 21 22 1 812842 64 32 16 296. IMAGEN ORIGINALSUPRESIN DE NO MXIMOSIMAGEN BINARIZADA PREVIA HISTRESIS DE UMBRAL 297. Operador Laplaciana Discretizaciones aproximadas 1 -2 1 1 -2 1 298. Accin conjunta de las dos mscaras 0 1 0 1 -4 1 0 1 0 Operador Laplaciana 299. Segunda Derivada Direccional En la direccin siendo H la matriz Hessiana Escogiendo el vector unitario en la direccin del gradiente 300. Operador Laplaciana 0 1 0 1 -4 1 0 1 0 1 1 1 1 -8 1 1 1 1 -1 2 -1 2 -4 2 -1 2 -1 301. Operador Laplaciana de la Gaussiana El filtro obtenido resulta bastante costoso en tiempo de computacin Al ser un operador segunda derivada se reduce el efecto del ruido al suavizar la imagen Se detectan bordes en todas las direcciones Se puede trabajar a diferentes escalas al variar el valor de la desviacin estndar de la Gaussiana. Cuanto mayor es esta desviacin, habr un menor nmero de pasos por cero. Original + LG Positivos Blanco Negativos - Negro Imagen de Ceros 302. Aproximacin de Haralick y Shaphiro Se filtra la imagen con la Laplaciana de la Gaussiana Un pixel es declarado como cero: Si es menor que t y uno de sus ocho vecinos es mayor que t Si es mayor que t y uno de sus ocho vecinos es menor que -t t=4000 Desviacin = 2.0 303. Definicin de Borde Extraccin de Bordes Operadores Derivada Comparacin de Funciones Locales Comparacin con Mscaras Orientadas Extraccin de Esquinas Umbralizacin 304. Funciones Gaussianas Se comparan la imagen origen con imgenes filtradas con Gaussianas de distinta sigma siendo h un filtro Gaussiano Realce de los bordes 305. Filtro: Gaussiano =1 Filtro: Gaussiano =0.7 Diferencia imgenes previas 306. Funciones Exponenciales simtricas Operaciones Morfolgicas Imagen dilatada multinivel Imagen erosionada multinivel Realce de bordes: Diferencia entre ambas 307. Imagen Dilatada Multinivel Imagen Erosionada Multinivel Diferencia Dilatacin-Erosin 308. Definicin de Borde Extraccin de Bordes Operadores Derivada Comparacin de Funciones Locales Comparacin con Mscaras Orientadas Extraccin de Esquinas Umbralizacin 309. Conjunto de Mscaras Cada una resalta la existencia de un borde en una determinada direccin Tamao y nmero Dependiente de la precisin requerida Realce de los bordes 310. Definicin de Borde Extraccin de Bordes Operadores Derivada Comparacin de Funciones Locales Comparacin con Mscaras Orientadas Extraccin de Esquinas Umbralizacin 311. Mtodo de Kitchen y Rosenfeld Siendo fx, fy las primeras derivadas y fxx, fxy, fyy las segundas derivadas. U1 es un umbral para determinar si hay borde. Curvatura Gaussiana (Beaudet) 312. Umbralizacin Etiquetado de los pixeles de borde Problemas Prdidas de conectividad: bordes poco definidos filtrados muy fuertes umbral muy exigente Generacin de bordes de anchura mltiple: efectos del filtrado umbral poco exigente Existencia de falsos bordes: presencia de ruido 313. Tipos de umbralizacin Operadores basados en la primera derivada Umbralizacin simple Umbral T nico, define la existencia de borde g(x, y)>T entonces BORDE g(x, y) espacio de parmetros de Hough (x,y) Candidatos a centro = valores ms visitados Radios: Para cada pixel p de la Imagen se calcula la distancia a cada posible centro Estas distancias -> espacio de Hough 1-D. Candidatos a Radio = valores ms visitados 331. p distancia Radio p x y Centro Clculo del Centro Clculo del Radio 332. Definicin Tcnicas Basadas en la Frontera Umbralizacin Segmentacin Basada en Regiones Watershed 333. Umbralizacin Es posible segmentar la imagen en funcin de los valores de intensidad de los pixeles Operacin Umbral global (Slo depende de intens. f(x,y)) Umbral local (Depende de f(x,y) y de p(x,y), propiedad local del punto) Umbral dinmico-zonal (Depende de f(x,y), x, y) Umbralizacin multiumbral T T1 T2 334. Ejemplo. Imagen Original (I) Umbral 60 Umbral 70 Umbral 140 335. Ejemplo: Imagen Filtrada (II) Imagen 60 Imagen 120 Imagen 150 336. Ejemplo: Imagen Filtrada (III) 60-120 120-150 337. Umbralizacin global Clara definicin entre objetos y fondo Seleccin del umbral A partir del conocimiento del histograma Problemas Histograma con ruido Dificulta la localizacin de puntos significativos Picos pequeos en el histograma Objetos pequeos que pueden ser tragados por su entorno Eliminacin de la informacin espacial No se tiene en cuenta a la hora de tomar la decisin 338. Ejemplo de umbralizacin global 339. Umbralizacin Zonal Seleccin de umbral Umbral nico para cada subimagen Rango de aplicacin Restringido a una zona de la imagen Modus operandi Dividir la imagen en subimgenes Arbitrariamente o mediante aplicacin de heursticos Elegir un umbral para cada subimagen Aplicar su umbral a cada regin Segunda pasada para homogeneizar en objetos 340. Umbralizacin local 341. Umbralizacin multiumbral Imgenes con N objetos (N mx. en histograma) Cada objeto ocupa un rango del histograma, definido por dos umbrales Seleccin de umbrales: N-1 mnimos entre los N mximos Rango de aplicacin Toda la imagen 255 255 0 T 342. Ejemplo de umbralizacin multiumbral 343. Ejemplo: Imagen Filtrada Multiumbral Imagen Multiumbral 60-120-150 344. Umbralizacin basada en pixeles de frontera Conocido el Gradiente G y la Laplaciana L Cualquier fila o columna que contenga el objeto tiene la estructura: (.....)(-,+)(0 +)(+,-)(.....) Los pixeles centrales 0 + son pixeles correspondientes al objeto 345. Definicin Tcnicas Basadas en la Frontera Umbralizacin Segmentacin Basada en Regiones Watershed 346. Crecimiento de regiones Principio: Pixeles vecinos tienden a tener propiedades similares si pertenecen a un mismo objeto Criterios de similitud Se basan en conjugar dos propiedades Vecindad Homogeneidad 347. Crecimiento simple Inicializacin Se parte de pixeles semilla, uno o varios por regin Progreso Las semillas crecen por adicin de pixeles similares Finalizacin Las regiones creadas cubren las zonas de inters Seleccin de semillas Se realiza de forma manual 348. A Comprobacin para el crecimiento Se realiza un chequeo en conexin a 8 Se comprueba si los pixeles no clasificados son similares al central Diferencia en niveles de gris Distancia en el espacio de color RGB HSL ... A A A A A A B B 349. Ejemplo de crecimiento simple x x x x 350. Automatizacin de la seleccin de semillas Se toma un pixel por cada pico del histograma Ms de una semilla por regin Se necesita unir regiones con caractersticas similares x x x x x x x x x x x x 351. Crecimiento y unin de regiones Se barre la imagen fila a fila Cada pixel Si es similar se aade a una regin existente Si no es similar inaugura una nueva regin El rendimiento depende de la regla de comparacin Muy exigente: muchas regiones pequeas Poco exigente: pocas regiones poco homogneas A A A A A AA A A A B BA A ? 352. Crecimiento de regiones conexas binarias Estrategia Anlisis de vecindad Procedimiento Se barre la imagen fila a fila Cuando se encuentra un 1: Se enciende un fuego en ese pixel El fuego se propaga a todos los 1s vecinos Un 1 quemado se convierte en 0 El fuego se extingue al llegar al lmite de la regin Cuando acaba un fuego se contina con el barrido 353. Ejemplo de crecimiento de regiones conexas binarias 0 1 354. Divisin de regiones Inicio Toda la imagen se supone homognea Comprobacin Suposicin falsa, la imagen se divide en cuatro Repeticin Se repite suposicin y chequeo para subimgenes Finalizacin Se repite hasta que cada regin es homognea 355. Divisin y unin de regiones (split and merge) Problema de la divisin de regiones Se crean regiones adyacentes similares Solucin Inclusin de un algoritmo de unin Procedimiento Unin de las regiones generadas por la divisin Resultado Se obtienen menos regiones La unin puede hacerse: Antes de cada divisin Al final del proceso completo de divisin de regiones 356. Mtodos basados en textura No existe definicin de textura comnmente aceptada Mide Suavidad Bastez Regularidad Existen tres mtodos fundamentales: Estadsticos Basados en extensin y momentos de regiones del histograma Miden contraste, granularidad y bastez Espectrales Basados en autocorrelacin o T. de Fourier de una regin Miden periodicidad de la textura Estructurales Basados en la descripcin y localizacin de primitivas 357. Descriptores estadsticos de textura Ventaja: Computacionalmente sencillos Momentos centrales de hasta orden cuatro: Media (primer orden) Nivel medio de intensidad de la regin Varianza (segundo orden) Dispersin de los niveles de intensidad Sesgo (tercer orden) Medida de la simetra del histograma Curtosis (cuarto orden) Medida de la cada del histograma (granularidad de regin) Inconveniente: No dan informacin espacial 358. Definicin Tcnicas Basadas en la Frontera Umbralizacin Segmentacin Basada en Regiones Watershed 359. Lneas de unin de aguas Morfologa Matemtica La imagen digital se puede ver como una representacin topogrfica de un terreno Cada pixel se le asocia como valor de su altura el nivel de gris: Blanco -> Nivel mximo Negro -> Nivel mnimo 360. Imagen original Representacin Topogrfica 361. Proceso: Se comienza a inundar esta superficie desde los niveles ms bajos de altura (mnimos locales) Las aguas de dos cuencas contiguas se unen Las lneas de unin (watershed lines) representan las fronteras de regiones homogneas Corte 2D de la superficie del contorno (a) Lneas de unin (watershed 362. Algoritmo: Gradiente de la imagen original Mnimos locales -> Etiqueta diferente Para cada pixel: Encontrar el mnimo valor de sus vecinos, seguir el camino hasta encontrar un mnimo local o un pixel ya etiquetado Etiquetar este pixel con el nmero de la cuenca de inundacin correspondiente Las fronteras entre pixeles etiquetados son las lneas de divisin Si las fronteras son ms anchas que un pixel, se selecciona como lnea de divisin el conjunto de pixeles equidistantes a las dos cuencas 363. Problema: En la prctica se produce en muchos casos una sobresegmentacin debido a ruido o pequeas irregularidades de la imagen gradiente 364. Solucin: Utilizar unos marcadores previamente definidos Problema de detectar los marcadores 365. Watershed Jerrquico: Se calcula el Watershed de la imagen original Para las regiones resultantes se etiqueta cada una de las regiones con el valor de gris de la imagen original Se aplica de nuevo el watershed 366. Div. Ingeniera de Sistemas y Automtica Universidad Miguel Hernndez GRUPO DE TECNOLOGA INDUSTRIAL 367. Existen muchos formatos. Destacan: BMP, TIF, GIF y JPG Diferencias entre los formatos: Niveles de profundidad admitidos: 1 bit Imgenes en blanco y negro 1 byte Escala de grises o paleta de 256 colores 3 bytes Modelo RGB Tipo de compresin: Sin prdida: RLE, LZW Con prdida: mediante FFT, DCT, wavelets Otras caractersticas: Posibilidad de definir transparencias Diferentes imgenes en un mismo archivo (animaciones) Como resultado, segn la aplicacin ser ms adecuado uno u otro formato. 368. Almacenamiento de imgenes mediante paleta Paleta de colores: es una tabla de tamao n, donde cada posicin es un color (normalmente en RGB). 0 1 2 3 4 El valor de un pxel de la imagen hace referencia a la paleta. Nmero de bits/pxel Tamao de la paleta. 2 bits = 4 colores; 3 bits = 8 colores; 4 bits = 16 colores; ... 3 3 3 4 4 4 4 4 4 0 1 1 4 4 1 1 4 0 2 2 1 1 2 2 4 0 2 2 2 2 2 2 4 0 1 1 2 2 1 1 4 0 4 4 1 1 4 4 R= 51 G= 153 B= 255 369. Almacenamiento de imgenes mediante paleta Normalmente, las paletas no suelen ser de ms de 256 colores (1 byte por pxel). Si la imagen originalmente tiene ms colores, es necesario reducir los colores Seleccionar los colores ms usados. Resultado: hay una prdida de informacin de color. Sin paleta Con paleta (256 colores) 370. Tipos de compresin Compresin sin prdida: si se comprime y luego se descomprime se obtiene la misma imagen. Compresin con prdida: no se obtiene la misma imagen, hay una prdida de calidad en la imagen. Compresin RLE (Run Length Encoding): sin prdida. Se basa en detectar la repeticin de un mismo valor. Un valor no repetido se almacena directamente. Un valor repetido se almacena de forma especial, mediante un par (Valor, N repeticiones). Ejemplo. Icono bandera: 3, 3, 3, 4, 4, 4, 4, 4, 4, 0, 1, 1, ... Imagen comprimida: (3, 3), (4, 6), 0, (1, 2), ... 371. Compresin RLE (Run Length Encoding) La compresin