Visión de Alto Nivel - INAOE - P

48
1 Visión de Alto Nivel Visión de Alto Nivel Dr. Luis Enrique Sucar INAOE [email protected] ccc.inaoep.mx/~esucar Dr. Luis Enrique Sucar INAOE [email protected] ccc.inaoep.mx/~esucar Sesión 1 Introducción Sesión 1 Introducción

Transcript of Visión de Alto Nivel - INAOE - P

Page 1: Visión de Alto Nivel - INAOE - P

1

Visión de Alto NivelVisión de Alto NivelDr. Luis Enrique Sucar

INAOE

[email protected]/~esucar

Dr. Luis Enrique Sucar

INAOE

[email protected]/~esucar

Sesión 1Introducción

Sesión 1Introducción

Page 2: Visión de Alto Nivel - INAOE - P

2

IntroducciónIntroducción

Page 3: Visión de Alto Nivel - INAOE - P

3

¿Qué es Visión?¿Qué es Visión?• “Visión es saber que hay y donde mediante

la vista” (Aristóteles)• “Visión es recuperar de la información de los

sentidos propiedades válidas del mundo exterior” (Gibson)

• “Visión es un proceso que produce a partir de las imágenes del mundo una descripciónque es útil para el observador y que no tiene información irrelevante” (Marr)

• “Visión es saber que hay y donde mediante la vista” (Aristóteles)

• “Visión es recuperar de la información de los sentidos propiedades válidas del mundo exterior” (Gibson)

• “Visión es un proceso que produce a partir de las imágenes del mundo una descripciónque es útil para el observador y que no tiene información irrelevante” (Marr)

Page 4: Visión de Alto Nivel - INAOE - P

4

Procesamiento de ImágenesProcesamiento de Imágenes

• Remover defectos,• Remover problemas por movimiento o desenfoque,• Mejorar ciertas propiedades como color, contraste,

estructura, etc.• Agregar “colores falsos” a imágenes monocromáticas

• Remover defectos,• Remover problemas por movimiento o desenfoque,• Mejorar ciertas propiedades como color, contraste,

estructura, etc.• Agregar “colores falsos” a imágenes monocromáticas

IMAGENPROCESAMIENTOIMAGEN

Page 5: Visión de Alto Nivel - INAOE - P

5

Ejemplo procesamientoEjemplo procesamiento

Page 6: Visión de Alto Nivel - INAOE - P

6

Visión ComputacionalVisión Computacional

IMAGEN VISIÒNDESCRIPCIÒN

• Determinar la identidad y localización de objetos en una imagen,

• Construir una representación tridimensional de un objeto.

• Determinar la identidad y localización de objetos en una imagen,

• Construir una representación tridimensional de un objeto.

Page 7: Visión de Alto Nivel - INAOE - P

7

Visión ComputacionalVisión Computacional

IMAGEN VISIÒNDESCRIPCIÒN

• Analizar un objeto para determinar su calidad,• Descomponer una imagen u objeto en diferentes

partes.

• Analizar un objeto para determinar su calidad,• Descomponer una imagen u objeto en diferentes

partes.

Page 8: Visión de Alto Nivel - INAOE - P

8

Ejemplo visiónEjemplo visión

Page 9: Visión de Alto Nivel - INAOE - P

9

AplicacionesAplicaciones

• Robótica móvil y vehículos autónomos• Manufactura• Interpretación de imágenes aéreas• Análisis de imágenes médicas• Interpretación de escritura y dibujos• Reconocimiento de personas, gestos y

actividades• Juegos

• Robótica móvil y vehículos autónomos• Manufactura• Interpretación de imágenes aéreas• Análisis de imágenes médicas• Interpretación de escritura y dibujos• Reconocimiento de personas, gestos y

actividades• Juegos

Page 10: Visión de Alto Nivel - INAOE - P

10

AplicacionesAplicaciones

• Análisis de imágenes de microscopios y telescopios

• Compresión de imágenes para transmisión y almacenamiento

• Interfaces humano-computadora• Seguridad• Aplicaciones militares

• Análisis de imágenes de microscopios y telescopios

• Compresión de imágenes para transmisión y almacenamiento

• Interfaces humano-computadora• Seguridad• Aplicaciones militares

Page 11: Visión de Alto Nivel - INAOE - P

11

Ejemplos de aplicacionesEjemplos de aplicaciones

Page 12: Visión de Alto Nivel - INAOE - P

12

Vehículos autónomosVehículos autónomos

Page 13: Visión de Alto Nivel - INAOE - P

13

Colores falsos (ultrasonido)Colores falsos (ultrasonido)

Page 14: Visión de Alto Nivel - INAOE - P

14

Aplicaciones médicasAplicaciones médicas

Page 15: Visión de Alto Nivel - INAOE - P

15

Reconocimiento de gestosReconocimiento de gestos

Page 16: Visión de Alto Nivel - INAOE - P

16

Robótica móvilRobótica móvil

Page 17: Visión de Alto Nivel - INAOE - P

17

Seguimiento y JuegosSeguimiento y Juegos

Page 18: Visión de Alto Nivel - INAOE - P

18

RepresentaciónRepresentación

F

X

Y

Monocromática:I=f(x,y)

Monocromática:I=f(x,y)

Color:f(x,y)=[f_{rojo}(x,y),f_{azul}(x,y),f_{verde}(x,y)]

Color:f(x,y)=[f_{rojo}(x,y),f_{azul}(x,y),f_{verde}(x,y)]

Page 19: Visión de Alto Nivel - INAOE - P

19

Proyección PerspectivaProyección Perspectiva

Por triángulos semejantes: y/f = Y/(F - Z)Por lo que: y=fY / (F - Z)En forma análoga: x=fX / (F - Z)

Por triángulos semejantes: y/f = Y/(F - Z)Por lo que: y=fY / (F - Z)En forma análoga: x=fX / (F - Z)

Z

y,Y

f

Lens

(X,Y,Z)

(x,y)

Page 20: Visión de Alto Nivel - INAOE - P

20

ReflectanciaReflectancia

FpFo

f

ñDA

Luz incidente depende de 3 factores:• Fuente lumínica• Geometría (ángulo)• Propiedades del objeto

Luz incidente depende de 3 factores:• Fuente lumínica• Geometría (ángulo)• Propiedades del objeto

Page 21: Visión de Alto Nivel - INAOE - P

21

ColorColor

Longitud de onda: 400 - 700 nmLongitud de onda: 400 - 700 nm

Percepción del color:Percepción del color:

400 700

AZUL

VERDEROJO

Page 22: Visión de Alto Nivel - INAOE - P

22

Modelos de ColorModelos de ColorModelo RGB:Modelo RGB:

VERDE ROJO

AZUL

BLANCO

Page 23: Visión de Alto Nivel - INAOE - P

23

Modelos de ColorModelos de ColorModelo RGB:Modelo RGB:

Page 24: Visión de Alto Nivel - INAOE - P

24

R

A

V

NEGR O

BLANCO

CÚBICO

Modelos perceptuales:• Intensidad - I• Croma (hue) - H• Saturación - S

Modelos perceptuales:• Intensidad - I• Croma (hue) - H• Saturación - S

I

HS

Modelos de ColorModelos de Color

Page 25: Visión de Alto Nivel - INAOE - P

25

Modelos perceptuales:• Intensidad - I• Croma (hue) - H• Saturación - S

Modelos perceptuales:• Intensidad - I• Croma (hue) - H• Saturación - S

Modelos de ColorModelos de Color

Page 26: Visión de Alto Nivel - INAOE - P

26

Digitalización de imágenesDigitalización de imágenes

2424 38384343 45455656 5959 4646

50504444

Page 27: Visión de Alto Nivel - INAOE - P

27

MuestreoMuestreo

DIM ENSIÓ NFOURIER

Frecuencia de muestreo: > 2 veces mayor frecuencia(teorema de Shannon)

Frecuencia de muestreo: > 2 veces mayor frecuencia(teorema de Shannon)

Page 28: Visión de Alto Nivel - INAOE - P

28

Efectos de Muestreo (resolución)Efectos de Muestreo (resolución)

bbaa

cc dd

Page 29: Visión de Alto Nivel - INAOE - P

29

Dispositivos de capturaDispositivos de captura

• Cámaras fotográficas,• Cámaras de televisión,• Digitalizadores,• Sensores de rango (laser),• Sensores de ultrasonido,• Rayos X, tomografía,• Resonancia magnética.

• Cámaras fotográficas,• Cámaras de televisión,• Digitalizadores,• Sensores de rango (laser),• Sensores de ultrasonido,• Rayos X, tomografía,• Resonancia magnética.

Page 30: Visión de Alto Nivel - INAOE - P

30

Niveles de análisisNiveles de análisis

• Teoría computacional- ¿Qué?

• Representación y algoritmo- ¿Cómo - concepto?

• Implementación - ¿Cómo - físico?

• Teoría computacional- ¿Qué?

• Representación y algoritmo- ¿Cómo - concepto?

• Implementación - ¿Cómo - físico?

Page 31: Visión de Alto Nivel - INAOE - P

31

Niveles de análisisNiveles de análisis• Procesamiento de nivel bajo• Procesamiento de nivel intermedio• Procesamiento de nivel alto

• Procesamiento de nivel bajo• Procesamiento de nivel intermedio• Procesamiento de nivel alto

óvalo

Page 32: Visión de Alto Nivel - INAOE - P

32

EjemploEjemplo

1. Captura de la imagen2. Mejoramiento de la imagen3. Binarización4. Detección de orillas5. Segmentación6. Extracción de características7. Reconocimiento

1. Captura de la imagen2. Mejoramiento de la imagen3. Binarización4. Detección de orillas5. Segmentación6. Extracción de características7. Reconocimiento

Page 33: Visión de Alto Nivel - INAOE - P

33

Ejemplo: identificación de placasEjemplo: identificación de placas

H

Page 34: Visión de Alto Nivel - INAOE - P

34

Visión de Nivel Bajo y MedioVisión de Nivel Bajo y Medio

orillas

textura

color

3-D

ImagenSegmen-

tada

Page 35: Visión de Alto Nivel - INAOE - P

35

Visión de Nivel AltoVisión de Nivel Alto

orillas

textura

color

3-D

ImagenSegmen-

tadaDescripciónsimbólica

Representacióndel mundo

Page 36: Visión de Alto Nivel - INAOE - P

36

Visión de Alto NivelVisión de Alto Nivel

• Obtiene una interpretación consistente de las características obtenidas en visión de nivel bajo e intermedio

• Se basa en utilizar conocimiento de los objetos del dominio de interés

• En base al conocimiento y las características se realiza el reconocimiento

• Obtiene una interpretación consistente de las características obtenidas en visión de nivel bajo e intermedio

• Se basa en utilizar conocimiento de los objetos del dominio de interés

• En base al conocimiento y las características se realiza el reconocimiento

Page 37: Visión de Alto Nivel - INAOE - P

37

Aspectos básicosAspectos básicos

• Representación - forma de modelar el mundo, en particular los objetos de interés para el sistema

• Reconocimiento - como el modelo y la descripción de la imagen(es) son utilizadas para identificar los objetos

• Representación - forma de modelar el mundo, en particular los objetos de interés para el sistema

• Reconocimiento - como el modelo y la descripción de la imagen(es) son utilizadas para identificar los objetos

Page 38: Visión de Alto Nivel - INAOE - P

38

Extracción de CaracterísticasExtracción de Características

• Basadas en segmentación– Propiedades globales de la región como color,

textura, forma• Basadas en contornos

– Descripción de “forma” basada normalmente en modelos geométricos

• Basada en características locales– Descripción mediante “puntos” distintivos como

esquinas, orillas, Haar, Sift, etc.

• Basadas en segmentación– Propiedades globales de la región como color,

textura, forma• Basadas en contornos

– Descripción de “forma” basada normalmente en modelos geométricos

• Basada en características locales– Descripción mediante “puntos” distintivos como

esquinas, orillas, Haar, Sift, etc.

Page 39: Visión de Alto Nivel - INAOE - P

39

RepresentacionesRepresentaciones

• Propiedades – vector de características• Estructurales – partes y sus relaciones• Geométricas – modelos en 2 o 3 dimensiones

• Propiedades – vector de características• Estructurales – partes y sus relaciones• Geométricas – modelos en 2 o 3 dimensiones

Page 40: Visión de Alto Nivel - INAOE - P

40

ReconocimientoReconocimiento

• Técnicas de reconocimiento de patrones (representaciones vectoriales)– Clasificadores, aprendizaje– Métodos estadísticos– …

• Técnicas basadas en conocimiento (representaciones estructurales)– Sistemas de reglas, redes semánticas, …– Modelos gráficos probabilistas

• Técnicas de reconocimiento de patrones (representaciones vectoriales)– Clasificadores, aprendizaje– Métodos estadísticos– …

• Técnicas basadas en conocimiento (representaciones estructurales)– Sistemas de reglas, redes semánticas, …– Modelos gráficos probabilistas

Page 41: Visión de Alto Nivel - INAOE - P

41

ReconocimientoReconocimiento

• Técnicas de alineamiento (representaciones geométricas)– Transformaciones y apareamiento– Grafos e isomorfismo

• Técnicas de alineamiento (representaciones geométricas)– Transformaciones y apareamiento– Grafos e isomorfismo

Page 42: Visión de Alto Nivel - INAOE - P

42

Ejemplo – reconocer una personaEjemplo – reconocer una persona

• Basado en características - globales• Basado en características - globales

Área, color, forma, …

Page 43: Visión de Alto Nivel - INAOE - P

43

Ejemplo – reconocer una personaEjemplo – reconocer una persona

• Basado en características - locales• Basado en características - locales

[C1], [C2], [C3], …

Page 44: Visión de Alto Nivel - INAOE - P

44

Ejemplo – reconocer una personaEjemplo – reconocer una persona

• Basado en una representación estructural• Basado en una representación estructural

cara

torso brazobrazo

pierna pierna

Page 45: Visión de Alto Nivel - INAOE - P

45

Ejemplo – reconocer una personaEjemplo – reconocer una persona

• Basado en alineamiento - contorno• Basado en alineamiento - contorno

Page 46: Visión de Alto Nivel - INAOE - P

46

Resto del CursoResto del Curso

• Breve repaso de visión de bajo nivel– Orillas, textura, color

• Nivel Intermedio– Segmentación– Características globales– Características locales

• Breve repaso de visión de bajo nivel– Orillas, textura, color

• Nivel Intermedio– Segmentación– Características globales– Características locales

Page 47: Visión de Alto Nivel - INAOE - P

47

Resto del CursoResto del Curso

• Visión de alto nivel– Modelos geométricos– Modelos basados en conocimiento– Modelos bayesianos– Relaciones y gramáticas

• Aplicaciones– Recuperación de imágenes por contenido– Visión robótica

• Visión de alto nivel– Modelos geométricos– Modelos basados en conocimiento– Modelos bayesianos– Relaciones y gramáticas

• Aplicaciones– Recuperación de imágenes por contenido– Visión robótica

Page 48: Visión de Alto Nivel - INAOE - P

48

ReferenciasReferencias

• Sucar & Gómez: Cap. 1• Ullman: Cap. 1 y 2• Forsyth & Ponce: Cap. 1

• Sucar & Gómez: Cap. 1• Ullman: Cap. 1 y 2• Forsyth & Ponce: Cap. 1