Vision del computador

37
Sistemas de Sensación Visión del Computador CI-2657 Robótica M.Sc. Kryscia Ramírez Benavides

description

Robótica

Transcript of Vision del computador

  • Sistemas de SensacinVisin del Computador

    CI-2657 Robtica

    M.Sc. Kryscia Ramrez Benavides

  • Introduccin

    Existen multitud de sensores capaces de informar de algunas caractersticas del ambiente que envuelve al robot.

    El sensor ms completo y que confiere la mxima adaptabilidad al robot es la visin.

    Existe una gran cantidad de empresas e investigadores que se dedican a mejorar esta tcnica.

    Sin embargo, todava no se ha implantado la visin en los robots comerciales, dadas las dificultades que existen.

    2

  • Introduccin (cont.)

    Las dificultades que existen son las siguientes:Los sistemas de visin superan, en muchos casos, el costo del sistema de robot industrial.

    Exigen extensos desarrollos de software para que el robot actu de acuerdo con la informacin del mundo exterior.

    Se necesitan potentes computadores para procesar una gran cantidad de informacin en poco tiempo. En robtica, las imgenes hay que procesarlas en tiempo real.

    3

  • Introduccin (cont.)

    Las dificultades que existen son las siguientes:Hay gran dificultad en el tratamiento de la informacin visual, debido a factores inherentes al mismo proceso, como son sombras, tipo de iluminacin, imgenes uni, bidimensionales y tridimensionales, oclusiones entre objetos, etc.

    En el anlisis de la imagen, adems de la informacin directa, hay que procesar otras fuentes de datos, tan complejos como los procedentes de la experiencia memorizada, el contexto general y los objetivos perseguidos.

    4

  • Introduccin (cont.)

    Las aplicaciones ms interesantes de visin, dentro de la Robtica, son:

    Reconocimiento y clasificacin de objetos.

    Ensamblado.

    Soldadura.

    Sincronizacin con otros dispositivos en movimiento.

    Guiado de robots mviles.

    5

  • Introduccin (cont.)

    Un sistema de visin artificial consta de las siguientes partes:

    Cmara. Encargada de captar la imagen y transmitirla en forma de seales elctricas, siguiendo unas normas de exploracin.

    Interfaz. Adaptacin de las seales elctricas producidas por la cmara a un computador.

    Paquetes de software. Para el proceso de la informacin por el computador, que permita analizar las escenas y generar los comandos de gobierno del robot, de forma autnoma y en tiempo real (Inteligencia Artificial).

    6

  • Introduccin (cont.)

    En la confeccin del software, pueden distinguirse tres fases consecutivas:

    Seleccin, de la informacin til e indispensable, puesto que es casi imposible, tener en cuenta toda la informacin que proporciona la cmara.

    Interpretacin, de la escena en forma conveniente para la aplicacin en curso.

    Clculo y generacin, de las denes de control a los elementos motrices del manipulador, segn los resultados de la fase anterior.

    7

  • Exploracin de Imgenes

    La exploracin de una imagen consiste, en esencia, en el conjunto de operaciones necesarias para convertirla en seales elctricas.

    Posteriormente, las seales se pueden amplificar y transmitirse, as como aplicarse a los dispositivos adecuados para su reproduccin o el reconocimiento, ms o menos inteligente, de la escena original.

    8

  • Exploracin de Imgenes (cont.)

    Por su reducido tamao y peso, su resistencia a los ambientes industriales y hostiles, y la tendencia a la baja de su precio, las cmaras de estado slido se estn imponiendo en las aplicaciones de Robtica.

    Dichas cmaras estn formadas por un conjunto de sensores fotosensibles, dispuestos en una estructura matricial de m filas y n columnas.

    Los sensores tienen dimensiones minsculas (25 x 25 micrones) y dan la informacin sobre un punto o elemento de la imagen, al que se denomina PIXEL (picture element).

    9

  • Exploracin de Imgenes (cont.)

    10

  • Exploracin de Imgenes (cont.)

    La representacin de un punto de una imagen, con las cmaras de estado slido, se define con tres parmetros, que son:

    Situacin de la fila del pixel (X).

    Situacin de la columna del pixel (Y).

    Intensidad luminosa del pixel (Z).

    Segn los sensores utilizados, las cmaras de estado slido pueden ser de tecnologa:

    CID (Charge-Injection Device): dispositivo de inyeccin de carga

    CCD (Charge-Compled Device): dispositivo de acoplo de carga.

    11

  • Exploracin de Imgenes (cont.)

    12

  • Exploracin de Imgenes (cont.)

    13

  • Exploracin de Imgenes (cont.)

    14

  • Exploracin de Imgenes (cont.)

    15

  • Exploracin de Imgenes (cont.)

    16

  • Exploracin de Imgenes (cont.)

    La matriz de pixeles de las cmaras de estado slido, estn formadas por un conjunto de condensadores MOS.

    En el tipo CCD, al incidir los fotones, generan unas cargas que son retenidas por cada puerta y luego transferidas o ledas en serie, de forma secuencial.

    La lectura de informacin de las cmaras CID se hace mediante direccionamiento X-Y, es decir, de forma aleatoria, lo que las faculta para explorar parcialmente a las imgenes.

    El procesamiento de la informacin que entrega la cmara, trata la imagen, selecciona los datos tiles y aplica los algoritmos apropiados para el reconocimiento de la forma del objeto enfocado.

    17

  • Procesamiento de Imgenes

    Estructura general de un sistema de visin.

    Los sistemas de visin usados en aplicaciones industriales estn basados en un computador de propsito general compuesto por varios mdulos interconectados por buses normalizados.

    As, los computadores basados en los microprocesadores Intel, utilizan los buses IBM-PC, el ISA-EISA (AT) y los procesadores de Motorola utilizan el bus VME.

    18

  • Procesamiento de Imgenes (cont.)

    Los mdulos principales de los equipos destinados al proceso de imgenes son:

    Uno o varios procesadores.

    Memoria principal para el almacenaje de programas y datos.

    Mdulos para el control de perifricos (discos, modem, impresoras, etc..)

    Modulo de entrada y salida para el gobierno de los elementos externos, como maquinaria, relees, robots, alarmas, etc.

    Tarjetas especializadas en el procesado de imgenes.

    19

  • Procesamiento de Imgenes (cont.)

    La tarjeta de video dispone de los elementos necesarios para llevar a cabo las siguientes funciones:

    Digitalizacin de la seal de video procedente de la cmara, mediante un conversor A/D.

    Almacenamiento de la informacin de la imagen digitalizada en una "memoria imagen".

    Sistema para el procesado de la imagen, mediante un procesador especializado o hardware especfico, como circuitos integrados PLD con ALUS integradas, tablas de transformacin hardware (LUT), etc.

    20

  • Procesamiento de Imgenes (cont.)

    La tarjeta de video dispone de los elementos necesarios para llevar a cabo las siguientes funciones:

    Visualizacin de la imagen almacenada en un monitor, a travs de un conversor D/A.

    Conexin del contenido de la memoria de imagen al bus normalizado para su posible procesamiento y tratamiento en la seccin del procesador principal y su memoria.

    21

  • Procesamiento de Imgenes (cont.)

    Digitalizacin.

    La exploracin de una lnea de la imagen de una cmara, proporciona una seal analgica continua, que debe ser muestreada en tantos puntos como pixeles tenga la lnea.

    Cada pixel o punto de la imagen capturada corresponde con una tensin analgica, cuyo valor representa el nivel de luminosidad o "nivel de gris".

    En el caso de las cmaras de estado slido no se precisa realizar el muestreo, puesto que cada celda CCD de la lnea proporciona directamente la tensin analgica del pixel correspondiente.

    22

  • Procesamiento de Imgenes (cont.)

    Como el procesamiento de la informacin es del tipo digital, hay que transformar los valores analgicos de los pixeles de la imagen en valores digitales.

    El nmero de bits en que se transforma la seal analgica mediante el conversor A/D, determina la cuantificacin de los niveles de gris, es decir, la cantidad de niveles de gris que se empleara en el procesamiento.

    As, con una resolucin de 8 bits se dispone de 256 niveles de gris, desde el blanco hasta el negro. Con dicha resolucin, el ojo humano ya no aprecia los escalones entre los niveles de gris.

    23

  • Procesamiento de Imgenes (cont.)

    La conversin de la seal analgica de video, procedente de la cmara ha de ser muy rpida, lo que exige conversores caros del tipo comparador en paralelo.

    Por ejemplo trabajando a 10Mhz, la conversin ha de hacerse en menos de 100ns.

    Una vez que se almacena la imagen digitalizada en la memoria de imagen, la mayora de las tarjetas de video tiene la posibilidad de poder visualizarla en un monitor, lo que conlleva la conversin D/A, as como la mezcla con los impulsos de sincronismo horizontal y vertical, para restablecer la seal de video.

    24

  • Procesamiento de Imgenes (cont.)

    Imgenes en proceso.

    El tratamiento de la informacin que compone la imagen puede llevarse a cabo a travs de programas (software), o bien, por medio de circuitos electrnicos especializados (hardware).

    En general, el hardware es ms rpido que el software, pero tambin ms caro.

    Hay situaciones en las que se hace imprescindible el tratamiento mediante hardware.

    Por ejemplo, cuando se trabaja en tiempo real como en las aplicaciones en Robtica, en las que la actuacin del manipulador depende, en cada momento, de la imagen que capta de la cmara sobre el entorno.

    25

  • Procesamiento de Imgenes (cont.)

    Tratamiento hardware.

    Uno de los recursos ms empleados en el proceso de imgenes pixel a pixel es el de las tablas de traduccin de hardware (LUT: Look Up Table).

    Se trata de circuitos integrados de diseo especfico, que tienen implementando el algoritmo de transformacin que hay que aplicar en cada pixel.

    A veces, la materializacin se lleva a cabo a modo de memoria EPROM de alta velocidad.

    26

  • Procesamiento de Imgenes (cont.)

    El nivel de gris I(x,y) de cada pixel se transforma, mediante un determinado algoritmo, en otro nivel de gris de salida O(x,y).

    O (x,y) = (Algoritmo) I(x,y)

    La LUT funciona como una memoria a la que se accede a una posicin con el valor I(x,y), encontrndose en dicha posicin el valor O(x,y) correspondiente, de forma directa y rpida.

    I(x,y) Entrada de direccionamiento An LUT DnSalida del dato O(x,y).

    27

  • Procesamiento de Imgenes (cont.)

    Tratamiento software.

    La ejecucin de un programa para la manipulacin y transformacin de los pixeles de una imagen, generalmente requiere ms tiempo que los circuitos que realizan al misma funcin por hardware.

    Los programas de procesado de imgenes suelen ser el lenguaje ensamblador o lenguaje C, es decir, aquellos que son ms cercanos al lenguaje mquina, para optimizar tiempo y tamao de la memoria.

    28

  • Procesamiento de Imgenes (cont.)

    A veces, en la propia tarjeta de visin se incluye un procesador especializado, que trabaja con instrucciones apropiadas en el tratamiento de imgenes.

    Sin embargo, en muchas ocasiones se utiliza el propio procesador principal del sistema.

    La eleccin del procesador es crucial en el rendimiento del sistema de visin.

    La velocidad de procesamiento de las instrucciones y el tamao del bus, son las caractersticas ms determinantes.

    29

  • Estructura y Jerarqua en el Proceso de Imgenes

    Tras captar la imagen mediante la cmara, hay un abanico de posibilidades para manipular la informacin recogida y obtener datos, que se desprenden de su anlisis.

    A todos estos mtodos de tratamiento de la informacin de imgenes se les llama genricamente: proceso de imgenes.

    30

  • Estructura y Jerarqua en el Proceso de Imgenes (cont.)

    En el proceso de imgenes se distinguen 3 niveles jerrquicos:

    Bajo Nivel. Las tcnicas utilizadas en este nivel son bsicas y estn orientadas a la definicin y obtencin de las propiedades generales de la imagen. En esta fase se incluye la fase de captacin mediante las cmaras y la fase de preproceso, en la cual se contempla la digitalizacin de la seal de video; la obtencin de las propiedades ms representativas, como los bordes, el color, la textura, etc.; y la mejora de la imagen.

    31

  • Estructura y Jerarqua en el Proceso de Imgenes (cont.)

    En el proceso de imgenes se distinguen 3 niveles jerrquicos:

    Nivel Intermedio. En este se incluyen las tcnicas empleadas para obtener las propiedades de la escena. As, con la segmentacin se extraen o aslan los objetos particulares de la imagen, con la descripcin se caracterizan dichos objetos, y con el reconocimiento, se identifican los objetos de la escena.

    Alto Nivel. En esta categora en la que se aplica el proceso inteligente, la tcnica ms representativa es la interpretacin, que trata de estudiar la lgica de los objetos localizados en la escena, procediendo a un etiquetado y representacin simblica.

    32

  • Componentes de un Sistema de Visin

    Existen 5 componentes importantes:Captacin: Es el proceso a travs del cual se obtiene una imagen visual.

    Pre-pocesamiento: Incluye tcnicas tales como la reduccin de ruido y realce de detalles.

    Segmentacin: Es el proceso que divide una imagen en objetos que sean de inters.

    Descripcin: Es el proceso mediante el cual se obtienen caractersticas convenientes para diferenciar un tipo de objeto de otro, por ejemplo: tamao y forma.

    Reconocimiento: Es el proceso que asocia un significado a un conjunto de objetos reconocidos.

    33

  • Componentes de un Sistema de Visin (cont.)

    34

  • Referencias Bibliogrficas

    La informacin fue tomada de:Fu, K.S.; Gonzlez, R.C. y Lee, C.S.G. Robotics: Control, Sensing, Vision, and Intelligence. McGraw-Hill. 1987.

    Esteve, Juan Domingo. Apuntes de Robtica. Universidad de Valencia. Espaa.

    URL: http://proton.ucting.udg.mx/materias/robotica/.

    35

  • 36CI-2657 RobticaOdometra

  • 37

    Gracias!

    M.Sc. Kryscia Daviana Ramrez BenavidesProfesora e InvestigadoraUniversidad de Costa RicaEscuela de Ciencias de la Computacin e Informtica

    Sitio Web: http://www.kramirez.net/E-Mail: [email protected]

    [email protected] Sociales:

    CI-2657 RobticaOdometra