anteproyecto

21
UNIVERSIDAD DISTRITAL “Francisco José de Caldas” Facultad Tecnológica Formato para Propuesta de Proyecto de Grado de Ingeniería en Control. Modalidad: PASANTÍA MONOGRAFÍA X INVESTIGACIÓN TITULO PROPUESTA Sistema de conteo automático de flujo de personas por medio de visión artificialPROPONENTES Andrés Mauricio García Piragua 20131383032 William Alexander Moreno Gómez 20131383033 DIRECTOR Ing. Miguel Ricardo Pérez Pereira REFERENCIA AL CONSEJO El proyecto se enfoca en el desarrollo, implementación y validación de un sistema de visión artificial para el conteo automático de personas en tiempo real, como herramienta de cálculo y análisis de aforo en lugares concurridos, que mejore la movilidad en comparación con tecnologías actuales como torniquetes. El proyecto se ejecutará en la modalidad de investigación en la rama de análisis de imágenes, abordados por el grupo de investigación Roma de la Universidad Distrital Facultad tecnológica. DATOS DE ENLACE E-mail: [email protected] Teléfono: 3166128479 E-mail: [email protected] Telefono: 31033322255 ____________________________________________________________________ Espacio Exclusivo Consejo Curricular APROBADO MODIFICAR RECHAZADO

description

procesamiento de imagenes

Transcript of anteproyecto

Page 1: anteproyecto

UNIVERSIDAD DISTRITAL “Francisco José de Caldas”

Facultad Tecnológica

Formato para Propuesta de Proyecto de Grado de Ingeniería en Control.

Modalidad:

PASANTÍA MONOGRAFÍA X INVESTIGACIÓN

TITULO PROPUESTA “Sistema de conteo automático de flujo de personas por medio de visión artificial”

PROPONENTES Andrés Mauricio García Piragua 20131383032 William Alexander Moreno Gómez 20131383033

DIRECTOR Ing. Miguel Ricardo Pérez Pereira

REFERENCIA AL CONSEJO El proyecto se enfoca en el desarrollo, implementación y validación de un sistema de visión artificial para el conteo automático de personas en tiempo real, como herramienta de cálculo y análisis de aforo en lugares concurridos, que mejore la movilidad en comparación con tecnologías actuales como torniquetes. El proyecto se ejecutará en la modalidad de investigación en la rama de análisis de imágenes, abordados por el grupo de investigación Roma de la Universidad Distrital Facultad tecnológica.

DATOS DE ENLACE

E-mail: [email protected] Teléfono: 3166128479 E-mail: [email protected] Telefono: 31033322255

____________________________________________________________________ Espacio Exclusivo Consejo Curricular

APROBADO MODIFICAR RECHAZADO

Page 2: anteproyecto

HOJA DE ACEPTACIÓN

Sistema de conteo automático de flujo de personas por medio de visión artificial.

Observaciones. _________________________________________________________ _________________________________________________________ _________________________________________________________ _________________________________________________________ _________________________________________________________ _________________________________________________________ _______________________________ Director del Proyecto Ing. Miguel Ricardo Pérez Pereira _______________________________ Evaluador del Proyecto Ing. Frank Nixon Ramos _______________________________ Vo.Bo. Metodología

Ing. Henry Montaña Fecha de presentación: Mayo de 2015

Page 3: anteproyecto

INFORMACIÓN GENERAL DEL PROYECTO

Título: Sistema de conteo automático de flujo de personas por medio de visión artificial.

Estudiantes Proponentes: Andrés Mauricio García Piragua William Alexander Moreno Gómez Total de Estudiantes (número): 2 Línea de Investigación: Visión Artificial.

Descriptores / Palabras claves: Feature extraction, Image analysis, Object detection, Subtraction techniques, Image recognition.

Modalidad

Pasantía: Monografía: X Investigación:

Lugar de Ejecución del Proyecto: Nombre de la Entidad: Entidad Pública X Entidad Privada Empresa agrícola Empresa Industrial Empresa servicios Grupo investigación X Otras (Indicar cuál) Ciudad: Bogotá D.C. Departamento: Cundinamarca Dirección: Transversal 70B No 73 A 35 sur Teléfono: Fax: Correo Electrónico: [email protected] Sede de la Entidad: Facultad Tecnológica Nit: 899.999.230.7

Duración del Proyecto (meses): 6

Valor total del proyecto:$ 2’246.000

Modalidad - Investigación Grupo de investigación: Roma Director del Grupo: Giovanny Bermúdez Proyecto de investigación adscrito: Desarrollo de sistemas sensoriales.

Modalidad - Pasantía: N/A Entidad: N/A Representante Legal: N/A Profesional de la entidad que acompaña pasantía.: N/A Valor del proyecto: N/A Financiación en especie: N/A Financiación en dinero: N/A

Observaciones:

Page 4: anteproyecto

RESUMEN EJECUTIVO

La creciente necesidad del conteo de personas ha tomado una gran importancia para los entes administrativos de diferentes sitios que ofrecen algún tipo de servicio al público, ya sea por requerimiento de verificación o, como fin estadístico para crear una base de datos estadísticos para el marketing, servicio al cliente u otros intereses administrativos del lugar. Considerar el aforo es parte de un control de seguridad, pues la restricción en la cantidad de ocupantes por área según el espacio, garantiza la seguridad de la estadía de las personas debido a las características intrínsecas de las edificaciones, así como su uso, riesgo, tipo de construcción o evento que aloja. Generalmente en algunos sitios este ingreso se ha hecho con torniquetes, pero no en todos los sitios se puede llevar a cabo una implementación de éste tipo por lo impráctico que puede llegar a ser, y por qué en el caso de una emergencia pueden convertirse en obstáculos y trampas que ponen en riesgo la vida humana. Tener presente la cantidad de personas que entran y salen de un lugar en tiempo real permite dar datos estadísticos de uso del sitio pero aún más, cumplir requisitos de seguridad, para la prevención de siniestros que como objetivo fundamental de todo lugar público o privado debe ser salvaguardar vidas humanas, así como de preservar el patrimonio y continuidad de la edificación. El objetivo entonces es determinar el número puntual de personas que ingresan y salen a un lugar mediante el procesamiento de imágenes obtenidas mediante cámaras que permita conocer en tiempo real el aforo del lugar donde se implementó, en este sentido el proyecto debe entregar un algoritmo de reconocimiento de personas, junto con los requerimientos mínimos de funcionamiento óptimo, que otorgue herramientas cuantitativas para elaborar histogramas de afluencia o estrategias de seguridad. El reconocimiento de personas será programado en base a algoritmos de reconocimiento de objetos en imágenes, dependiendo del tipo de eficiencia en algoritmos supervisados o no supervisados y buscando herramientas de programación sobre algoritmos que se ajusten a nuestras necesidades como Linux, open CV, image toolbox de Matlab, phyton, Java u otros. Nos centraremos en aquel que permita en lo posible una portabilidad de lenguaje para futuros trabajos en múltiples plataformas. El trabajo es propuesto en la modalidad de monografía en la cual serán plasmado el trabajo que recopila los resultados obtenidos y el prototipo será puesto a prueba en el grupo de investigación ROMA en la Facultad Tecnológica, una vez esté finalizado se entregara una herramienta de control de público en lugares públicos o privados flexible de fácil implementación y con toda la documentación de uso para el aporte en la rama de procesamiento digital de señales, en la carrera de Ingeniería en control. El costo general del proyecto se estima en $2’246.000 y se estima una duración de 6 meses

Page 5: anteproyecto

2.0 DESCRIPCIÓN DEL PROYECTO

2.1 Planteamiento del Problema

Todo edificio, auditorio, Coliseo, de carácter público o privado según normas arquitectónicas admite una cantidad máxima de personas que pueden estar en un tiempo determinado, estos parámetros se deducen del uso, riesgo o tipo de construcción así como del evento alojado. Cuando no se respetan dichas disposiciones se incurre en faltas a la seguridad, poniendo en riesgo la vida de las personas que allí se encuentren. La falta de datos sobre la concurrencia de personas a un lugar lleva a congestiones, y en muchos casos tragedias, cuando el uso de elementos como torniquetes no permite tener un control sobre el aforo del sitio. Hoy en día colocar torniquetes en eventos o lugares de carácter público resulta una solución poco práctica pues hoy en día deben tender a desaparecer por ser un obstáculo para personas en condición de discapacidad, y por qué en caso de una emergencia se convierten en trampas para los planes de evacuación. Es necesario tener a disposición un sistema flexible que no obstaculice el libre paso de los transeúntes pero que también, esté en la capacidad de entregar datos cuantitativos lo más exactos posibles para el realizar el control del aforo en lugares requeridos.

2.2 Justificación

Eliminar los torniquetes e implementar un sistema de conteo de personas por análisis digital de imágenes permite integrar soluciones flexibles y novedosas para la movilidad que hoy en día se vienen implementando en lugares con alta afluencia de público. El análisis digital de imágenes impulsado desde la investigación permite en primera instancia la apropiación del conocimiento de diferentes técnicas y algoritmos que muchos entes académicos a nivel mundial vienen impulsando desde hace mucho tiempo, y que hoy en día es un gran campo del conocimiento donde el grupo de investigación puede empezar a dar grandes aportes para la carrera de ingeniería en control. Lograr enfocar el proyecto desde herramientas basadas en soluciones de código abierto para análisis y detección de personas, representa un gran plus en el proyecto pues permite impulsar nuevas soluciones para la parte administrativa que se considera en el proyecto, y además le da la oportunidad de impulsar futuros trabajos relacionados con la detección de personas e imágenes, que se plantearan desde el grupo de investigación aplicados a la robótica móvil.

Page 6: anteproyecto

3. Estado del Arte El incremento exponencial en el manejo de archivos digitales abre un gran campo de estudio e investigación en diferentes campos como lo son los enfocados en las imágenes el audio y el video. En [1] se resalta la necesidad de tener herramientas pertinentes y eficientes para la manipulación de todo tipo de archivos digitales. En especial de las imágenes se debe extraer y etiquetar cientos de características en base al color, intensidad, textura, contornos. [1] realiza un trabajo de revisión desde los comienzos del procesamiento en los años 90, posteriormente los trabajos que recopila muestra el comienzo del soporte de color a las imágenes y extracción de formas y características. El trabajo resume entonces los componentes principales que deben tener los sistemas de reconocimiento entre los que destacan una interfaz de usuario de fácil acceso para los sistemas, la integración de varias características para elaborar una similitud entre las imágenes que se procesan, y finalmente destacan el potencial de aplicación que tiene el procesamiento de imágenes en diversos campos de aplicación. En el trabajo de detección de rostros [2] tenemos una visión positiva del proyecto, pues el desempeño que han logrado hoy en día las herramientas computacionales nos permiten avanzar en la implementación de soluciones basadas en sistemas más flexibles más precisos y más seguros basándose en sistemas informáticos que proveen una solución económica de bajo mantenimiento como lo son las cámaras. Los trabajos actuales de imágenes se enfocan en proveer análisis de imágenes de alta calidad para el monitoreo y control en tareas en que dispositivos como los infrarrojos hoy en día tienen tantos fallos, con el fin de tener la información precisa en tiempo real. Ahora la clave es tener la noción general de como es el proceso de detección de objetos y las metodologías propuestas desde el campo de la investigación académica. Trabajos como [3] y [4] proponen algunos parámetros a tener en cuenta y de [3] destacamos el diagrama de flujo que proponen para el análisis de imágenes. Aunque su trabajo está limitado a la cantidad de personas que están presentes en determinado momento, representa un aporte bastante positivo para nuestro proyecto, pues plantean problemas que debemos intentar solucionar como, el hecho que las personas lleguen abrazadas y haga un conteo erróneo, este trabajo ubica la cámara apuntando paralelamente al piso y utilizan una técnica de marcado de pixeles para sobre marcar unos vectores entre imágenes que determinan hacia donde se dirigen ciertos objetos. Existen problemas cuando las personas llevan objetos como maletas de mano u otros que marcan también trayectorias sobre los análisis y pueden convertirse en falsos positivos, pero hace parte de problemas que debemos incluir dentro del proyecto. El diagrama de flujo que [4] nos propone estima la extracción de los objetos que en la imagen están moviéndose, y estima la posible existencia de una persona basándose en el área del objeto en movimiento, calcula el color de los pixeles en movimiento y le hace un seguimiento a través de un par le líneas imaginarias que representan la entrada y salida del lugar para finalmente hacer el conteo. Se considera que si el seguimiento a los pixeles no superan las líneas imaginarias no se debe contar. Es de destacar que ellos hacen el trabajo con una resolución de imagen de 320x240 a 30FPS estos datos para nuestro proyecto nos plantean si podemos elevar la resolución de la imagen a costa de elevar el proceso computacional pero mejorar la precisión del trabajo que [4] propone o si también se

Page 7: anteproyecto

puede considerar la posibilidad de elevar los fotogramas por segundo que se están tomando en el video. El resultado final de ellos fue un contador de personas de buena precisión, pero no se aplica el sistema a ninguna aplicación específica, solo se limitan a un ensayo inicial del prototipo.

Figura 1. Algortimo propuesto para identificacion de personas [4]

El trabajo de [3] nos resalta la importancia del manejo del pre-procesamiento de la imagen para controlar el umbral de rango en que se digitaliza la imagen, y posteriormente se hace la segmentación de las personas y el fondo de la imagen pues muestran como la influencia de las condiciones externas al lugar donde se realiza el trabajo influye en el desempeño del algoritmo que ellos proponen. Esto nos ubica en dos situaciones de trabajo pues debemos considerar en primera instancia que el lugar de implementación sea controlado para la validación y verificación de los algoritmos que se analizan y en segunda instancia como mejorarlos una vez analizados para ponerlos a trabajar en condiciones no controladas.

Page 8: anteproyecto

El mejoramiento de los problemas de iluminación se podría llegar a solucionar con la propuesta de [2] en donde plantean el NCC (Normalized Color Coordinates). La normalización de los colores es una propuesta que vale la pena considerar pues muestra resultados positivos para elevar la eficiencia del método. Es pertinente para nuestro trabajo considerar como será la ubicación de la cámara pues esto parte en 2 los trabajos que nos permiten desarrollar el estado del arte, debido a que el posicionamiento implica el aumento o disminución del efecto del ambiente sobre la imagen consideramos muestras de algunos trabajos.

Figura 2. Analisis de 2 peatones que caminan en direcciones opuestas [4]

Figura3. Ejemplo de vistas de cámara en (c) y (d) la alta afluencia empobrece la imagen [3]

Figura 4. Deteccion de personas de frente [2]

El trabajo de [2] basado en la detección facial nos lleva a indagar que otros algoritmos en este campo existen encontramos pues en [5] un artículo que resume las principales investigaciones en el campo del reconocimiento facial. El aporte más importante de este artículo es la revisión matemática que se realiza para la extracción de características en las imágenes. En primera instancia muestra que si bien los algoritmos de identificación muestran una alta eficiencia ninguno es 100% confiable y esto es porque la técnica de identificación por imágenes al no ser invasiva, deja un margen de error que para algunas aplicaciones

Page 9: anteproyecto

puede ser despreciable. Tenemos entonces bastantes trabajos en base a diferentes técnicas de detección de rostros como el Análisis de componentes principales (PCA) también denominada Eigenfaces [6], o los Análisis de discriminantes lineales (FLD de Fisher o Fisherfaces [7], estos últimos trabajos aunque se especializan en detección de rostros sobre personas especificas también exponen identificadores claves para el reconocimiento del área del rostro que brinda una característica de análisis clave para el proyecto para eliminar e problema de los falsos positivos cuando se ponga a prueba el prototipo. De estos últimos tenemos como los autores resaltan la importancia del pre-procesamiento en función de corregir elementos como la iluminación y el escalado, pues como no hay una técnica de reconocimiento que se logre considerar como la mejor, si no que se escoge en función del problema que pretende solucionar, y respecto a su implementación [5] sugiere que la mayor cantidad de trabajos se suele trabajar en tarjetas DSPa nivel de hardware aunque en [8] se realiza una implementación de detección para seguridad donde se hace la implementación sobre código abierto y una plataforma Raspberry Pi que emula un pequeño ordenador basado en plataforma Linux de bajo costo y con buenos resultados superiores al 70% en la detección. Finalmente en [9] tenemos un trabajo enfocado a detección de objetos donde destacan el uso de las técnicas de modelado de fondo y extracción (background modeling techniques), estos son mejor expuestos en [10] donde analizan 6 técnicas diferentes entre las cuales están: el promedio gaussiano, la estimación por densidad y la concurrencia por variaciones de imágenes. La comparación de los métodos se hace entorno a la velocidad, los requerimientos de memoria y la precisión de los métodos. Este documento permite hacer una comparación rápida de los métodos, para encontrar entre los métodos el más óptimo para una aplicación en específico.

4 Marcos de referencia

4.1 Marco Teórico 4.1.1 Procesamiento digital de imágenes El procesamiento de imágenes, nace desde que se dispone de recursos tecnológicos para captar y manipular información a manera de matrices de información, creando una tecnología asociada al campo de la computación. Los estudios recientes se enfocan a minimizar el efecto de las pérdidas de información por la misma naturaleza de las imágenes bien sea por la naturaleza discreta de los pixeles de la imagen o por el rango limitado de luminosidad que el pixel puede tomar. Todas las señales que encontramos en la naturaleza son de tipo análogas continuas variables en amplitud, para que puedan ser procesadas la tecnología se vale de elementos pasivos y activos, más específicamente los sistemas que son dedicados al procesamiento de señales discretas se les denomina DSP [11] y consta de lo siguiente:

Page 10: anteproyecto

Figura 5. Diagrama de bloques de un sistema DSP [11].

De donde los subsistemas que lo componen son:

PrF: Es un pre-filtro también llamado filtro antiliasing, para evitar el aliasing que es un fenómeno que impide que una señal análoga se discretice correctamente.

ADC: Conversor análogo digital produce una transmisión digital de números binarios en función de señales análogas.

Digital Signal Processor: Es el corazón del DSP como sistema y puede ser un microprocesador de propósito general o especifico según la aplicación, la diferencia generalmente depende de la ALU contenida.

DAC: Realiza la operación Inversa del ADC produce una forma de onda escalonada correspondiente a una secuencia binaria digital, generando una onda continua.

PoF: Este es un post-filtro para suavizar la salida escalonada del DAC a una señal análoga.

4.1.2 Definiciones. Para El trabajo enfocado a imágenes digitales debemos manejar los términos claves en [12] encontramos los términos básicos relacionados que son:

Visión por computadora: Se refiere a la adquisición, procesamiento, identificación y clasificación de patrones que se pueden encontrar en las imágenes digitales.

Pixel: Elemento fundamental sobre el que se construyen las imágenes digitales, a saber cada pixel aporta información de la imagen sobre color intensidad u otro según el formato usado.

Imagen: Se denomina al arreglo bidimensional de pixeles puede ser de diferentes tipos como escalar de grises o RGB según el tipo de procesamiento que se esté usando. Matemáticamente según [12] la imagen se representa por

𝑟 = 𝑓(𝑥, 𝑦) También un sistema de procesamiento se puede dar por una función:

𝑔(𝑥, 𝑦) = 𝑇[𝑓(𝑥, 𝑦)] Color: Se forma generalmente de combinaciones rojo, verde y azul o RGB por sus

siglas en ingles. Según el sistema de procesamiento pueden ser valores de 0-1 o de 0-255, de la combinación de estos salen parámetros como Brillo, Tono, luminosidad.

Histograma: es una representación del número de pixeles en cuanto a su valor presente en una imagen.

Page 11: anteproyecto

4.1.3 Ruido en imágenes El ruido en las imágenes es una característica inherente en las mismas y es por la naturaleza de la cámara o el medio de transmisión de la señal, generalmente son pixeles aislados con valores marcadamente diferentes a los pixeles vecinos. En [12] se encuentra una clasificación básica que según el tipo puede ser:

Gaussiano: Cuando se aprecian pequeñas variaciones en las imágenes, se debe principalmente a diferentes ganancias en la cámara o ruido en los opto sensores. Se considera que el valor ideal del pixel es el mismo más una ganancia variable aleatoria gaussiana.

Impulsional: en otras literaturas lo llaman “sal-pimienta”, en la imagen se aprecia como puntos que son pixeles que toman valores muy altos o bajos con respecto a sus vecinos, sus causas son saturaciones en los sensores o una pérdida de señal en el punto, aunque también en sistemas de cámaras infrarrojas se da por saturación del pixel.

Multiplicativo: Si la imagen en general muestra una deficiencia progresiva, se dice que ocurre cuando hay presente la convolución de 2 señales.

4.1.4 Visión por computadora en Python El procesamiento mediante visión por computadora se ha desarrollado casi siempre sobre plataformas en base a C/C++, y el uso de software de Matlab [13]. Pero aunque Matlab ofrece una plataforma de alto nivel para probar algoritmos y hacer prototipado, pero su desempeño no es comparable con una implementación optimizada de código. Actualmente han emergido soluciones muy competentes en procesamiento y algoritmos de visión artificial sobre Python [14]. 4.1.5 Herramientas sobre python Actualmente se han desarrollado múltiples herramientas sobre código abierto que han sido muy usadas entre ellas se destacan 2 principalmente que son: NumPy/ SciPy y OpenCV en [15] encontramos la información de las herramientas y tenemos:

NumPy: Ofrece un soporte de arreglos de N-dimensiones para Python. La librería es reconocida por ofrecer manipuladores multidimensionales para lenguaje C. Gran cantidad de algoritmos a bajo nivel son basados en este mismo.

SciPy: Contiene librerías y herramientas científicas y matemáticas para Python sobre NumPy. La herramienta incluye rutinas como integración optimización y funciones para procesamiento de imágenes como Matplotlib y IPython.

Pygame: Es un Framework enocado al desarrollo de juegos, provee funciones de tipo graficas y de audio para aplicaciones multimedia, recientemente a añadido un soporte para cámara, se basa en plataformas SDL y trabaja en OSX, Linux, Windows, Nokia S60 y OLPC.

OpenCV: Originalmente nació como una iniciativa de Intel. Se creó como una plataforma de código abierto para visión por computadora, muy usada por su desempeño en tiempo real. La librería se desarrolló sobre código C, y asegura una portabilidad rápida del código y para muchas plataformas de tipo embebido.

Page 12: anteproyecto

4.1.6 Visión por Computadora En muchas aplicaciones de Visión por computadora como la realidad aumentada se tiene procesos similares, un fotograma es adquirido de un video secuencial, pasa por un proceso arbitrario, y luego la imagen es mostrada. Esta secuencia se repite indefinidamente cuando estamos trabajando en tiempo real. En Phyton existen una variedad de herramientas en [15] se resumen a manera de tabla las principales:

Tabla 1. Un pequeño resumen de librerías que pueden ser usadas para CV con Phyton [15].

Es parte del trabajo estudiar algunas de estas opciones, para aplicarlas al proyecto según sea necesario. También puede ser pertinente revisar el Image TollBox de Matlab ® , cuyas funciones, y algoritmos de procesamiento se detallan en la ayuda del mismo programa o en [16] tenemos un gran resumen que puede ser útil, de soluciones que fueron probadas en Matlab ® pero basadas en código abierto. 4.2 Marco Legal 4.2.1 ISO 9001 La norma establece que en el diseño y desarrollo del proyecto en el que estamos involucrando tecnología, se debe estructurar y especificar las etapas y resultados del diseño de un proyecto de tal manera que se sinteticen:

Etapa de diseño y desarrollo.

Revisión verificación y validación del sistema.

Requisitos funcionales y de diseño.

Información proveniente de diseños previos similares.

Proporcionar información apropiada para la compra y/o producción necesaria en el diseño.

Especificación de las características de uso correcto del prototipo. Adicionalmente también [17] muestra que deben validarse y aprobarse los procedimientos llevados a cabo para la realización del proyecto, por lo tanto es necesario aplicar los siguientes parámetros cuando sea pertinente:

Revisión de criterios y aprobación del desempeño.

Aprobación del sistema.

Revalidación.

Page 13: anteproyecto

Asuntos como la mejora y seguimiento de medición y funcionamiento de los prototipos también son incluidos dentro de la norma, sin embargo estos puntos tienen lugar a discusión una vez se ha realizado la puesta en marcha del prototipo, lo cual es posterior a diseño y validación.

5. Objetivos

5.1 General.

Diseño de un sistema de conteo de personas basado en algoritmos de identificación en imágenes continúas digitales.

5.2 Específicos.

Identificar algoritmos de procesamiento continuo de imágenes para conteo de objetos.

Selección e implementación de dos algoritmos de reconocimiento de imágenes

Implementación del algoritmo que se ajuste a las necesidades del proyecto.

Puesta a prueba del prototipo de detección de personas en un ambiente controlado para analizar la precisión del algoritmo implementado.

6 Alternativa de Solución

6.1 Diagrama de bloques de la solución El proyecto en resumen se basa en la extracción de características en imágenes digitales usando la diferencia entre fotogramas, en base a esto se espera evaluar bordes sobre las figuras o evaluar una técnica basada en detección de rostros para evitar los falsos positivos dando mejores resultados, después de hacer la detección se debe hacer un seguimiento sobre el plano, de tal forma que se determine si el sujeto va pasando, a esta técnica se le denomina tracking. En el diagrama de bloques propuesto para el algoritmo tenemos que el sistema toma fotogramas mediante la cámara cada imagen se pasa a formato estándar definido según el algoritmo (RGB, YUY, UYBY) se puede trabajar, en la imagen se debe extraer el fondo para poder hacer la extracción de objetos, posteriormente se debe marcar aquellos objetos que son posibles personas, con las marcas se hace un seguimiento a lo largo de los siguientes fotogramas y si pasa cierto umbral se hace el conteo mas uno.

Page 14: anteproyecto

6.2 Especificaciones Técnicas de la solución propuesta.

Cámara: requerimiento mínimo Logitech Quick Cam V-ubv-49 de línea premiere, puerto USB 2.0, con lente cancelador de ruido tipo C-MOS, resolución verdadera a: 640x480, 320x240, 800X600, 960x720 y 1280x1024. Video continuo a máximo 30 Fotogramas por segundo.

Computador para correr software requerido: Portátil o de escritorio con procesador Intel Core I5 o AMD A10, memoria RAM de 4GB, disco duro con 100GB libres mínimo, puertos USB 2.0.

Software requerido: Matlab R11 minimo versión 2011a. Python 2.7.10 o superior. OpenCV versión 2.1 o superior.

Page 15: anteproyecto

7 Metodología Propuesta

7.1 FASE I: Conceptualización: Se procederá con la investigación en el campo de procesamiento digital de imágenes enfocado al conteo de objetos, buscando dentro de los principales estudios, los algoritmos implementados en cada uno de ellos, que permitan específicamente la detección y conteo de personas. Se documenta en un cuadro comparativo, los ambientes en los que han sido aplicados, las ventajas de cada algoritmo, las debilidades, las oportunidades y los riesgos en la aplicación al proyecto, así como los requerimientos de hardware y software necesarios para ejecución. En base a la investigación se determinara la factibilidad de cada uno de los algoritmos basados en la disponibilidad del hardware y software disponibles para el proyecto y de las características técnicas de la cámara disponible para el desarrollo del mismo. De los resultados del cuadro comparativo y la factibilidad de aplicación, se seleccionan las dos mejores opciones para aplicar al proyecto. 7.2 FASE II: aplicación y selección de algoritmos. Se implementaran los dos algoritmos escogidos sobre el mismo hardware, realizando una serie de pruebas para ambos casos en los que permitan conocer características como tiempos de respuesta, rendimiento, fiabilidad, uso de recursos, precisión y otros que en la medida de ejecución se consideren importantes para la decisión final del algoritmo a implementar. Estas pruebas y sus resultados serán documentados sobre una comparativa entre ambos algoritmos con el fin de generar una base de conocimiento para el grupo de investigación en el campo de reconocimiento y conteo de personas a través del procesamiento de imágenes. 7.3 FASE III: implementación y mejoramiento del sistema. Se analizaran los resultados generados en la fase II del proyecto, identificando la mejor opción entre los algoritmos seleccionados para la implementación al sistema de conteo de personas definido, buscando el mejor ajuste al objetivo general del proyecto con el fin de dar solución a la problemática planteada. En la implementación del algoritmo se debe analizar si cumple en su totalidad con los resultados esperados o se requiere entrar a realizar adiciones o modificaciones para el mejoramiento del sistema, en cuyo caso se documentará, las modificaciones realizadas. 7.4 FASE IV: Prueba de funcionamiento y evaluación. Se realizará la instalación del sistema en un ambiente controlado, para probar su funcionamiento y evaluar la precisión del sistema para el conteo de personas. En este ambiente se solicitara a un grupo de personas transitar por el lugar en diferentes medidas de agrupamiento, iniciando por un número pequeño de individuos transitando al mismo tiempo y se ira aumentando hasta concluir la capacidad del sistema para el reconocimiento de personas, sobre una tasa de efectividad.

Page 16: anteproyecto

8 Cronograma de Actividades.

Mes 1

2

3

4

5 6

Actividad Semanas

1) Adquisición de Cámara y software de trabajo.

2) Documentación para trabajo con Python, Matlab y/o Linux.

3) Revisión si es necesario trabajar en Linux nativo para Python

4) Estudio Image-Toolbox de Matlab ®. Y Open CV

5) Implementación de algoritmos sencillos en imágenes

6) Implementación de seguimiento de objetos Con OpenCV, Matlab y/o Linux

7) Estructuración algoritmo de conteo de personas

8) Puesta a prueba del prototipo de conteo

9) Revisión y mejoras del primer prototipo

10) Segunda puesta a prueba del prototipo

11) Revisión de Portabilidad del código

12) Muestra y documentación del prototipo final

13) Socialización con el grupo de investigación

14) Elaboración de Monografía

9. Impacto Esperado.

El trabajo de análisis de imágenes enfocadas a la solución de problemas de diversos tipos, ha tenido grandes resultados gracias a los desarrollos en el campo de la visión artificial. El proyecto que se estimó como detección de personas tiene gran campo de acción en la detección de objetos que puede ser aplicado en áreas como la robótica. La tesis mostrara un camino de metodologías de apropiación de conocimiento y bases para construcción de novedosas aplicaciones en el campo de la visión artificial impulsados por el grupo de investigación ROMA.

Page 17: anteproyecto

9.1 Impacto Social A nivel académico se espera dejar bases para la comunidad universitaria que desde el campo de la Ingeniería en control, se impulse nuevas investigaciones en la rama de visión artificial. El resultado final del proyecto será usado para determinar aforos en diferentes lugares se espera portar el código para generar soluciones en movilidad en lugares públicos de alta afluencia como las estaciones de transporte público, que precisan tener un dato cuantitativo de afluencia. 9.2 Impacto Económico A nivel económico el proyecto permite realizar un control de seguridad de espacios de uso común para asegurar la continuidad de la infraestructura y seguridad para los usuarios a muy bajo costo en comparación con otras implementaciones como torniquetes o vigilantes. El proyecto a futuro visto como control de afluencia de público tiene un alto potencial de aplicación en marketing, pues permite elaborar estrategias de aceptación e impacto de estrategias de publicidad con alta precisión a buen costo de implementación y resultados exactos.

10. Resultados Esperados

Al finalizar el proyecto se espera entregar una monografía que compila el análisis de algoritmos de reconocimiento de imágenes, junto con el prototipo final con su porcentaje de efectividad de reconocimiento, probado sobre un ambiente controlado. Además se consignaran las anotaciones pertinentes del para que pueda ser portado a otro tipo de plataformas como sistemas embebidos. El concepto principal del proyecto que consiste en el reconocimiento y seguimiento de personas se espera que a futuro en el grupo de investigación se implemente en otro tipo de sistemas como de seguridad o detección para plataformas robóticas móviles.

11 Estrategia de Comunicación

Para divulgar el trabajo realizado y los resultados obtenidos se pretende realizar una sustentación pública. Se planea exponer los algoritmos de detección aplicados en el prototipo, junto con documentación escrita que permitan dejar clara la manera como debe usarse y los trabajos a futuro que se plantean a partir de este. Los detalles del trabajo serán consignados en una monografía, en la cual se especificaran requisitos, análisis, códigos, resultados y conclusiones del proyecto de manera clara.

Page 18: anteproyecto

11. Trayectoria del Grupo ROMA (Robótica Móvil Autónoma).

El grupo orienta sus investigaciones y principales actividades al estudio de la robótica de servicio, y todo lo que implica para el mejoramiento de la sociedad. Dentro del grupo se plantean actividades de investigación, procesos de formación, formulación y ejecución de proyectos de investigación para apropiación social del conocimiento y transferencia de resultados a la sociedad e industria. Dentro del grupo por dirección del ingeniero y docente Miguel Pérez se viene impulsando desde la carrera de Ingeniería en Control de la Universidad Distrital, la línea de visión artificial para solución de diferentes problemáticas sociales. El grupo actualmente cuenta con clasificación B ante Colciencias.

11 PRESUPUESTO

11.1 Fuentes de financiación:

El presupuesto para la realización del presente proyecto será financiado por sus proponentes y por la Universidad Distrital Francisco José de Caldas. Esta última será la que aporte los rubros correspondientes a los gastos generados por concepto de los elementos y equipos de laboratorio prestados para llevar a cabo la experimentación necesaria en la ejecución del proyecto.

PRESUPUESTO GLOBAL DE LA PROPUESTA POR FUENTES DE FINANCIACIÓN

RUBROS

FUENTES

TOTAL Univ. Distrital

1

Recursos propios

2

Especie Dinero Especie Dinero

PERSONAL $616.000 - - - $616.000

EQUIPO - - $1´500.000 - $1´500.000

MATERIALES - - - $130.000 $130.000

SALIDAS DE CAMPO - - - - -

VIAJES - - - - -

BIBLIOGRAFÍA

SOFTWARE - - - - -

PUBLICACIONES

SERVICIOS TÉCNICOS

- - - - -

CONSTRUCCIONES - - - - -

MANTENIMIENTO - - - - -

ADMINISTRACIÓN - - - - -

TOTAL $616.000 - $1´500.000 $130.000 $2´246.000

Tabla 2: Presupuesto global.

Page 19: anteproyecto

11.2 Rubros NO financiables:

La universidad Distrital Francisco José de Caldas financiará rubros como: los seguros, gastos de mantenimiento y trámites de importación de equipos pertenecientes a ella, seguros de vida y de salud de profesores y demás empleados involucrados en la realización del proyecto, impuestos incluyendo retención en la fuente y administración.

11.3 Rubros financiables:

Personal del Proyecto

DESCRIPCIÓN DE LOS GASTOS DE PERSONAL

INVESTIGADOR/AUXILIAR

FORMACIÓN

FUNCIÓN DENTRO

DEL PROYECT

O

DEDICACIÓN

RECURSOS

TOTAL Univ. Distrital

1

Recursos propios

2

Miguel Pérez Pereira

Profesional especializad

o Director 32 $19.250 $616.000

William Alexander Moreno

Estudiante de

Ingeniería

Investigador

160 $11.550 $1.848.000

Andrés García Piragua

Estudiante de

Ingeniería

Investigadora

160 $11.550 $1.848.000

TOTAL: $4´312.000

Tabla 3: Recursos Humanos y Presupuesto

1 Empresa, o institución 2 Contrapartida

Equipo En la tabla 4 se especifica el costo de los equipos que serán utilizados en la realización y ejecución del proyecto. Cabe aclarar que solo se requiere en lo respectivo a los programas la licencia de Matlab ® ya que los programas como Python, OpenCV, Linux y varias librerías de imágenes están desarrolladas en código abierto, por demás se aclara que el PC portátil también ha sido adquirido por los proponentes del proyecto. Si dentro del proyecto se llega a hacer cambios de hardware los costos serán asumidos por los proponentes del proyecto.

Page 20: anteproyecto

DESCRIPCIÓN Y CUANTIFICACIÓN DE LOS EQUIPOS DE USO PROPIO (En miles de $)

EQUIPO Univ.Distrital

1

Recursos propios

2 Total

PC Portátil - $1´500.000 $1´500.000

Instrumentos de medida $ 100.000 - $100.000

Cámara Logitech - $130.000 $130.000

Licencia Matlab R $1’250.000 - $1’250.000

TOTAL $1’350.000 $1.630.000 $2’980.000

Tabla 4: Costo equipos.

Varios

Varios Valor

Papelería $ 50.000

Internet $ 50.000

Telefonía $ 20.000

Total $ 120.000

Tabla 5: Costos varios.

BIBLIOGRAFÍA

[1] M. Oussalah, “Content Based Image Retrieval: Review of the State of Art and Future

Directions”, Image Processing Theory, Tools and Applications, 2008 [2] C. Tsong-Yi, C. Chao-Ho, W. Da-Jinn, K. Yi-Li, “A People counting System Based on

Face-Detection”, Fourth International Conference on Genetic and Evolutionary Computing, 2010

[3] A. Albiol, V. Naranjo, “Real-Time High Density People Counter using Morphological Tools”, Intelligent Transportation Systems, IEEE Transactions on Vol.2, pp.204-218 2001.

[4] C. Thou-Ho, C. Tsong-Yi, C. Zhi-Xian, “An intelligent People-Flow Counting Method for Passing Through a Gate”, Robotics, Automation and Mechatronics, 2006 IEEE Conference on, 2006

[5] H. Aguello. “Sistemas de reconocimiento basados en la imagen facial”, Revista Avances en Sistemas e Informática, pp. 7-16 Vol. 8 No.3, diciembre, 2011

[6] R. Gottumukkal and V.K. Asari, “System level design of real time face recognition

architecture based on composite PCA, ”in 13th ACM Great Lakes Symposium on VLSI,

pp. 157-160, 2003

[7] P. Belhumeur and E. Ortiz “Evaluation of face recognition techniques for application

to facebook ”, in IEEE International Conference on Automatic Face and Gesture

Recognition, pp. 1-6, 2008.

[8] W Feipeng Abaya, Alexander C. Abad, Elmer P. Dadios, "Low Cost Smart Security Camera with Night Vision Capability Using Raspberry Pi and OpenCV," 7th IEEE

Page 21: anteproyecto

International Conference Humanoid, Nanotechnology, Information Technology Communication and Control Nov. 2014

[9] Massimo Camplani and Luis Salgado, “Adaptative Multi-Camera System for Real Time Object detection”, IEEE International Conference on Consumer Electronics (ICCE), 2011

[10] Massion Piccardi, “Background subtraction techniques review”, IEEE International conference on Systems, Man and Cybernetics, 2004.

[11] Vinay K. Ingle, Jhon G. Proakis, “Digital Signal Processing using Matlab® V.4”, Ed. Pws Pub Co , 1996, pp. 2-10.

[12] José J. Esqueda, Luis E. Elizondo, “Fundamentos de procesamiento de imágenes”, Universidad autónoma de Baja California.

[13] Matlab by MathWorks, 2013 disponible en: http://www.mathworks.com/products/matlab/.

[14] A. Fernandez Montoro, “Primeros pasos, ” en Python 3 al descubierto. Ed. RC Libros, 2012, pp. 1-20.

[15] B. Thorne, “Introduction to Computer Vision in Phyton”, University of Canterbury, The Phyton Papers Monograph, Vol1. [en línea]. Disponible en: http://ojs.pythonpapers.org/index.php/tppm.

[16] P. Kovesi, “MATLAB and Octave functions for computer vision and image processing,” School of Computer Science & Software Engineering, The University of Western Australia, 2000. [En línea]. Disponible en: http://www.csse.uwa.edu.au/~pk/research/matlabfns/

[17] ISO, "Sistema de gestión de calidad- Requisitos", Norma Internacional ISO 9001, Ginebra Suiza, Cuarta edición, Nov. 2008.