UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

55
UNIVERSIDAD NACIONAL DE SAN AGUST ´ IN DE AREQUIPA FACULTAD DE INGENIER ´ IA DE PRODUCCI ´ ON Y SERVICIOS ESCUELA PROFESIONAL DE INGENIER ´ IA DE SISTEMAS TITULO PROFESIONAL DE INGENIERO DE SISTEMAS RECONOCIMIENTO DE GRANOS DE CAF ´ E VERDE AR ´ ABIGA SIN DEFECTOS F ´ ISICOS EN MUESTRAS USANDO VISI ´ ON ARTIFICIAL Tesis presentada por el Magister: Juan Ramirez Ticona Asesor: Ing. Pedro Rodr´ ıguez Gonzalez AREQUIPA-PER ´ U 2017

Transcript of UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Page 1: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

UNIVERSIDAD NACIONAL DE SAN AGUSTIN DE AREQUIPAFACULTAD DE INGENIERIA DE PRODUCCION Y SERVICIOS

ESCUELA PROFESIONAL DE INGENIERIA DE SISTEMASTITULO PROFESIONAL DE INGENIERO DE SISTEMAS

RECONOCIMIENTO DE GRANOS DE CAFE VERDE ARABIGA SIN DEFECTOSFISICOS EN MUESTRAS USANDO VISION ARTIFICIAL

Tesis presentada por el Magister:Juan Ramirez Ticona

Asesor: Ing. Pedro Rodrıguez Gonzalez

AREQUIPA-PERU2017

Page 2: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Agradecimientos

Agradezco a Dios, mi familia y a los profesores que me brindaron su apoyo.

Page 3: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Resumen

El reconocimiento de granos de cafe verde arabiga sin defectos fısicos es importante desde elpunto de vista comercial, dado que el cafe de la especie arabiga es un producto de alta de-manda en el mercado internacional. Dicho reconocimiento es propenso a errores, debido a queactualmente es realizado en su mayorıa de forma manual y subjetiva. Los principales trabajosque tratan este problema basados en vision artificial requieren de prototipos de adquisicion,que toman cada imagen desde un angulo completamente vertical con respecto a la superficieque contiene a la muestra de granos de cafe. Cada uno de estos prototipos es un limitantepara labores practicas debido a la dificultad de su implementacion y al angulo restrictivo.Por lo que el objetivo general de este trabajo es proponer un modelo para el reconocimientoautomatico de granos de cafe verde arabiga sin defectos fısicos en imagenes de muestras cap-turadas manualmente con un angulo de toma diagonal usando vision artificial y basandose parael reconocimiento en el estandar de la Specialty Coffee Association of America (SCAA) [1]. Lametodologıa utilizada en este trabajo se divide en: adquisicion de imagenes, mejora de imagenes,segmentacion, extraccion de caracterısticas, clasificacion y comparacion con otros trabajos. Losresultados obtenidos en este trabajo muestran que el reconocedor puede ser utilizado en apli-caciones reales debido a que se alcanzo un overall accuracy del 99.60%.

3

Page 4: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Abstract

The recognition of arabica green coffee beans without physical defects is important from acommercial point of view, since arabica green coffee beans is a product of high demand in theinternational market. Such recognition is error prone because it is now mostly done manuallyand subjective. The main work addressing this problem based on computer vision requireacquisition of prototypes, taking each image from a completely vertical angle to the surfacecontaining the sample of coffee beans. Each of these prototypes is a limiting factor for practicalwork because of the difficulty of implementation and the restrictive angle. Therefore, the generalobjective of this research is to propose a model for the automatic recognition of arabica greencoffee beans without physical defects in images of manually captured samples with a diagonalangle of view with artificial vision and based for the recognition in the standard Specialty CoffeeAssociation of America (SCAA) [1]. The methodology used in this work is divided into: imageacquisition, image improvement, segmentation, extraction of characteristics, classification andcomparison with other works. The results obtained in this work show that the recognizer canbe used in real applications due to a 99.60% overall accuracy.

4

Page 5: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Tabla de Contenidos

1 Planteamiento del problema 101.1 Descripcion de la realidad problematica . . . . . . . . . . . . . . . . . . . . . . . 101.2 Delimitaciones y definicion del problema . . . . . . . . . . . . . . . . . . . . . . 11

1.2.1 Delimitaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.2.2 Definicion del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3 Formulacion del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111.4 Objetivo de la investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.4.1 Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.4.2 Objetivos especıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.5 Hipotesis de la investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121.6 Variables e indicadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.6.1 Variable independiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.6.2 Variable dependiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.7 Viabilidad de la investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.7.1 Viabilidad tecnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.7.2 Viabilidad operativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.7.3 Viabilidad economica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.8 Justificacion e importancia de la investigacion . . . . . . . . . . . . . . . . . . . 141.8.1 Justificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.8.2 Importancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.9 Limitaciones de la investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.10 Tipo y nivel de la investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.10.1 Tipo de investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.10.2 Nivel de investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.11 Metodo y diseno de la investigacion . . . . . . . . . . . . . . . . . . . . . . . . . 161.11.1 Metodo de la investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . 161.11.2 Diseno de la investigacion . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.12 Tecnicas e instrumentos de recoleccion de informacion . . . . . . . . . . . . . . . 161.12.1 Tecnicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.12.2 Instrumentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.13 Cobertura de estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.13.1 Universo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.13.2 Muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.14 Cronograma y presupuesto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171.14.1 Cronograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

5

Page 6: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

1.14.2 Presupuesto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181.15 Estructura del documento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2 Estado del arte 192.1 Consideraciones iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.2 Fundamento teorico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.2.1 Granos de cafe verde arabiga . . . . . . . . . . . . . . . . . . . . . . . . . 192.2.2 Espacio de color RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.2.3 Constancia del color . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.2.4 Vision artificial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.2.5 Descripcion general de los trabajos que usan vision artificial para el re-

conocimiento de granos de cafe verde arabiga sin defectos fısicos . . . . . 212.2.6 White patch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.2.7 Metodo de Otsu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.2.8 Maquinas de vectores de soporte . . . . . . . . . . . . . . . . . . . . . . . 25

2.3 Clasificacion de trabajos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282.3.1 Breve Descripcion de los Trabajos y sus Logros . . . . . . . . . . . . . . 282.3.2 Metodos de segmentacion . . . . . . . . . . . . . . . . . . . . . . . . . . 292.3.3 Metodos de Extraccion de Caracterısticas . . . . . . . . . . . . . . . . . . 292.3.4 Metodos de clasificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.4 Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3 Modelo para el reconocimiento automatico de granos de cafe verde arabigasin defectos fısicos 323.1 Consideraciones iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.2 Muestras de cafe verde arabiga . . . . . . . . . . . . . . . . . . . . . . . . . . . 343.3 Adquisicion de imagenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363.4 Mejora de imagenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393.5 Segmentacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393.6 Extraccion de caracterısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.7 Clasificacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.7.1 Seleccion de los parametros y validacion del clasificador . . . . . . . . . . 423.8 Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4 Resultados y discusion 454.1 Consideraciones iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.2 Segmentacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.3 Seleccion de parametros y validacion . . . . . . . . . . . . . . . . . . . . . . . . 464.4 Comparacion con otros trabajos . . . . . . . . . . . . . . . . . . . . . . . . . . . 464.5 Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

5 Conclusiones y trabajos futuros 505.1 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 505.2 Trabajos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

6 Trabajos publicados 52

6

Page 7: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Bibliografıa 52

7

Page 8: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Indice de Tablas

1.1 Cantidad de granos de cafe verde arabiga por clase . . . . . . . . . . . . . . . . 17

4.1 Cantidad de Imagenes de Granos de Cafe Verde Arabiga por Clase . . . . . . . . 464.2 Overall accuracy para cada tamano de datos por clase y proporcion de prueba . 474.3 Matriz de confusion de la propuesta . . . . . . . . . . . . . . . . . . . . . . . . . 474.4 Comparacion de algoritmos de constancia de color y extractores de caracterısticas 48

8

Page 9: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Indice de Figuras

1.1 Prototipo de adquisicion tıpico de los trabajos que tratan el reconocimiento degranos de cafe verde arabiga sin defectos fısicos [2]. . . . . . . . . . . . . . . . . 12

2.1 Granos de cafe verde arabiga. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.2 Espacio de color RGB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.3 Las etapas tıpicas de los trabajos que usan vision artificial para el reconocimiento

de granos de cafe verde arabiga sin defectos fısicos. . . . . . . . . . . . . . . . . 22

3.1 Esquema del modelo para el reconocimiento automatico de granos de cafe verdearabiga sin defectos fısicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.2 Los doce defectos fısicos de granos de cafe verde arabiga . . . . . . . . . . . . . 353.3 Imagenes de granos de cafe verde arabiga sin defectos fısicos. . . . . . . . . . . . 363.4 Prototipo de adquisicion de imagenes utilizado en este trabajo para capturar las

muestras de granos de cafe verde arabiga. . . . . . . . . . . . . . . . . . . . . . . 373.5 Ejemplo del angulo de toma diagonal para capturar muestras de granos de cafe

verde arabiga. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383.6 Imagen de muestra de granos de cafe verde arabiga antes y despues de aplicar el

algoritmo de constancia del color WP. . . . . . . . . . . . . . . . . . . . . . . . . 383.7 Pasos en el proceso de segmentacion. . . . . . . . . . . . . . . . . . . . . . . . . 403.8 Histogramas de intensidad por cada canal de color de un grano de cafe verde

arabiga. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.1 Los tres casos de error en la segmentacion de granos de cafe. . . . . . . . . . . . 464.2 Overall accuracy para cada tamano de datos por clase y proporcion de prueba

que varia del 10%-50%. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

9

Page 10: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Capıtulo 1

Planteamiento del problema

1.1 Descripcion de la realidad problematica

Debido al actual gran incremento de la produccion del cafe en el Peru [3] y al reducido pago porproductos con defectos fısicos por parte de las cooperativas cafetaleras hacia los agricultores,existe la necesidad de crear soluciones computacionales que apoyen a los agricultores en elreconocimiento de granos de cafe verde arabiga sin defectos fısicos, ya que esto en su mayorıaes realizado manualmente por ellos, quienes presentan las siguientes desventajas mostradas acontinuacion:

• Sus capacidades de percepcion varıan dıa a dıa, lo que quiere decir que no van a tener sussentidos la misma capacidad todo el tiempo, como por ejemplo la vista con el pasar deltiempo va a sentir cansancio visual debido a las largas horas que dura el reconocimiento.• Sus juicios pueden variar bajo la influencia de factores externos, uno de esos factores por

ejemplo puede ser la iluminacion ambiente, la que puede variar el color de los granos decafe y hacer confundir al agricultor al tratar de reconocer el defecto.• No estan libres de prejuicios, dado que los agricultores se dejan llevar por su experiencia

y solo al ver una parte del grano de cafe ya dan por hecho que posee un defecto enparticular, lo cual a veces da un error.• No tienen la misma habilidad que un experto, dado que al ser agricultores de granos de

cafe tienen mayor experiencia en el cultivo, dado que la mayor parte de su tiempo ladedican a esa actividad, por lo que presentan una mayor inexperiencia que un experto loque causa errores en el reconocimiento de defectos en el cafe.

Ademas dicho reconocimiento es repetitivo lo que causa fatiga dado que el tiempo requeridopara esto va desde los segundos a minutos.

10

Page 11: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

1.2 Delimitaciones y definicion del problema

1.2.1 Delimitaciones

Debido a los problemas que trae el reconocimiento manual de granos de cafe verde arabigasin defectos fısicos, se genero la necesidad de desarrollar soluciones computacionales basadas envision artificial. La vision artificial es utilizada para el reconocimiento de objetos a traves dela extraccion de informacion cuantitativa de imagenes digitales con el objetivo de proporcionarinformacion objetiva y de forma rapida [4]. Debido a esto, en los ultimos anos en la literaturahan aparecido trabajos que recomiendan su uso en reemplazo de humanos expertos, para lastareas de reconocimiento de granos de arroz [5], semillas de soja [6], granos de trigo [7–9], granosde cafe [2, 10–15], granos de maız [16, 17], semillas de colza [18] y semillas de ricino [19]. Portanto la delimitacion del trabajo es el campo de la vision artificial aplicada al reconocimientode granos de cafe verde arabiga sin defectos fısicos.

1.2.2 Definicion del problema

Los trabajos que tratan el reconocimiento de granos de cafe verde arabiga sin defectos fısicosusando vision artificial en la literatura presentan algunos problemas que son mencionados acontinuacion:

• No estan basados en un estandar de clasificacion [10].• Presentan errores en el reconocimiento [2, 10, 11,13,14]• Presentan problemas al segmentar los granos de cafe del fondo [13,14]

Ademas cada prototipo de estos trabajos requiere del uso de una camara con soporte quetoma cada imagen desde un angulo completamente vertical con respecto a la superficie quecontiene a la muestra de granos de cafe verde arabiga como se muestra en la Figura 1.1. Estacaracterıstica de los prototipos realmente es una problema dado que si el angulo de toma poralguna situacion externa se modificara no se sabrıa si funcionarıa de la misma forma por faltade pruebas.

1.3 Formulacion del problema

El problema en este trabajo es realizar el reconocimiento de granos de cafe verde arabiga sindefectos fısicos usando vision artificial con las siguientes consideraciones:

• El reconocimiento debera estar basada en un estandar internacional.• Reconocer sin error.• Segmentar sin error los granos de cafe en la muestra.

11

Page 12: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Figura 1.1: Prototipo de adquisicion tıpico de los trabajos que tratan el reconocimiento degranos de cafe verde arabiga sin defectos fısicos [2].

• Permitir la captura de imagenes con angulo diagonal.• El prototipo de adquisicion de imagenes debe ser de facil implementacion.

1.4 Objetivo de la investigacion

1.4.1 Objetivo general

El objetivo general es proponer un modelo para el reconocimiento automatico de granos decafe verde arabiga sin defectos fısicos en imagenes de muestras capturadas manualmente conun angulo de toma diagonal usando vision artificial y basandose para el reconocimiento en elestandar de la SCAA.

1.4.2 Objetivos especıficos

• Construir un prototipo de adquisicion de imagenes de facil implementacion.• Adquirir imagenes digitales de muestras de granos de cafe verde arabiga.• Uniformizar la iluminacion de una imagen digital.• Reconocer granos individuales en una imagen digital de muestra.• Extraer caracterısticas de color de cada grano de cafe verde arabiga.• Validar el modelo de clasificacion.

1.5 Hipotesis de la investigacion

El modelo para el reconocimiento automatico de granos de cafe verde arabiga sin defectosfısicos en imagenes de muestras capturadas manualmente con un angulo de toma diagonalusando vision artificial y basandose para el reconocimiento en el estandar de la SCAA, permitira

12

Page 13: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

reconocer granos de cafe verde arabiga sin defectos fısicos en imagenes tomadas con un angulode toma diagonal.

1.6 Variables e indicadores

1.6.1 Variable independiente

La variable independiente en este trabajo es el grano de cafe verde arabiga, dado que estavariable independiente una vez ingresada al modelo cambiara a la variable dependiente que esla salida del modelo, dependiendo si este grano presenta defecto fısico o no.

Indicadores

El indicador es la intensidad de cada pıxel del grano de cafe verde arabiga en cada uno de loscanales del espacio de color RGB.

Indices

El ındice es las intensidades de cada canal de color del espacio RGB de cada pıxel del granode cafe verde arabiga que varıa entre los valores enteros de 0 a 255.

1.6.2 Variable dependiente

La variable dependiente en este trabajo es el resultado del reconocimiento, dado que la variableindependiente aplicada al modelo permite obtener el resultado en el reconocimiento automaticode granos de cafe verde arabiga sin defectos fısicos.

Indicadores

El indicador es el overall accuracy la cual es una medida ampliamente utilizada en clasificadorespara validar el modelo, es decir medir la confianza en los resultados.

13

Page 14: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Indices

El ındice es el overall accuracy dado que solo se usa un indicador, ademas el overall accuracyse mide en una escala del 0% al 100%.

1.7 Viabilidad de la investigacion

1.7.1 Viabilidad tecnica

Para la realizacion de esta investigacion se cuenta con el software y hardware necesario, ademasde las muestras de granos de cafe verde arabiga. Ademas se cuenta con los conocimientosnecesarios en vision artificial y programacion en C++ para desarrollar este proyecto.

1.7.2 Viabilidad operativa

Debido a que esta investigacion usara elementos de facil acceso para la implementacion delprototipo de adquisicion de imagenes y el modelo sera muy intuitivo debido a que reconocerasi el grano de cafe verde arabiga no presenta defectos fısicos, esto hara que sea de facil uso yque no haya problemas al usarlo.

1.7.3 Viabilidad economica

Debido a que esta investigacion sera realizada por una persona que cuenta con los conocimien-tos, software y hardware necesarios, esta investigacion tendra un costo bajo el cual es detalladoen la Subseccion 1.14.2 por lo que el beneficio sera muy alto de venderse esta investigacion.

1.8 Justificacion e importancia de la investigacion

1.8.1 Justificacion

• Esta investigacion proporcionara un modelo para el reconocimiento automatico de granosde cafe verde arabiga sin defectos fısicos de facil acceso y uso para los agricultores debidoa la facilidad de su implementacion y de no requerir de un angulo de toma restrictivo.• Proporcionara una manera rapida y precisa de reconocer los granos de cafe verde arabiga

sin defectos fısicos y ası hacer que los agricultores aumenten sus ingresos ya que obtendran

14

Page 15: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

un producto de mayor calidad al no haber casi defectos fısicos en sus costales de cafe quevenden a las cooperativas.

1.8.2 Importancia

• Se aportara un prototipo de facil implementacion para la adquisicion de imagenes alestado del arte actual.• Debido a que no usara un angulo restrictivo como todos los prototipos en la literatura,

sera practico para las labores de reconocimiento al brindar una mayor libertad al tomarlas fotos.• Debido a que las imagenes luego de un procesamiento simularan haber sido adquiridas

con iluminacion uniforme, no se necesitara de un sistema de iluminacion especializado.

1.9 Limitaciones de la investigacion

La limitacion en este proyecto seran las muestras de granos de cafe verde arabiga que presentandefectos fısicos debido a que al existir una cantidad de defectos fısicos diferentes consideradospor distintos estandares, se limitara a 12 de los 16 defectos fısicos considerados por la SCAA,debido a que la SCAA es reconocida a nivel mundial. Los 12 defectos fısicos considerados sonlos siguientes: brocado leve, brocado severo, cereza seca, concha, dano por hongos, flotador,inmaduro, agrio parcial, negro, negro parcial, pergamino y partido/mordido/cortado. Ademasotra limitacion sera que que solo se podra adquirir informacion de una de las caras del granode cafe verde arabiga debido a que seran colocadas en una plataforma.

1.10 Tipo y nivel de la investigacion

1.10.1 Tipo de investigacion

Es del tipo de investigacion aplicada debido a que se pretende resolver un problema practico elcual es reconocer automaticamente granos de cafe verde arabiga sin defectos fısicos para apoyara los agricultores en esta labor debido a que lo realizan de forma manual.

1.10.2 Nivel de investigacion

Esta investigacion es del nivel de estudio aplicativo porque se busca aplicar los conocimientosadquiridos en vision artificial para resolver problemas de reconocimiento de granos de cafe verdearabiga sin defectos fısicos.

15

Page 16: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

1.11 Metodo y diseno de la investigacion

1.11.1 Metodo de la investigacion

El metodo en esta investigacion es el metodo inductivo dado que se analizan casos particularesde muestras de granos de cafe verde arabiga, cuyos resultados al utilizar el modelo son tomadospara extraer conclusiones de caracter general. A partir de las observaciones sistematicas delreconocimiento automatico de granos de cafe verde arabiga se descubre la generalizacion de eseresultado.

1.11.2 Diseno de la investigacion

El diseno de la investigacion es experimental o de laboratorio debido a que se presentaron lassiguientes etapas:

• Presencia de un problema para el cual sea realizada una revision bibliografica.• Identificacion y definicion del problema.• Definicion de hipotesis, variables, indicadores e ındices.• Diseno del plan experimental.• Prueba de confiabilidad de los datos.• Realizacion del experimento.• Tratamiento de datos.

1.12 Tecnicas e instrumentos de recoleccion de infor-

macion

1.12.1 Tecnicas

La tecnica de recoleccion de informacion en este trabajo es:

• Histogramas de intensidad.

1.12.2 Instrumentos

El instrumento de recoleccion de informacion en esta investigacion es:

• Una camara de celular.

16

Page 17: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Tabla 1.1: Cantidad de granos de cafe verde arabiga por clase

Clase Cantidad

Defecto fısico 420

Sin defecto fısico 420

1.13 Cobertura de estudio

1.13.1 Universo

Todos los granos de cafe verde arabiga del mundo serıa el universo o poblacion en este trabajodado que se trata de reconocer que granos de cafe verde arabiga no presentan defectos fısicos.

1.13.2 Muestra

Debido a que no se puede contar con toda la poblacion de granos de cafe verde arabiga delmundo se opto por contar con una cantidad de granos de cafe verde arabiga distribuida comose muestra en la Tabla 1.1, la cual fue proporcionada por la Central de Cooperativas AgrariasCafetaleras de los Valles de Sandia (CECOVASA), Peru.

1.14 Cronograma y presupuesto

1.14.1 Cronograma

Actividades / Mes (1:Diciembre,12:Noviembre)(X = actividad por realizar, O = actividad realizada)

Actividad/Mes 1 2 3 4 5 6 7 8 9 10 11 12

Revision bibliografica O O O O O O O O O O O OAdquirir imagenes de cafe O O O O O O O O OUniformizar iluminacion O O OReconocer cafe O O OExtraer caracterısticas O O O O O O O OValidar el modelo O O O O O O O ORedactar articulo O ORedactar tesis O O O OCorrecciones y conclusiones O O O

17

Page 18: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

1.14.2 Presupuesto

Concepto Valor

Pago investigador S/. 9600Laptop S/. 2500Camara de celular S/. 900Mesa S/. 100Soportes cartulina S/. 20Foco fluorescente S/. 15Cartulina color turquesa S/. 5Total S/. 13140

1.15 Estructura del documento

En el Capıtulo 2 se presenta el estado del arte, en el Capıtulo 3 se presenta el modelo para elreconocimiento automatico de granos de cafe verde arabiga sin defectos fısicos, en el Capıtulo4 se muestran los resultados obtenidos y una breve descripcion de cada uno, en el Capıtulo 5 semuestran las conclusiones y trabajos futuros, y finalmente en el Capıtulo 6 se ven los trabajospublicados frutos de este trabajo.

18

Page 19: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Capıtulo 2

Estado del arte

2.1 Consideraciones iniciales

En esta seccion se muestra el fundamento teorico y los trabajos que realizan el reconocimientode granos de cafe verde arabiga sin defectos fısicos. El fundamento teorico para entender estetrabajo se muestra, explicando sobre lo siguiente: los granos de cafe verde arabiga, el espaciode color RGB, constancia del color, vision artificial y la descripcion general de los trabajosque usan vision artificial para el reconocimiento de granos de cafe verde arabiga sin defectosfısicos. Los trabajos que tratan dicho reconocimiento usando vision artificial en la literaturason clasificados segun los metodos de segmentacion, extraccion de caracterısticas y clasificacion.

2.2 Fundamento teorico

2.2.1 Granos de cafe verde arabiga

Los granos de cafe verde son las semillas de los frutos de la planta del cafe antes de ser tostadas.La principal especie comercial de granos de cafe verde es el arabiga [20]. En la Figura 2.1 esmostrado los granos de cafe verde arabiga.

2.2.2 Espacio de color RGB

El espacio de color RGB trata los colores de la misma forma como el ojo humano los capta [2].Los colores estan representados por los canales R, G y B, que definen respectivamente lasintensidades con que los colores primarios rojo, amarillo y azul estan presentes. Por lo tanto, esun modelo aditivo, ya que el color esta representado por la suma de los valores de sus canales.

19

Page 20: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Figura 2.1: Granos de cafe verde arabiga.

Este espacio de color puede ser representado por un cubo donde cada uno de los canales que vande 0 a 255 (de 0-1 en algunas representaciones). El espacio de color RGB es importante porquees uno de los principales espacios de color utilizados en el proceso de captura de imagenes de lascamaras digitales, y por lo tanto la gran mayorıa de las imagenes se almacenan utilizandolo [2].En la Figura 2.2 se ve la representacion grafica del espacio de color RGB.

Figura 2.2: Espacio de color RGB.

2.2.3 Constancia del color

La constancia del color es el fenomeno por el cual la percepcion del color del objeto tiende apermanecer constante bajo cambios en la iluminacion [21]. La constancia del color no es unapropiedad de los objetos, es en realidad un fenomeno de percepcion, el cual es el resultado demecanismos en el ojo y el cerebro [22]. El procedimiento de calculo de la constancia de color

20

Page 21: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

incluye dos etapas: la estimacion de parametros de iluminacion y el uso de estos parametros paraobtener el color de los objetos bajo una fuente de luz blanca [23]. El primer paso, la estimacionde la iluminacion, es importante en el calculo de la constancia de color [23]. Hasta ahora, sehan propuesto una serie de algoritmos de constancia de color principales que se centran en laestimacion de la iluminacion [23]. Estos algoritmos intentan simular la habilidad de constanciade color, mediante la transformacion de una imagen de entrada capturada bajo condicionesde iluminacion no controladas en otra imagen aparentemente obtenida bajo condiciones deiluminacion controladas [24].

2.2.4 Vision artificial

La vision artificial es una nueva tecnologıa basada en procesamiento y analisis de imagenes, esutilizada para el reconocimiento de objetos a traves de la extraccion de informacion cuantitativade imagenes digitales, con el objetivo de proporcionar informacion objetiva y de forma rapida.La vision artificial realiza esta tarea sin contacto con los objetos por lo que es no destructiva,sin embargo con los actuales avances en el procesamiento de imagenes y el aumento de lascapacidades computacionales, la aplicacion de la vision artificial se ha extendido a la evaluacionde la calidad de los alimentos [2, 5–19].

2.2.5 Descripcion general de los trabajos que usan vision artificialpara el reconocimiento de granos de cafe verde arabiga sindefectos fısicos

Los trabajos que usan vision artificial para el reconocimiento de granos de cafe verde arabiga sindefectos fısicos utilizan las siguientes etapas tıpicas como se ven en la Figura 2.3, las cuales son:adquisicion de imagenes, segmentacion, extraccion de caracterısticas y clasificacion. Algunasde las principales cuestiones relacionadas con cada etapa se analizan a continuacion.

Adquisicion de imagenes

La primera etapa en cualquier modelo de vision artificial para el reconocimiento de granos decafe verde arabiga sin defectos fısicos, es un metodo de obtencion de imagenes digitales. Losprincipales factores que intervienen en esta etapa incluyen: el dispositivo de adquisicion deimagenes, la fuente de iluminacion y el fondo.

Segmentacion

La segmentacion es un metodo que permite dividir una imagen en regiones que faciliten re-conocer los objetos de interes en la misma que son los granos de cafe verde arabiga, lo cual es

21

Page 22: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Figura 2.3: Las etapas tıpicas de los trabajos que usan vision artificial para el reconocimientode granos de cafe verde arabiga sin defectos fısicos.

una tarea difıcil debido a la riqueza de la informacion visual en la imagen.

Extraccion de caracterısticas

En vision artificial las caracterısticas son abstracciones de la informacion en la imagen. Carac-terısticas extraıdas de una imagen digital pueden incluir informacion relacionada con el color,la textura y la forma, de granos de cafe verde arabiga.

Clasificacion

En aprendizaje automatico, el proceso de clasificacion se refiere a un proceso algorıtmico paraasignar un punto de datos a uno, de un conjunto de clases. El punto de datos, tambien de-nominado una instancia o un ejemplo, consiste en un vector de caracterısticas que en conjuntopresenta toda la informacion, que el clasificador tiene sobre los granos de cafe verde arabiga.La clasificacion en aprendizaje automatico suele ser un proceso supervisado, dado que el clasi-ficador es primero entrenado con una seleccion de puntos de datos que un ser humano le haproporcionado con los resultados correctos. El clasificador puede entonces deducir relacionesentre los resultados previstos y las caracterısticas de los puntos de datos, entonces sera capazde proporcionar una decision de clasificacion ante un nuevo punto de datos.

22

Page 23: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

2.2.6 White patch

La relacion de la intensidad del color bajo una fuente de luz en una imagen viene dada por:

fi(x, y) = G(x, y)Ri(x, y)Ii (2.1)

Donde fi(x, y) es la intensidad de un pıxel en la posicion (x, y), G(x, y) es un factor degeometrıa, Ri(x, y) es la reflectancia del objeto, Ii es el iluminante, e i corresponde al canal decolor. Una vez que se aplica White Patch (WP) [25] sobre una imagen f se obtiene la imagende salida s la cual es definida en:

si(x, y) = G(x, y)Ri(x, y)I ′i (2.2)

En donde el iluminante de salida I ′ = {1, 1, 1}, dado que WP considera que el iluminante desalida es una fuente de luz blanca [26]. Por lo tanto, la relacion entre la salida y la entrada es:

si(x, y) = G(x, y)Ri(x, y) =fi(x, y)

Ii(2.3)

WP tiene en cuenta el valor mas alto en cada canal de color como la representacion del blancopara la imagen. Computacionalmente, dichos valores se encuentran a partir de la intensidadmaxima en cada canal como se ve en:

Ii = max{fi(x, y)} (2.4)

Luego, todas las intensidades de los pıxeles son escaladas de acuerdo con el iluminante calcu-lado utilizando (2.3).

2.2.7 Metodo de Otsu

El metodo de binarizacion mundial mas conocido fue propuesto por [27]. El metodo de Otsufunciona mejor cuando: existe una clara separacion entre el primer plano (los granos de cafe)y el fondo, y la iluminacion es uniforme. Desafortunadamente, las imagenes de la vida real noson todas uniformes, por lo que para ayudar al metodo de Otsu se uso constancia del color.

El metodo de Otsu se basa en tomar dos clases de conjuntos de pıxeles en niveles de gris loscuales son C0(t) (granos de cafe) y C1(t) (fondo), que son definidos por un umbral t el cual esla variable a buscar, y las dos clases son el resultado deseado de la segmentacion. C0(t) denotapıxeles con nivel de gris entre [0, ..., t] y C1(t) denota pıxeles con nivel de gris entre [t+1, ..., G],

23

Page 24: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

donde G es el nivel de gris maximo. Por lo tanto la probabilidad de ocurrencia de las dos clasesse representa a continuacion:

CO(t) : P0(t) =t∑

g=0

p(g) (2.5)

C1(t) : P1(t) =G∑

g=t+1

p(g) (2.6)

Donde p(g) es la probabilidad de ocurrencia del valor de gris g comprendido entre 0 ≤ g ≤ G.Luego se halla la varianza en cada una de las dos clases como se ve en:

σ20(t) =

t∑g=0

(g − g0)2p(g) (2.7)

σ21(t) =

G∑g=t+1

(g − g1)2p(g) (2.8)

Donde g es la media aritmetica de los valores de gris de todos los pıxeles de la imagen, y g0, g1los valores medios de cada clase. El objetivo del metodo de Otsu es mantener la varianza entrelas clases lo mas grande posible mediante (2.9) y que la varianza dentro de cada clase sea lomas pequena posible mediante (2.10).

σ2vec(t) = P0(t).(g0 − g)2 + P1(t).(g1 − g)2 (2.9)

σ2vdc(t) = P0(t).σ

20(t) + P1(t).σ

21(t) (2.10)

Obteniendose (2.11) con (2.9) y (2.10), en la cual el valor t se escoge de manera que elcociente Q(t) sea maximo. De esta manera se elige un valor umbral que optimice las dos clasesen terminos de varianza.

Q(t) =σ2vec(t)

σ2vdc(t)

(2.11)

24

Page 25: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

2.2.8 Maquinas de vectores de soporte

Las maquinas de vectores de soporte (Support Vector Machines, SVMs) fueron introducidas por[28]. SVMs tienen fuertes fundamentos teoricos y han demostrado excelentes exitos empıricosen tareas de clasificacion, como la clasificacion de cafe verde arabiga [13,14]. SVMs separan losdatos en diferentes clases por un hiperplano o hiperplanos ya que tiene la capacidad de manejardatos multidimensionales. SVMs minimizan el error de clasificacion empırica y maximizan elmargen. Son tambien conocidas como clasificadores de margen maximo.

Suponemos que tenemos m puntos de datos de entrenamiento {(x1, y1) , ..., (xm, ym)}, dondexi ∈ Rn y yi ∈ {−1,+1}. La ecuacion del hiperplano solucion en n dimensiones se convierteen:

wT · xi + b = 0 (2.12)

donde w ∈ Rn es el vector de pesos, b ∈ R es un coeficiente de interseccion, y xi es unvector de entrada. Este hiperplano solucion se obtiene como el hiperplano medio entre otrosdos hiperplanos h+ y h− que son los que contienen los vectores de soporte de ambas clasesrespectivamente, estos dos hiperplanos se definen por:

h+ → wTxi + b = +1 (2.13)

h− → wTxi + b = −1 (2.14)

Siendo +1 para los puntos de datos positivos y −1 para los puntos de datos negativos. Deesta forma la condicion de clasificacion expresada en (2.15) va implicar que cuando se aplicalos parametros w, b del hiperplano a los puntos de datos positivos va a resultar en un valormayor o igual a +1 como es mostrado en (2.16), mientras que cuando se aplica a las muestrasnegativas va a dar como resultado un valor menor o igual a −1 como es mostrado en (2.17).

yi(wTxi + b) ≥ 1 (2.15)

wTxi + b ≥ +1 (2.16)

wTxi + b ≤ −1 (2.17)

Ecuaciones (2.16) y (2.17) pueden expresarse conjuntamente introduciendo una variable yique corresponde a la etiqueta de cada un de los puntos de datos, siendo +1 para las muestras

25

Page 26: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

positivas y −1 para las muestras negativas, de esta forma la condicion de clasificacion implicaque todas las muestras clasificadas correctamente tienen que estar situadas en la region delespacio de caracterısticas situada mas alla del margen. El margen por su lado correspondea una region que se puede calcular a partir de la distancia de los dos hiperplanos h+ y h− alhiperplano solucion h, como se muestra en:

margen = d+ + d− = 21

||w||(2.18)

Donde d+ y d− son las distancias de h+ y h− a h respectivamente, y ambas distancias sonrepresentadas por:

d+ = d− =|wxi + b|||w||

=1

||w||(2.19)

Se observa entonces que el margen depende unicamente de los parametros de W del hiperplanoh. Resulta util comprobar que maximizar el margen puede ser equivalente a minimizar elproblema inverso que se representa en (2.20) que va depender unicamente de (2.21) que no esmas que un producto escalar.

Minimizarw,b

Φ(w) =1

2||w||2 (2.20)

||w||2 = wTw (2.21)

En cuanto a la minimizacion, si esta sujeta a la condicion de clasificacion de (2.18), secomprueba que se transformo el problema de clasificacion en un problema de optimizacioncuadratica estandar que por lo tanto puede ser resuelto de manera estandar. El objetivo delSVM es obtener los valores w y b que nos van a dar la solucion de (2.12) para ello se planteael problema como (2.20) sujeto a (2.15). La resolucion de este problema se puede plantearanadiendo una funcion auxiliar que se denomina el lagrangiano que es representado por:

L(x, α) = f(x) +∑i

αgi(x) ∀αi ≥ 0 (2.22)

Donde f(x) es la funcion a optimizar que en este caso es la funcion Φ(w) mas gi(x) que es lasrestricciones a la que esta sujeto el problema que en este caso es la condicion de clasificacion yestas restricciones se multiplican por unos factores de α que se denominan los multiplicadoresde Lagrange. De esta forma la solucion al problema de optimizacion se obtiene como la mini-mizacion del lagrangiano respecto a las variables de la funcion a optimizar, en este caso w y b,

26

Page 27: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

posteriormente se maximiza con respecto a los multiplicadores de Lagrange, todo este procesose muestra en:

maxα

(minw,b

(L(w, b, α))) (2.23)

En este caso, el lagrangiano combinando la funcion a optimizar y las restricciones multiplicadaspor los multiplicadores de Lagrange dan:

L(w, b, αi) =1

2wTw −

∑i

αi[yi(wTxi + b)− 1] (2.24)

La minimizacion de esa expresion implica realizar las derivadas parciales respecto a w y re-specto a b igualando ambas a cero como se muestra a continuacion:

dL

dw= w −

∑i

αiyixi = 0⇒ W =∑i

αiyixi (2.25)

dL

db= −

∑i

αiyi = 0⇒∑i

αiyi = 0 αi ≥ 0 (2.26)

Bajo condiciones de convexidad vamos a poder incluir la solucion de (2.25) en la formuladel lagrangiano y con un poco de desarrollo matematico se encontrara el nuevo lagrangianosiguiente:

L(w, b, αi) = −1

2

∑i

∑j

αiαjyiyjxTi xj +

∑i

αi (2.27)

De esta forma se obtendra una nueva funcion Θ cuya maximizacion se representa en (2.28)y que sujeta a la condicion que se ha obtenido de (2.26) va a dar la solucion final del SVM yademas es un nuevo problema de optimizacion que es lo que se denomina SVM dual.

Maximizarα

Θ(α) =1

2

∑i

∑j

αiαjyiyjxTi xj +

∑i

αi (2.28)

Entonces a partir de la formulacion original a la que se le denomina SVM primal que es (2.23)obtenemos un nuevo problema de optimizacion cuya solucion es la solucion del SVM y que sedenomina SVM dual.

27

Page 28: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

2.3 Clasificacion de trabajos

Los trabajos que tratan el reconocimiento automatico de granos de cafe verde sin defectosfısicos son clasificados por sus metodos de segmentacion, extraccion de caracterısticas y clasi-ficacion para ver la diferencia con la propuesta de este trabajo. Pero antes se da una brevedescripcion de cada uno y lo que lograron en el reconocimiento de granos de cafe verde sindefectos fısicos.

2.3.1 Breve Descripcion de los Trabajos y sus Logros

En [10] proponen clasificar granos de cafe verde usando caracterısticas de color, forma ytamano. Realizaron la adquisicion de imagenes en condiciones de iluminacion controladas.Este trabajo es uno de los primeros en tratar de clasificar defectos de granos de cafe verde.

En [11] clasifican granos de cafe verde en cuatro clases nombradas A, B, C y RJ, donde las tresprimeras clases representan a los granos de cafe verde sin defectos y la ultima clase representaa los granos de cafe verde defectuosos. Para la adquisicion de imagenes utilizan un prototipobasado principalmente en la utilizacion de dos camaras CMOS, para capturar la parte superiore inferior de la muestra.

En [12] proponen la determinacion de la calidad del grano de cafe basado en procesamiento deimagenes y redes neuronales artificiales. Clasifican muestras de cafe como un todo, en lugar dela clasificacion de los granos componentes de forma individual. Para la adquisicion de imagenesutilizaron una caja negra con iluminacion uniforme en la cual se coloca la muestra de granosde cafe la cual es capturada por la camara. Presentan problemas en la clasificacion.

En [2] propone un metodo para clasificacion de granos de cafe en imagenes digitales a travesdel uso de atributos seleccionados de morfologıa, color y textura basado en procesamiento deimagenes y redes neuronales artificiales. Aun presenta problemas en la clasificacion dado quepresenta errores.

En [13] proponen la clasificacion automatica de defectos fısicos de granos de cafe verde arabigausando procesamiento de imagenes y Support Vector Machines (SVM). Para la obtencion deimagenes de granos de cafe elaboraron un prototipo de adquisicion de imagenes con luz contro-lada que mantiene una distancia fija entre la camara y la muestra de granos de cafe. Presentanproblemas en la segmentacion de granos de cafe verde arabiga y en la clasificacion.

En [14] proponen un enfoque para mejorar el reconocimiento de defectos de granos de cafeverde arabiga usando algoritmos retinex. Para la adquisicion de imagenes utilizaron un entornocon iluminacion controlada usando focos fluorescentes a una distancia fija de la escena tratandode capturar la mayor cantidad de granos dispuestos horizontalmente en una superficie plana sinbrillo y adecuada para la recepcion de cada grano de cafe. Las imagenes fueron obtenidas conuna camara digital de doce mega pıxeles. Presentan problemas en la segmentacion de granosde cafe y en la clasificacion.

28

Page 29: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

En [15] clasificaron las variaciones de color en granos de cafe verde arabiga en muestras encuatro grupos. Para la adquisicion de imagenes utilizan una caja metalica de color negro parareducir la luz del fondo y eliminar la interferencia de luz exterior. Recortaron todas las imagenesdel mismo tamano para obtener la parte que contenıa solo la muestra utilizando un softwarede edicion de imagenes.

2.3.2 Metodos de segmentacion

Basados en distancia de Mahanalobis

En [10] separan los granos del fondo de color rojo utilizando un clasificador de Mahanalobis yoperaciones de dilatacion y erosion.

Basados en umbral

En [13] y [14] utilizan el metodo de Otsu para separar los granos de cafe verde arabiga delfondo, presentando problemas debido a que el fondo que eligieron no era claramente separablede los granos en ambos trabajos.

Basados en funcion

En [2] utilizan una funcion de segmentacion en el espacio de color RGB para separar el fondode color azul de los granos de cafe, dicha funcion considera fondo a todo pıxel que posee sucanal B mayor o igual a su canal R y G multiplicados por una constante X, y objeto a lo demas.

2.3.3 Metodos de Extraccion de Caracterısticas

Basados en color

En [10] utilizan el promedio de todos los pıxeles pertenecientes a un grano en el espacio decolor RGB.

Basados en textura

En [13] y [14] utilizan caracterısticas Haralick basadas en la matriz de co-ocurrencia paraimagenes RGB (CGLCM).

29

Page 30: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Basados en color y forma

En [11] extrajeron seis caracterısticas las cuales son area, largo, perımetro, area de defecto,ındice rojo e ındice verde, en donde las cuatro primeras son caracterısticas de forma y las dosultimas de color.

Basados en forma, textura y color

En [2] utilizan 211 caracterısticas de forma, 126 de textura y 84 de color. Las caracterısticasde forma son descriptores de Fourier, descriptores genericos de Fourier, momentos de Zernike,elementos del modelo autorregresivo y un conjunto de atributos diversos. Las caracterısticas decolor son estadısticas extraıdas de histogramas de intensidad de 100 frecuencias de los canalesde los espacios de color HSV, CIELAB, I1I2I3 y RGB. De cada canal del espacio de color I1I2I3obtienen tres GLCMs con dos pıxeles de referencia, de cada GLCM obtienen 14 caracterısticasHaralick modificadas.

2.3.4 Metodos de clasificacion

Basados en la distancia de Mahalanobis

En [10] utilizan el clasificador de Mahalanobis para clasificar los granos de cafe verde arabigaen siete clases no basadas en un estandar.

Basados en redes neuronales artificiales

En [11] y [2] utilizan redes neuronales artificiales con propagacion hacia atras. En donde en elprimero clasifican en cuatro clases los granos de cafe verde arabiga basados en el estandar dela SCAA, mientras que en el segundo los clasifican en veintiun clases basados en el estandar dela Cooperativa Regional de Cafeicultores de Guaxupe Ltda. (Cooxupe).

Basados en Maquinas de Vectores de Soporte

En [13] clasifican en doce clases los granos de cafe verde arabiga utilizando una maquina devectores de soporte con kernel RBF, mientras que en [14] clasifican en trece clases los granos decafe verde arabiga utilizando tambien una maquina de vectores de soporte pero con la diferenciadel uso de un kernel polinomial.

30

Page 31: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

2.4 Consideraciones finales

En esta seccion se ve que las etapas tıpicas en el reconocimiento de granos de cafe verdearabiga sin defectos fısicos usando vision artificial son las siguientes cuatro: adquisicion deimagenes, segmentacion, extraccion de caracterısticas y clasificacion. En los trabajos vistos,la mayor parte para la segmentacion (separacion del fondo de los granos) se basan en umbral,mientras que para la extraccion de caracterısticas se basan mas en el color, y finalmente parala clasificacion hay un preferencia equitativa entre redes neuronales artificiales y maquinas devectores de soporte. El fundamento teorico explicado permite tener un vision mas clara delsiguiente capıtulo que sera mostrado a continuacion, el cual utiliza principalmente: la constanciadel color, el metodo de Otsu y maquinas de vectores de soporte.

31

Page 32: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Capıtulo 3

Modelo para el reconocimientoautomatico de granos de cafe verdearabiga sin defectos fısicos

3.1 Consideraciones iniciales

En este capıtulo a continuacion se veran los materiales y metodos que fueron utilizados paraobtener el modelo para el reconocimiento automatico de granos de cafe verde arabiga sin defectosfısicos. El esquema del modelo para el reconocimiento automatico de granos de cafe verdearabiga sin defectos fısicos que se propone en este trabajo es mostrado en la Figura 3.1 y comose puede ver este esquema muestra que el modelo tiene un conjunto de partes que son:

• Adquisicion de imagen• Mejora de imagen• Segmentacion• Extraccion de caracterısticas• Clasificacion

La primera parte de este modelo que es la adquisicion de imagen fue obtenida al utilizar lasmuestras de cafe verde arabiga y el metodo de adquisicion de imagenes, la segunda parte fueobtenida a partir del metodo de mejora de imagenes, la tercera parte fue obtenida al realizarel metodo de segmentacion, la cuarta parte fue obtenida gracias al metodo de extraccion decaracterısticas y la ultima parte fue obtenida utilizando el metodo de clasificacion.

32

Page 33: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Figura 3.1: Esquema del modelo para el reconocimiento automatico de granos de cafe verdearabiga sin defectos fısicos.

33

Page 34: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

3.2 Muestras de cafe verde arabiga

Las muestras de cafe verde arabiga fueron proporcionadas por la CECOVASA, la cual estaubicada en el Peru. Las muestras contenıan granos de cafe verde arabiga sin defectos fısicosy con defectos fısicos, seleccionadas por especialistas de la misma CECOVASA, donde dichosespecialistas se basaron en el estandar de la SCAA, el cual es un estandar internacional degran prestigio para realizar esta tarea, en donde los defectos fısicos que proporcionaron son dedoce tipos de los considerados por el estandar de la SCAA, siendo mostrados en la Figura 3.2y fueron los siguientes defectos fısicos:

• Brocado leve• Brocado severo• Cereza seca• Concha• Dano por hongos• Flotador• Inmaduro• Agrio• Negro• Negro parcial• Pergamino• Partido/mordido/cortado

Debido al problema tratado en este trabajo el cual es en general reconocer granos de cafeverde arabiga sin defectos fısicos se considero todos los defectos fısicos proporcionados por laCECOVASA como una sola clase conocida como defecto fısico, dado que el interes en estetrabajo es reconocer los que no tienen defecto fısico y seria innecesario clasificar los defectosfısicos debido a esto. Sin embargo se consideran dos clases debido a la adicion de la clase sindefecto fısico la cual es la que no presenta defectos fısicos y la clase de principal interes en estetrabajo debido a que este trabajo su objetivo es reconocer automaticamente granos de cafeverde arabiga sin defectos fısicos mostrando unos ejemplos en la Figura 3.3 de como son estosgranos de cafe verde arabiga sin defectos fısicos.

La cantidad de granos de cafe verde arabiga para las dos clases fue de 420 debido a que fuela cantidad que poseıa la clase con menos granos. Se utilizo la misma cantidad de granos decafe verde arabiga para las dos clases debido a que en [13] reportan un problema de clases nobalanceadas, el cual consiste en que si se tienen mas granos de cafe verde arabiga en una clase,esto puede hacer que el clasificador tenga preferencia por dicha clase debido a la diferencia degranos de cafe verde arabiga por clase.

34

Page 35: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

(a) (b) (c) (d)

(e) (f) (g) (h)

(i) (j) (k) (l)

Figura 3.2: Los doce defectos fısicos de granos de cafe verde arabiga considerados en este estudio:(a)brocado leve, (b)brocado severo, (c)cereza seca, (d)concha, (e)dano por hongos, (f)flotador,(g)inmaduro, (h)agrio, (i)negro, (j)negro parcial, (k)pergamino y (l) partido/mordido/cortado.

35

Page 36: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Figura 3.3: Imagenes de granos de cafe verde arabiga sin defectos fısicos.

3.3 Adquisicion de imagenes

El prototipo de adquisicion de imagenes de facil implementacion desarrollado en este estudioes mostrado en la Figura 3.4 y consistio en las siguientes partes mostradas a continuacion:

• Una mesa rectangular en donde en su tabla superior se coloco una cartulina de colorturquesa que sirviera como fondo para las muestras de granos de cafe verde arabiga.• Una camara digital de celular inteligente Moto G (Tercera Generacion) que cuenta con

una resolucion maxima de 13 megapıxeles, con la siguiente configuracion:– Sin el uso de flash– Apertura de f/2.0– Zoom de 2.76X– Angulo de rotacion de pantalla que tiende a los 0 grados

• Iluminacion controlada utilizando una lampara fluorescente colocada a un distancia fijapor encima y al centro de la muestra de granos de cafe verde arabiga en un angulocompletamente vertical al plano de la tabla superior de la mesa rectangular donde secoloca la muestra de granos de cafe verde arabiga.

Las imagenes de las muestras de granos de cafe verde arabiga fueron tomadas a la maximaresolucion de la camara del celular inteligente, con un angulo de toma diagonal en referencia alplano de la tabla superior de la mesa rectangular donde se colocaron los granos de cafe verdearabiga, un ejemplo de este angulo de toma diagonal es mostrado en la Figura 3.5 en la cualse ve claramente como se realizo estas tomas de las muestras de granos de cafe verde arabigacon la camara del celular inteligente, ademas cada toma se realizo a una distancia en la cualse distinguiera claramente los granos de cafe verde arabiga en la muestra sin la generacionde sombra por parte del celular u otro cosa ya que esto causarıa problemas en los siguientesmetodos debido a que cambiarıa el color de cada grano drasticamente, y finalmente se guardaronen el formato de imagen JPG en el espacio de color RGB.

36

Page 37: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Figura 3.4: Prototipo de adquisicion de imagenes utilizado en este trabajo para capturar lasmuestras de granos de cafe verde arabiga.

Cada muestra de granos de cafe verde arabiga de la clase defecto fısico fue un conjunto de 35granos de cafe verde arabiga separados entre si del mismo tipo de defecto fısico. Cada muestrade granos de cafe verde arabiga de la clase sin defecto fısico fue igualmente un conjunto de 35granos de cafe verde arabiga que no se tocan entre sı. Se utilizo la cantidad de 35 granos pormuestra de granos de cafe verde arabiga tanto de la clase sin defecto fısico como de la clasecon defecto fısico para que todas las imagenes sean uniformes en la cantidad de granos de cafeverde arabiga por imagen de muestra, dado que si se realizaba las tomas con otra cantidad degranos de cafe verde arabiga los resultados tendrıan variacion debido a que algunas imagenesde muestras de granos de cafe verde arabiga serian mas lejanas y otras mas cercanas debido ala cantidad de granos que deberıan ser capturadas, ya que al ser una cantidad mayor la camaradeberıa alejarse para poder capturar toda la muestra o caso contrario acercarse, por lo quelos resultados variarıan al no ser uniformes las imagenes debido a que algunos granos tendrıandemasiados mas pıxeles que otros de la misma clase y podrıan haber diferencias muy grandesentre granos de cafe verde arabiga de la misma clase.

Por lo tanto se obtuvieron doce imagenes de muestras de granos de cafe verde arabiga parala clase defecto fısico debido a que se contaba con 420 granos dividido entre 35 lo que dabalas doce imagenes, en donde cada imagen correspondıa a cada defecto fısico de granos de cafeverde arabiga considerado en este trabajo, sin olvidarnos que esos defectos estan basados en losutilizados por la SCAA, igualmente la clase sin defecto fısico consistio de doce imagenes dandoun total de veinticuatro imagenes en total de muestras de granos de cafe verde arabiga. Enla Figura 3.6a se ve una imagen de muestra de granos de cafe verde arabiga resultado de esteproceso de adquisicion de imagenes.

37

Page 38: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Figura 3.5: Ejemplo del angulo de toma diagonal para capturar muestras de granos de cafeverde arabiga.

(a) Antes (b) Despues

Figura 3.6: Imagen de muestra de granos de cafe verde arabiga antes y despues de aplicar elalgoritmo de constancia del color WP.

38

Page 39: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

3.4 Mejora de imagenes

Las imagenes de muestras de granos de cafe verde arabiga fueron mejoradas utilizando elalgoritmo de constancia del color WP el cual es explicado en detalle en la Subseccion 2.2.6.Se utilizo el algoritmo de constancia del color WP para mejorar las imagenes de muestras degranos de cafe verde arabiga debido a que una parte del problema aquı tratado en este trabajoera que la iluminacion no era uniforme al capturar las muestras de granos de cafe verde arabigadado que se utilizo un foco fluorescente el cual no genera iluminacion uniforme debido a sunaturaleza. La iluminacion uniforme al tomar las muestras de granos de cafe verde arabigahubiera sido cierto si se hubiera contado con casi la misma iluminacion en cada parte de laescena en donde se realizo la toma de muestras de granos de cafe verde arabiga, pero como estono fue posible debido a que una condicion del objetivo era implementar un prototipo de bajopresupuesto, se opto por usar este algoritmo de constancia del color WP.

El algoritmo de constancia del color WP trato de uniformizar la iluminacion de cada imagende muestras de granos de cafe verde arabiga simulando que cada imagen fue capturada bajoiluminacion uniforme a traves de un proceso no tan complejo el cual se basa principalmente entomar la maxima intensidad de pıxel en la imagen de muestra de granos de cafe verde arabigay tomarlo como el blanco de la imagen, con lo cual se hace un mapeo de los valores de cadapıxel en cada imagen para obtener las nuevas imagenes de muestras de granos de cafe verdearabiga con iluminacion uniformizada simulada.

En la Figura 3.6 es mostrado un ejemplo del resultado de usar el algoritmo de constanciadel color WP en una imagen de muestra de granos de cafe verde arabiga sin iluminacionuniformizada, la cual como se puede ver es menos clara que la imagen de muestra de granosde cafe verde arabiga despues de aplicar el algoritmo de constancia del color WP, viendose unamejora en cuanto a la iluminacion mas clara en comparacion con la primera imagen la cual notiene iluminacion uniforme.

3.5 Segmentacion

En el metodo de segmentacion a todas las imagenes de muestras de granos de cafe verdearabiga mejoradas con el algoritmo de constancia del color WP se les extrajo su canal B (cadauna de estas imagenes posee tres canales R, G y B, esto es explicado con mayor detalle en laSubseccion 2.2.2), debido a que los granos de cafe verde arabiga tienen baja tonalidad azul enel espacio de color RGB lo que facilita diferenciar el fondo de los granos de cafe verde arabigaen cada imagen de muestra de granos de cafe verde arabiga dado que el fondo utilizado era decolor predominantemente azul viendose una notoria diferencia entre los granos de cafe verdearabiga y el fondo en cada imagen de muestra de granos de cafe verde arabiga en escala degrises.

A cada canal B extraıdo de las imagenes de muestras de granos de cafe verde arabiga mejoradasse aplico el metodo de Otsu [27] (Para ver en detalle como funciona el metodo de Otsu ver

39

Page 40: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Figura 3.7: Pasos en el proceso de segmentacion.

la Subseccion 2.2.7), el cual es un metodo de segmentacion que permite separar el fondo delos granos de cafe verde arabiga a traves de una umbralizacion al canal B de cada imagen demuestra de granos de cafe verde arabiga con lo cual se obtuvo imagenes binarias, es decir cadaimagen de muestra de granos de cafe verde arabiga con dos valores que son cero y uno que seconocen como blanco y negro que facilitaron la diferenciacion entre el fondo y los objetos deinteres que son los granos de cafe verde arabiga en cada canal B de las imagenes mejoradas demuestras de granos de cafe verde arabiga.

Sin embargo el software utilizado en este trabajo debido a su configuracion trato como fondolos granos de cafe verde arabiga y como objeto el fondo en cada imagen binaria de muestra degranos de cafe verde arabiga, por lo que despues se realizo la operacion de complemento sobrecada imagen binaria de muestra de granos de cafe verde arabiga para arreglar ese problema, acontinuacion se erosiono cada imagen binaria de muestra de granos de cafe verde arabiga conel fin de eliminar posible ruido presente en las imagenes de muestras de granos de cafe con unamascara cuadrada de 10x10 debido a que quedaban unos puntitos blancos en las imagenes queeran confundidos con granos de cafe verde arabiga.

Con las imagenes de muestras de granos de cafe verde arabiga libres de ruido se procedio aobtener de cada una los contornos de cada grano de cafe verde arabiga aplicando un algoritmode seguimiento de contornos [29] a cada imagen de muestra de granos de cafe verde arabigalibre de ruido para obtener la forma de cada grano de cafe verde arabiga y finalmente se aplicominimum bounding box a cada imagen de muestra de granos de cafe verde arabiga utilizandolos contornos obtenidos para obtener las regiones de interes las cuales son areas rectangularesque contienen granos de cafe verde arabiga, donde cada region de interes fue almacenada enel formato de imagen PNG para no perder informacion dado que este formato de imagenalmacena toda la informacion sin perderla. Todo el proceso descrito anteriormente es mostradograficamente en la Figura 3.7.

40

Page 41: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Figura 3.8: Histogramas de intensidad por cada canal de color de un grano de cafe verdearabiga.

3.6 Extraccion de caracterısticas

Las dos clases de granos de cafe verde arabiga consideradas en este trabajo se diferencianmayormente a simple vista por el color, ademas que el estandar de la SCAA tambien se basacasi en su totalidad en el color, debido a esto se utilizo para la extraccion de caracterısticas decada grano de cafe verde arabiga histogramas de intensidad el cual permite obtener el color decada pıxel de las imagenes digitales de muestras de granos de cafe verde arabiga en cada canaldel espacio de color RGB.

De cada grano de cafe verde arabiga se obtuvo tres histogramas de 256 intensidades cada uno,donde cada uno de estos histogramas era obtenido de cada canal del espacio de color RGBperteneciente a cada imagen de muestra de granos de cafe verde arabiga. Para representarcada grano de cafe verde arabiga como un vector de caracterısticas se utilizo 256 caracterısticasdel histograma del canal R, 256 caracterısticas del histograma del canal G y 256 caracterısticasdel histograma del canal B, dado que con ello se obtendrıa un mayor detalle de cada grano decafe verde arabiga. De esta forma cada grano de cafe verde arabiga fue representado por 768caracterısticas. La representacion grafica de las caracterısticas que fueron extraıdas de cadagrano de cafe verde arabiga son mostradas en la Figura 3.8, donde se ve cada canal del espaciode color RGB respectivamente.

3.7 Clasificacion

Para reconocer las dos clases de granos de cafe verde arabiga de forma automatica se utilizo elclasificador de margen maximo Support Vector Machine (SVM) [28], ya que se ha aplicado con

41

Page 42: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

exito en otros estudios [13,14]. SVM trata de separar las dos clases mediante la busqueda directade los lımites adecuados entre ellas. Para este proposito, construye hiperplanos para separar elespacio de caracterısticas entre las clases. SVM se desarrollo para problemas de clasificacionbinaria como el tratado aquı en donde las dos clases son: defecto fısico y sin defecto fısico.

3.7.1 Seleccion de los parametros y validacion del clasificador

Con el objetivo de obtener un clasificador de granos de cafe verde arabiga SVM robusto yfiable, se realizo un conjunto de pasos basados en Overall Accuracy (OA). OA es un parametrode rendimiento del clasificador y se calcula sobre la base de la matriz de confusion. La matriz deconfusion como el mejor metodo para evaluar los modelos predictivos multiclase [18] es usadapara evaluar el funcionamiento del clasificador de granos de cafe verde arabiga. Las principalesventajas de la matriz de confusion es que puede explicar las relaciones entre diferentes clases ymuestra como los errores se distribuyen entre las clases. Cada columna de la matriz de confusionincluye las muestras en una clase predicha, mientras que cada fila incluye las muestras en unaclase real. Todas las predicciones correctas estan situadas en la diagonal de la matriz deconfusion por lo que OA en simples palabras es la suma de los elementos de la diagonal, esdecir el numero de clasificaciones correctas dividido entre el total de elementos de la matriz,dicho total es el numero total de datos de prueba, siendo mostrada su formula en:

OA =# de clasificaciones correctas

# de datos de prueba(3.1)

De cada una de las dos clases se uso diferentes conjuntos de datos desde un valor inicial de120 granos hasta los 348 con intervalos de 12 en 12 ademas cada dato fue elegido al azar. Cadaconjunto se dividio al azar en dos grupos, los grupos de entrenamiento y prueba. Diferentesproporciones de estos grupos fueron probados, los cuales fueron 90:10, 80:20, 70:30, 60:40 y50:50, de entrenamiento y prueba respectivamente. Para cada proporcion de entrenamiento seaplico varias iteraciones de validacion cruzada k-fold con k = 10 para obtener el valor de Cmas optimo, el cual es obtenido de la iteracion con el OA con mayor valor. La secuencia deiteraciones es mostrada en (3.2) y esta basada en la tecnica de grid-search.

(min,min× step1,min× step2, ...,min× stepn) (3.2)

En donde min es el valor inicial de C, step es una constante que debe ser mayor que 1 y n esel ındice maximo que satisface a:

min× stepn < max (3.3)

Los parametros iniciales del SVM fueron un kernel lineal, dado que luego de sucesivas pruebasse obtuvo que los datos eran en su mayorıa linealmente separables dado que usando otros kernels

42

Page 43: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

se obtuvo mayor confusion (resultados no mostrados), y parametro de regularizacion C = 0.1,es decir min = 0.1, max = 500 y step = 5. Finalmente se uso su proporcion de prueba parahallar el OA. Obtenidos los parametros de clasificacion, se procedio a validar el clasificador quelos utilizo, mediante la generacion de conjuntos de entrenamiento y prueba, de forma aleatoriaen 100 repeticiones.

3.8 Consideraciones finales

Las muestra de granos de cafe verde arabiga proporcionadas por la CECOVASA consistende granos de cafe verde arabiga con defectos fısicos y sin defectos fısicos, en donde los queposeen defectos fısicos son de doce tipos considerados por el estandar de la SCAA, sin embargose considera dos clases en este trabajo debido al problema tratado y son: defecto fısico y sindefecto fısico.

El metodo de adquisicion de imagenes utiliza un prototipo de adquisicion de imagenes de facilimplementacion que consiste en una mesa, una cartulina color turquesa, una camara de celulary una lampara fluorescente como se ve en la Figura 3.4, la ventaja de este prototipo es quepermite tomar fotos de muestras de granos de cafe verde arabiga en un angulo de toma diagonallo que no ocurre con los trabajos actuales que tratan este problema de reconocimiento de granosde cafe verde arabiga sin defectos fısicos.

El metodo de mejora de imagenes utiliza un algoritmo de constancia del color conocido comoWP, el cual simula que la iluminacion fue uniforme al tomar las fotos de las muestras de granosde cafe verde arabiga, dado que la iluminacion realmente no fue uniforme debido a que fueproducida por una lampara fluorescente, con lo cual facilita el reconocimiento de granos de cafeverde arabiga sin defectos fısicos debido a que no hay una variacion muy grande en el colorentre granos del mismo tipo al ser la iluminacion uniforme.

El metodo de segmentacion permite separar los granos de cafe verde arabiga del fondo a travesde un conjunto de pasos que de forma resumida consisten en aplicar a cada imagen de muestrasde granos de cafe verde arabiga los siguientes pasos: extraer el canal B, aplicar el metodo deOtsu al canal B, aplicar el complemento a la imagen obtenida al aplicar Otsu, eliminar ruidoen el complemento, aplicar un algoritmo de seguimiento de contornos al complemento sin ruidopara obtener los bordes de cada grano de cafe verde arabiga y finalmente minimum boundingbox usando los contornos para obtener las areas rectangulares mınimas de interes.

El metodo de extraccion de caracterısticas se basa en histogramas de 256 intensidades queextraen caracterısticas de cada canal del espacio de color RGB de una imagen de muestrasde granos de cafe verde arabiga, ademas se escogio histogramas de intensidad dado que lacaracterıstica mas usada por el estandar de la SCAA es el color, extrayendo en total 768caracterısticas de color de cada grano de cafe verde arabiga para el reconocimiento de granosde cafe verde arabiga sin defectos fısicos.

El metodo de clasificacion se baso principalmente en el uso de SVM, dado que este clasificador

43

Page 44: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

se desarrollo para problemas de clasificacion binaria el cual encaja perfectamente con el prob-lema tratado aquı que cuenta con dos clases: sin defecto fısico y con defecto fısico. Ademas serealizo la seleccion de parametros y validacion del clasificador con el fin de obtener lo optimoen esta parte basado principalmente en el OA y la matriz de confusion.

Como se vio en este capıtulo, las muestras de granos de cafe verde arabiga pasan por unaserie de metodos para el reconocimiento de los granos sin defectos fısicos, siendo esta tarea notrivial al necesitar de tecnicas de vision artificial, procesamiento de imagenes y de aprendizajede maquina.

44

Page 45: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Capıtulo 4

Resultados y discusion

4.1 Consideraciones iniciales

En esta seccion se muestran los resultados y discusion de los siguientes metodos: segmentacion,seleccion de parametros y validacion. Finalmente se muestra en este capıtulo la prueba, re-sultados y discusion para la comparacion del modelo para el reconocimiento automatico degranos de cafe verde arabiga sin defectos fısicos realizado en este trabajo con otros trabajos dela literatura muy parecidos a este.

4.2 Segmentacion

El proceso de segmentacion tuvo algunos errores dado que de un total de 840 granos fueronsegmentados correctamente 801 granos, los cuales representan el 95.36% del total. Las causasdel error en la segmentacion fueron tres casos. El primer caso es cuando los granos tienenuna separacion casi no visible. El segundo caso es la sombra, la cual hace creer al proceso desegmentacion que es parte de un grano. Finalmente el tercer caso es la oclusion entre granos.Estos tres casos se pueden ver en la Figura 4.1. Luego del proceso de segmentacion, se utilizaronsolo los granos segmentados correctamente, pero debido a que la clase defecto fısico contenıauna cantidad irregular por cada defecto se procedio a tener la misma cantidad de granos pordefecto, siendo este cantidad la de 29 granos por defecto debido a que este numero fue la mismacantidad que tiene el defecto con menor numero de granos segmentados correctamente, por loque finalmente la clase defecto fısico cuenta con un total de 348 granos, lo cual hizo que laclase sin defecto fısico utilizara esa misma cantidad como se muestra en la Tabla 4.1 para lossiguientes metodos.

45

Page 46: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

(a) Caso I (b) Caso II (c) Caso III

Figura 4.1: Los tres casos de error en la segmentacion de granos de cafe.

Tabla 4.1: Cantidad de Imagenes de Granos de Cafe Verde Arabiga por Clase

Clase Cantidad

Defecto fısico 348

Sin defecto fısico 348

4.3 Seleccion de parametros y validacion

Los resultados de este proceso son mostrados en la Figura 4.2 en donde se ve que a mayorcantidad de granos por clase los resultados no varıan demasiado incluso llegando al 99.60% deOA, sin embargo con el fin de obtener el clasificador lo mas robusto posible se escogio usar todoslos datos (348) para cada clase y la particion 30:70 de prueba y entrenamiento respectivamente,dado que es un valor intermedio de las demas proporciones y el valor de C = 0.1 debido aser el valor optimo al realizar la validacion cruzada. Para mayor detalle sobre los resultadosobtenidos se puede ver la Tabla 4.2. Los resultados de la validacion fueron obtenidos de lamatriz de confusion de la Tabla 4.3. Se obtuvo un OA del 99.51%, ademas la clase que presentomayor error al ser clasificada fue defecto fısico con 58 errores solamente. Lo cual demuestraque la propuesta presentada en este trabajo es robusta y fiable.

4.4 Comparacion con otros trabajos

Todas las comparaciones se realizaron con las principales tecnicas de trabajos directamenterelacionados con este y que utilizaron los mismos defectos fısicos aquı tratados. Dichos trabajosson [14] y [13], en donde la tecnica principal del primero fue un algoritmo de constancia delcolor conocido como MSRCR y la tecnica principal del segundo fue CGLCM. Las comparacionesse realizaron utilizando la propuesta con conjuntos al azar de entrenamiento y prueba en 100repeticiones.

46

Page 47: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Tabla 4.2: Overall accuracy para cada tamano de datos por clase y proporcion de prueba

Datos Proporcion de prueba (%)

por clase 10 (%) 20 (%) 30 (%) 40 (%) 50 (%)

120 89.4309 94.8529 91.9463 92.5926 92

132 96.2687 97.2789 94.375 97.1098 97.8495

144 95.8621 94.9367 97.6608 93.4783 91.9048

156 96.7949 98.2249 93.956 96.6346 90.9502

168 97.6048 97.7778 95.6311 96.347 95.5102

180 96.6292 98.0392 97.6959 86.4198 91.4062

192 97.8836 96.7442 89.4737 97.2441 97.5

204 97 97.7876 97.619 98.1132 94.5017

216 98.1043 97.8903 98.8593 96.1938 94.6032

228 97.2973 96.371 98.5401 99 96.0123

240 99.5935 97.4265 98.6577 97.8395 98.2857

252 98.0545 97.8799 98.0583 98.5075 99.169

264 96.2687 95.5782 97.1875 97.1098 98.7013

276 97.491 97.377 98.4894 96.7568 97.4747

288 96.5517 96.2025 94.9296 97.9003 95.7143

300 97.3422 98.2353 98.3607 97.284 96.5197

312 98.7179 98.5755 98.1432 98.7981 97.8022

324 97.8328 98.0663 97.7556 98.1265 98.2833

336 97.6048 98.3914 97.8155 97.7827 95.7143

348 96.5217 96.0938 96.6903 98.9177 97.4052

Tabla 4.3: Matriz de confusion de la propuesta

Defecto fısico Sin defecto fısico

Defecto fısico 10342 58

Sin defecto fısico 43 10357

47

Page 48: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Figura 4.2: Overall accuracy para cada tamano de datos por clase y proporcion de prueba quevaria del 10%-50%.

Tabla 4.4: Comparacion de algoritmos de constancia de color y extractores de caracterısticas

Overall Accuracy

Constancia del color

Sin utilizar 85.7260%

WP 99.5144%

MSRCR 67.0769%

Extractores de caracterısticasHistogramas de intensidad 99.5144%

CGLCM 59.0196%

Primeramente se realizo la comparacion de algoritmos de constancia del color. Se realizo lacomparacion cambiando el algoritmo de constancia del color de la propuesta por el MSRCR yaplicandose a cada grano como en [14]. Finalmente se realizo la comparacion de tecnicas deextraccion de caracterısticas tambien utilizando la propuesta pero cambiando el extractor decaracterısticas por CGLCM utilizando la configuracion de [13].

El resultado de la comparacion de algoritmos de constancia de color y extractores de carac-terısticas es mostrado en la Tabla 4.4. Como se ve el algoritmo de constancia de color utilizadoaquı es superior para este estudio dado que con MSRCR se obtuvo un OA del 67.08%, mientrasque sin usar un algoritmo de constancia de color se obtuvo un OA del 85.73%. Finalmente elresultado de la comparacion de tecnicas de extraccion de caracterısticas da como claro ganadoral extractor de caracterısticas utilizado en este trabajo dado que con CGLCM se obtuvo unOA del 59.02%.

48

Page 49: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

4.5 Consideraciones finales

Se pudo ver que el metodo de segmentacion tuvo algunos errores debido a tres casos los cualesson: separacion no visible, sombra y oclusion. Ademas el metodo de seleccion de parametros yvalidacion, muestra como a mayor cantidad los resultados casi no varıan mucho entre valores del94% al 100% de OA. Finalmente en la comparacion con otros trabajos se vio que la propuestade este trabajo es superior a los otros con los que se comparo.

49

Page 50: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Capıtulo 5

Conclusiones y trabajos futuros

5.1 Conclusiones

• Se logro proponer un modelo que permite el reconocimiento automatico de granos de cafeverde arabiga sin defectos fısicos en imagenes de muestras capturadas manualmente conun angulo de toma diagonal usando vision artificial y basandose para el reconocimientoen el estandar de la SCAA.• Se logro construir un prototipo de adquisicion de imagenes de facil implementacion debido

a que requiere de productos ya fabricados y no se requiere de un especialista para armarlo.• Se adquirio imagenes digitales de muestras de granos de cafe verde arabiga gracias a las

muestras proporcionadas por la CECOVASA y al uso del prototipo de adquisicion deimagenes.• Se logro uniformizar la iluminacion en las imagenes de muestras de granos de cafe verde

arabiga utilizando el algoritmo de WP, el cual permite mejorar las imagenes de muestrasde granos de cafe para facilitar la clasificacion de defectos fısicos, dado que permitesimular que la imagen fue tomada en condiciones de iluminacion controladas, dado quelas imagenes fueron tomadas con un angulo diagonal y manualmente utilizando un celular,lo que produce variaciones en la iluminacion por el movimiento.• Se reconocieron granos individuales en las imagenes digitales de muestras de granos de

cafe verde arabiga usando principalmente el metodo de Otsu.• Se extrajeron caracterısticas de color de cada grano de cafe verde arabiga usando his-

togramas de intensidad.• Se logro validar el modelo de clasificacion principalmente a traves del uso de la matriz de

confusion y de el OA.• Los resultados obtenidos en este trabajo muestran que el reconocedor puede ser utilizado

en aplicaciones reales para el reconocimiento de granos de cafe verde arabiga sin defectosfısicos dado que se alcanzo un OA del 99.60%.

50

Page 51: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

5.2 Trabajos Futuros

• Un reconocedor de granos de cafe verde arabiga sin defectos fısicos mas completo debeser desarrollado para incluir una gama mas amplia de granos sin defectos fısicos.• El modelo propuesto puede ser mejorado a traves de la incorporacion de un procedimiento

que permita agregar nuevos tipos de granos de cafe con o sin defectos fısicos. De estamanera, la cantidad de granos de cafe verde arabiga sin defectos fısicos reconocidos secree que mejorara.

51

Page 52: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Capıtulo 6

Trabajos publicados

Los trabajos publicados durante toda la investigacion fueron los siguientes:

• J. Ramirez-Ticona, J. C. Gutierrez-Caceres and C. E. Portugal-Zambrano, “Cell-phonebased model for the automatic classification of coffee beans defects using white patch,”2016 XLII Latin American Computing Conference (CLEI), Valparaıso, 2016, pp. 1-6.• C. E. Portugal-Zambrano, J. C. Gutierrez-Caceres, J. Ramirez-Ticona and C. A. Beltran-

Castanon, “Computer vision grading system for physical quality evaluation of green coffeebeans,” 2016 XLII Latin American Computing Conference (CLEI), Valparaıso, 2016, pp.1-11.

52

Page 53: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Bibliografıa

[1] (2016) La web de la SCAA. [Online]. Available: http://www.scaa.org

[2] P. I. C. Oyama, “Metodo para classificacao de cafe em graos por imagens digitais pelo usode atributos selecionados de morfologia, cor e textura,” Master’s thesis, Universidade deSao Paulo, Sao Paulo, 2014.

[3] International Coffee Organization. (2016, Jul.) Total production by all exportingcountries. [Online]. Available: http://www.ico.org/prices/po-production.pdf

[4] R. Klette, Concise Computer Vision: An Introduction into Theory and Algorithms.Springer London, 2014.

[5] R. M. Carter, Y. Yan, and K. Tomlins, “Digital imaging based classification and authen-tication of granular food products,” Measurement Science and Technology, vol. 17, no. 2,pp. 235–240, 2006.

[6] O. Khatchatourian and F. R. R. Padilha, “Reconhecimento de variedades de soja pormeio do processamento de imagens digitais usando redes neurais artificiais,” EngenhariaAgrıcola, vol. 28, pp. 759–769, Dec 2008.

[7] R. Choudhary, J. Paliwal, and D. Jayas, “Classification of cereal grains using wavelet,morphological, colour, and textural features of non-touching kernel images,” BiosystemsEngineering, vol. 99, no. 3, pp. 330–337, 2008.

[8] A. Arefi, A. Modarres Motlagh, and R. Farrokhi Teimourlou, “Wheat class identificationusing computer vision system and artificial neural networks,” International Agrophysics,vol. 25, no. 4, pp. 319–325, 2011.

[9] S. R. Delwiche, I.-C. Yang, and R. A. Graybosch, “Multiple view image analysis offreefalling u.s. wheat grains for damage assessment,” Computers and Electronics in Agri-culture, vol. 98, pp. 62–73, 2013.

[10] E. Carrillo and A. A. Penaloza, “Artificial vision to assure coffee-excelso beans quality,”in Proceedings of the 2009 Euro American Conference on Telematics and InformationSystems: New Opportunities to Increase Digital Citizenship, New York, USA, 2009, pp.

53

Page 54: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

35:1–35:8.

[11] D. W. Soedibyo, U. Ahmad, I. Subrata, and K. B. Seminar, “The development of automaticcoffee sorting system based on image processing and artificial neural network,” in AFITA2010 International Conference, Bogor, Indonesia, Oct 2010, pp. 271–275.

[12] F. Faridah, G. O. F. Parikesit, and F. Ferdiansjah, “Coffee bean grade determinationbased on image parameter,” TELKOMNIKA (Telecommunication Computing Electronicsand Control), vol. 9, no. 3, pp. 547–554, Dec 2011.

[13] R. H. M. Condori et al., “Automatic classification of physical defects in green coffee beansusing cglcm and svm,” in Computing Conference (CLEI), 2014 XL Latin American, Mon-tevideo, Uruguay, Sep 2014, pp. 1–9.

[14] R. G. Apaza et al., “An approach for improve the recognition of defects in coffee beansusing retinex algorithms,” in Computing Conference (CLEI), 2014 XL Latin American,Montevideo, Uruguay, Sep 2014, pp. 1–9.

[15] E. M. de Oliveira et al., “A computer vision system for coffee beans classification based oncomputational intelligence techniques,” Journal of Food Engineering, vol. 171, pp. 22–27,2016.

[16] X. Chen, Y. Xun, W. Li, and J. Zhang, “Combining discriminant analysis and neuralnetworks for corn variety identification,” Computers and Electronics in Agriculture, vol.71, Supplement 1, pp. S48–S53, 2010.

[17] J. M. Valiente-Gonzalez, G. Andreu-Garcıa, P. Potter, and A. Rodas-Jorda, “Automaticcorn (zea mays) kernel inspection system using novelty detection based on principal com-ponent analysis,” Biosystems Engineering, vol. 117, pp. 94 – 103, 2014.

[18] F. Kurtulmus and H. Unal, “Discriminating rapeseed varieties using computer vision andmachine learning,” Expert Systems with Applications, vol. 42, no. 4, pp. 1880–1891, 2015.

[19] W. T. S. Vilar, R. M. Aranha, E. P. Medeiros, and M. J. C. Pontes, “Classification ofindividual castor seeds using digital imaging and multivariate analysis,” Journal of theBrazilian Chemical Society, vol. 26, pp. 102–109, Jan 2015.

[20] International Coffee Organization. (2016, Jul.) Monthly export statistics. [Online].Available: http://www.ico.org/prices/m1-exports.pdf

[21] Y. Ling and A. Hurlbert, “Role of color memory in successive color constancy,” Journalof the Optical Society of America A, vol. 25, no. 6, pp. 1215–1226, Jun 2008.

[22] A. Hurlbert, “Colour constancy,” Current Biology, vol. 17, no. 21, pp. R906 – R907, 2007.

[23] L. Bing, X. De, and F. Songhe, “Illumination estimation based on color invariant,” Chinese

54

Page 55: UNIVERSIDAD NACIONAL DE SAN AGUST IN DE AREQUIPA …

Journal of Electronics, vol. 18, no. 3, pp. 431–434, Jul 2009.

[24] A. Gijsenij and T. Gevers, “Color constancy using natural image statistics and scenesemantics,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 33,no. 4, pp. 687–698, Apr 2011.

[25] J. Cepeda-Negrete and R. E. Sanchez-Yanez, “Experiments on the white patch retinex inrgb and cielab color spaces,” Acta Universitaria, vol. 22, pp. 21–26, 2012.

[26] ——, “Automatic selection of color constancy algorithms for dark image enhancement byfuzzy rule-based reasoning,” Applied Soft Computing, vol. 28, pp. 1–10, 2015.

[27] N. Otsu, “A threshold selection method from gray-level histograms,” IEEE Transactionson Systems, Man, and Cybernetics, vol. 9, no. 1, pp. 62–66, Jan 1979.

[28] C. Cortes and V. Vapnik, “Support-vector networks,” Machine Learning, vol. 20, no. 3,pp. 273–297, 1995.

[29] S. Suzuki and K. be, “Topological structural analysis of digitized binary images by borderfollowing,” Computer Vision, Graphics, and Image Processing, vol. 30, no. 1, pp. 32–46,1985.

55