Download Descargar el archivo PDF - Sistema de Revistas Electrónicas de la
Transcript
John Díaz Abstract This paper is about a computer vision system to determine the quality of the coffee. The study consists in the generation of three classification systems (first is creates a bank of images for the realization of the study, is used two phases (pre-processing and processing) to get good images). The first system is based on the comparison of histograms using the Bhattacharyya coefficient (the technique is tested with color and gray scale images). The second system is based on the color segmentation using the Mahalanobis distance (also tested the Euclidean distance), morphological operations (dilatation and open) and logical operations (AND in specific). The third technique is based on the neural network feedforward using the training algorithm Backpropagation based On Levenberg Marquardt, the features used in this system are the Kurtosis and the mean (also tested with the Skewness and variance). After perform testing with the three systems is determines the best. Coffee, Computer vision, Threshold, ROI, Histogram Keywords comparison, Bhattacharyya Coefficient, Color segmentation, Euclidean distance, Mahalanobis distance, Morphological operations. I. INTRODUCCIÓN L as aplicaciones que se basan en un sistema de visión por computador para dar solución a una problemática por lo general requieren de una gran variedad de técnicas para lograr su objetivo, más aun si el sistema tiene que trabajar con imágenes a color en donde cada uno de los elementos a identificar, seleccionar, reconocer y/o clasificar poseen el mismo color pero con diferentes tonalidades que no están distribuidas uniformemente, además las tonalidades de algunos objetos de una clase son muy similares con respecto a la otra clase, y los objetos tienen formas similares. Este es el caso de un clasificador de granos de café que determina la calidad del producto mediante un sistema de visión por computador, lograr que este sistema funcione correctamente no es una tarea muy sencilla ya que no es como los seleccionadores que solo identifican si el grano esta bueno o malo, la clasificación es la fase siguiente de la selección, el clasificador debe determinar la calidad del producto sin importar las clases (cinco son las manejadas en el proyecto) de granos que se le impongan. El café es una parte fundamental de la economía del país y para que exista una gran acogida por parte de los compradores, ya sean extranjeros o nacionales, este producto debe ser de buena calidad. En Colombia existe una gran exigencia en este tema ya que es uno de los mayores productores de café de calidad en el mundo. En cuanto a los precios para la exportación hay ciertos criterios que se manejan como es [1] que se encarga que los productores de café reciban el precio justo. Para que los campesinos puedan obtener una gran parte de ingresos por el producto se les da el privilegio de que lleven a cabo la mayoría de los procesos de producción del café, sin embargo hay una parte dentro del proceso que es muy John Diaz, Universidad de Cundinamarca (UdeC), Fusagasugá, Colombia, jade7700@gmail.com importante pero que es demorado y requiere de cuidado, este es el proceso de clasificación del café, debido a que este proceso se lleva a cabo manualmente no por los campesino si no por una persona experta la cual determina la calidad y por ende el precio, los criterios de calidad pueden variar de acuerdo al estado de animo de la persona, cansancio, o simplemente porque otro experto tiene otros criterios para evaluar la calidad lo cual pueden llevar a una discrepancia por consiguiente, se pretende que este proceso se realice de manera imparcial por medio de un sistema autónomo de clasificación de café ya que una maquina no tiene esos problemas, el sistema solo actúa de acuerdo a las características técnicas que se le especifiquen. Se enfatiza en que las características de un buen grano de café están dadas por el tamaño y el color, ya que son los rasgos más significativos en la determinación de la calidad del grano. También existen otras características como aroma, textura, forma, humedad, entre otros, sin embargo estos no serán tomados en cuenta para el desarrollo del proyecto ya que se pretende es el diseño de un sistema clasificador de granos de café mediante la caracterización de imágenes con el fin de determinar la calidad del producto, y las características como aroma no se podrían medir con este sistema, la textura y el forma no son muy significativos a la hora de determinar la calidad del café. Como se presenta en la ficha técnica del café [2] el aspecto más importante es el color (Verde mismo en la norma técnica de café verde [3], se toma muy en cuenta el tamaño del grano así como el color (verde azulado y verde claro lo cual coincide con [2], esto quiere decir que únicamente se tienen en cuenta los cafés buenos y muy buenos) para determinar la calidad del café. En cuanto a la temática ya han realizado sistemas de visión por computador que clasifican el café y determinan la calidad del producto, uno de estos sistemas es [4] que desarrolla un sistema de clasificación automático que consiste en un programa informático de procesamiento de imágenes y una red neuronal artificial que identifica la calidad del café verde, por otro lado en [5] se presenta un trabajo desarrollado en indonesia basado también en una red neuronal que intenta solucionar el problema en cuanto a la dificultad e irregularidades en la clasificación del café bajo el estándar N º SNI 01-2907-1999 de ese país, y en [6] también se propone un sistema de clasificación de granos mediante clasificación de Naive Bayes y clasificadores de redes neuronales. Como se puede ver, es muy común hablar de redes neuronales en este tipo de sistemas, sin embargo este trabajo no se enfoca en el trabajo con redes neuronales, además se presentan alternativas de solución poco comunes en este tipo de sistemas no obstante, los resultados obtenidos son buenos. En el sistema la característica más importante del café es el color, existe una gran variedad de técnicas de procesamiento con las cuales se pueden clasificar los granos de acuerdo a esta característica pero, en este documento únicamente se realiza el estudio con las técnicas de; comparación de histogramas, segmentación por color y redes neuronales, en la primera técnica se utiliza el coeficiente de Bhattacharyya, para el caso de la segmentación además de la distancia euclidiana y la distancia de Mahalanobis se utilizan operaciones morfológicas debido a que el solo proceso de segmentación no es suficiente para lograr una clasificación adecuada, por último la red neuronal utilizada es de tipo Feed-forward entrenada mediante el algoritmo backpropagation basado en Levenberg Marquardt, en donde las características usadas para el entrenamiento son la media y la curtosis, de la intensidad de los pixeles de cada canal. La característica del tamaño también es importante sin embargo, es la más fácil de adquirir mediante la obtención y determinación de áreas para el caso de la primer y tercer técnica, en la segunda se utiliza el conteo y eliminación de áreas. Una vez desarrollados los sistemas se identifica cual es el más adecuado para llevar a cabo el proceso de clasificación con el cual se determinará la calidad del producto. En cuanto al tamaño únicamente se trabaja con granos medianos y grandes debido a que en la región no son muy comunes los granos pequeños (en la recolección de los granos no se encontraron aquellos que tuvieran un tamaño inferior a 6 mm). III. DESCRIPCIÓN GENERAL DEL SISTEMA En general el proyecto es un sistema de visión artificial (Teniendo en cuenta a [7], [8] y [9] en la figura 1 se presenta un diagrama de bloques general de un sistema de visión artificial) con el cual se determina a calidad del producto, para no hacer tan extenso el documento en la figura 2 se explica en que consiste el proyecto mediante un diagrama de bloques. La primer fase es la generación del banco de imágenes que consiste en el procesamiento de bajo nivel, la segunda fase y las más larga consiste en la realización de pruebas con las diferentes técnicas señaladas para así clasificar los granos de café de acuerdo a las características de color y tamaño (Tabla 4), y la última fase consiste en interpretar los datos obtenidos mediante las técnicas escogidas en la fase anterior con el fin de determinar la calidad del producto. II. CARACTERÍSTICAS PARA DETERMINAR LA CALIDAD DEL CAFÉ Este documento no se centrara en el proceso del café porque la temática principal es la visión artificial y se desea que el documento se enfoque a ella por consiguiente, a continuación únicamente se muestran las características técnicas del grano. COLOR CALIFICATIVO Verde grisáceo/azulado Muy bueno Verde claro Bueno Ligeramente pálido corriente Blanquecino bajo Tabla 1. Calidad del café según su color NÚMERO 20 19 18 17 16 15 14 TAMAÑO (mm) 7,94 7,54 7,14 6,75 6,35 5,95 5,57 Figura 1. Diagrama de bloques general de un sistema de visión artificial Tabla 2. Tamaños del café Por cuestiones prácticas en cuanto al tamaño se toma lo siguiente: Grande Mayor a 7,94 mm Mediano Entre 6 mm y 7,9 mm Tabla 3. Clasificación del tamaño Tenido en cuenta estas dos características se determinara la calidad del café de la siguiente manera: CARACTERÍSTICAS CALIFICATIVO Verde grisáceo, Tamaño mediano Excelente (5) Verde grisáceo, Tamaño grande Muy Bueno (4) Verde claro, Tamaño mediano Bueno (3) Verde claro, Tamaño grande corriente (2) Blanquecino, Cualquier tamaño Bajo (1) Tabla 4. Calidad del café según su color y tamaño Figura 2. Diagrama de bloques general del sistema IV. GENERACIÓN DEL BANCO DE IMÁGENES Inicialmente se deben realizar las capturas de las imágenes con los diferentes granos de café. Lograr unas imágenes adecuadas para la realización del estudio, y así mismo si se deseara la implementación en tiempo real del sistema, se requiere principalmente de una luminosidad adecuada, sin embargo en muchas ocasiones lograr que esa luminosidad sea la mejor es algo complicado ya que existe una gran variedad de técnicas de iluminación y cada una de ellas exige un grado de complejidad a la hora de implementar el sistema de adquisición de las imágenes [10]. En esta aplicación la técnica utilizada es la iluminación polarizada, en donde el material utilizado para la polarización es una cartulina blanca (dependiendo del color de la cartulina se polarizara la luz y dará una iluminación con el color del material), se escogió este material ya que además de económico, absorbe y distribuye muy bien la luz (ver figura 4). También hay otra forma de realizar la iluminación e igualmente es recomendable, esta se hace mediante iluminación directa con un bombillo ahorrador (ya que emite una luz pálida) a una distancia mayor a la del reflector haciendo uso de un cuarto normal sin mucha iluminación, mediante este método también se puede obtener imágenes de muy buena calidad Para la obtención de las imágenes se utiliza la herramienta procesamiento) y para mejorar un más las imágenes se utiliza la curva de transformación [11], y finalmente para lograr obtener imágenes con un fondo uniforme y de color totalmente blanco se utiliza el algoritmo que se muestra en la figura 3. Como se puede observar en la figura 5, los resultados obtenidos después del procesamiento son muy buenos, estos resultados son los que se esperan obtener en un sistema de visión artificial y aunque se toma bastante tiempo realizar este procesamiento a cada imagen del banco, los resultados hacen que valga la pena ese esfuerzo adicional ya que en las etapas posteriores reduce tiempo y trabajo. Pre-procesamiento Procesamiento Figura 5. Comparación entre una imagen obtenida mediante la herramienta V. TÉCNICAS DE ESTUDIO PARA LA CLASIFICACIÓN DE COLOR A. Histograma Consiste en tomar un patrón para cada grano (verde grisáceo, verde claro,) y determinar su histograma, después se prosigue a seleccionar una región de interés (ROI) en donde esté ubicado el grano de café en una de las capturas del banco de imágenes, sin embargo se presenta el inconveniente de la ubicación de los granos, es decir para que esta técnica funcione correctamente se requiere que los granos este muy bien alineados y ubicados, además se debe especificar un numero de granos y las posiciones por ende, la ubicación de los granos siempre tendrían que ser la misma y debe tener siempre la misma cantidad de granos. Para la comparación de histogramas se utiliza el coeficiente de Bhattacharyya [12] definido por la ecuación (1) sin embargo, para poderlo aplicar a un histograma se puede asumir que Ri y Si son una distribución variable aleatoria de Poisson [13] obteniendo como resultado la ecuación (2) que en definitiva es la que se utiliza para la comparación de histogramas. p ( R, S ) n R(i) S (i) (1) Ri Si (2) i 1 p ( R, S ) Figura 3. Proceso para obtener imágenes con fondo totalmente blanco Figura 4. Prototipo implementado del sistema de adquisición de imágenes (vista superior con y sin la cubierta de cartulina que ajusta la luminosidad emitida por el reflector) i En cuanto a la comparación de los histogramas, se puede realizar mediante dos formas, las primera es convirtiendo la imagen del grano de café a escala de gris para así trabajar con un único histograma y la segunda es trabajando directamente con la imagen a color teniendo en cuenta los tres canales (se realiza una aproximación para utilizar únicamente ocho contenedores ya que reduce enormemente el coste computacional de la aplicación). Para esta aplicación resulta mejor utiliza imágenes a escala de gris (figura 6) que imágenes a color (figura 7). d x, y x y y x [( x1 y1 )2 ..... ( xn yn ) 2 ] 1 2 (3) En definitiva la DE esta dada por: d x, y k ( xn yn )2 (4) n 1 La distancia de Mahalanobis (DM) también se llama distancia cuadrática. Se mide la separación de dos grupos de objetos. Supóngase que se tienen dos grupos llamado z y a, la DM [16] es dada por la siguiente ecuación: D z, a Figura 6. Histogramas de las tres clases de café según su color (escala de gris) Figura 7. Histogramas RGB de las tres clases de café según su color (imágenes a color) Como se puede observar en la figura 7, los granos blanquecinos y verde claro poseen una similitud bastante elevada lo cual puede ocasionar que estos granos se confundan, sin embargo haciendo uso de imágenes a escala de gris este problema disminuye como se muestra en la figura 6, esto sucede ya que los granos poseen tonos diferentes fáciles de separar (brillos y contrastes bastante diferenciables). Por consiguiente en esta aplicación es mejor utilizar imágenes a escala de gris que a color. Los datos de las figuras 6 y 7 son tomadas de la media de 15 granos de cada clase, es decir se hallan 15 histogramas por cada tipo de grano y luego se realiza la media entre cada grupo, para así obtener un valor de histograma total que representa la población de granos, estos datos también funcionan como patrones B. Distancia Euclidiana y de Mahalanobis En cuanto a medidas de distancia computacional se trata la más común es la distancia euclidiana (DE), esta examina el origen de las diferencias cuadradas entre las coordenadas de un par de objetos [14], es decir la DE entre dos vectores de n dimensionales x e y se define [15] como escalar: ( z a)T C 1 ( z a) (5) Inicialmente se plantea utilizar como técnica de segmentación por color la DE, sin embargo se presentan algunos inconvenientes a la hora de diferenciar los granos verde grisáceo y verde claro. Lo primero que se debe tener en cuenta son los patrones a utilizar ya que de ellos depende que la aplicación funcione correctamente con cualquier imagen del banco, para cada patrón se escoge una tonalidad de los granos con el fin de determinar la matriz de covarianza C y el vector m (llamado patrón y en la ecuación (4)), el vector m si se trata de varios datos (pixeles) se conoce como el valor medio del conjunto de pixeles. Para determinar los valores de m y C se toman 300 granos de café (135 verde grisáceo, 135 verde claro y 30 blanquecino, solo se encontraron 30 granos blanquecinos lo cual quiere decir que son escasos, no por nada Colombia tiene uno de los mejores cafés del mundo, es por ello que es raro encontrar de calidad baja), estos granos se separan en grupos de 15, de cada grupo se halla un vector de media y una matriz de covarianza, al final los valores obtenidos de cada grupo son promediados y el valor resultante es el escogido como patrón para cada clase, a continuación se muestran los valores obtenidos después de realizar este procedimiento. Verde Grisáceo C=[658.9938 561.0452 375.5837 561.0452 572.8051 393.7808 375.5837 393.7808 407.4899]; m=[129.7335 111.1463 73.3943]; Verde Claro C=[ 621.1485 481.5995 269.9496 481.5995 566.2108 360.4601 269.9496 360.4601 534.0861]; m=[182.2080 142.9570 69.2871]; Blanquecino C=[290.8003 306.8977 307.1194 306.8977 443.2569 555.6072 307.1194 555.6072 925.7031]; m=[205.6220 192.9130 138.9192]; A continuación se muestra la distribución de la media de cada uno de los granos en donde se puede observar que las clases están bastante separadas, gracias a esta distribución se pueden llegar a obtener muy buenos resultados ya que las clases se diferencian notablemente. (Se establece que se va a utilizar la DM, sin embargo definiendo un buen umbral y realizando pruebas se puede llegar a utilizar la DE). Con esta misma grafica se puede definir el umbral a utilizar (de 10 o 15), debido a que los grupos se encuentran tan separados, (se utiliza 2 y 4 en la aplicación ya que se usa la DM y en palabras sencillas la matriz de covarianza hace que el umbral disminuya, para el caso de la DE si se toma un umbral de 10 a 15), el umbral se determina tomado la distancia del centro con respecto a uno de los puntos lejanos. Para el caso del color verde claro, los resultados son muy diferentes, es decir, con la DE no se obtienen granos muy bien definido (áreas grandes) ya que no se aumenta más el umbral con el fin de no obtener falsos positivos, a continuación en la figura 9 se puede observar este resultado en donde el área que está encerrada en un círculo es un café blanquecino, indicando que si se aumenta más el umbral este puede ser confundido como un verde claro, por otro hay granos verde claro que pueden no ser tomados por el sistema mediante la DE, esto se puede apreciar con los granos que están encerrados en el círculo verde. Figuera 9. Resultados obtenidos mediante las distancias euclidiana y de Mahalanobis con los granos verde claro. Grafica 1. Distribución de la media de todos los granos de café en el plano RGB Una vez obtenidos estos datos se prosigue a la realización de las pruebas (Vale la pena recordar que la DE solo utiliza el vector m). Para el documento únicamente se presentan las pruebas más relevantes, por esta razón se ha presentado a propósito la imagen de la figura 5 ya que posee las 5 diferentes clases de granos de café (3 clases para el caso del color) y hay un grano verde claro en específico que tiene una similitud elevada con respecto a los verde grisáceo lo cual puede llevar a que el sistema confunda este tipo de granos. En la figura 8 se muestran los resultados obtenidos con las dos técnicas para los granos verde grisáceo. En esta imagen se puede apreciar que tanto la DE como la DM funcionan correctamente aunque la DM es un poco mejor, por otro lado no se define un umbral mayor ya que si se llega a aumentar más el umbral en cualquiera de los dos casos el grano verde claro de tamaño grande que está al lado derecho de la imagen puede llegar a ser confundido como un grano verde grisáceo. Figura 8. Resultados obtenidos mediante las distancias euclidiana y de Mahalanobis con los granos verde grisáceo. Teniendo en cuenta los resultados anteriores se decide trabajar con la distancia de Mahalanobis sin embargo, para poder identificar los granos de café se requiere de otras técnicas ya que como se puede observar en las figuras 8 y 9 hay muchas áreas y no se pueden ver formas bien definidas, por consiguiente con estos resultados no se pueden llegar a clasificar los granos de café. A continuación se presenta el algoritmo utilizado para la clasificación de los granos por color mediante esta técnica. Figura 10. Algoritmo para la clasificación del café de acuerdo al color mediante la distancia de Mahalanobis entrenamiento de la red). La media y la varianza están dadas por las ecuaciones (8) y (9) respectivamente. Y V Como se puede observar en la figura 11, en este punto se obtienen únicamente los granos indicados con las áreas exactamente igual a las de la imagen original a excepción de un grano verde claro, sin embargo es un área bástate parecida a la original por lo cual puede asumir un valor correcto de área (un grano grande). C. Redes Neuronales Se utiliza una Red Multi-Layer Feed-Forward [17] y se entrena mediante el algoritmo Backpropagation vasado en Levenberg Marquardt [18]. Para el entrenamiento de la red se realizara una extracción de características a partir de las intensidades de cada pixel, mediante algunas medidas estadísticas. Dentro de las características más significativas que se tienen en cuenta son la asimetría y la curtosis [19]. Una distribución, o conjunto de datos, es simétrica si se ve la misma distribución a izquierda y a derecha del punto central, la simetría está dada por la ecuación (6), en donde 3 i 1 3 La curtosis es una medida de si los datos alcanzaron su punto máximo o plana en relación con una distribución normal. Es decir, los conjuntos de datos con alta curtosis tienden a tener un pico distinto cerca de la media, disminución con bastante rapidez, y tienen colas pesadas. Los conjuntos de datos con curtosis baja tienden a tener una parte superior plana cerca de la media en lugar de un pico agudo. Una distribución uniforme sería el caso extremo. La curtosis de una desviación normal estándar está dada por la ecuación (7) R Grafica 2. Distribución de la varianza de las tres clases en el plano RGB Kur En la gráfica anterior se puede ver que las tres cases notablemente están separadas entre sí, sin embargo hay unos puntos de varianza que pertenecen al verde claro que está muy cerca a las otras clases a tal punto de que se mescla con los blanquecinos, por consiguiente esta característica no va a ser tomada en cuenta para el entrenamiento de la red. 4 (Yi Y ) i 1 ( N 1) 4 B N (Yi Y ) i 1 es la (Yi Y ) ( N 1) 2 N G datos Skew Y i 1 Antes de empezar a entrenar la red hay que observar la distribución de cada clase de las características seleccionadas, esto se hace con el fin de utilizar únicamente las características necesarias en el entrenamiento y no incurrir en un sobre entrenamiento. A continuación se muestran las distribuciones en el plano RGB de la varianza (grafica 2), la media (grafica 1), la curtosis (grafica 3) y la asimetría (grafica 4). desviación estándar, Yi son los datos y Y es la media de los N N B Figura 11. Imagen binaria con los granos de café de interés 1 N 1 N 3 Las otras características tomadas en cuenta para entrenar la red son la media y la varianza ya que [20] las utiliza para el entrenamiento de su red neuronal en cuento a la clasificación por color ([20] utiliza la desviación, sin embargo la desviación es la raíz cuadrada de la varianza, por consiguiente escoger varianza o desviación no afecta significativamente el G R Grafica 3. Distribución de la curtosis de las tres clases en el plano RGB B En las gráficas 1 y 3 se puede ver como las clases se encuentran totalmente separadas, (la curtosis no esta tan separada como la media, no obstante se logra diferenciar la distribución entre las clases y los puntos entre clases no se mesclan aunque hay muy pocos que están cerca), en la gráfica 4 se encuentra la de la distribución de la asimetría en donde se muestra que posee el mismo inconveniente de la varianza, por esta razón únicamente se tienen en cuenta las características de la media y la curtosis para entrenar la red. G R Grafica 4. Distribución de la asimetría de las tres clases en el plano RGB En para el entrenamiento de la red y determinación del número adecuado de capas ocultas se utiliza validación cruzada [21]. El promedio del proceso de validación cruzada haciendo uso de tres capas ocultas (que es el numero óptimo de capas ocultas hallado para esta aplicación) es de 0.99, es decir solo un grano fue seleccionado erróneamente (un grano blanquecino fue tomado como verde claro). En esta parte ya se puede dar por terminada la red, sin embargo aún se puede optimizar más, para lograrlo únicamente se utilizan las tres características más significativas; la media de cada canal en este caso. Como se puede observar en la gráfica 1, las distribuciones entre los tres grupos son linealmente separables y están bastante separados un grupo del otro. Realizando esto se desea que los resultados mejoren o se mantenga (porque la eficiencia de la anterior red es del 99.9%), pero que el coste computacional de la aplicación disminuya. Haciendo uso únicamente de la media no es necesaria la validación cruzada (se toman 60 granos para entrenamiento y 240 para prueba), además se podría llegar a utilizar una sola neurona en la capa oculta ya que las distribuciones son linealmente separables, no obstante en esta aplicación los resultados no son los mejores, por consiguiente se utilizan dos neuronas. Los resultados obtenidos haciendo uso únicamente de estas tres características son realmente buenos, es más, aumento la eficiencia del sistema al 100%. A continuación en la figura 12, se muestra la estructura de la red neuronal utilizada en el sistema clasificador. Consta de 3 neuronas de entradas, 2 neuronas en la capa oculta y 1 neurona de salida (con tres estados -10, 0, 10). Figura 12. Estructura de la red neuronal utilizada en la clasificación por color. VI. DETERMINANDO LA CALIDAD DEL PRODUCTO El desarrollo del sistema clasificador de granos de café para determinar la calidad del producto se basa en aplicar las dos técnicas de clasificación por color, junto a la clasificación de acuerdo al tamaño, juntando las dos características se le da una calificación a cada grano como se estipula en la tabla 4. La clasificación por tamaño es bastante simple, únicamente se basa en la obtención y determinación de áreas para el caso del histograma y en el conteo y eliminación de áreas para el caso de la segmentación (Distancia de Mahalanobis en este caso). Para calcular la calidad a partir de la red neuronal se hace de forma similar a la manejada en la comparación de histogramas en cuento al tamaño, el resto del proceso se realiza con la red neuronal, pero en si la metodología para determinar la calidad mediante las características de color y tamaño es la misma que la presentada en la figura 13, por consiguiente este clasificador también posee el mismo problema de la ubicación y cantidad de granos debido a que se utilizan regiones de interés. Figura 13. Algoritmo utilizado para determinar la calidad del café por medio de la comparación de histogramas y determinación de áreas. Figura 14. Algoritmo utilizado para determinar la calidad del café por medio de la distancia de Mahalanobis, y el conteo y eliminación de áreas. VII. ANÁLISIS DE LOS RESULTADOS En cuanto a la clasificación por tamaño no hay ningún inconveniente con la comparación de histogramas y en la red neuronal ya que únicamente lo que se hace es binarizar el grano de interés (la ROI con la que el sistema esté trabajando en el momento) y determinar su área por consiguiente, se pueden clasificar granos de cualquier tamaño. Con la segmentación no ocurre lo mismo debido al proceso de eliminación de ruido (áreas pequeñas), se escoge eliminar áreas considerablemente grandes (menores a los granos medianos) con el objetivo de reducir la posibilidad de que se presenten falsos positivos. La clasificación por color es un proceso más complicado que el anterior. Lo primero que se debe tener en cuenta es la selección de un buen patrón; un buen patrón no es aquel que se toma del mejor grano, un buen patrón es aquel que en lo posible reúna las características de todos los granos que se encuentren dentro de esa clase sin que lleguen a confundirse con los de las otras clases. En primer sistema planteado (clasificador de café basado en la comparación de histogramas) se puede llegar a pensar que utilizando los tres canales (RGB) en la comparación de histogramas se obtienen mejores resultados que con imágenes a escala de gris, sin embargo en esta aplicación los histogramas RGB de las tres clases eran muy similares (más que todo el verde claro y el blanquecino), por esta razón se decide observar el comportamiento de estos en escala de gris, con los histogramas a escala de gris se obtiene una diferencia mayor entre clases. Aunque se escogió la mejor distribución entre los histogramas para hacer la comparación, los resultados no fueron para nada buenos, de 300 granos 154 fueron clasificados por el sistema erróneamente, con esto el sistema basado en la comparación de histogramas queda descartado inmediatamente. Si bien los resultados del sistema anterior fueron muy malos, se ideo una forma de mejorar el sistema; como se puede observar en la tabla 6, la mayoría de granos que son confundidos, son los verde claro con respecto a los blanquecinos, pero los blanquecinos con respecto a los verde claro no es muy común que se confunda, por consiguiente se decide sacar esta clase (blanquecino) dentro del proceso y determinarla mediante el descarte, es decir los granos que no pertenezcan a la clase verde grisáceo ni a verde claro son considerados como blanquecinos, de esta forma el sistema mejoro bastante, de 300 granos 10 fueron clasificados erróneamente, es decir el sistema paso de ser pésimo a aceptable o relativamente sobresaliente. Aunque los resultados son buenos mediante esta solución, no es aconsejable ya que se ha retirado una clase del sistema, si algún grano verde claro o verde grisáceo no es tomado por el sistema, este pasa a ser considerado como un grano blanquecino ocasionando más errores al sistema, otro caso es por ejemplo que si N (suponga que solo hay N granos blanquecinos) granos blanquecinos son tomados como verde claro el sistema dice que hay N granos blanquecinos, lo cual lleva al sistema a una inconsistencia bastante grande causando grabes errores en la clasificación del producto. La segmentación por color en esta aplicación no es algo tan trivial, debido a las características de color que presentan los granos de café, con una segmentación por color en si no pueden clasificar los granos de café, sin embargo es el primer y más importante subproceso para llevar a cabo la clasificación por color mediante una segmentación, es por ello que se realizan pruebas con las dos técnicas propuestas; DE y DM, la primera es más sencilla que la segunda y genera un menor coste computacional (0.14s frente a 2.2s) y es muy efectiva en cuanto a objetos que presenten tonos uniformes o muy simulares pero, para objetos que presentan tonos no uniformes es mejor la DM ya que con ella se puede segmentar varios tonos de color es decir, si un grano verde claro posee en alguna parte una coloración más oscura la DE no la toma como parte del grano ocasionado un área incompleta (con respecto al grano), mientras que la DM toma las dos tonalidades como parte del mismo objeto no obstante, hay que tener cuidado con las tonalidades para que sistema no confunda los granos verde grisáceo con los verde claro, es por ello que el umbral juega un papel importante en este proceso de segmentación. Una vez seleccionado un patrón y umbral adecuado se determina que para esta aplicación es mejor utilizar la DM (aunque la DE puede funcionar bien si se selecciona un buen patrón y umbral, en esta aplicación la DM resulta ser mejor pero no lo suficiente como para descartar DE como solución). Una vez se identifica la técnica para segmentar los colores más representativos de la imagen, aun no se tienen unos buenos resultados para llevar a cabo la clasificación es por ello que surgen como alternativa de solución las operaciones morfológicas y lógicas, es así como en la sección V(B) se muestra que haciendo uso de estas operaciones se pueden obtener áreas bien definidas o completas de los granos, con estas áreas ya es posible clasificar los granos de café sin embargo, debido a las operaciones morfológicas surge el inconveniente con los granos pequeños pero, es necesario realizarlas para que el proceso de segmentación tenga éxito. El sistema basado en la segmentación por color brida unos resultados realmente buenos, de 340 granos solo 1 es clasificado erróneamente. La ventaja que posee este sistema frente a los otros dos es que no le importa la cantidad de granos ni la ubicación de los mismos, esto para el usuario es de mucha ayuda porque no tiene que contar los granos ni ubicarlos ordenadamente. No obstante el sistema presenta fallos ante granos muy pequeños, es decir que posean un área en pixeles inferior a 1500 o 1600 ya que son eliminados en el proceso de eliminación de ruido, aunque es un fallo del sistema, este tamaño en los granos de la región no es muy común, por esta razón no se le da mucha importancia a este inconveniente. Clasificación Mediante Comparación De Histogramas Clasificación Mediante Segmentación De Color Clasificación Mediante Redes Neuronales Coste Computacional 0.2 segundos 0.65 segundos (Dependiendo del tamaño de la imagen, son 0.65segundos para una imagen igual de grande a las que se utilizan para el histograma) 4.5 segundos Cantidad De Granos El sistema está diseñado para exactamente 15 granos (Se puede aumentar sin embargo, la cantidad de granos siempre tiene que ser la misma) Indefinido, los que el usuario desee (El límite es la cantidad de granos que la cámara pueda capturar a la distancia indicada, 20cm en este caso) Coste Computacional Y Cantidad De Granos Si la cantidad de granos se aumenta el coste computacional también lo hace Ubicación De Los Granos Tienen que estar ubicados siempre en los mismo lugares Factor cantidad de granos clasificados erróneamente y errores (10 granos clasificados erróneamente) Existe una posibilidad bastante grande posibilidad de que los granos se confundan El cote computacional siempre es el mismo, independiente de la cantidad de granos (lo único que puede ocasionar que el coste computacional aumente o disminuya es el tamaño de la imagen) Pueden estar ubicados como el usuario lo desee (siempre y cuando los granos no se toquen) (1 grano clasificado erróneamente) Los granos de café con un tamaño inferior a 6mm (tamaño pequeño) no son tomados por el sistema (Esto se debe al proceso de eliminación de áreas para eliminar el ruido). Igual que en el sistema basado en la comparación de histogramas. Si la cantidad de granos se aumenta el coste computacional también lo hace Tienen que estar ubicados siempre en los mismo lugares (Ningún grano clasificado erróneamente) Ninguno encontrado Tabla 5. Comparación entre los tres sistemas clasificadores de café Los resultados obtenidos por la rede neuronal es excelente de 240 granos de prueba todos fueron clasificados correctamente, este sistema es realmente bueno, sin embargo como se está trabajando mediante regiones de interés surge mismo inconveniente que en la comparación de histogramas; la ubicación y la cantidad. Aparte de este inconveniente el sistema de clasificación basado en redes neuronales no presentan ningún otro fallo. Según la tabla 5, los sistemas más indicados para llevar a cabo la tarea de clasificación son; el basado en segmentación y el de redes neuronales, aunque los dos sistemas son realmente buenos (excepto por el coste computacional a comparación de los otros dos sistemas, pero el coste computacional no importa mucho en este proyecto ya que el objetivo es determinar la calidad del producto), por sencillez para el usuario se decide que el mejor sistema es el basado en la segmentación, el sistema basado en redes neuronales es muy bueno y puede llegar a ser mejor que el de segmentación, no obstante trabaja con regiones de interés y los granos deben estar ubicados en ciertas posiciones de la imagen, así mismo deben tener un número fijo de granos. VIII. CONCLUSIONES las imágenes logradas para la generación del banco son bastante buenas, a ellas se debe el éxito de los clasificadores, estas imágenes poseen un fondo netamente blanco, es decir un valor de 255 en cada canal, esto facilita la extracción de los valores RGB del café sin tomar el fondo, esto hace que el sistema se concentre únicamente con el objeto de interés. Este fondo blanco se logra con el algoritmo de procesamiento propuesto (Figura 3). Esto hace que los granos de las imágenes conserven su coloración, es decir que en el fondo las imágenes no se encuentran ruidos o manchas de color generadas ante algún factor externo, gracias a esto se puede realizar una eficiente extracción de características. En cuanto a la comparación de histogramas no se lograron buenos resultados, inicialmente de 300 granos el sistema selecciono 154 granos erróneamente lo cual es inaceptable, más del 50% de los grano es seleccionado erróneamente, esta relación de error se logró disminuir eliminado la clase blanquecina en el proceso de clasificación, es decir el sistema realmente clasifica dos clases y la tercera la sume, el problema de este método es que se pueden presentar más errores y muy graves, como por ejemplo: un grano verde grisáceo puede ser confundido con un verde claro o viceversa, también puede ocurrir que un grano sea tomado como verde grisáceo y verde claro al mismo tiempo lo que ocasiona que la cantidad de granos malos disminuya según el sistema (o en el peor caso dar una cantidad negativa de granos malos). En definitiva el sistema clasificador de café basado en la comparación de histogramas no recomendable para determinar la calidad del producto. Puede ser que el sistema basado en histogramas no funciona correctamente ya que este toma en cuenta toda la ROI (incluyendo el fondo), por este motivo los histogramas de las tres clases poseen valores elevados de brillo. Una forma de solucionar esto es extrayendo únicamente el color del grano aprovechando el fondo uniforme de las imágenes (como se hizo con la extracción de características de la red neuronal). Mediante el sistema de clasificación que se basa en la comparación de histogramas se puede ver que no siempre es Coffee Beans Classifier By Characterizing Images To Determine The Product Quality mejor trabajar con los tres canales de la imagen ya que con imágenes a escala de gris también se puede llegar a diferenciar las tonalidades (en el caso de diferenciar colores si es mejor utilizar los tres canales), ya que como se puede observar en la sección V(A), mediante imágenes a escala de gris existe una diferencia mayor entre las clases que utilizando los tres canales, inicialmente se podría llegar a pensar lo contrario (puede que así sea en muchas aplicaciones) pero en esta aplicación funciona mejor con imágenes a escala de gris. El sistema que se basa en la segmentación (que resulto ser la mejor opción para determinar la calidad del producto) resulto ser más complicado de lo esperado cuando se planteó la técnica como alternativa de solución, ya que no se tenía previsto trabajar con operaciones morfológicas ni lógicas que fue la solución propuesta para los problemas que se presentaron después de aplicar la distancia de Mahalanobis, por otro lado se planteó trabajar con la distancia Euclidiana sin embargo se obtuvieron mejores resultados con la otra distancia, es por ello que se decide trabajar con la distancia de Mahalanobis. Aunque se lleva a cabo un proceso bastante largo para conseguir una segmentación adecuada, los resultados obtenidos son muy buenos ya que de 340 granos solo uno fue clasificado erróneamente, esto significa que el sistema posee una eficiencia del 99%. Finalmente el clasificador basado en redes neuronales resulto ser uno de los mejores y utiliza únicamente tres características (la media de cada canal), este sistema fue capaz de seleccionar todos los granos correctamente, es decir la eficiencia del sistema es del 100%, no obstante tiene el inconveniente de a cantidad de granos en la imagen y la ubicación de los mismos, si se logra solucionar este inconveniente este sistema puede llegar a ser el mejor debido a que no posee el inconveniente que presenta la segmentación; que no toma en cuenta los granos muy pequeños (aunque como ya se dijo, no son muy comunes en la región). Pero por el momento el mejor sistema entre los tres es el basado en la segmentación por color. Trabajos futuros Dentro de los trabajos futuros hay dos fases importantes que se deben tener en cuenta para dar por finalizado el sistema, la primera fase es solucionar el inconveniente que posee el sistema basado en redes neuronales y la segunda es adecuar el sistema para que realice las capturas de los granos cuando el usuario se lo indique, porque el sistema actual únicamente puede ser utilizado con las imágenes del banco. REFERENCIAS [1] [2] [3] Grounds For Change, What is Fair Trade Certification [Online], disponible_en_<http://www.groundsforchange.com/learn/fairtrade.php? HPSESSID=daa6ca9f51cb05a2ed38f2e38d7ea286> [Citado 13 de mayo del 2012] Ficha técnica del café, Coffea arábica, Perú [Online], disponible en <http://clasev.net/v2/pluginfile.php/51611/mod_forum/attachment/1517 9/ficha%20tecnica%20del%20cafe.doc> [Citado 08 de Septiembre del 2012] Normas Jurídicas de Nicaragua, Norma Técnica De Café Verde [Online], Disponible_en<http://legislacion.asamblea.gob.ni/Normaweb.nsf/fb812b d5a06244ba062568a30051ce81/3b18bf362633187c062572dc006fa835? OpenDocument>[Citado 01 de Septiembre del 2012] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] Dedy Wirawan Soedibyo, Kudang Boro Seminar, Usman Ahmad, I Dewa Made Subrata, The Development of Automatic Coffee Sorting System Based on Image Processing and Artificial Neural Network, IPB Bogar Agricultural University Scientific Repository, 2010. Faridah, Gea O. F. Parikesit, Ferdiansjah, Coffee Bean Grade Determination Based on Image Parameter, TELKOMNIKA, Vol.9, No.3, December 2011, pp. 547~554. Habtamu Minassie Aycheh, Image Analysis For Ethiopian Coffee Classification [online], Addis Ababa University School of Graduate Studies, 2008, disponible en la pagina: <http://shawndra.pbworks.com/f/IMAGE+ANALYSIS+FOR+ETHIOPI AN+COFFEE+CLASSIFICATION.pdf> [Citado 13 de mayo del 2012] Mathworks, Visión Artificial Con MatLab [Webinar], producido por David_Pérez,_43_min,_disponible_en<http://www.mathworks.com/web ex/recordings/ES_110928_ComputerVision/index.html> [Citado 08 de Septiembre de 2012] Carlos Platero Dueñas, Universidad Politécnica de Madrid, Cap.5 Segmentación, 216 pág., 2008. González, Woods, Digital Image Processing, second edition, Cap.1 Introduction, Prentice Hall, ISBN 0-201-18075-8, 2002. Cesar Bustacara, Departamento de Ingeniería de Sistemas, Pontificia Universidad Javeriana, Visión Artificial, Técnicas De Iluminación, 2011, Disponible_en<http://sophia.javeriana.edu.co/~cbustaca/Vision_Artifici al/presentaciones/pdf/Iluminacion.pdf> [Citado el 14 de diciembre de 2012] González, Woods, Digital Image Processing using matlab, second edition, Cap.6 Color Processing, Prentice Hall, ISBN 9780982085400, 2009. Konstantinos G. Derpanis, The Bhattacharyya Measure [Online], 2008, Disponible_en<http://www.cse.yorku.ca/~kosta/CompVis_Notes/bhattac haryya.pdf> [Citado el 8 de diciembre de 2012] N. A. Thacker, F. J. Aherne and P. I. Rockett, The Bhattacharyya Metric as an Absolute Similarity Measure for Frequency Coded Data, Kybernetika, 34, 4, 363-368, 1997. Kardi Teknomo, Eunclidean Distance [Online], Disponible en <http://people.revoledu.com/kardi/tutorial/Similarity/EuclideanDistance. html> [Citado 6 de diciembre de 2012] González, Woods, Digital Image Processing using matlab, second edition, Cap.12 object recognition, Prentice Hall, ISBN 9780982085400, 2009. González, Woods, Digital Image Processing, second edition, Cap.6 Color Image Processing, Prentice Hall, ISBN 0-201-18075-8, 2002. Daniel Svozil and others, Introduction to multi-layer feed-forward neural networks, Chemometrics and Intelligent Laboratory Systems 39, 43-62, PII SO169-7439(97)00061-O, 1997 S.Sapna and others, Backpropagation Learning Algorithm Based On Levenberg Marquardt, Computer Science & Information Technology (CS & IT), pp. 393 398, ISSN 2231-5403, 2012. NIST SEMATECH, e-Handbook of Statistical Methods, Measures of Skewness and Kurtosis [Online], Disponible en <http://www.itl.nist.gov/div898/handbook/index.htm> [Citado 15 de Abril de 2013] Kivanç Kiliç and others, A 78 (2007) 897 904. Cosma Shalizi, Evaluating Statistical Models, Carnegie Mellon University, Departament of Statistic, 2011. Jhon Alexander Díaz Acevedo. Estudiante de ingeniería electrónica de la Universidad de Cundinamarca de Fusagasugá y tiene un diplomado en web 2.0 y VoIp. Trabaja como monitor en el laboratorio de electrónica de la UdeC. Temas de interés: Control inteligente, Visión por computador, Seguridad informática, Software y nuevas tecnologías.