Download Descargar el archivo PDF
Document related concepts
no text concepts found
Transcript
6CFE01-436 1/11 Cálculo del área foliar mediante técnicas basadas en el análisis RGB-HSB PÉREZ-RODRÍGUEZ, F.1,2, CAMINO-SACO, A.1, MOSQUERA, A.1, ROJO-ALBORECA, A.1,2 y GOMEZ-GARCÍA, E.1 1 VSonCLOUD S.L. www.vsoncloud.com Unidade de Xestión Forestal Sostible, Departamento de Enxeñaría Agroforestal, Escola Politécnica Superior de Lugo, Universidade de Santiago de Compostela. Campus universitario s/n, 27002 Lugo, España. 2 Resumen El Índice de Área Foliar (IAF) – LAI en inglés – es la principal variable para modelizar muchos procesos de fisiología vegetal, como por ejemplo la evapotranspiración, la capacidad fotosintética o la captura de carbono. Para el cálculo de este índice es necesario realizar una estimación de la superficie foliar total, por lo que es necesario conocer la superficie de una cantidad representativa de hojas, en un proceso que ha de ser lo más objetivo, rápido y preciso posible. Sin embargo, este cálculo es complicado debido a la gran diversidad de especies y a la heterogeneidad en la forma de las hojas. Por ello, se ha desarrollado un algoritmo que calcula la superficie de cada hoja partiendo de una imagen de la misma, y que utiliza la técnicas de análisis RGB-HSB, aplicada píxel por píxel. Esta metodología puede ser aplicada de manera destructiva (con extracción de hojas) o no destructiva (sin extracción). Además del cálculo rutinario de la superficie foliar, la aplicación de este algoritmo puede diferenciar partes sanas, dañadas e intermedias en las hojas. Palabras clave Sanidad foliar, LAI, píxel 1. Introducción El cálculo de la superficie de las hojas de una planta es utilizado en muchas disciplinas de las ciencias forestal y agrícola. A modo de ejemplo, el cálculo de la superficie foliar es necesario para la obtención del Índice de Área Foliar (IAF, o LAI en inglés), que es uno de los índices más importantes para el modelado de la capacidad fotosintética de las copas de los árboles, la evapotranspiración y microclimas, entre otros (WEISS et al., 2004). En otros campos, como el de la sanidad vegetal, también es importante ya que se puede estimar la disminución de la capacidad fotosintética de las plantas por pérdida de superficie foliar debida a defoliadores u otros agentes patógenos. Sin embargo, no resulta sencillo determinar con precisión la superficie de un elemento como es la hoja de una planta, cuya forma puede ser más o menos compleja según la especie considerada, e incluso puede existir variabilidad morfológica dentro de una misma especie en sus diferentes estadios. Por ello resulta necesario aplicar una metodología de cálculo de la superficie que no dependa de la subjetividad de un usuario, como puede ser el análisis de las imágenes (SANGWINE & HORNE, 1998). Actualmente existen ciertos software basados en la delimitación de la superficie de hojas, como pueden ser Leaf Analyser® (PARNHAM, 2007), Leaf Gui® (PRICE et al., 2011), WinFOLIA® (WINFOLIA REG, 2004), entre otros, 1/11 que ayudan a determinar con más o menos acierto la superficie foliar; sin embargo, no discriminan las partes de la hoja según su estado sanitario. Una de las metodologías más utilizadas en la delimitación automatizada de la superficie de hojas es la aplicación de técnicas de RGB (Rojo, Verde, Azul) (MA et al., 2008; WANG et al., 2008; TENG & CHUN, 2011), es decir, técnicas basadas en el análisis del color mediante la caracterización de los píxeles que componen una imagen. A este respecto, en las especies forestales los rangos de color verde del espectro visible se pueden asimilar en un porcentaje muy alto a hojas con buena salud, pero no es viable especificar un rango único porque hay una gran variabilidad entre especies. En la Figura 1 se muestra todo el abanico de posibles combinaciones RGB. (255,255,255) (0,255,255) (255,255,0) (0,255,0) (0,255,255) (255,0,0) (0,0,0) (0,0,255) Figura 1: Rango de variabilidad de colores según la variación de la magnitud de RGB con respecto al verde puro RGB (0,255,0) en 16 bits. En este trabajo se presenta un sencillo algoritmo para el cálculo de la superficie de una hoja y para determinar su estado sanitario, basado en la caracterización de los valores RGB de cada uno de píxeles (píxel a píxel). Debido a la comentada amplia gama del espectro verde en especies forestales, este algoritmo se calibra bajo un método empírico y observacional, y se discute si es suficiente para determinar objetivamente la superficie de la hoja, o si es necesario trabajar con conjuntos de píxeles. 2. Objetivos El objetivo principal de este trabajo es el desarrollo de un algoritmo para automatizar la evaluación de píxeles RGB / HSB (Saturación). Con este algoritmo se puede delimitar de forma automatizada la forma de las hojas y su superficie, así como diferenciar partes en la misma. Además, se compara el algoritmo con otros programas. 3. Metodología Una fotografía o imagen escaneada se puede describir como una matriz (x, y) donde xmax e ymax representan la resolución de la imagen, que se compone de (xmax · ymax) elementos, en este caso píxeles. Cada elemento de esa matriz contiene información, como puede ser la 1/11 caracterización RGB, que viene dada por un vector de tres elementos de la siguiente manera: RGB ([R],[G],[B]), donde [R], [G] y [B] son la concentración de rojo, verde y azul, respectivamente, y que se acota de 0 a 255 en colores de 16 bits. Además, uno de los componentes del HSB se define como el grado de saturación del color que indica la pureza, y viene definida como un porcentaje, siendo 0 el mínimo de saturación, lo que indica un color pálido y 100% el máximo, lo que indica un color muy vivo. Para la obtención de píxeles es necesario programar una rutina que recorra cada elemento de la imagen, como se indica a continuación: ‘“Pixel by Pixel” Routine Dim I As New Bitmap(file) For Y = 1 To I.Height - 1 For X = 1 To I.Width I.GetPixel(X, I.GetPixel(X, I.GetPixel(X, I.GetPixel(X, Next Next - 1 Y).R Y).G Y).B A).GetSaturation Un ejemplo de la caracterización RGB de una imagen es la que se muestra en la Figura 2, donde se presentan gráficamente las magnitudes obtenidas en ciertas partes de una hoja. Figura 2: Representación Grafica de las magnitudes RGB obtenidas en ciertas partes de una hoja. Partiendo de la obtención de un barrido RGB de una muestra representativa de hojas tipo obtenida de una base de datos, se ha procedido a la desagregación de las partes de una hoja según su sanidad aplicando las siguientes tres hipótesis para cada zonificación: Hipótesis I: “Las zonas de la hoja de buena salud son de color verde” En este caso (Buen estado sanitario), y aunque el verde se pueda descomponer en una combinación de rojo, verde y azul, la concentración de verde siempre será mayor al resto, obteniéndose toda la gama de verdes posible, desde el verde puro (0, 255, 0), al verde muy 1/11 pálido (200, 255, 200). Matemáticamente, esta hipótesis se puede traducir en la siguiente ecuación: [G] > a · [R] ∩ [G] > b · [B] = Estado Sanitario Bueno donde se va a suponer que la concentración de verde es mayor a la concentración de rojo multiplicada por un parámetro a y también superior a la concentración de azul multiplicada por un parámetro b. Estos parámetros se establecen para poder ajustar el algoritmo final mediante validación. Dentro de esta zonificación de Buen estado sanitario se puede establecer un umbral de transición hacia zonas de Mal estado sanitario, para lo que se puede suponer la siguiente hipótesis: Hipótesis II: “La diferencia entre un estado de buena salud y uno de mala salud depende de la concentración de color rojo, que da como resultado una combinación de amarillo-verde pálido” Según esta hipótesis, es posible establecer la zonificación en los puntos de la hipótesis 1 según la siguiente ecuación: [R] > c · [G] = Estado Sanitario Medio siendo c el parámetro necesario para el calibrado y validación. Finalmente, el resto de la imagen escaneada será hoja verde con menor concentración, o simplemente zonas fuera de la hoja. Esto significa que las concentraciones de rojo y azul serán mayores que la concentración de verde, lo que da paso a la siguiente hipótesis: Hipótesis III: “Los colores marrones son síntoma de mala salud” Esta hipótesis se materializa en la siguiente ecuación: [R] > d · [G] ∩ [R] > e · [B] = Estado Sanitario Malo siendo d y e los parámetros necesarios para el calibrado y validación. En el caso que no entre dentro de ninguna zona de estado sanitario definida en las tres hipótesis, el algoritmo entiende que no hay hoja. El algoritmo completo se muestra a continuación: ‘Desagregación y zonificación de la superficie foliar If [G] > a * [R] And [G] > b * [B] And [HSB] > 0.1 Then If [R] > d * [G] Then ‘Estado Sanitario Medio Else ‘Estado Sanitario Bueno End If Else If [R] > e * [G] And [R] > f * [B] Then ‘Estado Sanitario Malo Else 1/11 ‘Rango fuera de hoja End If End If Para la estimación de los parámetros a, b, c, d y e se ha aplicado la metodología de prueba y error, validada de forma empírica. Para ello se han probado diferentes combinaciones de los parámetros aplicando la comentada rutina "píxel a píxel" a una muestra de 10 hojas extraídas de distintas especies forestales, y luego se han comparado los resultados de la zonificación (estado sanitario bueno, medio y malo) que realiza el algoritmo con la obtenida de manera visual en la muestra de hojas. Una vez desagregada la superficie de la hoja en los diferentes estados sanitarios, se debe proceder al cálculo de su superficie. En este caso se pueden diferenciar dos casos, según el método de obtención de la imagen: Método no destructivo: La imagen de la hoja se obtiene mediante fotografía digital. En este caso el cálculo se efectúa según la siguiente ecuación: Aleaf X Y 0 0 (( f ( x, y))· Apixel donde f ( x, y) 1 cuando el píxel (x,y) entra dentro de la zonificación de Buena, Media o Mala salud, mientras que Apixeles la superficie del píxel. En este caso Apixel es muy difícil de determinar con precisión porque intervienen variables desconocidas, como la distancia de la hoja a la cámara o la resolución. Por lo tanto, se propone que las fotos se tomen con alguna referencia para conocer la escala. Método destructivo: En este método la hoja es extraída y escaneada. La ecuación de cálculo de la superficie en este caso es: X Y Aleaf 0 0 (( f ( x, y)) · Apanel X ·Y donde f ( x, y) 1 cuando el píxel (x,y) entra dentro de la zonificación de Buena, Media o Mala salud, Apanel es la superficie de barrido del scanner y X·Y es la resolución de la imagen escaneada. Para la validación de la metodología y del algoritmo propuestos se ha utilizado una muestra de 20 imágenes de hojas obtenidas mediante el fotografiado y escaneado de diversas especies forestales, anotando de forma manual regiones de píxeles pertenecientes a zonas de las hojas con diferente nivel de salud y comparando los resultados. Por otra parte, con el fin de comparar el algoritmo con otras metodologías, se ha explorado el procesamiento de imágenes de forma no-supervisada (esto es, no basado en reglas) con el objetivo de detectar la salud de las hojas empleando técnicas de cuantización (HECKBERT, 1982). El propósito general es, partiendo de los colores presentes 1/11 originalmente en la imagen, obtener una nueva imagen que cuente con un subconjunto mínimo de colores esenciales pero que conserve la forma de los objetos que componen la imagen inicial. El método aplicado se basa en crear regiones de color homogéneo sobre la base de un nivel de tolerancia que se calcula según el algoritmo de corte de mediana (HECKBERT, 1982) sobre el espacio de color RGB. El proceso de cuantización consiste en: Recorrer cada píxel de la imagen. Construir un conjunto reducido de colores que sean representativos de la imagen a partir del paso anterior. Establecer una correspondencia entre los colores originales y el conjunto de colores encontrado en el paso anterior. Convertir la imagen original utilizando el nuevo conjunto de colores. 4. Resultados 4.1. Determinación de los parámetros Aplicando a una muestra de hojas la rutina “píxel a píxel” con diferentes combinaciones de los parámetros, y comparando los resultados de la zonificación (estado sanitario bueno, medio y malo) que realizaba el algoritmo con la obtenida de manera visual se han obtenido los siguientes valores: a = 1,02; b = 1,00; c = 0,82; d = 1,05 y e= 1,03. En la Figura 3 se pueden observar los rangos de color que delimitan cada estado sanitario al aplicar estos parámetros. Superficie Buena Sanidad Superficie media Sanidad Superficie mala Sanidad Figura 3: Rangos de color obtenidos para cada estado sanitario. Aplicando estos parámetros a un ejemplo práctico se obtiene el resultado mostrado en la Figura 4. 1/11 Figura 4: Ejemplo de aplicación del algoritmo propuesto. Con respecto a la zonificación de Buen estado sanitario, se ha añadido un filtro corrector, dependiendo de la saturación de color o HSB, que ha de ser mayor del 10%, cifra que es arbitraria y que posiblemente requerirá un ajuste. En cuanto a la validación de la metodología y del algoritmo propuestos, en la Figura 5 se muestra un ejemplo de su comparación en una hoja en la que se han acotado de forma manual las regiones de píxeles pertenecientes a zonas de las hojas con diferente nivel de salud, y aleatoriamente dentro de esas zonas, se han extraído los RGB de puntos en esos recintos, con esos datos, se realizó una regresión lineal para establecer las pendientes de la relación [G] –[R] y [G]-[B] y obtener los parámetros según esa zonificación manual. 1/11 Figura 5: Prueba de validación del método comparándolo con los parámetros inicialmente propuestos y los obtenidos mediante regresión de datos. En la figura se muestra el ejemplo de la regresión para el parámetro a. Empleando las técnicas de regresión lineal sobre la relación entre los valores RGB de los píxeles presentes en zonas de buena, media y baja sanidad de las hojas se ha comprobado la validez de los parámetros inicialmente propuestos de forma empírica (ver Tabla 1). Tabla 1: Parámetros obtenidos mediante regresión lineal. a = 1,00522 b = 0,85610 b = 0,65402 c= 0,73367 d = 0,71576 Empíricamente se ha observado que aplicando el algoritmo con los parámetros iniciales, se acotaban las zonas manualmente definidas como tal (Figura 5) correctamente, y que los parámetros obtenidos mediante regresión lineal de las zonas acotadas manualmente no mejoraban los parámetros del algoritmo propuestos inicialmente. 4.2. Comparación con métodos no-supervisados Aplicando la metodología de cuantificación (HECKBERT, 1982) se consigue dividir el espacio de color de la imagen en aquellas partes en las que la variabilidad del color es mayor, reduciendo artefactos (elementos inherentes a la imagen en si, elementos de la compresión, polvo, huellas, etc.) y filtrando las geometrías internas de la hoja, tales como los patrones de las venas o los estomas. El resultado de puede observar en la Figura 6. Figura 6: Ejemplo de aplicación del técnicas de cuantización. Este proceso permite evaluar visualmente de forma más rápida la salud de la hoja que en la imagen original, pero sin embargo, y debido a la simplificación del espacio de color, es mucho menos preciso que la metodología propuesta a la hora de detectar los diferentes niveles de salud, como se observó en la Figura 4. 5. Conclusiones En este trabajo se presenta un algoritmo muy sencillo para calcular la superficie de una hoja y para diferenciar sus partes sanas, dañadas e intermedias, a partir de una metodología 1/11 de recorrido “píxel a píxel” en la que se han supuesto varias hipótesis para la zonificación de la sanidad foliar. Se puede asumir que las hipótesis supuestas son ciertas en un porcentaje muy alto de los casos, pero debido a la gran variabilidad de colores y formas que pueden presentar las hojas de distintas especies (e incluso sus diferencias con la edad), cada uno de los parámetros de las hipótesis propuestas han de ser calibrados con más precisión en cada aplicación. En este estudio la parametrización se ha realizado después de una zonificación visual, ya que ha generado mejores resultados que los obtenidos con técnicas más objetivas o con otras como la cuantización. Aunque el estudio se ha ideado para su aplicación en el campo forestal, el algoritmo propuesto se puede aplicar en cualquier otra investigación que requiera la determinación de la superficie y estado sanitario de hojas, como por ejemplo en viñedos. También puede ser utilizado para modelar hojas sanas y después determinar qué partes faltan en hojas dañadas por defoliadores. 6. Agradecimientos El Grupo de Investigación UXFS esta parcialmente financiado por la Xunta de Galicia a través del Programa de Consolidación y Estructuración de Unidades de Investigación Competitivas 2011, cofinanciado por el FEDER (Fondo Europeo de Desarrollo Regional). 7. Bibliografía HECKBERT, P.S.; 1982. Color Image Quantization for Frame Buffer Display. ACM SIGGRAPH '82 Proceedings. MA, W.; ZHA, H.; LIU, J.; ZHANG, X.; XIANG, B.; 2008. Image-based Plant Modeling by Knowing Leaves from Their Apexes ICPR 2008. 19th International Conference. IEEE Computer Society. 1-4. PARHAM; 2007. LeafAnalyser. Disponible en: leafanalyser.openillusionist.org.uk PRICE, C.A.; SYMONOVA, O.; MILEYKO, Y.; HILLEY, T.; WEITZ J.S.; 2011. Leaf Extraction and Analysis Framework Graphical User Interface: Segmenting and Analyzing the Structure of Leaf Veins and Areoles. Plant Physiology 155, 236-245. SANGWINE, S.J.; HORNE, R.E.N.; 1998. The colour Image Processing Handbook. Chapman & Hall. 443 pág. Londres. SHARMA, A.; 2004. Understanding Color Management. Thomson Delmar Learning. 367 pág. Nueva York. TENG, M.; CHUN JIANG, Z.; 2011. An interactive method for modeling leaves. Fourth International Conference on Intelligent Computation Technology and Automation. IEEE Computer Society 22-25. WANG, L.; YANG, T.; TIAN, Y.; 2008. Crop disease leaf image segmentation method based on color features. In IFIP International Federation for Information Processing, Volume 258; Computer and Computing Technologies in Agriculture, Vol. 1; Daoliang Li; (Boston: Springer). 713-717. 1/11 WEISS, M.; BARET, F.; SMITH, G.J.; JONCKHEERE, I.; COPPIN, P.; 2004. Review of methods for in situ leaf area index (LAI) determination. Part II. Estimation of LAI, errors and sampling. Agric. For. Meteorol. 121, 37-53. WINFOLIA; 2004. Disponible en www.regent.qc.ca/products/folia/WinFOLIASoftware.html