Download Extracción de bordes de imágenes digitales a través del análisis
Document related concepts
no text concepts found
Transcript
Extracción de Bordes de Imágenes Digitales a Través del Análisis Multifractal Duffaut, E. L. A. i ,2, Posadas, D. A.1 y Quiroz, R.1 1 Centro Internacional de la Papa, División de Manejo de Recursos Naturales PO Box 1558, Lima 12. 2 Pontificia Universidad Católica del Perú, Escuela de Graduados RESUMEN La extracción de información de una imagen siempre ha sido un tema de gran importancia práctica tanto en física como en las ciencias aplicadas. En los últimos años, al gran avance tecnológico de la informática ha permitido un gran salto en el desarrollo de técnicas dedicadas al análisis de imágenes. Así, en el presente trabajo desarrollamos un método para el análisis y extracción de los bordes de una imagen digitalizada basado en la teoría multifractal, técnica aun muy poco usada en la literatura para el análisis de imágenes. A diferencia de los métodos clásicos, la técnica multifractal asocia la imagen a un conjunto de medidas relacionadas a su intensidad de niveles de gris en cada píxel, los cuales a su vez, son caracterizados por un coeficiente denominado de Holder indicador de la singularidad de un elemento de la imagen. En este contexto son introducidos parámetros de medidas como “sum”, “max”, “min”, e “iso”, que cuantifican la singularidad en torno a un punto de la imagen, obteniendo información del comportamiento local de la medida perteneciente al borde que se quiere extraer. De esta forma el proceso es capaz de detectar y extraer los bordes de una imagen en una forma mucho mas robusta que los métodos tradicionales. Son presentados ejemplos de aplicaciones donde se muestra la robustez del método con relación a los métodos mas comúnmente utilizados. Palabras Clave: Multifractales, Coeficiente de Holder, Dimensión Fractal, Box-counting, Medidas (Capacidades) I. INTRODUCCIÓN La extracción de información de una imagen siempre ha sido un tema de suma importancia en el campo de la Física por el fácil manejo de una imagen, su bajo costo y en los últimos años, por el avance tecnológico de la informática. El campo de aplicaciones del análisis de imágenes es muy amplio cubriendo áreas como la medicina, agricultura y medio ambiente, robótica, sensoramiento remoto, biología y otros. Una aplicación importante del análisis de imágenes es la segmentación de una imagen que consiste en obtener una descripción concreta en términos de sus bordes y/o regiones. Esto significa identificar las características que describen tanto los contornos (detección de bordes) como las regiones donde ellos se concentran (extracción de regiones). Estas dos aproximaciones son duales pero sus algoritmos de identificación son muy diferentes y desgraciadamente la mayoría de veces lleva a resultados diferentes de segmentación. Los métodos clásicos de segmentación de imágenes usualmente asumen los bordes como los extremos locales del gradiente de los niveles de gris, los cuales introducen dificultades en su detección debido al ruido introducido por la cámara, el muestreo o los mismos objetos que componen la imagen. Estas dificultades de segmentación se genera básicamente por el hecho de usar operadores matemáticos definidos en el dominio de las funciones continuas y extrapoladas a funciones discretas de una imagen (Levy and Berroir, 1993). En los últimos años nuevas técnicas de procesamiento se han introducido, como los métodos basados en la teoría de wavelets (Prasad and Iyengar, 1997) y multifractales (Guiheneuf and Levy, 1996). En el presente trabajo se investiga la potencialidad del método multifractal para la segmentación de imágenes. cada píxel de la imagen (Chhabra, et al., 1989). II. FENOMENO MULTIFRACTAL La geometría fractal fue propuesta en los años setenta y ganó aceptación inmediata en diversas áreas científicas debido a su flexibilidad para describir las formas irregulares encontradas en la naturaleza (Mandelbrot, 1982, Feder, 1988; Gouyet, 1996). Esta situación, también observada en otros campos científicos, llevó a definir los llamados “fractales estadísticos” en contraposición a los “fractales matemáticos”. Los primeros son estadísticamente válidos en un determinado rango de escalas, mientras que los “fractales matemáticos” son exactos y válidos en todas las escalas de definición (Bicsek, 1992). El simple conocimiento de la dimensión fractal de un objeto es insuficiente para caracterizar su geometría, así como también cualquier propiedad física inherente a dicho objeto. La dimensión fractal describe objetos uniformes o sistemas homogéneos, pero no ofrece información alguna a cerca de las bajas o altas distribuciones irregulares dentro del sistema. Por ejemplo, el método fractal no hace distinción entre los dos cuadrados que se muestran en la figura 1, a pesar de la notable diferencia en la proporción de negro que cada uno de ellos contiene. Con la finalidad de obtener información de este tipo, una generalización del concepto, “Los Multifractales”, deberá ser usado. El concepto de multifractales contempla un número infinito de dimensiones fractales y por lo tanto puede ser más apropiado para la descripción de propiedades físicas. Un proceso multifractal se caracteriza por eventos extremos y más o menos aislados, asociados a una medida μ que representa la “materia” contenida en δ1 δn Figura 1 peso de la medida de una caja A pesar de las ventajas conceptuales y de una mayor flexibilidad en el análisis, la técnica multifractal no ha sido aplicado intensivamente para el procesamiento imágenes digitales, posiblemente debido a la complejidad matemática que ella representa y las limitaciones computacionales. III. DEFINICIÓN DE MEDIDA Y EXPONENTE DE HOLDER El principal motivo por el que se justifica la introducción de multifractales en el análisis de imágenes es que la dimensión fractal es una herramienta excelente para caracterizar la irregularidad de una curva o una superficie. Comúnmente se asume que una imagen (2D) puede ser vista como una superficie 3D, o equivalentemente los niveles de gris pueden asumirse como una coordenada en el eje Z. Así, se introducirá la definición de una medida sobre una región asociada a una función discreta de niveles de gris lo cual nos permitirá usar técnicas fractales para resolver algunos problemas específicos. En este contexto son introducidos parámetros de medidas como “sum”, “max”, “min”, e “iso”, sobre una región Ω perteneciente al conjunto de escenas de la imagen (Levy and Berroir, 1993). Si Ω’ es el subconjunto de Ω donde la intensidad de los niveles de gris p(i) definido en cada píxel i es diferente de cero, se define: μmax(Ω)=maxi∈Ωp(i) μmin(Ω)=mini∈Ω’p(i) La medida “iso” depende de una discretización de niveles de gris tal que: pδ(i) = pδ (j) ⇔ ⏐p(i)-p(j)⏐< δ Si G(Ω) es el centro geométrico de Ω, entonces se define: μ iso (Ω) = Card {i ∈ Ω / p δ (i ) = p δ ( j )} Veremos que los exponentes dados por las diferentes medidas dan diferente información sobre las singularidades encontradas: αmáx. y αmin. que solo dependen del peso de la singularidad, αiso solo depende de la forma de singularidad, y αsum depende de ambas características (peso y forma), siendo el parámetro de singularidad α el exponente de Holder, definido como: α= log(μ (box)) log ε De este modo el exponente α corresponde a la dimensión fractal de la medida. Para una clase grande de multifractales el valor de α está restringido a un intervalo [αmin, αmax], donde 0 < αmin < αmax < ∞. Este valor, para una señal unidimensional (1D, teniendo medida μ ) está próximo de 1, y para 2D (imágenes) esta cerca de 2. Si establecemos una distribución de frecuencias de este parámetro α en toda la imagen, para cada valor de α, se evalúa el numero de cajas Nε (α) de tamaño ε teniendo exponente de Holder α. Desde que el número total de cajas de tamaño ε es proporcional a ε−DE donde DE es la dimensión euclidiana de la caja, la probabilidad de tener el valor α es pε = Nε(α) / ε−DE Desde que ε →0, es apropiado considerar la función: log N ε (α ) , f ε (α ) = log ε para el cual existe un limite bien definido f(α) . Esto significa que, para cada α y ε decreciente, el número de cajas aumenta como: Nε (α)≈ ε−f (α). El exponente f(α) es una función continua de α. En muchos casos la gráfica de f(α) es de forma parabólica, con un máximo cerca de α = 1 (para señales 1D), o cerca de α = 2 (para señales 2D). Los valores de f(α) son interpretados como una dimensión fractal generalizada denominada de espectro multifractal (Bicsek, 1992). Existen varios métodos para obtener la función f(α), en este trabajo es usado el método de Box-counting descrito en la sección IV. La clasificación del espectros f(α), usado para el análisis de imágenes fue introducida por LevyVehel and Berroir (1993). El valor de α es asociado a la información LOCAL de la regularidad de un punto en la imagen, pues la medida μ hace que cada píxel de la imagen sea caracterizado por un valor propio de α. Por ejemplo, puntos de la imagen con α ≡ 2 son regiones donde la medida es regular y la probabilidad de cambios en la señal es pequeña. Puntos con α ≠ 2 denotan regiones donde "algo ocurre" y son consideradas zonas poco regulares. Así, puntos con α << 2 o α >> 2 denotan regiones caracterizadas por un gradiente muy alto o discontinuidades de la señal. IV. METODO DE HISTOGRAMA (BOX-COUNTING) Una de las diferentes versiones del cálculo numérico de la dimensión fractal es la llamada de box-counting que se relaciona con el concepto de estructura auto-similar. La metodología consiste en sobreponer a la estructura a ser analizada una rejilla con una malla de tamaños, ε formando un recubrimiento de cajas. El número de cajas que contienen valores de la estructura a caracterizar es Nε(α), el cual varia con el valor de ε escogido. Figura (2) Método de "box-counting" cubrimientos a diferentes escalas Para realizar el correspondiente calculo de la dimensión fractal se procede a contar el número de cajas Nε(α) a diferentes escalas (figura (2)), la variación de escala de un paso al siguiente es dependiente del tamaño de la imagen y de los múltiplos de ese tamaño. El valor de la dimensión corresponde a la pendiente de la representación log(Nε(α)) Vs. log(ε) (figura (3)). Figura (3). Método de "box-counting" Regresión log(Nε(α)) vs. Log(ε) La gran ventaja de esta metodología es el hecho de aplicarse en forma sistemática por su simplicidad en la creación del recubrimiento de cajas y el correspondiente recuento, que se efectúa rápidamente, inclusive para imágenes de alta resolución (Bicsek, 1992). El método box-counting se aplica dividiendo el lado L de la imagen en s cajas de igual tamaño (s=L/ε). Estas varían desde la dimensión máxima posible del lado L hasta la unidad mínima de la imagen que corresponde a un píxel. Para cada uno de estos valores de s se realiza un recubrimiento de toda la imagen con una disposición regular de cajas de lado δi =L/s, R(δ). Con el recuento de cajas que contienen algún valor de α en su interior se obtiene el valor de Nε(α). La representación log(Nε(α)) Vs. log(L/ε) que caracteriza a cada conjunto de α’s, y si los puntos aparecen alineados obtenemos la dimensión fractal característica que corresponde a la pendiente de la recta de regresión que pasa por los puntos representativos del rango de escalas consideradas. Obviamente las pendientes asociadas a puntos aislados o a rectas en un plano corresponden a los valores Euclideos de 0 o 1. Si el conjunto es lo suficientemente denso para cubrir totalmente el plano de la imagen a las distintas escalas estudiadas εi, entonces el valor de la dimensión es 2. IV. PROCEDIMIENTO Y ANALISIS Como estamos interesados en extraer los bordes de una imagen usando la técnica multifractal y mostrar su potencialidad, escogimos una imagen con cierto grado de complejidad en su procesamiento. Se trata de una imagen correspondiente a una distribución de pelos de alpaca pertenecientes a una determinada región del camélido (figura 7). Inicialmente transformamos la imagen a escala de grises y luego caracterizamos la imagen con las medidas mencionadas anteriormente (figuras (10), (11), (12), (13)) las cuales formaran grupos dentro de la imagen. Con estos grupos se obtiene un rango de valores de α’s los cuales son agrupados convenientemente y a cada grupo se le calcula su respectiva dimensión de box-counting para una posterior segmentación de la imagen (figuras(14)). El hecho de agruparlos en rangos de valores de α’s es la razón por la que se le conoce, a este método, como “método del histograma”(Chhabra, et al, 1989). Como una comparación se muestra la respuesta de esta técnica al ruido de tipo uniforme (figuras (4), (5) y (6)) comparado, por ejemplo, al método de detector de canny mas ampliamente usado. figura (7) Imagen de microscopia láser de una muestra de pelo de alpaca V. RESULTADOS A continuación mostramos algunos resultados, por ejemplo, la figura 4 muestra como el detector reacciona frente a un ruido uniforme en comparación al detector de bordes de Canny (figuras (5). Con varios niveles de detección obtenemos un mejor resultado (figura (7) medida Iso y posterior segmentación con respecto a las dimensiones cercanas a 1. figura (8) Imagen Binarizada usando método de Otsu (izquierda), detección de bordes detector de Canny figura (4) ruido uniforme (Izquierda) espectro multifractal (Derecha) figura (5) Detector con filtro Canny 0.3 (Izquierda), 1.0 (Medio), 1.9 (Derecha) figura (6) Puntos con f(alfa) cercano a 1 Se muestra también la detección y extracción de Bordes de la figura(7) (500x400 píxeles RGB) y se compara con métodos usados comúnmente como el de threshold usando el método de OTSU y el método de Canny mostrada en la figura(8). También se quiso mostrar como era la detección con respecto a softwares más comerciales (figura(9)) como lo son el de PHOTOSHOP y el COREL DRAW. figura (9) Imágenes de bordes usando diversos métodos de detección de bordes implementados en Photoshop y Corel Draw En las figuras 10,11,12,13 se muestran las imágenes de las características extraídas usando las medidas SUM, ISO, MAX y MIN mostrando también sus respectivos espectros multifractales. Finalmente vemos como una simple binarización de las dimensiones de cada grupo nos muestra una imagen de bordes bien definida según sea la medida, en la figura 14 mostramos los resultados más aceptables. dimensión medida ‘min’ segmentada con dimensiones cercanas a 1 (derecha) VI. CONCLUSIONES Dependiendo del tipo de medida usada, la detección no es muy afectada por la presencia de ruido uniforme. figura (10) imagen de alfas medida ‘sum’ (izquierda), espectro multifractal Podemos destacar que la técnica multifractal se basa solo en la característica de que una línea tiene dimensión 1 por eso es un buen detector Se observa también que la imagen analizada ha sido adquirida con una inadecuada iluminación que afecta a cualquier proceso que se le quiera realizar, pero que la técnica Multifractal no es afectada por este defecto en la toma de la imagen. figura (11) imagen de alfas medida ‘Iso’ (izquierda), espectro multifractal figura (12) imagen de alfas medida ‘Max’ (izquierda), espectro multifractal La medida MIN nos ha destacado las hebras mas definidas y que están mas por encima, en cambio la SUM nos destaca casi todas, siendo esta la que nos dio mejor resultado. En comparación con los otros métodos la técnica multifractal proporciona resultados notoriamente mejores, como se observa al comparar las figuras 8 y 9 con la figura 14 en la cual, según sea la medida, podemos destacar todas las hebras o solo las que no están borrosas. VII. BIBLIOGRAFIA figura (13) imagen de alfas medida ‘Min’ (izquierda), espectro multifractal [1] Introduction to the Multifractal Analysis of Images Jacques Lévy Véhel In Fractal Image Encoding and Analysis, 1998. Book Chapter [2] Multifractal Segmentation of Images Jacques Lévy Véhel and Pascal Mignot In Fractals, Vol. 2, Issue No. 3, pp. 371-378, June, 1994. Refereed Journal Article figura (14) Imagen de dimensión medida ‘sum’ segmentada con dimensiones cercanas a 1(izquierda), imagen de [3] Multifractal Analysis of Choquet Capacities: Preliminary Results Jacques Lévy Véhel and Robert Vojak In Advances in Applied Mathematics, Vol. 20, No. 1, pp. 1-43, January, 1998. Refereed Journal Article [4] Fractal Approaches in Signal Processing Jacques Lévy Véhel In Fractal Geometry and Analysis, The Mandelbrot Festschrift, Curacao. C.J.G. Evertsz, [5] H.-O. Peitgen & R.F. Voss Editors, World Scientific, 1996., 1995. Book Chapter