Download Clasificacin_imgenes.. - SIG
Document related concepts
no text concepts found
Transcript
Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Universidad NACIONAL DE ESTUDIOS A DISTANCIA UNED CLASIFICACIÓN DE IMÁGENES MULTISPECTRALES LANDSAT TM POR MEDIO DE REDES NEURONALES NO SUPERVISADAS DOCTORADO EN INTELIGENCIA ARTIFICIAL REDES NEURONALES 2006 Héctor F Gómez A 1 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas INTRODUCCIÓN El presente trabajo utiliza imágenes satelitales como fuentes de datos, a través de los cuales; se logra una clasificación temática y lógica de los mismos. Los datos en una imagen satelital se pueden clasificar entre otros en cobertura de suelo, agua e inclusive temperatura. Con el fin de entender a esta fuente de información, se empezará con un capítulo destinado a los conceptos y usos de las imágenes satelitales; en donde se expondrá el significado de cada una de las bandas y la exploración de su contenido. Luego en el capítulo análisis de bandas y filosofía de la solución expondremos la forma como podemos extraer datos de satélite que sirven de entrada para la red neuronal. En el capítulo III, Aplicaciones prácticas en la zona de estudio se explicará el funcionamiento del algoritmo de clasificación no supervisada de Teuvo Kohonen se hará uso de los simuladores y se comprobará los resultados sometiéndolos a discusión. Por último se expondrá las conclusiones y recomendaciones de los efectos de la clasificación no supervisada en la clasificación de usos de suelos para imágenes Landsat. 2 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas ESTADO ACTUAL DEL ARTE En los trabajos de [AGUILAR, BAÑADOS, CUARITE, REINAGA] se puede observar la aplicación de las redes neuronales a la identificación de patrones en fotografías aéreas. En este caso se hace un análisis de las redes neuronales supervisadas y no supervisadas para la obtención de la clasificación del patrón. En relación con el presente trabajo se explica el funcionamiento del algoritmo de Kohonen para el aprendizaje. Así mismo en [VILLMAN, MERENGY] se expone la clasificación de áreas en imágenes satelitales Landsat por medio de la herramienta GSOM utilizada para el entrenamiento de la red neuronal no supervisada. De igual forma como es obvio esta publicación se basa en las características del algoritmo de Kohonen. Por otro lado en [DME Tutorial for Week 5] se puede observar el tratamiento de las imágenes satelitales a través de píxeles. En esta publicación se ha aplicado la herramienta Netlab bajo el algoritmo Kohonen SOM. Como base para el desarrollo del presente trabajo se ha tomado en cuenta la publicación de [VESANTO Y HIMBERT], en donde se expone la forma como se debe utilizar la herramienta SomToolbox para la exploración de redes neuronales no supervisadas, empezando desde la lectura de los datos, su análisis por medio de componentes principales y por último la clasificación final de los mismos. Así mismo [CHUVIECO, 2002] sostiene un ítem dedicado a las redes neuronales y como estas nos pueden ayudar de forma sencilla al tratamiento de imágenes satelitales sin evitar el paso por supuesto de una lógica difusa o borrosa. [GUTIERRES,BRANCH, BOTERO] trata explícitamente sobre el tratamiento digital de imágenes Landsat mediante el uso de redes neuronales y la obtención automática de su clasificación. Software dedicado. Por ejemplo, el software IDRISI contiene dentro de si el método clustering o cluster el cual no es más que un método de clasificación que se basa en el algoritmo de Kohonen. Arcview de la familia ESRI sostiene métodos desde la determinación de la ruta más corta hasta la clasificación supervisada de zonas, tal y cual como ocurre también en el software ERDAS Imagine. Bien en el caso de la interpretación directa de imágenes satelitales y programas específicos el Matlab ofrece soluciones desde el image view hasta el somtoolbox que es free y es usado en el presente trabajo. Papers 3 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Para el desarrollo del presente trabajo se ha consultado papers que han dedicado su exposición a la interpretación de imágenes satelitales con aplicaciones apropiadas para el efecto. Por ejemplo en [ZHE LI and J. RONALD EASTMAN] se logra tener una explicación adecuada el uso del mapa de Kohonen para la clasificación de imágenes satelitales destinadas al uso de suelo. Podemos observar claramente como se ha logrado una clasificación destinada a trasporte, áreas residenciales, Bosques, etc. Así mismo en [PANDA, PANIGRAI, GAUTAM] se observa como se puede determinar la cantidad de NO3-N a partir de una imagen satelital, para el trabajo hemos tomado como base este paper que nos dio inicio al cluster base. No podíamos dejar a un lado la propuesta de Teuvo Kohonen en [OJA, KASKI, KOHONEN] en la cual por medio de un adendum nos demuestra la posibilidad real del uso de su teoría en el tratamiento de imágenes. Clasificación Supervisada y Clasificación No supervisada En [CHUVIECO,2002] se sostiene la diferenciación clara de los métodos supervisados y no supervisados, dentro de los cuales me permito citar algunos comentarios: Método Supervisado El conocimiento supervisado parte de un cierto conocimiento de la zona de estudio, adquirido por experiencia previa o por trabajos de campo. Para una localización más precisa de estas áreas de entrenamiento pueden ser de gran ayuda los trabajos de campo y otros documentos auxiliares –como la fotografía aérea o la cartografía convencional, teniendo en cuenta que debe tratarse de ejemplos suficientemente representativos. Método no Supervisado Este método se dirige a definir las clases espectrales presentes en la imagen. No implica ningún conocimiento del área de estudio. Como en el caso del método supervisado, es necesario analizar los píxeles incluidos en cada grupo para obtener sus medidas estadísticas elementales: media, desviación típica, mínimo, máximo, etc. Que servirán para abordar la fase posterior de clasificación. El propósito del presente trabajo es tratar de disminuir el trabajo de campo de los especialistas en el área biológica en relación al tiempo que les consume detectar si existe arbustos, matorrales o pastizales en el área destinada para el estudio. Esta zona de estudio frecuentemente no es conocida y se asigna en base a los características de los proyectos determinados. 4 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas CAPITULO I CONCEPTOS Y USO DE IMÁGENES SATELITALES 1. Concepto El propósito de la telepercepción o teledetección ambiental es servirse de sensores montados en plataformas aéreas para identificar y/o medir los parámetros de un objeto sobre la base de las variaciones en la radiación electromagnética (REM) que ese objeto emite o refleja. Aunque nosotros no podemos ver el desplazamiento de la luz , sabemos que ocurre. Ese desplazamiento entraña la transferencia de energía a través del espacio o de la materia en forma de movimientos ondulatorios. Las ondas que conforman la radiación electromagnética (REM) viajan a una Velocidad constante de 300 millones de metros por segundo. Todos los objetos reflejan o emiten REM. La cantidad de energía electromagnética emitida es una función de la temperatura del objeto - al aumentar la temperatura aumenta la intensidad de la radiación emitida. Existe toda una familia de ondas, que se denominan colectivamente vibraciones electromagnéticas y tienen distintas longitudes de onda y, por lo tanto (puesto que su velocidad es constante en el espacio), distintas frecuencias 1 . Esta familia se puede representar como un espectro de energías, ordenadas jerárquicamente según su frecuencia o su longitud de onda (Figura No. 1.1.). El espectro abarca una vasta serie continua de longitudes de onda, y es práctica común aplicar una diferenciación arbitraria de las principales bandas de onda sobre la base de ciertas propiedades como la fuente de la radiación, el método de generación, los medios de detección, ciertas aplicaciones, etc. Sólo algunas bandas de longitudes de onda revisten interés para la telepercepción 2 , a saber, las que atraviesan las ventanas de transmisión, porque a esas longitudes de onda la pérdida de REM3 por filtración de la atmósfera es mínima. Esas bandas se pueden representar como aparecen en el Cuadro No. 1.1. La energía captada por los diferentes sistemas de telepercepción es una función de diversos parámetros que pueden afectar a la energía antes de que sea recibida por los sensores. Esto se ilustra en la Figura No. 1.2, que indica que la REM puede ser natural -luz y otros tipos de radiación solar reflejada (fuente 1) o calor emitido por la tierra (fuente 2)- o artificial, como la que emiten una central eléctrica o un sistema de radar. La cantidad y el tipo de radiación emitida o reflejada dependen de la energía incidente (principalmente de la 1 Esto es importante notarlo ya que las frecuencias es lo que nos permiten medir un espectro Telepercepción = Teledetección 3 REM = Radiación Electromagnética 2 5 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas radiación solar entrante), de la naturaleza de la superficie de la tierra y de la interacción con la atmósfera terrestre.4 Figura No. 1.1. El espectro electromagnético 4 http://www.fao.org/DOCREP/003/T0446S/T0446S04.htm: Análisis de recursos para teledetección 6 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Cuadro 1.1. Bandas de ondas del espectro electromagnético que revisten interés en la telé percepción Banda de ondas y Detectores longitud de onda Visible 0,4 – 0,7 µm Algunas características Fotografía en blanco y negro y en colores. Cámaras de televisión. Explorador óptico. Gran efecto de dispersión atmosférica. La mayor parte es radiación solar reflejada, por lo que sólo se usa con la luz del día. Las longitudes de onda más cortas penetran en el agua. Infrarroja próxima Explorador de 0,7 – 3,0 µm infrarrojo. Alta reflectancia de la vegetación. Barredor multiespectral. También es energía solar reflejada por Fotografía. las superficies. Explorador óptico. Infrarroja media Como 3,0 – 8,0 µm anteriores. los Como las anteriores. Térmica 8,0 – 1 000 µm Termografía Predominantemente radiación emitida con luz por la tierra y la atmósfera. No infrarroja. atraviesa las nubes. Microonda 1 mm – 100 cm Radar. Atraviesa las nubes. Imágenes Radar de vista adquiridas en el modo activo - de día o lateral. de noche. Radiómetro por exploración. 7 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Figura No. 1.2. Características clave de datos tele percibidos 1.2. Uso de la información de los sensores remotos a la interpretación de imágenes satelitales. Imágenes Landsat Una imagen LANDSAT 7 ETM+ está compuesta por 8 bandas espectrales que pueden ser combinadas de distintas formas para obtener variadas composiciones de color u opciones de procesamiento. Entre las principales mejoras técnicas respecto de su antecesor, el satélite Landsat 5, se destaca la adición de una banda espectral (Banda Pancromática) con resolución de 15 metros. También cuenta con mejoras en las características geométricas y radio métricas y una mayor resolución espacial de la banda térmica para 60m. Estos avances tecnológicos permiten calificar al LANDSAT 7 como el satélite más interesante para la generación de imágenes con aplicaciones directas hasta una escala de 1:25.000, principalmente en áreas rurales o territorios de grandes extensiones. 8 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Como ejemplo tenemos un fragmento de la imagen satelital de la ciudad de Loja, presentada en la Figura No. 1.2.1 Figura No. 1.2.1. Imagen satelital de Loja Bandas satelitales La descripción y el uso de las bandas que pertenecen a una imagen satelital es la siguiente: Banda 1: (0,45 a 0,52 micrones - azul -) Diseñada para penetración en cuerpos de agua, es útil para el mapeo de costas, para diferenciar entre suelo y vegetación y para clasificar distintos cubrimientos boscosos, por ejemplo 9 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas coníferas y latifoliadas. También es útil para diferenciar los diferentes tipos de rocas presentes en la superficie terrestre. Banda 2: (0,52 a 0,60 micrones - verde -) Especialmente diseñada para evaluar el vigor de la vegetación sana, midiendo su pico de reflectancia (o radiancia) verde. También es útil para diferenciar tipos de rocas y, al igual que la banda 1, para detectar la presencia o no de limonita. Banda 3: (0,63 a 0,69 micrones - rojo -) Es una banda de absorción de clorofila, muy útil para la clasificación de la cubierta vegetal. También sirve en la diferenciación de las distintas rocas y para detectar limonita. Banda 4: (0,76 a 0,90 micrones - infrarrojo cercano -) Es útil para determinar el contenido de biomasa, para la delimitación de cuerpos de agua y para la clasificación de las rocas. Banda 5: (1,55 a 1,75 micrones - infrarrojo medio -) Indicativa del contenido de humedad de la vegetación y del suelo. También sirve para discriminar entre nieve y nubes. Banda 6: (10,40 a 12,50 micrones - infrarrojo termal -) El infrarrojo termal es útil en el análisis del stress de la vegetación, en la determinación de la humedad del suelo y en el mapeo termal. Banda 7: (2,08 a 2,35 micrones - infrarrojo medio -) Especialmente seleccionada por su potencial para la discriminación de rocas y para el mapeo hidrotermal. Mide la cantidad de hidróxilos (OH) y la absorción de agua. Estas siete bandas pueden combinarse de a tres o mas, produciendo una gama de imágenes de color compuesto que incrementan notablemente sus aplicaciones, especialmente en el campo de los recursos naturales. El mapeador temático (TM) tiene mayor sensibilidad radio métrica que su antecesor, el MSS, y mejor resolución espacial, ya que el tamaño del píxel en todas las bandas excepto la 6, es de 30 metros. Esto permite la clasificación de zonas tan pequeñas como 2,5 o 3 hectáreas. La banda 6, que es una banda termal, tiene un píxel de 120 metros en el terreno. Conclusiones del manejo de bandas Las imágenes de satélite Landsat poseen información importante los cuales al ser transformados en datos numéricos, puede ser utilizada como ejemplo o testeo en la red neuronal. Con el uso de sensores remotos se pueden hacer comparaciones entre imágenes con el fin de comprobar la eficiencia de la herramienta a utilizar, en este caso redes neuronales no supervisadas. 10 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Es correcto que cada banda de la imagen posea su propia información, pero en este caso es necesario conocer la estructura de la imagen misma para descomponerla. La propuesta consiste entonces en programar una herramienta que pueda clasificar sin tener este tipo de conocimientos, o lo que sería lo mismo; sin un patrón de comparación como ocurre en redes neuronales supervisadas. CAPITULO II APLICACIONES PRÁCTICAS A LA ZONA DE ESTUDIO Objetivo Usar la imagen satelital de Loja, para que por medio de sus píxeles (información, instancias) clasificar de forma no supervisada áreas de matorrales, arbustos y pastizal. 2.1. Zona de estudio La zona de estudio escogida para efectos de la clasificación es una imagen satelital de Loja. En esta imagen se pueden observar distintas coberturas con distintos niveles de gris, por lo que se ajusta adecuadamente al ejercicio a realizar. Observe en la siguiente figura: 11 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Figura 2.1. Imagen satelital de Loja, bandas 1,2,3. . Objetivo Usar la imagen satelital de Loja, para que por medio de sus píxeles (información, instancias) clasificar de forma no supervisada áreas de matorrales, arbustos y pastizal. 2.2. Obtención y manipulación de los datos de las bandas Cuando observamos la Figura No. 2.1, obtenemos la combinación de las tres bandas(1,2,3) al mismo tiempo y por supuesto esta combinación nos ofrece el resultado en nivel de colores de la imagen presentada. Los vectores de entrada5 para la red neuronal es la información que se puede obtener de cada una estas bandas, por lo que es necesario descomponer la imagen. 5 Se puede obtener mayor información de los vectores de entrada en : GOMEZ,JUAREZ,. Sistema Experto para el reconocimiento de rocas en la hoya de Loja, Tesis, UTPL ,2005. 12 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Para este efecto usamos el software Idrisi 2.0 ingresando como entrada la imagen de Loja y dividiendo la información en las tres bandas correspondientes: Figura No.2.2. Banda 1 de la imagen satelital de Loja 161 117 107 113 113 105 82 78 95 103 113 78 147 123 113 123 131 129 95 78 82 125 165 109 151 133 119 127 145 155 133 119 127 151 172 147 165 143 127 125 129 196 180 145 143 167 182 178 Píxeles de la Figura No.2.2. 13 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Figura No. 2.3. Banda 2 imagen satelital de Loja 103 92 95 86 73 56 36 52 73 71 69 40 130 132 105 57 69 67 61 40 65 81 108 61 141 149 108 83 115 105 112 81 96 111 130 120 133 142 105 79 87 124 136 121 113 128 129 155 Píxeles de la Figura No.2.3 14 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Figura No. 2.4. Banda 3 de la imagen satelital de Loja 26 25 26 22 25 15 6 12 17 22 17 9 36 44 31 17 15 18 12 12 15 17 22 15 36 47 34 22 29 28 23 20 20 26 36 33 34 39 26 15 18 25 29 26 23 28 34 40 Píxeles de la Figura No. 2.4. Cada una de las imágenes presentadas desde la Figura No.2.2. a la Figura No. 2.4;¡, sostienen información (valores) que representan a cada uno de los píxeles que la conforman. Bajo lo dicho, se obtiene el valor de los píxeles y se los agrupa en vectores de datos para una zona numerada desde 1 hasta 9, es decir en el archivo de datos a manipular existen los siguientes datos: Píxel 1_1, Píxel 1_2……………………….Pixel1_9, Píxel 2_1, Píxel 2_2……………………….Pixel2_9 y Píxel 3_1, Píxel 3_2……………………….Pixel3_9 Estos atributos se disponen en forma de columna para el archivo de entrada. En total tenemos 13851 datos en una matriz [27,513]. Cada uno de los registros se ha etiquetado con los valores: 15 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas 1: matorrales(m) 2: arbustos(a) 3: pastizal(p) Aprendizaje Para la obtención de resultados se usa los Mapas Autoorganizados de Kohonen cuyo funcionamiento es el siguiente: Mecanismo de cálculo de los pesos de la red6 Equivale a asociar las neuronas con posiciones del espacio adecuadas, donde dicha posición viene dada por los pesos de las neuronas Algoritmo: Repetir k veces: Para todos los patrones de entrada, X 1. Calcular d(X,Wj), ∀Wj 2. Obtener la neurona ganadora: c = argjmın d(X,Wj) 3. Adaptar los pesos de las neuronas: Wj(t + 1) = Wj(t) + a(k)(x − wj(k)), si j en vecindad de c Wj(t + 1) = Wj(t) en otro caso Tendencia del proceso de aprendizaje: cada neurona tiende a colocarse en el centroide de aquellos grupos de ejemplos para los cuales es la neurona ganadora. Manipulación de la información Los datos que nos entregan cada una de las bandas se encuentra almacenada en el archivo Datos.data, el mismo que respeta el siguiente formato: 6 http://scalab.uc3m.es/~docweb/aa/transpas05-06/kohonen.pdf#search=%22teuvo%20kohonen%22 16 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Figura No. 2.5. Formato de manipulación de datos de la imagen satelital de Loja Para aplicar la herramienta SomToolbox se ha propuesto el uso de la publicación de [VESANTO,HIMBERG,ALHONIEMI, PARHANKANGAS] aplicada a los datos de nuestra zona de estudio. Para el efecto del tratamiento de la información vamos a usar la herramienta SOM Tool box7 dentro de Matlab. Con la sentencia: sD = som_read_data('datos.data'); Warning: Automatically determined data dimension is 27. Is it correct? Realizamos la lectura de los datos almacenados en el archivo Datos.dat. El programa automáticamente nos devuelve que está compuesto por 27 atributos y además realiza la pregunta de si esto es correcto. En este caso observamos para nuestro archivo que esto esta bien por lo que seguimos con la ejecución de cada uno de los pasos. El siguiente paso consiste en la normalización de las variables. Este paso es importante con el fin de determinar ya sea los elementos que le corresponden a cada campo, los números de decimales así como la información de la cantidad de blancos (NaNs, valores inválidos) que pueden existir dentro de la 7 La herramienta SOM Tool Box es una gratuita y se puede obtener de la dirección: http://www.cis.hut.fi/projects/somtoolbox/ 17 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas información. Entonces se forma una matriz con valores válidos y no validos si este fuera el caso: >> sD= som_normalize(sD,'var'); Se puede observar que para el proceso de normalización de variables se ha utilizado el patrón ‘ var’. Como no se tienen clases para cada uno de los vectores, es decir; no es una clasificación supervisada los atributos y las instancias de ellos se van ha agrupar alrededor de la varianza. En este parámetro se buscará satisfacer el criterio de la mínima distancia entre los valores de instancia observados. Una vez normalizados los datos tenemos que proceder a construir la arquitectura de la red y a entrenarla en base a un SOM(Self Organization Map o Mapa Autoorganizado): sM=som_make(sD); Determining map size... map size [13, 8] Initialization... Training using batch algorithm... Rough training phase... Training: 0/ 0 s Training: 0/ 0 s Training: 0/ 0 s Finetuning phase... Training: 0/ 0 s Training: 0/ 0 s Training: 0/ 0 s Training: 0/ 0 s Training: 0/ 0 s Training: 0/ 0 s Training: 0/ 0 s Training: 0/ 0 s Training: 0/ 0 s Training: 0/ 0 s Training: 0/ 0 s Final quantization error: 2.655 Final topographic error: 0.037 En un mapa de Kohonen a cada cuadrícula del mapa es necesario darle un identificador. Como por ejemplo en un tablero de ajedrez cada cuadro tiene una posición, en un mapa de autoorganizado tiene que suceder igual, en este caso no vamos a manejar posiciones por el momento sino que estableceremos etiquetas: 18 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas >> sM = som_autolabel(sM,sD,'vote'); La palabra reservada vote significa que tome en cuenta también los espacios en blanco y aún aquellos que no sostienen información de etiqueta. Una vez que ya se ha identificado cada uno de los casilleros dentro del mapa y las variables que van a participar en el ejercicio, procedemos a visualizar la información obtenida hasta el momento, de acuerdo a la Figura No. 2.6.: >>som_show(sM,'umat','all','comp',1:27, 'empty', 'Labels','norm','d'); Figura No. 2.6. Ubicación en un mapa autoorganizado de los valores correspondientes a las variables normalizadas Se puede observar la distribución de los valores de los Píxeles como también la presentación de la matriz de confusión en la parte superior izquierda. El Píxel 1_8 presenta los valores más altos de la normalización (‘var’) mientras que el Píxel 3_6 presenta los valores más bajos. Así mismo la distribución de los valores en la matriz de confusión se puede observar en la Figura No.2.7: 19 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Figura No.2.7. Distribución de valores en el mapa autoorganizado de acuerdo a las etiquetas que les corresponden. La matriz de confusión ubicada en la parte superior izquierda presenta para la primera fila gran cantidad de matorrales con arbustos, mientras que en la parte inferior tenemos la presencia de arbustos con pastizales. Como existe combinación entre ellos es muy probable que se encuentren correlacionados por lo que será necesario obtener un análisis de componentes principales para analizar los mismos. Estos resultados se han obtenido a partir de la aplicación de la sentencia: >> som_show_add('label',sM,'subplot',29); Recuérdese que la variable sM, sostiene la información de cada una de las etiquetas y su correspondiente valor, además que en este caso la sentencia subplot, permite realizar un dibujo sobre otro, permitiendo con ello colocar los valores y etiquetas sobre el mapa número 29 de la Figura No. 2.7. Si bien es cierto, la información ha sido desplegada sobre el mapa y en efecto hemos obtenido el primer resultado de una clasificación, hasta el momento aceptable, sin embargo se puede optimizar los resultados por medio de la 20 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas reducción de variables. El efecto que produce la reclasificación de variables se lo puede verificar mediante la aplicación del estadístico conocido como el componente principal o análisis de ACP (análisis de componentes principales). Con esto se consigue además eliminar la correlación existente entre ellas. Un ACP nos entrega como resultado cuales variables pueden sostener la información de otras sin perder las características de exactitud ni tampoco de aplicabilidad de los datos. Sin salirnos del tema, pero con el fin de dar al lector una explicación adecuada de un componente principal es necesario citar a Emilio Chuvieco, en su libro Teledetección Ambiental, página 334: “El análisis de componentes principales (ACP) es una técnica bastante empleada en ciencias sociales y naturales. Su objetivo es resumir la información contenida en un grupo amplio de variables en un nuevo conjunto, más pequeño, sin perder una parte significativa de esa información. … Esas nuevas variables, los componentes o factores principales, podrían derivarse a partir de las variables originales, estudiando sus relaciones comunes tal y como se miden en la matriz de varianza-covarianza. Los factores o componentes principales vendrían, por tanto, a ser como variables-resumen de las medidas inicialmente: un menor número de dimensiones, preservando lo más sustancioso de la información original. Esta capacidad de síntesis ha sido la base de la aplicación del ACP en teledetección. La adquisición de imágenes sobre bandas adyacentes del espectro, implica con frecuencia detectar una información redundante, puesto que los tipos de cubierta tienden a presentar un comportamiento similar en longitudes de onda próximas. Por ello, las medidas realizadas en una banda pueden presentar una importante correlación con las deducidas de otra, haciendo una o varias de ellas prácticamente irrelevantes. En este contexto, el ACP permite sintetizar las bandas originales, creando unas nuevas bandas – los componentes principales de la imagen – que recojan la parte más relevante de la información original… Por otra parte y desde el punto de vista meramente estadístico, el ACP facilita una primera interpretación sobre los ejes de variabilidad de la imagen, lo que permite identificar aquellos rasgos que se recogen en la mayor parte de las bandas y aquellos otros que son específicos a algún grupo de ellas”. De acuerdo a Chuvieco, es necesario proceder a analizar la información, a tal punto que podamos identificar claramente dentro del grupo de datos de las bandas 1,2,3 aquellas variables que resumen en si toda la población. Para ello vamos a usar la sentencia: >> [Pd,V,me] = pcaproj(sD,3) Como resultado obtenemos Pd que es el componente principal, V que es el coeficiente aplicado al nivel de gris ND de cada una de las bandas y me que es una constante que suele introducirse en cada componente para evitar valores negativos. Es necesario recordar aquí que la matriz que va ha ser tomada en cuenta en el mapa de Kohonen sD y se van a analizar 3 vectores principales. 21 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas V= 0.1092 -0.2490 0.1362 -0.2707 0.1717 -0.2316 0.2026 -0.0914 0.2249 0.0115 0.2300 0.1078 0.2129 0.1726 0.2054 0.1916 0.1891 0.1600 0.1159 -0.2863 0.1588 -0.2954 0.1944 -0.2583 0.2223 -0.1276 0.2390 -0.0080 0.2438 0.1051 0.2208 0.1970 0.2150 0.1985 0.1908 0.1558 0.1187 -0.2877 0.1396 -0.2714 0.1691 -0.2189 0.2077 -0.0880 0.2186 0.0241 0.2201 0.1412 0.2020 0.2054 0.1836 0.1903 0.1497 0.1481 1.0e-015 * 0.2815 0.2263 -0.0101 -0.2086 -0.2246 -0.0822 0.0747 0.1629 0.2131 0.2330 0.1831 -0.0439 -0.2499 -0.2659 -0.1291 0.0796 0.2046 0.2476 0.1904 0.0997 -0.1230 -0.2983 -0.2675 -0.1281 0.0850 0.1970 0.2405 Columns 1 through 8 -0.0116 -0.0397 0.0634 0.2069 -0.2303 -0.1857 -0.0200 0.1576 Columns 9 through 16 -0.1703 0.0022 0.0727 -0.1631 0.1157 -0.0926 -0.0507 0.0548 Columns 17 through 24 -0.1185 0.1540 0.2518 -0.0314 -0.0904 -0.0876 0.0496 -0.0989 Columns 25 through 27 -0.1718 -0.0463 -0.1172 Los valores de V contemplan los vectores de los componentes principales y me contiene los valores de puntos centrales de sD. Una vez que hemos obtenido el análisis del componente principal es necesario efectuar su visualización de acuerdo a los nuevos variables obtenidas a través del método, ya que de acuerdo a la teoría descrita anteriormente se generan nuevos componentes que logran resumir en pocas variables o en pocos valores de la misma, toda la población inicial. Este efecto lo obtenemos mediante: >>som_grid(sM,'Coord',pcaproj(sM,V,me),'marker','none','Label',sM.labels,'labelcolor','k'); El resultado de esta operación se puede observar en el mapa de conexiones siguiente: 22 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Figura No. 2.8 Mapa de distribución de variables mediante ACP Se puede observar claramente que la correlación ha desaparecido ubicando en la parte izquierda a los matorrales en la parte céntrica a los arbustos y en la parte derecha a los pastizales.8 Una vez que obtenemos los datos es necesario preparar la visualización de los mismos en un gráfico, para ello usamos las sentencias hold on, grid on. La sentencia grid on nos permitirá construir un nuevo gris, cuya definición es de una imagen con los nuevos valores de los componentes principales sobre ella. Dentro de este mismo aspecto una imagen grid no es más que un conjunto de valores 1 o 0 en donde la presencia de un 1 significa la existencia de un píxel y el cero la carencia de el. Para que los nuevos valores de los componentes principales sean visualizados es necesario intercambiarlos con valores 1 y 0 del grid, y como tenemos 3 variables vamos a construir matrices con valores 1, desde la primera hasta la tercera columna. >> colD = [repmat([1 0 0],134,1);repmat([0 1 0],134,1);repmat([0 0 1],135,1)]; 8 La presencia de la clase nubes se puede tomar en cuenta en otros ejercicios, sin embargo en este caso solo tomamos las clases matorral, arbustos y pastizales. 23 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas La sentencia anterior nos indica claramente que los valores que van a ser ubicados en el nuevo grid corresponden a los nuevos valores de los componentes principales almacenados en la variable Pd cuya dimensión de la matriz es de [267 3]. >>som_grid('rect',[403 1],'Line','none','Coord',Pd,'markercolor',colD); La visualización de los componentes principales se ejecuta con la sentencia anterior obteniendo el siguiente resultado: Figura No.2.9. Análisis del Componentes Principales de la imagen satelital de Loja La representación de los componentes principales nos permite distribuir en tres colores distintos rojo, verde y azul las variables pastizal, matorrales, arbustos en la imagen satelital de Loja. En efecto se puede ampliar la distribución de estos puntos pero para efectos de visualización en el proyecto se ha realizado una minimización de los mismos a la escala en que se puedan observar. Con el uso componentes principales se ha logrado ubicar en un conjunto de valores representativos toda la población. Sin embargo esta información se 24 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas encuentra normalizada con lo que no se obtiene una información precisa ya que esta se encuentra normalizada (recordando la sentencia var aplicada anteriormente), por lo que es necesario tomar la información completa esto lo determinamos con la sentencia: >> M = som_denormalize(sM.codebook,sM); Esto permite que la matriz sM, obtenga los datos reales y realice desde ahora operaciones sobre ellos. En definitiva y como conclusión cuando tenemos un análisis de componentes principales obtenemos una nueva imagen satelital landsat resumida, lo que no implica que se haya perdido información importante. Esta información se encuentra ahora en una matriz sM, y es necesario construir un nuevo grid para su visualización. Observemos que tal como se procedió anteriormente es necesario construir una matriz de ceros para intercambiar con los nuevos valores de los componentes principales: >> colM = zeros(length(sM.codebook),3) en colM se encuentra dicha matriz. Las etiquetas suelen repetirse cuando tomamos toda la muestra en común, ahora lo que necesitamos es obtener etiquetas sin repeticiones: >> un = unique(sM.labels); Una vez que tenemos los datos y sus etiquetas procedemos a presentar la información construida en el grid, con el fin de encontrar la arquitectura adecuada para la nueva red neuronal de forma automática : >> for i=1:3, ind=find(strcmp(sM.labels,un(i)));colM(ind,i)= 1;end El for permitirá etiquetar cada uno de los valores para lo obtenido por los componentes principales ya renormalizados y al mismo tiempo que permitirá el armado de la arquitectura. >>som_grid(sM,'Coord',M(:,2:4),'MarkerSize',(M(:,1)),'Markercolor',colM); En esta sentencia se ha obtiene la topología de la red a través de M(:2:4) y las conexiones que se establecen entre ellas a través de (M(:1)). Lo que significa que se tiene 2 capas ocultas y 4 de salida, así mismo; todas las capas de entrada se encuentran conectadas y se restringirá las conexiones entre las capas intermedias 5. En este sentido he cambiado la arquitectura y las conexiones de la red neuronal con el fin de manejarla eficientemente y completar un menor tiempo de ejecución para la red neuronal. 25 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Por medio de esta sentencia se presenta la arquitectura de la red neuronal para un mapa autoorganizado SOM, de acuerdo a la figura No. 2.10: Figura No.2.10. Arquitectura de la red neuronal para la imagen satelital de Loja9 Ya tenemos la red neuronal y es hora entonces de entrenarla y verificar la clasificación mediante un mapa autoorganizado de acuerdo a la estructura de Teuvo Kohonen, para lo cual se ve necesario citar a [FREMAN, SKAPURA, 298 p.]: “ En el SOM10, la capa de entrada se proporciona sólo para almacenar el vector de entrada. Por esta razón, se puede considerar que el proceso de propagación hacia delante de la señal es cuestión de permitir que el computador vaya visitando secuencialmente todas las unidades de la capa de salida. En cada unidad de la capa de salida, el computador calcula la magnitud del vector diferencia entre la salida de la capa de entrada y el vector de pesos formado por las conexiones entre la capa de entrada y la unidad actual. Una vez 9 Las disposición de la red neuronal es muy grande por lo que solo se ha destinado una muestra de la arquitectura de la red. 10 SOM = Self organization map 26 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas terminados estos cálculos se almacenará la magnitud y el computador pasará a la unidad siguiente de la capa. Una vez que se hayan procesado todas las unidades del a capa de salida, ha concluido la propagación hacia delante de la señal, y a la salida de la red será la matriz que contiene la magnitud del vector de diferencias para todas las unidades de la capa de salida “.11 Todo este proceso ha sido realizado cuando se construyó la arquitectura de la red neuronal y se ha procedido a entrenar la red neuronal con propagación hacia delante, con lo que se ha podido obtener una adecuada distribución para el mapa de Kohonen, tal como lo demuestra la Figura No. 2.11: Figura No. 2.11. Resultado obtenido de la distribución de píxeles y su clasificación para la imagen satelital de Loja El mapa ha respetado la topología de la imagen por medio de la sentencia: >> som_cplane(sM.topol.lattice,sM.topol.msize,colM); En donde se obtiene la distinción de la topología y su latitud, la topología en su tamaño en si de píxeles de la imagen, y la obtención de los valores no 11 En [GONZAVEZ,ANDRADE,ZULLO] se puede encontrar la descripción de formulas y funcionamiento matemático del proceso. 27 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas normalizados y exactos a través de la variable colM. Establecemos nuevamente la opción hold on y usamos la sentencia: Figura No. 2.12. Representación de los valores de los píxeles por cada unidad del mapa De acuerdo a la Figura No.2.12. se pueden verificar el agrupamiento en la imagen satelital de cada una de las clases, así en la primera fila podemos observar que existe una gran cantidad de matorrales, como también en la parte céntrica se han agrupado los arbustos y así mismo tenemos poca cantidad de pastizales. Regresando a la imagen original tenemos que la distribución de los datos queda como se observa en la Figura No. 2.13: 28 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Figura No. 2.13. Ubicación de la clasificación no supervisada obtenida en la imagen satelital de Loja CAPITULO III COMPROBACION DE RESULTADOS Las barras de cada uno de los lugares del mapa(hexágonos) son los valores de los píxeles en esa zona específica y los colores significan el agrupamiento por etiquetas azul matorrales, verde arbustos y rojo pastizales.12 Método Experimental Redes Neuronales Supervisadas Para la comprobación de resultados vamos a usar la matriz de confusiones de la Figura No. 2.12, sobre una red neuronal supervisada usando la herramienta Weka13 y creando un nuevo campo llamado clase que agrupará a las etiquetas usadas anteriormente. Con el fin de tener una mejor apreciación de los datos se aplica el filtro AtributeSelection y se obtiene una organización de instancias en 15 atributos, de acuerdo a la figura 3.1.1: 12 Se ha notado también que existe un color negro representativo de una zona que no puede ser clasificada. 13 Weka es una herramienta gratuita que sostiene clasificadores dentro de si. Waikato University. 29 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Figura No. 3.1. Atributos a ser usados en la red neuronal supervisada La distribución de las incidencias ofrece una buena disposición para la clasificación ya que en ninguna de estas se presenta una diferencia lineal ( o linealidad): Figura No. 3.2. Distribución de las incidencias bajo los nuevos atributos obtenidos 30 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Bajo estas circunstancias se aplica la red neuronal supervisada multicapa y se entrena la red neuronal con 15 neuronas de entrada, 9 neuronas intermedias y 3 neuronas para la salida. Así mismo se usa 1000 épocas de entrenamiento y usamos el archivo de datos para el entrenamiento obteniendo la siguiente matriz de confusión: Figura No. 3.3. Matriz de confusión para red neuronal supervisada El porcentaje de clasificados correctamente es 94% y en efecto se logra admitir que en la imagen se obtiene mayor porcentaje de matorrales 131, 206 arbustos y 36 pastizales, muy coincidente con lo obtenido en la clasificación no supervisada. Así mismo se puede comparar los resultados de los clasificados erróneamente como por ejemplo el valor que han sido clasificados como arbustos en la primera fila. Se puede observar en la Figura No. 2.13 que también existe un error parecido en la clasificación al ubicar un lugar de arbusto para la clasificación no supervisada también en la primera fila. Simulador de Kohonen Para comprobar los resultados obtenidos con otro simulador de redes neuronales no supervisadas y en esencia con el Mapa Autoorganizado de Kohonen se propone el uso del simulador Koh. Para lo cual se ha formateado el archivo de ingreso de datos obteniendo los siguientes efectos: 31 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Figura No.3.4. Obtención de resultados por medio del simulador koh Se ha realizado el entrenamiento bajo 100 épocas y se ha obtenido una clasificación incorrecta de 0.0005, bajo un mapa 3x3. Además menciona que el peor clasificado es pastizal muy coincidente con las matrices de confusiones anteriores. En la parte gráfica de este simulador se puede observar de igual forma que los matorrales se encuentran en supremacía de clasificación, luego siguen los arbustos y por último los menos clasificados los pastizales. Conclusiones de la experimentación El error obtenido por la clasificación supervisada es de hecho menor a la no supervisada puesto que se tiene un patrón de comparación, sin embargo esto no quiere decir que los resultados no sean satisfactorios ni parecidos. El número de incidencias no infiere sobre la clasificación. Esto se ha probado ya que se ha etiquetado un número diferente de instancias y los resultados han sido los mismos. Por último se ha procedido ha tomar igual número de instancias por etiqueta sin variación de los resultados. Los parámetros del SOM pueden variar inclusive en su arquitectura determinando la cantidad de entrada y las conexiones. En este caso se ha logrado mayor precisión con la arquitectura propuesta. Lo propuesto [GUTIERREZ, BRANCH, BOTERO] puede resultar adecuado para una base de datos libre de ruido. A pesar de ello no tiene exactitud en los clasificadores para cada una de las instancias. En el presente proyecto se presentan resultados parecidos, tanto en redes neuronales supervisadas como no supervisadas. Aporte investigativo La propuesta realizada por [VESANTO Y HIMBERT] se encuentra centralizada en la clasificación de especies de plantas en el archivo Iris.dat. En el presente trabajo se encuentran los resultados de la clasificación no supervisada de una imagen satelital, sobre la cual se han extraído los parámetros y sus instancias que en definitiva son los valores de los píxeles de la misma. 32 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas Se ha procedido ha aplicar la metodología del paper original, para la cual se ha cambiado la arquitectura de la red puesto que al cambiar la cantidad de atributos es necesaria hacerla más manejable y obtener resultados reales. Por otro lado se ha incluido ruido el cual ha sido manejado a través de la comprobación de resultados para cada uno de los clasificadores expuestos Redes Neuronales Supervisadas y simulador de Kohonen. Así mismo se ha realizado la descripción teórica de los pasos dados. Trabajos Futuros Se ha realizado aquí la experimentación para 3 clases matorrales, arbustos y pastizales y se ha obtenido unos resultados satisfactorios para la clasificación. Por otro lado es necesario descomponer estas clases generales en sub clases y construir mayor cantidad de atributos con el fin de incrementar la exactitud del modelo. Por ejemplo se puede tener pastizales mínimos, pastizales medios y pastizales crecidos y obtener una nueva clasificación. Se menciona la creación de este nuevo modelo pues la clase pastizal es la peor clasificada en el proceso. Por otro lado se ha probado con lo componentes principales como tratamiento estadístico de las incidencias pudiéndose probar con otros filtros como los propuestos por Weka y obtener nuevas clasificaciones. Así mismo, Se podrá también tomar las bandas 3,4, 5 y aplicar el concepto de divergencia transformada promedio [GUTIERREZ, BRANCH, BOTERO] en el caso de que en las bandas 1,2,3 la desviación típica sea muy baja en el análisis. Agradecimientos Al equipo de trabajo de Inteligencia Artificial de Sistemas de Información Geográfica www.utpl.edu.ec/sig, por la colaboración prestada en la búsqueda de información y publicaciones relacionadas con algoritmos de clasificación para imágenes de satélite. Al Dr. Hugo Banda G, catedrático de la Escuela Politécnica Nacional por sus constantes revisiones al desarrollo del presente trabajo. Al profesor Dr. José Ramón Álvarez quien a través de sus observaciones como tutor de la materia de Redes Neuronales supo encaminar la aplicación de los clasificadores al tema general propuesto de aplicación de la Inteligencia Artificial a los sistemas de información geográfica. BIBLIOGRAFIA PDF: AGUILAR, BAÑADOS, CUARITE, REYNAGA. Reconocimiento de patrones a partir de imágenes aéreas. Universidad mayor de San Andrés Bolivia. Instituto de Pesquisas Energéticas y Nucleares. Brasil. 33 Universidad Técnica Particular de Loja Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas DME Tutorial for Week 5. GUERRA, Alejandro. Aprendizaje Automático, árboles de decisión. México, Universidad Veracruzana. GONCALVEZ, ANDRADE, ZULLO. Un sistema modular para la clasificación de imágenes utilizando mapas autoorganizados de Kohonen.1996. GUTIERREZ,BRANCH,BOTERO. Clasificación no supervisada de coberturas vegetales sobre imágenes digitales de sensores remotos: “Landsat – ETM+”.2005. OJA, KASKI, KOHONEN, Bibliography of Self-Organizing Map (SOM) Helsinki University of Technology, Neural Networks Research Centre. SALGADO, Ingnacio. Tratamiento espacio temporal 1986 – 2003 de plantaciones frutales en las laderas de la provincia de Quillota mediante imágenes digitales y SIG, Quillota, Junio 2005, Universidad Católica del Valparaíso. PANDA, PANIGRAI, GAUTAM, Analysis of clustering techniques for predicting soil NO3-N from aerial images, Soil Science, North Dakota University. VESANTO Y HIMBERT, Somtoolbox for Matlab 5, Helsinky Univesity of Technolgy, Finland. VILLMAN, MERENGY, Topology preservation in self-organizing maps, Elsevier, 1999. ZHE y RONALD, The nature and classification of unlabelled neurons in the use of Kohonen’s Self-Organizing Map for supervised classification, Clark University950 Main Street, Worcester, Massachusetts 01610, USA. ZHE LI and J. RONALD EASTMAN, The nature and classification of unlabelled neurons in the use of Kohonen’s Self-Organizing Map for supervised classification , Clark University 950 Main Street, Worcester, Massachusetts 01610, USA. LIBROS: JAMES FREEMAN/DAVID SKAPURA. Redes Neuronales, Algoritmos, aplicaciones y técnicas de programación. Addison – Wesley/Diaz de Santos. España,1993. 431 p. GIARRATANO-RILEY. Sistemas Expertos, Principios de Programación. Thomson, México,1998, 596 p. NILS J NILSON. Inteligencia Artificial, Una nueva síntesis. McGraw-Hill, Argentina, 2001, 457 p. CHUVIECO, Emilio. Teledetección Ambiental, Editorial Ariel, España ,2002, 584 páginas. MARTIN DEL BRIO, SANZ MOLINA. Redes Neuronales y Sistemas Difusos, Alfa-Omega, España, 2003, 399 p. WEB: http://scalab.uc3m.es/~docweb/aa/transpas0506/kohonen.pdf#search=%22teuvo%20kohonen%22: Autoorganizados de Kohonen Mapas 34