Download Clasificacin_imgenes.. - SIG

Document related concepts
no text concepts found
Transcript
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Universidad NACIONAL DE ESTUDIOS A DISTANCIA
UNED
CLASIFICACIÓN DE IMÁGENES MULTISPECTRALES LANDSAT TM
POR MEDIO DE REDES NEURONALES NO SUPERVISADAS
DOCTORADO EN INTELIGENCIA ARTIFICIAL
REDES NEURONALES
2006
Héctor F Gómez A
1
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
INTRODUCCIÓN
El presente trabajo utiliza imágenes satelitales como fuentes de datos, a través
de los cuales; se logra una clasificación temática y lógica de los mismos. Los
datos en una imagen satelital se pueden clasificar entre otros en cobertura de
suelo, agua e inclusive temperatura. Con el fin de entender a esta fuente de
información, se empezará con un capítulo destinado a los conceptos y usos de
las imágenes satelitales; en donde se expondrá el significado de cada una de
las bandas y la exploración de su contenido.
Luego en el capítulo análisis de bandas y filosofía de la solución expondremos la
forma como podemos extraer datos de satélite que sirven de entrada para la
red neuronal. En el capítulo III, Aplicaciones prácticas en la zona de estudio se
explicará el funcionamiento del algoritmo de clasificación no supervisada de
Teuvo Kohonen se hará uso de los simuladores y se comprobará los resultados
sometiéndolos a discusión.
Por último se expondrá las conclusiones y recomendaciones de los efectos de la
clasificación no supervisada en la clasificación de usos de suelos para imágenes
Landsat.
2
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
ESTADO ACTUAL DEL ARTE
En los trabajos de [AGUILAR, BAÑADOS, CUARITE, REINAGA] se puede
observar la aplicación de las redes neuronales a la identificación de patrones en
fotografías aéreas. En este caso se hace un análisis de las redes neuronales
supervisadas y no supervisadas para la obtención de la clasificación del patrón.
En relación con el presente trabajo se explica el funcionamiento del algoritmo
de Kohonen para el aprendizaje. Así mismo en [VILLMAN, MERENGY] se
expone la clasificación de áreas en imágenes satelitales Landsat por medio de
la herramienta GSOM utilizada para el entrenamiento de la red neuronal no
supervisada. De igual forma como es obvio esta publicación se basa en las
características del algoritmo de Kohonen.
Por otro lado en [DME Tutorial for Week 5] se puede observar el tratamiento de
las imágenes satelitales a través de píxeles. En esta publicación se ha aplicado
la herramienta Netlab bajo el algoritmo Kohonen SOM.
Como base para el desarrollo del presente trabajo se ha tomado en cuenta la
publicación de [VESANTO Y HIMBERT], en donde se expone la forma como se
debe utilizar la herramienta SomToolbox para la exploración de redes
neuronales no supervisadas, empezando desde la lectura de los datos, su
análisis por medio de componentes principales y por último la clasificación final
de los mismos.
Así mismo [CHUVIECO, 2002] sostiene un ítem dedicado a las redes neuronales
y como estas nos pueden ayudar de forma sencilla al tratamiento de imágenes
satelitales sin evitar el paso por supuesto de una lógica difusa o borrosa.
[GUTIERRES,BRANCH, BOTERO] trata explícitamente sobre el tratamiento
digital de imágenes Landsat mediante el uso de redes neuronales y la obtención
automática de su clasificación.
Software dedicado.
Por ejemplo, el software IDRISI contiene dentro de si el método clustering o
cluster el cual no es más que un método de clasificación que se basa en el
algoritmo de Kohonen.
Arcview de la familia ESRI sostiene métodos desde la determinación de la ruta
más corta hasta la clasificación supervisada de zonas, tal y cual como ocurre
también en el software ERDAS Imagine.
Bien en el caso de la interpretación directa de imágenes satelitales y programas
específicos el Matlab ofrece soluciones desde el image view hasta el somtoolbox
que es free y es usado en el presente trabajo.
Papers
3
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Para el desarrollo del presente trabajo se ha consultado papers que han
dedicado su exposición a la interpretación de imágenes satelitales con
aplicaciones apropiadas para el efecto. Por ejemplo en [ZHE LI and J. RONALD
EASTMAN] se logra tener una explicación adecuada el uso del mapa de
Kohonen para la clasificación de imágenes satelitales destinadas al uso de
suelo. Podemos observar claramente como se ha logrado una clasificación
destinada a trasporte, áreas residenciales, Bosques, etc.
Así mismo en
[PANDA, PANIGRAI, GAUTAM] se observa como se puede determinar la
cantidad de NO3-N a partir de una imagen satelital, para el trabajo hemos
tomado como base este paper que nos dio inicio al cluster base.
No podíamos dejar a un lado la propuesta de Teuvo Kohonen en [OJA, KASKI,
KOHONEN] en la cual por medio de un adendum nos demuestra la posibilidad
real del uso de su teoría en el tratamiento de imágenes.
Clasificación Supervisada y Clasificación No supervisada
En [CHUVIECO,2002] se sostiene la diferenciación clara de los métodos
supervisados y no supervisados, dentro de los cuales me permito citar algunos
comentarios:
Método Supervisado
El conocimiento supervisado parte de un cierto conocimiento de la zona
de estudio, adquirido por experiencia previa o por trabajos de campo.
Para una localización más precisa de estas áreas de entrenamiento
pueden ser de gran ayuda los trabajos de campo y otros documentos
auxiliares –como la fotografía aérea o la cartografía convencional,
teniendo en cuenta que debe tratarse de ejemplos suficientemente
representativos.
Método no Supervisado
Este método se dirige a definir las clases espectrales presentes en la
imagen. No implica ningún conocimiento del área de estudio.
Como en el caso del método supervisado, es necesario analizar los
píxeles incluidos en cada grupo para obtener sus medidas estadísticas
elementales: media, desviación típica, mínimo, máximo, etc. Que
servirán para abordar la fase posterior de clasificación.
El propósito del presente trabajo es tratar de disminuir el trabajo de campo de
los especialistas en el área biológica en relación al tiempo que les consume
detectar si existe arbustos, matorrales o pastizales en el área destinada para el
estudio. Esta zona de estudio frecuentemente no es conocida y se asigna en
base a los características de los proyectos determinados.
4
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
CAPITULO I
CONCEPTOS Y USO DE IMÁGENES SATELITALES
1. Concepto
El propósito de la telepercepción o teledetección ambiental es servirse de
sensores montados en plataformas aéreas para identificar y/o medir los
parámetros de un objeto sobre la base de las variaciones en la radiación
electromagnética (REM) que ese objeto emite o refleja.
Aunque nosotros no podemos ver el desplazamiento de la luz , sabemos que
ocurre. Ese desplazamiento entraña la transferencia de energía a través del
espacio o de la materia en forma de movimientos ondulatorios. Las ondas que
conforman la radiación electromagnética (REM) viajan a una
Velocidad constante de 300 millones de metros por segundo. Todos los objetos
reflejan o emiten REM. La cantidad de energía electromagnética emitida es una
función de la temperatura del objeto - al aumentar la temperatura aumenta la
intensidad de la radiación emitida. Existe toda una familia de ondas, que se
denominan colectivamente vibraciones electromagnéticas y tienen distintas
longitudes de onda y, por lo tanto (puesto que su velocidad es constante en el
espacio), distintas frecuencias 1 . Esta familia se puede representar como un
espectro de energías, ordenadas jerárquicamente según su frecuencia o su
longitud de onda (Figura No. 1.1.). El espectro abarca una vasta serie continua
de longitudes de onda, y es práctica común aplicar una diferenciación arbitraria
de las principales bandas de onda sobre la base de ciertas propiedades como la
fuente de la radiación, el método de generación, los medios de detección,
ciertas aplicaciones, etc. Sólo algunas bandas de longitudes de onda revisten
interés para la telepercepción 2 , a saber, las que atraviesan las ventanas de
transmisión, porque a esas longitudes de onda la pérdida de REM3 por filtración
de la atmósfera es mínima. Esas bandas se pueden representar como aparecen
en el Cuadro No. 1.1.
La energía captada por los diferentes sistemas de telepercepción es una función
de diversos parámetros que pueden afectar a la energía antes de que sea
recibida por los sensores. Esto se ilustra en la Figura No. 1.2, que indica que la
REM puede ser natural -luz y otros tipos de radiación solar reflejada (fuente 1)
o calor emitido por la tierra (fuente 2)- o artificial, como la que emiten una
central eléctrica o un sistema de radar. La cantidad y el tipo de radiación
emitida o reflejada dependen de la energía incidente (principalmente de la
1
Esto es importante notarlo ya que las frecuencias es lo que nos permiten medir un espectro
Telepercepción = Teledetección
3
REM = Radiación Electromagnética
2
5
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
radiación solar entrante), de la naturaleza de la superficie de la tierra y de la
interacción con la atmósfera terrestre.4
Figura No. 1.1. El espectro electromagnético
4
http://www.fao.org/DOCREP/003/T0446S/T0446S04.htm: Análisis de recursos para
teledetección
6
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Cuadro 1.1. Bandas de ondas del espectro electromagnético que revisten interés en la telé percepción
Banda de ondas y
Detectores
longitud de onda
Visible
0,4 – 0,7 µm
Algunas características
Fotografía
en
blanco y negro
y en colores.
Cámaras
de
televisión.
Explorador
óptico.
Gran efecto de dispersión atmosférica.
La mayor parte es radiación solar
reflejada, por lo que sólo se usa con la
luz del día. Las longitudes de onda más
cortas penetran en el agua.
Infrarroja próxima Explorador de
0,7 – 3,0 µm
infrarrojo.
Alta reflectancia de la vegetación.
Barredor
multiespectral.
También es energía solar reflejada por
Fotografía.
las superficies.
Explorador
óptico.
Infrarroja media Como
3,0 – 8,0 µm
anteriores.
los Como las anteriores.
Térmica
8,0 – 1 000 µm
Termografía
Predominantemente radiación emitida
con
luz por la tierra y la atmósfera. No
infrarroja.
atraviesa las nubes.
Microonda
1 mm – 100 cm
Radar.
Atraviesa
las
nubes.
Imágenes
Radar de vista adquiridas en el modo activo - de día o
lateral.
de noche.
Radiómetro por
exploración.
7
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Figura No. 1.2. Características clave de datos tele percibidos
1.2. Uso de la información de los sensores remotos a la interpretación de
imágenes satelitales.
Imágenes Landsat
Una imagen LANDSAT 7 ETM+ está compuesta por 8 bandas espectrales que
pueden ser combinadas de distintas formas para obtener variadas
composiciones de color u opciones de procesamiento. Entre las principales
mejoras técnicas respecto de su antecesor, el satélite Landsat 5, se destaca la
adición de una banda espectral (Banda Pancromática) con resolución de 15
metros. También cuenta con mejoras en las características geométricas y radio
métricas y una mayor resolución espacial de la banda térmica para 60m. Estos
avances tecnológicos permiten calificar al LANDSAT 7 como el satélite más
interesante para la generación de imágenes con aplicaciones directas hasta una
escala de 1:25.000, principalmente en áreas rurales o territorios de grandes
extensiones.
8
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Como ejemplo tenemos un fragmento de la imagen satelital de la ciudad de
Loja, presentada en la Figura No. 1.2.1
Figura No. 1.2.1. Imagen satelital de Loja
Bandas satelitales
La descripción y el uso de las bandas que pertenecen a una imagen satelital es
la siguiente:
Banda 1: (0,45 a 0,52 micrones - azul -) Diseñada para penetración en cuerpos
de agua, es útil para el mapeo de costas, para diferenciar entre suelo y
vegetación y para clasificar distintos cubrimientos boscosos, por ejemplo
9
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
coníferas y latifoliadas. También es útil para diferenciar los diferentes tipos de
rocas presentes en la superficie terrestre.
Banda 2: (0,52 a 0,60 micrones - verde -) Especialmente diseñada para evaluar
el vigor de la vegetación sana, midiendo su pico de reflectancia (o radiancia)
verde. También es útil para diferenciar tipos de rocas y, al igual que la banda 1,
para detectar la presencia o no de limonita.
Banda 3: (0,63 a 0,69 micrones - rojo -) Es una banda de absorción de clorofila,
muy útil para la clasificación de la cubierta vegetal. También sirve en la
diferenciación de las distintas rocas y para detectar limonita.
Banda 4: (0,76 a 0,90 micrones - infrarrojo cercano -) Es útil para determinar el
contenido de biomasa, para la delimitación de cuerpos de agua y para la
clasificación de las rocas.
Banda 5: (1,55 a 1,75 micrones - infrarrojo medio -) Indicativa del contenido de
humedad de la vegetación y del suelo. También sirve para discriminar entre
nieve y nubes.
Banda 6: (10,40 a 12,50 micrones - infrarrojo termal -) El infrarrojo termal es
útil en el análisis del stress de la vegetación, en la determinación de la
humedad del suelo y en el mapeo termal.
Banda 7: (2,08 a 2,35 micrones - infrarrojo medio -) Especialmente
seleccionada por su potencial para la discriminación de rocas y para el mapeo
hidrotermal. Mide la cantidad de hidróxilos (OH) y la absorción de agua.
Estas siete bandas pueden combinarse de a tres o mas, produciendo una gama
de imágenes de color compuesto que incrementan notablemente sus
aplicaciones, especialmente en el campo de los recursos naturales.
El mapeador temático (TM) tiene mayor sensibilidad radio métrica que su
antecesor, el MSS, y mejor resolución espacial, ya que el tamaño del píxel en
todas las bandas excepto la 6, es de 30 metros. Esto permite la clasificación de
zonas tan pequeñas como 2,5 o 3 hectáreas. La banda 6, que es una banda
termal, tiene un píxel de 120 metros en el terreno.
Conclusiones del manejo de bandas
Las imágenes de satélite Landsat poseen información importante los
cuales al ser transformados en datos numéricos, puede ser utilizada como
ejemplo o testeo en la red neuronal.
Con el uso de sensores remotos se pueden hacer comparaciones entre
imágenes con el fin de comprobar la eficiencia de la herramienta a utilizar,
en este caso redes neuronales no supervisadas.
10
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Es correcto que cada banda de la imagen posea su propia información, pero
en este caso es necesario conocer la estructura de la imagen misma para
descomponerla.
La propuesta consiste entonces en programar una
herramienta que pueda clasificar sin tener este tipo de conocimientos, o lo
que sería lo mismo; sin un patrón de comparación como ocurre en redes
neuronales supervisadas.
CAPITULO II
APLICACIONES PRÁCTICAS A LA ZONA DE ESTUDIO
Objetivo
Usar la imagen satelital de Loja, para que por medio de sus píxeles
(información, instancias) clasificar de forma no supervisada áreas de
matorrales, arbustos y pastizal.
2.1. Zona de estudio
La zona de estudio escogida para efectos de la clasificación es una imagen
satelital de Loja. En esta imagen se pueden observar distintas coberturas con
distintos niveles de gris, por lo que se ajusta adecuadamente al ejercicio a
realizar. Observe en la siguiente figura:
11
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Figura 2.1. Imagen satelital de Loja, bandas 1,2,3.
.
Objetivo
Usar la imagen satelital de Loja, para que por medio de sus píxeles
(información, instancias) clasificar de forma no supervisada áreas de
matorrales, arbustos y pastizal.
2.2. Obtención y manipulación de los datos de las bandas
Cuando observamos la Figura No. 2.1, obtenemos la combinación de las tres
bandas(1,2,3) al mismo tiempo y por supuesto esta combinación nos ofrece el
resultado en nivel de colores de la imagen presentada. Los vectores de
entrada5 para la red neuronal es la información que se puede obtener de cada
una estas bandas, por lo que es necesario descomponer la imagen.
5
Se puede obtener mayor información de los vectores de entrada en : GOMEZ,JUAREZ,.
Sistema Experto para el reconocimiento de rocas en la hoya de Loja, Tesis, UTPL ,2005.
12
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Para este efecto usamos el software Idrisi 2.0 ingresando como entrada la
imagen de Loja y dividiendo la información en las tres bandas
correspondientes:
Figura No.2.2. Banda 1 de la imagen satelital de Loja
161
117
107
113
113
105
82
78
95
103
113
78
147
123
113
123
131
129
95
78
82
125
165
109
151
133
119
127
145
155
133
119
127
151
172
147
165
143
127
125
129
196
180
145
143
167
182
178
Píxeles de la Figura No.2.2.
13
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Figura No. 2.3. Banda 2 imagen satelital de Loja
103
92
95
86
73
56
36
52
73
71
69
40
130
132
105
57
69
67
61
40
65
81
108
61
141
149
108
83
115
105
112
81
96
111
130
120
133
142
105
79
87
124
136
121
113
128
129
155
Píxeles de la Figura No.2.3
14
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Figura No. 2.4. Banda 3 de la imagen satelital de Loja
26
25
26
22
25
15
6
12
17
22
17
9
36
44
31
17
15
18
12
12
15
17
22
15
36
47
34
22
29
28
23
20
20
26
36
33
34
39
26
15
18
25
29
26
23
28
34
40
Píxeles de la Figura No. 2.4.
Cada una de las imágenes presentadas desde la Figura No.2.2. a la Figura No.
2.4;¡, sostienen información (valores) que representan a cada uno de los
píxeles que la conforman. Bajo lo dicho, se obtiene el valor de los píxeles y
se los agrupa en vectores de datos para una zona numerada desde 1 hasta 9,
es decir en el archivo de datos a manipular existen los siguientes datos:
Píxel 1_1, Píxel 1_2……………………….Pixel1_9,
Píxel 2_1, Píxel 2_2……………………….Pixel2_9 y
Píxel 3_1, Píxel 3_2……………………….Pixel3_9
Estos atributos se disponen en forma de columna para el archivo de entrada.
En total tenemos 13851 datos en una matriz [27,513]. Cada uno de los
registros se ha etiquetado con los valores:
15
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
1: matorrales(m)
2: arbustos(a)
3: pastizal(p)
Aprendizaje
Para la obtención de resultados se usa los Mapas Autoorganizados de Kohonen
cuyo funcionamiento es el siguiente:
Mecanismo de cálculo de los pesos de la red6
Equivale a asociar las neuronas con posiciones del espacio adecuadas,
donde dicha posición viene dada por los pesos de las neuronas
Algoritmo:
Repetir k veces:
Para todos los patrones de entrada, X
1. Calcular d(X,Wj), ∀Wj
2. Obtener la neurona ganadora: c = argjmın d(X,Wj)
3. Adaptar los pesos de las neuronas:
Wj(t + 1) = Wj(t) + a(k)(x − wj(k)), si j en vecindad de c
Wj(t + 1) = Wj(t) en otro caso
Tendencia del proceso de aprendizaje: cada neurona tiende a colocarse
en el centroide de aquellos grupos de ejemplos para los cuales es la
neurona ganadora.
Manipulación de la información
Los datos que nos entregan cada una de las bandas se encuentra almacenada
en el archivo Datos.data, el mismo que respeta el siguiente formato:
6
http://scalab.uc3m.es/~docweb/aa/transpas05-06/kohonen.pdf#search=%22teuvo%20kohonen%22
16
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Figura No. 2.5. Formato de manipulación de datos de la imagen satelital de Loja
Para aplicar la herramienta SomToolbox se ha propuesto el uso de la
publicación de [VESANTO,HIMBERG,ALHONIEMI, PARHANKANGAS] aplicada a
los datos de nuestra zona de estudio. Para el efecto del tratamiento de la
información vamos a usar la herramienta SOM Tool box7 dentro de Matlab. Con
la sentencia:
sD = som_read_data('datos.data');
Warning: Automatically determined data dimension is 27. Is it
correct?
Realizamos la lectura de los datos almacenados en el archivo Datos.dat. El
programa automáticamente nos devuelve que está compuesto por 27 atributos
y además realiza la pregunta de si esto es correcto. En este caso observamos
para nuestro archivo que esto esta bien por lo que seguimos con la ejecución
de cada uno de los pasos.
El siguiente paso consiste en la normalización de las variables. Este paso es
importante con el fin de determinar ya sea los elementos que le corresponden a
cada campo, los números de decimales así como la información de la cantidad
de blancos (NaNs, valores inválidos) que pueden existir dentro de la
7
La herramienta SOM Tool Box es una gratuita y se puede obtener de la dirección:
http://www.cis.hut.fi/projects/somtoolbox/
17
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
información. Entonces se forma una matriz con valores válidos y no validos si
este fuera el caso:
>> sD= som_normalize(sD,'var');
Se puede observar que para el proceso de normalización de variables se ha
utilizado el patrón ‘ var’. Como no se tienen clases para cada uno de los
vectores, es decir; no es una clasificación supervisada los atributos y las
instancias de ellos se van ha agrupar alrededor de la varianza. En este
parámetro se buscará satisfacer el criterio de la mínima distancia entre los
valores de instancia observados.
Una vez normalizados los datos tenemos que proceder a construir la
arquitectura de la red y a entrenarla en base a un SOM(Self Organization Map o
Mapa Autoorganizado):
sM=som_make(sD);
Determining map size...
map size [13, 8]
Initialization...
Training using batch algorithm...
Rough training phase...
Training: 0/ 0 s
Training: 0/ 0 s
Training: 0/ 0 s
Finetuning phase...
Training: 0/ 0 s
Training: 0/ 0 s
Training: 0/ 0 s
Training: 0/ 0 s
Training: 0/ 0 s
Training: 0/ 0 s
Training: 0/ 0 s
Training: 0/ 0 s
Training: 0/ 0 s
Training: 0/ 0 s
Training: 0/ 0 s
Final quantization error: 2.655
Final topographic error: 0.037
En un mapa de Kohonen a cada cuadrícula del mapa es necesario darle un
identificador. Como por ejemplo en un tablero de ajedrez cada cuadro tiene una
posición, en un mapa de autoorganizado tiene que suceder igual, en este caso
no vamos a manejar posiciones por el momento sino que estableceremos
etiquetas:
18
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
>> sM = som_autolabel(sM,sD,'vote');
La palabra reservada vote significa que tome en cuenta también los espacios en
blanco y aún aquellos que no sostienen información de etiqueta. Una vez que
ya se ha identificado cada uno de los casilleros dentro del mapa y las variables
que van a participar en el ejercicio, procedemos a visualizar la información
obtenida hasta el momento, de acuerdo a la Figura No. 2.6.:
>>som_show(sM,'umat','all','comp',1:27, 'empty', 'Labels','norm','d');
Figura No. 2.6. Ubicación en un mapa autoorganizado de los valores
correspondientes a las variables normalizadas
Se puede observar la distribución de los valores de los Píxeles como también la
presentación de la matriz de confusión en la parte superior izquierda. El Píxel
1_8 presenta los valores más altos de la normalización (‘var’) mientras que el
Píxel 3_6 presenta los valores más bajos. Así mismo la distribución de los
valores en la matriz de confusión se puede observar en la Figura No.2.7:
19
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Figura No.2.7. Distribución de valores en el mapa autoorganizado de acuerdo a
las etiquetas que les corresponden.
La matriz de confusión ubicada en la parte superior izquierda presenta para la
primera fila gran cantidad de matorrales con arbustos, mientras que en la parte
inferior tenemos la presencia de arbustos con pastizales.
Como existe
combinación entre ellos es muy probable que se encuentren correlacionados
por lo que será necesario obtener un análisis de componentes principales para
analizar los mismos.
Estos resultados se han obtenido a partir de la aplicación de la sentencia:
>> som_show_add('label',sM,'subplot',29);
Recuérdese que la variable sM, sostiene la información de cada una de las
etiquetas y su correspondiente valor, además que en este caso la sentencia
subplot, permite realizar un dibujo sobre otro, permitiendo con ello colocar los
valores y etiquetas sobre el mapa número 29 de la Figura No. 2.7.
Si bien es cierto, la información ha sido desplegada sobre el mapa y en efecto
hemos obtenido el primer resultado de una clasificación, hasta el momento
aceptable, sin embargo se puede optimizar los resultados por medio de la
20
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
reducción de variables. El efecto que produce la reclasificación de variables se
lo puede verificar mediante la aplicación del estadístico conocido como el
componente principal o análisis de ACP (análisis de componentes principales).
Con esto se consigue además eliminar la correlación existente entre ellas.
Un ACP nos entrega como resultado cuales variables pueden sostener la
información de otras sin perder las características de exactitud ni tampoco de
aplicabilidad de los datos. Sin salirnos del tema, pero con el fin de dar al lector
una explicación adecuada de un componente principal es necesario citar a
Emilio Chuvieco, en su libro Teledetección Ambiental, página 334:
“El análisis de componentes principales (ACP) es una técnica bastante
empleada en ciencias sociales y naturales. Su objetivo es resumir la
información contenida en un grupo amplio de variables en un nuevo conjunto,
más pequeño, sin perder una parte significativa de esa información. … Esas
nuevas variables, los componentes o factores principales, podrían derivarse a
partir de las variables originales, estudiando sus relaciones comunes tal y como
se miden en la matriz de varianza-covarianza. Los factores o componentes
principales vendrían, por tanto, a ser como variables-resumen de las medidas
inicialmente: un menor número de dimensiones, preservando lo más
sustancioso de la información original. Esta capacidad de síntesis ha sido la
base de la aplicación del ACP en teledetección. La adquisición de imágenes
sobre bandas adyacentes del espectro, implica con frecuencia detectar una
información redundante, puesto que los tipos de cubierta tienden a presentar
un comportamiento similar en longitudes de onda próximas. Por ello, las
medidas realizadas en una banda pueden presentar una importante correlación
con las deducidas de otra, haciendo una o varias de ellas prácticamente
irrelevantes. En este contexto, el ACP permite sintetizar las bandas originales,
creando unas nuevas bandas – los componentes principales de la imagen – que
recojan la parte más relevante de la información original… Por otra parte y
desde el punto de vista meramente estadístico, el ACP facilita una primera
interpretación sobre los ejes de variabilidad de la imagen, lo que permite
identificar aquellos rasgos que se recogen en la mayor parte de las bandas y
aquellos otros que son específicos a algún grupo de ellas”.
De acuerdo a Chuvieco, es necesario proceder a analizar la información, a tal
punto que podamos identificar claramente dentro del grupo de datos de las
bandas 1,2,3 aquellas variables que resumen en si toda la población. Para ello
vamos a usar la sentencia:
>> [Pd,V,me] = pcaproj(sD,3)
Como resultado obtenemos Pd que es el componente principal, V que es el
coeficiente aplicado al nivel de gris ND de cada una de las bandas y me que es
una constante que suele introducirse en cada componente para evitar valores
negativos. Es necesario recordar aquí que la matriz que va ha ser tomada en
cuenta en el mapa de Kohonen sD y se van a analizar 3 vectores principales.
21
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
V=
0.1092 -0.2490
0.1362 -0.2707
0.1717 -0.2316
0.2026 -0.0914
0.2249 0.0115
0.2300 0.1078
0.2129 0.1726
0.2054 0.1916
0.1891 0.1600
0.1159 -0.2863
0.1588 -0.2954
0.1944 -0.2583
0.2223 -0.1276
0.2390 -0.0080
0.2438 0.1051
0.2208 0.1970
0.2150 0.1985
0.1908 0.1558
0.1187 -0.2877
0.1396 -0.2714
0.1691 -0.2189
0.2077 -0.0880
0.2186 0.0241
0.2201 0.1412
0.2020 0.2054
0.1836 0.1903
0.1497 0.1481
1.0e-015 *
0.2815
0.2263
-0.0101
-0.2086
-0.2246
-0.0822
0.0747
0.1629
0.2131
0.2330
0.1831
-0.0439
-0.2499
-0.2659
-0.1291
0.0796
0.2046
0.2476
0.1904
0.0997
-0.1230
-0.2983
-0.2675
-0.1281
0.0850
0.1970
0.2405
Columns 1 through 8
-0.0116 -0.0397 0.0634 0.2069
-0.2303 -0.1857 -0.0200 0.1576
Columns 9 through 16
-0.1703 0.0022 0.0727 -0.1631
0.1157 -0.0926 -0.0507 0.0548
Columns 17 through 24
-0.1185 0.1540 0.2518 -0.0314
-0.0904 -0.0876 0.0496 -0.0989
Columns 25 through 27
-0.1718 -0.0463 -0.1172
Los valores de V contemplan los vectores de los componentes principales y me
contiene los valores de puntos centrales de sD.
Una vez que hemos obtenido el análisis del componente principal es necesario
efectuar su visualización de acuerdo a los nuevos variables obtenidas a través
del método, ya que de acuerdo a la teoría descrita anteriormente se generan
nuevos componentes que logran resumir en pocas variables o en pocos valores
de la misma, toda la población inicial. Este efecto lo obtenemos mediante:
>>som_grid(sM,'Coord',pcaproj(sM,V,me),'marker','none','Label',sM.labels,'labelcolor','k');
El resultado de esta operación se puede observar en el mapa de conexiones
siguiente:
22
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Figura No. 2.8 Mapa de distribución de variables mediante ACP
Se puede observar claramente que la correlación ha desaparecido ubicando en
la parte izquierda a los matorrales en la parte céntrica a los arbustos y en la
parte derecha a los pastizales.8
Una vez que obtenemos los datos es necesario preparar la visualización de los
mismos en un gráfico, para ello usamos las sentencias hold on, grid on. La
sentencia grid on nos permitirá construir un nuevo gris, cuya definición es de
una imagen con los nuevos valores de los componentes principales sobre ella.
Dentro de este mismo aspecto una imagen grid no es más que un conjunto de
valores 1 o 0 en donde la presencia de un 1 significa la existencia de un píxel y
el cero la carencia de el.
Para que los nuevos valores de los componentes principales sean visualizados
es necesario intercambiarlos con valores 1 y 0 del grid, y como tenemos 3
variables vamos a construir matrices con valores 1, desde la primera hasta la
tercera columna.
>> colD = [repmat([1 0 0],134,1);repmat([0 1 0],134,1);repmat([0 0 1],135,1)];
8
La presencia de la clase nubes se puede tomar en cuenta en otros ejercicios, sin embargo en
este caso solo tomamos las clases matorral, arbustos y pastizales.
23
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
La sentencia anterior nos indica claramente que los valores que van a ser
ubicados en el nuevo grid corresponden a los nuevos valores de los
componentes principales almacenados en la variable Pd cuya dimensión de la
matriz es de [267 3].
>>som_grid('rect',[403 1],'Line','none','Coord',Pd,'markercolor',colD);
La visualización de los componentes principales se ejecuta con la sentencia
anterior obteniendo el siguiente resultado:
Figura No.2.9. Análisis del Componentes Principales de la imagen satelital de
Loja
La representación de los componentes principales nos permite distribuir en tres
colores distintos rojo, verde y azul las variables pastizal, matorrales, arbustos
en la imagen satelital de Loja. En efecto se puede ampliar la distribución de
estos puntos pero para efectos de visualización en el proyecto se ha realizado
una minimización de los mismos a la escala en que se puedan observar.
Con el uso componentes principales se ha logrado ubicar en un conjunto de
valores representativos toda la población. Sin embargo esta información se
24
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
encuentra normalizada con lo que no se obtiene una información precisa ya que
esta se encuentra normalizada (recordando la sentencia var aplicada
anteriormente), por lo que es necesario tomar la información completa esto lo
determinamos con la sentencia:
>> M = som_denormalize(sM.codebook,sM);
Esto permite que la matriz sM, obtenga los datos reales y realice desde ahora
operaciones sobre ellos. En definitiva y como conclusión cuando tenemos un
análisis de componentes principales obtenemos una nueva imagen satelital
landsat resumida, lo que no implica que se haya perdido información
importante. Esta información se encuentra ahora en una matriz sM, y es
necesario construir un nuevo grid para su visualización. Observemos que tal
como se procedió anteriormente es necesario construir una matriz de ceros
para intercambiar con los nuevos valores de los componentes principales:
>> colM = zeros(length(sM.codebook),3)
en colM se encuentra dicha matriz.
Las etiquetas suelen repetirse cuando tomamos toda la muestra en común,
ahora lo que necesitamos es obtener etiquetas sin repeticiones:
>> un = unique(sM.labels);
Una vez que tenemos los datos y sus etiquetas procedemos a presentar la
información construida en el grid, con el fin de encontrar la arquitectura
adecuada para la nueva red neuronal de forma automática :
>> for i=1:3, ind=find(strcmp(sM.labels,un(i)));colM(ind,i)= 1;end
El for permitirá etiquetar cada uno de los valores para lo obtenido por los
componentes principales ya renormalizados y al mismo tiempo que permitirá el
armado de la arquitectura.
>>som_grid(sM,'Coord',M(:,2:4),'MarkerSize',(M(:,1)),'Markercolor',colM);
En esta sentencia se ha obtiene la topología de la red a través de M(:2:4) y las
conexiones que se establecen entre ellas a través de (M(:1)). Lo que significa
que se tiene 2 capas ocultas y 4 de salida, así mismo; todas las capas de
entrada se encuentran conectadas y se restringirá las conexiones entre las
capas intermedias 5. En este sentido he cambiado la arquitectura y las
conexiones de la red neuronal con el fin de manejarla eficientemente y
completar un menor tiempo de ejecución para la red neuronal.
25
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Por medio de esta sentencia se presenta la arquitectura de la red neuronal para
un mapa autoorganizado SOM, de acuerdo a la figura No. 2.10:
Figura No.2.10. Arquitectura de la red neuronal para la imagen satelital de Loja9
Ya tenemos la red neuronal y es hora entonces de entrenarla y verificar la
clasificación mediante un mapa autoorganizado de acuerdo a la estructura de
Teuvo Kohonen, para lo cual se ve necesario citar a [FREMAN, SKAPURA, 298
p.]:
“ En el SOM10, la capa de entrada se proporciona sólo para almacenar el vector
de entrada. Por esta razón, se puede considerar que el proceso de propagación
hacia delante de la señal es cuestión de permitir que el computador vaya
visitando secuencialmente todas las unidades de la capa de salida. En cada
unidad de la capa de salida, el computador calcula la magnitud del vector
diferencia entre la salida de la capa de entrada y el vector de pesos formado
por las conexiones entre la capa de entrada y la unidad actual. Una vez
9
Las disposición de la red neuronal es muy grande por lo que solo se ha destinado una muestra
de la arquitectura de la red.
10
SOM = Self organization map
26
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
terminados estos cálculos se almacenará la magnitud y el computador pasará a
la unidad siguiente de la capa. Una vez que se hayan procesado todas las
unidades del a capa de salida, ha concluido la propagación hacia delante de la
señal, y a la salida de la red será la matriz que contiene la magnitud del vector
de diferencias para todas las unidades de la capa de salida “.11
Todo este proceso ha sido realizado cuando se construyó la arquitectura de la
red neuronal y se ha procedido a entrenar la red neuronal con propagación
hacia delante, con lo que se ha podido obtener una adecuada distribución para
el mapa de Kohonen, tal como lo demuestra la Figura No. 2.11:
Figura No. 2.11. Resultado obtenido de la distribución de píxeles y su
clasificación para la imagen satelital de Loja
El mapa ha respetado la topología de la imagen por medio de la sentencia:
>> som_cplane(sM.topol.lattice,sM.topol.msize,colM);
En donde se obtiene la distinción de la topología y su latitud, la topología en su
tamaño en si de píxeles de la imagen, y la obtención de los valores no
11
En [GONZAVEZ,ANDRADE,ZULLO] se puede encontrar la descripción de formulas y
funcionamiento matemático del proceso.
27
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
normalizados y exactos a través de la variable colM. Establecemos nuevamente
la opción hold on y usamos la sentencia:
Figura No. 2.12. Representación de los valores de los píxeles por cada unidad
del mapa
De acuerdo a la Figura No.2.12. se pueden verificar el agrupamiento en la
imagen satelital de cada una de las clases, así en la primera fila podemos
observar que existe una gran cantidad de matorrales, como también en la parte
céntrica se han agrupado los arbustos y así mismo tenemos poca cantidad de
pastizales.
Regresando a la imagen original tenemos que la distribución de los datos queda
como se observa en la Figura No. 2.13:
28
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Figura No. 2.13. Ubicación de la clasificación no supervisada obtenida en la
imagen satelital de Loja
CAPITULO III
COMPROBACION DE RESULTADOS
Las barras de cada uno de los lugares del mapa(hexágonos) son los valores de
los píxeles en esa zona específica y los colores significan el agrupamiento por
etiquetas azul matorrales, verde arbustos y rojo pastizales.12
Método Experimental
Redes Neuronales Supervisadas
Para la comprobación de resultados vamos a usar la matriz de confusiones de la
Figura No. 2.12, sobre una red neuronal supervisada usando la herramienta
Weka13 y creando un nuevo campo llamado clase que agrupará a las etiquetas
usadas anteriormente.
Con el fin de tener una mejor apreciación de los datos se aplica el filtro
AtributeSelection y se obtiene una organización de instancias en 15 atributos,
de acuerdo a la figura 3.1.1:
12
Se ha notado también que existe un color negro representativo de una zona que no puede
ser clasificada.
13
Weka es una herramienta gratuita que sostiene clasificadores dentro de si. Waikato
University.
29
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Figura No. 3.1. Atributos a ser usados en la red neuronal supervisada
La distribución de las incidencias ofrece una buena disposición para la
clasificación ya que en ninguna de estas se presenta una diferencia lineal ( o
linealidad):
Figura No. 3.2. Distribución de las incidencias bajo los nuevos atributos
obtenidos
30
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Bajo estas circunstancias se aplica la red neuronal supervisada multicapa y se
entrena la red neuronal con 15 neuronas de entrada, 9 neuronas intermedias y
3 neuronas para la salida. Así mismo se usa 1000 épocas de entrenamiento y
usamos el archivo de datos para el entrenamiento obteniendo la siguiente
matriz de confusión:
Figura No. 3.3. Matriz de confusión para red neuronal supervisada
El porcentaje de clasificados correctamente es 94% y en efecto se logra admitir
que en la imagen se obtiene mayor porcentaje de matorrales 131, 206 arbustos
y 36 pastizales, muy coincidente con lo obtenido en la clasificación no
supervisada.
Así mismo se puede comparar los resultados de los clasificados erróneamente
como por ejemplo el valor que han sido clasificados como arbustos en la
primera fila. Se puede observar en la Figura No. 2.13 que también existe un
error parecido en la clasificación al ubicar un lugar de arbusto para la
clasificación no supervisada también en la primera fila.
Simulador de Kohonen
Para comprobar los resultados obtenidos con otro simulador de redes
neuronales no supervisadas y en esencia con el Mapa Autoorganizado de
Kohonen se propone el uso del simulador Koh. Para lo cual se ha formateado
el archivo de ingreso de datos obteniendo los siguientes efectos:
31
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Figura No.3.4. Obtención de resultados por medio del simulador koh
Se ha realizado el entrenamiento bajo 100 épocas y se ha obtenido una
clasificación incorrecta de 0.0005, bajo un mapa 3x3. Además menciona que
el peor clasificado es pastizal muy coincidente con las matrices de confusiones
anteriores. En la parte gráfica de este simulador se puede observar de igual
forma que los matorrales se encuentran en supremacía de clasificación, luego
siguen los arbustos y por último los menos clasificados los pastizales.
Conclusiones de la experimentación
El error obtenido por la clasificación supervisada es de hecho menor a la no
supervisada puesto que se tiene un patrón de comparación, sin embargo
esto no quiere decir que los resultados no sean satisfactorios ni parecidos.
El número de incidencias no infiere sobre la clasificación. Esto se ha
probado ya que se ha etiquetado un número diferente de instancias y los
resultados han sido los mismos. Por último se ha procedido ha tomar igual
número de instancias por etiqueta sin variación de los resultados.
Los parámetros del SOM pueden variar inclusive en su arquitectura
determinando la cantidad de entrada y las conexiones. En este caso se ha
logrado mayor precisión con la arquitectura propuesta.
Lo propuesto [GUTIERREZ, BRANCH, BOTERO] puede resultar adecuado
para una base de datos libre de ruido. A pesar de ello no tiene exactitud en
los clasificadores para cada una de las instancias. En el presente proyecto
se presentan resultados parecidos, tanto en redes neuronales supervisadas
como no supervisadas.
Aporte investigativo
La propuesta realizada por [VESANTO Y HIMBERT] se encuentra centralizada
en la clasificación de especies de plantas en el archivo Iris.dat. En el presente
trabajo se encuentran los resultados de la clasificación no supervisada de una
imagen satelital, sobre la cual se han extraído los parámetros y sus instancias
que en definitiva son los valores de los píxeles de la misma.
32
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
Se ha procedido ha aplicar la metodología del paper original, para la cual se ha
cambiado la arquitectura de la red puesto que al cambiar la cantidad de
atributos es necesaria hacerla más manejable y obtener resultados reales.
Por otro lado se ha incluido ruido el cual ha sido manejado a través de la
comprobación de resultados para cada uno de los clasificadores expuestos
Redes Neuronales Supervisadas y simulador de Kohonen. Así mismo se ha
realizado la descripción teórica de los pasos dados.
Trabajos Futuros
Se ha realizado aquí la experimentación para 3 clases matorrales, arbustos y
pastizales y se ha obtenido unos resultados satisfactorios para la clasificación.
Por otro lado es necesario descomponer estas clases generales en sub clases y
construir mayor cantidad de atributos con el fin de incrementar la exactitud del
modelo. Por ejemplo se puede tener pastizales mínimos, pastizales medios y
pastizales crecidos y obtener una nueva clasificación. Se menciona la creación
de este nuevo modelo pues la clase pastizal es la peor clasificada en el proceso.
Por otro lado se ha probado con lo componentes principales como tratamiento
estadístico de las incidencias pudiéndose probar con otros filtros como los
propuestos por Weka y obtener nuevas clasificaciones. Así mismo, Se podrá
también tomar las bandas 3,4, 5 y aplicar el concepto de divergencia
transformada promedio [GUTIERREZ, BRANCH, BOTERO] en el caso de que en
las bandas 1,2,3 la desviación típica sea muy baja en el análisis.
Agradecimientos
Al equipo de trabajo de Inteligencia Artificial de Sistemas de Información
Geográfica www.utpl.edu.ec/sig, por la colaboración prestada en la búsqueda
de información y publicaciones relacionadas con algoritmos de clasificación
para imágenes de satélite. Al Dr. Hugo Banda G, catedrático de la Escuela
Politécnica Nacional por sus constantes revisiones al desarrollo del presente
trabajo. Al profesor Dr. José Ramón Álvarez
quien a través de sus
observaciones como tutor de la materia de Redes Neuronales supo encaminar
la aplicación de los clasificadores al tema general propuesto de aplicación de la
Inteligencia Artificial a los sistemas de información geográfica.
BIBLIOGRAFIA
PDF:
AGUILAR, BAÑADOS, CUARITE, REYNAGA. Reconocimiento de
patrones a partir de imágenes aéreas. Universidad mayor de San Andrés
Bolivia. Instituto de Pesquisas Energéticas y Nucleares. Brasil.
33
Universidad Técnica Particular de Loja
Clasificación de imágenes multispectrales por medio de redes neuronales no supervisadas
DME Tutorial for Week 5.
GUERRA, Alejandro. Aprendizaje Automático, árboles de decisión.
México, Universidad Veracruzana.
GONCALVEZ, ANDRADE, ZULLO. Un sistema modular para la
clasificación de imágenes utilizando mapas autoorganizados de
Kohonen.1996.
GUTIERREZ,BRANCH,BOTERO. Clasificación no supervisada de
coberturas vegetales sobre imágenes digitales de sensores remotos:
“Landsat – ETM+”.2005.
OJA, KASKI, KOHONEN, Bibliography of Self-Organizing Map (SOM)
Helsinki University of Technology, Neural Networks Research Centre.
SALGADO, Ingnacio. Tratamiento espacio temporal 1986 – 2003 de
plantaciones frutales en las laderas de la provincia de Quillota mediante
imágenes digitales y SIG, Quillota, Junio 2005, Universidad Católica del
Valparaíso.
PANDA, PANIGRAI, GAUTAM, Analysis of clustering techniques for
predicting soil NO3-N from aerial images, Soil Science, North Dakota
University.
VESANTO Y HIMBERT, Somtoolbox for Matlab 5, Helsinky Univesity of
Technolgy, Finland.
VILLMAN, MERENGY, Topology preservation in self-organizing maps,
Elsevier, 1999.
ZHE y RONALD, The nature and classification of unlabelled neurons in
the use of Kohonen’s Self-Organizing Map for supervised classification,
Clark University950 Main Street, Worcester, Massachusetts 01610, USA.
ZHE LI and J. RONALD EASTMAN, The nature and classification of
unlabelled neurons in the use of Kohonen’s Self-Organizing Map for
supervised classification , Clark University 950 Main Street, Worcester,
Massachusetts 01610, USA.
LIBROS:
JAMES FREEMAN/DAVID SKAPURA. Redes Neuronales, Algoritmos,
aplicaciones y técnicas de programación. Addison – Wesley/Diaz de
Santos. España,1993. 431 p.
GIARRATANO-RILEY. Sistemas Expertos, Principios de Programación.
Thomson, México,1998, 596 p.
NILS J NILSON. Inteligencia Artificial, Una nueva síntesis. McGraw-Hill,
Argentina, 2001, 457 p.
CHUVIECO, Emilio. Teledetección Ambiental, Editorial Ariel, España
,2002, 584 páginas.
MARTIN DEL BRIO, SANZ MOLINA. Redes Neuronales y Sistemas
Difusos, Alfa-Omega, España, 2003, 399 p.
WEB:
http://scalab.uc3m.es/~docweb/aa/transpas0506/kohonen.pdf#search=%22teuvo%20kohonen%22:
Autoorganizados de Kohonen
Mapas
34