Download Un enfoque híbrido para la clasificación de espectros estelares
Transcript
ENFOQUE HÍBRIDO PARA LA CLASIFICACIÓN DE ESPECTROS ESTELARES MEDIANTE TÉCNICAS DE INTELIGENCIA ARTIFICIAL UNIVERSIDAD DE A CORUÑA Dept. Tecnologías de la Información y las Comunicaciones & Dept. Ciencias de la Navegación y de la Tierra Alejandra Rodríguez (arodriguezf@udc.es) Carlos Dafonte (dafonte@udc.es) Bernardino Arcay (cibarcay@udc.es) Iciar Carricajo (iciar@udc.es) Minia Manteiga (manteiga@udc.es) OBJETIVOS Desarrollo de un sistema automático para extracción de parámetros físicos y químicos a partir de espectros estelares Luminosidad Temperatura Efectiva Metalicidad Clasificación de espectros ópticos de baja resolución en el sistema MK Integración de varias técnicas de inteligencia artificial en un único sistema híbrido Sistemas Expertos Redes de Neuronas Artificiales Técnicas Estadísticas de Clustering SELECCIÓN DE DATOS Conjunto completo y consistente de 258 espectros de catálogos públicos 3500 Å - 7500 Å con resolución de 5 Å Espectros analizados y corregidos manualmente utilizando técnicas de clustering Silva (92), Pickles (98), Jacoby (84) Cubren todos los tipos espectrales y clases de luminosidad 50% Conjunto de entrenamiento 15% Conjunto de validación 35% Conjunto de evaluación Patrones de Entrada Espectros completos Parámetros espectrales (bandas moleculares, líneas de absorción y emisión) SELECCIÓN DE DATOS 706 espectros en la región del triplete de Calcio 8348 Å -- 9020 Å con resolución de 1.5 Å Proyecto GAIA Librería de espectros Cenarro, Gorgas et al, disponible en: http://www.ucm.es/info/Astrof/ellipt/CATRIPLET.html 60% Conjunto de entrenamiento, 40% Conjunto de evaluación Patrones de Entrada Parámetros espectrales: líneas de Fe, Ca, H ESTRUCTURA DEL SISTEMA Análisis Espectros BD Preprocesado + Análisis morfológico Espectro completo Parámetros espectrales: líneas de absorción y emisión, bandas moleculares, etc Clasificación espectral Clasificación Técnicas de IA Sistemas expertos RNAs Técnicas de clustering ORGANIZACIÓN DE LOS DATOS Base de datos relacional diseñada para almacenar información sobre estrellas, espectros, imágenes, telescopios, fotometrías, referencias bibliográficas, fases evolutivas, clasificaciones, catálogos, medidas de parámetros, etc. Proporciona un mecanismo de estructurado y seguro de la información almacenamiento Sistema Gestor de Base de Datos PostgreSQL v. 7.1 Permite recuperar los datos almacenados de forma rápida, cómoda y eficiente Interfaces de acceso y explotación a través de WEB ACCESO WEB ANÁLISIS MORFOLÓGICO Tratamiento del espectro como señal de longitudes de onda y flujo energético Preprocesado del espectro. Escalado, tratamiento de regiones espectrales vacías, ajuste de la frecuencia de muestreo Análisis morfológico del espectro. Detección y medida de líneas de absorción/emisión, bandas moleculares, energía espectral Bandas moleculares: discretas algoritmo Líneas de absorción/emisión: estimación del continuo local basado algoritmo en integrales basado en la Obtención de los parámetros y regiones espectrales necesarios para la clasificación CLASIFICACIÓN: SISTEMAS EXPERTOS Permiten reproducir el tipo de razonamiento utilizado por los espectroscopistas para clasificar espectros estelares Combinación de sistemas de reglas de producción clásicos y sistemas de reglas basados en lógica difusa Desarrollados en OPS/R2 Técnicas Means-End Analysis Max-Product Fuzzy Centroid Existen zonas de incertidumbre en la clasificación en las que el sistema obtiene varias conclusiones con una probabilidad asociada Estudio adicional: resultados de los mejores modelos de redes de neuronas CLASIFICACIÓN: RNAs SIMULADOR STUTTGART NEURAL NETWORK (SNNS v. 4.2) Herramienta desarrollada en JAVA para manipular Redes de neuronas con diferentes algoritmos de aprendizaje y arquitecturas: Feed Forward, CPN, SOM, Correlación en Cascada. Posee una interfaz Web para la interacción con el usuarios. CLASIFICACIÓN: RNAs Ejemplo del resultado del entrenamiento CLASIFICACIÓN: RNAs BACKPROPAGATION RED PATRONES CAPAS OCULTAS Tipo Espectral Parámetros espectrales 10 Tipo Espectral Parámetros espectrales 5x5 Tipo Espectral Parámetros espectrales 10x10 Tipo Espectral Parámetros espectrales 10x5x3 Tipo Espectral 659 valores de flujo 100x50x10x3 Luminosidad Parámetros espectrales 10x10 Luminosidad 659 valores de flujo 100x50x10x3 KOHONEN Mapas de dos dimensiones: 2x2, 6x6, 12x12 and 24x24 RBF (Radial Basis Functions) NETWORK INPUT PATTERNS HIDDEN LAYERS Tipo Espectral Parámetros espectrales 16 Tipo Espectral Parámetros espectrales 8 Tipo Espectral Parámetros espectrales 4 Tipo Espectral 659 valores de flujo 124 Luminosidad Parámetros espectrales 8 Luminosidad 659 valores de flujo 124 TÉCNICAS CLUSTERING MATLAB v.6.5.1 Algoritmos no jerárquicos: K-means Max-min Iso-Data Clusters iniciales: 6, 12 Análisis de sensibilidad de los parámetros de la clasificación RESULTADOS 100 espectros de catálogos públicos (Silva, Jacoby, Pickels) 100% Human Expert A Human Expert B 80% Expert Systems 60% Backpropagation RBF 40% Kohonen 20% K-means 0% Max-Min Tipo Luminosidad Isodata 95% BP, RBF, K-means & Isodata Las estrellas más problemáticas: B con líneas de emisión y M ~ RESULTADOS: GAIA Resultados preliminares para Teff con RNAs Redes entrenadas con índices espectrales: CaII, FeI, Lineas de Paschen FEED FORWARD MSE Capas ocultas 0,005 0,0025 0,0006 0,0001 5 0.43 0.43 0.69 0.74 10 0.42 0.47 0.70 0.75 15 0.46 0.45 0.71 0.78 20 0.44 0.43 0.72 0.77 25 0.39 0.44 0.68 0.79 Counter Propagation (CPN) Capas ocultas MSE 0,005 0,0025 0,0006 0,0001 50 0.41 0.42 0.61 0.66 100 0.39 0.41 0.61 0.70 200 0.43 0.35 0.62 0.65 INTERFAZ DEL SISTEMA ENFOQUE HÍBRIDO PARA LA CLASIFICACIÓN DE ESPECTROS ESTELARES MEDIANTE TÉCNICAS DE INTELIGENCIA ARTIFICIAL UNIVERSIDAD DE A CORUÑA Dept. Tecnologías de la Información y las Comunicaciones & Dept. Ciencias de la Navegación y de la Tierra Alejandra Rodríguez (arodriguezf@udc.es) Carlos Dafonte (dafonte@udc.es) Bernardino Arcay (cibarcay@udc.es) Iciar Carricajo (iciar@udc.es) Minia Manteiga (manteiga@udc.es)