Download 1. Historial de la asignatura. 2. Pre-requisitos y
Document related concepts
Transcript
Nombre de la asignatura: MINERÍA DE DATOS Línea de investigación o trabajo: Inteligencia Artificial Horas - Horas - Horas - Horas - Créditos Docentes TIS TPS totales (SATCA) 48 20 100 168 6 TIS: Trabajo Independiente significativo del estudiante. TPS: Trabajo profesional supervisado por parte del estudiante 1. Historial de la asignatura. Fecha revisión / actualización Octubre de 2010 Cenidet 20 de junio de 2011 Cenidet 20 de junio de 2011 Participantes Observaciones, cambios o justificación M.C. Andrea Magadán Salazar M.C. Matilde Velazco Soni Integrantes del área de IA: M.C. Andrea Magadán Salazar Dr. Raúl Pinto Elías Dr. José Ruiz Ascencio Dr. Gerardo Reyes Salgado Dr. Manuel Mejía Lavalle M.C. Matilde Velazco Soni Integrantes del área de IA: M.C. Andrea Magadán Salazar Dr. Raúl Pinto Elías Dr. José Ruiz Ascencio Dr. Gerardo Reyes Salgado Dr. Manuel Mejía Lavalle M.C. Matilde Velazco Soni Propuesta Preliminar Análisis y conformación de la asignatura Definición de la asignatura 2. Pre-requisitos y correquisitos. Se trata de una materia optativa en el área de Inteligencia Artificial, tiene como pre-requisito la materia de Reconocimiento de patrones. 3. Objetivo de la asignatura. Aplicar las técnicas básicas de inteligencia artificial requeridas para el desarrollo de sistemas inteligentes. 4. Aportación al perfil del graduado. La materia contribuye a obtener los siguientes aspectos del perfil: • Plantear, analizar y resolver problemas en el área de Minería de datos. • Analizar e interpretar los resultados obtenidos. • Aplicar la metodología científica en el desarrollo de sus trabajos. • Mantenerse actualizado en el estado del arte y/o práctica de su especialidad. • Responsabilidad, disciplina y ética en el desarrollo de sus actividades. 5. Contenido temático. Unidad Temas Soft computing y el internet 1 Horas docentes: 9 Consulta a bases de datos 2 Horas docentes: 9 3 Interacción con agentes inteligentes Horas docentes: 9 Minería de datos inteligentes 4 Horas docentes: 12 5 Lógica difusa en minería de datos Horas docentes: 9. Subtemas 1. 2. 3. 4. 5. Conceptos de minería de datos Conceptos básicos en la softcomputing Internet Metabuscadores. Aplicaciones. 1. 2. 3. 4. 5. 6. 1. 2. 3. 4. Tipos de datos Procesamiento de datos Medidas de similitud entre datos Exploración de datos Resumen estadístico Visualización Diseño de agentes inteligentes. Mecanismo de razonamiento. Arquitectura híbrida. Interacción entre agentes: principios de la cooperación. 5. Sistemas cooperación vs. no cooperativos. 6. Heurísticas para la cooperación 7. Coherencia y coordinación 8. Negociación y argumentación 9. criterios de evaluación Técnicas de clasificación 1. Árboles de inducción 2. Clasificador de los vecinos más cercanos 3. Clasificador bayesiano 4. Máquinas de vector soporte 5. Análisis asociativo 6. Análisis de agrupación 7. K-means 8. Agrupación jerárquica aglomerativa 9. Agrupación basada en densidades 1. Conceptos de lógica difusa. 2. Conjuntos difusos. 3. Reglas de asociación difusas 4. Uso de lógica difusa en minería de datos. 5. Conclusiones. 6. METODOLOGÍA DE DESARROLLO DEL CURSO • Unidades a través de clases impartidas por el profesor; tareas y ejercicios a desarrollar por los estudiantes.. • Unidades 4, exposición por parte de los alumnos. Documentación a entregar: 1º Presentar resumen de la investigación. 2º Exposición de 45 minutos en total durante el curso. • Asignación de proyectos. Queda a elección del docente el marcar problemas de aplicaciones específicas (para trabajo individual) en los cuales se aplique al menos una de las técnicas planteadas en el curso. Entregar: a 1er reporte del análisis y diseño, 10 semana. a 2º Código fuente documentado (Primera revisión 11 semana, revisión final semana a 12 ) a 3º Entrega del documento final: reporte del análisis, conclusiones (13 semana). 7. SUGERENCIAS DE EVALUACIÓN a. Exposición 20% b. Proyecto 40% c. Exámenes 20% d. Trabajos 20% 8. BIBLIOGRAFÍA Y SOFTWARE DE APOYO • Pang-Ning Tan, Michael Steinbach and Vipin Kumar. Introduction to Data Mining. Addison-Wesley. 2006. ISBN: 0321321367. • Anil K. Jain, Richard C. Dubes. Algorithms for Clustering Data. Prentice Hall. 1988. ISBN: 013022278X. • T. Hastie, R. Tibshirani and J. Friedman. Elements of Statistical Learning: Data Mining, Inference and Prediction. Springer-Verlag. 2001. ISBN: 0387952845. • ordini, Rafael H et al., Multi-agent programming: Languages, platforms, and applications, Springer, New York, 2005. • Jaques Ferber, Multi-agent Systems. An introduction to Distributed Artificial Intelligence, Addison Wesley, NY, 1999. • Mas Ana, Agentes de software y sistemas multiagentes, Pearson Prentice Hall, UK, 2005. • Maimon Oded and Lior Rokach, “Data minig and knowledge discovery handbook. Editorial Springer. 2005 USA. Bases de datos públicas para reconocimiento de formas (material de apoyo). [En línea] • http://www-etsi2.ugr.es/depar/ccia/rf/practica/datos/datos.html • Repositorio: CI Machine Learning Repository, (material de apoyo). [En línea] • http://www.ics.uci.edu/~mlearn/MLRepository.html 9. PRÁCTICAS PROPUESTAS Se sugiere que las prácticas propuestas sean realizadas por equipos para estar en concordancia con la finalidad de fomentar la discusión de ideas que plantea el curso. En este sentido, se proponen las siguientes prácticas por unidad: Unidad 1 Soft computing y el internet Práctica Análisis y discusión en clase de las aplicaciones actuales de las técnicas de soft computing. Discusión grupal: • ¿Es correcto el planteamiento del problema? • ¿Se han incluido todas las características descriptivas del problema? • ¿Son correctos los operadores obtenidos? • ¿Se ha contemplado las restricciones del problema? 3. Interacción con agentes inteligentes Desarrollo de un programa de computadora aplicando los métodos de razonamiento y/o cooperación entre agentes, analizar y discutir la evolución de cada uno, casos de aplicación en donde se obtienen mejores rendimientos. Analizar y discutir el tipo de arquitectura utilizada. Implementar un método de cooperación de acuerdo al problema. • Entrega del reporte impreso: análisis, implementación, pruebas, conclusiones. Análisis y discusión en clase de las diferentes técnicas de aprendizaje automático y su aplicación en tareas de minería de datos. • • 4. Minería de datos inteligentes Horas docentes: 9 5. Lógica difusa en minería de datos Horas docentes: 12 Discusión grupal: • Dado un problema: Modelar el problema con la técnica apropiada, verificar ventajas y desventajas • ¿Es posible combinar las estructuras? ¿Existe mejoras en la representación del conocimiento al utilizar una combinación? • Evaluación de la técnica en alguna herramienta de software libre. Análisis y discusión en clase de las diferentes aplicaciones de la lógica difusa ene la minería de datos . Discusión grupal: • ¿En qué tipo de aplicaciones se recomienda la lógica difusa? • Análisis de las ventajas y desventajas de su uso. 10. NOMBRE DEL CATEDRÁTICO RESPONSABLE: M.C. Andrea Magadán Salazar