Download Bases de Datos Avanzadas - Departamento de Ingeniería de
Transcript
Bases de Datos Avanzadas Introducción Curso Maestría Por Elizabeth León Guzmán, Ph.D. Profesora Asociada Ingeniería de Sistemas Grupo de Investigación MIDAS TABD - Introducción Agenda 1. ¿Qué son Bases de Datos? Datos, Información, Conocimiento 2. Modelos de Bases de Datos E/R 3. Integracion de Datos 4. Análisis de Datos 5. Recuperación de Datos TABD - Introducción ¿Qué es un dato? Hecho individual acerca de algo de interés para alguien TABD - Introducción ¿Qué es información? Datos relacionados TABD - Introducción Los datos son la materia prima bruta INFORMACIÓN TABD - Introducción Generación de Datos Comercial Web (e-commerce) Supermercados(compras) Bancos (transacciones con tarjetas) TABD - Introducción Generación de Datos Científico Satélites (sensores) Telescopios Microarrays (información genética) Simulaciones TABD - Introducción Datos Datos almacenados Bases de datos Web Archivos (excel, pdf, txt, etc) TABD - Introducción Modelo Relacional TABD - Introducción KDD Descubrimiento de Conocimiento en Bases de Datos Nos referimos al Conocimiento TABD - Introducción ¿Qué es conocimiento? Información co-relacionada Patrones! TABD - Introducción Información Algo peor que no tener información disponible es tener mucha información Y no saber qué hacer con ella. TABD - Introducción KDD Descubrimiento de Conocimiento en Bases de Datos TABD - Introducción Necesidad de Análisis “Conocimiento” ● ● ● Entender mejor el ambiente Seguimiento a transacciones diarias: evaluar como funciona la organización Evaluaciones y estrategías tácticas: ● Promociones ● Porción del mercado controlado ● Atracción de nuevos clientes ● Globalización ● Ambiente cultural ● Tecnología TABD - Introducción BD BD BD BD BD BD INTEGRAR ANALIZAR Descripción, Algoritmos inteligentes Grandes repositorios RECUPERAR Optimización TABD - Introducción Integrar Información BODEGA BODEGA DE DE DATOS DATOS TABD - Introducción Bodegas de Datos Data Warehousing TABD - Introducción Estructura del Proceso de Acceso a Datos y Entrega de Información en BI Data Quality Fuentes de datos OLAP ETLC Calidad de datos Diseño y Construcción Modelos OLAP Data Data Warehouse Warehouse Modelos Molap / Rolap Metadata Integrada para Acceder Bases de Datos y Fuentes OLAP Análisis OLAP Agregaciones Reportes y Consultas Score Cards Minería de datos Analizar Información Análisis Exploratorio Minería de Datos TABD - Introducción Análisis Exploratorio Hacer uso de las habilidades humanas para el reconocimiento de patrones. Una imagen vale más que mil palabras. l l l l l Histogramas Gráficas de Dispersión 10th percentile 75th percentile 50th percentile 25th percentile 10th percentile Gráficas de Caja TABD - Introducción OLAP TABD - Introducción Minería de Datos Uso de métodos inteligentes para extraer conocimiento (búsqueda de oro!) oro! . Datos Minería de datos Conocimiento TABD - Introducción Minería de datos Paso del KDD, Que descubre “conocimiento” en grandes conjunto de datos Usa métodos como: Estadistica Aprendizaje de Máquina Mineria Mineriade dedatos datos Inteligencia artificial Bases de datos TABD - Introducción Minería de datos No es… • Buscar un número telefónico en un directorio • Buscar en Google • Generar histogramas de salarios por grupos de edades diferentes TABD - Introducción Minería de datos es… • Encontrar grupos de personas con similares hobbies. • ¿Hay mas probabilidad de desarrollar cáncer si se vive cerca de una línea de poder? TABD - Introducción Inteligencia de Negocios (BI) Integración Análisis TABD - Introducción Estructura del Proceso de Acceso a Datos y Entrega de Información en BI Data Quality Fuentes de datos OLAP ETLC Calidad de datos Diseño y Construcción Modelos OLAP Data Data Warehouse Warehouse Modelos Molap / Rolap Metadata Integrada para Acceder Bases de Datos y Fuentes OLAP Análisis OLAP Agregaciones Reportes y Consultas Score Cards Minería de datos Recuperar Información Consultas (queries) sobre los repositorios de datos Texto Audio Video imagenes Indices DB Información estructurada Datos estructurados Datos no estructurados TABD - Introducción Sistemas de Recuperación de Información Query System (Db, www,etc) Query System query matched to object stored Top ranking objects System Ranking objects Query refined System (Db, www,etc) TABD - Introducción Aplicaciones IR Bibliotecas digitales: acceso a libros, revistas, etc. Motores de búsqueda (search engines) tales como: Google, Yahoo search y Live Search (MSN Search) TABD - Introducción Optimización: Indices TABD - Introducción