Download DTS y Analysis Services
Document related concepts
Transcript
Data Transformation Services y Analysis Services Salvador Ramos MVP SQL Server MCP SQL Server Columnista de dotNetManía Mi web: www.helpdna.net webmaster@helpdna.net Agenda Tecnologías OLTP vs OLAP Business Intelligence Diseño de Datawarehouse y soluciones OLAP Introducción a Data Mining Introducción al lenguaje MDX y herramientras cliente OLAP Novedades de OLAP y DTS en SQL Server 2005 Agenda Tecnologías OLTP vs OLAP Business Intelligence Diseño de Datawarehouse y soluciones OLAP Introducción a Data Mining Introducción al lenguaje MDX y herramientras cliente OLAP Novedades de OLAP y DTS en SQL Server 2005 Tecnologías OLTP vs OLAP OnLine Transaction Processing Sistemas transaccionales, enfocados a gestionar un gran número de transacciones concurrentes Permiten insertar, actualizar, borrar y consultar una pequeña cantidad de registros OnLine Analytical Processing Enfocados al análisis de grandes cantidades de datos Proporcionan respuestas rápidas y complejas Tecnologías OLTP vs OLAP OLTP Orientado a lo operativo (procesos) Predomina la actualización Se accede a pocos registros Datos altamente normalizados Estructura relacional Rápidos tiempos de respuesta. Estructura estática OLAP Orientado a temas Predomina la consulta. Datos históricos Procesos masivos, se accede a muchos registros Datos Denormalizados Estructura multidimensional Respuesta masiva, no inmediata Estructura dinámica, abundantes cambios Agenda Tecnologías OLTP vs OLAP Business Intelligence Diseño de Datawarehouse y soluciones OLAP Introducción a Data Mining Introducción al lenguaje MDX y herramientras cliente OLAP Novedades de OLAP y DTS en SQL Server 2005 Business Intelligence “Conjunto de herramientas y servicios destinado a la gestión eficiente del conocimiento y la información en empresas y organizaciones” Nos permite: Convertir los datos en información Tomar mejores decisiones rápidamente Utilizar un método razonable para la gestión empresarial SQL Server 2000 Data Transformation Services Analysis Services Reporting Services SQL Server 2000 Full-Text Search Replication Relational Database Engine *Notification Services HTTP Support © Fernando G. Guerrero (Solid Quality Learning) Solución Microsoft BI Colaboración BI Visualización Análisis Geoespacial Análisis de datos Análisis Ventas y Márketing Gestión de Proyectos Creación de Sitios B2B y B2C Agenda Tecnologías OLTP vs OLAP Business Intelligence Diseño de Datawarehouse y soluciones OLAP Introducción a Data Mining Introducción al lenguaje MDX y herramientras cliente OLAP Novedades de OLAP y DTS en SQL Server 2005 Componentes Herramientas de análisis y reporting ERP Aplicación 1 CRM ETL ETL Aplicación 2 DataWarehouse Cubos Analysis Services Aplicación N OLTP Area intermedia Area presentación Acceso a datos Datawarehouse Almacén de datos procedentes de los sistemas OLTP. Repositorio colectivo Almacén de datos centralizado Datos organizados en grupos temáticos Los datos son: Consistentes Depurados Históricos (no volátiles) Suministra datos rápida y eficientemente Datamarts DTS herramienta ETL Conjunto de servicios para ETL Modelo de objetos e interfaces gráficos Pueden ser utilizados desde entornos de desarrollo que soporten COM Incluyen asistentes que facilitan las tareas Diseñador de paquetes DTS herramienta ETL Permiten operar con los datos: Importación Exportación Transporte Transformación Los datos pueden proceder de Cualquier fuente Ole Db Cualquier fuente ODBC Ficheros planos Herramientas de DTS Asistente para la importación o exportación Diseñador DTS DTSRun DTSRunUI (interfaz gráfica) SQLAgent El diseñador de paquetes El diseñador de paquetes Conexiones Proveedor OLE DB para SQL Server Data Link Controlador ODBC para Oracle (MS) dBase 5 Microsoft Access Archivo HTML (origen) Microsoft Excel Paradox 5.x El diseñador de paquetes Conexiones Archivo de texto (origen) Archivo de texto (destino) Otras conexiones El diseñador de paquetes Tareas Transformar datos Consulta controlada por datos Inserción masiva Ejecutar SQL Copia de objetos de SQL Server Transferencia de base de datos Transferencia de mensajes de error Transferencia de Inicios de sesión Transferencia de trabajos Transferencia de proced. almacenados El diseñador de paquetes Tareas Secuencia de comandos ActiveX Propiedades dinámicas Ejecutar paquete Ejecutar proceso (.exe o .bat) FTP Cola de mensajes Enviar correo Procesar Analysis Services Extracción de datos (consultas de predicción) DTS Demo 1 Utilizando los asistentes Utilizando el diseñador de paquetes Diseño de un DW Definir objetivos y requerimientos Revisar los informes actuales Investigar todas las posibles fuentes de información que alimentarán el DW Diseño y modelado Definir las tablas del área intermedia, que alimentarán dimensiones y tablas de hechos Realizar los precálculos necesarios Crear índices y vistas Elegir el esquema más adecuado: Estrella (star) Copo de nieve (snowflacke) Diseño de un DW Estrategia de extracción y transformación Decidir en cada caso si se realizará una extracción completa o incremental Diseño del sistema de extracción incremental Utilizar triggers, replicación u otras técnicas Transformación de los datos Asegurar la validez, integridad y utilidad de los datos Comprobar que todas las claves externas encuentren valores, y evitar claves nulas (ej: sustituirlas por 0 -> ‘Sin familia’) Diseño de un DW Demo 2 BBDD Multidimensionales Son contenedores de cubos relacionados y objetos que comparten La unidad de almacenamiento es el cubo (en los SGDBR es la tabla) Opciones de almacenamiento MOLAP ROLAP Almacenamiento en estructura multidimensional de Analysis Services Mayor rapidez de respuesta Almacenamiento en base de datos relacional Para grandes volúmenes de datos HOLAP Híbrido Respuesta rápida y gran cantidad de datos en origen Elementos de la base de datos Origenes de datos Cubos Dimensiones compartidas Modelos de minería de datos Funciones de base de datos (seguridad) Sólo autenticación windows Cubos Producto Tabla de Hechos Tabla de Claves externas Medidas Dimensiones Producto1 Producto2 Producto 3 Hechos Cliente Id Id Nombre Nombre Tamaño Provincia … … Tiempo Fecha Año Mes Dia … Producto1 Producto2 Producto 3 Dimensiones Agregaciones Son sumas precalculadas de los datos para acelerar el tiempo de respuesta Jerarquías y niveles Miembros Tipos de dimensiones Regulares Virtuales (a partir de propiedades) Padre-Hijo o Primario-Secundario Según su ámbito Privadas Compartidas Medidas y Miembros calculados Medidas Conjunto de valores de una columna de la tabla de hechos del cubo Miembros calculados Medidas calculadas mediante una fórmula MDX Tipos de cubos Normales Vinculados Apuntan a un cubo de otro servidor Virtuales Se crean a partir de varios cubos existentes (‘equivalentes a JOIN en SGDBR’) Analysis Manager Analysis Services Demo 3 Agenda Tecnologías OLTP vs OLAP Business Intelligence Diseño de Datawarehouse y soluciones OLAP Introducción a Data Mining Introducción al lenguaje MDX y herramientras cliente OLAP Novedades de OLAP y DTS en SQL Server 2005 Data Mining Uso de métodos automatizados para obtener tendencias y pautas a partir de los datos del DW Se componen de Escenarios (entidades a analizar) Atributos (información sobre los escenarios) Ej: un cliente y sus ventas Ej: edad, número de hijos, total ventas, … Una vez elegidos los escenarios y atributos, procesamos el modelo Data Mining En Analysis Services disponemos de dos proveedores, diseñados para obtener agrupaciones eficazmente Microsoft Decision Trees Arbol de clasificación, con diversas ramificaciones Microsoft Cluster Agrupación de escenarios Data Mining Demo 4 Agenda Tecnologías OLTP vs OLAP Business Intelligence Diseño de Datawarehouse y soluciones OLAP Introducción a Data Mining Introducción al lenguaje MDX y herramientras cliente OLAP Novedades de OLAP y DTS en SQL Server 2005 El lenguaje MDX MultiDimensional eXpressions (Lenguaje de expresiones multidimensionales) Es el equivalente a SQL para bases de datos multidimensionales También tiene una instrucción SELECT SELECT <espec-eje>, <espec-eje> … FROM <espec-cubo> WHERE <espec-rebanador> Nos permite crear Miembros calculados y Conjuntos con nombre Dispone de múltiples funciones avanzadas El lenguaje MDX Demo 5 Conectividad PivotTable Service (PTS) Es el cliente de los servicios OLAP Proporciona la interfaz para conectarnos desde las aplicaciones ADO MD (ActiveX Data Objects MultiDimensional) ADO MD .Net Herramientas cliente OLAP SQL Server 2000 Reporting Services Microsoft Excel Microsoft Data Analyzer Herramientas desarrolladas por nosotros AddIn para Excel Aplicaciones asp o asp.net Webparts para Sharepoint Herramientas de terceros Microsoft Excel Consultas ad-hoc Para mostrar datos utiliza Tablas dinámicas Gráficos dinámicos Necesita MS Query instalado Se puede publicar en web (OWC) Microsoft Excel Demo 6 Microsoft Data Analyzer Herramienta para usuarios Facilita el análisis de datos de negocio Interfaz muy amigable Consultas ad-hoc Formas de visualización Gráfico de barras Gráfico de tarta Datos numéricos Microsoft Data Analyzer Demo 7 Agenda Tecnologías OLTP vs OLAP Business Intelligence Diseño de Datawarehouse y soluciones OLAP Introducción a Data Mining Introducción al lenguaje MDX y herramientras cliente OLAP Novedades de OLAP y DTS en SQL Server 2005 Novedades DTS DTS, ahora ‘Integration Services’ Se ha reescrito todo el código Servicio windows independiente Incrementa su potencia y funcionalidad Incrementa su rendimiento Nuevo entorno de desarrollo MS Development Evironment Integrados con la plataforma .Net Novedades DTS Nuevo entorno de desarrollo, en vez de crear un paquete DTS, se crean proyectos ‘Data Transformation Project’ MS Development Environment Ejemplo agregación Novedades Analysis Services Nuevas herramientas 2000 Enterprise Manager Query Analyzer Analysis Manager Report Manager 2005 BI Development Studio (BIDS) Orientado a Soluciones y Proyectos (similar a vs.net) Incluye un Debugger SQL Server Management Studio Novedades Analysis Services Mejoras para el modelado de datos Data Source Views Tenemos una capa más de abstracción Podemos trabajar de forma desconectada Podemos renombrar entidades Intellicube, nos facilita la construcción de cubos el Repository (por defecto en Access), se sustituye por metadatos en XML Deployment Wizard (facil despliegue) Novedades Analysis Services UDM – Unified Dimensional Model Se integran todos los tipos de Data Sources Combina las mejores características de los modelos relacionales y OLAP Querys interactivas con mejor rendimiento Alto rendimiento gracias a Proactive Caching Novedades Analysis Services KPI Framework Nuevos tipos de dimensiones Nuevos algoritmos de Data Mining MDX Scripts (servidor) y MDX Debugging BI Development Studio Preguntas y dudas ??? www.helpdna.net webmaster@helpdna.net