Download Dependencia de un data mart

Document related concepts

Data mart wikipedia , lookup

Almacén operacional de los datos wikipedia , lookup

Esquema en copo de nieve wikipedia , lookup

AQL wikipedia , lookup

Sistemas de información ejecutiva wikipedia , lookup

Transcript
DATA MART
 Los data warehouses están hechos para proporcionar una
fuente de datos única para todas las actividades de apoyo
para la toma de decisiones.
 Fue evidente que los usuarios a menudo realizaban amplias
operaciones de informes y análisis de datos sobre un
subconjunto relativamente pequeño de todo el data
warehouse.
 La ejecución repetida de tales operaciones sobre el mismo
subconjunto de todo el almacén no era muy eficiente.
 Entre las perdidas inherentes al uso de data marts están la escalabilidad
limitada, la duplicación de datos, la inconsistencia de los datos con
respecto a otros almacenes de información y la incapacidad para
aprovechar las fuentes de datos de la empresa.
 El Data mart es un sistema orientado a la consulta, en el que se
producen procesos batch de carga de datos (altas) con una frecuencia
baja y conocida.
 Es consultado mediante herramientas OLAP (On line Analytical
Processing - Procesamiento Analítico en Línea) que ofrecen una visión
multidimensional de la información.
 Sobre estas bases de datos se pueden construir EIS (Executive
Information Systems, Sistemas de Información para Directivos) y DSS
(Decision Support Systems, Sistemas de Ayuda a la toma de
Decisiones).
Conceptos de Data Mart
 "un almacén de datos especializado, orientado aún tema,
integrado, volátil y variante en el tiempo para apoyar un
subconjunto específico de decisiones de administración".
 La principal diferencia entre un data mart y un data
warehouse es que el data mart es especializado y volátil.
 Por especializado queremos decir que contiene datos para
dar apoyo (solamente) a un área específica de análisis de
negocios; por volátil queremos decir que los usuarios
pueden actualizar los datos e incluso, posiblemente, crear
nuevos datos (es decir, nuevas tablas) para algún propósito.
 Funcionamiento de los Data Marts:
 La implementación es muy similar, ya que debe proporcionar las mismas
funcionalidades.

 Una aplicación corriendo sobre un data mart necesita los mismos recursos que
si corriera sobre un data warehouse.

 El menor volumen de datos se debe a que no se tienen todos los datos de toda la
empresa, pero si se tienen todos los datos de un determinado sector de la
empresa, por lo que una consulta sobre dicho sector tarda lo mismo si se hace
sobre el data mart que si se hace sobre el data warehouse.

 Actualizar el data mart desde el data warehouse cuesta menos (ya que los
formatos de los datos son o suelen ser idénticos) que actualizar el data
warehouse desde sus fuentes de datos primarias, donde es necesario realizar
operaciones de transformación (ver ETL).
Tres enfoques principales para la creación de un
data mart:
 Los datos pueden ser simplemente extraídos del data warehouse; de hecho,
sigue un enfoque de "divide y vencerás" sobre la carga de trabajo general de
apoyo para la toma de decisiones, a fin de lograr un mejor rendimiento y
escalabilidad.

 A pesar del hecho de que el data warehouse pretende proporcionar un "punto
de control único", un data mart puede ser creado todavía en forma
independiente (es decir, no por medio de la extracción a partir del data
warehouse).

 Algunas instalaciones han seguido un enfoque de "primero el data mart",
donde los data marts son creados conforme van siendo necesarios y el data
warehouse general es creado, finalmente, como una consolidación de los
diversos data marts.
Una nota sobre el diseño de data marts
Una decisión importante que hay que
tomar en el diseño de cualquier base de
datos de apoyo para la toma de decisiones
es la “granularidad” de la misma
Data mart OLAP
Se basan en los populares cubos OLAP, que se
construyen agregando, según los requisitos de
cada área o departamento, las dimensiones y los
indicadores necesarios de cada cubo relacional.
Las compañías generalmente almacenan los datos de
la empresa en bases de datos relacionales, lo que
significa que alguien tiene que extraer, transformar y
cargar estos datos en el hipercubo
Ejemplo sencillo
El cubo podría adoptar una nueva orientación
para que los datos aparezcan ahora en función
de los períodos y el tipo de coste.
Data mart OLTP
es un tipo de sistemas que facilitan y administran
aplicaciones transaccionales, usualmente para
entrada de datos y recuperación y procesamiento
de transacciones (gestor transaccional)
Ventajas:
Poco volumen de datos
Mayor rapidez de consulta
Consultas SQL y/o MDX sencillas
Validación directa de la información
Facilidad para el historial de los datos
Dependencia de un data mart
Se necesita para un esquema o modelo de datos
espacial
Prestaciones
Seguridad
Conveniencia
Demostración sobre el terreno
Política