Download Trabajo final OLAP

Document related concepts
Transcript
Data Warehouse OLAP
On Line Analytical Processing
Procesamiento Analítico en Línea
¿Qué es OLAP?
La necesidad de tener DW OLAP
Imaginemos el siguiente escenario:
Una cadena de supermercados posee una (o varias)
bases de datos operacional que registra información
sobre:
 Supermercados( y sus descripciones)
 Productos (y sus descripciones)
 Precios de productos y promociones
 Proveedores y partes entregados por ellos
 Inventarios en bodegas y supermercados
 Ordenes de compra a proveedores, transacciones y
facturas
 Transacciones de venta en cada supermercado
 Programa clientes frecuentes, recursos humanos, etc.

Procesamiento Transaccional En
Línea(OLTP).
Esta base de datos está optimizada para
realizar
procesamiento
transaccional
(OLTP).

Complejidad de la base de datos
Debido a que la base de datos está
normalizada, esta puede llegar a tener 500
tablas ( no es extraño encontrar base de
datos con cientos de tablas).
Por ejemplo, solo para describir a los
supermercados podrías tener:
Supermercado:
-Marketing(publicidad, comerciales, vías de nuevos mercados.etc.)
-Ventas(Totales
producto.etc.)
del
periodo,
de
otros
periodos,
de
cada
-Comercialización y atención al cliente(Proveedores-distribuidores)
-Estudios de mercado(Mercado meta, clientes potenciales, etc.)
-Análisis de competencia(Comparaciones de precios, etc.)
-Contabilidad(Ventas, costos, caja, auditoria interna)
-Producción(Proveedores, inventario de mercadería, etc..)
-Almacenaje(Inventarios al comienzo del periodo, inventario actual,
etc.)
Y MUCHOS MAS…….
Complejidad de la Base de Datos
Puede ser difícil visualizar una Base de
Datos de esta naturaleza
Consultas Analíticas (Reportes)



Un analista de la cadena de supermercados
necesita investigar las ventas totales.
Se contacta con el administrador de la base de
datos y le solicita la siguiente información
Ventas totales por semana, supermercado y tipo
de producto
Productos más vendidos en los últimos dos
meses
Etc.
El administrador calcula estos datos vía consultas
SQL de la siguiente forma:
Consultas Analíticas (Reportes)
Proceso Tradicional para calcular
Consultas analíticas
Después de leer el reporte, el analista
observa que las ventas de la semana X del
año 2010 son especialmente altas: necesita
saber por qué.
Solicita al administrador las ventas por día en
la semana X del 2010.
Otra futuras indagaciones generan una serie
de solicitudes/entregas de reportes entre el
analista y el administrador de la base de datos
Data Warehouse OLAP
Idea: construyamos un sistema para el ANALISTA con las
siguientes características:
 Guarde datos sobre un único tema o proceso
 Ejemplo, proceso de venta obtenido de la base de
datos operacional.
 No es necesario que los datos estén totalmente
actualizados.
 Fácil de visualizar, por ejemplo, datos organizados de
acuerdo a conceptos que sean fáciles de entender para
los analistas: Modelo Multidimensional.
 Fácil formulación de consultas, consultas a distintas
granularidades: Operadores.
 Respuestas en el orden de los pocos segundos.
ESTO ES UN DATA WAREHOUSE OLAP
Esto es una Data Warehouse
OLAP
Colaboración BI
Visualización
Análisis
Geoespacial
Análisis
de
datos
Análisis
Ventas y Marketing
Gestión de
Proyectos
Creación de Sitios
B2B y B2C
Business Intelligence


“Conjunto de herramientas y servicios
destinado a la gestión eficiente del
conocimiento y la información en
empresas y organizaciones”
Nos permite:



Convertir los datos en información
Tomar mejores decisiones rápidamente
Utilizar un método razonable para la gestión
empresarial
Arquitectura de un Data Warehouse
OLAP
Tecnologías OLTP vs OLAP

OnLine Transaction Processing



Sistemas transaccionales, enfocados a
gestionar un gran número de transacciones
concurrentes
Permiten insertar, actualizar, borrar y
consultar una pequeña cantidad de registros
OnLine Analytical Processing


Enfocados al análisis de grandes cantidades
de datos
Proporcionan respuestas rápidas
Tecnologías OLTP vs OLAP







OLTP
Orientado a lo operativo
(procesos)
Predomina la
actualización
Se accede a pocos
registros



Datos altamente
normalizados
Estructura relacional

Rápidos tiempos de
respuesta.
Estructura estática



OLAP
Orientado a temas
Predomina la consulta.
Datos históricos
Procesos masivos, se
accede a muchos
registros
Datos Denormalizados
Estructura
multidimensional
Respuesta masiva
Estructura dinámica,
abundantes cambios
Modelo de Datos Multidimensional
El proceso a analizar se representa como:
 Un conjunto de Dimensiones:
 Perspectivas que usamos para visualizar el
proceso.
 Estructuradas como jerarquías
 Generalmente pequeñas.
 Un conjunto de hechos (facts):
 Asignaciones de mediciones a puntos en
espacios formados por dimensiones.
 Agrupados en tablas de hechos
 Esta tabla cambia frecuentemente.
 Grande (GB’s o TB’s)
Cubos

Producto
Tabla de Hechos



Tabla de
Claves externas
Medidas
Dimensiones
Producto1
Producto2
Producto 3
Hechos
Cliente
Id
Id
Nombre
Nombre
Tamaño
Provincia
…
…
Tiempo
Fecha
Año
Mes
Dia
…
Producto1
Producto2
Producto 3
Opciones de almacenamiento

MOLAP



ROLAP



Almacenamiento en estructura
multidimensional de Analysis Services
Mayor rapidez de respuesta
Almacenamiento en base de datos relacional
Para grandes volúmenes de datos
HOLAP


Híbrido
Respuesta rápida y gran cantidad de datos en
origen
Costo del software.
Preguntas y dudas
???
PREGUNTAS

¿Viendo las características de Data
Warehouse OLAP podría optimizar la
atención al cliente ?

¿Teniendo una micro-empresa o
mediana-empresa seria eficiente
implementar el Data Warehouse
OLAP?