Modelo Dimensional
Kimball
1
lunes 7 de mayo de 2012
Modelos relacionales y dimensionales
- Modelo E-R:
- Entidades.
- Atributos.
- Relaciones.
2
- Modelo Dimensional:
- Hechos.
- Dimensiones.
- Medidas.
lunes 7 de mayo de 2012
Modelo Estrella.- Eficiencia.- Soportado por múltiples SGBD.- Análisis de datos de menor complejidad,
debido a la desnormalización.
3
lunes 7 de mayo de 2012
Modelo de copo de nieve.
- Mayor normalización, es decir los niveles de las jerarquías se normalizan.
- Mayor flexibilidad.- Mayor dificultad de mantenimiento.- Joins costosos.- Menos registros en las dimensiones.
4
lunes 7 de mayo de 2012
Modelado dimensional.
5
lunes 7 de mayo de 2012
Modelado dimensional.- Es una adaptación del modelo relacional.- Consiste en tablas de hechos que se caracterizan usando
dimensiones y medidas.- La información sobre un hecho (actividad) se representa
mediante indicadores (medidas o atributos de echo).- La información da cada dimensión se representa por un
conjunto de atributos (atributos de dimensión).- Una dimensión es el contexto de un echo, tiende a ser
discretas y jerárquicas.- Un indicador es una cantidad que describe el echo, debe
ser agregables.
6
lunes 7 de mayo de 2012
Conceptos básicos.
- Hecho: Evento, actividad, ítem, transacción del negocio.
- Medida: Atributo o medida de hechos, métricas del negocio
- Dimensión: Característica de un hecho.
- Jerarquía: Relaciones padre-hijo dentro de una dimensión.
- Tabla de hechos: Almacena eventos y las métricas.
- Tabla de dimensión: Almacenan las dimensiones.
7
lunes 7 de mayo de 2012
Hechos
8
-Representan un evento o actividad específica, tiene dimensiones y medidas.
-Representan un item de negocio, una transacción o un evento que tiene significancia para el negocio.
-Son aquellos datos que residen en una tabla de hechos y que son utilizados para crear indicadores, a través de sumarizaciones preestablecidas.
-Un hecho debe estar relacionado al menos con una dimensión: “El tiempo”.
lunes 7 de mayo de 2012
Medidas – Metricas – Hechos.
Es un atributo numérico de un hecho que representa el comportamiento del negocio relativo a la dimensión.
9
Ejemplos: -Ventas en $$.-Cantidad de productos.-Total de transacciones.-Cantidad de pacientes admitidos.-Llamadas efectuadas.-PromedioGeneral = avg(notasFinales).-MontoTotal = precioproducto*cantidad.
lunes 7 de mayo de 2012
Hechos o medidas.
- Representan los valores que son analizados.
- Características:
- Deben ser numéricas (Cálculos).
- Cruzan todas la dimensiones en todos los niveles.
- Si la medida no es numérica se deberá codificar a un valor numérico y cuando se tenga que exponer decodificarla para mostrar su valor original.
10
lunes 7 de mayo de 2012
Hechos o medidas.
Naturales: - Agregación de los datos originales.
- Suma.- Cuenta.- Mínima.- Máxima.- Distintos.
11
Calculadas: - Se derivan de una medida natural.
- Alertas.- Cálculos.- Condicionales.
lunes 7 de mayo de 2012
Dimensiones.
- Característica de un echo (Análisis - Toma de decisiones).
- Determina el contexto del hecho (quien participó, cuándo y donde paso).
- Entidad de negocio en la cual se calculan la métricas (clientes, productos, tiempo).
- Discretas y jerárquicas: Pais, región, provincia.
- Colección del mismo tipo que permite categorizar un hecho.
12
lunes 7 de mayo de 2012
Dimensiones- Se utilizan como parámetros para los
análisis OLAP.- Dimensiones habituales:
13
Dimensión MiembroTiempo Meses, Trimestre, Años
Geografía País, Región, CiudadCliente Id Cliente
Vendedor Id Vendedor
lunes 7 de mayo de 2012
Jerarquía dimensiones
- Una jerarquía representa una relación lógica entre los datos de una dimensión.
- Estos datos poseen una relación “Padre-Hijo”
14
lunes 7 de mayo de 2012
- Características:- Pueden existir varios niveles.- Relación 1-N.
- Se identifican cuando existen relaciones 1-N en la dimensión
15
Jerarquía dimensiones
lunes 7 de mayo de 2012
Origen de las jerarquías.
16
CategoríaNumero producto Tipo
Día Mes Trimestre Año
Semana
Tiempo
Producto
lunes 7 de mayo de 2012
Granulidad.- El nivel de detalle de la información.
- A mayor nivel de detalle, mayor posibilidad analítica.
- Los datos con granulidad fina (nivel de detalle) podrán ser resumidos hasta obtener granulidad media o gruesa.
17
Ejemplos:
-Datos de ventas o compras de una empresa, pueden registrarse día a día.
-Datos pertinentes a pagos de sueldos o cuotas, podrán almacenarse a nivel de mes.
lunes 7 de mayo de 2012
Tablas de hechos.
- Las tablas de hechos contienen las dimensiones y las medidas de los hechos.
- Los hechos y medidas son los valores de datos que se analizan (numéricos).
- La tabla de hechos tiene una clave primaria compuesta por claves primarias de la tabla de dimensiones.
18
lunes 7 de mayo de 2012
19
“Analizar el indicadorN, por perspectivaN”
lunes 7 de mayo de 2012
Tabla de dimensiones.- Definen la organización lógica de los datos.
- Tienen un PK y columnas de referencia:
- Clave principal (PK)
- Claves foráneas.
- Datos de referencia primario.
- Datos de referencia secundaria.
- No siempre la PK del OLTP, corresponde con la PK de la tabla de dimensión.
20
lunes 7 de mayo de 2012
Etapas.
21
Requerimientos del usuario
Construcción de las Dimensiones
Armado de la Tabla de Hechos
Definición de las Medidas
Decidir la granularidad
0
2
1
3 4
lunes 7 de mayo de 2012
Requerimientos del usuario.
22
DimensionesDimensionesDimensionesDimensionesDimensiones
Medidas Tiempo Sucursal Vendedor Cliente Producto
Ventas_Importe X X X X X
Ventas_Costo X X X X X
Ventas_Unidades X X X X X
Ventas_ImporteTotal X X X X X
Ventas_Ganancia X X X X X
Ventas_Promedio X X X X X
0
lunes 7 de mayo de 2012
Decidir granulidad.
- La granulidad:- Nivel de detalle al que se desea almacenar la información
sobre la actividad a modelar.- Determina el significado de la tuplas de la tabla de
hechos.- Determina las dimensiones básicas del esquema.
23
Sucursal
* sucursal
** tipo sucursal
Sucursal* sucursal
** tipo sucursal
*** pais
Sucursal* sucursal
** tipo sucursal
*** pais
**** provincia
Sucursal* sucursal
** tipo sucursal
*** pais
**** provincia
***** ciudad
1
lunes 7 de mayo de 2012
Construccion de las dimensiones.
- Identificar las dimensiones que caracterizan el proceso al nivel de detalle (granulo) que se ha elegido.
- De cada dimensión se debe decidir los atributos (propiedades) relevantes para el análisis de la actividad.
- Entre los atributos de una dimensión existen jerarquías naturales que deben ser identificadas (día-mes-año)
24
•Tiempo.•sucursal.•Vendedor.•Cliente.•Producto.
Cuando se produce la actividad.Donde está ubicado.Quien ha vendido.Quien es el destinatario.Cual es el objetivo de la actividad.
2
lunes 7 de mayo de 2012
DimensionesDimensionesDimensionesDimensionesDimensiones
Medidas Tiempo Sucursal Vendedor Cliente Producto
Ventas_Importe X X X X X
Ventas_Costo X X X X X
Ventas_Unidades X X X X X
Ventas_ImporteTotal X X X X X
Ventas_Ganancia X X X X X
Ventas_Promedio X X X X X
2
lunes 7 de mayo de 2012
DimensionesDimensionesDimensionesDimensionesDimensiones
Medidas Tiempo Sucursal Vendedor Cliente Producto
Ventas_Importe X X X X X
Ventas_Costo X X X X X
Ventas_Unidades X X X X X
Ventas_ImporteTotal X X X X X
Ventas_Ganancia X X X X X
Ventas_Promedio X X X X X
2
lunes 7 de mayo de 2012
Tabla de hechos
DimensionesDimensionesDimensionesDimensionesDimensiones
Medidas Tiempo Sucursal Vendedor Cliente Producto
Ventas_Importe X X X X X
Ventas_Costo X X X X X
Ventas_Unidades X X X X X
Ventas_ImporteTotal X X X X X
Ventas_Ganancia X X X X X
Ventas_Promedio X X X X X
3
lunes 7 de mayo de 2012
Definicion de medidas.
Medidas
4
lunes 7 de mayo de 2012
Top Related