Class 51 OLAP.ppt
-
Upload
jesus-uchiha -
Category
Documents
-
view
83 -
download
2
Transcript of Class 51 OLAP.ppt
11/96/96
Mg. Samuel Oporto Díaz
Almacenes de Datos
INTELIGENCIA ARTIFICIAL
22/96/96
Tabla de Contenido• Introducción a la Inteligencia de Negocios• OLTP y OLAP• Metodología• Diseño Lógico• Diseño Físico• Principios de Diseño• Dimensiones• Cubos y medidas
33/96/96
TOMA DE DECISIONES
44/96/96
Toma de decisiones• Proceso de toma de decisiones:
Tomar decisiones sin la información adecuada, sobre todo cuando ésta se encuentra disponible en la organización, es un riesgo que ninguna empresa debería correr.
DecisiónMedición Control
Realidad
55/96/96
Ejercicio 1• Forme grupos de 4 o 5 alumnos.• Defina un problema de decisión de su entorno inmediato.• La decisión debe ser tomada necesariamente por el grupo.• Debe ser un problema real.• Diga qué información requieren para tomar la decisión.• Diga en qué estado se encuentra, ¿debe procesarla?• Quién es el dueño de la información.• Qué variable controla con esta información.• Explique qué acciones tomará dependiendo del valor de la
variable, arme un grafo, un cuadro, un árbol de decisión.• Tome la decisión en la realidad.• Explique las consecuencias de su decisión.
66/96/96
INTELIGENCIA DE NEGOCIOS
77/96/96
Niveles en el Uso de los Datos
88/96/96
Niveles en el uso de los datos• Nivel operacional: Se utilizan sistemas de información que
monitorean las actividades y transacciones elementales.
• Nivel de administración : Realiza operaciones repetitivas de captura masiva de datos y servicios básicos de tratamiento de datos, con tareas predefinidas.
• Nivel de conocimientos : Realiza actividades de análisis, de seguimiento, de control y toma de decisiones, realiza consultas sobre información almacenada.
• Nivel estratégico: Realizar las actividades de planificación a largo plazo, tanto del nivel de administración como de los objetivos que la empresa posee. Mira el futuro
99/96/96
Uso de la información
Plazo Nivel Uso
Corto plazo Operacional y Administrativo
Obtención y control de datos
OLTP
Mediano plazo
De Conocimientos
Decisiones tácticas
OLAP
Largo plazo Estratégico Decisiones estratégicas
OLAP
OLTP (On-Line Transaction Processing - Procesamiento de Transacciones en Línea). Para la capturan y almacenamiento de transacciones.
OLAP (On-Line Analytical Processing – Procesamiento Analítico en Línea). Para el análisis y las navegación en los datos.
1010/96/96
Inteligencia de Negocios
Business intelligence.• Conjunto de estrategias y herramientas enfocadas a la
administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.
• Características de las herramientas:– Accesibilidad a la información. Acceso de datos a los usuarios con
independencia de la procedencia de estos. – Apoyo en la toma de decisiones. Los usuarios tienen acceso a
herramientas de análisis que les permitan seleccionar y manipular sólo aquellos datos que les interesen.
– Orientación al usuario final. Independiente de los conocimientos técnicos de los usuarios y su capacidad para utilizar estas herramientas.
1111/96/96
Inteligencia de Negocios
Business intelligence.• Es el conjunto de técnicas y herramientas que apoyan la
toma de decisiones.
• Características:1. Proveen información para el control del proceso de negocio,
independientemente de la fuente de los datos.2. Dan soporte a la toma de decisiones.3. Diferencia la información útil para los usuarios finales.4. Uniformiza los términos usados en la institución.
Independientemente del origen de los datos o de la forma de extracción, transformación y agregación.
1212/96/96
Disciplinas• Enterprise Resource
Planning– ERP• Supply Chain
Management - SCM• Customer Relationship
Management. - CRM• Data Warehouses -
DW• Business Intelligence –
BI• Enterprise Application
Integration – EAI
1313/96/96
Disciplinas• Data Warehousing: Se basa en estructuras
multidimensionales (cubos) que almacenan información calculada previamente de todas las combinaciones de todos los niveles de todas las aperturas de análisis. NxM.
• Data Mart: Es el almacén de datos de un hecho en particular.
• Data Mining: Es una técnica para la extracción de patrones y reglas desde los datos, ayuda a crear nuevos modelos no percibidos por el analista hasta ese momento pero que realmente existen en los datos.
1414/96/96
Evolución• Business Data to Business Information
Etapa Pregunta del Negocio Tecnología disponible
Proveedores Características
Data Collection
(1960)
¿Cuál fue el total de ventas en Lima y en
Arequipa?
Computadoras, cintas, discos
IBM, NCR, etc Retrospectivo
Estático
Data Access (1980)
¿Cuáles fueron las ventas por sucursal en Lima y en Arequipa?
RDBMS SQL Oracle, Informix,
Sybase, etc Retrospectivo
binámico
Data Navigation
(1990)
¿Cuál fue el total de ventas en Lima?, Drill
DownOLAP DW
Pilot, Discoverer, Arbor,etc
Retrospectivo Dinámico Niveles
múltiples
Data Mining (2000)
¿Cómo evolucionarán las ventas en el próximo año?
Algoritmos avanzados,
Multiprocesadores
Intelligent Miner (IBM), SAS, etc
Prospectivo, Proactivo
1515/96/96
Inteligencia de NegociosPlazo Técnica Tecnología Tecnología Conocimiento
Largo Plazo Minería de Datos Agrupamiento
Clasificación
Secuenciación
Reglas de asociación
Patrones
Nuevos Conocimientos
Mediano Plazo Data Warehouse OLAP Información
Toma de Decisiones
Corto Plazo Legacy Sistems (sistemas transaccionales)
OLTP Datos
Operativo
1616/96/96
OLAP Y OLTP
1717/96/96
OLTP y OLAP OLTP OLAP
Usuario Operativos, Profesionales TI Trabajadores de conocimiento
Uso Predecible, Repetitivo Ad hoc, Heurístico
Accesos Alta Media y baja
Tipo acceso R/W - actualización al campo Lectura - Sumarización
T. respuesta Segundos Segundos a minutos
Contenido Valores elementales Datos sumarizados, derivados
Estabilidad Dinámicos Estáticos hasta su actualización
Función Operaciones día a día Soporte a las decisiones
Diseño BD Orientado a la aplicación Orientado al tema (sujeto)
Estructura Transaccional (NORMALIZADA) Consultas (DESNORMALIZADA)
# filas cientos millones
# usuarios miles cientos
DB Size 100 MB-GB 100GB-TR
métrica rendimiento de la transacción rendimiento de la consulta
1818/96/96
OLTP • On-Line Transaction Processing.• Sistemas operacionales que capturan transacciones y las
almacenan en Base de Datos.
• Características:– Transacciones en tiempo real (con día a día)– Datos almacenados cambian continuamente.– Mantienen los datos (INSER; DELETE;UPDATE)– Estructuras de datos optimizadas – normalizadas.– Basado en reglas.– Limitado para la toma de decisiones, las consultas
históricas producen un impacto en la operación del sistema.
– Usa Diagrama Entidad Relación (DER).
1919/96/96
OLTP - EjemploOperación del Cliente:
• Tomar la tarjeta del Cliente.
• Validar el Cliente. si el Cliente existe confirmar que se encuentra en una línea de cajeros habilitada.
• Autenticar el cliente en el sistema.
Realizar una transferencia:
• Verificar que está autorizado para realizarla.
• Verificar que tiene saldo.
• Inicializar la transferencia manejándola como una transacción.
• Emitir comprobante.
• Saludar al Cliente.
Operación en sitio Web:
• Validar al cliente y autenticarlo en el sistema.
• Tomar el pedido.
• Controlar los topes de créditos.
• Informar los valores parciales de la compra y acumulados.
• Requerir confirmación del cliente antes de enviar el pedido.
• Enviar el pedido.
• Descontar del stock las cantidades vendidas.
• Informar el número de venta y la fecha de entrega.
• Saludar al cliente.
Sistema de Cajeros Automáticos.
2020/96/96
OLAP• On-Line Analytical Processing.• Respuesta rápida y flexible a consultas, orientada al
análisis de datos.
• Características:– Optimizado para responder rápidamente a consultas.– Consulta interactiva de los usuarios.– Almacenan varios niveles de datos optimizadas para
responden a consultas.– Proporciona una vista de datos multidimensional.– Se puede cambiar fácilmente filas, columnas, y páginas
en informes de OLAP.
2121/96/96
OLAP - Ejemplos• Sistemas de Información para
ejecutivos
– Alertas.
– Toma de decisiones.
• OLAP en la Actividad Financiera
– Reportes analíticos.
– Planeamiento.
– Análisis.
• OLAP en el Marketing
– Análisis de productos.
– Análisis de Clientes.
– Análisis de Facturación.
• OLAP en Otros Usos
– Análisis de la Producción.
– Análisis de Servicios al cliente.
– Evolución del Costo del producto.
2222/96/96
OLAP - OLTP
OLTP Diagrama E-REntidad
Atributo
Relación
Normalización
Integridad Referencial
UML
Lenguaje de Modelamiento Unificado
Análisis
Diseño
Desarrollo
Implementación
Explotación
OLAP Cubos
Hechos
Dimensiones
Jerarquías
Medidas
Codificación
Granularidad
UDM
modelo dimensional unificado
Diseño
Carga
Explotación
2323/96/96
Ejercicio 2• Responder las siguientes preguntas:
2424/96/96
METODOLOGIA
2525/96/96
Metodología
2626/96/96
MetodologíaDefinición • Plantear los objetivos del
proyecto.• Definir los requerimientos del
negocio.• Modelar el negocio• Definir el plan de trabajo y
equipo de proyecto. Modelamiento • Comprender los requerimientos
del negocio.• Diseñar la arquitectura del DWH• Definir el equipo de pruebas.• Revisar el diseño
Construcción• Construir el DWH• Refinar los desarrollos del ETL• Probar la solución• Prueba de performance• Documentación Producción • Poner en operación del sistema• Validar y cargar la información
inicial• Administrar el crecimiento• Soporte de la solución.• Respaldar periodicamente la
información.
2727/96/96
Ejercicio 3• Identifique metodologías para el desarrollo de DWH• Identifique metodologías para el desarrollo de SI• Compare las metodologías de desarrollo de DWH vs SI• Existen metodologías ágiles para el desarrollo de DWH
2828/96/96
Ciclo de Vida del Proyecto
TechnicalArchitecture
Design
TechnicalArchitecture
Design
ProductSelection &Installation
ProductSelection &Installation
End-UserApplication
Specification
End-UserApplication
Specification
End-UserApplication
Development
End-UserApplication
Development
ProjectPlanningProject
Planning
Business
Requirement
Definition(week1)
Business
Requirement
Definition(week1)
DeploymentDeploymentMaintenance
andGrowth
Maintenanceand
Growth
Project ManagementProject Management
DimensionalModeling
DimensionalModeling Physical
DesignPhysicalDesign
Data StagingDesign &
Development
Data StagingDesign &
Development
2929/96/96
DISEÑO LÓGICO
3030/96/96
Diseño Lógico
3131/96/96
Diseño Lógico• Esquema conceptual• Esquemas fuentes no integrados• Esquema fuente integrado• Esquema lógico intermedio• Esquema lógico del DWH
• Lineamientos de diseño• Mapeos• Reglas
• Transformaciones
3232/96/96
Esquemas
Esquema conceptual
Esquema lógico
Esquema físico
Esquema visualización
lineamientos carga consultas
Esquema Fuente
Integrado
Esquema Intermedio
reglas de transformación
Esquema conceptual• Especifica los requerimientos del usuario.
– Hechos, Dimensiones, Medidas
• Representa los objetos del negocio en términos de hechos, dimensiones, atributos de las dimensiones, cruces entre dimensiones, niveles de las dimensiones y medidas.
3434/96/96
Esquemas fuentes• Define el origen de datos:
– Esquemas fuentes no integrados
– Esquema fuente integrado.
3535/96/96
Esquema fuente intermedio• Define los cambios desde el esquema fuente integrado
hasta el esquema lógico del DWH
3636/96/96
Esquema Lógico• La construcción del esquema lógico del DWH se lleva a
cabo mediante transformaciones aplicadas al esquema lógico de la base de datos fuente.
• Estas transformaciones se aplican a sub-esquemas relacionales, comenzando por el esquema fuente, generando como resultado el esquema lógico del DWH
• Especifica– El estilo de diseño del DH Copo de nieve o Estrella– Normalización de dimensiones– Fragmentación de datos
3737/96/96
Modelos básicos dimensionales
Estrella Copo de Nieve
3838/96/96
Esquema Físico• Existe tres formas de almacenar los datos:
.
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
DATOS AGREGACIONES
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
DATOS AGREGACIONES
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
ROLAP - Relacional OLAP. HOLAP - OLAP híbrido
MOLAP - Multidimensional OLAP.
3939/96/96
Mapeos• Indican donde se encuentran en el esquema lógico fuente,
los elementos del esquema lógico conceptual.• Permiten asociar cada elemento.
4040/96/96
Transformaciones• El diseño lógico del DW se realiza aplicando sucesivas
transformaciones de esquemas.• De deja una traza del diseño, de las transformaciones.
4141/96/96
Transformaciones
4242/96/96
Lineamientos de diseño• Abstrae la estrategia de diseño lógico del DWH y las
restricciones de desempeño y almacenamiento.• Define:
– El estilo de diseño del DH Copo de nieve o Estrella– Fragmentación vertical de dimensiones. Cuando normalizar o de-
normalizar una dimensión.• Estrella de-normaliza las dimensiones
• Copo de nieve normaliza las dimensiones
– Fragmentación horizontal de cubos.• Número de cubos para el datamart
• Cubos con datos históricos
– Mapeos• Estable la correspondencia entre esquemas
– Reglas
4343/96/96
DISEÑO FÍSICO
4444/96/96
MOLAP - OLAP Multidimensional• Los datos origen y sus agregaciones están en una
estructura multidimensional.• Los objetos dimensionales son procesados para incorporar
cambios de los datos operacionales• Existe latencia. tiempo comprendido entre procesamientos• Características:
– Provee excelente rendimiento y compresión de datos.
– Mejor tiempo de respuesta, depende de las las agregaciones.
– Estructura optimizada para maximizar las consultas.
– Apropiado para cubos de rápida respuesta.
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
4545/96/96
ROLAP - OLAP Relacional • La información del cubo, sus datos, su agregación, sumas
son almacenados en una base de datos relacional.• No copia la BD original, accede a las tablas origen.• Es más lenta que las otras estrategias (MOLAP o HOLAP).• Se utiliza para ahorrar espacio de almacenamiento en
grandes DB de baja frecuencia de consulta.• Usos comunes:
– Cuando los clientes desean ver los cambios inmediatamente. – Cuando contamos con grandes conjuntos de datos que no son
frecuentemente buscados
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
AGREGACIONES Y DATOS
4646/96/96
HOLAP – OLAP Híbrido• Combina atributos de MOLAP y ROLAP. • Las agregaciones se almacenen en una estructura
multidimensional y los detalle, en la BD original.• Cubos más pequeños q’ MOLAP y más rápidos q’ ROLAP.• Usos comunes:
– Cubos que requieren rápida respuesta
– Cuando existen sumarizaciones basadas en una gran cantidad de datos de origen.
– Solución de compromiso para bajar el espacio ocupado sin perjudicar totalmente el rendimiento de las consultas.
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
DATOS AGREGACIONES
Base de Datos Relacional
Vista de Usuario
Base de Datos Multidimensional
DATOS AGREGACIONES
4747/96/96
Características
MOLAP ROLAP HOLAPAlmacenamiento de las Agregaciones
Modelo Multidimensional
Base de datos relacional
Modelo Multidimensional
Almacenamiento de los datos
Modelo Multidimensional
Base de datos relacional
Base de datos relacional
Facilidad de Creación
Sencillo Muy Sencillo Sencillo
Velocidad de respuesta
Buena Regular o Baja
Buena para consultas que posean agregaciones, Regular para datos de bajo nivel
EscalabilidadProblemas de escalabilidad
Son más escalables
Recomendados para
Cubos con uso frecuente
Datos que no son frecuentemente usados
Si el cubo requiere una rápida respuesta
4848/96/96
Ventajas y Desventajas
Ventajas Desventajas
MOLAPMejor performance en los tiempos de respuesta
Duplica el almacenamiento de datos (ocupa más espacio)
Tiempo de Latencia
ROLAP
Ahorra espacio de almacenamiento. Útil cuando se trabaja con muy grandes conjuntos de datos.
El tiempo de respuesta a consultas es mayor.
HOLAPBuen tiempo de respuesta sólo para información sumarizada
Volúmenes de datos más grandes en la base de datos relacional
4949/96/96
Diseño Físico
query and reporting (Q&R) tool
5050/96/96
PRINCIPIOS DE DISEÑO
5151/96/96
Cubos
5252/96/96
Conceptos de diseño1. Dimensión: Es una entidad de negocios respecto de la cual
se deben calcular las métricas. Ejemplos: clientes, productos, tiempo.
2. Dimension Table (tabla de dimensión): Tablas que almacenan las dimensiones.
3. Fact table (tabla de hechos): Almacena eventos (por ejemplo, las ventas). Contiene las métricas que miden la efectividad de las operaciones del negocio.Fact (hecho): Es una fila de la fact table. Representa un evento específico.
4. Measures (medidas): Valores cuantitativos que almacenan las métricas del negocio. Están representados por columnas numéricas en la fact table.
5353/96/96
5454/96/96
1. Dimensiones• Es un criterio utilizado para cruzar la información.
• La medida “Ventas”, por sí sola, carece de sentido. ¿Quiero ver las ventas por producto? ¿por tiempo? ¿por distribuidor?
• Cada uno de estos criterios produce una dimensión.
5555/96/96
1. Dimensiones y niveles• Una dimensión tiene múltiples niveles de agrupación.
Por ejemplo, la dimensión “Ubigeo” debe poder disgregarse en países, departamentos, provincia, distrito.
• Cada uno de estos niveles de agregación define un nivel.• En el ejemplo antes mencionado, los niveles de la
dimensión “Ubigeo” son:. País
.. Departamento…Provincia….Distrito
• Cada nivel tiene ocurrencias. Por ejemplo, “Lima” es una ocurrencia del nivel Departamento. A estas ocurrencias se les llama miembros (members).
5656/96/96
2. Tablas de dimensión• Las dimensiones se almacenan
en tablas.• Generalmente, cada nivel
representa una columna en la tabla de dimensión.
• Una tabla de dimensión posee una columna clave, comúnmente auto-generada.
• Una tabla de dimensión contiene columnas que almacenan los IDs de cada registro en sus sistemas de origen.
PRODUCTO_DIM
Producto_Key
IDProducto
Familia
Subfamilia
Marca
Presentación
5757/96/96
3. Tabla de Hechos• La tabla de hechos es la tabla primaria del modelo
dimensional, y contiene los valores del negocio que se desea analizar.
• Cada tabla de hechos contiene las claves externas, que se relacionan con sus respectivas tablas de dimensiones, y las columnas con los valores que serán analizados.
• El modelo dimensional divide el mundo de los datos en dos grandes tipos: las medidas y las dimensiones de estas medidas.
• Las medidas, siempre son numéricas, se almacenan en las tablas de hechos y las dimensiones que son textuales se almacenan en las tablas de dimensiones.
5858/96/96
4. Medidas• Son las columnas numéricas que queremos analizar que
provienen directamente de los sistemas OLTP.
• Cuando definimos una medida debemos tener en cuenta cual será la forma de agregación (agrupación de la misma) al subir por la estructura dimensional.
• Estas formas de agregación pueden ser:– Suma: es la operación que suma los valores de las columnas– Cuenta: realiza un conteo de los valores– Mínima: devuelve un valor mínimo– Máxima: proporciona el mayor de los valores– Cuenta de Distintos: cuenta los valores diferentes
5959/96/96
Tabla de hechos y tablas de dimensión
La tabla de hechos tiene relaciones de foreign key con cada una de las tablas de dimensión
6060/96/96
Esquemas de las Dimensiones• En el modelo STAR, cada nivel corresponde con una
columna adicional en una sola tabla de dimensión.
• En el modelo SNOWFLAKE, cada nivel corresponde con una nueva tabla de dimensión.
6161/96/96
El modelo estrella (STAR)
6262/96/96
Modelo SNOWFLAKE
6363/96/96
Modelo STAR vs SNOWFLAKE
STAR SNOWFLAKE
Entendimiento del modelo
Sencillo Mayor dificultad
Número de tablas Menor Mayor
Complejidad de la consulta
Baja Alta
Desempeño de las consultas y el procesamiento del cubo
Rápida Lenta
6464/96/96
Modelo STAR vs SNOWFLAKE
6565/96/96
DIMENSIONES
6666/96/96
Dimensiones• Las dimensiones se obtienen a partir de los criterios
utilizados por los usuarios para consultar las medidas.
• Si las ventas se miden por producto, tiempo y cliente; es posible que deba crear tres dimensiones: producto, tiempo y cliente.
6767/96/96
Atributos• Un atributo representa una propiedad de interés en una
dimensión.
• Ejemplo: atributos de la dimensión Cliente:– Nombre cliente– Grado de instrucción– Nro de hijos– Ciudad– País
• Cada atributo proviene de una columna de la tabla de dimensión.
6868/96/96
Jerarquías y niveles• Existen en una empresa entidades de negocio que admiten
más de una interpretación.
• Por ejemplo: puedo analizar a los clientes por ubicación geográfica, grado de instrucción, sexo, número de hijos, etc.
• Por cada manera distinta de analizar la información de una dimensión, se crea una nueva jerarquía.
• Cada jerarquía contiene su propia estructura de niveles. Cada nivel proviene de un atributo.
6969/96/96
Ejercicio 4• Se desea obtener indicadores de rendimiento de los
empleados de la corporación.• Los reportes de evaluación de los empleados deben ser
totalizados de acuerdo a las divisiones organizacionales y regiones geográficas de la corporación.
• Cada empleado trabaja para una división organizacional. A su vez, cada empleado pertenece a una ciudad, y cada ciudad está contenida en una región.
• ¿Cuál es la manera de definir los niveles de la dimensión Empleado?
7070/96/96
Solución• Crear dos jerarquías: Región y División.
Empleado.Región
▪ Región
▪▪ Ciudad
▪▪▪ Empleado
Empleado.División
▪ División
▪▪ Empleado
7171/96/96
Miembros de una dimensión• Cada miembro es una
ocurrencia específica de una dimensión.
• Las dimensiones suelen tener una estructura basada en niveles. Cada miembro se ubica en un determinado nivel.
7272/96/96
Relaciones entre los miembros• Austria es el padre (parent) de
Graz y Salzburg.• Austria y Belgium son hermanos
(siblings).• Graz y Salzburg son hermanos
(siblings).• Graz y Salzburg son hijos
(children) de Austria.• Los ancestros (ancestors) de
Graz son Ubigeo y Austria.• Los descendientes
(descendants) de Ubigeo son todos los miembros de la dimensión (Argentina, Austria, Graz, Salzburg, etc.)
• Graz y Salzburg son primos (cousin) de Bruxelles y Charleroi.|
7373/96/96
Tipos de dimensiones
1. Dimensiones estándar
2. Dimensiones Time
3. Dimensiones Padre - Hijo
7474/96/96
Dimensiones estándar• Es el tipo más sencillo de dimensión.• Una dimensión estándar tiene un conjunto fijo de jerarquías
y niveles, establecido por el diseñador a través de SSBIDS.
• Propiedades:– Name: Nombre de la dimensión.– Usage: Uso que se dará a la dimensión.– KeyColumns: Columna(s) de clave para la dimensión.– NameColumn: Columna que proporciona el valor
mostrado en la dimensión al consultar datos.
7575/96/96
Dimensiones Parent – Child• Se basan en relaciones
recursivas existentes en una tabla de dimensión.
• Por ejemplo, un empleado tiene un jefe. Pero este jefe es también un empleado.
7676/96/96
Dimensiones Parent – Child• Las dimensiones Parent –
Child contienen un número variable de niveles.
• En la figura, Ken Sánchez es el jefe de Brian Welcker y David Bradley.
• Ejemplos típicos: jerarquías de mando, organigramas.
7777/96/96
Dimensión Time• El tiempo es parte implícita
de la información que contiene el data mart.
• Esta dimensión la podemos definir separándola en distintas jerarquías de tiempo:
• Año• Semestre • Mes
7878/96/96
CUBOS Y MEDIDAS
7979/96/96
Cubos
8080/96/96
Propiedades de los cubos• Name: Nombre del cubo.• Visible: Determina si el cubo es visible o no.• Default Measure: La medida devuelta por el cubo en caso
de que las consultas no especifiquen de forma explícita qué medida se desea visualizar.
• Medida: representa un valor obtenido a partir de una columna numérica de la tabla de hechos.
• Grupo de medidas (measure group): Las medidas se agrupan en grupos de medidas (grupo de medidas). Cada grupo de medidas corresponde con una tabla de hechos. Un cubo puede contener varios grupo de medidas.
8181/96/96
Propiedades de las medidas• Name: Nombre de la medida.• Description: Descripción de la medida.• Source: Columna de la tabla de hechos a partir de la cual
se obtiene la medida. • Format String: Determina el formato de visualización de la
medida (por ejemplo, porcentaje y moneda). También permite ingresar una cadena de formato personalizada.
• Visible: Determina si la medida es visible o no. Esta propiedad es útil cuando se definen medidas intermedias, a partir de las cuales se calcularán otras medidas a través de MDX.
• Data Type: Tipo de dato de la medida. Por defecto, es heredado del tipo de dato de la columna que genera la medida.
8282/96/96
Función de agregación• SUM: Es por defecto. Significa que el valor de la medida para un
miembro de una dimensión es igual a la suma de los valores para todos sus miembros hijos.
• COUNT: Recupera la cuenta de registros en la tabla de hechos. • MIN: Significa que el valor de la medida para un miembro es igual al
valor mínimo encontrado entre sus miembros hijos.• MAX: Significa que el valor de la medida para un miembro es igual al
valor máximo encontrado entre sus miembros hijos.• DISTINCT COUNT: Recupera la cuenta de registros en la tabla de
hechos, eliminando las ocurrencias repetidas.• NONE: No se efectúa ningún tipo de agregación• BY ACCOUNT: Agrega la medida de acuerdo con la función de
agregación asignada a las dimensiones de tipo “Account”.
8383/96/96
Función de agregación• AVERAGE OF CHILDREN: Significa que el valor de la medida para un
miembro de una dimensión es igual al promedio de los valores para todos sus miembros hijos no vacíos.
• FIRST CHILD: Significa que el valor de la medida para un miembro es igual al valor de la medida para su primer miembro hijo.
• LAST CHILD: Significa que el valor de la medida para un miembro es igual al valor de la medida para su último miembro hijo.
• FIRST NON EMPTY: Significa que el valor de la medida para un miembro es igual al valor de la medida para su primer miembro hijo no vacío.
• LAST NON EMPTY: Significa que el valor de la medida para un miembro es igual al valor de la medida para su último miembro hijo no vacío.
8484/96/96
Relaciones entre las dimensiones hechos• Regular• Referenciada• Fact• Many – to – many
8585/96/96
1. Relación regular• Relación uno – muchos con la tabla de hechos.
8686/96/96
Roles de las dimensiones• En ocasiones, una dimensión participa múltiples veces en
el mismo cubo, desempeñando distintos roles.• Ejemplos:
– Una tabla de hechos puede contener tres columnas que lo enlacen con la dimensión de tiempo: una columna para almacenar la fecha de facturación, otra para almacenar la fecha de remisión, y otra para almacenar la fecha de entrega.
– Una tabla de hechos puede contener dos columnas enlazadas con la dimensión de empleados: una columna para representar al empleado que efectuó la venta, y otra para representar al empleado que efectuó el despacho.
8787/96/96
Roles de las dimensiones
8888/96/96
2. Relación referenciada• Se produce cuando la tabla de dimensión no está
directamente relacionada con la tabla de hechos.
8989/96/96
2. Relación referenciada
9090/96/96
3. Relación “Fact”• Frecuentemente, las tablas de hechos contienen, además
de columnas de medidas y foreign keys, columnas adicionales que almacenan información relevante para el negocio.
• En estas situaciones, puede resultar muy útil definir una dimensión a partir de la tabla de hechos. A este tipo de dimensiones se les denomina “dimensiones degeneradas”.
9191/96/96
3. Relación “Fact”• La columna
“SalesOrderNumber” almacena el número del documento de orden de venta.
• Esta información puede ser usada para definir una dimensión.
9292/96/96
4. Relación Muchos – Muchos• Implementan relaciones muchos – muchos entre tabla de
hechos y tabla de dimensión.
9393/96/96
4. Relación Muchos – Muchos• Ejemplos:
– Un motivo de venta (tabla de dimensión) puede tener muchas ventas (tabla de hechos). Una venta específica, a su vez, puede tener muchos motivos.
– La misma ausencia laboral puede deberse a múltiples razones. Cada razón tiene varias ausencias relacionadas.
• Estas relaciones se implementan a través de una tabla de hechos intermedia.
9494/96/96
4. Relación Muchos – Muchos