Sistema Web de Soporte a las Decisiones para el cultivo de arroz
+ + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
-
Upload
ronald-mamani -
Category
Documents
-
view
213 -
download
0
Transcript of + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
1/60
Rodolfo Arana Gonzales
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
2/60
El dinámico mundo de los negocios hace necesario el
acceso rápido y sencillo a información para la toma dedecisionesLas empresas tienen Sistemas Transaccionales (ST) paraaplicaciones de nivel operacional. Los niveles gerenciales necesitan de información máselaborada para tomar decisiones cruciales. Confrecuencia usan la experiencia o un enfoque subjetivo.Este enfoque no es apto, pues estudios de gestión decalidad vigentes han demostrado la importancia de la
toma de decisiones basada en cifras, datos y hechos.
2
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
3/60
Los Data Warehouse (DW) permiten tomar decisionescon enfoque racional, con información confiable y
oportuna.Un DW básicamente transforma los datosoperacionales de los ST en información útil paradecidir.
En esencia, con un DW se puede lograr:• Encontrar relaciones nuevas entre los datos• Predecir el comportamiento futuro bajo
condiciones dadas.
Su filosofía es modelar los datos a partir dedimensiones basadas en una tecnología deprocesamiento analítico.
3
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
4/60
Los datos operacionales (dispersos) son entrada alDW.
La tarea de un DW es :Recolectar - Unificar - Depurar
Eliminar inconsistencias y conservar solo información
útil para los objetivos empresariales.Los datos en el ambiente DW pueden organizarse en:
• Data Warehouse corporativo
• Dividirse por área o sector, almacenándose en
Data Marts (versión reducida de un DW)
4
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
5/60
Las aplicaciones de usuario final que acceden al DWbrindan:
•
Información a diferentes niveles de agregación(detallados o resumidos)
• Filtrar consultas por distintas variables (“rebanar”y “picar” la información).
• Herramientas como el Data Mining, para encontrarrelaciones ocultas entre los datos.
En consecuencia, la integración de un DW a laempresa representa una ventaja competitiva en el
mundo de los negocios.
5
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
6/60
El proceso automatizado del negocio usa datosoperacionales, (registros de las transaccionesalmacenados en una base de datos).
Para los directivos (usuarios) del negocio esdifícil tener acceso a los datos operacionalespor limitaciones de rendimiento y tecnología.
Lo que el usuario del negocio necesita paraanálisis son datos informativos. Estos son unacombinación de datos operacionales con datosde fuentes externas, modificados, depurados,transformados, consolidados y organizados.
6
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
7/60
Los datos operacionales manejados porsistemas operacionales o transaccionales (OnLine Transactional Processing, OLTP), seconcentran en la administración y la mediciónde:
◦
indicadores empresariales (capital einversión),◦ indicadores financieros (márgenes de
utilidades, etc.)◦ indicadores de ventas (identificación de
clientes etc.)
7
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
8/60
Por su parte, los datos informativos son losque conforman un DW, que comprende,
mide y administra parámetrosempresariales estratégicos, como:
◦ Crecimiento del ingreso◦
Rentabilidad◦ Participación en el mercado◦ Segmentos del cliente.
8
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
9/60
Datos Operacionales Orientados a una
aplicación Integración limitada Constantemente
actualizados Sólo valores
actuales Soportan
operaciones diarias
Datos Informativos Orientados a un
tema Integrados No volátiles, no
cambian Valores a lo largo
del tiempo Soportan decisiones
de administración
9
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
10/60
Concepto continuará)
Un Data Warehouse es un conjunto de datos
integrados orientados a temas, de tiempo
variante, no volátil, que se usa en el proceso
de toma de decisiones de una organización.
A esta definición se incluyen herramientaspara la inteligencia empresarial (BI),herramientas para extraer, transformar y
cargar datos en el almacén de datos, yherramientas para gestionar y recuperar losmetadatos.
10
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
11/60
Dos enfoques: Data Warehouse
Bill Inmon: los Data marts se crearán despuésde haber terminado el data warehousecompleto de la organización.Ralph Kimball: un data warehouse no es más
que: "la unión de todos los Data marts de unaorganización»
11
http://localhost/var/www/apps/conversion/tmp/scratch_7/W-%20Data%20Warehouse%20Almac%C3%A9n%20de%20datos.docxhttp://localhost/var/www/apps/conversion/tmp/scratch_7/W-%20Data%20Warehouse%20Almac%C3%A9n%20de%20datos.docxhttp://localhost/var/www/apps/conversion/tmp/scratch_7/W-%20Data%20Warehouse%20Almac%C3%A9n%20de%20datos.docx
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
12/60
Integra y asocia información de muchas fuentes .Múltiples bases de datos y otras fuentes.
Está orientado a un tema . Relevante para laorganización. Variante en el tiempo . Datos relativos a un
periodo de tiempo e integrados periodicamente
(como fotos). Gestiona múltiples versiones de un esquema de
base de datos . Controlar información originadaen diversas organizaciones de bases de datos.
Condensa y agrega información . Condensa yagrega información para presentarla en formacomprensible.
12
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
13/60
13
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
14/60
DefiniciónUn DSS es un sistema de computación diseñado
para apoyar al proceso de toma de decisiones
de planeamiento, de administración y
operacionales) en un negocio.
Contiene servicios o procesos para elegir,
manipular y analizar datos informativos ypresentar resultados. Brinda acceso transparente a los datos en varias
partes del DW y proveer de interfaces comunes aun grupo de usuarios de la organización“Un DSS es una ventana a los datos informativos”
14
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
15/60
Definición
La Inteligencia de Negocios Business
Intelligence, BI), es una disciplina que combina
consultas, servicios, aplicaciones y tecnologías
para obtener, administrar, analizar y
transformar datos en información útil para
lograr el entendimiento necesario para tomar
decisiones eficaces.
Se basa en el concepto de Inteligencia:“Aplicación de la información, habilidades,
experiencias y razonamiento para resolver unproblema de negocios”
15
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
16/60
Inteligencia de Negocios: Proceso de convertir datos en conocimiento y
conocimiento en acción para el beneficio del
negocio.DW + DSS = BI
16
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
17/60
17
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
18/60
Data Mart. Definición
Un Data Mart es una implementación de un DW con
un determinado alcance de información y unsoporte limitado para procesos analíticos.◦ Sirve a un sólo departamento de una
organización o para el análisis de problemas deun tema particular.
◦ Es un subconjunto de información corporativacon formato adicional a la medida de unusuario específico.
◦ Será siempre menor en complejidad y alcance
de los datos.
18
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
19/60
Problemas en la organización Falta de integración de la
información. Sobrecarga de información. Exceso de información genérica y
despersonalizada. Falta de retroalimentación oportuna
para la mejora de los negocios.
19
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
20/60
Beneficios del DW Menor costo en la toma de decisiones. Posibilidad de encontrar relaciones
ocultas. Aprendizaje del pasado. Mayor flexibilidad ante el entorno. Ventajas competitivas:Mejor servicio al cliente.
Rediseño de procesos.
20
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
21/60
Arquitectura Transformar los datos en conocimiento es
un proceso complejo, por tanto serequiere una estructura.
Un Data Warehouse es una arquitectura
que debe servir como infraestructura paraproporcionar una solución completa a losproblemas anteriormente mencionados.
21
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
22/60
22
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
23/60
Fuentes de datos
Pueden ser datos de sistemas operacionales
corporativos, sistemas operacionalesdepartamentales y fuentes externas.Extracción, transformación y carga ETL)
Son subsistemas para poblar el Data
Warehouse. Se pueden construir utilizandoherramientas y productos disponibles en elmercado o programas y procesoscodificados desde cero, que permitan elcrecimiento evolutivo del DW (mapeo).
23
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
24/60
Extracción Extraction)
Capturar y copiar los datos requeridos de uno
o más sistemas operacionales o fuentes dedatos, que luego son colocados en un archivointermedio con un formato definido.
Pueden presentarse errores como ser
violaciones de integridad, claves duplicadas,formatos de datos incorrectos y datos inválidoscomo campos vacíos, fechas futuras e importesnegativos cuando estos no correspondan
24
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
25/60
Transformación Transformation)
Esta fase consiste en leer los archivosintermedios generados por la extracción,realizar las transformaciones necesarias,construir los registros en el formato del
Data Warehouse y crear un archivo desalida conteniendo todos los registrosnuevos a ser cargados en el DataWarehouse.
25
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
26/60
Las transformaciones incluyen: Combinar campos múltiples de nombres y
apellidos en un solo campo. Fusionar campos o datos homónimos. Separar un campo de fecha en año, mes día. Cambiar la representación de los datos, como
TRUE a 1, y FALSE a 0, o códigos numéricos aalfanuméricos. Cambiar un dato que tiene múltiples
representaciones a una sola representación,como por ejemplo definir un formato comúnpara números telefónicos etc.
26
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
27/60
Carga Loading) AQUI
Consiste en tomar los datos de la fase de
transformación y cargarlos en el DW.Estos datos son insertados en el DW y rara vez sonactualizados o eliminados
Ambiente Data Warehouse
Este bloque almacena los datos informativos parausos estratégicos.Algunas herramientas no usan este bloque por loque las consultas las realizan directamente sobrela base operacional (vista lógica)
27
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
28/60
Herramientas de acceso y uso
Se incluye software y hardware para visualización,reportes, hojas de calculo, graficos y diagramas deanalisis.
28
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
29/60
Herramientas de acceso y uso
Son sistemas de software basados en técnicas paracapturar datos, analizarlos desde distintos puntos devista y transformarlos en información útil para elnegocio.Se llaman genéricamente Herramientas de Inteligenciade Negocio (Business Inteligence Tools, BIT) Ver video
Consultas SQL Herramientas MDA (Multidimensinal Analysis) OLAP (On-Line Analitical Processing) Data Minning
29
http://localhost/var/www/apps/conversion/tmp/XXI%20Encuentro%20GeneXus%20%20%20%20Info%20conferencia%20%20%20materiales2.avihttp://localhost/var/www/apps/conversion/tmp/XXI%20Encuentro%20GeneXus%20%20%20%20Info%20conferencia%20%20%20materiales2.avi
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
30/60
Los metadatos
Son datos acerca de los datos que proveen acceso alDW, mediante un componente llamado repositorio.
Tareas:◦ Catalogar y describir la información disponible.◦ Especificar el propósito de la misma.◦ Indicar las relaciones entre los distintos datos.
◦ Establecer quién es el propietario de la información.◦ Relacionar estructuras técnicas de datos con
información de negocio.◦ Establecer las relaciones con los datos operacionales
y las reglas de transformación.◦ Limitar la validez de la información.
30
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
31/60
Ejemplo: Metadato para entidad dimensión) Cliente
31
Nombre Cliente
Nombre alterno CuentaDefinición Un cliente es una persona o empresa que
hacomprado a la corporación bienes oservicios por lo menos en una ocasión
Fecha creación 15 de enero de 2000Fecha últimaactualización
01/03/2005
Claves Identificación del cliente
Ciclo deactualizac.
Extraído cada mes
Patrones de acceso Fecha de último acceso 20/03/2013
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
32/60
Ejemplo: Metadato para atributo campo) Cuenta
32
Nombre Nombre de Cliente
Nombre alterno Nombre de Cuenta
Definición Nombre oficial que usa la persona o empresa cliente
Fecha creación 15 de enero de 2000
Fecha última actualiz. 01/03/2005
Clave N
Fuente de dato Sistema de ingreso de pedidos. El atributo proviene
de la tabla clientes y se denomina nom_cuenta
Inf. de transf/conversión 30 caracteres
Algor. de resum/deriv Ninguno
Valor predeterminado Ninguno
Fuentes oper. múltiples No
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
33/60
Problemas del modelo Entidad-Relación
Para sistemas transaccionales (OLTP) el modelo ER esadecuado en función de la integridad y de la
redundancia de datos.Para un DW el modelo ER tiene estos problemas: Legibilidad limitada. Los usuarios suelen “navegar” o
“divagar” por el modelo ER en busca de información.
Dificultad para las herramientas de consulta en el acceso aun modelo ER. Estas herramientas poseen prestacionesmediocres cuando trabajan en entornos relacionales degrandes volúmenes de datos.
La utilización de la técnica de modelado ER frustra el
principal atractivo del DW. Con el uso del modelado ERqueda frustrada la recuperación de información intuitiva ycon alto rendimiento.
33
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
34/60
Modelo dimensional
–
OLAP On Line Analisy Processing)
Técnica de diseño lógico que presenta la informaciónen un marco estándar e intuitivo para un acceso dealto rendimiento.El Procesamiento Analítico en Línea (OLAP) es unatecnología de análisis de datos.Crea nueva informaciónempresarial a partir de los datos existentes.
Basado en el modelo relacional (con restricciones)Resume, organiza y presenta la información parasoportar el análisis.Cubos OLAP
Son estructuras relacionales compuesta por dimensionesseparadas y heterogéneas, cuyos datos que se obtienen devarias fuentes (tablas relacionales, archivos planos).
34
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
35/60
Modelo dimensional OLAP
35
Características de OLAP:
Presenta una visión multidimensional lógica de los datosdel Data Warehouse, independiente de su forma dealmacenamiento.
Crea resúmenes, adiciones y jerarquías. Comprende consultas interactivas y análisis de los datos.
Permite una profundización hacia niveles más detalladoso un ascenso a niveles superiores de resumen y adición.
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
36/60
Modelo dimensional OLAP
36
Características: Ofrece opciones de modelado analítico, así
como también provee modelos estadísticosbásicos.
Responde con rapidez a las consultas, de modoque el proceso de análisis no se interrumpe y la
información no se desactualiza. Recupera y exhibe datos tabulares en dos o tres
dimensiones, cuadros o gráficos, con un fácilpivoteo de los ejes.
OLAP OLTP
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
37/60
Usuario
Gerente, Ejecutivo Empleado, Prof. de Sistemas
Función Soporte a las Decisiones Operación diaria Diseño de la Base
de Datos
Orientado a una materia Orientado a una aplicación
Datos
Históricos, resumidos,multidimensionales,integrados,consolidados, detallados
Actuales, detallados,relacionales, aislados
Uso
Ad-hoc, requerimientos delmomento
Repetitivo
Acceso Exploración Lectura/Escritura,Índices/Algoritmos dedispersión
Unidad de Trabajo
Consultas complejas Transacciones simples
Cantidad registros
accedidos
Millones Decenas
Cantidad usuarios Cientos Miles
Volumen Base de
Datos
Mayor Menor 37
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
38/60
38
Elementos fundamentales de OLAP:
* Áreas temas
* Indicadores
* Dimensiones
* Hechos
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
39/60
Area tema
Un área tema es una cuestión de interés de una funciónempresarial. Por ejemplo, el departamento decomercialización puede estar interesado en las áreas tema:
Pedidos, Promociones, Mercados y Ventas.Medidas indicadores)
Son cuantificadores del desempeño de un ítem o unaactividad del negocio. Esta información es usada en
consultas para evaluar el desempeño de un área temaPara el área tema “llamadas”, los indicadores serían:
duración de las llamadas y cantidad de llamadas.En un “banco”, los indicadores pueden ser:
creditos, comisiones, cant. clientes, % particip. mercado
39
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
40/60
Dimensiones
Son atributos usados por los analistas paraidentificar el contexto de las medidas con las que
trabajan. Vienen expresadas en forma de cualidades de las medidas y que no cambian en el tiempo.En una telefónica:
Tipo de Llamada, Duración, Organización Telefónica
En un banco se tendrán:Cuentas, Clientes, Tiempo, Productos, Agencias,
Regiones, etc.Las dimensiones están compuestas por «miembros»,
que pueden tener jerarquías. Por ejemplo, el mesdentro de un trimestre. (otro ej. areas o deptos.,dentro de empresa)
40
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
41/60
41
Medida: Duración deLlamadas.
Dimensiones:
Tiempo, Tipode Llamada yOrganización
Telefónica(secciones)
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
42/60
42
Técnicas para navegar por distintos niveles de detalle de una jerarquía de datos, desde los de mayor nivel de agregación hasta
los más detallados y viceversa. Drill Down explora los hechoshacia los niveles más detallados de la jerarquía de dimensiones,mientras que Roll Up explora los hechos iterativamente hacia elnivel más alto de agregación.
DrillDown yRoll Up
*
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
43/60
43
Los datos multidimensionales pueden ser mostrados aplicandodiferentes filtros a los cubos.
Slice (Rebanar) a un subconjunto de datos de un cubo se aplica unaúnica restricción a una sola dimensión, mediante la elección de unmiembro en particular. Cuando se combinan varios Slice la acciónefectuada es llamada Dice (Picar).
Slice y Dice
*Navegación en OLAP
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
44/60
Ventas productos farmaceuticos
en miles de Bs.)
Enero
44
Agencia 1 Agencia 2 Agencia 3
Refrianex 558 553 644
Optigen 323 290 307Amoxicilina 922 452 455
Risperidon
a
457 691 821
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
45/60
Agencia 1 Agencia 2 Agencia 3
Refrianex 428 523 301Optigen 33 91 33
Amoxicilina 769 821 502
Risperidona 688 500 680
Agencia 1 Agencia 2 Agencia 3
Refrianex 501 490 490
Optigen 33 91 33
Amoxicilina 769 821 502Risperidon
a
688 500 680
Ventas productos farmaceuticos
en miles de Bs.)
Abril
Marzo
Febrero
Enero
45
Agencia 1 Agencia 2 Agencia 3
Refrianex 244 663 533Optigen 64 66 17
Amoxicilina 755 983 742
Risperidon
a
544 876 558
Agencia 1 Agencia 2 Agencia 3
Refrianex 558 553 644
Optigen 323 290 307
Amoxicilina 922 452 455
Risperidon
a
457 691 821
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
46/60
Tipos de implementación
El esquema multidimensional puede ser
implementado por dos tipos de esquemas omodelos relacionales:Modelo estrella – el más utilizado-(starschema)
Modelo copo de nieve (snowflake schema)
46
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
47/60
Elementos del modelo estrella
Tablas dimensión - Tabla de hechosLas tablas periféricas dimensión guardan lainformación descriptiva acerca de sus miembros ysus relaciones, mientras que la tabla central dehechos con una clave primaria almacena datos denegocios.
Indicadores o medidas
Son medidas candidatas los atributos numéricos devalor continuo. Pero no cada atributo numérico esuna medida.
Están involucradas en «queries de usuario» quecalculan resúmenes. Ejemplos:
Cantidades, tamaños, montos, duración, etc.
47
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
48/60
Tablas de dimensión
Cada tabla dimensión tiene su clave primaria que
corresponde exactamente con uno de loscomponentes de la clave compuesta de la tabla dehechos.Las tablas de dimensiones contienen informacióntextual descriptiva, sus atributos se emplean comofuente de las restricciones en las consultas al DW.Las dimensiones son referenciadas por las llaves dedimension. Contienen:
Entidades de dimensión
Atributos de dimensión Jerarquías de dimensión Niveles de agregación
48
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
49/60
Tabla de hechos
La tablas de hechos, además de sus campos clave,contiene uno o más indicadores o “hechos”. Los
indicadores más útiles en una tabla de hechos sonnuméricos y aditivos.Puede representar un objeto de negocio, unatransacción o un evento que es utilizado por el
analista de información. Contienen:◦ Un identificador de hechos◦ Llaves de dimensión (que los enlaza con las dimensiones)◦ Medidas◦
Varios tipos de atributos (se derivan de otros datos delmodelo)
49
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
50/60
50
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
51/60
Modelo copo de nieve
En este modelado se normalizan algunas lasdimensiones reflejando las jerarquías en las mismasy conservando lo esencial del modelo en estrella: lastablas de hechos.La ventaja del modelo copo de nieve es eliminar laredundancia de datos y por lo tanto ocupar menos
espacio en discoCuando no es posible recopilar toda la informaciónnecesaria en un único esquema estrella o copo nenuieve, se puede utilizar varios esquemas. Cada uno
de estos esquemas se denomina Datamart.
51
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
52/60
1. En que nivel de trabajo de una empresa se aplica el
Data Warehouse y por que?
2. Con un DW se pueden lograr en esencia dos
aspectos. Cuales son?
3. Cuales son las principales tareas de un DW?
4. Indique las aplicaciones de usuario final que bridan
los DW.
5. Que son los datos informativos para un usuario del
negocio?
6. A que se refieren y que miden los sistemas OLTP?
7. Que miden los datos informativos de un DW?
52
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
53/60
53
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
54/60
54
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
55/60
PLANIFICACIÓN DEL PROYECTO.
La planificación busca identificar la definición y el alcance del proyecto dedatawarehouse, incluyendo justificaciones del negocio y evaluaciones defactibilidad. La planificación del proyecto se focaliza sobre recursos, perfiles,tareas, duraciones y secuencialidad. El plan de proyecto resultante identifica
todas las tareas asociadas con el BDL e identifica las partes involucradas. Estaetapa se concentra sobre la definición del proyecto (identificación del escenariodel proyecto para saber de dónde surge la necesidad del data warehouse).
DEFINICIÓN DE LOS REQUERIMIENTOS DE NEGOCIOS
Un factor determinante en el éxito de un proceso de Data Warehousing es lainterpretación correcta de los diferentes niveles de requerimientos expresados
por los diferentes niveles de usuarios. La técnica utilizada para relevar losrequerimientos de los analistas del negocio difiere de los enfoquestradicionales guiados por los datos [Inm92] [Gol99]. Los diseñadores de losdata warehouses deben entender los factores claves que guían al negocio paradeterminar efectivamente los requerimientos y traducirlos en consideracionesde diseño apropiadas.
55
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
56/60
56
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
57/60
•DISEÑO DE LA ARQUITECTURA TÉCNICA.
Los ambientes de data warehousing requieren la integración de numerosas
tecnologías. Se debe saber tres factores: los requerimientos del negocio, losactuales ambientes técnicos y las directrices técnicas estratégicas futurasplanificadas para de esta forma poder establecer el diseño de la arquitecturatécnica del ambiente de data warehousing .
•MODELO DIMENSIONAL.
La definición de los requerimientos del negocio determina los datos necesarios
para cumplir los requerimientos analíticos de los usuarios. Diseñar los modelosde datos para soportar estos análisis requiere un enfoque diferente al usado enlos sistemas operacionales. Básicamente se comienza con una matriz donde sedetermina la dimensionalidad de cada indicador y luego se especifican losdiferentes grados de detalle (atributos) dentro de cada concepto del negocio(dimensión), como así también la granularidad de cada indicador (variable o
métrica) y las diferentes jerarquías que dan forma al modelo dimensional delnegocio (BDM) o mapa dimensional.
57
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
58/60
•ESPECIFICACIÓN DE IMPLEMENTACIÓN PARA USUARIOS FINALES
No todos los usuarios del warehouse necesitan el mismo nivel deanálisis. Es por ello que en esta etapa se identifican los diferentes roles o
perfiles de usuarios para determinar los diferentes tipos de aplicacionesnecesarias en base al alcance de los diferentes perfiles (gerencial,analista del negocio, vendedor, etc.) Kimball se concentra sobre elproceso de creación de aplicaciones “templates”. Comienza definiendo elconcepto de la aplicación para usuario final y su rol en el acceso a lainformación del negocio. Brinda un marco metodológico bastanteestándard en lo que ha desarrollo de aplicaciones (como piezas desoftware) se refiere.•SELECCIÓN DEL PRODUCTO E INSTALACIÓN
Utilizando el diseño de arquitectura técnica como marco, es necesarioevaluar y seleccionar componentes específicos de la arquitectura comoser la plataforma de hardware, el motor de base de datos, la herramientade ETL o el desarrollo pertinente, herramientas de acceso, etc. Una vez
evaluados y seleccionados los componentes determinados se procedecon la instalación y prueba de los mismos en un ambiente integrado dedata warehousing.
58
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
59/60
•DISEÑO FÍSICO.
El diseño físico de las base de datos se focaliza sobre la selección de las estructurasnecesarias para soportar el diseño lógico. Algunos de los elementos principales de esteproceso son la definición de convenciones estándares de nombres y seteos específicosdel ambiente de la base de datos. La indexación y las estrategias de particionamiento sontambién determinadas en esta etapa.
•DISEÑO Y DESARROLLO DE PRESENTACION DE DATOS.
Esta etapa es típicamente la más subestimada de las tareas en un proyecto de datawarehouse. Las principales subetapas de esta zona del ciclo de vida son: la extracción, latransformación y la carga (ETL process). Se definen como procesos de extracción aaquellos requeridos para obtener los datos que permitirán efectuar la carga del ModeloFísico acordado. Asimismo, se definen como procesos de transformación los procesospara convertir o recodificar los datos fuente a fin poder efectuar la carga efectiva delModelo Físico.
•DESARROLLO DE APLICACIÓN PARA USUARIOS FINALES.
Siguiendo a la especificación de las aplicaciones para usuarios finales, el desarrollo de lasaplicaciones de los usuarios finales involucra configuraciones del metadata y
construcción de reportes específicos. Una vez que se ha cumplido con todos los pasos dela especificación y se tiene la posibilidad de trabajar con algunos datos de prueba,comienza el desarrollo de la aplicación.
Selección de un enfoque de implementación, Desarrollo de la aplicación y Prueba yverificación de datos
59
-
8/17/2019 + + + SISTEMAS DE SOPORTE A LAS DECISIONES--- Cap. 3.pdf
60/60
•IMPLEMENTACION
La IMPLEMENTACIÓN representa la convergencia de la tecnología, los datosy las aplicaciones de usuarios finales accesible desde el escritorio del
usuario del negocio. Hay varios factores extras que aseguran el correctofuncionamiento de todas estas piezas, entre ellos se encuentran lacapacitación, el soporte técnico, la comunicación, las estrategias defeedback. Todas estas tareas deben ser tenidas en cuenta antes de quecualquier usuario pueda tener acceso al data warehouse.
•MANTENIMIENTO Y CRECIMIENTO
Como se remarca siempre, Data Warehousing es un proceso (de etapas biendefinidas, con comienzo y fin, pero de naturaleza espiral) pues acompaña ala evolución de la organización durante toda su historia. Se necesitacontinuar con los relevamientos de forma constante para poder seguir laevolución de las metas por conseguir. Según afirma Kimball. Al contrario delos sistemas tradicionales, los cambios en el desarrollo deben ser vistoscomo signos de éxito y no de falla. Es importante establecer las prioridades
para poder manejar los nuevos requerimientos de los usuarios y de esaforma poder evolucionar y crecer.