Introducción Al Datamart y El Datawarehouse

29
Introducción al Datamart y al Datawarehouse

description

Introducción Al Datamart y El Datawarehouse

Transcript of Introducción Al Datamart y El Datawarehouse

Diapositiva 1

Introduccin al Datamart y al Datawarehouse1Objetivos GeneralesReconoce y diferencia los conceptos de Datamart y Datawarehouse.

Contenido de AgendaConcepto de DatamartConcepto de DatawarehouseLa visin de Bill Inmon: Inmon Corporate Information FactoryLa visin de Ralph Kimball: Kimball Bus ArchitectureEtapas de un proceso de Data Mart y Data Warehouse segn la metodologa de Ralph KimballUn Datamart es un Datawarehouse ms pequeo. Est orientado principalmente a un rea del Negocio.Su implementacin en tiempo es ms corta.Su implementacin en dinero es ms cmoda.1. Concepto de Datamart

Contenido de AgendaConcepto de DatamartConcepto de DatawarehouseLa visin de Bill Inmon: Inmon Corporate Information FactoryLa visin de Ralph Kimball: Kimball Bus ArchitectureEtapas de un proceso de Data Mart y Data Warehouse segn la metodologa de Ralph KimballUn Data Warehouse (DWH) es un repositorio central que contiene la informacin ms valiosa de la empresa. Los datos que aqu se almacenan han pasado por un proceso de calidad que asegura su consistencia. Adems, el repositorio est construido de tal manera que el acceso sea lo ms rpido posible.2. Concepto de Datawarehouse

Contenido de AgendaConcepto de DatamartConcepto de DatawarehouseLa visin de Bill Inmon: Inmon Corporate Information FactoryLa visin de Ralph Kimball: Kimball Bus ArchitectureEtapas de un proceso de Data Mart y Data Warehouse segn la metodologa de Ralph Kimball3. La visin de Bill Inmon: Inmon Corporate Information Factory

3.1 Caractersticas CIF: Orientado a un TemaLa data es categorizada y almacenada por reas de negocio en lugar de aplicaciones.Aplicaciones OLTP InformacionFinancieradel ClienteTema del Data WarehousePlanes de EquidadAccionesSegurosPrestamosAhorros3.2 Caractersticas CIF: Integrada Data WarehouseAplicaciones OLTP La data es definida como nica.AhorrosCuenta corrientePrestamos Cliente3.3 Caractersticas CIF: Variante en el Tiempo1/20132/20133/2013JanuaryFebruaryMarchData WarehouseTimeDataLa data es almacenada como serie de fotos asociadas al tiempo.2013201320133.4 Caractersticas CIF: No VoltilLa data en el DW tpicamente No cambia.WarehouseReadInsert ReadUpdateDeleteLoadOperacionalContenido de AgendaConcepto de DatamartConcepto de DatawarehouseLa visin de Bill Inmon: Inmon Corporate Information FactoryLa visin de Ralph Kimball: Kimball Bus ArchitectureEtapas de un proceso de Data Mart y Data Warehouse segn la metodologa de Ralph Kimball4. La visin de Ralph Kimball: Kimball Bus Architecture

Contenido de AgendaConcepto de DatamartConcepto de DatawarehouseLa visin de Bill Inmon: Inmon Corporate Information FactoryLa visin de Ralph Kimball: Kimball Bus ArchitectureEtapas de un proceso de Data Mart y Data Warehouse segn la metodologa de Ralph Kimball5.Etapas de un proceso de Data Mart y Data Warehouse segn la metodologa de Ralph KimballBusiness Dimensional Lifecycle propuesto por Ralph Kimball

La planificacin busca identificar la definicin y el alcance del proyecto de Data Warehouse incluyendo justificaciones del negocio y evaluaciones de factibilidad. La planificacin del proyecto se focaliza sobre recursos, perfiles, tareas, duraciones y secuencialidad. El plan de proyecto resultante identifica todas las tareas asociadas con el BDL e identifica las partes involucradas.5.1 Planificacin del Proyecto

Un factor determinante en el xito de un proceso de Data Warehousing es la interpretacin correcta de los diferentes niveles de requerimientos, expresados por los diferentes niveles de usuarios. La tcnica utilizada para relevar los requerimientos de los analistas del negocio difiere de los enfoques tradicionales guiados por los datos. Los diseadores de los Data Warehouses deben entender los factores claves que guan al negocio para determinar efectivamente los requerimientos y traducirlos en consideraciones de diseo apropiadas.5.2 Planificacin del Proyecto

La definicin de los requerimientos del negocio determina los datos necesarios para cumplir los requerimientos analticos de los usuarios. Disear los modelos de datos para soportar estos anlisis requieren un enfoque diferente al usado en los sistemas operacionales. Bsicamente se comienza con una matriz donde se determina la dimensionalidad de cada indicador y luego se especifican los diferentes grados de detalle (atributos) dentro de cada concepto del negocio (dimensin), como as tambin la granularidad de cada indicador (variable o mtrica) y las diferentes jerarquas que dan forma al Modelo Dimensional del Negocio (BDM) o Mapa Dimensional.5.3 Modelado Dimensional

El diseo fsico de las base de datos se focaliza sobre la seleccin de las estructuras necesarias para soportar el diseo lgico.Algunos de los elementos principales de este proceso son la definicin de convenciones estndares de nombres y seteos especficos del ambiente de la base de datos.La indexacin y las estrategias de particionamiento son tambin determinadas en esta etapa.5.4 Diseo Fsico

Esta etapa es una de las ms subestimadas de las tareas en un proyecto de Data Warehouse. Las principales sub etapas de esta zona del ciclo de vida son: la extraccin, la transformacin y la carga (ETL process). Se definen como procesos de extraccin a aquellos requeridos para obtener los datos que permitirn efectuar la carga del Modelo Fsico acordado. As mismo, se definen como procesos de transformacin a los procesos para convertir o recodificar los datos fuente a fin poder efectuar la carga efectiva del Modelo Fsico. Por otra parte, los procesos de carga de datos son los procesos requeridos para poblar el Data Warehouse.

5.5 Diseo y Desarrollo de Presentacin de Datos

Los ambientes de Data Warehousing requieren la integracin de numerosas tecnologas. Se debe tener en cuenta tres factores: los requerimientos del negocio, los actuales ambientes tcnicos y las directrices tcnicas estratgicas futuras planificadas para de esta forma poder establecer el diseo de la arquitectura tcnica del ambiente de Data Warehousing.

5.6 Diseo de la Arquitectura Tecnolgica

Utilizando el diseo de arquitectura tcnica como marco, es necesario evaluar y seleccionar componentes especficos de la arquitectura como ser la plataforma de hardware, el motor de base de datos, la herramienta de ETL o el desarrollo pertinente, herramientas de acceso, etc.

5.7 Seleccin de Productos e Instalacin

No todos los usuarios del Data Warehouse necesitan el mismo nivel de anlisis. Es por ello que en esta etapa se identifican los diferentes roles o perfiles de usuarios para determinar los diferentes tipos de aplicaciones necesarias en base al alcance de los diferentes perfiles (gerencial, analista del negocio, vendedor, etc.)5.8 Especificaciones de Aplicaciones para usuarios finales

5.9 Desarrollo de Aplicaciones para usuarios finalesSiguiendo a la especificacin de las aplicaciones para usuarios finales, el desarrollo de las aplicaciones de los usuarios finales involucra configuraciones del metadata y construccin de reportes especficos.Una vez que se ha cumplido con todos los pasos de la especificacin y se tiene la posibilidad de trabajar con algunos datos de prueba, comienza el desarrollo de la aplicacin (Kimball, 1998).

5.10 ImplementacinLa implementacin representa la analoga de la tecnologa, los datos y las aplicaciones de usuarios finales accesibles desde el escritorio del usuario del negocio. Hay varios factores extras que aseguran el correcto funcionamiento de todas estas piezas, entre ellos se encuentran la capacitacin, el soporte tcnico, la comunicacin, las estrategias de feedback. Todas estas tareas deben ser tenidas en cuenta antes de que cualquier usuario pueda tener acceso al Data Warehouse.

5.11 Mantenimiento y CrecimientoData Warehousing es un proceso (de etapas bien definidas, con comienzo y fin, pero de naturaleza espiral) pues acompaa a la evolucin de la organizacin durante toda su historia. Se necesita continuar con los relevamientos de forma constante para poder seguir la evolucin de las metas por conseguir. Segn afirma Kimball (1998), si se ha utilizado el BDL el Data Warehouse est preparado para evolucionar y crecer. Al contrario de los sistemas tradicionales, los cambios en el desarrollo deben ser vistos como signos de xito y no de falla.

El gerenciamiento del proyecto asegura que las actividades del BDL se lleven en forma y sincronizadas. Entre sus actividades principales se encuentra el monitoreo del proyecto y la comunicacin entre los requerimientos del negocio. Asimismo, determina las restricciones de informacin para poder manejar correctamente las expectativas en ambos sentidos.5.12 Gerenciamiento del Proyecto

Actividad 3: Cuestionario de PreguntasTiempo: 20 minutosCuestionario de PreguntasActividad 4: : Desarrollo de un caso siguiendo la metodologa de Ralph Kimball.Tiempo: 20 minutosDesarrollo de un caso siguiendo la metodologa de Ralph Kimball

Laboratorio 2: Introduccin al Data Mart y el Data Warehouse