Almacen de Datos

7
  Universidad Politécnica de Tlaxcala Ingeniería en T ecnologías de la Información DISEÑO DE BASE DE DATOS Maestra: Candy Atonal Nolasco Presentan: Ma. Isabel Gutiérrez Cervantes y Adrián Polvo Funes Tema: Almacén de datos

description

este contenido es hacerca de ingenieria de requerimientos

Transcript of Almacen de Datos

  • Universidad Politcnica de Tlaxcala

    Ingeniera en Tecnologas de la Informacin

    DISEO DE BASE DE DATOS

    Maestra: Candy Atonal Nolasco

    Presentan: Ma. Isabel Gutirrez Cervantes y Adrin Polvo Funes

    Tema: Almacn de datos

  • Las bases de datos tradicionales equilibran el requisito de acceso a datos con la necesidad de asegurar

    la integridad de los mismos, los vendedores de software y el personal de mantenimiento de sistemas

    han comenzado a disear sistemas para realizar estas funciones. El mercado de almacenes de datos ha

    sufrido un rpido crecimiento desde mediados de los aos noventa. Dado que se han creado

    almacenes de datos para satisfacer las necesidades particulares de las empresas, no existe una sola

    definicin cannica del trmino almacn de datos.

    Un Almacn de Datos (o Data Warehouse) es una gran coleccin de datos que recoge informacin de

    mltiples sistemas fuentes u operacionales dispersos, y cuya actividad se centra en la Toma de

    Decisiones -es decir, en el anlisis de la informacin- en vez de en su captura. Una vez reunidos los

    datos de los sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos

    histricos; as los almacenes de datos proporcionan al usuario una interfaz consolidada nica para los

    datos, lo que hace ms fcil escribir las consultas para la toma de decisiones.

    Caractersticas del Almacn de Datos

    Organizado en torno a temas. La informacin se clasifica en base a los aspectos que son de inters para la empresa.

    Integrado. Es el aspecto ms importante. La integracin de datos consiste en convenciones de nombres, codificaciones consistentes, medida uniforme de variables, etc.

    Dependiente del tiempo. Esta dependencia aparece de tres formas: o La informacin representa los datos sobre un horizonte largo de tiempo. o Cada estructura clave contiene (implcita o explcitamente) un elemento de tiempo

    (da, semana, mes, etc.).

    o La informacin, una vez registrada correctamente, no puede ser actualizada. Arquitectura de un sistema de almacn de datos (Data Warehouse) La mayor diferencia entre la arquitectura de un almacn de datos y una base de datos OLTP

    estndar, conteniendo datos de los sistemas del planeamiento del recurso de la empresa (como SAP, CRM) es que en una estructura de bodega de datos las tablas estn denormalizadas entre variables y dimensiones.

  • 1. Datos operacionales. Origen de datos para el componente de almacenamiento fsico del Almacn de Datos.

    2. Extraccin de datos. Seleccin sistemtica de datos operacionales usados para formar parte del Almacn de Datos.

    3. Transformacin de datos. Procesos para sumarizar y realizar cambios en los datos operacionales.

    4. Carga de datos. Insercin de datos en el Almacn. 5. Almacn. Almacenamiento fsico de datos de al arquitectura Data Warehouse.

    6. Herramienta de acceso. Herramientas que proveen acceso a los datos.

    El tiempo debe estar presente en todos los registros contenidos en un DW. Las bases de datos operacionales contienen los valores actuales de los datos. Un DW no es ms que una serie de

    instantneas en el tiempo tomadas peridicamente.

    Los bloques funcionales se corresponden con un sistema de informacin completo que utiliza un almacn de datos:

    Nivel operacional: Contiene datos primitivos (operacionales) que estn siendo permanentemente actualizados, usados por los sistemas operacionales tradicionales que realizan operaciones transaccionales.

    Almacn de datos: Contiene datos primitivos correspondientes a sucesivas cargas del Almacn de Datos y algunos datos derivados. Los datos derivados son datos generados a partir de los datos primitivos al aplicarles algn tipo de procesamiento (resmenes).

    Nivel departamental (Data Mart): Contiene casi exclusivamente datos derivados. Cada departamento de la empresa determina su nivel departamental con informacin de inters a dicho nivel. Va a ser el blanco de salida sobre el cual los datos en el almacn son organizados y almacenados para las consultas directas por los usuarios finales, los desarrolladores de reportes y otras aplicaciones.

    Nivel individual: Contiene pocos datos, resultado de aplicar heursticas, procesos estadsticos, etc., a los datos contenidos en el nivel anterior. El nivel individual es el objetivo final de un Almacn de Datos. Desde este nivel acceder el usuario final y se podrn plantear diferentes hiptesis, as como navegar a travs de los datos contenidos en el Almacn de Datos.

    Un almacn de datos debe entregar la informacin correcta a la gente indicada en el momento adecuado en el formato correcto. El almacn de datos da respuesta a las necesidades de usuarios conocedores, utilizando sistemas de ayuda en la decisin (DSS), Sistemas de Informacin

  • Ejecutiva (EIS) o herramientas para hacer consulta o informes. Los usuarios finales fcilmente pueden hacer consultas sobre sus almacenes de datos sin tocar o afectar la operacin del sistema.

    Los almacenes de datos existen para facilitar las consultas complejas, que involucran a gran cantidad de datos y que son con frecuencia ad hoc. Por lo tanto, deben proporcionar un soporte de consulta mucho mayor y ms eficaz que el exigido por las bases de datos transaccionales. El componente de acceso de los almacenes de datos soporta una funcionalidad de hoja de clculo extendida, un procesamiento de consultas eficiente, consultas estructuradas, consultas ad hoc y minera de datos. La funcionalidad de hoja de clculo extendida incluye un soporte para lo ms novedoso en aplicaciones de hojas de clculo

    Metadata

    Uno de los componentes ms importantes de la arquitectura de un DW es el Metadata. Es definido comnmente como: "datos acerca de los datos", en el sentido de que se trata de datos que describen cul es la estructura de los datos y cmo se relacionan.

    El Metadata documenta exactamente, entre otras cosas, qu tablas existen para esa aplicacin, qu columnas poseen cada una de las tablas y qu tipo de datos se pueden almacenar. Los datos son de inters para el usuario final, el Metadata es de inters para los programas que tienen que manejar estos datos.

    Error al crear miniatura: Falta archivo

    Sin embargo, el rol que cumple el Metadata en un ambiente de DW es muy diferente al rol que cumple en los ambientes operacionales. En un ambiente de DW el Metadata juega un rol fundamental.

    Middleware

    La funcin del Middleware es la de asegurar la conectividad entre todos los componentes de la arquitecturade un DW. El Middleware puede verse como capa API, en base a la cual los programadores pueden desarrollar aplicaciones que trabajen en diferentes ambientes sin preocuparse de los protocolos de red ycomunicaciones en que se corrern. De esta manera se ofrece una mejor relacin costo/rendimiento que pasa por el desarrollo de aplicaciones ms complejas, en menos

    tiempo.

    API

    Application Programmer Interface (Interfaz de Programacin de Aplicacin). Lenguaje y formato de mensaje utilizados por un programa para activar e interactuar con las funciones de otro programa o de un equipo fsico. middleware Asegura la conectividad entre todos los componentes de una infraestructura informtica. Es la estructura para enlazar todas las aplicaciones en forma integrada.

  • Mecanismos de Extraccin

    Otro de los componentes de la arquitectura de un DW son los sistemas OLAP. Estos tipos de sistemas estn orientados a la realizacin de anlisis estratgicos de la informacin contenida en un DW de una manera ad-hoc. Los anlisis estratgicos requieren de una visin dinmica y multidimensional de la informacin diferente a la que se encuentra en los sistemas OLTP.

    Este tipo de anlisis est orientado a procesar grandes volmenes de datos de forma que se puede medir la evolucin del negocio a travs del tiempo, mediante la confeccin de comparaciones, el estudio de indicadores, desviaciones, etc. Esto requiere la posibilidad de realizar anlisis Top Down, es decir, que estos sistemas deben poseer el dinamismo necesario para permitir la reformulacin de la

    consulta realizada de acuerdo al anlisis de los resultados obtenidos en una primera instancia.

    Mecanismos de Carga

    Existen dos formas bsicas de desarrollar esta tarea:

    Acumulacin Simple. La acumulacin simple es, sin duda, la ms sencilla y comn, y consiste en realizar una sumarizacin o resumen de todas las transacciones comprendidas en el perodo de tiempo seleccionado y transportar el resultado como una nica transaccin hacia el DW.

    Rolling. El proceso de Rolling por su parte, se aplica en los casos en que se opta por mantener varios niveles de granularidad. Para ello se almacena informacin resumida a distintos niveles, correspondientes a distintas agrupaciones de la unidad de tiempo.

    EJEMPLO

  • REFERENCIAS

    ETL-Tools.Info (2006)Almacn de datos consultado el 6 de marzo de 2015 en

    http://etl-tools.info/es/bi/almacendedatos_arquitectura.htm

    Roberto H.(2003) Almacenes de datos (Datawarehouse) consultado el 6 de marzo de 2015 en

    http://www2.rhernando.net/modules/tutorials/doc/bd/dw.html

    S/A (2015) Almacenes de datos consultado el 6 de marzo de 2015 en

    http://www.ecured.cu/index.php/Almac%C3%A9n_de_Datos

    Alberto A. (2006) ) Almacenes de datos consultado el 6 de marzo de 2015 en

    https://books.google.es/books?id=280trvxZv3IC&pg=PT69&dq=Almacen+de+datos&h

    l=es&sa=X&ei=Zbr5VLquBs73yQTolIDQDQ&ved=0CC4Q6AEwAQ#v=onepage&q=Al

    macen%20de%20datos&f=false

    Juan Carlos T. (2011) Almacenes de datos consultado el 6 de marzo de 2015 en

    https://books.google.es/books?id=E7Aceg--

    o4oC&printsec=frontcover&dq=Almacen+de+datos&hl=es&sa=X&ei=Zbr5VLquBs73y

    QTolIDQDQ&ved=0CCcQ6AEwAA#v=onepage&q=Almacen%20de%20datos&f=false

    Liudmila P.(2006) Almacenes de datos importancia consultado el 6 de marzo de 2015 en

    http://www.mailxmail.com/curso-almacenes-datos-importancia-

    estandar/caracteristicas-almacen-datos

    Wladimiro D.(s/f) Almacenes de datos importancia consultado el 6 de marzo de 2015 en

    http://informatica.uv.es/iiguia/DBD/Teoria/data-warehouses.pdf