Almacen de Datos
-
Upload
izabeliux-gutierrez -
Category
Documents
-
view
8 -
download
0
description
Transcript of Almacen de Datos
-
Universidad Politcnica de Tlaxcala
Ingeniera en Tecnologas de la Informacin
DISEO DE BASE DE DATOS
Maestra: Candy Atonal Nolasco
Presentan: Ma. Isabel Gutirrez Cervantes y Adrin Polvo Funes
Tema: Almacn de datos
-
Las bases de datos tradicionales equilibran el requisito de acceso a datos con la necesidad de asegurar
la integridad de los mismos, los vendedores de software y el personal de mantenimiento de sistemas
han comenzado a disear sistemas para realizar estas funciones. El mercado de almacenes de datos ha
sufrido un rpido crecimiento desde mediados de los aos noventa. Dado que se han creado
almacenes de datos para satisfacer las necesidades particulares de las empresas, no existe una sola
definicin cannica del trmino almacn de datos.
Un Almacn de Datos (o Data Warehouse) es una gran coleccin de datos que recoge informacin de
mltiples sistemas fuentes u operacionales dispersos, y cuya actividad se centra en la Toma de
Decisiones -es decir, en el anlisis de la informacin- en vez de en su captura. Una vez reunidos los
datos de los sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos
histricos; as los almacenes de datos proporcionan al usuario una interfaz consolidada nica para los
datos, lo que hace ms fcil escribir las consultas para la toma de decisiones.
Caractersticas del Almacn de Datos
Organizado en torno a temas. La informacin se clasifica en base a los aspectos que son de inters para la empresa.
Integrado. Es el aspecto ms importante. La integracin de datos consiste en convenciones de nombres, codificaciones consistentes, medida uniforme de variables, etc.
Dependiente del tiempo. Esta dependencia aparece de tres formas: o La informacin representa los datos sobre un horizonte largo de tiempo. o Cada estructura clave contiene (implcita o explcitamente) un elemento de tiempo
(da, semana, mes, etc.).
o La informacin, una vez registrada correctamente, no puede ser actualizada. Arquitectura de un sistema de almacn de datos (Data Warehouse) La mayor diferencia entre la arquitectura de un almacn de datos y una base de datos OLTP
estndar, conteniendo datos de los sistemas del planeamiento del recurso de la empresa (como SAP, CRM) es que en una estructura de bodega de datos las tablas estn denormalizadas entre variables y dimensiones.
-
1. Datos operacionales. Origen de datos para el componente de almacenamiento fsico del Almacn de Datos.
2. Extraccin de datos. Seleccin sistemtica de datos operacionales usados para formar parte del Almacn de Datos.
3. Transformacin de datos. Procesos para sumarizar y realizar cambios en los datos operacionales.
4. Carga de datos. Insercin de datos en el Almacn. 5. Almacn. Almacenamiento fsico de datos de al arquitectura Data Warehouse.
6. Herramienta de acceso. Herramientas que proveen acceso a los datos.
El tiempo debe estar presente en todos los registros contenidos en un DW. Las bases de datos operacionales contienen los valores actuales de los datos. Un DW no es ms que una serie de
instantneas en el tiempo tomadas peridicamente.
Los bloques funcionales se corresponden con un sistema de informacin completo que utiliza un almacn de datos:
Nivel operacional: Contiene datos primitivos (operacionales) que estn siendo permanentemente actualizados, usados por los sistemas operacionales tradicionales que realizan operaciones transaccionales.
Almacn de datos: Contiene datos primitivos correspondientes a sucesivas cargas del Almacn de Datos y algunos datos derivados. Los datos derivados son datos generados a partir de los datos primitivos al aplicarles algn tipo de procesamiento (resmenes).
Nivel departamental (Data Mart): Contiene casi exclusivamente datos derivados. Cada departamento de la empresa determina su nivel departamental con informacin de inters a dicho nivel. Va a ser el blanco de salida sobre el cual los datos en el almacn son organizados y almacenados para las consultas directas por los usuarios finales, los desarrolladores de reportes y otras aplicaciones.
Nivel individual: Contiene pocos datos, resultado de aplicar heursticas, procesos estadsticos, etc., a los datos contenidos en el nivel anterior. El nivel individual es el objetivo final de un Almacn de Datos. Desde este nivel acceder el usuario final y se podrn plantear diferentes hiptesis, as como navegar a travs de los datos contenidos en el Almacn de Datos.
Un almacn de datos debe entregar la informacin correcta a la gente indicada en el momento adecuado en el formato correcto. El almacn de datos da respuesta a las necesidades de usuarios conocedores, utilizando sistemas de ayuda en la decisin (DSS), Sistemas de Informacin
-
Ejecutiva (EIS) o herramientas para hacer consulta o informes. Los usuarios finales fcilmente pueden hacer consultas sobre sus almacenes de datos sin tocar o afectar la operacin del sistema.
Los almacenes de datos existen para facilitar las consultas complejas, que involucran a gran cantidad de datos y que son con frecuencia ad hoc. Por lo tanto, deben proporcionar un soporte de consulta mucho mayor y ms eficaz que el exigido por las bases de datos transaccionales. El componente de acceso de los almacenes de datos soporta una funcionalidad de hoja de clculo extendida, un procesamiento de consultas eficiente, consultas estructuradas, consultas ad hoc y minera de datos. La funcionalidad de hoja de clculo extendida incluye un soporte para lo ms novedoso en aplicaciones de hojas de clculo
Metadata
Uno de los componentes ms importantes de la arquitectura de un DW es el Metadata. Es definido comnmente como: "datos acerca de los datos", en el sentido de que se trata de datos que describen cul es la estructura de los datos y cmo se relacionan.
El Metadata documenta exactamente, entre otras cosas, qu tablas existen para esa aplicacin, qu columnas poseen cada una de las tablas y qu tipo de datos se pueden almacenar. Los datos son de inters para el usuario final, el Metadata es de inters para los programas que tienen que manejar estos datos.
Error al crear miniatura: Falta archivo
Sin embargo, el rol que cumple el Metadata en un ambiente de DW es muy diferente al rol que cumple en los ambientes operacionales. En un ambiente de DW el Metadata juega un rol fundamental.
Middleware
La funcin del Middleware es la de asegurar la conectividad entre todos los componentes de la arquitecturade un DW. El Middleware puede verse como capa API, en base a la cual los programadores pueden desarrollar aplicaciones que trabajen en diferentes ambientes sin preocuparse de los protocolos de red ycomunicaciones en que se corrern. De esta manera se ofrece una mejor relacin costo/rendimiento que pasa por el desarrollo de aplicaciones ms complejas, en menos
tiempo.
API
Application Programmer Interface (Interfaz de Programacin de Aplicacin). Lenguaje y formato de mensaje utilizados por un programa para activar e interactuar con las funciones de otro programa o de un equipo fsico. middleware Asegura la conectividad entre todos los componentes de una infraestructura informtica. Es la estructura para enlazar todas las aplicaciones en forma integrada.
-
Mecanismos de Extraccin
Otro de los componentes de la arquitectura de un DW son los sistemas OLAP. Estos tipos de sistemas estn orientados a la realizacin de anlisis estratgicos de la informacin contenida en un DW de una manera ad-hoc. Los anlisis estratgicos requieren de una visin dinmica y multidimensional de la informacin diferente a la que se encuentra en los sistemas OLTP.
Este tipo de anlisis est orientado a procesar grandes volmenes de datos de forma que se puede medir la evolucin del negocio a travs del tiempo, mediante la confeccin de comparaciones, el estudio de indicadores, desviaciones, etc. Esto requiere la posibilidad de realizar anlisis Top Down, es decir, que estos sistemas deben poseer el dinamismo necesario para permitir la reformulacin de la
consulta realizada de acuerdo al anlisis de los resultados obtenidos en una primera instancia.
Mecanismos de Carga
Existen dos formas bsicas de desarrollar esta tarea:
Acumulacin Simple. La acumulacin simple es, sin duda, la ms sencilla y comn, y consiste en realizar una sumarizacin o resumen de todas las transacciones comprendidas en el perodo de tiempo seleccionado y transportar el resultado como una nica transaccin hacia el DW.
Rolling. El proceso de Rolling por su parte, se aplica en los casos en que se opta por mantener varios niveles de granularidad. Para ello se almacena informacin resumida a distintos niveles, correspondientes a distintas agrupaciones de la unidad de tiempo.
EJEMPLO
-
REFERENCIAS
ETL-Tools.Info (2006)Almacn de datos consultado el 6 de marzo de 2015 en
http://etl-tools.info/es/bi/almacendedatos_arquitectura.htm
Roberto H.(2003) Almacenes de datos (Datawarehouse) consultado el 6 de marzo de 2015 en
http://www2.rhernando.net/modules/tutorials/doc/bd/dw.html
S/A (2015) Almacenes de datos consultado el 6 de marzo de 2015 en
http://www.ecured.cu/index.php/Almac%C3%A9n_de_Datos
Alberto A. (2006) ) Almacenes de datos consultado el 6 de marzo de 2015 en
https://books.google.es/books?id=280trvxZv3IC&pg=PT69&dq=Almacen+de+datos&h
l=es&sa=X&ei=Zbr5VLquBs73yQTolIDQDQ&ved=0CC4Q6AEwAQ#v=onepage&q=Al
macen%20de%20datos&f=false
Juan Carlos T. (2011) Almacenes de datos consultado el 6 de marzo de 2015 en
https://books.google.es/books?id=E7Aceg--
o4oC&printsec=frontcover&dq=Almacen+de+datos&hl=es&sa=X&ei=Zbr5VLquBs73y
QTolIDQDQ&ved=0CCcQ6AEwAA#v=onepage&q=Almacen%20de%20datos&f=false
Liudmila P.(2006) Almacenes de datos importancia consultado el 6 de marzo de 2015 en
http://www.mailxmail.com/curso-almacenes-datos-importancia-
estandar/caracteristicas-almacen-datos
Wladimiro D.(s/f) Almacenes de datos importancia consultado el 6 de marzo de 2015 en
http://informatica.uv.es/iiguia/DBD/Teoria/data-warehouses.pdf