Pasos para hacer un Cubo
-
Upload
edwin-najera -
Category
Documents
-
view
13.667 -
download
0
Transcript of Pasos para hacer un Cubo
2009
Edwin Nájera. --- 200516280
17/09/2009
DataWerehouse
Seminario2
Segundo Semestre
Ingeniería en Ciencias y
Sistemas
DataWerehouse
17 de septiembre de 2009
Descripción de las tablas y campos
En este caso voy a tener lo que son 6 dimensiones en donde cada una juega un
papel importante para la creación del cubo, que posteriormente nos será útil para
poder tomar unadecisión.
Cliente En esta dimensión se tendrá toda la información del cliente.
- ID_cliente: Dato con el cual se va a identificar el cliente en todo el sistema
- Nombre: Nombre completo de la persona, en donde identificamos a una persona como tal
- Email: dirección del correo, en donde le llegara la información - Tipo_id: Número que identifica al tipo de cliente, este puede ser
individual o empresa - Tipo: Descripción del tipo de cliente - Acepta_email: Especifica si requiere que le llegue la notificación por
email o no - Fecha_modificacion: Fecha en donde se registraron las últimas
modificaciones del cliente
Producto
En esta dimensión se tendrá toda la información necesaria de los productos que
se tiene.
- ID: Este campo no es útil para poder identificar el producto de una
manera más eficiente
- Nombre: Es la identificación del producto de una manera mas clara y
más fácil de entender.
- Id_subcategoria: Identificador de la subcategoría, en el refleja el numero
de dicho campo
- Subcategoria: nombre explicito de la subcategoría.
- Id_categoria: Identificador de la categoría, el cual refleja el numero de
dicho campo
- Categoria: nombre explicito de la categoria.
- Ranking: En este campo indica la posición de las ventas de dicho
producto.
Territorio
En esta dimensión se tendrá los datos de las localidades y/o territorios.
- id_territorio: Identificador general, para poder identificar de una mejor
manera al territorio.
- Nombre: nos indica de una manera explicita el territorio.
DataWerehouse
17 de septiembre de 2009
- region_code: Abreviación de dicha región, este es un estándar
- country: Nombre del lugar a donde pertenece dicho territorio, en otras
palabras es el país
Tiempo
Dimensión importante en donde se establece la frecuencia de las actividades.
- Id: Identificador secuencial con respecto a la fecha, hace una manera
más fácil la búsqueda de datos
- Anio: como su nombre lo indica, nos representa el año.
- Trimestre: Se especifica el trimestre al cual pertenece.
- mes: como su nombre lo indica, nos representa el mes.
- dia: como su nombre lo indica, nos representa el día.
- shipdate: como su nombre lo indica, representa el día de la compra.
Factura
Dimensión que posee el número de la factura, de esta forma desglosamos una
factura de sus datos primordiales con los datos del detalle de la misma
Detalle_factura
En esta dimensión contiene la especificación de la factura, como estan los
siguientes datos:
- Id_detalle: Especifica el identificador global del detalle según la factura
- Factura: Número de factura, del cual pertenece dicho detalle
- Id_producto: número del producto, el cual es parte del detalle
- Cantidad: cantidad de unidades que se tiene en el detalle de la factura
- Precio_lista: precio del producto, en la lista del sistema.
- Costo_estandar: costo del producto.
FACT
Esta es la base de todo el modelo, la tabla fact, contiene las métricas más
importantes, en este caso:
- id_Factura: Número de la factura.
- Id_Cliente: Número de identificador del cliente
- ID_territorio: Número de identificación del territorio.
- Sub_total: sub total de la factura.
- Freight: costo del flete.
- Taxamt: costo del impuesto
- Shipdate: fecha de envio, de la factura.
- Totaldue: total de los impuestos aduanero.
DataWerehouse
17 de septiembre de 2009
Empleado
En esta tabla se encuentra todos los datos de los empleados, datos que nos
ayudan a la toma de una decisión. Los campos que esta tabla posee son los
siguientes:
- Id_empleado: identificador único en la tabla y corresponde a un
empleado.
- Nombre: es el indicador por su nombre.
- Puesto: el puesto que desempeña dentro de la empresa
- Turno: el turno al cual está asignado esta persona.
- Salario: el monto de su paga.
Después de tener construido nuestro modelo estrella vamos a llegar las tablas de nuestra estrella por medio del ETL
Proceso de ETL
Como primer paso debemos crear el tipo de proyecto especifico para realizar este tipo de proceso. Para ello vamos a dar clic sobre Inicio y luego en todos los programas y luego en SQL Server Business Intelligence Development Studio
DataWerehouse
17 de septiembre de 2009
Luego creamos un nuevo proyecto de Integration Services
DataWerehouse
17 de septiembre de 2009
Ya que tenemos nuestro proyecto en limpio empezamos a poner los diferentes componentes.
Una vez que tenemos listo nuestro proyecto y ponemos un componente de
flujo de datos, y posteriormente ponemos un OLE DB Source y un OLE DB Destination una vez que tenemos eso nos queda de este modo.
DataWerehouse
17 de septiembre de 2009
En el OLE DB Source ponemos nuestro Query el cual nos va a servir para
extraer la información.
DataWerehouse
17 de septiembre de 2009
Después debemos de establecer cuál es la tabla destino.
DataWerehouse
17 de septiembre de 2009
Después de repetir este proceso en todas las tablas nos queda de esta
forma.
Una vez que la carga de datos esta exitosa nos muestra la siguiente forma.
DataWerehouse
17 de septiembre de 2009
Generación del cubo.
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009
DataWerehouse
17 de septiembre de 2009