Microsoft sql server 2008 - ETL

47
TUTORIAL ETL Asignatura: BASE DE DATOS AVANZADA Autora: Fanny Pita Chapilliquen Docente Ingeniero: Hector Zelada

description

Son una parte de la integración de datos, pero es un elemento importante cuya función completa el resultado de todo el desarrollo de la cohesión de aplicaciones y sistemas. La palabra ETL corresponde a las siglas en inglés de: • Extraer: extract. • Transformar: transform. • Y Cargar: load.

Transcript of Microsoft sql server 2008 - ETL

Page 1: Microsoft sql server 2008 - ETL

TUTORIAL ETL

Asignatura: BASE DE DATOS AVANZADA

Autora: Fanny Pita Chapilliquen

Docente Ingeniero: Hector Zelada

Page 2: Microsoft sql server 2008 - ETL

BI

(Business Intelligence)

Datos

Información

Conocimientos

Toma de Decisiones

Cumple con sus objetivos

Cumple con sus objetivos

estratégicos

Logra su Visión

Analizar

Page 3: Microsoft sql server 2008 - ETL

ETL

Son una parte de la integración de datos, pero es un elemento importante cuya función completa el resultado de todo el desarrollo de la cohesión de aplicaciones y sistemas.

La palabra ETL corresponde a las siglas en inglés de:

• Extraer: extract. • Transformar: transform. • Y Cargar: load. Con ello, queremos decir que todo proceso ETL consta precisamente de estas tres fases: extracción, transformación y carga. Vamos a definir en qué consisten cada una de estas fases

Page 4: Microsoft sql server 2008 - ETL

PROCESOS ETL DEL DATAWAREHOUSE

Teniendo como primer paso para la obtención de la información hacia el ambiente del

Data WareHouse. Una vez que la información es extraída hacia el área de tráfico de

datos, hay posibles pasos de transformación.

Ejemplo limpieza de la información, que no nos sirve, seleccionar únicamente los

campos necesarios para el Data WareHouse, combinar fuentes de datos, haciéndolas

coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una

dimensión.

DATAMART

Es una versión especial de almacén de datos (Data WareHouse).

Son subconjuntos de datos con el propósito de ayudar a que un área específica.

Los datos existentes en este contexto pueden ser agrupados, explorados y

transmitidos de múltiples formas para que diversos grupos de usuarios realicen la

explotación de los mismos de la forma más conveniente según sus necesidades.

El Data Mart es un sistema orientado a la consulta.

Page 5: Microsoft sql server 2008 - ETL

MICROSOFT SQL SERVER 2008

Primero instalamos el programa En el programa sql server 2008r2

En database se realiza un anticlick en Attach sebusca la base de datos a ser agregada

Page 6: Microsoft sql server 2008 - ETL

El attach Database

Seleccionamos en Add

Se selecciona las unidades lo cual elegimos la unidad donde esta nuestra carpeta con la base

de datos.

Page 7: Microsoft sql server 2008 - ETL

Verificamos la conexión al realizar clic en nuestra base de datos

Page 8: Microsoft sql server 2008 - ETL

Procedemos a trabajar el Visual Studio

Inicio

Creando un Proyecto

Page 9: Microsoft sql server 2008 - ETL

Elegimos el proyecto a trabajar Integration

Elegimos un nombre para el proyecto

Elegimos la unidad a guardarla Se crea una carpeta

Page 10: Microsoft sql server 2008 - ETL

Aceptamos

Realizamos Clic en Data Source

Page 11: Microsoft sql server 2008 - ETL
Page 12: Microsoft sql server 2008 - ETL

Nombre del archivo. , o se elige por defecto el nombre indicado

Elegimos la base de destino

Verificamos la conexión realizando el clic en Test Conection

Page 13: Microsoft sql server 2008 - ETL

Declaramos el nombre del origen

Ingresamos otra data para el destino

Page 14: Microsoft sql server 2008 - ETL

Siguiente

New(nuevo)

Seleccionamos la base de datos de destino

Page 15: Microsoft sql server 2008 - ETL

Verificamos la conection

Observamos la siguiente data con las dos bases:

Page 16: Microsoft sql server 2008 - ETL

Le damos nombre a la base

Ubicamos en la parte inferior para la coneccion: en Conection Managerscon anticlic(1)

Conectamos las bases de origen – destino(2)

2

1

Page 17: Microsoft sql server 2008 - ETL

Agregamos la 1ª conection de origen

Agregamos la segunda conection de destino visualizamos las conecciones

Page 18: Microsoft sql server 2008 - ETL

Creamos las Dimensiones

Se realizaran 3 Dimensiones de la base de destino especificada en la tabla siguiente:

Tabla a relacionarse con la de destino

Page 19: Microsoft sql server 2008 - ETL

DTL

Iniciamos con la tabla Proveedor – Dimension Proveedor por estar en ese orden

Con la herramienta – SQL Task

Insertamos en la opción arrastrando la herramienta SQL Task

Page 20: Microsoft sql server 2008 - ETL

Conectamos con la base de destino hacia donde nos dirigimos

Para realizar la limpieza de datos La tabla de Productos no se elimina datos por lo que actualiza

Page 21: Microsoft sql server 2008 - ETL

Las tablas siguientes tablas de destino se borraran datos

Copiamos las consultas realizadas

Page 22: Microsoft sql server 2008 - ETL

Trabajamos con data flow task para las 3 dimensiones

Observamos las Dimensiones a tratar

Page 23: Microsoft sql server 2008 - ETL

Realizamos dobleclic en dataflowProveedor

Ingresamos un OLB Source

Page 24: Microsoft sql server 2008 - ETL

La base de origen

Seleccionamos table por que ambas bases se relacionan con tablas sus datos

Se origina la activación

Page 25: Microsoft sql server 2008 - ETL

Ingresamos un data convertion lo cual homogeniza los datos ()

Doble clic mostrando este cuadro

Page 26: Microsoft sql server 2008 - ETL

Seleccionamos lo requerido por no ser de igual tipo dato, en este caso todos

Especificamos con un nombre para ubicarlo en el mapping con mayor facilidad

Page 27: Microsoft sql server 2008 - ETL

Ingresamos una herramienta de destino

Dobleclic en sourcedestino verificamos y ubicamos en el destino

Page 28: Microsoft sql server 2008 - ETL

Nos ubicamos en mapping

Seleccionamos lo requerido(a relacionar)

Page 29: Microsoft sql server 2008 - ETL

Comprobamos la conexión como alerta origina de color verde

Datos Origen

Page 30: Microsoft sql server 2008 - ETL

Dimensión tiempo en origen no tiene fecha, año, mes luego se completaran creando su

consulta : SELECT * FROM Compra

Agrupamos con GROUP BY Fecha

Page 31: Microsoft sql server 2008 - ETL

Consulta Mes

Consulta TRIMESTRE

Page 32: Microsoft sql server 2008 - ETL

Consulta Año

Dobleclic ingresamos

Page 33: Microsoft sql server 2008 - ETL

Seleccionamos Comand por lo que ingresamos las consultas:

Ingresamos la herramienta destino aquí no insertamos la herramienta data conection por

ingresar consultas

Page 34: Microsoft sql server 2008 - ETL

Conexión Tiempo

Relacionamos con lo correspondiente

Page 35: Microsoft sql server 2008 - ETL

Ejecutamos

Conectamos

Page 36: Microsoft sql server 2008 - ETL

Ubicamos el Producto desde valor cero

Insertamos 2 OLE DB

Un origen

Un destino

Configuramos Origen

Page 37: Microsoft sql server 2008 - ETL

Destino

Destino Producto

Los elementos son iguales

Page 38: Microsoft sql server 2008 - ETL

Modificamos para que tengan los mismos caracteres sor

Soordestino

Page 39: Microsoft sql server 2008 - ETL

Para unir a los sor con el main ubicamos derecha o izquierda

Clic en Mage Join

Page 40: Microsoft sql server 2008 - ETL

Activamos

Ingresamos un conditional

Page 41: Microsoft sql server 2008 - ETL

Dobleclic

Page 42: Microsoft sql server 2008 - ETL

NULL

Page 43: Microsoft sql server 2008 - ETL

Verificamos en las Columnas

Ubicamos a KEY

Page 44: Microsoft sql server 2008 - ETL

Al unir origina

Page 45: Microsoft sql server 2008 - ETL

Dobleclic

Relacionamos

Page 46: Microsoft sql server 2008 - ETL

Ejecutamos

Page 47: Microsoft sql server 2008 - ETL

Conclusiones

Indicar y señalar la importancia del proceso ETL y la necesidad

de que ésta sea planificada y modelada correctamente.

Facilitar esfuerzos de definición y redefinición de actividades.

ETL es la etapa más crítica para la calidad de la información de los almacenes de datos.

Se pretende desarrollar un modelo conceptual para procesos

ETL con su propia notación gráfica, tomando en cuenta los aspectos de seguridad.

ETL es el proceso que organiza el flujo de los datos entre diferentes

sistemas en una organización y aporta los métodos y herramientas necesarias para mover datos desde múltiples fuentes como la compra.

ETL forma parte de la Inteligencia de Negocios (Business Intelligence),

también llamado “Gestión de los Datos” (Data Management).