Frutikola(Bi)

22
CAPITULO II ELABORACION DEL PROYECTO 2.1 Justificación de la Metodología y Herramientas de Desarrollo 2.1.1 Justificación de la Metodología 2.1.2 Justificación del uso de la Metodología de Kimball Se realizará una comparación entre las dos metodologías más importantes que son la metodología de Ralph Kimball (y su enfoque dimensional), y la metodología de Will Inmon (y su enfoque Empresarial Warehouse) para la construcción de Data. Warehouse, en el caso de particular de este trabajo de investigación se analizara desde el punto de vista de la construcción de un Datamart que es una parte de un Data Warehouse. Como introducción a este análisis podemos mencionar que se tienen otras alternativas como son la metodología de Hefesto y The SAS Rapid Data Warehouse Methodology entre otras que son adaptaciones de las dos principales, además de metodologías Hibridas como (el Hybrid DW o el Federated DW, que utilizan una aproximación intermedia para la construcción del sistema) que no explicaremos en este documento que son aquellas que usan en parte Bottom-up y en parte Top-Down. Se debe tomar en cuenta que a la hora de escoger una metodología debemos revisar una que se adapte a al tipo de proyecto y organización dentro de la cual nos encontramos, tomando en cuenta particularidades como tipos de datos que se manejan, la complejidad de los mismos y del modelo relacional, fuentes de datos, número de transacciones, la perspectiva de crecimiento, además si los requerimientos de análisis de información son similares en los

description

este trabajop es un trabajo de investigacion que consiste en realizar intelignecia de negocio para la empresa de bebidas en ayacucho peru .

Transcript of Frutikola(Bi)

Page 1: Frutikola(Bi)

CAPITULO II

ELABORACION DEL PROYECTO

2.1 Justificación de la Metodología y Herramientas de Desarrollo

2.1.1 Justificación de la Metodología

2.1.2 Justificación del uso de la Metodología de Kimball

Se realizará una comparación entre las dos metodologías más importantes que son la

metodología de Ralph Kimball (y su enfoque dimensional), y la metodología de Will Inmon

(y su enfoque Empresarial Warehouse) para la construcción de Data.

Warehouse, en el caso de particular de este trabajo de investigación se analizara desde el

punto de vista de la construcción de un Datamart que es una parte de un Data Warehouse.

Como introducción a este análisis podemos mencionar que se tienen otras alternativas

como son la metodología de Hefesto y The SAS Rapid Data Warehouse Methodology

entre otras que son adaptaciones de las dos principales, además de metodologías Hibridas

como (el Hybrid DW o el Federated DW, que utilizan una aproximación intermedia para la

construcción del sistema) que no explicaremos en este documento que son aquellas que

usan en parte Bottom-up y en parte Top-Down. Se debe tomar en cuenta que a la hora de

escoger una metodología debemos revisar una que se adapte a al tipo de proyecto y

organización dentro de la cual nos encontramos, tomando en cuenta particularidades como

tipos de datos que se manejan, la complejidad de los mismos y del modelo relacional,

fuentes de datos, número de transacciones, la perspectiva de crecimiento, además si los

requerimientos de análisis de información son similares en los diferentes departamentos o

no.

2.1.3 Metodologías Libres

Es interesante ver que existen alternativas libres como la que se menciona a continuación,

además de haberla mencionado en el párrafo anterior, la metodología de Hefesto podría

ser válida para el desarrollo de un proyecto como este, pero se encuentra en un proceso de

desarrollo por lo que no se consideró para este proyecto.

Page 2: Frutikola(Bi)

Metodología Hefesto

La Metodología Hefesto, creada por Bernabeu Ricardo Dario (disponible con licencia

GNU FDL) [4]. Esta metodología es muy realista y pragmática (no se enfoca en un

excesivo número de documentos). Hefesto, se enfoca en el análisis de los

requerimientos de la empresa, la identificación de las carencias de información que se

tienen, los indicadores y "perspectivas" del negocio, y acto seguido se procede al

análisis de las fuentes de datos, como se puede apreciar a continuación:

Figura 1 Etapas Metodología de Hefesto

(HEFESTO)

Figura 2 Metodología Hefesto

(HEFESTO)

Page 3: Frutikola(Bi)

Hay muchas más tecnologías para la implementación de inteligencia de negocios pero las que se ajustan a nuestro negocio es la metodología kimball.

2.2.1 Metodología de Kimball parar construcción de Datamarts

Figura 3 Metodología de Kimball parar construcción de Datamarts

(Elaborado por: MILAN)

2.2.2Etapas de la Metodología de Kimball.

· Planificación, Planificación del Proyecto.

· Requerimientos, Definición de requerimientos.

· Análisis, Arquitectura técnica.

· Diseño, Selección de herramientas, Diseño físico.

· Construcción, Diseño de la puesta en escena (Staging) y desarrollo.

· Despliegue, Implantación y Mantenimiento.

2.2.3 Justificación de Herramientas de Desarrollo

Las herramientas que se han escogido para el desarrollo del presente proyecto son:

· Gestor de Base de datos: SQL SERVER 2012. · Herramienta de Aplicación: VISUAL STUDIO 2013 (para compilar el SQL server

2012 BI).· Herramienta para Inteligencia de Negocio: TABLEAU 9.0 Desktop· Herramienta para Inteligencia de negocio: SQL SERVER DATA TOOLS (SSDT-

BI).

· Herramienta para Inteligencia de Negocio: MICROSOFT SQL SERVER 2012 (ANALYSIS SERVICES,INTEGRATION SERVICES,REPORTING SERVICES)

Page 4: Frutikola(Bi)

· Diseño del cubo:Workbench.

A continuación se presenta la justificación del uso de estas herramientas en base a

parámetros generales que se tomaran en cuenta en el análisis pertinente a cada uno

de estos.

· Costo de licencia.· La mejor adaptación al proyecto

· Costo de Implementación.

· Crecimiento de las organizaciones.

· Facilidad de acceso.

Justificación de tableau 9.0 Desktop para la inteligencia de negocio.

Es un software de Business Intelligence Es un producto de análisis de datos Es una herramienta de análisis que ayuda a mejorar y acelerar la toma de

decisiones de la empresa Por su funcionalidad. Es muy útil para el negocio, para una mejor toma de

decisiones. Gran capacidad visual de análisis. Facilita la comprensión de datos. Es intuitivo. Se aprende muy rápidamente a utilizarlo, es de muy fácil uso. Precio Su precio está por debajo de la media del mercado.

Page 5: Frutikola(Bi)

2.2.5 Justificación de SQL SERVER DATA TOOLS (SSDT-BI) 2014

SQL Server Data Tools - Business Intelligence (SSDT-BI) para Visual Studio incluye herramientas de creación de proyectos de inteligencia empresarial y plantillas de proyectos para SQL Server Analysis Services, Reporting Services e Integration Services integrados en el shell de Visual Studio. Puede instalar SSDT-BI como un entorno de creación de inteligencia empresarial independiente o paralelo con un SQL Server Data Tools (SSDT) existente. Es importante entender que SSDT-BI y SSDT son dos paquetes de descarga e instalación separados. Estas instrucciones son para descargar e instalar SSDT-BI. Para más información

Page 6: Frutikola(Bi)

2.2.6 Justificación de SQL SERVER 2012 como gestor de base de datos.

1) Un primer factor muy importante para escoger a SQL SERVER 2012 como gestor

de base de datos es el tipo de proyecto que estamos implementando, por el interfaz

amigable que muestra por la licencia y es más accesible.

Si el tipo de proyecto fuera bajo un ambiente propietario donde además se puedan

pagar altos costos de licencias, seguramente se podría optar por una solución

privativa como Oracle, la misma que por la mayoría de expertos es considerada

como el mejor gestor de base de datos.

Se adjunta información de comparativas de base de datos realizadas por Forrester.

Figura 4 Estudio Forrester 2009 sobre Gestores de Base de Datos

(Estudio Forrester)2. Para elegir un gestor de bases de datos se debe tomar en cuenta aspectos como:

prestigio (Probado y utilizado en entornos de producción), fiabilidad, velocidad,

rendimiento, facilidad de administración y conexión con otros productos,

documentados, con perspectiva de evolución, soporte y capacitación.

· Se va a construir un datamart, por lo que la prioridad será la velocidad de acceso a

los datos (habrá cargas de datos regulares cuando estemos alimentando el DW a

partir de los sistemas operacionales, y la mayoría de accesos serán para consultar

dichos datos).

Page 7: Frutikola(Bi)

· Para mejorar el rendimiento de la base de datos, en la tabla de hechos (que tendrá

una gran cantidad de registros, pues en ella se guardarán todas las transacciones

de eventos, herramientas, organizaciones y proyectos) Si el volumen de esta tabla

es demasiado grande se requerirá realizar particionamiento.

2.2.7Justificación de sql server 2012 Como Suite de BI

Compila e implemente soluciones BI corporativas seguras, escalables y administrables

con análisis e informes avanzados. Los usuarios profesionales se benefician de los

análisis predictivos, con la sencillez y familiaridad de Microsoft Excel, gracias a los

complementos de minería de datos de SQL Server para Microsoft Office.

Análisis de alto rendimiento

Nuestro motor de análisis in-memory proporciona un salto generacional en el rendimiento, permitiendo al mismo tiempo la interacción con una cantidad de datos sin precedentes. La funcionalidad en memoria se integra justo en los motores de análisis de SQL Server, para una mayor facilidad de uso y flexibilidad.

Datos veraces y coherentes

TI puede controlar y administrar mejor los datos a través de un modelo semántico de BI, que proporciona una vista coherente de orígenes de datos heterogéneos, además de mejoras en SQL Server Integration Services.

Calidad de datos sólida

Mejore la calidad de los datos haciendo uso de los conocimientos de la organización y recurriendo a proveedores de datos de terceros de referencia para generar perfiles, limpiar y buscar coincidencias en los datos.

Administración de datos maestros

Mantenga los datos maestros en todas las estructuras de la organización para la asignación de objetos, datos de referencia y administración de metadatos.

Disponibilidad, seguridad y administración de datos básicas

Page 8: Frutikola(Bi)

La edición Business Inteligencie también incluye la funcionalidad de base de datos básica de SQL Server Standard para aplicaciones departamentales, como la compatibilidad básica con Windows Server y los roles definidos por el usuario para configurar la separación de tareas.

Figura 5 (la implementación de inteligencia de negocios para toma de decisiones)

3.1 La solución BI en SQL server 2012 /data tools 2014

Figura 6 SSDT-BI PARA EL PROCESO DE NEGOCIO

El servidor OLAPPara obtener la funcionalidad de procesamiento analítico en línea (OLAP) se utilizan

otras dos aplicaciones: el servidor OLAP Mondrian, que combinado con Jpivot,

Page 9: Frutikola(Bi)

permiten realizar querys a Datamarts, que los resultados sean presentados mediante

un browser

Data MiningPentaho está incorporando la tecnología Weka que es una herramienta extensible e

integrable que incluye herramientas para realizar transformaciones sobre los datos,

tareas de clasificación, regresión, clustering, asociación y visualización.

ETLExtract, Transform and Load («extraer, transformar y cargar», frecuentemente abreviado ETL) es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio.

Figura 7 (PROCESO DE INTEGRACION) 3.2 La solución BI en tableau

Page 10: Frutikola(Bi)

3.2.1Características: Muy rápido. Es suficiente con arrastrar y soltar para cambiar los parámetros de su análisis Fácil de utilizar. Tableau es una herramienta intuitiva que e permite ver todos los cambios a

medida que los va realizando. Cuadros de mando brillantes. Es capaz de combinar varios análisis en un único informe

donde se inserten páginas webs y documentos para una mejor explicación y comprensión de las cifras.

Conexión directa. Tableau elimina el paso previo para crear “universos”, “cubos” y “tablas temporales”. Su conexión es directa, no se requiere programación.

“Mashups” perfectos. Un análisis a partir de la combinación de datos de distinto origen simplemente supone conectar cada fuente en otro “plano” para arrastrarlos y soltarlos en un clic.

Capitulo2 DEFINICIÓN DE REQUERIMIENTOS Y ANÁLISIS DE NEGOCIO

El objetivo de este capítulo es describir a la empresa industrias y derivados del sur

S.A.C las ares de ventas y productos en AYACUCHO -HUAMANGA que será nuestro

caso de estudio, así como el análisis del datamart para la inteligencia de negocio para

la empresa en el rubro de bebidas gasificadas, las consideraciones y requerimientos

tomados en cuenta para su solución, su arquitectura y el modelo de datos definido.

2.1 Captura y Especificación de Requisitos

Inteligencia de negocio de la empresa INDUSTRIAS Y DERIVADOS DEL SUR S.A.CPara la mejor toma de decisiones de sus diferentes áreas .

2.1.1 Caso de Estudio

2.1.2 Objetivos del Sistema

Page 11: Frutikola(Bi)
Page 12: Frutikola(Bi)
Page 13: Frutikola(Bi)

Se requiere implementar un datamart, para almacenar los datos necesarios que

mediante la aplicación de técnicas ETL y técnicas OLAP, que otorguen la información

adicional y relevante a la que brinda el sistema de administración.

También se precisa de la posibilidad de visualización de información en diferentes

perspectivas (dimensiones) para tener mayores argumentos que permitan una

justificación de las decisiones que se tomen referentes al Software Libre y su difusión.

A futuro seria importarte desarrollar un módulo en el sistema de administración que

permita ligar o relacionar a los usuarios con el proceso de aprendizaje o capacitación

en el software Libre, para que de esta forma se pueda determinar patrones de

aprendizaje, porcentajes de deserción, factores que favorezcan al crecimiento del

software libre, factores individuales y sociales que afectan al crecimiento del Software

Libre.

Page 14: Frutikola(Bi)

2.1.4 Recursos tecnológicos con los que cuenta

Actualmente la EMPRESA INDUSTRIAS DERIVADOS DEL SUR no cuenta con un

base de datos, servidor donde se pueda almacenar toda su información requerida

para la inteligencia de negocio.

Se tiene que considerar adicional a esto que la empresa solo cuenta con libros de

Excel donde almacenan su información de ventas, pedidos, de sus productos.

2.1.5 Recursos tecnológicos que necesita

Se requiere construir una base de datos relacional para optimizar sus procesos, se

requiere aplicaciones para simplificar sus procesos de elaboración de sus productos,

2.2 Análisis Dimensional

2.2.1 Módulos del Sistema

Page 15: Frutikola(Bi)

2.2.1.1 Modelo LógicoPara poder realizar el análisis es necesario entender la estructura del negocio como

se establece en la metodología de Kimball para datawarehousin, a continuación se

muestra el modelo de datos que va manejar la empresa.

Modelo de datos para la inteligencia de negocio de la empresa (INDUSTRIAS Y DERIVADOS DEL SUR)

Preguntas de investigación ¿En qué grado las tecnologías de información y lasherramientas de BI ayudan a los ejecutivos en la toma dedecisiones estratégicas? ¿Cómo asegurar una buena integración de los datos en lossistemas de información de las organizaciones?17 Daena: International Journal of Good Conscience. 4(2) : 16-52. Septiembre 2009.ISSN 1870-557X. ¿Cómo asegurar la calidad de la información en lossistemas organizacionales, para una buena toma dedecisiones? ¿Existe alguna diferencia entre información yconocimiento? ¿Se pueden lograr ventajas competitivas tomando buenasdecisiones apoyados con herramientas de BI?

Page 16: Frutikola(Bi)

ANALSIS

2.3 Arquitectura del Sistema

2.3.1 Arquitectura Técnica

La arquitectura de la solución está conformada por tres grandes capas, que son:

integración, análisis y visualización.

La capa de integración, se extraen los datos de las bases de datos operacionales y

se seleccionan los campos necesarios conforme al modelo de datos. Posteriormente

los datos pasan por un proceso ETL donde se limpian y estandarizan, ya que de esta

forma se eliminan inconsistencias y posibles errores que pudiera llegar a existir.

Posterior a ello estos datos serán almacenados en estructuras (tablas), relacionales y

de esta forma quedara implantado en datamart.

La capa de análisis, esta capa comprende la aplicación de técnicas OLAP y

algoritmos de data mining de ser el caso, técnicas relacionadas a data mining, pero

por cuestiones de escalabilidad queda abierta la posibilidad de usar data mining

dentro de la arquitectura del sistema.

Para OLAP, desde la capa de visualización, que se explicara posteriormente, por el

usuario que ejecuta una consulta, la cual es formulada en lenguaje MDX.

Posteriormente por el motor OLAP que se encarga de mapear las consultas en

lenguaje MDX a sentencias SQL, serán ejecutadas en la base de datos relacional

donde reside el datamart. La información resultante es regresada al motor OLAP y

este se encarga de enviarla nuevamente a la capa de visualización.

La capa de visualización, es la capa que permite mostrar al usuario final los

resultados, que se obtienen de la aplicación de las técnicas OLAP, de una forma que

el usuario los pueda interpretar más fácilmente.

Los resultados pueden visualizarse a través de textos, tablas y gráficos. Esta variedad

facilita la comprensión e interpretación de los mismos. De esta manera el usuario

puede interactuar y manipular la información de su interés para analizarla desde

diferentes perspectivas. Dichas perspectivas le permitirán obtener información

relevante que le ayudará a crear estrategias justificadas que traigan beneficiosa a la

empresa.

Page 17: Frutikola(Bi)
Page 18: Frutikola(Bi)
Page 19: Frutikola(Bi)