Software Libre para la Toma de Decisiones
-
Upload
hector-neri -
Category
Software
-
view
335 -
download
0
Transcript of Software Libre para la Toma de Decisiones
Software Libre para la Toma de DecisionesFliSoL CUCEA 2016
Inteligencia de Negocios - Business Intelligence
Sabiduría
Conocimiento
Información
Datos
Hacer lo correcto
Hacer las cosas bien
¿Por qué?¿Qué es lo mejor?
¿Cómo hacerlo?
¿Qué?
• Es obtener conocimiento a través de los datos que una organización tiene a su disposición para ayudar en la toma de decisiones.
Business Intelligence Analysis
• Análisis que pueden realizarse para la Inteligencia de Negocios:
– Análisis estadístico
– Pronósticos (Forecasting)
– Minería de datos (Data Mining)
– Optimización
– Minería de Procesos
Business Intelligence Reporting
• El análisis de datos permite generar reportes o informes con la información y conocimientos obtenidos.
• Tipos de reportes:– Informes predefinidos
– Informes a la medida (ad-hoc)
– Consultas y Cubos OLAP
– Alertas
Data Warehousing
• Los Data Warehouses concentran la información de una organización en una base de datos diseñada para el análisis y la difusión eficiente de los datos.
• Contiene todos los datos de los sistemas operacionales– Se organizan para que todos los datos relativos al mismo evento u objeto del
mundo real queden relacionados entre sí.
• La información no se modifica ni se elimina.– La información es read-only y solo accesible para consultas.
ETL - Extract, Transform and Load
ETL es la integración de los datos para poder ser analizados de una forma precisa y congruente.
En la mayoría de los casos, la información que se quiere analizar se encuentra dispersa o los datos están “sucios”, es decir, no tienen las características ideales con la forma de trabajar de nuestras herramientas de inteligencia de negocios.
Esquema de Proceso
Extracción de Datos
Este paso significa extraer datos de diversas fuentes de datos, tales como archivos XLS (Excel), archivos XML (facturas electrónicas, por ejemplo), bases de datos SQL (de nuestro ERP o sistema de planeación de recursos empresariales), bases de datos NoSQL, o simplemente de archivos TXT o puro texto.
Con la fase de extracción, se valida si los datos tienen los valores correctos o esperados.
Transformación de Datos
En este proceso, se aplica una serie de reglas o funciones a una buena parte de los datos. Una función importante de la transformación es la limpieza de los datos, que tiene por objetivo el transmitir sólo los datos adecuados.
Algunos de los procesos de transformación que se pueden aplicar son los siguientes
• Elegir sólo ciertas columnas o filas.
• Traducir valores codificados (0: masculino, 1: femenino)
• Codificar valores (Aguascalientes:1, Jalisco:14)
• Crear un Valor Calculado (ventas = cantidad * precio)
• Agregación, acumulación y resumen de los valores.
• Unir datos de diferentes fuentes y evitar duplicados
• Transposición o pivote entre columnas y filas.
• Separar una columna en diversas columnas
Carga de Datos
En esta fase se cargan los datos en el destino final que puede ser un archivo plano simple o un almacén de datos.
Se pueden aplicar las restricciones definidas en el esquema de la BD, por lo que esta fase refleja si todo se ha realizado bien.
Un uso alternativo para ETL es mover información hacia otra aplicación de forma permanente. La nueva aplicación podría utilizar un diferente proveedor de base de datos y podría tener un esquema muy diferente.
ETL usando Kettle
Algunas Herramientas Open Source
– Pentaho
– Jaspersoft
– SpagoBI
– RapidMiner
– Palo
– Eclipse BIRT Project
– Logi Analytics
Características de Pentaho
• Es una de las herramientas más populares de BI.
• Modelo de negocios basado en “Open Core”- Ofrece una versión de comunidad con las características principales de forma
“open source” y gratuita, mientras que también se ofrece otra versión empresarial con características más avanzadas.
• Pentaho tiene capacidades de integración de datos, servicios OLAP, informes, cuadros de mando, minería de datos y ETL.
Herramientas de Pentaho
Data Integration (Kettle): • Ofrece capacidades de ETL. • Diseña transformaciones y jobs de forma visual Report Designer: • Genera informes en Excel, PDF, HTML y más.Aggregation Designer: • Crea tablas agregadas y mejora rendimiento de análisis OLAP.Hadoop Shims: • Plugins para distribuciones de Hadoop.
Características de Jaspersoft
• Inició como una herramienta independiente para BI, su popularidad lo llevó a ser adquirida por Tibco, quienes tienen sus propias herramientas comerciales para BI (Spotfire).
• Su modelo de negocios también está basado en “Open Core”
• Además de ofrecer OLAP, informes y ETL, cuenta con un servidor donde se pueden almacenar los informes y realizar análisis.
Proceso en Jaspersoft
Herramientas de Jaspersoft
Jaspersoft ETL: • Ofrece transformaciones y jobs de forma visual Jaspersoft Studio: • Genera informes con integración al Servidor, incluye librería
JasperReports.JasperReports Server: • Ofrece Informes y Análisis en un Servidor autónomo y puede
servir como un concentrador de información empresarial.
Características de SpagoBI
• Es la única suite de herramientas de BI 100% Open Source.
• Su modelo de negocios está basado en Servicios y Consultoría
• Es la que ofrece mayor cantidad de herramientas de todas, incluyendo ETL, Informes, Análisis OLAP, Gráficas Interactivas, Informes Ad-Hoc, Geolocalización, Minería de Datos, Análisis de Grafos, Automatización Ofimática, soporte móvil y más.
Arquitectura de SpagoBI
Módulos de SpagoBI
SpagoBI Server: El núcleo de la suite incluyendo las herramientas de análisis.
SpagoBI Studio: Entorno de desarrollo integrado.SpagoBI Meta: Entorno de los metadatos.SpagoBI SDK: La capa de integración que permite utilizar SpagoBI
con herramientas externasSpagoBI Applications: Una colección de modelos analíticos
verticales que se desarrollan utilizando SpagoBI.
Fin de la Presentación