220396623 Presentacion Pentaho OSBI SIU DW

44
Pentaho BI Suite 3.5 Introducción SIU – Datawarehouse / Julio 2010

Transcript of 220396623 Presentacion Pentaho OSBI SIU DW

  • Pentaho BI Suite 3.5Introduccin

    SIU Datawarehouse / Julio 2010

  • Inteligencia de Negocios es el proceso de convertir datos en conocimientos y el

    conocimiento en accin, para la toma de decisiones

    Business Intelligence

    DATOSANLISIS CONOCIMIENTO

    SIU Datawarehouse / Julio 2010

  • Fases de un proceso BI

    SIU Datawarehouse / Julio 2010

  • Pentaho OSBIOpen Source Business Intelligence

    SIU Datawarehouse / Julio 2010

  • Proyecto Open Source (GNU GPL) cuyo objetivo es crear soluciones para Inteligencia de Negocios.

    Las funcionalidades principales son:Reporting empresarial y Anlisis.Tableros de mando.Minera de datos.Integracin de datos.Workflow, alertas, suscripciones, etc.

    Qu es Pentaho? (1/2)

    SIU Datawarehouse / Julio 2010

  • Plataforma orientada a la solucin y centrada en procesos.

    Compuesto por mltiples programas que trabajan juntos para crear y distribuir soluciones BI. (diferentes funcionalidades).

    Puede ser accedido desde un simple web browser, embebido en portales (LifeRay), embebido en sistemas de gestin (Alfresco).

    Su diseo modular le permite utilizar otros programas ajenos a la suite (BIRT, Jasper).

    Qu es Pentaho? (2/2)

    SIU Datawarehouse / Julio 2010

  • Principales proyectos

    Pentaho Reporting (antes JFreeReport):http://reporting.pentaho.org

    Pentaho Data Integration (Kettle): http:// kettle.pentaho.org

    Pentaho Analysis (Mondrian OLAP server):http:// mondrian.pentaho.org

    Pentaho Data Mining (Weka): http:// weka.pentaho.org

    Pentaho Dashboards (CDF):http://www.pentaho.com/products/dashboards/

    Pentaho BI Platform:http:// community.pentaho.com/projects/bi_platform/

    SIU Datawarehouse / Julio 2010

  • Anlisis OLAP

    SIU Datawarehouse / Julio 2010

  • Grficos

    SIU Datawarehouse / Julio 2010

  • Tableros de mando

    SIU Datawarehouse / Julio 2010

  • Reportes

    SIU Datawarehouse / Julio 2010

  • Componentes (1/3)

    Plataforma 100% J2EE, asegurando la escalabilidad, integracin y portabilidad.

    Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS.

    Base de datos: va JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, NCR Teradata, Firebird, etc.

    SIU Datawarehouse / Julio 2010

  • Componentes (2/3)

    Sistema operativo: no hay dependencia. Lenguaje interpretado.

    Lenguaje de programacin: Java, Javascript, JSP, XSL (XSLT/XPath/XSL-FO).

    Interfaz de desarrollo: Java SWT, Eclipse, Web-based.

    Repositorio de datos basado en XML.

    Todos los componentes estn expuestos va Web Services para facilitar la integracin con Arquitecturas Orientadas a Servicios (SOA).

    SIU Datawarehouse / Julio 2010

  • Componentes (3/3)

    SIU Datawarehouse / Julio 2010

  • Arquitectura

    SIU Datawarehouse / Julio 2010

  • Existen dos versiones disponibles de Pentaho

    Pentaho Community Edition

    Pentaho Enterprise Edition (*)

    (*) (Costo de soporte 10.000 US$/ao hasta 25 usuarios 1 semestre 2010)http://desarrollos.siu.edu.ar/trac/datawarehouse/attachment/wiki/Informacin%20de%20inters/lower%20costs%20with%20OSBI.pdf

    SIU Datawarehouse / Julio 2010

  • Versin Comunitaria

    Sin costos de licencia

    Sin servicios de soporte asociados

    Suite completa con todas las funcionalidades para el desarrollo de proyectos de Business Intelligence.

    Aunque Pentaho sol la recomienda para:Aficionados al BIAcadmicosProgramadores de Software Abierto

    Pentaho Community Edition

    SIU Datawarehouse / Julio 2010

  • Versin Empresarial.

    Sin costos de licencia.

    Costo de soporte y mantencin con suscripcin anual.

    Versin certificada con funcionalidades mejoradas para la consola de administracin, y la construccin de tableros de control.

    Pentaho Enterprise Edition

    SIU Datawarehouse / Julio 2010

  • Community Enterprise?

    http://www.pentaho.com/download/asset_container.php?durl=pentaho_bi_suite_enterprise_edition.pdf&furl=540000 SIU Datawarehouse / Julio 2010

  • http://www.pentaho.com/download/asset_container.php?durl=pentaho_bi_suite_enterprise_edition.pdf&furl=540000

    Community Enterprise?

    SIU Datawarehouse / Julio 2010

  • http://www.pentaho.com/download/asset_container.php?durl=pentaho_bi_suite_enterprise_edition.pdf&furl=540000

    Community Enterprise?

    SIU Datawarehouse / Julio 2010

  • Dnde conseguir ayuda ?

    Web principal: http://www.pentaho.com

    Descarga de: http://sourceforge.net/projects/pentaho

    Material comunitario: http://community.pentaho.com

    Wiki Comunidad: http://wiki.pentaho.com/display/COM/Community+Wiki+Home

    Foros Comunidad: http://forums.pentaho.org/

    Wiki - SIU-Datawarehouse: http://desarrollos.siu.edu.ar/trac/datawarehouse

    SIU Datawarehouse / Julio 2010

  • Suites BI

    Pentaho Community Edition (CE):Aplicacin web desarrollada en J2EE. Modular.Multiplataforma.Incluye: ETL, Reporting, OLAP, Data mining, Dashboards.GNU GPL.

    OpenI:Aplicacin de tipo SaaS. Desarrolada en J2EE. Multiplataforma.Incluye: OLAP.Licencia Open Source.

    SIU Datawarehouse / Julio 2010

  • SpagoBI:Aplicacin web desarrollada en J2EE. Modular.Multiplataforma.Incluye: ETL, Reporting, OLAP, Data mining, Dashboards.Licencia GNU LGPL.

    JasperSoft Community Edition:Aplicacin de tipo SaaS. Modular. Multiplataforma.Incuye: ETL, Reporting, OLAP, Dashboards.Licencia GNU GPL.

    Suites BI

    SIU Datawarehouse / Julio 2010

  • Palo Community Version:Orientada a Planificacin y Presupuestos. Basada enAJAX. Multiplataforma.Incluye: ETL, Reporting, OLAP.Licencia Open Source.

    Suites BI

    SIU Datawarehouse / Julio 2010

  • Pentaho Data Integration (PDI) - Kettle

    SIU Datawarehouse / Julio 2010

  • SIU Datawarehouse / Julio 2010

  • Usos comunes

    Carga de datawarehouses y datamarts.

    Integracin de datos.

    Limpieza de datos (Data cleansing).

    Migracin y depuracin de datos.

    Exportacin de datos.

    Integracin de PDI usando Pentaho BI.

    ...

    SIU Datawarehouse / Julio 2010

    Introduccin (1/4)

  • Pentaho Data Integration (PDI) - Kettle Kettle Extraccin, Transformacin, y Carga.

    Licencia GNU LGPL.

    Las soluciones de PDI se basan en dos tipos de objetos diferentes:TransformacionesTrabajos

    PDI cuenta con un Motor propio que le permite interpretar, planificar y ejecutar Transformaciones y Trabajos (T&T).

    Introduccin (2/4)

    SIU Datawarehouse / Julio 2010

  • PDI cuenta con herramientas y utilidades para crear, administrar y ejecutar T&T:

    Spoon: IDE grfico para crear T&T.

    Kitchen: herramienta de lnea de comandos para ejecutar Trabajos.

    Pan: herramienta de lnea de comandos para ejecutar Transformaciones.

    Carte: servidor liviano para ejecutar T&T en host remotos.

    Las T&T utilizan un lenguaje descriptivo (XML), el cual ser interpretado por el Data Integration Engine para su ejecucin.

    Introduccin (3/4)

    SIU Datawarehouse / Julio 2010

  • Catlogo Sin Catlogo: se almacenan y gestionan las T&T en algn directorio.Con Catlogo: se utiliza una BD Relacional para almacenar y gestionar T&T.

    Introduccin (4/4)

    SIU Datawarehouse / Julio 2010

  • Kettle en el proceso de BI

    SIU Datawarehouse / Julio 2010

  • Componentes PDI

    SIU Datawarehouse / Julio 2010

  • Data Integration Engine

    Responsable de interpretar y ejecutar los T&T de PDI.

    Data Integration Engine utiliza:Para Transformaciones Motor de TransformacionesPara Trabajos Motor de Trabajos

    Implementado como una librera Java.

    Cuenta con una GUI muy avanzada.

    Incluido en Pentaho BI server, para permitir ejecutar Trabajos como parte de una xaction.

    SIU Datawarehouse / Julio 2010

  • Transformacin (transformation)Orientacin a los Datos. Representa una tarea ETL.

    Es una coleccin de pasos. Cada paso es una operacin particular sobre datos.

    Los pasos se conectan entre s a travs de saltos, que indica cual ser el flujo de los datos.

    Los pasos trabajan de manera simultnea y asincrnica.

    SIU Datawarehouse / Julio 2010

  • Trabajo (job)Orientacin a la Tarea y a los Datos.

    Usualmente un Trabajo se compone de una o ms Transformaciones, que sern ejecutadas secuencialmente.

    La ejecucin de cada Entrada de Trabajo presenta una salida de status, que puede ser analizada para la realizacin de diferentes acciones.

    SIU Datawarehouse / Julio 2010

  • Transformacin (transformation)

    Ejemplo:

    SIU Datawarehouse / Julio 2010

  • Trabajo (job)Ejemplo: Carga de un DW

    SIU Datawarehouse / Julio 2010

  • Interfase grfica

    SIU Datawarehouse / Julio 2010

  • Demo

    SIU Datawarehouse / Julio 2010

  • Web: http://kettle.pentaho.orgForo: http://forums.pentaho.org/forumdisplay.php?f=69Wiki: http://wiki.pentaho.org/display/EAILista de mails: http://groups.google.com/group/kettle-developersManual de Spoon en espaol: http://wiki.pentaho.com/display/EAIes/Manual+del+Usuario+de+SpoonDocumentacin en espaol: http://wiki.pentaho.com/display/EAIes/InicioLibros:

    Pentaho 3.2 Data Integration - Beginner's Guide. Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho and MySQL.Pentaho Kettle Solutions - Building Open Source ETL Solutions with Pentaho Data Integration. (Septiembre 2010)

    Donde obtener informacin

    SIU Datawarehouse / Julio 2010

  • Bibliografa

    Roland Bouman, Jos van Dongen, 2009. Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho and MySQL. Wiley Publishing, Inc.Mara Carina Roldan, 2010. Pentaho 3.2 Data Integration - Beginner's Guide. Packt Publishing.Ing. Bernabeu Ricardo Dario, 2010. DATA WAREHOUSING:Investigacin y Sistematizacin de Conceptos HEFESTO: Metodologa propia para la Construccin de un Data Warehouse. http://tgx-hefesto.blogspot.com/2010/07/hefesto-v20.html Matt Casters. Pentaho Data Integration 4 and MySQL.. MySQL User Conference, Tuesday April 13th , 2010.http://community.pentaho.comhttp://kettle.pentaho.orghttp://todobi.blogspot.com

    SIU Datawarehouse / Julio 2010

  • Preguntas?

    SIU Datawarehouse / Julio 2010

  • Muchas Gracias!!!

    SIU Datawarehouse / Julio 2010