Nube BI

Nube BI: El futuro de la inteligencia empresarial en la nube

Hussain Al-Aqrabi , Lu Liu , , Richard Hill, Nick Antonopoulos

Mostrar másdoi: 10.1016 / j.jcss.2014.06.013Obtener los derechos y contenidos

Destacados•

Responda a estas preguntas clave en lo que respecta a la toma de inteligencia de negocio a la nube.

•

El Cloud hosting de BI se ha demostrado con la ayuda de la simulación.

•

Procesar de manera eficiente el procesamiento analítico (OLAP) demandas de las aplicaciones en línea en La computación en nube.

AbstractoEn entornos auto-organizado se temía que la inteligencia de negocios (BI), finalmente se enfrentará a una situación de crisis de recursos debido a la expansión sin fin de los almacenes de datos y el procesamiento analítico en línea (OLAP) exige el establecimiento de una red subyacente. La computación en nube ha instigado una nueva esperanza para las futuras perspectivas de BI. Sin embargo, ¿cómo se BI implementarse en la nube y cómo será el aspecto del tráfico y el perfil de la demanda como? Esta investigación intenta responder a estas cuestiones clave en lo que respecta a la toma de BI a la nube. El Cloud hosting de BI se ha demostrado con la ayuda de una simulación en OPNET comprende un modelo de nube con varios servidores de aplicaciones OLAP aplican cargas de consultas en paralelo en una serie de servidores que alojan las bases de datos relacionales. Los resultados de la simulación reflejan que el procesamiento paralelo extensible de servidores de bases en la nube puede procesar de manera eficiente las demandas de aplicaciones OLAP sobre computación en nube.

Palabras clave La inteligencia de negocios;

Procesamiento analítico en línea; La computación ennube; Software-as-a-service; Base de datos-as-a-service; Sistemas masivamente paralelos

1. IntroducciónLa computación en nube se ha convertido en una de las tecnologías revolucionarias en los últimos años. La computación en nube se conceptualiza en tres formas - Software-as-a-service (SaaS), plataforma como servicio (PaaS) e infraestructura-como-un-servicio (IaaS). La interfaz de los proveedores de SaaS con los usuarios finales, en virtud de la provisión de servicios de aplicaciones de negocios similares a los que tradicionalmente han sido auto-organizada por las casas de las empresas [1]. Nube paradigma de computación se ha convertido para llevar la informática, recursos de almacenamiento a gran escala y los recursos de los servicios de datos en conjunto para construir un VCE (entorno informático virtual) [2]. Usuarios de cloud computing pueden descartar las molestias de las inversiones a gran escala en las plataformas de hardware y software, en actualizarlas con regularidad y en costosas licencias de software de aplicación que se utilizan para ejecutar los procesos de negocio, transacciones relacionadas y los sistemas de soporte de decisiones [3].La nube es generalmente un entorno de computación multi-arrendatario; las soluciones de nube multi-tenant pueden optimizar el intercambio de recursos al tiempo que proporciona solución de aislamiento en diferentes niveles requeridos para el inquilino[4].Este modelo se ha asegurado una mejor accesibilidad de los mejores sistemas de aplicación posibles de apoyo por lo tanto un aumento de la eficiencia de las empresas[5]. Los recursos se asignan a los usuarios contra las solicitudes de servicio realizadas por sus terminales de gama terminar, y los recursos son asignados por un motor de aprovisionamiento de servicios que verifica la elegibilidad de los usuarios a partir de un objeto de esquema separado que contiene datos multi-tenencia sobre todos los usuarios y grupos de la nube. Una vez que la elegibilidad se verifica, los recursos se reservan para el usuario a través de los enlaces de la sesión hasta que los procesos de computación están en curso por el terminal de usuario. El terminal es normalmente un cliente virtualizado presentado a través de un conjunto de servidores virtuales. Sin embargo, no puede haber carga directa de los recursos, así (ejemplo, para copia de seguridad de datos). Una capa separada controla el uso de sesiones y utilización de los recursos de tal manera que la información de facturación relacionada se puede generar[6]. NIST (Instituto Nacional de Estándares y Tecnología) está en el proceso de desarrollo de protocolos estándar para la conectividad de los usuarios a la nube a través de la interfaz de la virtualización, la interfaz de emulación de terminal, la interfaz de cliente ligero y una interfaz de navegador de Internet. A partir de ahora, no hay un

protocolo estándar para la conectividad de los usuarios a la nube alojada recursos [7].Como un enfoque centrado en los datos de inteligencia de negocios (BI), la adquisición de datos es cada vez más fácil de adquirir y grandes almacenes de datos con 10-100s de terabytes de sistemas de gestión de bases de datos relacionales (RDBMS) se están convirtiendo cada vez más común debido a la popularidad de los interactivos, web bases de datos basadas en [33]. BI ha sido históricamente una de las aplicaciones intensivas de la mayoría de los recursos. Comprende una serie de almacenes de datos creadas por ir a buscar los datos de apoyo a las decisiones de amplias bases de datos de la organización. Los almacenes de datos se actualizan a intervalos frecuentes a través de consultas apropiadas ejecutados en el procesamiento de los negocios y las bases de datos transaccionales. Procesamiento analítico en línea (OLAP) es la interfaz de usuario final de BI que está diseñado para presentar informes gráficos multidimensionales a los usuarios finales. OLAP emplea una técnica llamada análisis multidimensional se utiliza principalmente para permitir el análisis interactivo flexible de los datos multidimensionales [32]. Mientras que un relacionales base de datos almacena todos los datos en forma de filas y columnas, OLAP también emplea cubos de datos formadas como resultado de consultas multidimensionales ejecutar en una gran variedad de almacenes de datos. Por otra parte, una aplicación OLAP obtiene datos de los almacenes de datos, los organiza en cubos de datos multidimensionales de alta complejidad, y se presenta a los usuarios a través de definido por el usuario y cuadros de mando GUI configurados [8]. Marco de BI y OLAP tiene una utilidad de gran negocio, ya que ayuda a localizar y eliminar o resolver las deficiencias del proceso de negocio, los pasos del proceso ineficientes y pasos del proceso de residuos. Se espera que un marco de BI y OLAP para proporcionar información oportuna, precisa, organizada e integrada a los tomadores de decisiones de negocios [8] y [9].A pesar de la excelente utilidad del negocio de marco de BI y OLAP, muchos propietarios de negocios se vieron obligados a buscar su alternativa debido a aumento incontrolado de los requisitos informáticos y de recursos de almacenamiento en entornos auto organizado. En algún momento, el costo de mantener y actualizar el marco de BI y OLAP vuelve injustificada para que una empresa [10]. Sin embargo, los puntos de venta exclusivos de la nube oferta de computación exactamente lo que las empresas necesitan para ejecutar correctamente BI y OLAP marcos-ilimitadas recursos, la elasticidad de los recursos (recursos bajo demanda), costos moderados de uso, alta de tiempo de actividad y disponibilidad, de alta seguridad, no hay problemas de actualización y el mantenimiento de cargas de servidores y bases de datos, y así sucesivamente [1] y [5]. Por lo tanto, por la presente se argumentó que la computación en nube tiene el potencial de ofrecer una nueva oportunidad de vida en el marco de BI y OLAP. Por otra parte, también se argumenta que la computación en nube puede extender el poder de BI y OLAP a las pequeñas y las empresas medianas, que no podía permitirse el marco en el auto-organizada infraestructuras de TI. Sin embargo, es importante

establecer un marco para la implementación de BI y OLAP en una plataforma de computación en nube.El resto del documento está organizado de la siguiente manera. Sección 2 es una revisión de la literatura sobre cómo marco BI y OLAP se puede implementar en las nubes y presenta beneficios clave de la computación en la nube para BI. Sección 3muestra un enfoque para la toma de BI a la nube, así como los desafíos clave en la organización de BI en la nube. Sección 4 describe y explica en detalle cómo marco BI y OLAP se puede modelar en una nube y cómo debe comportarse con el fin de ampliar la máxima utilidad a las empresas en virtud de un experimento de simulación OPNET basado. Sección 5 se presenta el resumen de los resultados de investigación y análisis.Finalmente, las conclusiones de este trabajo con las direcciones futuras se discuten en la Sección 6.

2. Revisión de la literatura

2.1. Una revisión de la inteligencia empresarial y OLAP y su portabilidad en computación en nube

La inteligencia de negocios (BI) se emplea para monitorear el desempeño de los procesos de negocio a través de la presentación y el análisis de datos multidimensionales tomadas de los sistemas de procesamiento de transacciones distribuidas en toda la empresa precisa [23]. Los analistas utilizando cuadros de mando OLAP habilitado sistemas de información y prefieren asignar los datos financieros con los datos de rendimiento (de personas y procesos) para identificar ineficiencias y reducir a través de la reestructuración estratégica de los procesos de negocio y flujos de trabajo[23]. Según [24], un sistema de BI está hecha de siete capas: TI y la infraestructura conexa, adquisición de datos, integración de datos, almacenamiento de datos, organizador de datos, análisis de datos y presentación de datos.Los cubos OLAP forman el almacenamiento de datos (parcialmente, en forma de puntos de vista) y los datos de la organización de capas de un sistema de BI. Se asienta sobre las tablas de almacenamiento de datos en forma de puntos de vista multidimensionales.Una estructura del cubo está hecho de una serie de columnas con referencias cruzadas con datos obtenida de diferentes procesos y tablas de datos financieros en un periodo.Los períodos en un cubo son más cortos que los que hay en el almacén de datos que tiene la tarea de datos de proceso de almacenamiento relacionados y financieros de períodos más largos (por lo general, cinco años o más). Las consultas OLAP son comandos de búsqueda robusta que comprende datos de múltiples puntos de vista a la vez. La capa de presentación hace que los conjuntos de datos visibles en forma de pantallas gráficas multidimensionales [25] y [26].Varios tipos de consulta OLAP se utilizan para generar las vistas y presentarlos en los cuadros de mando / pantallas de presentación. Algunas de las consultas OLAP populares incluyen: slice and dice, consultas pivotantes, fusionar / consultas de división, laminados en marcha consultas y de perforación hacia abajo consultas [26]. El cubo OLAP se puede visualizar como una pila de planos matriz bidimensional, en el que cada plano de la matriz representa una relación entre dos

dimensiones diferentes [26]. Fig. 1es una presentación de un cubo OLAP multidimensional que comprende dos planos dimensionales matriz.

Fig. 1. Una vista de la matriz de un cubo OLAP multidimensional.

Opciones Figura

Cabe señalar que estas matrices no son independientes el uno del otro. Todos los atributos de estos planos se anidan entre sí, y están vinculadas con una clave principal que controla todas las relaciones a través de múltiples elementos compuestos de muchos a muchos. Por ejemplo, un código de producto puede ser visto como una clave principal que controla las relaciones entre todos los atributos relacionados con las ventas en una empresa [27].Formación de cubos OLAP en una empresa no es una tarea fácil. Una arquitectura bien planificada tiene que estar en su lugar para el contenido de integración, modelado / mapeo y presentación. La arquitectura típica debería formar parte de: componentes y conectividad para el acceso federado a todos los y DSS (sistemas de soporte de decisiones) en toda la empresa, un diccionario de datos diseñada de acuerdo con las formulaciones de cubos OLAP, un mapeo de metadatos según el diccionario de datos, una de datos reales repositorio (almacenamiento), un repositorio virtual de (vistas de datos que sirven como bloques de construcción de los cubos OLAP) y los servicios avanzados de presentación de datos (cuadros de mando e interfaces de informes de BI personalizadas) [28]. Modelado de datos precisos, el mapeo de metadatos y la integración de contenidos ayuda a la formación precisa de cubos multidimensionales y, finalmente, lo que resulta en la presentación exacta de temas de negocios [29]. La presentación de datos debe hacerse de tal manera que la interfaz hombre-máquina es tan amable como sea posible (clasificación, gráficos, códigos de colores y características interactivas multidimensionales) [30].El tipo de documento lenguaje de datos (DTD) definición para definir un esquema XML es el facilitador principal para la toma de BI a las Nubes. Las vistas de datos multidimensionales en los cubos OLAP se

pueden formar mediante la inclusión de DTD analiza los archivos de datos XML. DTD analiza archivos XML en un cubo OLAP resultados en las estructuras adecuadas para hacer uso de los servicios web arquitectura de una nube de orientación. El tablero de instrumentos / BI de informes interfaces y análisis de datos capas se construyen en aplicaciones que pueden alojarse como modo SaaS de Cloud hosting. Los almacenes de datos y cubos OLAP se pueden formar empleando archivos de datos XML multidimensionales y jerárquicas. Las estructuras DTD-uno a muchos se pueden utilizar para crear los almacenes de datos y de los muchos-a-muchos estructuras DTD se pueden utilizar para crear los cubos OLAP.Los cubos y almacenes se pueden alojar en el modo PaaS de Cloud hosting. Los componentes de la infraestructura de servidores subyacentes, bases de datos, almacenamiento y red se pueden alojar en el modo de IaaS de nube de alojamiento [22].

2.2. BI y OLAP

Marco BI y OLAP comprende una estructura multi-capa altamente compleja. Los siguientes son los componentes clave del marco de BI y OLAP [8]:•

Una capa de interfaz de usuario que comprende una gran biblioteca de cuadros de mando para la generación de informes gráficos.

•Una capa de análisis de datos que comprende escenarios hipotéticos, informes, consultas almacenadas y modelos de datos.

•Una capa para el almacenamiento de los cubos OLAP formados por la extracción de datos multi-dimensional de la capa de datos (los almacenes de datos).

•Una capa de integración de datos para la identificación, limpieza, organización y agrupación de los datos extraídos de los almacenes de datos antes de que se forman los cubos.

•Una capa de datos que comprende de los almacenes de datos.

•Una capa de adquisición de datos de la transformación empresarial, apoyo a las decisiones y de las bases de datos transaccionales utilizados por varias funciones de la organización.

•La capa que comprende los componentes de la infraestructura de TI y recursos relacionados (procesamiento de datos, almacenamiento y red).

La característica clave de un marco BI y OLAP es el cubo OLAP, que es una vista multidimensional formado en la estructura de una matriz. El cubo OLAP es una vista de datos complejo formado mediante la ejecución de consultas simultáneas en las mesas de los almacenes de datos

subyacentes que recuperan al menos tres veces más datos en comparación con una consulta de base de datos común. Cada cubo comprende una pila de múltiples dos informes dimensionales (un grafo plano ordinaria que muestra una relación entre dos variables). En aplicaciones típicas OLAP, las consultas traen típicamente 10-12 veces más datos que una consulta de base de datos común [11]. Una aplicación OLAP puede comprender múltiples cubos OLAP almacenados en forma de una compleja jerarquía de matrices que tienen datos organizados en forma de tabulaciones cruzadas. Los cubos normalmente se almacenan en mercados de datos separados o dentro de tablas predefinidas en los almacenes de datos [12]. Las funciones OLAP comunes empleados para la formación de dichos cubos con una jerarquía de datos de tabulación cruzada son drill-down, fusionar / dividir, roll-up, cortar-y-dados y pivotante. Cada plano matriz se identifica por su propia clasificación que comprende diferentes asignaciones de datos. Los planos forman una estructura en forma de nido como debido a interrelaciones. La relación resultante se parece a un árbol con las raíces que comprenden las variables primarias y las ramas que comprenden las variables secundarias. Por ejemplo, un código de producto es una variable primaria y los ingresos generados en lugar de venta es una variable secundaria. El operador salpicadero puede modificar o cambiar las variables primarias y secundarias, que dirige la consulta en busca de un conjunto diferente de datos para formar diferentes tabulaciones cruzadas en el próximo ciclo de consulta en los almacenes de datos subyacentes. Por lo tanto, los cubos OLAP son flexibles y se pueden cambiar dinámicamente de acuerdo con las necesidades del negocio [13]. Fig. 2 muestra el marco BI y OLAP.

Fig. 2. El marco de BI y OLAP.

Opciones Figura

La figura muestra dos formas de cubos - los cubos de datos multidimensionales OLAP y los cubos OLAP de datos maestros. Los

cubos de datos maestros controlan la formación de la relación entre los planos de datos bidimensionales dentro de los cubos de datos multidimensionales. Los usuarios de negocios se les ofrece una amplia gama de variables que se pueden combinar para formar diferentes puntos de vista de los informes de dos dimensiones necesarias en los cuadros de mando. Los datos se extrae de OLTP (procesamiento de transacciones en línea) y bases de datos DSS en las tablas de almacenamiento de datos de forma periódica, lo que a su vez ayuda en la actualización automática periódica de los datos en los cubos de datos y, finalmente, en los cuadros de mando. Por lo tanto, los usuarios de negocio pueden seguir de cerca el desempeño del negocio, en virtud de la actualización de cuadros de mando de forma continua.Apropiada código de colores de referencia puntos / umbrales de ayuda en la generación de alertas y alarmas. Esto podría ayudar a los negocios que toman las decisiones estratégicas que adopten medidas apropiadas [14] y [5].

2.3. Beneficios de Cloud BI

Hoy en día, las soluciones de la nube de BI están ganando gradualmente popularidad entre las empresas, ya que muchas empresas se están dando cuenta de los beneficios del análisis de datos. Las empresas necesitan conocimientos de calidad impulsadas por datos precisos más que nunca. Los proveedores de SaaS están sirviendo como la interfaz principal a la comunidad de los usuarios de negocios [22]. Nube de BI es el concepto de la entrega de capacidades de BI como servicio. Los siguientes son los beneficios clave de la computación en nube para la inteligencia de negocios.

2.3.1. La eficiencia de costes

En la nube, las empresas no necesitan presupuesto para los grandes, por adelantado las compras de paquetes de software o realizar cambios que requieren mucho tiempo en los servidores locales de poner la infraestructura de BI en marcha y funcionando. Ellos lo tratan como un servicio, pagando sólo por los recursos informáticos que necesitan y evitar la adquisición de activos costosos y mantenimiento reduciendo la barrera de umbral de entrada.

2.3.2. La flexibilidad y la escalabilidad

Soluciones de nube de BI permiten una mayor flexibilidad para ser alterado rápidamente para dar a los usuarios el acceso a técnicas nuevas fuentes de datos, la experimentación con modelos analíticos. Con las soluciones de nube de BI, los usuarios de negocio podrán mantener un mejor control fiscal sobre los proyectos de TI y tienen la flexibilidad para ampliar o reducir el uso a medida que cambian las necesidades. Por otra parte, en la nube, los recursos pueden escalar de forma automática y rápidamente y escalar, y puede soportar un gran número de usuarios simultáneos. Esto significa que los clientes pueden fácilmente aumentar su uso de software sin demora o el costo de tener que desplegar e instalar el hardware y el software adicional.

2.3.3. Confiabilidad

Confiabilidad mejora mediante el uso de múltiples sitios redundantes, que puede proporcionar lugares de fiabilidad y seguros para el almacenamiento de datos y los recursos se puede transmitir a través de un gran número de usuarios, lo que hace que la computación en la nube adecuado para la recuperación de desastres y continuidad del negocio.

2.3.4. Capacidades de intercambio de datos mejorada

Aplicaciones en la nube permiten acceder a los datos a ser compartida de forma remota y activar las capacidades de intercambio de datos entre la ubicación de fácil, ya que se despliegan a través de Internet y fuera del firewall de la empresa.

2.3.5. Sin gastos de capital

Bajo TCO (coste total de propiedad) es un beneficio clave del modelo de Cloud. Con la nube, las empresas pagan por un servicio que realmente utilizan. Con esta política, computación en nube permite a las empresas controlar mejor el CAPEX (gastos de capital) y el OPEX (gastos de operaciones) asociada a actividades no esenciales. Por lo tanto, los beneficios de BI se puede rodar más rápido a más usuarios dentro de la organización.

3. Teniendo BI a la nubeBI en la nube es un juego de cambio de fase de TI, ya que hace BI finalmente asequible y accesible en comparación con el BI tradicional. En la nube, las matrices en los cubos OLAP se pueden formar utilizando el concepto de almacenamiento de datos web haciendo uso de los archivos de datos XML utilizando DTD (definición de tipo de documento) describe lenguaje de programación XML. Las estructuras de datos en los cubos se forman usando la DTD analiza archivos XML [14]. El formato DTD ayuda a un archivo XML para exhibir propiedades relacionales de una base de datos convencional.Esto es lo que permite a los cubos OLAP almacenados en la nube haciendo uso de los archivos de datos XML siguientes estructuras DTD (llamadas cubos web). Esto también ayuda a que el sistema de BI hacer uso de componentes de servicios web garantizando así un mejor rendimiento en la nube [15], [16], [17] y [18]. El marco OLAP entera que comprende los cuadros de mando y la capa de análisis de datos se puede alojar como SaaS. Las plataformas de software marco BI y OLAP disponibles para Cloud hosting son SAP, IBM Cognos y el salpicadero Web-Sphere Dashboards, objetos de negocio de Oracle y Salesforce.com. La integración de los almacenes de datos (basado en XML) y bases de datos OLTP / DSS se pueden alojar en PaaS. Los servidores y bases de datos subyacentes se pueden alojar en el modo de IaaS de Cloud hosting. Para un rendimiento óptimo en la nube, los servidores y matrices de base de datos debe ser aplicado en un sistema paralelo masivo capaz de procesar grandes consultas en paralelo [19].Una base de datos optimizado para trabajar en un entorno de procesamiento masivamente paralelo. Las bases de datos en la nube

deben aplicarse en forma de un sistema paralelo masivo para apoyar alta elasticidad de la demanda del marco de BI y OLAP. Un objeto de esquema centralizado puede estar diseñado para mantener los datos y privilegios de todos los inquilinos en la Nube. Cada objeto de esquema que contiene los archivos de datos puede dividirse masivamente de manera que cada partición puede ser ocupado por un servidor independiente en una matriz de servidores a gran escala. El proveedor de IaaS debe ser capaz de rápida expansión de la que hace uso matriz de servidor de expansión del array virtualizado. De esta manera, puede ser posible para servir a una partición a través de más de un servidor que puede mejorar el rendimiento de BI. El proveedor de IaaS debe mantener una estrecha vigilancia sobre los dos patrones de distribución y tiempo de respuesta de carga y hacer cambios en la red eficaces para garantizar que la carga de la red también se distribuye de manera uniforme [21]. La aplicación OLAP alojado en la nube puede no ser compatible servicios web. Para hacer una aplicación OLAP compatible con la arquitectura de servicios web, el proveedor de SaaS puede permitir la creación de una capa intermedia para albergar un grafo de dependencias que ayuda en la caída de los atributos no se necesitan en el cubo de datos XML finalizado [20] y [21].Por lo tanto, los siguientes son los desafíos clave en la organización de BI en la nube:

•El cumplimiento de la aplicación de BI con los servicios web estándares arquitectónicos (y los estándares definidos por el proveedor de SaaS o PaaS, como las normas de Google Apps).

•Despliegue del sistema de datos de depósito masivamente paralelo con la carga distribuida uniformemente consulta e incluso los patrones de los tiempos de respuesta de todos los servidores de bases de datos. El proveedor de IaaS debe utilizar con eficacia la gestión matriz de servidor virtualizado y expansión para satisfacer los recursos bajo demanda.

•La arquitectura de red debe estar diseñado de tal manera que la carga de consulta puede ser distribuido uniformemente entre los servidores en una matriz. Esto asegurará incluso los tiempos de respuesta de procesamiento de consultas por los servidores en una matriz. Si la matriz de servidor emplea área de almacenamiento en red para almacenar los archivos de datos XML y los cubos OLAP, ir a buscar los datos de varios dispositivos de almacenamiento de nuevo deben ser distribuidos de manera uniforme, en virtud de las conexiones de red apropiados.

En la siguiente sección, se ha creado un modelo de OPNET de un marco de BI y OLAP pequeña escala en el Cloud. La red ha sido diseñado de tal manera que la carga se distribuya de manera uniforme a todos los sistemas de gestión de base de datos relacionales (RDBMS) servidores. Además, las demandas de las aplicaciones se han creado de tal manera que todos los servidores RDBMS están implicados de manera

uniforme en la recepción y el procesamiento de la carga de consulta OLAP. El BI en el modelo de nube se describe en la siguiente sección y los resultados de la simulación se describen en la siguiente sección.

4. BI en el modelo de la nubeEn esta sección se ofrece una breve descripción de la interfaz principal del modelo OPNET. El modelo consta de dos grandes dominios - BI en el dominio de la nube y el dominio Extranet que comprende seis corporaciones que tienen 500 usuarios OLAP en cada uno como se muestra en la Fig. 3. Las nubes se muestran en esta interfaz se crean utilizando la red IP objetos Nube en OPNET. Un objeto de la nube de la red IP se puede ampliar para entrar en otra gama de colores para la realización de modelo detallado que comprende nodos y enlaces.

Fig. 3. La arquitectura del modelo.

Opciones Figura

Las Nubes de aplicación son objetos de la nube de red IP que comprenden matrices de servidores de aplicaciones y bases de datos, conjuntos de servidores conectados a una red de la nube. Los perfiles son necesarios en un modelo OPNET para configurar el comportamiento de las aplicaciones configuradas en la red y aplicar en sistemas de servidor, de forma selectiva, de tal manera que el papel, la carga de tráfico, patrones de tráfico, de inicialización y terminación, e inter-sesión retrasos pueden ser claramente definida. Los perfiles también ayudan en la definición de un patrón de tráfico iniciado por un servidor o un dispositivo cliente final, como - constante, lineal, logarítmica, en serie al azar, en serie ordenada, paralelo (con tiempos superpuestos), concurrente, o exponencial. Si la calidad del servicio se lleva a cabo, los perfiles también ayudan en la definición de prioridades de tráfico.

Experto en BI tendrá en cuenta al hacer el cambio a BI basada en la nube supondrá una implementación masiva de las bases de datos relacionales en la nube alojada servidores. Por lo tanto, los arrays de servidor (tanto la aplicación como bases de datos) se implementan en forma de un sistema de procesamiento paralelo masivo sin objeto físico ligado a ningún hardware específico [31]. Las aplicaciones y bases de datos en las plataformas de cloud computing deben ser Web 2.0. Por lo tanto, todas las

aplicaciones y bases de datos deben soportar los formatos XML y WML. Estos formatos son compatibles con todos los sistemas de bases de datos modernos. Por lo tanto, los datos almacenados en los objetos tradicionales de esquema se pueden exportar a formatos DTD para formar archivos de datos XML. Análisis sintáctico es una forma de filtrado de datos y la formación de una estructura de DTD idéntica a la estructura prevalente en los objetos de esquema. De análisis también ayuda en la migración de las propiedades relacionales en los objetos de esquema en los archivos XML. Dado que los cubos OLAP son "extractos" multi-dimensionales de las tablas de esquema de un almacén de datos, que pueden formarse fácilmente utilizando los archivos XML después de un análisis DTD organizado. Estos archivos XML se pueden consultar más de alimentar datos en varios cuadros de mando, que esencialmente son auto-actualización de dos dimensiones gráficos / tablas / metros.El BI en el dominio de la nube se expande en la Fig. 4. El marco de BI en la nube se ha modelado mediante cuatro números de Cisco 7609 capa 3 series de enrutamiento de gama alta interruptores de conexión de tal manera que la carga se distribuya uniformemente. El interruptor de la nube 4 está dedicado a enrutar todo el tráfico entrante a los servidores y enviar sus respuestas de nuevo a los clientes. La nube interruptores 1 y 3 están cumpliendo cuatro servidores RDBMS cada uno y la Nube interruptor 2 está sirviendo a todos los servidores de aplicaciones OLAP. Una serie de cinco números de los servidores de aplicaciones OLAP y una serie de ocho números de servidores RDBMS. Las líneas de puntos azules indican la distribución del flujo de tráfico configurado entre los servidores de aplicaciones OLAP y los servidores RDBMS. Las demandas de los servidores RDBMS se distribuyen por igual a invocar un procesamiento paralelo masivo como el medio ambiente.

Fig. 4. El BI en la arquitectura Cloud.

Opciones Figura

Las líneas de puntos azules de cada servidor OLAP se dibujan a todos los servidores RDBMS que indican que cada servidor OLAP utilizará los servicios de todos los servidores RDBMS disponibles en la matriz para procesar una consulta de base de datos. La carga del cliente se envía a los servidores de aplicaciones OLAP utilizando la configuración de preferencias de destino en los objetos cliente configurados en el dominio Extranet, como se muestra en la figura. 5.

Fig. 5. El dominio Extranet comprende seis corporaciones que tienen 500 usuarios OLAP en cada empresa.

Opciones Figura

La Extranet consta de tres interruptores de puerta de enlace de ISP que sirven seis segmentos LAN corporativas que tienen 500 usuarios cada una. Un total de 3000 usuarios concurrentes OLAP se han modelado en la red. En Nubes reales este número podría ser mucho mayor (cientos de miles). La idea clave es analizar cómo los servidores de bases de datos están procesando la carga paralela aplicada por la aplicación OLAP. Cada objeto LAN tiene los cuatro servidores OLAP configurados como preferencias de destino para el perfil de aplicación OLAP. De esta forma, las peticiones de los clientes OLAP se enrutan a los cuatro servidores OLAP y las solicitudes de RDBMS se enrutan de los cuatro servidores OLAP a los ocho servidores RDBMS (que sirven como una pequeña matriz de servidores de escala en este modelo).

Consultas OLAP son 10-12 veces más pesado que las consultas de bases de datos normales. Esto se debe a que cada consulta extrae datos multidimensionales de varios esquemas. Por lo tanto, la carga de consulta en las transacciones OLAP es muy alta.Teniendo en cuenta que el servicio de OLAP en una nube puede ser utilizada por cientos de miles de usuarios, las bases de datos de back-end necesitan ser repartido masivamente con el procesamiento paralelo de las particiones para manejar la carga de consultas OLAP. Este hecho se ha demostrado en los resultados de la simulación. Un objeto de esquema centralizado debe mantenerse con todos los detalles de los inquilinos, como - la

identificación, los usuarios por el inquilino, identificadores de usuario, contraseñas, secretos pre-compartida, privilegios de acceso, las asignaciones de nivel de servicio y los detalles de esquema inquilino [31].Las consultas OLAP se han configurado con los siguientes atributos:

•Mezcla de transacción comprende 100% de las consultas de sólo lectura porque todas las tablas de data warehouse son.

•Transacción tiempo entre llegadas es de 1 s que indican una carga pesada consulta.

•Cada transacción transfiere 10.240 bytes, que es 10 veces más que el tamaño predeterminado en OPNET. Esto se debe a una consulta OLAP es al menos 10 veces más pesado que consulta la base de datos normal.

Las consultas RDBMS se configuran mediante los atributos que se muestran en la Tabla1. Las configuraciones por defecto de carga de base de datos de pesada de OPNET ha sido elegido y luego aumentó en 10 veces en la Tabla 2. Esto se basa en la revisión de la literatura que OLAP carga de consulta de bases de datos está en menos 10 veces más pesado que la carga normal de consulta. Además, el tiempo entre llegadas de consulta se ha fijado en un segundo, y el tipo de servicio se ha fijado en "excelente servicio". Por último, la mezcla de transacción de consultas frente a las transacciones totales se ha fijado en 100%. Esto es porque el BI y el marco de OLAP no tiene la carga de entrada de datos ya que el marco se utiliza para el soporte de decisiones estratégicas.

Mesa 1.Los ajustes de consulta de base de datos para emular la carga de consultas OLAP en las bases de datos.

Tabla 2.El perfilado de aplicaciones OLAP.

La aplicación OLAP se ha configurado como una aplicación HTTP navegación pesada que tiene que varía de 5120 bytes a 10.240 bytes de descargas de objetos por segundo (continuamente cuadros de mando de actualización), de 7 a 10 objetos por interfaz (cuadros de mando, sus pantallas descripción, leyendas, cuadros de texto, y así sucesivamente), una segunda vez objeto de actualización (debido a que el tiempo de transacción entre llegadas en las bases de datos es de un segundo) y 10-segunda página de tiempo de refresco (asegurándose de que la pantalla OLAP se actualiza después de cada 10 de cubo se actualiza de tal manera que el usuario obtiene notable cambios de datos en cada actualización de la pantalla).

La Tabla 2 muestra el perfil de aplicación de aplicación OLAP (peticiones OLAP) y los servicios RDBMS. Tanto los perfiles disparan simultáneamente con un desplazamiento de 5 a 10 s después de la hora de inicio. La hora de inicio se ha configurado a 50-55 s para asegurarse de que todas las actualizaciones de enrutamiento se completen con éxito en la red antes de que se activan los servicios de aplicación.

5. Los resultados de investigación y análisisEn esta investigación, los resultados que se muestran aquí son los capturados de una simulación de 50 millones de eventos que es el máximo posible en la edición académica OPNET. La carga de consultas no es exactamente el mismo en los servidores RDBMS pero el patrón indica casi una distribución uniforme de la carga de la consulta. Esto es evidente en las "solicitudes de consulta de bases de datos por segundo" estadísticas recopiladas en los ocho servidores RDBMS apilados uno encima de otro como se muestra en la figura. 6.

Fig. 6. Carga de consultas en los servidores RDBMS.

Opciones Figura

Las solicitudes de consulta experimentados por cada servidor se representan en forma de "número de consultas por segundo" en la Y eje x con respecto al tiempo de simulación en el X eje y. En la Fig. 6, esta estadística se reporta para el servidor RDBMS del 1 al 8 de servidor en la nube. Esto ha sido posible en OPNET debido a la aplicación de las configuraciones de la demanda de cada servidor OLAP a todos los servidores RDBMS.Sin embargo, esto no será tan sencillo en una verdadera nube de BI como aparece aquí.Tal distribución paralela de carga de consulta se conseguirá mediante la implementación de los motores de enrutamiento apropiados. Además, la carga de consulta de cada servidor OLAP será diferente y por lo tanto, el motor de enrutamiento debe ser un dispositivo inteligente que puede detectar la carga de todos los servidores OLAP e igualmente distribuirlos entre los servidores de RDBMS. Si una matriz de servidores RDBMS se carga de manera óptima, el motor de enrutamiento debe garantizar extienda de la carga a matrices adicionales conectados a la nube. Puede ser posible que los arreglos adicionales son recibidos por otros proveedores de IaaS.

La carga de consultas está ligeramente por encima o por debajo de 40 solicitudes por segundo en todos los servidores RDBMS. Esto revela que la distribución de la carga a través de la configuración de red adecuada y la aplicación de perfiles de demanda (configuraciones de flujo de tráfico indicados por líneas de puntos azules en la Fig. 4).Estas configuraciones han causado cerca de una distribución uniforme de la carga de consulta de los cuatro servidores OLAP en los servidores RDBMS. Además, los tiempos de procesamiento de la tarea de consulta en los servidores de bases de datos son también casi incluso como se muestra en la figura. 7.

Esto ha sido posible debido a que el mismo hardware marca, modelo y configuraciones han sido elegidos por todos los ocho servidores RDBMS. El tiempo de respuesta de la consulta por cada servidor se representa en forma de "número de consultas procesadas por segundo" en la Y eje x con respecto al tiempo de simulación en el X eje y. En la Fig. 7, esta estadística se reporta para el servidor RDBMS del 1 al 8 de servidor en la nube.

Fig. 7. Consulta el tiempo de procesamiento de tareas por los servidores RDBMS.

Opciones Figura

Estos resultados son una buena demostración de cómo un sistema RDBMS masivamente paralelo puede ser desplegado para formar un marco de BI y OLAP, y cómo el marco debe realizar en el entorno Cloud. Esto está en consonancia con los requisitos establecidos por los investigadores como revisado en el estudio de la literatura. Sin embargo, hay algunos puntos clave que se deben tener en cuenta acerca de este modelo que se enumeran a continuación:

En primer lugar, el modelo tiene sólo ocho servidores de la matriz RDBMS que sirven sólo cuatro números de servidores de aplicaciones OLAP.

En segundo lugar, la distribución de la carga se ha gestionado de manera uniforme a través de modelos de flujo de demanda de aplicaciones que es una excelente característica de OPNET y funciona muy bien.

En tercer lugar, los servidores seleccionados en este modelo son de la misma marca y modelo que tiene la configuración de hardware idéntico.

En cuarto lugar, la carga se ha modelado como constante después de un aumento exponencial en la salida. La simulación de la carga llevada a cabo en este modelo ha durado sólo para 50 millones de eventos sin variaciones de carga.

Por último, este modelo cuenta con sólo 3.000 usuarios OLAP de conexión al mismo tiempo. Un entorno de BI real sobre computación en nube tendrá decenas de miles de usuarios finales que solicitan la carga BI concurrente en los servidores.

Estos son escenarios ideales que no será posible en las nubes reales. Sin embargo, estos ajustes en OPNET han convertido en retos que se enfrentan en el movimiento de BI a la nube según los requisitos establecidos por los investigadores. Una nube tendrá cientos de servidores en las matrices; por lo tanto, una distribución uniforme de carga de la red será una tarea muy difícil.

Los arquitectos tendrán que mirar para los cuellos de botella en las conexiones entre switches, incluso si se implementan mediante las conexiones ATM posibles de más rápido o el gigabit Ethernet 10G. La distribución de la carga tendrá que ser gestionado por los motores y los routers de aprovisionamiento avanzadas, que no será tan fácil como la configuración de los patrones de flujo de la demanda de aplicaciones en OPNET según lo indicado por las líneas de puntos azules en la figura. 4. Estos motores de aprovisionamiento y routers necesitan ser optimizados para asegurar que la carga del usuario se distribuye uniformemente entre los servidores de la matriz y se extendió a matrices adicionales si hay un escenario de sobrecarga. La partición de bases de datos en los almacenes de datos se debe lograr de una manera tal que las matrices se pueden expandir con rapidez y nuevos servidores pueden empezar a contribuir recursos al servicio de las particiones sin llevar a cabo los cambios estructurales de las bases de datos. En algún momento, debería ser posible implementar tanto los almacenes de datos y cubos OLAP que emplean los archivos de datos XML, eliminando por completo la necesidad de sistemas de software RDBMS tradicionales en el marco de BI y OLAP.En cuanto al hardware, puede que no sea posible que el proveedor de IaaS de implementar una nube con hardware idéntico marca, modelo y configuraciones. Por lo tanto, el tiempo de respuesta de procesamiento de consultas de cada servidor será diferente en la nube debido a diferencias en las configuraciones de hardware. Por lo tanto, una mera distribución uniforme de la carga a los servidores por el motor de aprovisionamiento de servicios y el router no sirva al propósito. Debe haber algo de inteligencia para dirigir la carga basado en el conocimiento de los tiempos de respuesta de procesamiento de consultas de los servidores. Los servidores con tiempos de respuesta más lentos deben recibir menos carga en comparación con los servidores con tiempos de respuesta más rápidos para eliminar estados de espera en el extremo receptor. Las capacidades de particionamiento RDBMS, balanceo de carga RDBMS, servicios de aplicaciones aprovisionamiento web, motores de enrutamiento de servicios y consulta de optimización de rendimiento deben ser explotados de manera efectiva por los arquitectos de BI. Esto es para asegurar que el sistema de procesamiento masivamente paralelo de matrices de servidor de base de datos funciona perfectamente para utilizar eficazmente la potencia de procesamiento de los servidores y

sincronizar los tiempos de procesamiento de consultas para reducir o eliminar los estados de espera al final de los servidores de aplicaciones.

La discusión anterior presenta un reto más en la adopción de BI a las Nubes. Los proveedores de SaaS, PaaS y IaaS pueden ser diferentes empresas. Por lo tanto, para garantizar los requisitos anteriores de BI de alojamiento en las nubes, estos proveedores necesitan para llevar a cabo una excelente coordinación de los detalles arquitectónicos para el diseño y la implementación de los servicios para permitir que las diversas capas del marco de BI y OLAP. BI no se puede implementar de una manera ad-hoc por los proveedores de lo contrario sufrirá el mismo nivel de los cuellos de botella y las crisis de recursos, ya que ha estado sufriendo en entornos auto-organizada. Los proveedores necesitan para llevar a cabo una planificación eficaz de todos los detalles y poner en práctica los componentes de infraestructura, componentes de la plataforma y los componentes de la aplicación para lograr un verdadero sistema de procesamiento masivamente paralelo con un marco de aumento de la capacidad de alta elasticidad utilizando todas las tecnologías disponibles de manera eficiente.

6. Conclusiones y direcciones futurasCloud es una parte importante del futuro de BI y ofrece varias ventajas en términos de eficiencia de costes, flexibilidad y escalabilidad de la aplicación, la confiabilidad y capacidades mejoradas de intercambio de datos. Nube tiene el potencial de ofrecer una nueva oportunidad de vida al marco de BI y OLAP. La computación en nube se compone de tres modos de aprovisionamiento de servicios - software-as-a-service (SaaS), plataforma como servicio (PaaS) e infraestructura-como-un-servicio (IaaS). Estos servicios pueden ser prestados por la misma o de diferentes proveedores, dependiendo de los acuerdos comerciales. Sin embargo, el proveedor de SaaS necesita la configuración de la PaaS y IaaS Nubes que se definan de acuerdo con los servicios de aplicaciones proporcionadas a través de los componentes de la arquitectura de servicios web. Nubes comprenden los de aprovisionamiento y de enrutamiento motores de servicios que pueden detectar con eficacia el patrón de carga en los recursos subyacentes.

Marco de BI y OLAP es muy intensivo en recursos. Tiene una arquitectura multicapa que comprende cubos OLAP multidimensionales con matrices multiplexados que representan las relaciones entre las diferentes variables de negocio. Los cubos se forman mediante el envío de consultas OLAP a los almacenes de datos almacenados en los servidores RDBMS. El tamaño de una consulta OLAP es típicamente 10-12 veces más grande que una consulta de base de datos común. Por lo tanto, si se toma marco de BI y OLAP a la nube para servir a cientos y miles de usuarios finales, es esencial que los proveedores de la nube implementar sistemas de procesamiento de RDBMS masivamente paralelas con una distribución uniforme de la carga de consulta y los tiempos de respuesta de consultas para los servidores de aplicaciones OLAP. En esta investigación, un marco de BI y OLAP se ha modelado utilizando OPNET y los requisitos de una matriz de servidor RDBMS masivamente paralelo se ha modelado

usando las características OPNET. Los resultados han reflejado el escenario ideal para la toma de BI a la nube. Sin embargo, las nubes reales no tendrán configuraciones ideales como hecho en este modelo OPNET. Por lo tanto, los desafíos reales en la nube deben ser identificados y dirigida a garantizar que los resultados se pueden acercar a los escenarios ideales en la medida de lo posible.

Se han discutido los detalles de desafíos en la implementación de un sistema de servidor de procesamiento masivamente paralelo RDBMS para tomar BI a la nube. Muchos ajustes que son posibles en el entorno de simulación OPNET pueden requerir innovaciones arquitectónicas significativas para lograr lo que se ha descrito en este documento para tomar con éxito de BI a las Nubes.

En el futuro, los investigadores pueden gustaría estudiar tecnologías modernas relativas a la prestación de servicios, enrutamiento de servicios, la partición de esquema, balanceo de carga, y así sucesivamente para poner en práctica un sistema RDBMS nivel de la empresa para lograr un sistema de servidor de procesamiento RDBMS masivamente paralelo para la toma de BI a las Nubes . En este contexto, hay una gran oportunidad para llevar a cabo múltiples estudios experimentales para evolucionar las soluciones de configuración prácticos útiles para los proveedores de servicios cloud destinados a albergar marco BI y OLAP en la Nube.

La computación en nube también ofrece potencia de cálculo considerable y capacidad.Por lo tanto, se espera que BI para entrar en muchos dominios complejos (empresariales y no empresariales relacionados) que eran imposible que en un entorno alojado en sí mismo. Aplicaciones como, automatización sensible al contexto reconoce la ubicación, la semántica masivas escala, bases de datos de ciencia y tecnología avanzada, el desastre en tiempo real y gestión de crisis, gestión de la ciudad, las finanzas globales y reporte economía y la vigilancia mundial de las industrias y sectores son pocas áreas donde BI o BI como sistemas poseen un enorme potencial de la computación en la nube. El tamaño, la escala, el dinamismo y alcance de mercados de datos y almacenes de datos en las nubes pueden superar incluso la escala de petabytes (el desafío emergente de Big Data). Tales sistemas de datos no se pueden gestionar mediante sistemas y herramientas tradicionales. Los desafíos de seguridad en tales escalas masivas será diferente y mucho más compleja. Por lo tanto, esta investigación tiene aberturas significativas para las contribuciones futuras. Este concepto es una especie de principio de crear un escenario para los estudios sobre este tipo de desafíos futuros.

AgradecimientosEl trabajo presentado en este trabajo ha sido apoyado por la Asociación de Investigación de Educación Superior entre China y Reino Unido para Estudios de doctorado, Fundación de Ciencias Naturales de la provincia de Jiangsu de China (BK20130528), RLTF Social P2P Programa (RLTFD015), Visitante Programa Becario de Investigación de la Universidad de Tongji ( 8,105,142,504), la Fundación Nacional de

Ciencias Naturales de ChinaPrograma (61202 mil cuatrocientas setenta y cuatro y 61272 mil setenta y cuatro) y de China 973 Fundamental I + D Programa (2011CB302600).

Nube BI

Documents

Transcript of Nube BI