Ecosistema actual de bi y data mining

1

Click here to load reader

Transcript of Ecosistema actual de bi y data mining

Page 1: Ecosistema actual de bi y data mining

Visualización de datos Data Mining Visual Data MiningExplorando lo evidente Descubriendo lo oculto

Foco

Características técnicas

Autonomía del usuario

Tipo de usuario

Especialidad

Ámbito departamental. Reporting y dashboarding flexible y visual.

Envío de informes a usuarios finales en un entorno de reporting y dashboarding predefinido y visual.

Usuarios ocasionales y usuarios de negocio.

Escasa. Dependencia del departamento de TI para crear gráficos o informes o para añadir nuevos datos.

Modelo de datos predefinido. Tecnología OLAP o in-memory. Se requiere nivel medio-alto de hardware.

ExploraciónTécnicas: profundidad, cubos, fracciones, agregados, desgloses, etc. La exploración depende de filtros, medidas y dimensiones predefinidas.

Instalación Semanas-meses. Un nuevo informe lleva horas-días.

Ejemplos

Visualización de ventas por región Margen por producto Coste por canal Beneficio mensual/semestral/anual Seguimiento de KPIs, objetivos y logros

No ofrece técnicas de analítica avanzada. Ingeniería y enriquecimiento de datos limitados.

Analítica & Ingeniería

Distribución masiva de informes y dashboards

basados en un modelo de datos predefinido

Análisis de datos en crudo para obtener insights de negocio de inmediato

a través de técnicas de Data Mining rápidas e intuitivas

Rigurosos modelos predictivos para temas core de negocio, desarrollados por

expertos matemáticos y/o estadísticos

Despliegue departamental con enfoque corporativo. Modelos predictivos. Anticipación a oportunidades de negocio.

Análisis dinámico de grandes volúmenes de datos para obtener insights. Técnicas de Data Mining rápidas, intuitivas y usables.

Analistas, power users y usuarios de negocio.

Ninguna dependencia de TI o de mineros de datos. Autonomía del usuario para descubrir e interpretar insights libremente.

No se necesitan cubos ni OLAP. Tecnología column-based e in-memory. Datos ilimitados. Bajo TOC. Requiere poco hardware.

Técnicas: profundidad, cubos, fracciones, agregados, desgloses, etc. No está limitado a OLAP, ni a medidas ni a dimensiones.

Venn, Pareto, tablas pivotadas, clustering, profile, Árbol de Decisión, forecasting,... e ingeniería de datos (agregados, expresiones, decodificaciones, percentiles, rangos numéricos...)

Días-semanas. Los usuarios pueden realizar análisis al momento.

Predicción del abandono de los clientes: ¿Por qué nos están abandonando? ¿Quién nos abandonará en el futuro?

Mejor producto a recomendar a cada cliente Detección de oportunidades de venta cruzada y dirigida ¿Cuál será el comportamiento del cliente? ¿Cómo responderá el cliente a cada campaña?

Despliegue corporativo y departamental. Modelos core de negocio y scorings o estimaciones.

Rigor en modelos estadísticos para temas clave (fraude, riesgos, predicciones…), desarrollados por mineros de datos.

Matemáticos y estadísticos.

Dependencia total del equipo de data miners.

Se requiere hardware potente.

Muchos algoritmos dirigidos a expertos en Data Mining. Ingeniería de datos basada en programación para expertos.

Patrones de blanqueo de capital Estimación del riesgo Límite de riesgo por cliente Predicción del fraude

Modelos predictivos desarrollados por expertos

Meses. Un modelo nuevo lleva días-semanas.

Informes y dashboards flexibles.Resultado Insights al instante y analítica avanzada para datos ilimitados. Rigurosos modelos estadísticos y predictivos.

Lenguaje de programación no visual.