Maching learning vs SSAS Data mining

Post on 14-Apr-2017

391 views 11 download

Transcript of Maching learning vs SSAS Data mining

#SQSummit

Maching Learning vs SSAS Data Mining

Daniel Gil - DPS (dgil@solidq.com)

Pau Sempere – DPA (psempere@solidq.com)

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Introducción

SSAS Data Mining• On premises• Integrado en SSAS • 9 algoritmos disponibles• DMX

Introducción

Azure Machine Learning• Cloud• Múltiples orígenes, todos desde nube• Transformaciones específicas• 25+ algoritmos disponibles• Integra Python y R• Servicios web

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

¡Enfrentando las herramientas!

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Diferencias - Orígenes

Azure ML • Hive• SQL Database• Blob Storage• Table Storage• Odata• HTTP

SSAS Data Mining• Bases de datos• Cubos SSAS

Diferencias - Dimensionamiento

Azure ML • 10 GB en total• Hay módulos que

aceptan menos• Recomendadores• SMOTE• Scripts (R, Python, SQL)• Cross-validation, Tune

Model Hyperparameters

SSAS Data Mining• Dependiente del

hardware

Diferencias - Tiempos

Azure ML • 1 hora en versión free

• 7 días de ejecución• 24 horas por módulo

SSAS Data Mining• Ilimitado

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Market Basket Analysis

¿Qué compran nuestros usuarios?

¿Cómo lo compran? ¿Siguen un patrón?

Market Basket Analysis

Usuario Producto Cantidad

Dani Disfraz 1

Pau Disfraz 1

Dani Capa 1

Pau Cables 2

Pau Switch 1

Pau Capa 1

Usuario Edad Sueldo

Daniel 25 Poco

Pau 29 Menos aun

Market Basket Analysis

Usuario Edad Sueldo Producto Cantidad

Daniel 25 Poco Disfraz 1

Capa 1

Pau 29 Menos aun Disfraz 1

Capa 1

Cables 2

Switch 1

Market Basket Analysis

• Association rules / Árboles de decisión• Podemos añadir clustering para identificar

patrones de compra

DemoMarket Basket Analysis con SSAS

Market Basket Analysis

• No hay un algoritmo específico• Preprocesado del dato para darle otra forma

Matriz de productos / Usuarios

Dani Pau

Disfraz 1 1

Capa 1 1

Cable 0 1

Switch 0 1

DemoMarket Basket Analysis con Azure ML

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Clasificación

• Predicción de categorías• Muerto / vivo• Solvente / deudor• Comprador / no comprador• …

Clasificación

Clasificación

• Varios algoritmos: • Árboles de decision

• Múltiples modos de ejecución• Regresión logística• Red neural• Clustering

• Análisis de precisión• Lift chart• Profit chart• Red de dependencias

Clasificación

• Múltiples algoritmos• Boosted decision tree• Red neural• Regresión logística• Máquina bayesiana• …

• Análisis de precisión• ROC• Lift chart• Puntuaciones ponderadas

DemoClasificación binaria

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Series temporales

• Datos sobre un eje temporal / numérico• Cumplen patrones cíclicos

Series temporales

• Dos algoritmos nativos• ARTXP• ARIMA

• Comprar contra casos conocidos (training-test) • Visualmente• Métricas de error

Series temporales

• No hay un algoritmo nativo• Pero siempre está …

• ARIMA• ETS• Otros

• Mismo método para estimar la precision que en SSAS

DemoSeries temporales

Conclusiones

Azure ML • Fuentes Azure• Variedad de algoritmos• R! Python!• 100 % Online• Todo en 1

SSAS Data Mining• On premises• Sin limite de datos y

tiempos• Menos algoritmos nativos• Necesidad de

herramientascomplementarias

¿PREGUNTAS?

También puedes preguntar tus dudas con el hashtag #SQSummit en Twitter

ADAPTIVE BI FRAMEWORKTe ayudaremos a mejorar la velocidad de desarrollo de tu plataforma de analítica de negocio basada en nuestra experiencia:•Diseña antes de construir•Automatización de procesos por ETL•Servicios de mentoring para ayudarte a conseguir mejores prácticas para la construcción de procesos específicos y plataformas de analítica de negocio

•Muy fácil de mantener

SOLIDQ FLEX SERVICESCon SolidQ Flex Services evitarás sustos, consiguiendo que tus sistemas sean estables. Desde una solución sencilla de monitorización, hasta un servicio de atención de incidencias 24/7, mantenimiento proactivo, resolución de problemas y línea de soporte. Todo con un coste fijo mensual… y tú dedica el tiempo a las cosas importantes.

¡Gracias!