Maching learning vs SSAS Data mining

33
#SQSummit Maching Learning vs SSAS Data Mining Daniel Gil - DPS ([email protected]) Pau Sempere – DPA ([email protected])

Transcript of Maching learning vs SSAS Data mining

Page 1: Maching learning vs SSAS Data mining

#SQSummit

Maching Learning vs SSAS Data Mining

Daniel Gil - DPS ([email protected])

Pau Sempere – DPA ([email protected])

Page 2: Maching learning vs SSAS Data mining

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Page 3: Maching learning vs SSAS Data mining

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Page 4: Maching learning vs SSAS Data mining

Introducción

SSAS Data Mining• On premises• Integrado en SSAS • 9 algoritmos disponibles• DMX

Page 5: Maching learning vs SSAS Data mining

Introducción

Azure Machine Learning• Cloud• Múltiples orígenes, todos desde nube• Transformaciones específicas• 25+ algoritmos disponibles• Integra Python y R• Servicios web

Page 6: Maching learning vs SSAS Data mining

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Page 7: Maching learning vs SSAS Data mining

¡Enfrentando las herramientas!

Page 8: Maching learning vs SSAS Data mining

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Page 9: Maching learning vs SSAS Data mining

Diferencias - Orígenes

Azure ML • Hive• SQL Database• Blob Storage• Table Storage• Odata• HTTP

SSAS Data Mining• Bases de datos• Cubos SSAS

Page 10: Maching learning vs SSAS Data mining

Diferencias - Dimensionamiento

Azure ML • 10 GB en total• Hay módulos que

aceptan menos• Recomendadores• SMOTE• Scripts (R, Python, SQL)• Cross-validation, Tune

Model Hyperparameters

SSAS Data Mining• Dependiente del

hardware

Page 11: Maching learning vs SSAS Data mining

Diferencias - Tiempos

Azure ML • 1 hora en versión free

• 7 días de ejecución• 24 horas por módulo

SSAS Data Mining• Ilimitado

Page 12: Maching learning vs SSAS Data mining

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Page 13: Maching learning vs SSAS Data mining

Market Basket Analysis

¿Qué compran nuestros usuarios?

¿Cómo lo compran? ¿Siguen un patrón?

Page 14: Maching learning vs SSAS Data mining

Market Basket Analysis

Usuario Producto Cantidad

Dani Disfraz 1

Pau Disfraz 1

Dani Capa 1

Pau Cables 2

Pau Switch 1

Pau Capa 1

Usuario Edad Sueldo

Daniel 25 Poco

Pau 29 Menos aun

Page 15: Maching learning vs SSAS Data mining

Market Basket Analysis

Usuario Edad Sueldo Producto Cantidad

Daniel 25 Poco Disfraz 1

Capa 1

Pau 29 Menos aun Disfraz 1

Capa 1

Cables 2

Switch 1

Page 16: Maching learning vs SSAS Data mining

Market Basket Analysis

• Association rules / Árboles de decisión• Podemos añadir clustering para identificar

patrones de compra

Page 17: Maching learning vs SSAS Data mining

DemoMarket Basket Analysis con SSAS

Page 18: Maching learning vs SSAS Data mining

Market Basket Analysis

• No hay un algoritmo específico• Preprocesado del dato para darle otra forma

Matriz de productos / Usuarios

Dani Pau

Disfraz 1 1

Capa 1 1

Cable 0 1

Switch 0 1

Page 19: Maching learning vs SSAS Data mining

DemoMarket Basket Analysis con Azure ML

Page 20: Maching learning vs SSAS Data mining

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Page 21: Maching learning vs SSAS Data mining

Clasificación

• Predicción de categorías• Muerto / vivo• Solvente / deudor• Comprador / no comprador• …

Page 22: Maching learning vs SSAS Data mining

Clasificación

Page 23: Maching learning vs SSAS Data mining

Clasificación

• Varios algoritmos: • Árboles de decision

• Múltiples modos de ejecución• Regresión logística• Red neural• Clustering

• Análisis de precisión• Lift chart• Profit chart• Red de dependencias

Page 24: Maching learning vs SSAS Data mining

Clasificación

• Múltiples algoritmos• Boosted decision tree• Red neural• Regresión logística• Máquina bayesiana• …

• Análisis de precisión• ROC• Lift chart• Puntuaciones ponderadas

Page 25: Maching learning vs SSAS Data mining

DemoClasificación binaria

Page 26: Maching learning vs SSAS Data mining

Contenido de la sesión

• Introducción• Enfrentando las herramientas

• Limitaciones y diferencias• Market Basket Analysis• Clasificación• Series temporales

Page 27: Maching learning vs SSAS Data mining

Series temporales

• Datos sobre un eje temporal / numérico• Cumplen patrones cíclicos

Page 28: Maching learning vs SSAS Data mining

Series temporales

• Dos algoritmos nativos• ARTXP• ARIMA

• Comprar contra casos conocidos (training-test) • Visualmente• Métricas de error

Page 29: Maching learning vs SSAS Data mining

Series temporales

• No hay un algoritmo nativo• Pero siempre está …

• ARIMA• ETS• Otros

• Mismo método para estimar la precision que en SSAS

Page 30: Maching learning vs SSAS Data mining

DemoSeries temporales

Page 31: Maching learning vs SSAS Data mining

Conclusiones

Azure ML • Fuentes Azure• Variedad de algoritmos• R! Python!• 100 % Online• Todo en 1

SSAS Data Mining• On premises• Sin limite de datos y

tiempos• Menos algoritmos nativos• Necesidad de

herramientascomplementarias

Page 32: Maching learning vs SSAS Data mining

¿PREGUNTAS?

Page 33: Maching learning vs SSAS Data mining

También puedes preguntar tus dudas con el hashtag #SQSummit en Twitter

ADAPTIVE BI FRAMEWORKTe ayudaremos a mejorar la velocidad de desarrollo de tu plataforma de analítica de negocio basada en nuestra experiencia:•Diseña antes de construir•Automatización de procesos por ETL•Servicios de mentoring para ayudarte a conseguir mejores prácticas para la construcción de procesos específicos y plataformas de analítica de negocio

•Muy fácil de mantener

SOLIDQ FLEX SERVICESCon SolidQ Flex Services evitarás sustos, consiguiendo que tus sistemas sean estables. Desde una solución sencilla de monitorización, hasta un servicio de atención de incidencias 24/7, mantenimiento proactivo, resolución de problemas y línea de soporte. Todo con un coste fijo mensual… y tú dedica el tiempo a las cosas importantes.

¡Gracias!