Salesforce Predictive Modelling - Cajamar Data Lab

10
Salesforce Predictive Modelling Equipo WorkingData

Transcript of Salesforce Predictive Modelling - Cajamar Data Lab

Page 1: Salesforce Predictive Modelling - Cajamar Data Lab

Salesforce Predictive Modelling Equipo WorkingData

Page 2: Salesforce Predictive Modelling - Cajamar Data Lab

¿Quiénes somos?

2 #UniversityHack

WorkingData

DAVID JIMÉNEZ PAREDES

RAÚL LÓPEZ JIMÉNEZ FRANCISCO JAVIER VÍLCHEZ TORRALBA

Page 3: Salesforce Predictive Modelling - Cajamar Data Lab

¿Por dónde empezar?

3

#UniversityHack

WorkingData R

ET

OS

R1

R2

R3

Desconocimiento teórico en el ámbito asociado al reto

Conjunto de datos con una elevada dimensionalidad

Contexto de las variables desconocido

Page 4: Salesforce Predictive Modelling - Cajamar Data Lab

Distribución del poder adquisitivo

4 #UniversityHack

WorkingData

Clase B

aja C

lase Alta

Page 5: Salesforce Predictive Modelling - Cajamar Data Lab

5 #UniversityHack

WorkingData

¿Afecta la tenencia de productos? C

LASE

ALT

A

CLA

SE B

AJA

Misma distribución de tenencia de productos en ambas clases económicas

SE PUEDEN ELIMINAR, REDUCCIÓN DE

DIMENSIONALIDAD

Page 6: Salesforce Predictive Modelling - Cajamar Data Lab

Trabajando con clase “Baja”

6 #UniversityHack

WorkingData

¿QUÉ SON ESOS PICOS?

¿VARIAS POBLACIONES JUNTAS EN EL DATASET?

¿TIENEN ALGO EN COMÚN?

Page 7: Salesforce Predictive Modelling - Cajamar Data Lab

Regresión lineal Lasso Modelos

8 #UniversityHack

WorkingData

Light GBM, Gradient Boosting Regression, XGBoost...

Modelos de apilamiento/Stacking Models

Page 8: Salesforce Predictive Modelling - Cajamar Data Lab

Evaluación del modelo

9 #UniversityHack

WorkingData

Medida de evaluación Root Mean Squared Logarithmic Error (RMSLE) Validación Cruzada K_fold = 5 Tuning parámetros por cada modelo

Mejor modelo Modelo de apilamiento

RMSLE(Train) = 0.2579

Page 9: Salesforce Predictive Modelling - Cajamar Data Lab

Herramientas Utilizadas

10 #UniversityHack

WorkingData

Page 10: Salesforce Predictive Modelling - Cajamar Data Lab