Predecir el comportamiento del cliente con la lealtad de … · 2020. 10. 7. · Una nueva...

30
Resumen Objetivo: identificar un nuevo modelo de predicción del comportamiento del cliente basado en nuevas variables que puedan ser utilizadas por la dirección de marketing y adaptadas a su planificación empresarial. Metodología: se ha utilizado un nuevo modelo, con la definición de nuevos sistemas de cálculo de las variables tradicionales R, recencia, F, frecuencia y M, valor monetario, (RFM), relacionadas con los periodos de negocio. Además, la activación en cada periodo P se convierte en una variable clave para construir las cohortes de compra de los clientes e identificar su potencial. Una nueva variable, lealtad de activación, se reconoce como un buen indicador de la probabilidad de futuras compras de los clientes. El modelo construye una ponderación mediante un análisis de regresión múltiple obteniendo β para cada varia- ble, incluyendo los periodos de activación, presentando el efecto relativo de las variables y la mejor explicación global del modelo. Resultados: este nuevo modelo, RFMAP, que incluye periodos de activación y lealtad de activación, presenta una mayor precisión de la predicción y mejoras sobre los modelos tra- dicionales con un claro impacto, líneas de segmentación útiles y manejables y priorización para la gestión de marketing en sistemas CRM. Limitaciones: la principal limitación de este modelo consiste en que se basa en datos de una sola empresa, y debe mostrar el valor en otros sectores y dar una visión completa a través de su aplicación transversal. Implicaciones prácticas: las ventajas indicadas demostraron una mejor predictibilidad y utilidad para los tomadores de decisiones, no solo para determinar los mejores clientes, sino también con los inactivos. Ofrece una explicación significativa de las diferencias en el comportamiento del cliente, que están presentes en los datos y se reflejan en el modelo. Esic Market Economics and Business Journal Vol. 51, n.º 3, septiembre-diciembre 2020, 639-667 Predecir el comportamiento del cliente con la lealtad de activación por periodo. Del RFM al RFMAP Josep Alet Vilaginés * EAE Business School * Autor de correspondencia. e-mail: [email protected] ISSN 0212-1867 / e-ISSN 1989-3574 © ESIC Editorial, ESIC Business & Marketing School DOI: 10.7200/esicm.167.0513.4 http://www.esic.edu/esicmarket Recibido: 05-05-2020; aceptado: 18-09-2020; publicado: 05-10-2020

Transcript of Predecir el comportamiento del cliente con la lealtad de … · 2020. 10. 7. · Una nueva...

  • Resumen

    Objetivo: identificar un nuevo modelo de predicción del comportamiento del cliente basado en nuevas variables que puedan ser utilizadas por la dirección de marketing y adaptadas a su planificación empresarial.Metodología: se ha utilizado un nuevo modelo, con la definición de nuevos sistemas de cálculo de las variables tradicionales R, recencia, F, frecuencia y M, valor monetario, (RFM), relacionadas con los periodos de negocio. Además, la activación en cada periodo P se convierte en una variable clave para construir las cohortes de compra de los clientes e identificar su potencial. Una nueva variable, lealtad de activación, se reconoce como un buen indicador de la probabilidad de futuras compras de los clientes. El modelo construye una ponderación mediante un análisis de regresión múltiple obteniendo β para cada varia-ble, incluyendo los periodos de activación, presentando el efecto relativo de las variables y la mejor explicación global del modelo.Resultados: este nuevo modelo, RFMAP, que incluye periodos de activación y lealtad de activación, presenta una mayor precisión de la predicción y mejoras sobre los modelos tra-dicionales con un claro impacto, líneas de segmentación útiles y manejables y priorización para la gestión de marketing en sistemas CRM.Limitaciones: la principal limitación de este modelo consiste en que se basa en datos de una sola empresa, y debe mostrar el valor en otros sectores y dar una visión completa a través de su aplicación transversal.Implicaciones prácticas: las ventajas indicadas demostraron una mejor predictibilidad y utilidad para los tomadores de decisiones, no solo para determinar los mejores clientes, sino también con los inactivos. Ofrece una explicación significativa de las diferencias en el comportamiento del cliente, que están presentes en los datos y se reflejan en el modelo.

    Esic Market Economics and Business JournalVol. 51, n.º 3, septiembre-diciembre 2020, 639-667

    Predecir el comportamiento del cliente con la lealtad de activación porperiodo. Del RFM al RFMAP

    Josep Alet Vilaginés*

    EAE Business School

    * Autor de correspondencia. e-mail: [email protected]

    ISSN 0212-1867 / e-ISSN 1989-3574© ESIC Editorial, ESIC Business & Marketing SchoolDOI: 10.7200/esicm.167.0513.4http://www.esic.edu/esicmarket

    Recibido: 05-05-2020; aceptado: 18-09-2020; publicado: 05-10-2020

  • 640 Josep Alet Vilaginés

    Además, proporciona una priorización prescriptiva de las variables que gestionar en el plan de marketing y cómo implementarlas.

    Palabras clave: modelo RFM; RFMAP; periodos de activación; lealtad de activación; análisis de la base de clientes.

    Códigos JEL: M31.

    Alet Vilaginés, J., 2020, Predecir el comportamiento del cliente con la lealtad de activación por periodo. Del RFM al RFMAP, Esic Market Economics and Business Journal, 51(3), 639-667. Doi: 10.7200/esicm.167.0513.4

    1. Introducción

    El marketing debe ser más relevante en nuestro complejo mundo actual, que, más que nunca, tiene más canales, más atención borrosa del cliente y recorridos del cliente con múltiples puntos de contacto. El marketing se ha enriquecido con la explotación de big data, los medios digitales y el uso de redes móviles y sociales (Reinartz et al., 2019) (Shaphali Gupta et al., 2020).

    La centralidad en el cliente ha sido considerada en los últimos años como una necesidad para una estrategia eficaz en el entorno actual (Vargo y Lusch, 2004). En esta estrategia, la base de clientes es fundamental para establecer la planificación y el control, y donde un cuadro de mando y un sistema de predicción son necesarios para administrar una empresa y obtener los mejores resultados. La atención en el indivi-duo es el desarrollo central en el nuevo milenio (Wierenga, 1997), donde los datos se pueden expandir para segmentar y administrar con modelos de valor de la vida del cliente (VVC) (Kumar et al., 2004), dentro del sistema de gestión de relaciones con clientes (CRM) (Kumar y Reinartz, 2012; Ngai et al., 2009; Wierenga, 2008).

    El comportamiento del cliente es el eje crítico para analizar lo que sucede en el mercado y comprender a las personas y sus acciones, predecir el futuro y gestionar los recursos empresariales y sociales de forma eficaz, tal como se ha demostrado a partir de un análisis fundamental con datos de panel (Guadagni y Little, 1983) y en un artículo reciente sobre un minorista en línea global (Chamberlain et al., 2017), donde el 60% del VVC se explica por el historial de compras. Eso muestra el papel del comportamiento del cliente pasado como referencia para el valor real y potencial, y es esencial definir qué y cuándo hacerlo y, en el caso de que usemos el nuevo mode-lo de análisis, cuánto se puede esperar obtener de ellos (Davenport y Harris, 2010).

    La base de clientes está infrautilizada y el potencial de la segmentación de clien-tes se ha vuelto más importante para definir quiénes son los mejores clientes para obtener la mayor rentabilidad. La segmentación es útil si ayuda a comprender el comportamiento del cliente, utilizando criterios estrechamente vinculados a pará-metros bien definidos que son comprensibles y permitan rendir cuentas del negocio tanto como sea posible. Entre las diferentes técnicas de segmentación empleadas con datos de comportamiento, hay una que destaca por su extenso uso desde hace más

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 641

    de 50 años: el modelo RFM. Recencia, frecuencia y monto son las tres variables que se utilizan con este modelo en la venta por correo y por catálogo y en el campo del marketing directo desde la década de 1960 (Osherow, 1960). El método RFM es útil, tiene atributos para la segmentación de clientes y proporciona una selección óptima para el correo directo. Los modelos RFM se utilizan comúnmente en muchos sectores, incluidos los nuevos digitales, y un informe reciente (Econsultancy, 2017) muestra que el 30% de las empresas y el 37% de las agencias en diferentes países declararon utilizar RFM para personalizar el contenido de su sitio web.

    La recencia R, es el tiempo transcurrido desde que se realizó la última compra. Suele definir la diferencia entre la fecha de análisis y la fecha de la compra anterior, referida en días, semanas o meses.

    La frecuencia, F, se suele definir como el número de transacciones durante un periodo de referencia, que podría ser en el mes anterior o en el año anterior, o duran-te toda la relación.

    El valor monetario, M, se define, según la fuente, como el monto total gastado a lo largo de la relación, en el año anterior, periodo anterior, o el promedio por año o periodo.

    Las medidas de RFM explican lo que hacen los clientes: cuándo, con qué frecuen-cia y cuánto compran, esos son los parámetros básicos de comportamiento (Wei et al., 2010).

    Por lo general, los clientes se agrupan en combinaciones de valores R, F y M. Debido a la consideración de quintiles por variable, el número total de grupos es 125 (5x5x5), lo cual es suficiente para usar agrupación u otro método de segmentación, pero esto es una limitación de condicionamiento innecesario. Algunos autores han realizado un RFM ponderado, que considera diferentes pesos de R, F y M, depen-diendo del sector (Stone, sf), considerando la apreciación subjetiva de gerentes o especialistas, Analytic Hierarchy Process (AHP) (Liu y Shih, 2005), o la definición de ponderaciones a priori por consideración personal (McCarty y Hastak, 2007; Miglautsch, 2000).

    Los modelos RFM tradicionales han recibido críticas explícitas sobre sus limita-ciones de no poder proporcionar ninguna predicción de activación o VVC del cliente (Gupta et al., 2006; Kumar et al., 2008), mientras que algunos autores han desarro-llado modelos predictivos con una de las cuatro siguientes técnicas:

    a) Conglomerados o “clustering”

    Al ser un sistema de clasificación de las tres variables combinadas (R, F y M), la combinación no tiene un significado directo asociado a todas ellas. Necesita un agrupamiento de K-means para obtener el significado especial de las diferentes fases del cliente que podrían ayudar a gestionar cada tipo de cliente, identificado con la combinación de los tres (Cheng y Chen, 2009; Sohrabi y Khanlari, 2007). Con

  • 642 Josep Alet Vilaginés

    la agrupación, intentan identificar a los clientes a través de diferencias en R, F y M como altas o bajas, tratando de aproximarse a las etapas típicas de la vida del cliente, como nuevos clientes o clientes inactivos (Carrasco et al., 2018).

    b) Regresión logística

    Para predecir compras futuras con la variable dependiente binaria de activación del cliente (1) o inactivación (0), donde los clientes se clasifican en una de las cate-gorías más probables (Glady et al., 2009; Hwang, Jung y Suh 2004; McCarty y Hastak, 2007).

    c) Árbol de decisiones

    El análisis de árbol de decisión consiste en una estructura de reglas de clasifica-ción de clientes en una estructura de árbol, donde diferentes intervalos de variables generan categorías con resultados esperados diferentes significativos, explicados a través de la varianza. Ofrece más información sobre las variables y cómo afectan los resultados, con las técnicas CHAID como las más utilizadas (Van den Berg y Breur, 2007).

    d) Redes neuronales

    Es una técnica de minería de datos que se ha aplicado en el campo del marketing directo. Se genera un número específico de categorías de salida a través de una capa de entrada, una o más capas ocultas y una capa de salida, cada una de las cuales contiene varias neuronas. A través del entrenamiento, genera una puntuación por datos de entrada y clases definidas para resultados (Kim y Street, 2004; Sarkar y De Bruyn, 2020; Smith y Gupta, 2000). Si bien podría obtener buenos resultados, tiene una clara desventaja en su falta de interpretación precisa de los resultados.

    Olson y Kevin, (Olson y Kevin, 2012) hicieron una comparación justa de los resultados de los diferentes métodos aplicados en RFM, con ventajas y desventajas. Concluyeron que los árboles de decisión son la mejor opción por su precisión de predicción y porque son fácilmente comprensibles por los gerentes, aunque tienen un número excesivo de reglas en algunos casos.

    El objetivo principal del nuevo modelo propuesto es incorporar la sencillez y claridad en las variables, implementación de transparencia, asegurando la alineación con los conceptos y segmentos naturales utilizados en el plan de marketing. Tener un impacto claro en los resultados junto con una retroalimentación de línea de acción predictiva y prescriptiva que esté en línea con un programa de marketing exitoso (Lilien et al., 2004).

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 643

    2. Nuevo modelo RFMAP y comparación con el modelo RFM tradicional

    Este modelo está configurado para ser útil y efectivo en negocios donde los clien-tes compran en un tiempo discreto, un entorno no contractual (Fader et al., 2010), refiriéndose a entornos comerciales donde el comportamiento del cliente es “necesa-riamente discreto”. Aunque puede haber más de una compra por periodo, el patrón de compra está asociado con un intervalo de tiempo en el que ocurre o no. La base adoptada está en línea con un proceso de Bernoulli, es un proceso estocástico de tiempo discreto que toma solo dos valores, canónicamente 0 y 1, representando, en este caso, la no activación o activación en el periodo analizado.

    Tomando en consideración los mismos aspectos mencionados anteriormente, se define un nuevo modelo que toma en cuenta una nueva definición de las variables tradicionales R, F y M con una especificación precisa del periodo P de valoración. Eso es fundamental en este método porque es la base de referencia del modelo.

    La figura 1 muestra las principales diferencias de enfoque entre el nuevo modelo RFM propuesto y los modelos RFM individuales: análisis de las cohortes de clientes con los mismos periodos de activación y un modelo de regresión lineal que da valores y explica el comportamiento de compra de los clientes con las principales variables.

    Figura 1. Comparación entre los modelos tradicionales de RFM y el nuevo modelo RFMAP propuesto

    Modelo tradicional RFM Nuevo modelo RFMAP

    RFM individual Cohorte de compra RFM

    Puntos RFM125 celdas

    • Ponderado• No ponderado

    ClusteringRegresión logística

    Árbol de decisión

    Redes neuronales

    + Otras variables

    Combinación de periodos de activación

    • 10010101010• 01001100111

    Valoración del modelo

    Modelo de regresiónRFMAP

    • Variables RFM• Lealtad de activación• Periodos de activación

    Valoración del modelo

  • 644 Josep Alet Vilaginés

    2.1. Nueva definición de variables

    2.1.1. Periodo de activación

    Define el espacio-tiempo que necesitan los clientes para realizar las compras para cubrir sus necesidades en relación con el mercado analizado. El tipo de negocio tiene relación directa con el periodo y las frecuencias de compra definen cuál es el periodo de análisis adecuado para establecer las diferentes variables. De acuerdo con Ehren-berg (1988), el uso de periodos de tiempo fijos da una amplia gama de “resultados generalizables” y “estos son fáciles de vincular con otros datos de marketing que se miden por periodos de tiempo”. Los patrones de comportamiento del cliente son específicos del sector y, al mismo tiempo, reflejan sus intereses o necesidades durante su vida, la dinámica de la relación y dependen del contrato o servicio de soporte en la relación.

    Con datos de comportamiento de cada mercado, es posible definir cuál es el periodo relevante para obtener la mejor valoración y predicción del cliente. Los periodos se podrían establecer para cada tipo de negocio en función de datos de mercado y la experiencia profesional de la siguiente manera:

    – Mes: tienda de supermercados, grandes almacenes, peluquería, gasolinera.– Semestre: Especialistas en retail, como muebles, productos para el hogar,

    moda, bricolaje.– Año: mantenimiento de automóviles, captación de fondos.– Plurianual: bienes duraderos como electrodomésticos, ordenadores o

    automóviles.

    El periodo no solo es la referencia para evaluar cada variable R, F, M, sino que también es una variable en sí misma porque las celdas están definidas por la activa-ción (valor 1) o no activación (valor 0) en cada periodo y, en combinación, definen 2n cohortes de compra que tendrán un comportamiento de comprador particular que considerar. Estas cohortes de compra darán una imagen precisa del valor de toda la base de clientes a través de su activación por periodos. Eso proporcionará etiquetas personales que tienen información asociada sobre el comportamiento esperado y el valor asociado.

    Por ejemplo, si se considera un negocio minorista donde el Cliente A compró en la primavera de 2008, el otoño de 2009, el verano de 2010, el invierno de 2010 y la primavera de 2012, y el Cliente B en el invierno de 2008, el otoño de 2009, la primavera de 2010 y el invierno de 2011, los datos se sintetizan como se muestra en la figura 2:

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 645

    Figura 2. Traslación de la activación del cliente a los indicadores primarios de RF

    2007 2012OI PV OI PV OI PV OI PV OI PV

    Cliente A 1 1 1 1 1Cliente B 1 1 1 1

    Cliente A R=0 F=5Cliente B R=1 F=4

    2008 2009 2010 2011

    100111001101100100

    Este modelo sigue la recomendación de Fader et al. (2010: 1103) para utilizar cohortes de clientes con un patrón de activación que puede ofrecer una mejor com-prensión de su base de clientes y la eficacia de sus esfuerzos de marketing. En este caso, con un peso relativo de cada variable y un claro impacto y conocimiento de la influencia de cada una.

    La clasificación de los clientes en cohortes de compra será el identificador, donde el patrón histórico de su compra se traduce en una probabilidad de activación y una predicción de una cantidad específica de dinero comprada para los próximos perio-dos. En lugar de trabajar como individuos, el nuevo modelo se segmenta como un grupo, cambiando la forma en que los modelos de RFM consideran la predicción a nivel individual. Se pronostica una tasa de activación y una compra promedio por cada cohorte, definida por los periodos en los que compraron.

    Con datos históricos con una cantidad suficiente de clientes en cada cohorte, los patrones estables de comportamiento de compra se pueden estimar de manera con-sistente y traducir a un modelo de migración de clientes (Dwyer, n.d.), que se refleja en un nuevo modelo de RFM. Este modelo integra los diferentes factores conside-rados y el peso relativo de cada variable obtenido a través del modelo de regresión.

    Como se desprende de la experiencia, no es posible estimar con confianza cuál de los clientes comprará o no en cada periodo. Sin embargo, es posible estimar con mucha confianza el número de clientes que comprarán y cuál será el monto promedio. Entonces, el grupo de activación está directamente, y con más claridad, delineando la diferenciación entre clientes, creando segmentos que tienen comporta-mientos de compra muy diferentes, y con una explicación clara de su patrón histó-rico de activación por periodo.

    2.1.2. R, recencia de la última compra

    El número de periodos sin comprar desde el último analizado es (0, 1,… n-1), desde que no ha pasado ningún tiempo desde que el cliente compró en el periodo anterior representado por 0, hasta que el cliente compró en el primer periodo de los datos analizados, representado por n-1. Este periodo no se calcula por días, semanas o meses desde la última compra, sino solo desde que se activó el periodo anterior. La fecha dentro del periodo no se considera relevante.

  • 646 Josep Alet Vilaginés

    2.1.3. F, frecuencia de las compras

    El número de periodos activados en el total analizado (0, 1,…, n). Esta frecuen-cia es la misma valoración, ya sea que haya una compra o muchas compras dentro del mismo periodo, porque la frecuencia dentro del periodo es principalmente una cuestión de comportamiento personal que se puede ajustar en el marco de los datos del mercado. Es una diferencia menor como medida de éxito. Para el enfoque de este trabajo, es el mismo patrón cinco compras por periodo de 30€ que una de 150€.

    El comportamiento de compra dentro del periodo, considerado esencial en algu-nos trabajos (Platzer y Reutterer, 2016), se descarta aquí porque el marco de tiempo es referido al periodo del negocio. Una conclusión que apoya la preferencia por la frecuencia por periodo, o la activación sobre la frecuencia de compra, ha sido valida-da en amplios estudios del Ehrenberg Bass Institute, donde las principales diferencias provienen de la penetración en la compra de los hogares sobre la frecuencia de com-pra (ASC Ehrenberg et al., 1990). El crecimiento de la marca está más relacionado con el aumento de la penetración que con la frecuencia de compra (Graham et al., 2012).

    2.1.4. M, valor monetario de las compras

    Es el dinero promedio gastado en cada periodo en el que el cliente lo ha comprado.

    M = (Total compra cliente perdido) / F (1)

    Esta nueva definición de F y M elimina la correlación entre ellas. Siempre apare-ció un problema cuando F se considera como el número de veces que el cliente com-pró dentro del periodo. Para enfrentar este problema, algunos autores propusieron una nueva variable V = M / R (Yang, 2004), que no es necesaria en este caso.

    2.1.5. Lealtad de activación

    La lealtad de activación A es la lealtad promedio durante la duración de la rela-ción. Es el ratio entre la frecuencia F y la duración de la relación D, presentando la activación relativa de periodos como cliente, como se muestra en la fórmula 2:

    A = F / D (2)

    Esta variable refleja la solidez de la relación de manera fundamental en un entor-no no contractual, donde su duración no implica un estado de cliente activo con certeza. Esta variable es un excelente indicador para considerar la probabilidad de

    n1Σ

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 647

    estar vivo el cliente. Su valor va de 0 a 1, donde 0 representa un cliente inactivo en el periodo total de análisis y 1 ilustra un cliente que permanece activo en todos los periodos. Es una variable clave porque pone en perspectiva que la frecuencia aumen-ta naturalmente con una extensión en la duración de la relación.

    Aunque algunos autores consideran relevante la duración de la relación (Fader et al., 2005b; Poel, 2003), esto ya se considera con la nueva definición de frecuencia F explicada anteriormente, y también la frecuencia incluye las compras realizadas en la relación.

    Podemos ver en la figura 3 diferentes cohortes de compra con la misma recencia (0) y frecuencia (3) y diferente lealtad de activación.

    Figura 3. Algunos ejemplos de clientes con la misma R y F y diferente lealtad de activación A

    1 2 3 4 5 6 7 8 9 10

    1 2 3 4 5 6 7 8 9 10

    1 2 3 4 5 6 7 8 9 10

    1 2 3 4 5 6 7 8 9 10

    1 2 3 4 5 6 7 8 9 10

    A=1,00× × ×

    A=0,75× × ×

    A=0,60× × ×

    A=0,43× × ×

    A=0,30× × ×

    A

    B

    C

    D

    E

    La lealtad de activación representa uno de los principales indicadores de lealtad porque muestra la lealtad relativa del cliente por periodos de activación y permite diferenciar el valor de los nuevos clientes.

    2.1.6. Agrupamiento

    (Zhang et al., 2015) introdujo el concepto de agrupamiento (clumpiness) en la literatura del marketing y propuso esta métrica que refleja variaciones en los patro-nes de compra, tomando el valor mínimo con eventos igualmente espaciados y el nivel máximo con patrones grumosos (cumply) donde hay periodos de actividad seguidos con largos periodos de inactividad.

    Nuestra propuesta de periodos de activación va en línea con su consideración para elegir periodos que coincidan con la escala de los periodos del tiempo de decisión de una empresa (Zhang et al., 2015: 198). Sin embargo, se espera que la aglomeración tenga una relación negativa con la activación y las compras futuras

  • 648 Josep Alet Vilaginés

    de los clientes porque una compra regular por periodo está vinculada a la lealtad comportamental (Buckinx y Van Den Poel, 2005).

    3. La aplicación del nuevo modelo RFMAP

    3.1. Análisis de datos

    Los datos analizados son de la empresa líder en el comercio minorista de mobi-liario y hogar en España con cinco años de transacciones de datos traducidas a diez semestres con un total de 1.131.780 hogares con una tasa de identificación superior al 60% de las ventas. Todas las transacciones se agruparon por tarjetas personales asociadas a un hogar (un hogar contiene una o más tarjetas personales). Todos los hogares se clasificaron en cohortes de los mismos patrones de periodos de activación, agrupando los datos de hogares totales y ventas totales por periodo.

    La figura 4 ilustra las seis fases de la metodología utilizada. Tras la integración de datos individuales en cohortes de compra, los datos se analizan mediante un modelo de regresión lineal, ya que resulta útil y muy exacto y con predicciones precisas con variable dependiente con valores intermedios, como es el caso (Ahlemeyer-Stubbe y Coleman, 2014; Sharpe et al., 2019).

    Figura 4. Seis fases de la metodología utilizada

    Datos individuales(hogares)

    Datos porcohorte de compra

    2.n periodos

    Modelo de regresiónlineal múltiple

    1 2 3

    RFMAP RFM

    Comparación demodelos basado en

    métricas

    Predicciones delmodelo RFMAPevaluado en el

    siguiente periodo

    Método deimplementación

    6 5 4

    El mejor periodo del análisis son los periodos de seis meses, de septiembre-febrero y marzo-agosto, que están asociados con el comportamiento de compra del cliente y la planificación de los sistemas de gestión. En este caso, con diez periodos de seis meses en 5 años (septiembre 2007-agosto 2012), obtenemos 210 o 1.024 cohortes de compra, que se utilizarán para identificar el mejor modelo de regresión para compras

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 649

    en la temporada septiembre 2012-febrero 2013 con toda la información asociada a ellos:

    • Número de hogares en el grupo.• P. Periodos de activación 1 o 0 (considerados como factores categóricos).• R. Recencia, último periodo activado.• F. Frecuencia, número de periodos activados.• M. Monto, compra promedio por periodo.• D. Duración de la relación.• A. Lealtad de activación (F / L).• C. Agrupamiento (clumpiness).

    Para preparar el conjunto de datos con las principales variables de cada cohorte, sintetizamos las cifras relacionadas con las variables incluidas como relevantes en el modelo de regresión en la siguiente tabla:

    Tabla 1. Estadísticos descriptivos de las variables independientes utilizadas en el análisis de regresión

    Variable Media Mínimo Máximo Std. Dev. Asimetría Curtosis

    P9_SEP11-FEB12 0,50 0 1 0,50 0,00 1,00

    P10_MAR12-AGO12 0,50 0 1 0,50 0,00 1,00

    R 0,99 0 9 1,38 1,92 7,49

    F 5,00 1 10 1,57 0,02 2,76

    M 247,73 165,14 366,50 28,18 0,51 4,05

    Duración D 9,01 1 10 1,38 -1,92 7,49

    A (F/D) 0,56 0,10 1,00 0,16 0,07 2,86

    C clumpiness 0,41 0,00 0,96 0,19 -2,01 -2,19

    % ACTIV 44,6% 5,6% 87,1% 16,3% -0,04 2,41

    Compra media sept-feb13 86,53 10,08 212,44 37,98 0,33 2,52

    Como se muestra en las siguientes figuras 5 y 6, la compra esperada en el próxi-mo periodo aumenta significativamente cuando la recencia es 0 o 1 y cuando F es 9 o 10. Si lo traducimos en periodos de activación, las dos condiciones coinciden cuando el cliente se activa en los dos últimos periodos. Eso significa que podemos esperar que los periodos por sí mismos sean significativos sobre el RFM, como una variable con impacto en las ventas y como una hipótesis que debe aparecer en el modelo de regresión. Otro dato relevante es el aumento significativo de activación y compra esperada en el caso de R = 0 y F = 1 debido a nuevos clientes que pueden tener una traducción al modelo.

  • 650 Josep Alet Vilaginés

    Figura 5. Compras por cliente con R y F

    - €

    50,00 €

    100,00 €

    150,00 €

    200,00 €

    0 2 4 6 8 10 12

    Com

    pras

    Frecuencia

    RF y compras

    R0

    R1

    R2

    R3

    R4

    R5

    R6

    R7

    R8

    R9

    Figura 6. Activación con las variables R y F

    0,0%

    10,0%

    20,0%

    30,0%

    40,0%

    50,0%

    60,0%

    70,0%

    80,0%

    90,0%

    0 1 2 3 4 5 6 7 8 9 10

    Act

    ivac

    ión

    Frecuencia

    RF y % Activación

    R0

    R1

    R2

    R3

    R4

    R5

    R6

    R7

    R8

    R9

    Con el análisis de la tasa de activación y la compra promedio por cliente relacio-nada con los grupos de RF, podemos ver el aumento esperado de respuesta y valor con más recencia y frecuencia. Identificamos que existe un incremento de valor que es más crítico con la activación en los dos últimos periodos, reflejado en los puntos de la curva de R0 y R1.

    Podemos ver en la figura 7 las enormes diferencias en la tasa de activación en la próxima temporada a partir del 87% en la cohorte de mayor compra con clientes

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 651

    activados en todos los periodos, a menos del 10% en las cohortes sin activación en los últimos siete, ocho o nueve periodos.

    Figura 7. Tasa de activación del próximo periodo relacionado con la activación por periodos

    5,6% 6,8%

    7,2% 8,9%

    9,6%

    9,8%

    10,0

    % 19,

    2%

    28,9

    % 34,6

    %

    37,3

    %

    40,3

    %

    55,0

    % 62,4

    % 69,6

    % 75,4

    %

    80,0

    %

    81,3

    %

    82,2

    %

    87,1

    %

    % Activación

    Como podemos ver en la figura 8, la lealtad de activación mantiene una relación directa y sustancial con los dos resultados deseados: compra / cliente y tasa de acti-vación en el próximo periodo.

    Además, cuando analizamos el efecto que ya tiene considerando los valores de R y F, la lealtad de activación agrega un impacto claro y muy alto por sí mismo, mostrando un valor agregado diferencial al modelo básico. De acuerdo con la tabla 2, donde apreciamos diferente lealtad de activación, aunque utilizando la misma recencia y frecuencia, podemos observar cómo se comportan estos clientes en una consecuente activación distinta en el siguiente periodo:

  • 652 Josep Alet Vilaginés

    Figura 8. Activación del cliente y compras en comparación con la lealtad de activación

    - €

    20,00 €

    40,00 €

    60,00 €

    80,00 €

    100,00 €

    120,00 €

    140,00 €

    160,00 €

    180,00 €

    0,0%

    10,0%

    20,0%

    30,0%

    40,0%

    50,0%

    60,0%

    70,0%

    80,0%

    0,1

    0

    0,1

    3

    0,1

    7

    0,2

    2

    0,2

    9

    0,3

    3

    0,4

    0

    0,4

    4

    0,5

    6

    0,6

    0

    0,6

    7

    0,7

    1

    0,7

    8

    0,8

    3

    0,8

    8

    0,9

    0

    % ACTIV Compra / cliente

    Tabla 2. Los clientes con la misma R y F, con una mayor lealtad de activación, tienen una tasa de activación más alta el siguiente periodo

    Cliente Cohorte de compra % Activ A

    A 0000000111 65,9% 1,00

    B 0000001011 58,4% 0,75

    C 0000000111 52,4% 0,60

    D 0000000111 48,7% 0,43

    E 0000000111 36,8% 0,30

    3.2. Análisis de regresión múltiple

    El análisis de regresión múltiple es entre la variable dependiente de tasa de activa-ción o compra promedio en el próximo periodo –en este caso OI 2012– en relación con los últimos diez periodos (figura 9) con las variables independientes R, F, M, y considerando cada periodo de activación relacionado con la tasa de activación y monto obtenido por cliente, como se presenta en la fórmula 3.

    Compra próxima temporada

    = β0 + β1R + β2F + β3M + β4A + β5P9 + β6P10 + ε (3)

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 653

    R Recencia de cada cohorte, F Frecuencia de cada cohorte, M Valor monetario de cada cohorte. Ps Periodo de activación como variable y A la Lealtad de activación.

    Figura 9. Regresión de los últimos diez periodos para obtener el mejor pronóstico de la próxima temporada

    2007 20 12OI PV OI PV OI PV OI PV OI PV OI1 2 3 4 5 6 7 8 9 10

    Siguiente

    10 periodos analizados temporada

    20112008 2009 2010

    Los datos se agrupan mediante una combinación de periodos de activación en lugar de clientes individuales ordenados por RFM. Cada cliente está asociado a su cohorte de compra, un grupo de activación con los mismos valores, porque el com-portamiento del grupo se puede pronosticar muy bien como grupo, mientras que como individuo es solo un 0 o 1. Como dijimos, los periodos de activación están incluidos como variables categóricas individuales. En este caso, como se observa en los datos presentados en las figuras 5 y 6, los relevantes son los dos últimos periodos de activación.

    Con este sistema, como se puede apreciar en la tabla 3, la correlación entre las variables de este nuevo modelo y con las diferentes definiciones de F, ahora la fre-cuencia no se correlaciona con M, y eso hará que el modelo de regresión sea más robusto y efectivo que un modelo tradicional RFM. En este caso, estas variables tienen un impacto claro, y sin el problema de la colinealidad.

    Se descartó la aglomeración (clumpiness) porque se correlaciona positivamente con F e introduce demasiada colinealidad en el modelo con valores de FIV (factor de inflación de la varianza) superiores a 10 en dos variables y con una débil explicación adicional de menos del 1% de la varianza. Entonces, el nuevo modelo se construye como en la siguiente figura.

    El modelo de regresión se completa primero con las variables primarias del modelo RFM para ganar un punto de referencia comparativo con los modelos tradi-cionales y comprender la importancia relativa entre las tres, que la mayor parte del tiempo en el pasado no fueron consideradas o no evaluadas estadísticamente. Los resultados globales son buenos con una gran explicación de la varianza reflejada en un R2 ajustado de 0,711 y una significancia muy alta en un valor de p

  • 654 Josep Alet Vilaginés

    Tabla 3. Correlación entre variables

    Tabla correlación

    linealP9 P10 R F M A

    C cum-pliness

    % ACTIV

    media sept-feb13

    P9_SEP11-FEB12

    1,00 0,00 -0,36 0,31 0,05 0,36 -0,27 0,53 0,45

    P10_MAR12-AGO12

    0,00 1,00 -0,72 0,31 0,12 0,36 -0,22 0,68 0,71

    R -0,36 -0,72 1,00 -0,44 0,02 -0,50 0,39 -0,78 -0,73

    F 0,31 0,31 -0,44 1,00 -0,03 0,83 -0,96 0,75 0,62

    M 0,05 0,12 0,02 -0,03 1,00 0,24 0,09 0,15 0,23

    A 0,36 0,36 -0,50 0,83 0,24 1,00 -0,77 0,80 0,70

    C Cumpliness -0,27 -0,22 0,39 -0,96 0,09 -0,77 1,00 -0,65 -0,43

    % ACTIV 0,53 0,68 -0,78 0,75 0,15 0,80 -0,65 1,00 0,90

    Compra media sept-feb13

    0,45 0,71 -0,73 0,62 0,23 0,70 -0,43 0,90 1,00

    Figura 10. Construcción definitiva de las variables en el nuevo modelo RFMAP

    Recencia

    Frecuencia

    valormonetario

    Lealtad deactivación

    Periodosactivación

    RFM

    NUEVAS VARIABLES

    PERIODOS DEACTIVACIÓN

    3.2.1. Nuevo modelo RFMAP

    La lealtad de activación (F/D) es la primera variable incluida en el análisis de regresión por pasos debido a su mayor correlación con la activación en el siguiente

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 655

    periodo. Esta variable ayuda a explicar el mejor comportamiento de los nuevos clien-tes que, teniendo la misma frecuencia, muestran una activación y compra esperadas por cliente mucho más altas.

    Desarrollando el modelo máximo explicable, obtenemos el modelo RFMAP, con la inclusión de las tres variables RFM y la lealtad de activación y la activación en los dos últimos periodos.

    Tabla 4. El modelo de regresión con compra por cliente

    Nuevo modelo RFM Nuevo modelo RFMAP

    Tabla regresión Coeficientes

    Constante - 26,69 € 4,64 €

    R - 15,71 € - 2,83 €

    F 9,17 € 4,38 €

    M 0,33 € 0,16 €

    A (F/D) 43,15 €

    P9_SEP11-FEB12 10,97 €

    P10_MAR12-AG12 18,97 €

    R2 ajustado 0,711 0,826

    Std. Err. of~Estimate 20,412 15,838

    F Modelo 839,635 810,078

    Tabla 5. El modelo de regresión con % de activación

    Nuevo modelo RFM Nuevo modelo RFMAP

    Tabla regresión Coeficientes

    Constante - 0,003 0,135

    R - 0,066 -0,018

    F 0,052 0,026

    M 0,001 0,000

    A (F/D) 0,252

    P9_SEP11-FEB12 0,050

    P10_MAR12-AG12 0,065

    R2 ajustado 0,846 0,947

    Std. Err. of~Estimate 0,064 0,037

    F Modelo 1877,374 3036,072

  • 656 Josep Alet Vilaginés

    La revisión de los coeficientes estándar de las seis variables en el modelo, la leal-tad de activación y los datos de los dos periodos anteriores de compras pasadas son los principales influyentes en la activación esperada y la compra promedio. Como se ha comentado anteriormente con las figuras 5 y 6, la gran brecha en el mejor com-portamiento de compra se da en el caso de recencia 0 y 1 con los mismos valores de frecuencia, lo que significa que los dos periodos de activación juegan un papel relevante en el modelo, como fue considerado en la primera hipótesis.

    La lealtad de activación captura la información de F y agrega información adi-cional cuando se muestra relacionada con la duración de la relación. Por su parte, los dos últimos periodos de activación (P9 y P10) sustituyen el componente de R, recencia, con el ajuste implícito de lo que podría ser un cliente grumoso (clumpy) (Zhang et al., 2015) con activación esporádica y la última activación que se asocia a una mayor probabilidad de comprar en el futuro.

    M es la variable con menor impacto porque el cliente de este sector no tiene un presupuesto para mejoras en el hogar y el mobiliario. La etapa de vida y las priori-dades del hogar definen la cantidad gastada en cada periodo y en qué tipo de tienda, por lo que el menor peso, en este caso, es razonable, ya que es el modelo de predic-ción más pobre en la compra esperada versus la tasa de activación.

    3.2.2. Evaluación del modelo obtenido

    El modelo tiene resultados sobresalientes con un R2 ajustado de 0,947 en cuanto a porcentaje de activación y de 0,8261 en compra por cliente, es decir, una explica-ción de 94,7% y 82,6% de varianza, respectivamente, por parte del modelo con las seis variables para predecir % de activación y compras promedio por cohorte en el periodo siguiente. En estos casos, las fórmulas predictivas serán 4 y 5:

    Próxima compra = –4,64 – 2,83R + 4,38F + 0.16M + 41,15A + 10,97P9 + 18,97P10 (4)

    % Activación = 0,135 – 0,018R + 0,026F + 0,0002M + 0,252A + 0,050P9 + 0,065P10 (5)

    El modelo con los dos últimos periodos y la lealtad de activación significa una mejora esencial sobre un modelo ya preciso (ver tablas 4 y 5). Tiene variables total-mente significativas *** (

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 657

    Tabla 6. Detalle estadístico con las variables del nuevo modelo de regresión RFMAP

    Tabla regresiónCoefi-ciente

    Error estándar

    Valor t Valor p

    Intervalo confianza 95%

    Multicolinealidad

    Inferior Superior VIF R-Square

    Constante 0,135 0,012 11,214 0,0000 0,112 0,159

    R -0,018 0,002 -11,893 0,0000 -0,021 -0,015 3,203 0,688

    F 0,026 0,001 17,450 0,0000 0,023 0,029 4,037 0,752

    M 0,000 0,000 4,711 0,0000 0,000 0,000 1,414 0,293

    A (F/ D) 0,252 0,016 15,816 0,0000 0,221 0,283 4,743 0,789

    P9_SEP11-FEB12 0,050 0,001 34,985 0,0000 -0,052 -0,047 1,459 0,315

    P10_MAR12-AGO12 0,065 0,002 34,114 0,0000 -0,069 -0,061 2,629 0,620

    El modelo con todas las variables implementadas tiene un diagrama de disper-sión de residuos estandarizado, que muestra una distribución casi aleatoria en todo el rango de valores y una distribución normal de residuos del modelo de regresión.

    3.3. Precisión de la predicción. Mejor estimación del próximo periodo y periodos futuros

    El desempeño de este nuevo modelo se evaluará obteniendo una mejora en la precisión de la predicción a nivel agregado, logrando un incremento sobre las ventas obtenidas en grupos de clientes ordenados de mejor a peor. Mostrará cómo, con el mismo número de mejores clientes, se gana una mayor cantidad de ventas, por lo que la inversión es más eficiente que el modelo anterior.

    Como se ha considerado, una limitación fundamental de los modelos RFM tra-dicionales es que son modelos de puntuación y no proporcionan explícitamente una estimación en dólares del valor del cliente (Sunil Gupta et al., 2004). Sin embargo, RFM incluye importantes variables de compras pasadas que pueden ser buenos predictores del comportamiento de compra futuro de los clientes, con activación y compras de clientes.

    En este caso, el modelo RFMAP obtenido supera al modelo tradicional en térmi-nos de precisión predictiva con un mejor R2 y la multicolinealidad eliminada, lo que permite una interpretación sólida de los parámetros.

    El nuevo modelo RFMAP tiene el potencial de identificar a los mejores clientes en cualquier circunstancia. Cuando una empresa quiere recuperar a los clientes más probables, tiene una oportunidad clara: los clientes inactivos con mayor valor espe-rado o con mayor tasa de respuesta en los casos en que la empresa prefiera el número de clientes al negocio obtenido.

    Además, como ilustración de la precisión del modelo y la capacidad de identificar a los clientes rentables de los inactivos, existe una buena comprensión detrás de por

  • 658 Josep Alet Vilaginés

    qué los clientes del decil inactivo1 tienen una mejor tasa de respuesta que los clientes del decil diez activos. El modelo de predicción para todo el periodo de un semestre da una predicción de 63,98 € gastados por cliente inactivo1 frente a 61,95 € por Cliente Activo10, donde estos clientes inactivos tienen un valor esperado más alto que los peores clientes activos. Los datos reales de la próxima temporada lo corro-boran con diferencias más notorias: 61,58 € por cliente inactivo1 frente a 51,68 € Clientes Activos10, con pequeños errores.

    Figura 11. Monto gastado por Inactivo1 mejor que Activo10

    61,95 €

    51,68 €

    63,98 € 61,58 €

    0 €

    10 €

    20 €

    30 €

    40 €

    50 €

    60 €

    70 €

    Modelo RFMAP Real

    Inactivo 1 mejor que activo 10

    Activo 10 Inactivo 1

    3.4. Ventajas gerenciales obtenidas del nuevo modelo RFMAP

    El objetivo principal de este nuevo modelo es proporcionar una base para desa-rrollar e implementar programas de marketing que obtengan el mayor valor de la base de datos de clientes, con facilidad de uso y comprensión completa de qué y cómo influye en los resultados. El objetivo es la precisión predictiva que brinde con-fianza y orientación para tomar las decisiones correctas.

    En este sentido, el nuevo modelo RFMAP aporta una mayor comprensión del comportamiento subyacente del cliente derivado del modelo. Incluye las tres varia-bles con ponderaciones estadísticas significativas y nuevas variables asociadas a una variable crítica: los periodos de negocio. La construcción del modelo se adapta a las particularidades del negocio, siendo relevante y útil para los tomadores de deci-siones. Este modelo hace que el diálogo sea más comprensible y traducible para las personas que utilizan los datos para su plan de negocios y su implementación (Wie-renga, 1997). La combinación de periodos de activación es un excelente indicador del comportamiento futuro del cliente, y todas las variables pueden traducirse en un claro impacto comercial.

    Como indicó Bob Stone en su libro fundamental sobre marketing directo, cada empresa puede tener una ponderación diferente debido a las particularidades de las diversas empresas (Stone, s.f.). Ese es el caso que encontramos en nuestro trabajo con

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 659

    empresas de la industria minorista: supermercados, farmacias, moda, grandes alma-cenes o muebles tienen ponderaciones y consideraciones muy diferentes que afectan significativamente el periodo en el que se considera cada variable de RFM (Poel, 2003). Teniendo en cuenta que cada empresa tiene sus particularidades a través de la fidelización de su base de clientes, la calidad de las relaciones con sus clientes, y el tipo de campañas estacionales que influye en el tipo de activación y, en consecuencia, sus variables RFMAP.

    En este negocio minorista, la lealtad de activación y la activación en los dos últimos periodos son las principales variables para obtener el mayor valor esperado y tasa de activación en la próxima temporada. Sobre todo, esa activación implica directamente un impacto positivo en los resultados deseados.

    Por otro lado, tenemos coeficientes estándar de M bajos, lo que implica un bajo impacto del monto promedio gastado en futuras activaciones y gastos. Por el con-trario, la activación es fundamental para desarrollar una relación con los clientes y aumentar su valor.

    Trabajar con cohortes de periodos activados puede traducirse en conceptos que ya son utilizados por los gestores en su análisis de segmentos de clientes y su toma de decisiones. Específicamente, consideramos tres grupos que luego se subdividen en deciles en función de su valor esperado y activación.

    • Los nuevos clientes, 0000000001, deben considerarse aisladamente por razo-nes de la relación que se va a construir y la necesidad de más información y evaluación. Tienen una tasa de activación y gasto mucho mejor y deben tratarse en consecuencia. El modelo RFMAP, con los parámetros de lealtad de activación como 1, periodo de activación P10, reconoce el valor extra de un cliente excepcional que tiene un solo periodo de compras.

    • Clientes activos: representados por xxxxxxxxx11, xxxxxxx01 y xxxxxxx10 en caso de semestre, son los clientes que compraron en el último año, en uno o dos de los dos periodos anteriores. La información clave de clientes y la información de la empresa son referidas a las cifras reales del año anterior, por lo que el modelo encaja perfectamente con los sistemas de información y control habitualmente implantados.

    • Clientes inactivos: representados por XXXXXXXX00, son los clientes sin comprar en los dos últimos semestres y se gestionan de manera diferente, considerando la extensión crítica de tiempo.

    Todas estas etiquetas son segmentos relevantes para la organización y necesitan un tratamiento especial por la fase de su relación con la empresa. Se pueden traducir fácilmente a las campañas de marketing y las interacciones de servicio al cliente con los clientes. Con el primero, podemos identificar no solo los mejores clientes, sino clientes suficientemente valiosos, y diferenciarlos de los clientes inactivos, principal-mente considerando la frecuencia y la lealtad de activación.

  • 660 Josep Alet Vilaginés

    4. Método de implementación para conseguir un sistema de apoyo a la toma de decisiones más útil

    Este modelo, RFMAP, puede ser una base sobre la que se implemente un plan de marketing. Comprender las implicaciones del comportamiento del cliente brinda una clara priorización de la lealtad de activación, con activación en cada periodo. El modelo no solo proporciona una predicción, sino que también implica una línea de acción prescriptiva sobre los diferentes impactos de cada variable en el modelo de predicción. La identificación de los periodos de activación como variable esencial da peso y prioridad para activar a cada cliente en el periodo de referencia. Implica una generación de negocio para el periodo y aumenta directamente el valor esperado para el próximo periodo y, en definitiva, un mucho mayor VVC.

    Los pasos que implementamos en la empresa fueron los siguientes:

    1. Selección del semestre como fase primaria de activación utilizada por los gerentes y miembros de marketing de la organización. El periodo de negocio para definir la cohorte de compra proporciona información útil por sí mismo porque ofrece una perspectiva de análisis y prioriza la frecuencia de activación sobre la frecuencia entre compras.

    2. Análisis de regresión del último semestre con los datos de los cinco años ante-riores a ese periodo, diez periodos comerciales.

    3. Generación de valor esperado por cohorte de activación para el próximo periodo.

    4. División de los clientes por activación:

    a. Nuevos clientes: clientes que se activan en un periodo por primera vez.b. Activo: compras en el último año o dos periodos anteriores.c. Inactivo1: un año y menos de dos años sin compras.d. Inactivo2: dos años inactivo.e. Inactivo3: tres años inactivo.f. Durmientes: inactivos durante más de tres años.

    5. División de clientes activos e inactivos por deciles para establecer segmentos de referencia para priorizar campañas y fijar grupos de referencia para impul-sar campañas, con grupos de control y retorno de inversión esperado. Combi-nado con otros datos de comportamiento, como la propensión a la siguiente mejor oferta, o datos sociodemográficos, utilizados como un sistema de apoyo a la decisión para predecir y luego priorizar inversiones por segmento, tipo de acción y finalmente ofrecer un sistema de control de clientes por valor esperado.

    6. Establecimiento de un sistema de control por tipo de clientes activos y la información clave como tasa de activación, compras promedio por periodo y margen por cliente.

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 661

    Este modelo, que se define por un comportamiento de periodo completo, funcio-na de manera precisa identificando diferencias en las tasas de respuesta reales para campañas específicas dentro del periodo, como se puede ver en la figura 12, y se convierte en un excelente punto de partida para el sistema de planificación y control de marketing.

    Figura 12. Tasa de respuesta de campaña por decil de clientes, temporada de octubre OI2012

    Por ejemplo, como ya se predijo, en los resultados de la campaña a partir del conjunto de datos de la temporada, la figura 12 muestra cómo el cliente Inactivo1 proporciona mejores resultados que los clientes Activo10. Estos resultados se expli-can por su mayor valor esperado por una buena lealtad de activación y una mejor frecuencia F en su comportamiento pasado que compensó la inactivación de los dos últimos periodos (R> 1).

    5. Conclusiones y consideraciones futuras

    El nuevo modelo RFM, presentado como modelo RFMAP, tiene algunas mejoras evidentes sobre los existentes. Primero, da un punto de referencia gerencial, llamado periodo de activación, que es el término natural para planificar y controlar las cam-pañas de marketing y sus resultados. El plan anual está fragmentado en periodos o temporadas más pequeños que integran el comportamiento de compra natural de los

    Activ

    os 1

    Activ

    os 2

    Activ

    os 3

    Activ

    os 4

    Activ

    os 5

    -7

    Activ

    os 8

    -9

    Activ

    os 1

    0

    Inac

    tivos

    1

    Inac

    tivos

    2-3

    -4

    Inac

    tivos

    5-6

    -7-8

    -9

  • 662 Josep Alet Vilaginés

    clientes para tener una visión más integral considerando hábitos, lealtad compartida o diferentes objetivos de visitas de compra.

    Es un modelo de cinco variables, donde la nueva variable, lealtad de activación, es la más explicativa y los periodos de activación son conceptualmente fundamen-tales. En el caso analizado, ambas variables inciden en la predicción de compra. Entonces, el nuevo modelo es un modelo preciso y útil que da sentido y tiene uso práctico en la gestión, aportando una mejor explicación de la varianza sobre los modelos tradicionales de RFM y con el peso de las variables explícitas en el modelo de regresión, y con un mejor ajuste a los resultados reales.

    El modelo ha mostrado una alta precisión de predicción con un modelo robusto y gran significación en todas las variables que se han considerado. El método presen-tado se propone como modelo de línea base para desarrollar modelos enriquecidos con segmentación sociodemográfica y comportamental, que sean útiles para obtener una segmentación de valor del cliente para construir el plan de marketing.

    Eso redundará en una mejor forma de entender quién y por qué compra, per-mitiendo desarrollar líneas de actuación específicas y rentables. En este sentido, la segmentación de propensión, que toma en cuenta categorías específicas de produc-tos comprados o análisis de cesta de la compra para identificar oportunidades con mayor potencial, es una buena opción que obtiene mejores resultados en campañas de focalización personalizadas (Reutterer et al., 2006) sobre el ya buen modelo RFMAP.

    La frecuencia de compra dentro de un periodo puede ser relevante y podría analizarse en futuras investigaciones sobre este nuevo modelo, lo que permitirá un mayor potencial de predicción y comprensión al tener una referencia que coloque la frecuencia de compra dentro del ciclo de compra. La siguiente área de desarrollo del modelo es exponer cómo puede ser un buen modelo de predicción para VVC según Fader et al., 2005a; Jasek et al., 2019; Khajvand et al. 2011; Kumar et al., 2004; Kumar, 2018; Liu y Shih 2005.

    El modelo presentado, RFMAP, se ha utilizado como nuevo modelo de seg-mentación en una empresa líder en retail de mobiliario en España con una mejora significativa en los resultados y una clara comprensión por parte del equipo de mar-keting. El equipo de marketing utilizó este nuevo modelo en lugar del método global anterior en los siguientes tres años después de que actuáramos como consultores de la empresa.

    Este modelo ha sido utilizado para otro tipo de negocios en el retail como super-mercados, farmacias, moda, grandes almacenes y mayoristas, solo adaptando los periodos de negocio y obteniendo resultados notables. Los directivos tienen ahora una clara comprensión y, sobre todo, una base de referencia para desarrollar y seguir el plan de marketing desde la perspectiva de la base de clientes para obtener su máximo valor. Esperamos que sea valioso para futuras investigaciones y prácticas de gestión.

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 663

    Declaración de intereses en conflicto

    El autor declara no tener ningún conflicto de intereses potencial con respecto a la investigación, autoría y/o publicación de este artículo.

    Fondos

    El autor no recibió apoyo financiero para la investigación, autoría y/o publica-ción de este artículo.

    Bibliografía

    Ahlemeyer-Stubbe, A., y Coleman, S., 2014, A Practical Guide to Data Mining for Business and Industry. https://doi.org/10.1002/9781118763704

    Buckinx, W., y Van Den Poel, D., 2005, Customer base analysis: Partial defection of behaviourally loyal clients in a non-contractual FMCG retail setting. European Journal of Operational Research. https://doi.org/10.1016/j.ejor.2003.12.010

    Carrasco, R. A., Blasco, M. F., García-Madariaga, J., y Herrera-Viedma, E., 2018, A Fuzzy Linguistic RFM Model Applied to Campaign Management. International Journal of Interactive Multimedia and Artificial Intelligence, InPress, 1. https://doi.org/10.9781/ijimai.2018.03.003

    Chamberlain, B. P., Cardoso, A., Liu, C. H. B., Pagliari, R., y Deisenroth, M. P., 2017, Customer Lifetime Value Prediction Using Embeddings. https://doi.org/10.1145/3097983.3098123

    Cheng, C. H., y Chen, Y. S., 2009, Classifying the segmentation of customer value via RFM model and RS theory. Expert Systems with Applications, 36(3 PART 1), 4176-4184. https://doi.org/10.1016/j.eswa.2008.04.003

    Davenport, T. H., Harris, J. G., y Morison, A. R., 2010, Analytics At Work (Harvard Business Press (ed.); Issue June. http://books.google.com/books?id=2otJuvfvflgC&pgis=1

    Dwyer, R. (n.d.). Customer lifetime valuation to support marketing decision making’. Journal of Direct Marketing, 3(4), 8-15.

    Econsultancy, R., 2017, Conversion optimization report. https://info.redeye.com/hubfs/White Papers and Reports 2017/Econsultancy-2017-CRO-Report.pdf

    Ehrenberg, A., 1988, Repeat-Buying. Facts, Theory And Applications. Chapters 1-5. In Repeat-Buying - Facts, Theory And Applications.

    Ehrenberg, A. S. C., Goodhardt, G. J., y Barwise, T. P., 1990, Double Jeopardy Revi-sited. Journal of Marketing, 54(3), 82. https://doi.org/10.2307/1251818

    Fader, P. S., Hardie, B. G. S., y Lee, K. L., 2005a, RFM and CLV: Using Iso-Value Curves for Customer Base Analysis. Journal of Marketing Research. https://doi.org/10.1509/jmkr.2005.42.4.415

  • 664 Josep Alet Vilaginés

    Fader, P. S., Hardie, B. G. S., y Lee, K. L., 2005b, “Counting Your Customers” the Easy Way: An Alternative to the Pareto/NBD Model. Marketing Science, 24(2), 275-284. https://doi.org/10.1287/mksc.1040.0098

    Fader, P. S., Hardie, B. G. S., y Shang, J., 2010, Customer-Base Analysis in a Discrete-Time Non-contractual Setting. Marketing Science, 29(6), 1086–1108. https://doi.org/10.2139/ssrn.1373469

    Glady, N., Baesens, B., y Croux, C., 2009, A modified Pareto/NBD approach for predicting customer lifetime value. Expert Systems with Applications, 36(2), 2062-2071. https://doi.org/10.1016/j.eswa.2007.12.049

    Graham, C., Scriven, J., Bennett, D., y Graham, C., 2012, Using the NBD-Dirichlet parameters to interpret long-term purchase incidence and brand choice. Introduc-tion & Objectives. 0-26.

    Guadagni, P. M., y Little, J. D. C., 1983, A Logit Model of Brand Choice Calibrated on Scanner Data. Marketing Science, 2(3), 203-238. https://doi.org/10.1287/mksc.2.3.203

    Gupta, Shaphali, Leszkiewicz, A., Kumar, V., Bijmolt, T., y Potapov, D., 2020, Digi-tal Analytics: Modeling for Insights and New Methods. Journal of Interactive Marketing. https://doi.org/10.1016/j.intmar.2020.04.003

    Gupta, Sunil, Hanssens, D. M., Hardie, B. G. S., Kahn, W., Kumar, V., Lin, N., Ravishanker, N., y Sriram, S., 2006, Modeling Customer Lifetime Value. Journal of Service Research, 9(2), 139-155. https://doi.org/10.1177/1094670506293810

    Gupta, Sunil, Lehmann, D. R., y Stuart, J. A., 2004, Valuing Customers. Journal of Marketing Research, 41(1), 7-18. https://doi.org/10.1509/jmkr.41.1.7.25084

    Hair, J. F., Black, W. C., Babin, B. J., y Anderson, R. E., 2014, Multivariate Data Analysis Seventh Edition.

    Hwang, H., Jung, T.-S., y Suh, E.-H., 2004, An LTV model and customer segmen-tation based on customer value: a case study on the wireless telecommunica-tion industry. Expert Systems with Applications, 26(2), 181-188. https://doi.org/10.1016/S0957-4174(03)00133-7

    Jasek, P., Vrana, L., Sperkova, L., Smutny, Z., y Kobulsky, M., 2019, Comparative analysis of selected probabilistic customer lifetime value models in online shop-ping. Journal of Business Economics and Management, 20(3), 398-423. https://doi.org/10.3846/jbem.2019.9597

    Khajvand, M., Zolfaghar, K., Ashoori, S., y Alizadeh, S., 2011, Estimating customer lifetime value based on RFM analysis of customer purchase behavior: Case study. Procedia Computer Science. https://doi.org/10.1016/j.procs.2010.12.011

    Kim, Y., y Street, W. N., 2004, An Intelligent System for Customer Targeting: A Data Mining Approach. Decision Support Systems 37 (), 37, 215-228.

    Kumar, V., 2018, A theory of customer valuation: Concepts, metrics, strategy, and implementation. Journal of Marketing. https://doi.org/10.1509/jm.17.0208

    Kumar, V., y Reinartz, W., 2012, Customer Relationship Management. Con-cept, strategy, and Tools (Springer Heidelberg (ed.)). https://doi.org/10.1007/978-3-642-20110-3

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 665

    Kumar, V., Ramani, G., y Bohling, T., 2004, Customer lifetime value approaches and best practice applications. Journal of Interactive Marketing. https://doi.org/10.1002/dir.20014

    Kumar, V., Venkatesan, R., Bohling, T., y Beckmann, D., 2008, The Power of CLV: Managing Customer Lifetime Value at IBM. Marketing Science, 27(4), 585-599. https://doi.org/10.1287/mksc.1070.0319

    Lilien, G. L., Rangaswamy, A., Bruggen, G. H. Van, Van Bruggen, G. H., y Starke, K., 2004, DSS effectiveness in marketing resource allocation decisions: Reali-ty vs. perception. Information Systems Research, 15(3), 216-235. https://doi.org/10.1287/isre.1040.0026

    Liu, D.-R., y Shih, Y.-Y., 2005, Integrating AHP and data mining for product recom-mendation based on customer lifetime value. Information & Management, 42(3), 387-400. https://doi.org/10.1016/j.im.2004.01.008

    McCarty, J. A., y Hastak, M., 2007, Segmentation approaches in data-mining: A comparison of RFM, CHAID, and logistic regression. Journal of Business Research, 60(6), 656-662. https://doi.org/10.1016/j.jbusres.2006.06.015

    Miglautsch, J. R., 2000, Thoughts on RFM scoring. Journal of Database Mar-keting & Customer Strategy Management. https://doi.org/10.1057/palgrave.jdm.3240019

    Ngai, E. W. T., Xiu, L., y Chau, D. C. K., 2009, Expert Systems with Applications Application of data mining techniques in customer relationship management: A literature review and classification. Expert Systems With Applications, 36(2), 2592-2602. https://doi.org/10.1016/j.eswa.2008.02.021

    Olson, D. L., y Kevin, B., 2012, Direct marketing decision support through pre-dictive customer response modeling. Decision Support Systems, 54(1), 443-451. https://doi.org/10.1016/j.dss.2012.06.005

    Osherow, J. B., 1960, How to clean a mailing list. The Reporter of Direct Mail Advertising, October.

    Platzer, M., y Reutterer, T., 2016, Ticking Away the Moments: Timing Regularity Helps to Better Predict Customer Activity. Marketing Science, 35(5), 779-799. https://doi.org/10.1287/mksc.2015.0963

    Poel, D. Van Den., 2003, Predicting Mail-Order Repeat Buying: Which Variables Matter? Tijdschrift Voor Economie En Management, XLVIII, 371-404.

    Reinartz, W., Wiegand, N., y Imschloss, M., 2019, The impact of digital transforma-tion on the retailing value chain. International Journal of Research in Marketing. https://doi.org/10.1016/j.ijresmar.2018.12.002

    Reutterer, T., Mild, A., Natter, M., y Taudes, A., 2006, A dynamic segmentation approach for targeting and customizing direct marketing campaigns. Journal of Interactive Marketing. https://doi.org/10.1002/dir.20066

    Sarkar, M., y De Bruyn, A., 2020, LSTM Response Models for Direct Marketing Analytics: Replacing Feature Engineering with Deep Learning. SSRN Electronic Journal. https://doi.org/10.2139/ssrn.3601025

    Sharpe, N. R., De Veaux, R. D., y Velleman, P. F., 2019, Business statistics (P. Edu-cation. (ed.); 4th ed).

  • 666 Josep Alet Vilaginés

    Smith, K. A., y Gupta, J. N. D., 2000, Neural networks in business : techniques and applications for the operations researcher. 27, 1023-1044.

    Sohrabi, B., y Khanlari, A., 2007, Archive of SID Customer Lifetime Value (CLV) Measurement Based on RFM Model Archive of SID. Iranian Accounting & Audi-ting Review, 14(47), 7-20. https://acctgrev.ut.ac.ir/article_18552_3c49bb9a53ce8058c5e7d811b5515f2d.pdf

    Stone, B., n.d., Successful direct marketing methods (NTC Business Books. (ed.).Van den Berg, B., y Breur, T., 2007, Merits of interactive decision tree building: Part

    1. Journal of Targeting, Measurement and Analysis for Marketing, 15(4), 201-209. https://doi.org/10.1057/palgrave.jt.5750054

    Vargo, S. L., y Lusch, R. F., 2004, Evolving to a New Dominant Logic for Marketing. Journal of Marketing, 68(1), 1-17. https://doi.org/10.1509/jmkg.68.1.1.24036

    Wei, J. T., Lin, S., y Wu, H. H., 2010, A review of the application of RFM model. 4(19), 4199-4206.

    Wierenga, B., 1997, Marketing decision support systems: Adoption, use, and satis-faction. Intern. J. of Research in Marketing, 14, 275-290.

    – 2008, The Past, the Present and the Future of Marketing Decision Models Intro-duction to the Handbook. 3-20. https://doi.org/10.1007/978-0-387-78213-3

    Yang, A. X., 2004, How to Develop New Approaches to RFM Segmentation. Jour-nal of Targeting Measurement and Analysis for Marketing, 13(1), 50-60. https://doi.org/10.1057/palgrave.jt.5740131

    Zhang, Y., Bradlow, E. T., y Small, D. S., 2015, Predicting customer value using clumpiness: From RFM to RFMC. Marketing Science. https://doi.org/10.1287/mksc.2014.0873

  • Predecir el comportamiento del cliente con la lealtad de activación por periodo… 667

    Datos del autor

    Nombre: Josep Alet VilaginésCargo: Profesor asociadoEscuela/Facultad: EAE Business SchoolDirección: 55 Aragó Street, Barcelona Spain 08015Correo electrónico: [email protected]: 0000-0002-0854-3750