Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse,...

60
SEGMENTACIONES, UN MECANISMO DE PREVENCIÓN Y CONTROL DEL RIESGO ANTE EL LAVADO DE ACTIVOS Y FINANCIACIÓN DEL TERRORISMO SARLAFT 4.0 EBOOK P. AGUILERA, E. RESTREPO Y C. TORRES ESCRITO POR:

Transcript of Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse,...

Page 1: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

SEGMENTACIONES, UN MECANISMO DE PREVENCIÓN Y CONTROL DEL RIESGO

ANTE EL LAVADO DE ACTIVOS Y FINANCIACIÓN DEL TERRORISMO

SARLAFT 4.0

E B O O K

P. AGUILERA, E. RESTREPO Y C. TORRESESCRITO POR:

Page 2: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Capítulo 1: Segmentaciones en el Sector Financiero01

Factores de riesgo

5 puntos de impacto del SARLAFT 4.0

04

Tabla de contenido

Implementando el nuevo SARLAFT 4.002

Conocimiento de los clientes06

Perfil de riesgo LAFT09

PEP’s11

Países de alto riesgo13

Capítulo 2: El entendimiento y la preparación de los datos15

La preparación de los datos19

El entendimiento de los datos16

Page 3: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Tabla de contenido

Capítulo 3: Conceptos claves en la selección de un modelo de segmentación ágil e intuitivo25

26

27

Conceptos del modelamiento

Actividades y etapas de modelamiento

Selección de técnicas de modelado28

Capítulo 4: Cumpliendo el SARLAFT 4.0. Homogeneidad y heterogeneidad de los segmentos41

Métricas de validación interna43

Métricas de validación externa47

Page 4: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Capítulo 1: Segmentaciones en el Sector Financiero

Page 5: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Implementando el nuevo SARLAFT 4.0

La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo no se escapa de esto, para muestra de ello la Superintendencia Financiera de Colombia presentó a comienzos del mes de septiembre de 2020 en la Circular Externa 0027 de 2020 el SARLAFT 4.0, cuyo foco de impacto principal es demostrar que la identificación digital confiable de los clientes puede simplificar las tareas de monitoreo y supervisión de las transacciones, minimizando las inconsistencias producidas por el control humano, logrando que los sistemas de prevención del LAFT sean más ágiles e intuitivos basados en la efectividad.

Este nuevo enfoque nace del resultado del informe de evaluación mutua realizado por el Fondo Monetario Internacional (FMI) y el Grupo de Acción Financiera Internacional (GAFI); y busca acogerse a las recomendaciones señaladas en la Guía de Identidad Digital del GAFI.

El Sarlaft 4.0 abre un espacio en el sistema financiero a la innovación tecnológica, gracias a la promoción de mecanismos que faciliten la vinculación de nuevos clientes de forma presencial o mediante la utilización de canales digitales que utilicen el reconocimiento facial, biométrico o por voz, por nombrar algunos; así como permite que las entidades vigiladas puedan diseñar formularios para recolectar la información necesaria a fin de adelantar una adecuada y efectiva gestión de los riesgos LAFT en los procedimientos de conocimiento del cliente.

02

Page 6: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

En la Circular Externa 0027 de 2020, como primera etapa del SARLAFT, en el numeral 4.1, se especifica la Identificación de los riesgos LAFT mediante la segmentación de sus factores de riesgo.

03

Para identificar el riesgo de LA/FT, las entidades vigiladas deben como mínimo:

4.1.1.1.

4.1.1.2.

4.1.1.3.

Establecer metodologías para la segmentación de los factores de riesgo y segmentar los factores de riesgo conforme aquellas.

Establecer metodologías para la identificación del riesgo de LA/FT y sus riesgos asociados respecto de cada uno de los factores de riesgo segmentados, teniendo en cuenta el contexto interno y externo de la entidad vigilada.

Considerano las características particulares de los factores de riesgo de la entidad y las variables consideradas para cada uno de ellos.

Page 7: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Factores de riesgo: Son los agentes generadores del riesgo de LAFT. Para efectos del SARLAFT las entidades vigiladas deben tener en cuenta como mínimo los siguientes:

1.13.1. Clientes y usuarios.

1.13.2. Productos.

1.13.3. Canales de distribución.

1.13.4. Jurisdicciones.

Es de conocimiento previo que la base de un eficiente y eficaz Sistema de Administración de Riesgo de Lavado de Activos y Financiación del Terrorismo es una buena caracterización de los factores de riesgo, el nuevo SARLAFT 4.0 los identifica de la siguiente forma:

Factores de Riesgo:

Para dar cumplimiento a lo expresado anteriormente es importante resaltar los 5 puntos de impacto del SARLAFT 4.0 en las segmentaciones de los factores de riesgo.

01

04

Page 8: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

05

Recalcando en esta oportunidad la apertura que se le da a las entidades vigiladas de segmentar nuevos Factores de Riesgo que hayan sido definidos durante el análisis del contexto externo de la organización financiera, teniendo en consideración el ambiente cultural, político, tecnológico, económico, entre otros; así como del contexto interno donde entran a colación el gobierno, estructura organizacional, funciones y responsabilidades; las capacidades, entendidas en términos de recursos y conocimiento (vr.gr. capital, tiempo, personas, procesos, sistemas y tecnologías) de la organización.

De este análisis previo de los respectivos contextos, la norma señala como posibles generadores de riesgo LAFT los accionistas, beneficiarios finales, administradores en los términos del art. 22 de la ley 222 de 1995, empleados, proveedores y vinculados, dando una primera idea de otros factores que pueden ser segmentados en el proceso de creación del SARLAFT.

Page 9: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Las segmentaciones de los factores de riesgo, vistas desde los cuatro factores de riesgo habituales, usan datos del cliente de una forma u otra entre las variables que definen dichos factores, por lo que la forma en la que sea recolectada la información impactará en la calidad de las segmentaciones.

Conocimiento de los clientes: 02

06

Page 10: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

En este punto la circular 0027 de 2020 expresa:

Las entidades vigiladas pueden realizar los procedimientos de conocimiento del cliente de manera presencial o no presencial a través del uso de canales digitales o electrónicos. Asimismo, las entidades vigiladas pueden obtener la información necesaria para realizar los procedimientos de conocimiento del cliente de bases de datos públicas, de los operadores de servicios ciudadanos digitales o de identidad digital autorizados, siempre que:

Individualizan al potencial cliente a través de la verificación de sus datos de identificación. Den cumplimiento a las reglas establecidas en la Ley 1581 de 2012 sobre tratamiento de datos personales y demás normas que las modifiquen, complementen, sustituyan o adicionen.

Dicho potencial cliente no esté catalogado por la entidad como de alto riesgo.

(I).

(II).

(III).

07

Page 11: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Las entidades vigiladas pueden diseñar formularios para recolectar la información necesaria para adelantar una adecuada y efectiva gestión de los riesgos LAFT en los procedimientos de conocimiento de cliente, asegurando mediante dicho formulario la debida obtención de la información básica, socioeconómica, financiera y transaccional del potencial cliente conforme a su perfil de riesgo.

De igual forma deben conocer los datos relacionados con la actividad económica; las características, montos y procedencia de sus ingresos y egresos; el domicilio y, para las personas jurídicas, los datos de identificación del representante legal y los miembros de junta directiva u órgano que haga sus veces.

El acceso a nuevos canales para obtener datos de reconocimiento de clientes abre un abanico de opciones que permite además de mejorar la calidad de los datos, obtener variables alternas que permitan realizar una mejor caracterización de los segmentos que se generen para cada factor de riesgo.

El uso de fuentes alternas además facilitará garantizar la completitud y exactitud de los datos recolectados, minimizando la necesidad de imputar o eliminar registros.

08

Page 12: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

VERLO AHORA

También podría interesarte nuestro:

Ebook

Tips para elegir el número óptimo de clústeres en una segmentación de factores de riesgo.

Page 13: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

EL nuevo SARLAFT 4.0 fijó lineamientos donde las entidades financieras determinen su procedimiento de conocimiento del cliente como se especificó anteriormente, ahora con un enfoque basado en riesgos, definiendo la información que solicitarán al cliente en atención al análisis cuidadoso y particular que realicen del mismo.

Perfil de Riesgo LAFT: 03

09

Page 14: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Procedimientos de conocimiento de cliente de manera proporcional en atención a su análisis del riesgo LA/FT, esta calificación debe tener en cuenta la valoración integral de los

factores de riesgo.

Las entidades vigiladas deben tener a disposición de esta Superintendencia los medios verificables a través de los cuales se demuestre la realización del análisis del riesgo de LA/FT

Concluyendo de este punto, que una información requerida para la segmentación de los Clientes es dicho Perfil de Riesgo, el cual entre los criterios de valoración debe tener en consideración el Perfil Transaccional de cada cliente.

A partir de esto se da ingreso al perfil de riesgo LAFT de cada cliente como se detalla a continuación:

10

Page 15: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

PEP´s:A la vista del SARLAFT 4.0, se identifican las Personas Expuestas Políticamente, según la definición contemplada en el Decreto 1674 de 2016 (que adiciona el Decreto 1081 de 2015) y demás normas que lo modifiquen; así como, los PEP´s extranjeros y los PEP´s de organizaciones internacionales.

04

11

Page 16: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

12

- Entendiendo por PEP Extranjeros aquellas personas que desempeñan funciones públicas destacadas en otro país. Como lo son jefes de Estado, jefes de Gobierno, ministros, subsecretarios o secretarios de Estado; congresistas o parlamentarios; miembros de tribunales supremos, tribunales constitucionales u otras altas instancias judiciales cuyas decisiones no admitan normalmente recurso, salvo en circunstancias excepcionales; miembros de tribunales o de las juntas directivas de bancos centrales; embajadores, encargados de negocios y altos funcionarios de las fuerzas armadas, y miembros de los órganos administrativos, de gestión o de supervisión de empresas de propiedad estatal.

- En relación con los PEP´s de organizaciones internacionales: se identifican aquellas personas que ejercen funciones directivas en una organización internacional como lo son Directores, subdirectores, Miembros de juntas directivas o cualquier persona que ejerza una función equivalente.

En este aspecto la Circular Externa 027 de 2020 establece disposiciones que buscan fortalecer la debida diligencia de las Personas Expuestas Políticamente (PEP) y la supervisión en corresponsalía transnacional, la aplicación de contramedidas en países de mayor riesgo, el requerimiento de información en las transferencias internacionales y nacionales.

Page 17: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Jurisdicciones bajo mayor supervisión GAFI - 30 de junio de 2020: http://www.fatf-gafi.org/publications/high-risk-and-other-monitored-jurisdictions/documents/increased-monitoring-june-2020.html

13

Entre los lineamientos estipulados en el SARLAFT 4.0 queda estipulado que las entidades vigiladas deben revisar permanentemente los países de mayor riesgo contenidos en los listados del GAFI de países no cooperantes y jurisdicciones de alto riesgo (high risk and other monitored jurisdictions).

A fin de aplicar medidas intensificadas de conocimiento del cliente y de monitoreo de aquellas relaciones comerciales y transaccionales con personas naturales y jurídicas, e instituciones financieras, procedentes de los países que se encuentren listados como de mayor riesgo por GAFI

Países de alto riesgo 05

Page 18: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

En términos generales, el proceso de identificación de los Riesgos LAFT, a partir de este nuevo enfoque, tendrá cambios de gran impacto al momento de realizar las segmentaciones de los Factores de Riesgos, dado la libertad que se expresa ahora en relación con la ausencia de variables mínimas para las respectivas segmentaciones.

Así como la posibilidad de definir nuevos Factores de Riesgo susceptibles de ser segmentados, mediante el análisis del contexto interno y externo de la entidad vigilada.

En el SARLAFT 4.0 se expresa de forma relevante e importante que las variables utilizadas en las segmentaciones de los factores de riesgo definidos garanticen la homogeneidad al interior de los segmentos y heterogeneidad entre ellos, dando así cumplimiento a una correcta identificación de los riesgos LAFT.

14

Page 19: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Capítulo 2: El entendimiento y la

preparación de los datos

Page 20: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

16

En gran parte de la literatura es considerado que estas dos etapas son las que fundamentalmente deberían ocupar el mayor porcentaje de duración del proyecto, puesto que son consideradas la base para la obtención de unos resultados coherentes en el modelamiento, pero veamos que conceptos las integran.

Consiste en todas las actividades asociadas a la creación de la colección de la información y busca responder a la pregunta, ¿es representativa la información seleccionada para el problema que se intenta resolver?

El entendimiento de los datos:

Page 21: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

17

Para la realización de un adecuado entendimiento y la determinación de la pertinencia de una variable como parte de la colección de datos, suele ser una buena practica el uso de métodos estadísticos descriptivos sobre cada una de las variables que se pretenden hagan parte del modelo. Entre los métodos más comunes encontramos:

El cálculo de la media, mediana, mínimos, máximos y la desviación estándar de cada una de las variables.

La generación de una matriz de correlación de las variables preseleccionadas, este es uno de los métodos más adecuados para determinar la conexión entre variables y la detección de campos redundantes.

La generación de histogramas de cada uno de los campos preseleccionados, donde se busca obtener una visión sobre la distribución que presentan cada una de las variables.

Page 22: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Paralelamente, es un recurso que permite cuestionarse sobre el tipo de preparación que podría requerir la información, como puede ser el caso de una variable categórica que contenga muchos valores asociados y que podría llegar a requerir una agrupación como método de preprocesamiento.

Es importante también abordar este paso con el objetivo de extraer información acerca de la calidad que presentan las variables, la detección de información faltante, y finalmente, el porcentaje que estos hallazgos puedan estar ocupando de la información original.

Finalmente, al ser parte el entendimiento de los datos de un ciclo interactivo, se podrá retornar a él desde otros pasos, dado que se determine que los resultados no cumplen con el nivel esperado o que la información seleccionada no sea representativa de los resultados obtenidos.

18

Page 23: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Por otro lado, es la etapa donde se aplican metodologías que permiten que las variables seleccionadas aporten información consistente, precisa y representativa del panorama. Aquí es donde se eliminan o transforman los datos que se determina cuentan con una calidad poco acorde a los objetivos del producto que se espera obtener, además es en esta fase donde se aplican tratamientos a los datos faltantes, se da la eliminación de registros repetidos y la unión de las fuentes de datos. De acuerdo con Rick Sherman, in Business Intelligence Guidebook, 2015, esta parte del ciclo puede ocupar de la duración de un proyecto entre el 60 y 75% del tiempo.

La preparación de los datos:

19

Page 24: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Otro de los procedimientos que integran esta fase es la creación de nuevas variables a partir del dominio del conocimiento que se tenga del problema, con el fin de representar una característica destacada que no se considere esté caracterizada en la información recolectada.

Como se mencionó al inicio de este artículo es el conjunto de estas dos fases del ciclo las que suelen ser consideradas como la base del éxito de los resultados y por ende las que ocupan del proyecto el mayor esfuerzo, y es que es aquí donde se desarrollan también tareas asociadas a la definición de las fuentes de información, el perfilamiento de las variables, la selección del factor a analizar y la definición del flujo de la información fuente al modelo; actividades que además traen sujetas reuniones, consensos, definiciones, entre otros.

Es preciso destacar entonces la relevancia que ocupan estas dos etapas en el nuevo sistema de prevención LA/FT expedido por la superintendencia financiera a través de la Circular Externa 27 de 2020, del cual, algunas de sus características más relevantes fueron analizadas ampliamente en el primer capítulo de este E-book. Se encuentra entonces que el nuevo SARLAFT busca que sea a través de la definición del contexto interno y externo de la entidad vigilada que se defina como es mencionado en el numeral 4.2.2.3.2, que los factores de riesgo mínimos que serán seleccionados sean acordes a las características particulares de cada entidad vigilada, además de la pretensión que se hace de que el análisis de cada uno de los factores de riesgo contemple también el estudio de la información transaccional histórica que refleja la estacionalidad del negocio.

20

Page 25: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Paralelamente, es importante precisar la notabilidad de esta gestión también desde los planteamientos que aborda la norma en la búsqueda de la ampliación de los mecanismos de conocimiento del cliente a través de la integración de la información recolectada de bases externas, como también ya fue ampliamente visto en el primer capítulo, ya que no sólo se limita su uso al entendimiento adecuado del perfil de riesgo, sino que además se considera es información relevante que puede entrar hacer parte de las variables usadas en la segmentación de riesgos.

21

Un ejemplo pertinente que se puede resaltar y ejemplifica las definiciones mencionadas, se presenta en el artículo 4.2.2.2.1.1.3.4, donde para la selección de la información, que permitiría entender mejor a las entidades vigiladas un cliente con un perfil de riesgo potencial alto, se busca que las entidades hagan uso de medidas intensificadas, es decir que el estudio del conocimiento del cliente este compuesto por la obtención de información adicional, por ejemplo para el caso de una persona natural del origen de sus bienes y/o fondos, su patrimonio y sus relaciones contractuales con otras entidades vigiladas, la revisión en bases de datos de entidades públicas, así como cualquier otra medida intensificada que sea eficaz y proporcional a los riesgos identificados por entidad.

Page 26: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

VERLO AHORA

También podría interesarte nuestro:

Ebook

Análisis Comparativo Evaluación Nacional deRiesgo 2013, 2016 y 2019

Page 27: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Por último, si usted es de los que en este momento tiene el interrogante de por dónde empezar, a continuación, le resumimos en una serie de procedimientos algunas tareas que le ayudarán a poner en perspectiva el camino para llegar su objetivo.

22

Reporte inicial de las colecciones de datos: Realice una lista con las fuentes de datos que considera requerirá en el que incluya su locación y los métodos que necesitará aplicar para realizar un uso de estos. Además, complemente esta información con los problemas detectados en su recolección, esta información le servirá para replicar el procedimiento.

Reporte descriptivo de los datos: Incluya información sobre el formato que presentan los datos, el número de registros y los campos que componen las bases.

Exploración de la información: Hágase preguntas que esperaría obtener de respuesta haciendo uso de la información recolectada. Use visualizaciones y reportería que le permitan abordar puntos clave como la distribución de los atributos, la relación entre ellos, agregaciones que considera pueda requerir, detección de propiedades significativas de subgrupos y el uso de análisis descriptivos simples.

01.

03.

02.

Page 28: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

23

Realice un reporte con los resultados de la exploración: Incluya los hallazgos y las hipótesis iniciales que infiere de la información, de acuerdo con el objetivo que pretende su análisis. Acompañe la información de gráficos que le permitan observar las características que sugiere presenta la información.

Examine la calidad de su información: Aborde preguntas cómo ¿Está la información recolectada completa?, ¿Se detecta errores en la información, y si es así, que tan frecuentes son?, ¿La información presenta valores faltantes, y si es así como son representados en cada uno de los campos?

Realice un informe sobre la evaluación de la calidad: Describa los problemas existentes y sugiera posibles soluciones a los hallazgos.

Seleccione las variables que formarán la estructura final de los datos: En este paso usted decidirá que campos de la información desea incluir, al igual que los registros. Para esta selección usted puede hacer uso de las indicaciones de la norma, además de la calidad detectada, problemas técnicos que limiten el volumen de la información y el tipo de dato. Realice una lista final de los campos que dese incluir y excluir, y la razón asociada.

Limpieza de la información: En este paso usted podrá emplear metodologías como selección de registros de buena calidad, inserción de valores por defecto o técnicas avanzadas de calculo de datos faltante a través de modelación. Finalmente, realice un reporte en el describa las decisiones y acciones tomadas para los problemas de calidad y el posible impacto que considera podría generar en los resultados.

04.

06.07.

05.

08.

Page 29: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

24

Construya la estructura de los datos: En este paso usted desarrollará las tareas asociadas a la generación de nuevos atributos haciendo uso de uno o más de los atributos que presenta en sus registros, por ejemplo, usted puede hacer uso de las variables de activos y pasivos para el cálculo del patrimonio, o la creación completa de nuevos registros, cómo la generación de un campo asociado a los clientes sin operaciones en los últimos meses.

Integración de las bases de datos: Este paso está compuesto por métodos que requieren la combinación de múltiples bases, registros o la creación de nuevos valores. Aquí encontrará el uso de procedimientos como la fusión de tablas donde se unen diferentes colecciones de datos que contienen información del mismo factor, por ejemplo, una cadena puede tener en una tabla registros sobre la información general de sus tiendas y en otra las ventas. Por otro lado, también es posible hacer uso de métodos de agregación de la información, en el que se calculan nuevos registros a través de la generación de un resumen entorno a una variable. Por ejemplo, convertir la tabla de transacciones, en un resumen de las características de compra que presentan cada uno de los clientes, extrayendo promedio del valor mensual, número total de compras realizadas, promedio mensual de artículos comprados, entre otros.

Una vez culminados estos pasos, usted ya cuenta con la información necesaria para la búsqueda de un modelo que represente su información.

10.

09.

Page 30: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Capítulo 3: Conceptos claves en la

selección de un modelo de segmentación ágil e intuitivo

Page 31: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Conceptos del modelamiento

La segmentación consiste en implementar metodologías que permitan fragmentar cada factor de riesgo en una serie de grupos o segmentos homogéneos respecto a una o varias variables. Desde un enfoque estadístico este tipo de segmentación puede abordarse como un tipo de aprendizaje en machine learning, este es conocido como aprendizaje no supervisado, este tipo de algoritmos infieren patrones a partir de un conjunto de datos sin hacer referencia a resultados conocidos o etiquetados, aspecto que conjuga muy bien con la nueva normativa del SARLAFT 4.0, donde se expresa que las segmentaciones de los factores de riesgo deben ser más flexibles en cuanto a la estructura de los algoritmos de segmentación.

A diferencia del aprendizaje automático supervisado, los métodos de aprendizaje automático no supervisados no se pueden aplicar directamente a una regresión o un problema de clasificación porque no tiene idea de cuáles podrían ser los valores de los datos de salida, lo que imposibilita entrenar el algoritmo como se haría normalmente. El aprendizaje no supervisado se puede utilizar para descubrir la estructura subyacente de los datos. De esta manera y de acuerdo con la Guía de Mejores Prácticas para la Construcción de Modelos de segmentación Relacionados con los Factores de Riesgo de Lavado de Activos y Financiación del Terrorismo publicada por la Superintendencia Financiera de Colombia elegir el algoritmo “Es un proceso que implica tener en cuenta el alcance de las herramientas tecnológicas que se usan para la ejecución y diseño de las modelos de segmentación”.

26

Page 32: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Actividades y etapas de modelamientoLas actividades que comprende la etapa de modelamiento, de una forma general son las que se ilustran en la Figura 1. Se puede apreciar que se trata de un proceso iterativo y no lineal, en el cual se hace necesaria la realización de estas actividades en paralelo, puesto que al momento de elegir el algoritmo de segmentación adecuado es indispensable verificar los resultados de diferentes modelos (Evaluación métricas de desempeño) aplicando las herramientas estadísticas requeridas y su vez teniendo un punto de vista práctico y de esta manera poder seleccionar el que mejor se ajuste a los datos.

Ilustración 1. Flujo de actividades fase Modelamiento

27

Page 33: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

1.1 Selección Medidas de Distancia -Disimilitud

Selección de técnicas de modelado:

28

La distancia (disimilitud) y la similitud son la base para construir algoritmos de agrupamiento, para poder llevar a cabo las agrupaciones es necesario definir y cuantificar la similitud entre las observaciones. El término distancia se emplea dentro del contexto del clustering como cuantificación de la similitud o diferencia entre observaciones. La característica que hace del clustering un método adaptable a escenarios muy diversos es que puede emplear cualquier tipo de distancia, lo que permite al analista seleccionar la más adecuada según sea el caso de la segmentación.

En cuanto a las características de los datos dependiendo del tipo de estos se reconoce la relación entre los datos de la siguiente manera: - Datos cuantitativos: Distancia - Datos cualitativos: Similitud

Page 34: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

29

Tabla 1. Medidas de Distancia -Disimilitud

La medida de distancia apropiada es importante, pero no siempre se puede saber a ciencia cierta cuál es la medida óptima. La distancia euclídea entre dos puntos es una de las más utilizadas.

Page 35: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Ilustración 2. Algoritmos de Agrupamiento

30

1.2 Selección algoritmos

Como se mencionó anteriormente, al tratarse de un proceso de forma iterativa se recomienda probar y evaluar diversos modelos o técnicas, con el fin de seleccionar el que presente mejores métricas de desempeño y garantice el correcto funcionamiento de acuerdo con la dinámica del negocio.

A continuación, los algoritmos de agrupamiento más utilizados y una breve descripción de su funcionamiento.

Page 36: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

31

1.2.1 Algoritmo de agrupamiento basado en partición

Son métodos de agrupación que se utilizan para clasificar las observaciones, dentro de un conjunto de datos, en varios grupos según su similitud. Los algoritmos requieren que el analista especifique el número de conglomerados o clusters que se generarán. K-means y K- mediods son los dos más famosos de este tipo de algoritmos de agrupamiento. K-mediods es una mejora de K-means para tratar con datos discretos, Los algoritmos de agrupamiento típicos basados en particiones también incluyen PAM, CLARA, CLARANS.

Como se mencionó anteriormente en este tipo de algoritmos es necesario definir el número de clusters por eso se definen los métodos más utilizados para la selección óptima del número de clusters.

Selección del número óptimo de Clusters

Uno de los problemas a la hora de aplicar alguno de los algoritmos de agrupamiento basado en partición es la elección del número de Clusters. No existe un criterio objetivo ni ampliamente válido para la elección de un número óptimo de Clusters; pero se debe tener en cuenta, que una mala elección de los mismos puede dar lugar a realizar agrupaciones de datos muy heterogéneos (pocos Clusters); o datos, que siendo muy similares unos a otros se agrupen en Clusters diferentes (muchos Clusters).

Page 37: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

32

Método del “Codo”: Es uno de los métodos más populares para determinar este valor óptimo de k. La idea general es probar un rango de valores del hiperparámetro en cuestión, representar gráficamente los resultados obtenidos con cada uno e identificar aquel punto de la curva a partir del cual la mejora deja de ser sustancial (principio de verosimilitud). El método del Codo calcula la varianza total intra-cluster en función del número de clusters y escoge como óptimo aquel valor a partir del cual añadir más clusters apenas consigue mejoría. Ilustración 3. Método del “Codo”

El método de la silueta: Es muy similar al del “Codo”, con la diferencia de que, en lugar de minimizar la suma total de cuadrados entre grupos, se maximiza la media de los coeficientes de silueta o índices silueta. Este coeficiente cuantifica qué tan buena es la asignación que se ha hecho de una observación comparando su similitud con el resto de las observaciones de su cluster frente a las de los otros clusters. Su valor puede estar entre -1 y 1, siendo valores altos un indicativo de que la observación se ha asignado al cluster correcto.

Ilustración 4. Método de la silueta

Page 38: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Gap statistic: Este estadístico compara, para diferentes valores de k, la varianza total intra-cluster observada frente al valor esperado acorde a una distribución uniforme de referencia. La estimación del número óptimo de clusters es el valor k con el que se consigue maximizar el estadístico gap, es decir, encuentra el valor de k con el que se consigue una estructura de clusters lo más alejada posible de una distribución uniforme aleatoria. Este método puede aplicarse a cualquier tipo de clustering.

Ilustración 5. Gap statistic

Los métodos del “Codo”, la silueta y gap no tienen porqué coincidir exactamente en su estimación del número óptimo de clusters, pero tienden a acotar el rango de posibles valores. Por esta razón es recomendable calcular los tres y en función de los resultados decidir.

Además de estos tres métodos, existen en la bibliografía muchos otros desarrollados también para identificar el número óptimo de clusters. La función NbClust() del paquete NbClust en R incorpora 30 índices distintos, dando la posibilidad de calcularlos todos en un único paso. Esto último es muy útil, ya que permite identificar el valor en el que coinciden más índices, aportando seguridad de que se está haciendo una buena elección.

33

Page 40: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

34

1.2.2 Agrupación Jerárquica

Es una alternativa a los métodos de partición ya que no requiere que se preespecifique el número de clusters. Los métodos que engloba la agrupación jerárquica se subdividen en dos tipos dependiendo de la estrategia seguida para crear los grupos:

El agrupamiento se inicia en la base del árbol, donde cada observación forma un cluster individual. Los clusters se van combinado a medida que la estructura crece hasta converger en una única “rama” central, estos se pueden dividir en las siguientes subcategorías:

- Algoritmos que se derivan de la teoría de matrices- Algoritmos que se derivan de la teoría de grafos

1.2.2.1Algoritmos

aglomerativos (bottom-up)

Es la estrategia opuesta a los algoritmos aglomerativos, se inicia con todas las observaciones contenidas en un mismo cluster y se suceden divisiones hasta que cada observación forma un cluster individual.

1.2.2.2Algoritmos

divisivos (top-down)

En ambos casos, los resultados pueden representarse de forma muy intuitiva en una estructura de árbol llamada dendrograma.

Page 41: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

35

1.2.3 Algoritmo de agrupamiento basado en Modelos

La idea básica es seleccionar un modelo particular para cada grupo y encontrar el que mejor se ajuste a ese modelo. Existen principalmente dos tipos de algoritmos de agrupación basados en modelos, uno basado en el método de aprendizaje estadístico y el otro basado en el método de aprendizaje de redes neuronales.

Los algoritmos típicos, basados en el método de aprendizaje estadístico, son COBWEB y GMM. La idea central de COBWEB es construir un árbol de clasificación, basado en algunos criterios heurísticos, para realizar la agrupación jerárquica en el supuesto de que la distribución de probabilidad de cada atributo es independiente.

1.2.3.1

Los algoritmos típicos, basados en el método de aprendizaje de redes neuronales, son SOM y ART. La idea central de ART, un algoritmo incremental, es generar una nueva neurona dinámicamente para que coincida con un nuevo patrón para crear un nuevo grupo cuando las neuronas actuales no son suficientes.

1.2.3.2

Page 42: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

36

Es uno de los algoritmos más empleado para generar agrupaciones difusas. Se asemeja en gran medida al algoritmo de k-means, pero con dos diferencias: - El cálculo de los centroides de los clusters. La definición de centroide empleada por c-means es: la media de todas las observaciones del set de datos ponderada por la probabilidad de pertenecer al cluster.Devuelve para cada observación la probabilidad de pertenecer a cada cluster.

1.2.5.1Fuzzy

c-means (FCM)

1.2.4 Algoritmo de agrupamiento basado en Densidad Modelos

Forma de identificar clusters siguiendo el modo intuitivo en el que lo hace el cerebro humano, identificando regiones con alta densidad de observaciones separadas por regiones de baja densidad.Este es un buen algoritmo para encontrar esquemas en un conjunto de datos. Encuentra grupos de forma arbitraria en función de la densidad de puntos de datos en diferentes regiones. Separa las regiones por áreas de baja densidad para que pueda detectar valores atípicos entre los grupos de alta densidad. Este algoritmo es mejor que k-means cuando se trata de trabajar con datos de formas extrañas.

1.2.5 Agrupación Difusa

Los métodos de clustering descritos hasta ahora (K-means, agrupación jerárquica, K-medoids, CLARA…) asignan cada observación únicamente a un cluster, de ahí que también se conozcan como hard clustering. Los métodos de agrupación difusa se caracterizan porque, cada observación, puede pertenecer potencialmente a varios clusters, en concreto, cada observación tiene asignado un grado de pertenencia a cada uno de los cluster.

Page 43: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

37

Debido a que la selección del algoritmo, debe ser un proceso iterativo, es decir, se hace necesario verificar los resultados de diferentes modelos desde un enfoque estadístico y práctico, pues de esta manera se puede seleccionar el que mejor se ajuste a los datos (GUÍA), por ende, es indispensable generar diseños de prueba donde se puedan probar tales modelos y hacer un acercamiento al algoritmo que se seleccionará para trabajar. Se realizan los diseños de prueba necesarios para los algoritmos que se desee o requiera probar.

2. Generar diseño de prueba

Cuando se han generado los diseños de prueba para los diversos algoritmos y se han evaluado paralelamente de acuerdo con las métricas de desempeño definidas teniendo en cuenta la dinámica del negocio, se procede a seleccionar el modelo de segmentación a implementar y si es posible ajustar los hiperparámetros de este para mejorar su rendimiento.

3. Construcción modelo

Page 44: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

38

Esta actividad debe realizarse en paralelo a la generación de los diseños de prueba para que de esta manera al analizar los resultados arrojados por los modelos probados se puedan ir depurando lo que definitivamente se consideren que no se ajustan a los datos y así poder seleccionar el algoritmo adecuado.

4. Evaluación de métricas de desempeño

Calidad de los clustersUna vez seleccionado el número adecuado de clusters y aplicado el algoritmo de agrupación adecuado (previamente seleccionado) se tiene que evaluar la calidad de los de los mismos, de lo contrario, podrían derivarse conclusiones de agrupación que no se corresponden con la realidad. Pueden diferenciarse tres tipos de estadísticos empleados con este fin:

Emplean únicamente información interna del proceso de agrupamiento para evaluar la bondad de las agrupaciones generadas. Se trata de un proceso totalmente no supervisado ya que no se incluye ningún tipo de información que no estuviese ya incluida en el agrupamiento.

4.1Validación

interna de los clusters

La idea principal detrás del clustering es agrupar las observaciones de forma que sean similares a aquellas que están dentro de un mismo cluster y distintas a las de otros clusters, es decir, que la homogeneidad (también llamada compactness o cohesión) se lo mayor posible a la vez que lo es la separación entre clusters. Cuantificar estas dos características es una forma de evaluar cómo de bueno es el resultado obtenido.

4.2Estabilidad,

Silueta y Dunn

Page 45: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

39

Las medidas de estabilidad son un tipo particular de validación interna que cuantifican el grado en que varían los resultados de un clustering como consecuencia de eliminar, de forma iterativa, una columna del set de datos. Todas ellas son relativamente costosas desde el punto de vista computacional ya que requieren repetir el clustering tantas veces como columnas tenga el set de datos

4.2Medidas de estabilidad

Índice Dunn

Si la estructura contiene clusters compactos y bien separados, el numerador es grande y el denominador pequeño, dando lugar a valores altos de D. El objetivo por lo tanto es maximizar el índice Dunn. Esta forma de evaluar la calidad del clustering tiene un inconveniente. Si todos los clusters tienen un comportamiento ideal excepto uno, cuya calidad es baja, dado que el denominador emplea el máximo en lugar de la media, el índice estará totalmente influenciado por este cluster enmascarando al resto.

Page 46: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Combinan los resultados del agrupamiento (no supervisado) con información externa (supervisado), como puede ser un set de validación en el que se conoce el verdadero grupo al que pertenece cada observación. Permiten evaluar hasta qué punto el clustering o agrupamiento es capaz de agrupar correctamente las observaciones, aunque su uso está limitado a escenarios en los que se dispone de un set de datos de validación.

4.2Validación

externa de los clusters (ground

truth)

Estudiar la significancia de clusters consiste en calcular la probabilidad de que las agrupaciones se obtengan simplemente por azar. Se han desarrollado diferentes aproximaciones para cuantificar la significancia, algunas basadas en métodos de resampling y otras en la incorporación de información externa.

4.3Significancia de

los clusters

40

De esta manera una vez se ejecute el proceso iterativo descrito en las actividades anteriores se puede obtener el algoritmo o modelo de segmentación adecuado para el set de datos, teniendo presente que es fundamental la participación y el conocimiento de la dinámica del negocio adicional a los revisiones estadísticas y técnicas.

Page 47: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Capítulo 4: Cumpliendo el SARLAFT 4.0

Homogeneidad y heterogeneidad de los

segmentos

Page 48: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

En todos los modelos de segmentación, incluyendo los generados como parte del SARLAFT, los datos son analizados bajo la premisa de que existe similitud entre ellos, al punto de que se puedan generar grupos, sin embargo, es difícil definir cuándo el resultado de un agrupamiento es aceptable y en efecto cumple con las exigencias de la norma. Por esta razón existen técnicas e índices para la validación de una segmentación realizada.

Es por eso que luego de generar los modelos de segmentación, se debe evaluar que los segmentos obtenidos en efecto son homogéneos en su interior, lo que quiere decir que los elementos incluidos en dicho segmento sean lo más parecidos entre sí; y heterogéneos entre ellos, entendiendo que esto se cumple cuando los elementos de un segmento no se parecen a los elementos de otro segmento.

Esta evaluación de los modelos debe hacerse simultáneamente a la generación de los mismos, a fin de analizar los resultados obtenidos por los modelos probados, e ir depurando lo que definitivamente se considere que no se ajusta a los datos, para de esta manera realizar descripciones y resultados correctos de los factores segmentados.

42

Page 49: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

43

Para llevar a cabo dicha evaluación, se va a dar continuidad a lo reseñado en el capítulo 3 del Ebook: SEGMENTACIONES, UN MECANISMO DE PREVENCIÓN Y CONTROL DEL RIESGO ANTE EL LAVADO DE ACTIVOS Y FINANCIACIÓN DEL TERRORISMO, donde en el numeral 4, se expresan las métricas de desempeño de los segmentos.

Dichas métricas están divididas según el tipo de validación, la validación interna y la validación externa, y la principal diferencia es si se usa o no información externa para la validación, es decir, información que no es producto de la técnica de agrupación utilizada.

Cohesión: El miembro de cada segmento debe ser lo más cercano posible a los otros miembros del mismo segmento.

Separación: Los segmentos deben estar ampliamente separados entre ellos. Existen varios enfoques para medir esta distancia entre segmento: distancia entre el miembro más cercano, distancia entre los miembros más distantes o la distancia entre los centroides.

Métricas de validación interna

Como el objetivo de la segmentación es agrupar objetos similares en el mismo segmento y objetos diferentes ubicarlos en diferentes segmentos, las métricas de validación interna están basadas usualmente en los dos siguientes criterios:

Page 50: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Basándose en estos dos criterios, los indicadores para la validación interna utilizados frecuentemente se basan en las «sumas de cuadrados» y se caracterizan por medir o cuantificar la dispersión de los puntos a nivel inter-segmento e intra-segmento.

Estos indicadores son:

44

Ball y Hall (1965)

01.Calinski y Harabasz (1974)

02.

Hartigan (1975)

03.Xu (1997)

04.

SSWk

SSB / (k - 1)SSW / (n - k)

SSBSSWLog ( ( ( (

d * log + log (k)SSWdN2

Siendo k el número de segmentos, N el número de datos y d la dimensión de los datos.

Page 51: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Y donde:

45

Sum of Squared Within (SSW) - Medida interna especialmente usada para evaluar la cohesión de los segmentos que el algoritmo de agrupamiento generó.

Siendo k el número de segmentos, x un punto del segmento Ci y mi el centroide del segmento Ci.

Sum of Squared Between (SSB) - Es una medida de separación utilizada para evaluar la distancia intersegmento (Separación)

Siendo k el número de segmentos, nj el número de elementos en el segmento j, cj el centroide del segmento j y x es la media del data set.

dist

Page 52: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

Adicionalmente, existe otro grupo de índices o métricas internas que no tiene relación con los mencionados anteriormente y que se basan en otros criterios:

46

Coeficiente de Silhouette Donde el valor de s(x) puede variar entre -1 y 1. -1 = mal agrupamiento 0 = indiferente 1 = bueno

Índice Davies-Bouldin (DB)Donde k es el número de segmentos, es la distancia promedio entre cada punto en el segmento i y el centroide del segmento, es la distancia promedio entre cada punto del segmento j y el centroide del segmento, y d (ci , cj) es la distancia entre los centroides de los 2 segmentos. Entendiéndose que valores pequeños para el índice DB indica segmentos compactos, y cuyos centros están bien separados los unos de los otros. Consecuentemente el número de segmentos que minimiza el índice DB se toma como el óptimo.

Page 53: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

47

Métricas de validación externa

Cuando se tiene información externa tal como la clase de cada dato, es común y ampliamente utilizado el análisis donde se tiene de antemano el número de segmento y a cuál segmento pertenece cada dato.

Una vez realizado un primer agrupamiento mediante algún algoritmo para ese propósito, el algoritmo puede sugerir un nuevo agrupamiento de los datos diferente al que indicarán las clases conocidas de antemano.

Verdad

Hipótesis

PP

N

N

Teniendo el agrupamiento sugerido por el algoritmo utilizado, se contrasta ambos resultados de la siguiente forma y utilizando la siguiente tabla:

Page 54: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

VERLO AHORA

También podría interesarte nuestro:

Ebook

Enfoques de supervisión basado en riesgo del SAGRILAFT de la Superintendencia de Sociedades y el SARLAFT 4.0 de la Superintendencia Financiera de Colombia

Page 55: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

48

El siguiente concepto es el de «Falso Positivo» (FP) que hace referencia a aquellos puntos que fueron ubicados por el algoritmo en un segmento distinto y que en realidad pertenecían a otro segmento.

Se comienza a trabajar con el concepto de «VP» o «Verdadero Positivo». Este término hace referencia a aquellos puntos que fueron ubicados por el algoritmo en el mismo segmento que indicaba la clase con la que se contaba de antemano.

Se ubica en las columnas la información referente a la «Verdad», es decir, las etiquetas de las clases que se conocen de antemano. A nivel de las filas se maneja la información correspondiente al resultado del algoritmo.

Verdad

Hipótesis

PP VP

N

N

Verdad

Hipótesis

PP VP FP

N

N

Page 56: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

49

Los «Falsos Negativos» (FN) hacen referencia a aquellos elementos del segmento que fueron ubicados en un segmento diferente al que indicaba su etiqueta.

El último término a aclarar es: «Verdadero Negativo» (VN). Esto hace referencia a aquellos elementos que fueron ubicados correctamente fuera del segmento, es decir, aquellos elementos ajenos al segmento en cuestión y que efectivamente no correspondían a este.

Verdad

Hipótesis

PP VP

FNFPN

N

Verdad

Hipótesis

PP VP

FN VNFPN

N

Page 57: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

50

Con la terminología anterior aclarada es posible introducir las siguientes métricas ampliamente utilizadas y provenientes del campo de Information Retrieval (Búsqueda y recuperación): la Precisión y el Recall (rellamado).

Verdad

Hipótesis

PP VP

FN VNFPN

N

Precisión =a

a + bRecall =

aa + c

Page 58: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

60

Otra métrica utilizada para la validación externa es:

La Medida F

Con los conceptos de precisión y recall es posible definir otro tipo de métrica llamada «Medida F». Esta se da en función de las dos métricas ya vistas y puede ser interpretada como la media armónica de ambas. En particular la medida F maneja un parámetro «α» de la siguiente manera:

α = 1 media armónicaα ε (0:1) preferencia por la precisión α > 1 preferencia por el recall

F1 +

1 +

precisión

=αα

αrecall

Page 59: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

61

Finalmente, al momento de tomar la decisión de las técnicas y modelos que mejor describen el negocio de las entidades financieras que son vigiladas por la Superintendencia Financiera de Colombia, los oficiales de cumplimiento, consultores o equipo técnico deben hacer uso del conocimiento y experiencia propia del negocio, así como de los indicadores o métricas estadísticas, que permiten precisar si los modelos generados realmente describen de forma eficaz los factores de riesgo segmentados.

ReferenciaAmat Rodrigo, J. (Septiembre de 2017). Clustering y heatmaps: aprendizaje no supervisado. Obtenido de https://www.cienciadedatos.net/documentos/37_clustering_y_heatmaps#Correlaci%C3%B3nhttps://disi.unal.edu.co/~eleonguz/cursos/mda/presentaciones/validacion_Clustering.pdf

Page 60: Segmentaciones un mecanismo de prevencion y control del … · La tecnología llegó para quedarse, y el Sistema de Administración de Lavado de Activos y Financiación de Terrorismo

¿Necesitas apoyo con la segmentación de

factores de riesgo?

¡En Stradata tenemos lo que necesitas!

Contáctanoswww.aml.stradata.co [email protected] Teléfono: (57) 318 348 16 24 Medellín - Colombia