UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE...

80
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA ECONÓMICA, ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de Ingeniería Estadística APLICACIÓN DE LA TÉCNICA ESTADÍSTICA CLÚSTER K-MEDIAS PARA LA SEGMENTACIÓN ORIENTADA A COMPRENDER LAS NECESIDADES DE FINANCIAMIENTO DE CLIENTES DE UNA ENTIDAD FINANCIERA Presentado por: FRANCO RAFAEL BAZÁN PÉREZ INFORME DE SUFICIENCIA PARA OBTENER EL TÍTULO PROFESIONAL DE INGENIERO ESTADÍSTICO LIMA-PERÚ 2015

Transcript of UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE...

Page 1: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

UNIVERSIDAD NACIONAL DE INGENIERÍA

FACULTAD DE INGENIERÍA ECONÓMICA,

ESTADÍSTICA Y CIENCIAS SOCIALES

Escuela Profesional de Ingeniería Estadística

APLICACIÓN DE LA TÉCNICA ESTADÍSTICA

CLÚSTER K-MEDIAS PARA LA SEGMENTACIÓN

ORIENTADA A COMPRENDER LAS NECESIDADES DE

FINANCIAMIENTO DE CLIENTES DE UNA ENTIDAD

FINANCIERA

Presentado por:

FRANCO RAFAEL BAZÁN PÉREZ

INFORME DE SUFICIENCIA PARA OBTENER EL TÍTULO

PROFESIONAL DE INGENIERO ESTADÍSTICO

LIMA-PERÚ 2015

Page 2: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

ii

A mis padres Erwin y Gloria a

quienes les estaré eternamente

agradecido por su constante apoyo

incondicional.

Page 3: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

iii

AGRADECIMIENTOS

A mi alma mater, mis maestros y compañeros que hicieron posible cumplir este gran

reto.

Page 4: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

iv

ÍNDICE

DEDICATORIA ........................................................................................................................... ii

AGRADECIMIENTOS ................................................................................................................iii

RESUMEN .................................................................................................................................... vi

ABSTRACT ................................................................................................................................. vii

INTRODUCCION ........................................................................................................................ 1

CAPITULO I ................................................................................................................................. 3

1.1 Problemática ........................................................................................................................ 3

1.2 Formulación del problema .................................................................................................. 6

1.2.1 Problema General ......................................................................................................... 6

1.2.2 Problemas Específicos .................................................................................................. 6

1.3 Objetivos de la investigación .............................................................................................. 6

1.3.1 Objetivo General .......................................................................................................... 6

1.3.2 Objetivos Específicos ................................................................................................... 6

1.4 Justificación del estudio ...................................................................................................... 7

1.5 Limitación del Estudio ........................................................................................................ 7

1.6 Delimitación del Estudio ..................................................................................................... 8

CAPITULO II ............................................................................................................................... 9

2.1 Antecedentes de la investigación ........................................................................................ 9

2.2 Bases Teóricas ................................................................................................................... 15

2.2.1 Componentes Principales ........................................................................................... 15

2.2.2 K – medias .................................................................................................................. 17

2.3 Marco Conceptual ............................................................................................................. 19

CAPITULO III ............................................................................................................................ 22

4.1 Diseño de la investigación................................................................................................. 22

4.2 Construcción de la matriz de datos ................................................................................... 22

4.3 Preparación para el análisis ............................................................................................... 28

4.3.1 Detección de datos atípicos ........................................................................................ 28

4.3.2 Selección de variables ................................................................................................ 28

4.4 Análisis Explorativo de las variables seleccionadas ......................................................... 32

4.5 Aplicación y evaluación de la técnica ............................................................................... 47

CAPITULO IV ............................................................................................................................ 53

Page 5: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

v

5.1 Selección del número de clústeres..................................................................................... 53

5.2 Validación y Clasificación de nuevos casos. ..................................................................... 55

5.3 Caracterización de clústeres .............................................................................................. 57

CAPITULO V ............................................................................................................................. 62

6.1 Conclusiones ..................................................................................................................... 62

6.1.1 Conclusión General .................................................................................................... 62

6.1.2 Conclusiones específicas ............................................................................................ 62

6.2 Recomendaciones .............................................................................................................. 65

CAPITULO VI ............................................................................................................................ 66

BIBLIOGRAFIA ..................................................................................................................... 66

ANEXOS..................................................................................................................................... 68

Page 6: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

vi

RESUMEN

El presente informe se centró en corroborar el alto potencial con

el que cuenta la técnica de clústerización k-medias, que díó tratamiento a la

ausencia de grupos naturales dentro del conjunto de clientes de una entidad

financiera, ya que su metodología garantiza un buen desempeño para

información compleja y de gran dimensión, además que sus resultados son de

muy fácil compresión para su posterior análisis.

Adicionalmente con la aplicación de la técnica estadística clúster k-medias se

logró encontrar similitudes dentro de los grupos generados así como una óptima

particularidad de los grupos que los diferencien entre sí, el proceso incluyó

trabajar en la selección de variables que puedan diferenciar comportamientos

diversos según esta perspectiva, además se seleccionó el número idóneo de

clústeres que mejor describan los diversos comportamientos.

Se trabajó a partir de información histórica de clientes, con una

permanencia mínima de 1 año, se logró corroborar el alto potencial de la técnica

y se planteó así 7 grupos diferenciados de clientes, siendo estos: Consolidado

Ancla, Consolidado Pujante, Consolidado Agresivo, Consolidado Maduro,

Aspiracional Flemático, Aspiracional Conservador y Aspiracional Maduro.

Palabras clave: Clústerizacion, k-medias, centroide, Financiamiento,

pymes

Page 7: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

vii

ABSTRACT

This report focused on corroborating the high potential that has the

technique of k-means clústering, this technique treated the absence of natural

groups within the set of costumers of a financial institution, as its methodology

ensures a good performance for complex an high dimension information,

besides, its results are very easy to understand for further analysis.

In addition, with the application of k-means clúster methodology we will

achieve find similarities within groups generated and optimum characteristic of

groups that differ from one another, the process will include work on the

selection of variables that can differentiate different behaviors according this

perspective, besides, the selection of the best number of clústers that describes

the various behaviors.

Working from historical customer information with a minimum stay of

one year, will be achieved confirm the high potential of the technique and 7

distinct groups of customers and raised, these being: Anchor Consolidated,

Thriving Consolidated, Aggressive Consolidated, Mature Consolidated,

Phlegmatic Aspirational, Conservative aspirational and Mature aspirational.

Keywords: k-means clústering, centroids, Funding, characterization.

Page 8: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

1

INTRODUCCION

El presente informe de suficiencia se centró en la aplicación de la técnica

exploratoria de clústerización k-medias y de corroborar su alto potencial en la búsqueda

de segmentos diferenciados dando tratamiento a la ausencia de grupos diferenciados en

el conjunto de clientes de una entidad financiera. Para fundamentar la selección de la

técnica es preciso enunciar sus principales cualidades, estas se resumen en dos

conceptos; el primero es su alto rendimiento en data de gran dimensión ya sea en

variables u observaciones, y el segundo por su fácil aplicación y comprensión de los

resultados generados, estas cualidades la llevan a formar parte de las herramientas

estadísticas más usadas para la clústerización de bases de datos. Si bien este informe

tuvo como finalidad principal la búsqueda de grupos diferenciados, la aplicación

también ayudó a corroborar las cualidades que nos han hecho decidir su elección para

afrontar el problema.

El contexto bajo el cual se buscó encontrar los grupos diferenciados es

comprender las necesidades de financiamiento con las que cuentan los clientes objeto de

estudio, guiados a identificar innovadoras estrategias de posicionamiento de los

productos o servicios que se les puede ofrecer. Para diseñar estas estrategias fue

necesario generar variables que expliquen la frecuencia con la cual los clientes

consumen los productos financieros, cuales son estos productos, con cuanto monto

promedio cuentan en cada uno de ellos, cuanta participación tiene la entidad con

respecto al resto del sistema financiero, cual es el plazo promedio de crédito, etc. Por

último el estudio debería de encontrar que las variables mencionadas cuentan con algún

Page 9: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

2

tipo de relación con variables demográficas, económicas, sociales, etc., y así diferenciar

los grupos generados.

Es a raíz de esta visión y dado que en la entidad financiera de estudio no hay una

segmentación interna que se use para estos fines, que se planteó identificar los patrones

de comportamiento existentes en el financiamiento al que recurren los clientes, siendo

estos pequeños empresarios que buscan invertir en bienes o activos para llevar adelante

sus objetivos de posicionamiento en el mercado. Dentro de los principales documentos a

los que se tuvo acceso, y que forma parte de la revisión bibliográfica, está el publicado

en agosto del 2008 por la Universidad Esan, titulado Segmentación psicográfica de la

pequeña y microempresa, este estudio logró a partir de encuestas diseñadas de dos

teorías de segmentación extranjeras, comprender de mejor manera la relación casi

dependiente que tienen estas empresas con el sistema financiero y que muestra grupos

muy diferenciados de estos usuarios del crédito.

Luego de plantear los objetivos y revisar los antecedentes se procedió a reunir la

mayor cantidad información que se tenga sobre nuestros clientes y así empezar con la

preparación de la esta y posterior análisis, la data está comprendida por información del

sistema financiero peruano, información de la base de contribuyentes de Sunat y la del

sistema de ingreso de solicitudes de crédito de la entidad financiera.

El análisis arrojó conclusiones muy importantes en torno a los objetivos, se llegó

a identificar 7 grupos diferenciados de clientes que gracias al uso de la técnica clúster se

logró corroborar su homogeneidad interna y a la vez heterogeneidad entre los grupos.

La metodología estuvo compuesta por la identificación de outliers y la selección de

variables, ayudando de esta forma los resultados más exactos. Dentro de los 7 grupos se

identificó 3 que están asociados al segmento Aspiracional o Emprendedor, según la

segmentación interna de la entidad financiera, estos serán Aspiracional Flemático,

Aspiracional Conservador y Aspiracional Maduro; y cuatro al segmento consolidado,

siendo estos: Consolidado Ancla, Consolidado Pujante, Consolidado Agresivo,

Consolidado Maduro.

Page 10: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

3

CAPITULO I

1.1 Problemática

El uso de técnicas estadísticas exploratorias multivariadas ha cobrado una

relevancia muy notoria en las diversas áreas donde los procesos diarios

almacenan gran cantidad de información sin que esta pueda ser procesada y

analizada de manera efectiva para la toma de decisiones, este problema no es

ajeno a la entidad financiera en donde la falta de explotación de la información

almacenada hace que no se pueda visualizar posibles grupos naturales de

observaciones donde la dispersión general quede diversificada para su mejor

manejo y análisis. Según lo mencionado inicialmente, de las diversas técnicas

estadísticas exploratorias se usó convenientemente la de clústerización la cual

buscara que las observaciones de cada grupo sean muy similares y a la vez que

cada grupo sea lo más distinto posible de otro cualquiera.

Según Prabhdip Kaur y Shruti Aggrwal (2013) en su artículo

“Comparative Study of Clústering Techniques” los algoritmos de clústerizacion

son muy diversas y cada algoritmo posee alguna particularidad que lo puede

hace más conveniente que otro, un solo algoritmo no posee todos los

requerimientos que lo haga ser el mejor es por ello que es difícil de escoger un

solo algoritmo con un propósito en específico. Sin embargo, guiados por el

estudio mencionado, plantearemos ver el funcionamiento de la técnica de

clústerizacion k medias que está basada en el particionamiento y cuenta con las

Page 11: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

4

ventajas de tener un buen desempeño para información compleja y de gran

dimensión, además que los resultados generados son de muy fácil compresión y

posterior análisis.

Ya ilustrada la problemática estadística esta se amplió en función de la

encontrada en el campo de aplicación, encontrada a partir de mi corta

experiencia laboral dentro de áreas de inteligencia comercial y gestión de

ingresos he notado el gran potencial de información que se maneja, tanto de

información interna como las conseguidas del exterior, y que sin embargo no se

sabe dar el tratamiento que deberían de recibir para poder sacar el máximo

provecho, esta es una gran desventaja, más aun cuando se ha comprobado el

gran impacto que tienen las estrategias que van de la mano con la explotación de

información. Esta desventaja se vuelve una problemática para cualquier empresa

que no ha iniciado un correcto manejo de la información, y que sin embargo

tiene el objetivo claro de personalizar su oferta en función de las necesidades y

expectativas de sus clientes. Esta problemática, que no permite diversificar las

estrategias de captación o fidelización, se trasmite a los clientes generando

disgusto e incomodidad, como por ejemplo recibir propuestas de crédito no

acorde con sus necesidades o que en ocasiones son minúsculas que obligan a los

clientes a buscar otras opciones de financiamiento. Por todo ello las empresas

están dando prioridad a la explotación de la información para así conocer mejor

a sus clientes y poder direccionar de mejor manera sus estrategias.

Adicionalmente, fruto del análisis de ingresos en función del número de

productos la entidad financiera encontró un gran potencial dentro de su cartera

de clientes, según el grafico 1.0.1 que fue generado a partir de una muestra de

clientes caracterizados por ser de la provincia Lima y con un buen

comportamiento financiero se puede visualizar la relación entre el ingreso

promedio anual, el número de productos y el porcentaje de casos encontrados, de

la primera barra de la izquierda se puede decir que el ingreso promedio anual de

los clientes que solo cuentan con un producto financiero es de 6 mil soles,

representando estos casos el 86 por ciento del total de clientes.

Page 12: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

5

Gráfico 1.0.1 Gráfico de Sedimentación

La cantidad de clientes con dos productos financieros cae abruptamente

ya que solo representan el 12.3 por ciento, pero estos casos cuentan con un

ingreso promedio de 13 mil soles, sucesivamente se puede notar la misma

tendencia, habiendo muy pocos casos de clientes con varios productos pero que

estos en promedio generan altos ingresos a la entidad financiera. Esto es visto

como una problemática y al mismo tiempo como un potencial muy grande ya

que la concentración de clientes con un solo producto es muy elevado, y si se

realiza las correctas estrategias comerciales para la colocación de un segundo

producto o un tercero ya genera gran impacto en los ingresos de la entidad

financiera, de allí la importancia vital de comprender las necesidades para

direccionar estas estrategias.

La combinación de los puntos expuestos amplia el enfoque de la

problemática tornando más urgente su tratamiento, el impulso que da el haber

encontrado un gran potencial en los clientes que únicamente cuenta con uno o

dos productos nos lleva a la pregunta de cómo se debe de abordar, la solución

más convincente obliga a hacer uso de la información histórica que se tiene de

los clientes ya que no hay estudios previos que se hayan hecho para poder tomar

decisiones como que se debe de ofrecer a los clientes con cierto perfil o a que

grupo se debería de dar mayor prioridad y así minimizar los recursos que se

pueda invertir para solucionar esta problemática.

6 13

28

41

67

86.1%

12.3%

1.4% 0.2% 0.0% 0%

20%

40%

60%

80%

100%

0

10

20

30

40

50

60

70

1 2 3 4 6

Numero de productos financieros

Ingreso Promedio Anual (En miles de Soles) % Casos

Page 13: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

6

1.2 Formulación del problema

1.2.1 Problema General

Es necesario corroborar el óptimo desempeño de la técnica estadística k-

medias para lidiar con la ausencia de segmentos naturales en los clientes

de una entidad financiera y por consiguiente puedan mejorar sus políticas

de crédito.

1.2.2 Problemas Específicos

Es necesario confirmar que la técnica estadística k-medias es una

metodología de segmentación eficiente y conveniente para la búsqueda

de segmentos diferenciados que ayuden a comprender las necesidades de

financiamiento de los clientes de una entidad financiera.

la entidad financiera no cuenta con políticas de crédito bien dirigidas´,

partiendo de la ausencia de grupos diferenciados y correctamente

caracterizados por alguna metodología de segmentación,

1.3 Objetivos de la investigación

1.3.1 Objetivo General

Corroborar el buen funcionamiento de la técnica de clústerización k-

medias como metodología de segmentación, para dar para dar

tratamiento a la falta de grupos naturales dentro de los clientes de una

entidad financiera y además les ayude a mejorar sus políticas de crédito.

1.3.2 Objetivos Específicos

Verificar el desempeño de la técnica de clústerización k-medias para asi

corroborar que es una metodología eficiente y conveniente para la

búsqueda de segmentos diferenciados que ayuden a comprender las

necesidades de financiamiento de los clientes de una entidad financiera.

Page 14: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

7

Proponer políticas de crédito bien dirigidas, a partir de la formación de

grupos diferenciados y caracterizados mediante la técnica de

clústerizacion k-medias.

1.4 Justificación del estudio

El presente estudio se justificó en la búsqueda de corroborar el potencial

que posee la técnica de clústerización k-medias para dar tratamiento, en esta

ocasión, a la ausencia de grupos naturales dentro de un grupo de clientes de una

entidad financiera. Características como su alto potencial para ser usada en data

de alta dimensionalidad así como lo sencillo que es la lectura de sus resultados

hace que se justifique su elección de entre otras técnicas de clústerización.

El presente estudio encontró una justificación adicional en la ausencia de

una óptima metodología estadística que de tratamiento a la falta de una adecuada

segmentación de clientes de la entidad financiera, para que así sea usada de una

manera muy efectiva para sus intereses.

De cara al negocio financiero viene del lado de la solución de la

problemática antes mencionada, según la cual se espera mejorar o implementar

las estrategias comerciales sobre el ofrecimiento de productos de crédito que

estén más de acorde con las necesidades de financiamiento de los pequeños

empresarios. Estas estrategias ayudaran a generar campañas más efectivas y

mejorar el uso de los recursos por parte de la empresa financiera.

1.5 Limitación del Estudio

En cuanto a la información donde se dió aplicación a la técnica clúster k-

medias el estudio se limitó a trabajar con clientes de la entidad financiera, es

decir, provincias donde tienen sectorizados a sus clientes, estos comprenden los

departamentos de Lima, Piura, Lambayeque, Trujillo, Iquitos, Junín, Cusco,

Arequipa, Tacna.

Page 15: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

8

1.6 Delimitación del Estudio

Para generar un mejor desempeño de la técnica clúster k-medias y así

llegar a concluir de manera generalizable, el estudio se ha orientado a trabajar

con información homogénea, para ello esta ha sido delimitada, solo se incluye

pequeños empresarios que se han mantenido como clientes al menos un año

entre el periodo de noviembre 2013 a mayo 2014, además que manejaron

productos como: Líneas Revolventes, Capital de Trabajo, Créditos estaciones,

Leasing, Activo Fijo y compra de deuda.

Page 16: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

9

CAPITULO II

2.1 Antecedentes de la investigación

Los primeros antecedentes que se han incluido en esta sección están

asociados a la técnica estadística, donde se resaltó el valor e importancia que se

le atribuye a la metodología. Adicionalmente se han agregado antecedentes

secundarios que están asociadas a la aplicación y que será tomada en cuenta para

la terminología que se usara en la investigación así como para enriquecer las

conclusiones.

El Instituto de Tecnología de la India GLNA publicó el año 2012 una

investigación titulada: “A Comparative Study of Various Clústering

Algorithms in Data Mining”, la cual tiene como autores a: Verma et al,

Srivastava et al, Chack et al, Diswar et al, Gupta et al. [:10]. En este

trabajo se muestra los resultados hallados a partir de la comparación que

se realizó al correr diversas técnicas de segmentación a una conjunto de

datos bancarios relacionados a información bancaria, para de esta forma

determinar las ventajas y desventajas de cada una de las técnicas , así

como cual resulta más eficiente. La base de datos está conformada por 11

atributos y 600 observaciones, el herramienta donde se procesó la

información es el software Libre Weka. Las técnicas de segmentación

analizadas fueron las siguientes: K-Means, Segmentación Jerárquica,

Segmentación DBScan, Segmentación basada en Densidad, Optics y El

algoritmo EM.

El análisis arrojó los siguientes resultados:

Page 17: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

10

1. “El rendimiento del algoritmo k-medias incrementa cuando el

Error Cuadrático Medio disminuye y el Error Cuadrático Medio

disminuye cuando el número de clústers aumenta”.

2. “El rendimiento del Algoritmo k-medias es mejor que el

Algoritmo de Segmentación Jerárquico”

3. “Todos los algoritmos presentan alguna ambigüedad en algunos

datos (ruido) cuando segmentan”.

4. “La calidad del Algoritmo EM incrementa cuando incrementa la

información”.

5. “DBScan y Optics no tienen un eficiente desempeño en datas

pequeñas”.

6. “Los Algoritmos K-medias y EM son muy sensibles a ruidos en

la información. Este ruido hace difícil que el algoritmo encuentre

buenos clústers, afectando los resultados del algoritmo”.

7. “El Algoritmo K-medias es más rápido que cualquier otro

algoritmo y también genera resultados de alta calidad con data

extensa”.

8. “El algoritmo de segmentación Jerárquico es mas sensible al

ruido en la información”.

9. “Correr los algoritmos de segmentación en cualquier otro

software produce casi los mismos resultados aun cambiando

alguno de sus factores, esto debido a que la mayoría de software

de segmentación usan el mismo procedimiento al implementar el

algoritmo”.

En Mayo del 2012 La Revista Internacional de Aplicaciones

Informáticas publicó un estudio titulado: “Segmenting the Banking

Market Strategy by Clústering”, la cual tiene como autores a Kumar et al,

Chaitanya et al, Madhavan et al. [:10]. El objetivo que persigue esta

investigación es encontrar grupos de clientes que tengan necesidades

compartidas y así poder mejorar las estrategias de marketing.

Para que puedan alcanzar este fin el estudio fue manejado en dos fases, la

primera fase incluye la segmentación por medio de la metodología

Page 18: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

11

estadística k-medias, con la particularidad de que los clientes son

agrupados de acuerdo a las variables de la metodología de valoración de

clientes RFM, la cual gira en torno a las variables Recencia, Frecuencia y

Monto. Para la segunda fase se cuenta con variables demográficas las

cuales se usan para particionar los clústers en nuevos subclústers.

Finalmente el proceso concluye con la generación del perfil del cliente,

para ello se usa la metodología LTV (Valor de Tiempo de vida de los

clientes).

Parte del proceso de clústerización que encontramos en el estudio de

Kumar et al, Chaitanya et al, Madhavan et al.(2012) [:10], menciona:

“Consideramos los clientes registrados como n-observaciones usando

valores demográficos y a través de RFM estos son clústerizados, por

ejemplo, en cada clúster consideramos datos demográficos (estudiantes,

empleados, jubilados, granjeros, ciudadanos acomodados) y usando las

variables RFM (depósitos, disposiciones, transacciones), como valor de

media central, los clientes son agrupados”.

En conclusión los criterios presentados en este estudio logran dar una

apropiada dirección al propósito de analizar las características y

comportamientos de los clientes, de hecho se escoge y se trabaja con la

mejor herramienta de segmentación y sumado a la metodología RFM se

logra una combinación que establece una mejor relación con el cliente

para así direccionar de mejor manera las estrategias globales, mejorar la

lealtad del cliente y encontrar oportunidades para venta cruzada.

El año 2013 fue publicado en la Facultad de Ciencia Económica de la

Universidad de rumana de Oradea un estudio titulado “Segmentación de

la cartera de pequeñas y medianas empresas en el Sistema Bancario”

escrito por Namolosu Simona Mihaela [:7]. Este documento gira en torno

a encontrar el mejor método para diseñar e implementar las óptimas

estrategias de marketing, para ello, basado en evidencia empírica, nos

detalla los métodos y características que se deben de considerar en la

Page 19: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

12

segmentación, la cual finalmente son de gran valor para definir las

óptimas estrategias de marketing que a la vez tiene como objetivo

minimizar las perdidas e incrementar la rentabilidad de todo las cartera

de pequeños y medianos empresarios.

Namolosu (2013) resume el proceso en tres partes: El primero es

comprender el modelo de servicio del sistema bancario para los pequeños

y medianos empresarios, esto comprende el análisis y segmentación del

portafolio que se centra inicialmente en diferenciar a los clientes con

señales negativas y aquellos con baja o nula actividad, para que puedan

ser excluidos. Luego de esto se plantea y ejecuta la segmentación en base

a características de la compañía así como comportamiento financiero, el

propósito será identificar comportamientos comunes, para establecer las

estrategias en términos de rentabilidad, luego se realiza la caracterización

de los productos ofrecidos a la empresa, previamente se muestra que la

dependencia entre las características de la compañía y el servicio es alta,

las satisfacción de las pequeñas empresas son más fáciles de identificar,

anticipar y diseñar, mientras que de las medianas es recomendable tener

en cuenta las características estándares y las características

personalizadas, dentro de este punto también es importante el grado de

satisfacción generado por medio del asesor financiero quien deberá de

responder a las expectativas del cliente y más aún anticiparse a sus

necesidades futuras ya que eso definirá la toma o no de crédito.

El segundo punto mostrado es sobre la aplicación de la segmentación y el

diseño de las estrategias de crédito, para esto inicialmente se caracteriza a

los grupos de productos para su mejor entendimiento así como entender

como es la gestión de riesgos la cual varia por producto y por tipo de

empresa, otro punto a tener en cuenta es la medición de la rentabilidad

por crédito o producto, por ultimo una vez definido todos los segmentos

se definirán las estrategias tomando en cuenta el potencial de cada

segmento, principalmente su capacidad de crear un posicionamiento

especial.

Page 20: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

13

Como tercer punto se procede a la medición de resultados, esto a partir

de los escenarios planteados a manera de piloto según las estrategias, el

seguimiento se hace en un periodo determinado y mediante umbrales de

éxito, dependiendo de la rentabilidad y éxito de las estrategias, se hizó el

análisis y monitoreo de los segmentos, para así optimizar los resultados.

Finalmente se puede decir que debido al modelo bancario presente en

Rumania el cual es muy similar al interno, estas estrategias y métodos

pueden ser reflejados sin problema hacia nuestro entorno financiero.

El estudio publicado en la Universidad Esan lleva por título

Segmentación psicográfica de la pequeña y microempresa realizado por

Matute et al., Bohorquez et al., Carbajal Díaz et al., Espinoza et al.,

Jiménez et al. (2008) [:6]. Este estudio tenía como objetivo identificar los

tipos de mype existentes en la ciudad de Lima Metropolitana, con el fin

de definir los lineamientos que sirvan de base para el desarrollo de

productos financieros y de crédito, de acuerdo a las necesidades del

micro y pequeño empresario y según el segmento en que se encuentre.

Entre los objetivos secundarios del estudio también se encuentra:

Determinar las características del crédito ofrecido en la actualidad,

identificar las principales fuentes de financiamiento, conocer las

necesidades de financiamiento no cubiertas por las entidades financieras

y los atributos del crédito que más valoran los micro empresarios.

El trabajo realizado por Matute et al., Bohorquez et al., Carbajal Díaz et

al., Espinoza et al., Jiménez et al. es resumido en los siguientes párrafos.

El estudio se sustenta bajo dos teorías de segmentación. En primer lugar,

el estudio realizado por Ichak Adizes el año 2001 sobre el ciclo de vida

de las organizaciones, la cual indica que sin importar su tamaño, las

empresas se enfrentan a diez etapas a lo largo de su ciclo de vida, estas

son: Noviazgo, Infancia, Go-Go, Adolescencia, Plenitud, Estabilidad,

Aristocracia, Burocracia temprana, Burocracia, Muerte. En segundo

lugar, la investigación sobre estilos de vida (Euro-Socio-Styles)

desarrollado por el grupo multinacional de investigación de mercados

Page 21: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

14

Gesellschaft für Konsumforschung (grupo GfK) de Alemania, trata de

sintetizar las diversas facetas que se presentan en la vida social y

económica de las personas en base a encuestan realizadas a lo largo de

Europa. Este estudio segmenta a las personas se acuerdo a sus estilos de

vida, expectativas, valores y ambientes en los que se desenvuelven,

agrupándolas en cuatro dimensiones: mirage, permanence,

metamorphosis y reality; sin embargo una persona puede compartir los

valores de diferentes dimensiones, identificándose ocho grandes grupos

llamados estilos sociales.

El levantamiento de información con miras a este estudio se realizó

mediante un cuestionario el cual fue preparado considerando: tipología

de empresa, perfil del empresario, requerimientos de servicio y requisitos

para los productos financieros por parte del empresario, actitudes hacia la

banca, relación con las entidades financieras, MSB (marketing de

servicios bancarios), hábitos crediticios, estilos de vida y otros datos

generales. El cuestionario final costa de 16 partes y 139 preguntas en

total.

La metodología de análisis comprende el uso de análisis factorial de la

información recolectada en la encuesta, y luego el análisis de estos

mediante la técnica de segmentación clúster jerárquico, utilizando el

método aglomerativo.

Finalmente del análisis clúster se logró identificar siete segmentos: los

conservadores, los conformistas, los materiales, los maduros, los

flemáticos, los estables y los progresistas. Esta denominación está basada

en las características más resaltantes de la empresa y del empresario

obtenidas a partir de las encuestas, dentro de ellas se puede mencionar:

edad, grado de instrucción, situación financiera, rubro al que se dedica,

tamaño de la empresa, etc.

Hace más de tres años la entidad financiera solicito a una consultora

realizar un estudio de sus clientes para enfocar sus estrategias a

segmentos según el nivel de ventas, es decir, con esto se logró determinar

Page 22: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

15

los rangos de ventas anuales de los clientes para así agruparlos y darles

un tratamiento diferenciado al momento de la evaluación de los créditos.

La segmentación arrojo tres grupos: Los emprendedores, los aspiraciones

y los consolidados: El nivel de ventas para los emprendedores va desde

350 mil soles hasta 1 millón de soles, para los aspiraciones de 1 millón

hasta 3 millones y los consolidados de 3 millones hasta 5 millones. Esta

segmentación logro que se manejara las opciones de endeudamiento de

los clientes con políticas de crédito diferenciadas, sin embargo, no genera

valor para las estrategias más elaboradas donde se aspira llegar a

comprender y prever las necesidades de nuestros clientes.

2.2 Bases Teóricas

2.2.1 Componentes Principales

En el desarrollo del estudio se verá involucrado la necesidad de

recurrir al análisis de componentes principales que nos ayudara a

quedarnos con las mejores variables, guiados por la reducción de la

dimensionalidad.

De la mano de la notación y conceptos usada por Alan Julian (2008) [:1]

se dará detalle al desarrollo resumido de la técnica.

“En situaciones donde se ve involucrada alta dimensión de la data es

donde consideramos la posibilidad de proyectar esta información en un

subespacio de menor dimensionalidad sin perder información

importante”.

“Es de esta manera que Hotelling en el año de 1933 propuesto el método

lineal de proyección que hasta hoy conocemos como análisis de

componentes principales (PCA)”.

Page 23: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

16

“PCA fue introducida como una técnica para derivar un conjunto de

proyecciones lineales ortogonales de una única colección de variables

correlacionadas, , donde las proyecciones son ordenadas

de acuerdo a la disminución de la variabilidad”.

“PCA no está estrictamente ligado a la reducción de la dimensional dad,

también es usado como técnica de construcción de variables y además a

la identificación de características variables importantes de la

información”.

A continuación se detalla la técnica según la notación usada por Alan

Julian (2008).

“Asumimos que el vector aleatorio de dimensión r.

Tiene media y matriz de covarianza ). El análisis de

componentes principales busaca remplazar el conjunto de variables de

entrada (desordenadas y correlacionadas) , , por un conjunto de

proyecciones lineales (ordenadas y no correlacionadas),

), de las variables de entrada,

Donde se minimizara la perdida de información debido al remplazo.

En el análisis de componentes principales, “información” es interpretada

como el “total de variación” de las variables de entrada iniciales.

Del teorema de descomposición espectral, se puede escribir:

, ,

Page 24: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

17

Donde la matriz diagonal tiene como elementos de la diagonal a los

autovalores, , de , y las columnas de son los eigenvectores de

. Por lo tanto, la varianza total es la .

El -esimo vector coeficiente, es escogido con tal de

que:

o Las primeras proyecciones lineales de son puntuadas

en importancia a través de sus varianzas , las cuales son

ordenadas en orden decreciente de magnitud:

.

o no esta correlacionado con ningún .

Las proyecciones lineales son conocidas como las primeras componentes

principales de ”.

2.2.2 K – medias

El algoritmo clúster que será escogido para el análisis es el de k-medias

la cual es muy reconocida por su potencial por su extrema eficiencia para

conjunto de datos muy grande.

Debido a que se usó el software estadístico SPSS [:5] para el análisis,

inicialmente se explicará cómo este seleccionó los puntos iniciales para luego

continuar con el algoritmo de la técnica.

“Se considera la siguiente notación para la elección de los centroides

iniciales:

Numero de clústeres requerido

Media del -esimo clúster

Vector de la -esima observación

Distancia Euclidea entre los vectores

Page 25: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

18

, mínima distancia entre centros

Para seleccionar los centroides iniciales se realiza una simple pasada de

los datos, los valores de los primeros casos que no sean valores perdidos son

asignados como centros iniciales, para los casos restantes se procede como

sigue:

Si > y > , entonces remplaza a

. Si > y < , entonces remplaza a

; esto es quiere decir: si la distancia en entre la observación analizada ( ) y

el centroide más cercano es más grande que la distancia entre los centroides más

cercanos ( ), entonces remplaza a , el que este más cerca a

.

Si no remplaza un centroide una segunda prueba es realizada:

Sea el centroide más cercano a .

Sea el segundo centroide más cercano a .

Si > , entonces ;

Esto quiere decir, si esta más alejado del segundo centroide más

cercano que el centroide más cercano esta de cualquier otro centroide,

remplaza al centroide más cercano.

Al final de la pasada de todas las observaciones, los centroides iniciales de todos

los clústeres son definidos”.

Una vez que se cuenta con los centroides iniciales lo que se busca es ir

reasignando observaciones a los clúster preformados hasta minimizar la suma de

cuadrados del error (EES). El proceso culminara cuando ninguna reasignación

adicional reduzca el valor de EES.

Según Alan Julian (2008) [:1] el proceso puede ser resumido en los siguientes

pasos:

1.- Observaciones

Page 26: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

19

2.- Hacer uno de los siguientes puntos:

Realizar una asignación aleatoria de las observaciones dentro de los K

clústeres y, para cada clúster, calcular su actual centroide,

Pre especificar los K centroides

3.- Calcular la Distancia Euclidea al Cuadrado (ESS) para cada uno de los

observaciones hacia su actual centroide:

donde es el k-ésimo centroide y es el clúster conteniendo .

4.- Reasignar cada observación al centroide más cercano con la finalidad de que

ESS es reducido en magnitud. Actualizar el centroide de cada clúster después de

la reasignación.

5.- Repetir los pasos 3 y 4 hasta que no sea posible realizar una reasignación

adicional.

Si adicionalmente se considerá cierto número de iteraciones y con

cierto nivel de convergencia , según el software SPSS el algoritmo parará

cuando el máximo número de iteraciones es alcanzado o cuando el máximo

cambio de centroide de clúster en dos iteraciones sucesivas es más pequeña que

veces la mínima distancia entre los centroides iniciales.

2.3 Marco Conceptual

Dentro del Marco Teórico se ha mencionado algunos términos

estadísticos además de otros asociados a la técnica, estos se definen a

continuación.

Page 27: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

20

Clústerización o Segmentación: Consiste en la división de una base de datos en

diversos grupos, diferenciados unos de otros, pero que al mismo tiempo cada

grupo contenga unidades similares entre sí.

Clúster o Segmento: También es conocido como conglomerado final, proviene

del proceso de Clústerización y cada uno se caracteriza por contener unidades

similares entre sí, el conjunto de Clústeres da como resultado la base de datos

inicial.

Centroide: Es un concepto geométrico, en la metodología de la Clústerización se

usa para definir al centro multivariado de cada Clúster, es decir es un vector que

contiene las medias por variable de cada Clúster.

PCA: Son las siglas en ingres de Análisis de Componentes Principales, es una

técnica para reducir la dimensionalidad de un conjunto da datos, para los fines

del trabajo ha sido usada además para identificar a las principales variables.

ESS: Es la distancia al cuadrado del error (alejamiento de la observación al

centroide), esta es una medición de dispersión basada en la distancia euclidea

para así determinar el nivel de agrupamiento que existe dentro de cada clúster.

Distancia Euclidea: Es una distancia geométrica usada para calcular la distancia

entre dos puntos, dentro de la metodología es usada para ver la cercanía de una

observación hacia los centros de los clúster, y según esto incluir la observación

al clúster más cercano.

Adicional a estos conceptos es también necesario introducir los que provienen

del ámbito de aplicación, parte de estos términos definen la segmentación

interna que se ha venido usando dentro de la entidad así como la descripción de

los productos que son parte del análisis.

Cliente: Pequeño Empresario que cuenta con algún producto financiero: Capital

de Trabajo, Línea Revolvente, Compra de Deuda, Activo Fijo, Leasing y Crédito

Estacional.

Page 28: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

21

Pequeño Empresario: Persona Jurídica (con RUC) o Persona Natural con

Negocio (con DNI) que presenta un nivel de ventas por encima de los 500 mil

soles anules y que no supera los 5 millones.

Segmento Aspiracional (S1/S2): Este segmento está conformado por los

clientes con nivel de ventas entre 500 mil soles y los 3 millones de soles.

Segmento Consolidado (S3/M1): Este segmento está conformado por los

clientes con nivel de ventas entre los 3 millones de soles y los 5 millones

de soles.

Capital de Trabajo: Es un pagare a un plazo promedio de 18 meses, plazo fijo.

Línea Revolvente: Es similar a un capital de trabajo, su valor agregado es que a

medida que se va cancelando el préstamo el monto de la línea se va liberando y

el crédito puede ser reutilizado.

Crédito Estacional: Tiene las misma características de un capital de trabajo, con

la diferencia de que este se maneja a plazos, de 3 a 6 meses.

Activo Fijo: Usado para la adquisición de bienes muebles o inmuebles. Los

plazos para este tipo de operaciones son en general mayores a 24 meses.

Leasing: También conocido como arrendamiento financiero, usado para la

adquisición de bienes muebles o inmuebles con la característica de que a pesar

de que el bien es adquirido al inicio de la operación este no es propiedad del

cliente hasta que el crédito no es cancelado y se haga efectivo un monto

adicional, en caso de no ser abonado este monto el bien queda a propiedad de la

entidad financiera.

Compra de Deuda: Son operaciones que derivan de la transmisión de la deuda de

otra entidad financiera, es similar a un capital de trabajo y generalmente cuenta

con tasas bajas.

Page 29: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

22

CAPITULO III

4.1 Diseño de la investigación

El presente trabajo de investigación es de tipo Aplicación, ya que se

centró en encontrar grupos diferenciados de clientes partiendo del uso de la

técnica clúster k-medias, es decir se aplicó la metodología de la técnica una vez

hallado consenso en cuanto a las ventajas que posee para el tipo de información

que se posee.

El nivel del presente trabajo es, por los objetivos planteados, de tipo

Descriptivo ya que a partir de los grupos diferenciados que se obtendrá con la

aplicación de la técnica clúster k-medias se procederá a describir cada uno de

ellos y así queden definidos para su manejo posterior.

Por ultimo le presente trabajo tiene un diseño Observacional y

Longitudinal, debido a que se ha analizado información histórica en un

determinado periodo de tiempo, es decir, para llegar a los objetivos propuestos

se ha observado el comportamiento de las distintas variables asociadas a las

necesidades de financiamiento por medio de la técnica clúster k- medias.

4.2 Construcción de la matriz de datos

La fuente de información que da base al análisis son 2, la primera es la

base transaccional de créditos que es alimentada por el sistema internos de

Page 30: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

23

ingreso de solicitudes de crédito y la otra es el Registro Consolidado de Crédito

(RCC) que es proporcionada por la SBS.

Más adelante se verá detalladamente las variables extraídas desde ambas

fuentes, por lo tanto se explicará los periodos y tratamiento que se dio a las

observaciones para poder alcanzar los objetivos propuestos

Se dio prioridad a la generalización de resultados, es decir, encontrar la

forma conveniente de evitar encontrar grupos de observaciones con un

comportamiento sesgado causado por condiciones temporales que podrían

influenciar un comportamiento diferenciado a lo natural. Con esta finalidad cada

observación se generó en función de un horizonte de un año y por ser un estudio

comportamental se alarga el ancho temporal en 18 meses, de manera que

pudieron haberse generado hasta un máximo de 7 observaciones por cliente, esto

siempre y cuando cumplieron con las especificaciones de nuestro estudio

mostrados en la delimitación.

Gráfico 4.0.1 Construcción de la matriz de datos

En cuanto a la matriz de datos de las variables cualitativas para la

caracterización, estas se extrajeron del último periodo de análisis por ser estas en

su mayoría características de los negocios obtenidas al momento de llenar las

solicitudes de crédito, las cuales eras perdurables en el periodo propuesto.

La matriz final de datos consta de 40,668 observaciones con las siguientes

variables.

Page 31: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

24

Tabla 4.0.1 Variables

DESCRIPCIÓN

NOMBRE DE

VARIABLE TIPO

VA

RIA

BL

ES

CO

MP

OR

TA

ME

NT

AL

ES

IN

ICIO

DE

L P

ER

IOD

O

Meses desde el último

periodo MESES_ULTIMO_DESEMB Numérica

Número de productos NRO_PRODUCTOS_INICIO Numérica

Cantidad de créditos

Capital de Trabajo CAPITAL_SI_INICIO Numérica

Cantidad de créditos Línea

Revolvente LINEA_SI_INICIO Numérica

Cantidad de créditos

Estacionales ESTACIONAL_SI_INICIO Numérica

Cantidad de créditos

Leasing LEASING_SI_INICIO Numérica

Cantidad de créditos

Activo Fijo ACTIVO_SI_FIJO_INICIO Numérica

Cantidad de créditos

Compra de Deuda COMPRA_SI_DEUDA_INICIO Numérica

Monto total desembolsado MONTO_TOTAL_INICIO Numérica

Cuota total mensual CUOTA_TOTAL_INICIO Numérica

Saldo deudor total SALDO_TOTAL_INICIO Numérica

Máximo número de cuotas NROCUOTAS_MAX_INICIO Numérica

Número de cuotas del

Capital de Trabajo CAPITAL_NROCUOTAS_INICIO Numérica

Número de cuotas del

Línea Revolvente LINEA_NROCUOTAS_INICIO Numérica

Número de cuotas del

Estacionales ESTACIONAL_NROCUOTAS_INICIO Numérica

Número de cuotas del

Leasing LEASING_NROCUOTAS_INICIO Numérica

Número de cuotas del

Activo Fijo ACTIVO_FIJO_NROCUOTAS_INI

CIO Numérica

Page 32: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

25

Número de cuotas del

Compra de Deuda COMPRA_DEUDA_NROCUOTAS

_INICIO Numérica

VA

RIA

BL

ES

CO

MP

OR

TA

ME

NT

AL

ES

FIN

AL

DE

L P

ER

IOD

O

Número de productos NRO_PRODUCTOS_FIN Numérica

Monto total desembolsado MONTO_TOTAL_FINAL Numérica

Cuota total mensual CUOTA_TOTAL_FINAL Numérica

Saldo deudor total SALDO_TOTAL_FINAL Numérica

Saldo deudor Capital de

Trabajo CAPITAL_SALDO_FINAL Numérica

Saldo deudor Línea

Revolvente LINEA_SALDO_FINAL Numérica

Saldo deudor Estacional ESTACIONAL_SALDO_FINAL Numérica

Saldo deudor Leasing LEASING_SALDO_FINAL Numérica

Saldo deudor Activo Fijo ACTIVO_FIJO_SALDO_FINAL Numérica

Saldo deudor Compra de

Deuda COMPRA_DEUDA_SALDO_FINA

L Numérica

Máximo número de cuotas NROCUOTAS_MAX_FINAL Numérica

Número de cuotas del

Capital de Trabajo CAPITAL_NROCUOTAS_FINAL Numérica

Número de cuotas del

Línea Revolvente LINEA_NROCUOTAS_FINAL Numérica

Número de cuotas del

Estacionales ESTACIONAL_NROCUOTAS_FINAL Numérica

Número de cuotas del

Leasing LEASING_NROCUOTAS_FINAL Numérica

Número de cuotas del

Activo Fijo ACTIVO_FIJO_NROCUOTAS_FIN

AL Numérica

Número de cuotas del

Compra de Deuda COMPRA_DEUDA_NROCUOTAS

_FINAL Numérica

VA

RIA

BL

ES

CO

MP

OR

TA

ME

NT

AL

E

S C

AL

CU

LA

DA

S D

EL

PE

RIO

DO

Número de Desembolsos DESEMBOLSOS_PERIODO Numérica

Número de productos

manejados a lo largo del

periodo

NRO_PRODUCTOS Numérica

Número de desembolsos CAPITAL_DESEMBOLSOS_PERI Numérica

Page 33: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

26

Capital de Trabajo ODO

Número de desembolsos

Línea Revolvente LINEA_DESEMBOLSOS_PERIOD

O Numérica

Número de desembolsos

Estacionales ESTACIONAL_DESEMBOLSOS_P

ERIODO Numérica

Número de desembolsos

Leasing LEASING_DESEMBOLSOS_PERIODO Numérica

Número de desembolsos

Activo Fijo ACTIVO_FIJO_DESEMBOLSOS_PERIODO Numérica

Número de desembolsos

Compra de Deuda COMPRA_DEUDA_DESEMBOLS

OS_PERIODO Numérica

Saldo deudor total

promedio SALDO_TOTAL_PROMEDIO Numérica

Saldo deudor promedio

Capital de Trabajo CAPITAL_SALDO_PROMEDIO Numérica

Saldo deudor promedio

Línea Revolvente LINEA_SALDO_PROMEDIO Numérica

Saldo deudor promedio

Estacional ESTACIONAL_SALDO_PROMED

IO Numérica

Saldo deudor promedio

Leasing LEASING_SALDO_PROMEDIO Numérica

Saldo deudor promedio

Activo Fijo ACTIVO_FIJO_SALDO_PROMEDIO Numérica

Saldo deudor promedio

Compra Deuda COMPRA_DEUDA_SALDO_PRO

MEDIO Numérica

Máximo número de cuotas NROCUOTAS_MAX_PERIODO Numérica

Número de cuotas del

Capital de Trabajo CAPITAL_NROCUOTAS_PERIODO Numérica

Número de cuotas del

Línea Revolvente LINEA_NROCUOTAS_PERIODO Numérica

Número de cuotas del

Estacionales ESTACIONAL_NROCUOTAS_PE

RIODO Numérica

Número de cuotas del

Leasing LEASING_NROCUOTAS_PERIOD

O Numérica

Número de cuotas del ACTIVO_FIJO_NROCUOTAS_PE Numérica

Page 34: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

27

Activo Fijo RIODO

Número de cuotas del

Compra de Deuda COMPRA_DEUDA_NROCUOTAS_PERIODO Numérica

Número de meses con

algún producto activo MESES_ACTIVO Numérica

Número de meses con

saldo mayor a 0 TOTAL_CON_SALDO Numérica

Mínimo saldo deudor MIN_TOTAL_SALDO Numérica

Máximo saldo deudor MAX_TOTAL_SALDO Numérica

Número de Disposiones de

Línea NUMERO_DISPOSICIONES_LINEA Numérica

Diferencia entre saldo final

e inicial SALDO_DIFER Numérica

VA

RIB

LE

S R

CC

Última deuda del Sistema

Financiero MIMEPE_ULTIMO Numérica

Ultima deuda de la entidad

financiera MIMEPE_IBK_ULTIMO Numérica

Diferencia de la

participación de deuda DIFER_SOW Numérica

Deuda Promedio del

Sistema Financiero MIMEPE_PROMEDIO Numérica

Máxima Línea de Tarjeta

de crédito del periodo MAX_LINEA_TCCONSUMO Numérica

Número de entidades con

las que manejo deuda MAX_NRO_ENT Numérica

VA

AR

IBL

ES

DE

L N

EG

OC

IO Edad del Titular o

Representante Legal EDAD Numérica

Venta Anual evaluada VENTA_ANUAL_EVALUADA Numérica

Número de Empleados NumEmpleados Numérica

Número de Sucursales NumSucursales Numérica

Meses de antigüedad en la

Entidad Financiera MESES_ANTIGUEDAD_BPE Numérica

Meses de experiencia en su

giro de negocio MESES_EXPERIENCIA_GIRO Numérica

Page 35: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

28

Meses de inicio del

negocio MESES_INICIO_NEGOCIO Numérica

4.3 Preparación para el análisis

Antes de seguir con los siguientes puntos de esta sección es importante

mencionar que para el presente estudio no se encontraron datos faltantes en

ninguna variable por lo cual no fue necesario utilizar ninguna técnica de

imputación, exclusión de variables u observaciones.

4.3.1 Detección de datos atípicos

La metodología que se utilizó para la detección de valores

atípicos multivariados es k-medias que es recomendada y aplicada por

Mandouh [:3] en el apartado Identificación de outliers usando

Clusterización, dado que, a pesar de ser una tecnica exploratoria, la

segmentación es muy sensible a la existencia de outliers, es así que se

sacó ventaja para la detección de estos, tal como sugiere Montgomery

[:2].

El proceso consiste en solicitar un gran número de clústeres (en

este caso 50 clúster) y aquellos clúster con menos observaciones y con

mayor distancia entre los demás clúster serán potenciales outlier

multivariados.

Los 50 clústeres fueron generados en el anexo I, para determinar

que grupos son excluidos se ha decidido convenientemente que sean

aquellos que cuentan con una frecuencia no mayor a 0.4 por ciento del

total de datos, marcando así 36 clúster que en total concentran 1,121

observaciones, 2.7 por ciento del total de observaciones.

4.3.2 Selección de variables

Con la finalidad de excluir aquellas variables correlacionadas se

optó por utilizar el análisis de factores mediante la técnica multivariada

Page 36: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

29

de componentes principales propuesta por Ester Gutiérrez y Luis Onieva

[:5]. Ademas, el análisis de componentes principales es recomendado por

Alan Izenman (2008) [:1] como herramienta para la construcción de

variables y selección de variables principales. El procedimiento

comprende primero identificar aquellos componentes que representan la

mayor variabilidad de la data para luego de cada componente extraer la

variable más representativa, esto en función del valor de su coeficiente en

valor absoluto, la selección de realiza de entre los tres mayores,

decidiendo en función de su interpretación futura. Con esta metodología

práctica es posible lidiar con la correlación de variables y al mismo

tiempo seleccionar aquellas donde se concentra la mayor cantidad de

información.

Gráfico 4.0.2 Gráfico de Sedimentación

Page 37: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

30

Tabla 4.0.2 Varianza Explicada

Total Variance Explained

Component

Rotation Sums of Squared Loadings

Total % of Variance Cumulative %

1 9.434 12.413 12.413

2 5.473 7.202 19.614

3 5.061 6.659 26.274

4 4.780 6.290 32.563

5 4.680 6.158 38.721

6 4.496 5.915 44.637

7 3.390 4.461 49.098

8 3.059 4.025 53.122

9 3.021 3.975 57.097

10 2.966 3.903 61.000

11 2.565 3.375 64.375

12 2.436 3.205 67.580

13 2.352 3.095 70.675

14 2.266 2.981 73.656

15 2.161 2.843 76.500

16 1.826 2.402 78.902

17 1.328 1.748 80.650

Visualizando el grafico de sedimentación se decide trabajar con

13 componen entes a pesar que se sugiere en un comienzo 17

componentes, la decisión se soporta en la visualización del gráfico y el

criterio experto.

Los 13 componentes constituyen, según el porcentaje de varianza

acumulado, e 70.6 por ciento de la variabilidad de la data.

Page 38: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

31

En anexo 2 se puede observar la totalidad de los coeficientes

hallados del análisis de componentes principales, y según esta

metodología se opta por escoger las siguientes variables.

Tabla 4.0.3 Variables Seleccionadas

COMPONEN

TE

VARIABLE

SELECCIONADA

N° VARIABLES

ADICIONALES

1 SALDO_TOTAL_PROM

EDIO

1 CAPITAL_SI_INICIO

2 ACTIVO_FIJO_SI_INICI

O

2 ESTACIONAL_DESEMB

OLSOS_PERIODO

3 CUOTA_TOTAL_FINAL

3 NRO_PRODUCTOS_INIC

IO

4 LINEA_SI_INICIO

5

CAPITAL_DESEMBOLS

OS_PERIODO

6 LEASING_SI_INICIO

7

LINEA_DESEMBOLSOS

_PERIODO

8

COMPRA_DESEMBOLS

OS_PERIODO

9

ACTIVO_FIJO_DESEMB

OLSOS_PERIODO

10

COMPRA_DEUDA_SI_I

NICIO

11 MIMEPE_PROMEDIO

12

ESTACIONAL_SI_INICI

O

13

LEASING_DESEMBOLS

OS_PERIODO

Adicionalmente se ha agregado 3 variables que debido a las ya

ingresadas se ha visto conveniente incluir y así también facilitar las

futuras conclusiones. Se ha verificado de todos modos que estas no

tengan algún rastro de correlación significativa.

Page 39: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

32

4.4 Análisis Explorativo de las variables seleccionadas

Como paso previo al análisis clúster se realizó una inspección

descriptiva de las variables seleccionadas, de manera que se podrá comprender

su comportamiento.

Saldo deudor total promedio

Tabla 4.0.4 Estadísticos Descriptivos de Saldo Deudor Total Promedio

Promedio 75,200

Mediana 54,733

Std. Dst. 85,378

Varianza 7,289,333,913

C.V. 1.14

Asimetría 4.23

Kurtosis 26.288

Gráfico 3.0.3 Histograma de Saldo Deudor Total Promedio

Page 40: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

33

Los valores de esta variable son de una magnitud muy amplia por lo que

se ve reflejado en su varianza, sin embargo también es muy dispersa tal y como

se deduce de su Coeficiente de variación (>1).

Cuota total mensual al final del periodo

Tabla 4.0.5 Estadísticos Descriptivos de Cuota Mensual al final del periodo

Promedio 8,140

Mediana 5,527

Std. Dst. 12,806

Varianza 163,988,392

C.V. 1.57

Asimetría 8.65

Kurtosis 108.057

Gráfico 4.0.4 Histograma de Cuota Mensual al final del periodo

Page 41: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

34

El comportamiento de esta variable es bastante similar a la que se mostró

anteriormente, valor alto de varianza y un coeficiente de variación aún más alto

por lo cual se deduce que es más variable o heterogéneo.

Deuda Promedio del Sistema Financiero

Tabla 4.0.6 Estadísticos Descriptivos de Deuda Promedio del SSFF

Promedio 217,619

Mediana 146,902

Std. Dst. 226,828

Varianza 51,450,894,583

C.V. 1.04

Asimetría 2.35

Kurtosis 7.364

Gráfico 4.0.5 Histograma de Deuda Promedio del SSFF

Page 42: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

35

A diferencia de las anteriores variables esta es más homogénea, cuenta

con un CV mas moderado pero que sin embargo no deja de ser en magnitud alto.

Su coeficiente de asimetría confirma que su distribución se aleja de normal con

una cola alargada hacia la derecha.

Número de productos al inicio del periodo

Tabla 4.0.7 Tabla de Frecuencias de Número de productos al inicio del periodo

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

1 35934 88.4 88.4 88.4

2 4447 10.9 10.9 99.3

3 277 .7 .7 100.0

4 10 .0 .0 100.0

Total 40668 100.0 100.0

Gráfico 4.0.6 Histograma de Número de productos al inicio del periodo

Page 43: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

36

Cerca del 90 por ciento de los clientes, en su periodo de análisis,

realizaron un único desembolso, seguido de lejos por un 10 por ciento de

clientes que realizaron más de dos desembolsos.

Cantidad de créditos capital de trabajo al inicio del periodo

Tabla 4.0.8 Tabla de Frecuencias de Cantidad de créditos capital de trabajo al inicio del periodo

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

0 26734 65.7 65.7 65.7

1 13934 34.3 34.3 100.0

Total 40668 100.0 100.0

Gráfico 4.0.7 Histograma de Cantidad de créditos capital de trabajo al inicio del periodo

Al inicio del periodo 34 por ciento de clientes contaban con 1 crédito Capital de

Trabajo.

Page 44: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

37

Cantidad de créditos Línea Revolvente al inicio del periodo

Tabla 4.0.9 Tabla de Frecuencias de Cantidad de créditos línea revolvente al inicio del periodo

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

0 21261 52.3 52.3 52.3

1 19407 47.7 47.7 100.0

Total 40668 100.0 100.0

Gráfico 4.0.8 Histograma de Cantidad de créditos línea revolvente al inicio del periodo

Al inicio del periodo 48 por ciento de clientes contaban con 1 crédito Línea

Revolvente.

Page 45: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

38

Cantidad de créditos Estacionales al inicio del periodo

Tabla 4.0.10 Tabla de Frecuencias de Cantidad de créditos estacionales al inicio del periodo

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

0 39713 97.7 97.7 97.7

1 955 2.3 2.3 100.0

Total 40668 100.0 100.0

Gráfico 4.0.9 Histograma de Cantidad de créditos estacionales al inicio del periodo

Al inicio del periodo 2 por ciento de clientes contaban con 1 crédito Estacional.

Page 46: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

39

Cantidad de créditos Leasing al inicio del periodo

Tabla 4.0.11 Tabla de Frecuencias de Cantidad de créditos leasing al inicio del periodo

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

0 37909 93.2 93.2 93.2

1 2759 6.8 6.8 100.0

Total 40668 100.0 100.0

Gráfico 4.0.10 Histograma de Cantidad de créditos leasing al inicio del periodo

Al inicio del periodo 7 por ciento de clientes contaban con 1 crédito Leasing.

Page 47: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

40

Cantidad de créditos Activo Fijo al inicio del periodo

Tabla 4.0.12 Tabla de Frecuencias de Cantidad de créditos leasing al inicio del periodo

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

0 33402 82.1 82.1 82.1

1 7266 17.9 17.9 100.0

Total 40668 100.0 100.0

Gráfico 4.0.11 Histograma de Cantidad de créditos Activo Fijo al inicio del periodo

Al inicio del periodo 18 por ciento de clientes contaban con 1 crédito Activo

Fijo.

Page 48: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

41

Cantidad de créditos Compra Deuda al inicio del periodo

Tabla 4.0.13 Tabla de Frecuencias de Cantidad de créditos Compra Deuda al inicio del periodo

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

0 39290 96.6 96.6 96.6

1 1378 3.4 3.4 100.0

Total 40668 100.0 100.0

Gráfico 4.0.12 Histograma de Cantidad de créditos Compra Deuda al inicio del periodo

Al inicio del periodo 3 por ciento de clientes contaban con 1 crédito Compra de

Deuda.

Page 49: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

42

Número de desembolsos Capital de Trabajo en el periodo

Tabla 4.0.14 Tabla de Frecuencias de Número de desembolsos Capital de Trabajo en el periodo

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

0 30078 74.0 74.0 74.0

1 9160 22.5 22.5 96.5

2 1350 3.3 3.3 99.8

3 79 .2 .2 100.0

4 1 .0 .0 100.0

Total 40668 100.0 100.0

Gráfico 4.0.13 Histograma de Número de desembolsos Capital de Trabajo en el periodo

Page 50: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

43

Número de desembolsos Línea Revolvente en el periodo

Tabla 4.0.15 Tabla de Frecuencias de Número de desembolsos Línea Revolvente en el periodo

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

0 33084 81.4 81.4 81.4

1 6936 17.1 17.1 98.4

2 617 1.5 1.5 99.9

3 31 .1 .1 100.0

Total 40668 100.0 100.0

Gráfico 4.0.14 Histograma de Número de desembolsos Línea Revolvente en el periodo

Page 51: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

44

Numero de desembolsos Estacionales en el periodo

Tabla 4.0.16 Tabla de Frecuencias de Numero de desembolsos Estacionales en el periodo

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

0 38332 94.3 94.3 94.3

1 1246 3.1 3.1 97.3

2 534 1.3 1.3 98.6

3 338 .8 .8 99.5

4 208 .5 .5 100.0

5 10 .0 .0 100.0

Total 40668 100.0 100.0

Gráfico 4.0.15 Histograma de Número de desembolsos Estacionales en el periodo

Page 52: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

45

Numero de desembolsos Leasing en el periodo

Tabla 4.0.17 Tabla de Frecuencias de Numero de desembolsos Leasing en el periodo

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

0 39911 98.1 98.1 98.1

1 756 1.9 1.9 100.0

2 1 .0 .0 100.0

Total 40668 100.0 100.0

Gráfico 4.0.16 Histograma de Número de desembolsos Leasing en el periodo

Page 53: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

46

Numero de desembolsos Activo Fijo en el periodo

Tabla 4.0.18 Tabla de Frecuencias de Número de desembolsos Activo Fijo en el periodo

Frecuencia Porcentaje

Porcentaje

válido

Porcentaje

acumulado

0 38965 95.8 95.8 95.8

1 1633 4.0 4.0 99.8

2 68 .2 .2 100.0

3 2 .0 .0 100.0

Total 40668 100.0 100.0

Gráfico 4.0.17 Histograma de Número de desembolsos Activo Fijo en el periodo

Page 54: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

47

Numero de desembolsos Compra de Deuda en el periodo

Tabla 4.0.19 Tabla de Frecuencias de Número de desembolsos Compra de Deuda en el periodo

Frecuencia Porcentaje

Porcentaje

válido

Porcentaje

acumulado

0 40152 98.7 98.7 98.7

1 514 1.3 1.3 100.0

2 2 .0 .0 100.0

Total 40668 100.0 100.0

Gráfico 4.0.18 Histograma de Número de desembolsos Compra de Deuda en el periodo

4.5 Aplicación y evaluación de la técnica

La técnica será evaluada con diferentes número de clúster y de manera

conveniente se escogerá la de mejor resultado según el criterio experto, de

antemano se validara que necesariamente converja el resultado de los centroides

Page 55: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

48

y cuan cambiante serán los clúster según la elección que se vaya realizando, todo

esto mediante el software SPSS.

CASO 1: 9 clústeres

Tabla 4.0.20 Resultados Primera Corrida – 9 clústeres

Page 56: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

49

CASO 2: 8 clústeres

Tabla 4.0.21 Resultados Segunda Corrida – 10 clústeres

Page 57: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

50

CASO 3: 7 clústeres

Tabla 4.0.22 Resultados Tercera Corrida – 7 clústeres

Page 58: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

51

CASO 4: 6 clústeres

Tabla 4.0.23 Resultados Cuarta Corrida – 7 clústeres

Page 59: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

52

El análisis de los casos y el detalle de la elección que ayudara a tomar

uno de ellos se verá en el siguiente capítulo, además de la caracterización de los

segmentos finales.

Page 60: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

53

CAPITULO IV

5.1 Selección del número de clústeres

Todos los casos fueron trabajados con un límite máximo de 200

iteraciones y con criterio de convergencia de 0, es decir, para cesar las

iteraciones los centroides no deben de moverse con respecto a la iteración

anterior.

El primer caso convergió luego de 62 iteraciones, el segundo en 95

iteraciones, el tercero en 104 iteraciones mientras que el último en 49.

El siguiente grafico ayuda de manera dinámica a visualizar como van

agrupando los clústeres, empezando con el que cuenta más grupos, esto al final

nos dará indicios de en qué proceso de agrupamiento podría haber una forzada

formación de clústeres.

Page 61: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

54

Gráfico 5.0.1 Selección del número de clústeres

Si se analiza cómo se conforman los clúster del caso 2 en función de los

clústeres del caso 1 se notó que hay una relación muy fuerte en el sentido de que

estos nuevos clústeres están conformados en su mayoría por un clúster del caso

anterior, por ejemplo el 100 por ciento de casos del clúster 3 del caso 1 (9

clústeres) conforman el clúster 8 del caso 2 (8 clústeres).

Lo mismo sucede en la comparación del caso 2 y caso 3. Sin embargo en

la última comparación no sucede esto y se nota que se pierde la armonía con

respecto a los clústeres que se habían formado hasta el caso 3 (7 clústeres), por

ejemplo se tiene, solo el 62 por ciento de los casos que conformaban el clúster 3

del caso 3 (7 clústeres) llegan a ser incluidos dentro del clúster 2 del caso 4 (6

clústeres), el resto de observaciones van dirigidos al clúster 5.

CASO 1 1 2 3 4 5 6 7 8 99 CLUSTERS

100% 100% 98% 88% 95% 99% 100% 97%

CASO 2 5 8 3 1 6 2 7 48 CLUSTERS

85% 100% 90% 99% 100% 100% 97%

CASO 3 7 2 1 6 4 5 37 CLUSTERS

87% 62% 79% 100% 64% 100% 77%

CASO 4 4 2 1 5 3 2 36 CLUSTERS

Page 62: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

55

Además se nota que no se llega a formar el clúster número 6 del caso 4,

de hecho este es formado por subgrupos pequeños del caso 3.

Adicionalmente, si se analiza cómo van evolucionando las cantidades de

los segmentos de cada caso es notorio que la tendencia desde el caso1 hasta el

caso 3 es que cada grupo va incrementando gradualmente su cantidad, sin

embargo en el caso 4 ya no sucede asi, al contrario, se genera un grupo con muy

pocas observaciones (cerca del 0 por ciento) y se crea un clúster con más del 50

por ciento de observaciones.

Finalmente bajo el análisis realizado y con la condición de conservar la

armonía que existe en la formación o separación de clústeres se seleccionó aquel

que sin perder este comportamiento cuenta con el menor número de clúster, por

lo tanto se escogerá el caso 3, K=7.

5.2 Validación y Clasificación de nuevos casos.

Para corroborar el potencial de esta metodología estadística y debida a

que se ha trabajado con la totalidad de la información haremos una corrida

adicional de la técnica con el número de clústers ya definido. Para ello

validaremos los resultados encontrados escogiendo una muestra aleatoria que

representa el 80 por ciento del total de información, el resultado será

confirmatorio solo si encontramos similitud en los centroides y si las frecuencias

de los grupos también lo son. Una vez que sea exitosa la validación

clasificaremos el 20 por ciento restante mediante la cercanía de estos al centroide

estimado en la validación, para esto se asumirá que los grupos hallados con el

total de la información son los que debemos tomar como reales y así mediremos

el poder de la clasificación.

Los resultados obtenidos al hacer la corrida con el 80 por ciento de

información son mostrados en la tabla 5.1:

CASO 1 1 2 3 4 5 6 7 8 99 CLUSTERS

100% 100% 98% 88% 95% 99% 100% 97%

CASO 2 5 8 3 1 6 2 7 48 CLUSTERS

85% 100% 90% 99% 100% 100% 97%

CASO 3 7 2 1 6 4 5 37 CLUSTERS

87% 62% 79% 100% 64% 100% 77%

CASO 4 4 2 1 5 3 2 36 CLUSTERS

Page 63: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

56

Tabla 5.1 Resultados de la corrida de validación

La validación de los resultados mostrados en la Tabla 4.23 y en la Tabla

5.1 arroja gran afinidad de los resultados ya que los centroides son similares al

igual que la distribución de frecuencias porcentuales.

A continuación y según lo expuesto en las líneas iniciales de este

apartado, en la tabla 5.2 se muestra el resumen de la clasificación de los casos

restantes, 20% del total de información.

1 2 3 4 5 6 7

SALDO_TOTAL_PROMEDIO 531,985 65,390 124,436 113,159 31,669 105,605 188,967

CUOTA_TOTAL_FINAL 27,823 8,023 13,574 13,547 4,303 10,705 15,353

MIMEPE_PROMEDIO 713,321 159,085 476,249 763,964 54,884 289,339 1,268,046

NRO_PRODUCTOS_INICIO 1.6 1.1 1.2 1.1 1.1 1.2 1.2

CAPITAL_SI_INICIO 0.2 0.3 0.3 0.3 0.4 0.3 0.3

LINEA_SI_INICIO 0.5 0.5 0.5 0.6 0.4 0.6 0.6

ESTACIONAL_SI_INICIO 0.0 0.0 0.0 0.0 0.0 0.0 0.0

LEASING_SI_INICIO 0.3 0.1 0.1 0.1 0.0 0.1 0.2

ACTIVO_SI_FIJO_INICIO 0.5 0.1 0.1 0.1 0.2 0.1 0.1

COMPRA_SI_DEUDA_INICIO 0.1 0.0 0.0 0.0 0.0 0.0 0.0

CAPITAL_DESEMBOLSOS_PE

RIODO0.2 0.3 0.3 0.2 0.3 0.3 0.2

LINEA_DESEMBOLSOS_PERI

ODO0.3 0.2 0.2 0.3 0.1 0.3 0.2

ESTACIONAL_DESEMBOLSO

S_PERIODO0.1 0.1 0.2 0.1 0.1 0.1 0.1

LEASING_DESEMBOLSOS_P

ERIODO0.1 0.0 0.0 0.0 0.0 0.0 0.0

ACTIVO_FIJO_DESEMBOLSO

S_PERIODO0.1 0.0 0.0 0.0 0.1 0.0 0.0

COMPRA_DEUDA_DESEMBO

LSOS_PERIODO0.0 0.0 0.0 0.0 0.0 0.0 0.0

Final Cluster Centers

Clúster

%1 481 1%

2 9,857 30%

3 2,691 8%

4 1,429 4%

5 12,264 38%

6 5,436 17%

7 419 1%

32,577 100%

- 0%

Válido

Perdidos

Número de casos en cada clúster

Clúster

Page 64: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

57

Tabla 5.2 Resultados de clasificaion de casos

De lo mostrado en la tabla 5.2 se aprecia que de los casos seleccionados

para la clasificación solo 24 son ubicados en clústeres distintos a los definidos

inicialmente, comprobándose así el gran potencial de la técnica, prácticamente el

100% de clasifica correctamente.

5.3 Caracterización de clústeres

Para la caracterización se usó las variables cualitativas que se registran en

el sistema de ingresos de solicitudes de crédito además de variables cuantitativas

pero categorizadas en rangos de manera convenientes.

El siguiente paso es crear, mediante SPSS, tablas personalizadas en

forma de cuadros de doble entrada que permitan ver la agrupación de clúster en

función de estas variables.

ClusterNro Bien

Clasificados

Nro Mal

Clasificados

% Bien

Clasificados

%Mal

Clasificados

1 135 - 100% 0%

2 2,408 12 100% 0%

3 693 4 99% 1%

4 347 4 99% 1%

5 2,982 - 100% 0%

6 1,396 4 100% 0%

7 106 - 100% 0%

Total 8,067 24 100% 0%

Page 65: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

58

Tabla 5.2 Algunas variables de caracterización

El cuadro completo se encuentra en el anexo 3.

El análisis de los cuadros combinados arroja las siguientes conclusiones:

CLÚSTER 1, cuenta con las siguientes características:

o Comprende clientes consolidados, según la segmentación interna.

1 2 3 4 5 6 7

Variable Categoria % % % % % % %

0 35.6% 28.2% 27.3% 27.2% 38.8% 24.5% 33.3%

Mas de una 64.4% 71.8% 72.7% 72.8% 61.2% 75.5% 66.7%

1 53.4% 89.0% 82.0% 87.2% 93.1% 83.9% 81.6%

2 37.4% 10.6% 16.6% 11.9% 6.7% 15.0% 15.5%

3 7.8% .4% 1.4% .9% .2% 1.1% 2.9%

4 1.3% 0.0% .1% 0.0% 0.0% 0.0% 0.0%

1 40.0% 88.6% 78.6% 85.1% 92.8% 82.1% 80.2%

2 50.7% 11.0% 19.5% 14.1% 6.9% 16.4% 16.5%

3 8.0% .4% 1.9% .8% .3% 1.5% 3.3%

4 1.3% 0.0% 0.0% 0.0% 0.0% .0% 0.0%

1 6.9% 4.2% .6% 0.0% 27.3% 3.5% 0.0%

2 20.1% 19.1% 6.5% 2.9% 36.8% 10.2% 3.1%

3 34.2% 36.2% 21.7% 19.4% 24.1% 25.0% 12.4%

4 22.4% 30.3% 35.2% 31.8% 10.0% 36.9% 30.4%

5 12.1% 9.1% 26.3% 31.8% 1.7% 20.1% 29.8%

6 4.2% 1.1% 8.4% 11.3% .1% 3.8% 20.5%

7 .2% .1% 1.0% 2.8% .0% .5% 3.7%

9 0.0% 0.0% .1% 0.0% 0.0% 0.0% 0.0%

AUMENTO

SOW46.1% 42.0% 42.3% 38.6% 30.5% 43.4% 27.1%

DISMINUYO

SOW44.4% 50.4% 54.4% 58.3% 36.8% 50.5% 70.5%

MANTUVO

SOW 9.3% 4.7% .8% 0.0% 27.2% 3.8% 0.0%

SALDO

FINAL 0.2% 2.9% 2.6% 3.1% 5.5% 2.3% 2.3%

S1 12.6% 25.0% 6.3% 4.7% 62.8% 11.5% 4.1%

S2 21.7% 54.3% 37.8% 27.7% 29.8% 48.1% 8.3%

S3/M1 65.7% 20.7% 55.9% 67.6% 7.4% 40.4% 87.6%

Si 100.0% 93.5% 99.0% 99.8% 86.6% 98.5% 100.0%

No 0.0% 6.5% 1.0% .2% 13.4% 1.5% 0.0%

TipoFormal

SEGMENTO

MAX_NRO_ENT

SOW_COMPOR

T

CFF7

NRO_PRODUCT

OS_INICIO

NRO_PRODUCT

OS_FIN

DISPOSICIONES

_MAS_DESEMB

OLSOS

Page 66: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

59

o Disminución considerable del número de clientes con 1 solo producto,

muy dinámico en desembolso de los diversos productos.

o Al final del periodo su SOW se vio incrementado, con respecto al SOW

inicial, en el periodo mantuvo con la entidad financiera el 75 por ciento

de su deuda total.

o Al comienzo del periodo más de la mitad de los clientes cuenta con

producto Leasing y Activo Fijo.

Por estas características se denominó a este segmento CONSOLIDADO

ANCLA.

CLÚSTER 2, cuenta con las siguientes características:

o Comprende clientes aspiracionales, según la segmentación interna.

o Muy pocos desembolsos en el periodo.

o Al final del periodo su SOW se vio disminuido, con respecto al SOW

inicial, en el periodo mantuvo con la entidad financiera el 41 por ciento

de su deuda total.

Por estas características se denominó a este segmento ASPIRACIONAL

FLEMATICO.

CLÚSTER 3, cuenta con las siguientes características:

o Comprende clientes consolidados, según la segmentación interna.

o Al final del periodo su SOW se ve disminuido, con respecto al SOW

inicial, en el periodo mantuvo con la entidad financiera el 27 por ciento

de su deuda total.

o Resalta el desembolso de productos como Activo Fijo y Leasing.

Por estas características se denominó a este segmento CONSOLIDADO

PUJANTE.

CLÚSTER 4, cuenta con las siguientes características:

o Comprende clientes consolidados, según la segmentación interna.

o Desembolsos muy dinámicos de líneas revolventes y disminución de

capitales de trabajo.

Page 67: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

60

o Al final del periodo su SOW se vio disminuido, con respecto al SOW

inicial, en el periodo mantuvo con la entidad financiera el 15 por ciento

de su deuda total.

Por estas características se denominó a este segmento CONSOLIDADO

AGRESIVO.

CLÚSTER 5, cuenta con las siguientes características:

o Comprende clientes aspiracionales, según la segmentación interna.

o Desembolsos muy pasivos, la mayoría cuenta con un único producto.

o Al final del periodo su SOW se mantiene, con respecto al SOW inicial. la

entidad financiera tiene la mayor participación de deuda, en el periodo

mantuvo con la entidad financiera el 58 por ciento de su deuda total.

Por estas características se denominó a este segmento ASPIRACIONAL

CONSERVADOR.

CLÚSTER 6, cuenta con las siguientes características:

o Comprende clientes aspiracionales, según la segmentación interna.

o Desembolsos muy dinámicos.

o Al final del periodo su SOW se ve disminuido, con respecto al SOW

inicial, en el periodo mantuvo con la entidad financiera el 36 por ciento

de su deuda total.

o Su comportamiento es similar al segmento consolidado.

Por estas características se denominó a este segmento ASPIRACIONAL

MADURO.

CLÚSTER 7, cuenta con las siguientes características:

o Comprende clientes consolidados, según la segmentación interna.

o Al final del periodo su SOW se ve disminuido, con respecto al SOW

inicial, en el periodo mantuvo con la entidad financiera el 15 por ciento

de su deuda total.

o Cuenta con un alto saldo promedio en el Sistema Financiero, más de un

millón de soles.

Page 68: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

61

o Por el nivel de su endeudamiento estos clientes se asemejan más otro

segmento de empresarios (medianas empresas).

Por estas características se denominó a este segmento CONSOLIDADO

MADURO.

Page 69: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

62

CAPITULO V

6.1 Conclusiones

6.1.1 Conclusión General

Como metodología de segmentación se logra corroborar el potencial que

posee la técnica de clústerización k-medias, esto gracias a la validación y

la clasificación de observaciones mostrado en el apartado 5.2. Es así que

se logra dar un tratamiento óptimo a la falta de grupos naturales dentro

de los clientes de una entidad financiera, planteándose 7 segmentos

diferenciados.

6.1.2 Conclusiones específicas

1. Se corrobora que la técnica de clústerizacion k-medias posee un alto

potencial como técnica de segmentación comprobado ya sea por su

funcionamiento con una muestra y con la población, así como los

resultados de la clasificación de observaciones, por lo cual también es

correcto afirmar que posee un funcionamiento óptimo al encontrar

diferencias sustanciales entre los clientes de la entidad financiera en

estudio.

Page 70: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

63

Los segmentos encontrados a partir de la técnica clúster k medias han

sigo caracterizadas en función de variables económicas y otras

variables cualitativas relacionadas al comportamiento de deuda en el

periodo. Los 7 segmentos han sido convenientemente etiquetados de

la siguiente manera:

Consolidado Ancla

Aspiracional Flemático

Consolidado Pujante

Consolidado Agresivo

Aspiracional Conservador

Aspiracional Maduro

Consolidado Maduro

La tabla 5.1 contiene el detalle de variables usadas para la

caracterización, además la descripción detallada de cada uno de ellos

lo encontrará en el apartado 5.2.

2. Según la segmentación encontrada se plantea las siguientes acciones

que deberían de incluirse en las políticas de la Entidad Financiera.

CONSOLIDADO ANCLA, enfocar a ellos campañas de ampliación

de líneas o renovación de créditos, ofreciendo mejores condiciones

para que no sean tentados a irse de la banca.

ASPIRACIONAL FLEMATICO, Para incrementar nuestra

participación en saldo y debido a que es un grupo muy activo de

clientes aspiracionales, es recomendable que se le otorgue créditos a

aprobados de rápido desembolso ya que este grupo valora más ese

característica de crédito.

CONSOLIDADO PUJANTE, su comportamiento da a entender que

se encuentran en una fase de consolidación del negocio, por ello se le

Page 71: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

64

debería de dar facilidades para el acceso de productos relacionados a

activos, como leasing y activo fijo.

CONSOLIDADO AGRESIVO, su baja participación de deuda con la

entidad financiera debería invertirse si se amplía sus líneas

revolventes, este segmento es muy dinámico en este producto y por

su nivel de deuda en el SSFF no debería de haber trabas en la

ampliación.

ASPIRACIONAL CONSERVADOR, por tratarse de clientes

aspiracionales con poco dinamismo en la obtención de créditos, se

debería ofrecerles charlas sobre manejo de caja y inversión

sistemática, de manera que pueda servirle como incentivo a la

inversión.

ASPIRACIONAL MADURO, Su comportamiento los hace

asemejarse más a los del segmento consolidado por ello recomendaría

que puedan darse las condiciones relativamente favorables en

cuestión de tasa y ampliación de líneas y así también incrementar la

participación de estos clientes que son potenciales consumidores de

diversos productos.

CONSOLIDADO MADURO, Debido a que su comportamiento

refleja su alto grado de inversión, en caso de no poder ofrecerle

productos más elaborados se le debería de derivar hacia la banca de

medianos empresarios de la banca, y así poder ofrecerle toda la

variedad de condiciones y productos que van más acorde con sus

necesidades de financiamiento.

Page 72: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

65

6.2 Recomendaciones

o Se recomienda en estudios posteriores o de similar objetivo se puedan

realizar variaciones en cómo se obtienen los puntos iniciales para la

clusterización, ya que de esto también depende la exactitud de los

resultados, evitan encontrar siempre mínimos locales.

o Es importante que se entienda que no necesariamente para todas las áreas

del conocimientos la técnica de clusterización k-medias puede ser la

mejor para el hallazgo de grupos naturales en problemas que se les

presente, analizar la dimensión de la información, la cantidad de valores

faltantes, el tipo de datos, el número de variables, etc. es muy importante

para poder empezar a diseñar la búsqueda de agrupaciones mas

convenientes.

o El siguiente trabajo puede llegar a ser reforzado y corroborado con

análisis de campañas de colocación productos financieros dirigidas a la

gran cantidad de clientes de la entidad financiera, al comparar la

diferencia de resultados obtenidos en los grupos ahora conocidos

podemos ampliar la definición ya realizada líneas arriba, tener en cuenta

para cualquier estudio posterior.

o Se recomienda que en un periodo no mayor a 1 año y medio se vuelva a

correr la segmentación para corroborar cuando han variado los centros y

las frecuencias de cada clúster, esto con la finalidad de realizar alguna

calibración posterior que ayude a redistribuir cierto grupo de clientes, ya

que como por el tiempo de actividad y otras variables de éxito en general

las empresas incrementan sus ingresos y pasan de ser pequeños a

medianos empresarios, o de ser microempresarios a pequeños

empresarios.

Page 73: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

66

CAPITULO VI

BIBLIOGRAFIA

[1] Alan Julian Izenman (2008), Modern Multivariate Statistical Techniques

Regression Classification and Main fold Learning. Editorial Springer

[2] Douglas Montgomery, Introducción al análisis de regresión Lineal, Mexico 2004

[3] Mamdouh Refaat (2008), Data Preparation for Data Mining Using SAS - Morgan

Kaufman

[4] Ester Gutiérrez, Luis Onieva, La selección de variables a través de componentes

principals, Dpto. de Organización Industrial y Gestión de Empresas. Escuela Técnica

Superior de Ingenieros. Universidad de Sevilla, España 2007

[5] IBM, SPSS Statistics 19 Algorithms. 2010

[6] Genaro Matute, Kattia Bohorquez, Luis Carbaja, Connie Díaz, Ada Espinoza,

Carlos Jiménez, Segmentación psicográfica de la pequeña y microempresa,

Universidad ESAN, 2010

[7] Namolosu Simona Mihaela, Segmentation of SME Portfolio in banking system,

Annals of the University of Oradea : Economic Science, Vol 22, Iss 1, Pp 1786-1796

(2013), 2013

[8] Prabhdip Kaur, Shruti Aggrwal, Comparative Study of Clústering Techniques,

International Journal for Advance Research in Engineering and Technology, Vol 1,

Issue III, Abril 2013

[9] Manish Verma, Mauly Srivastava, Neha Chack, Atul Kumar Diswar, Nidhi

Gupta, A Comparative Study of Various Clústering Algorithms in Data Mining, GLNA

Institute of Technology, International Journal of Engineering Research and Applications

(IJERA), Vol 2, Issue 3, May-Jun 2012, pag.1379-1384.

Page 74: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

67

[10] Varun Kumar. M, Vishnu Chaitanya. M, Madhavan. M, Segmenting the

Banking Market Strategy by Clústering, International Journal of Computer

Applications, Vol 45 – Nro 17, May 2012.

Page 75: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

68

ANEXOS

Anexo1

Tabla A. Clústeres para detección de outliers

Clúster N° %

Clúster N° %

1 7 0.0%

26 2 0.0%

2 205 0.5%

27 7 0.0%

3 2,187 5.2%

28 12 0.0%

4 7 0.0%

29 1,277 3.1%

5 143 0.3%

30 14 0.0%

6 517 1.2%

31 39 0.1%

7 313 0.7%

32 30 0.1%

8 32 0.1%

33 9,588 22.9%

9 1,179 2.8%

34 17 0.0%

10 100 0.2%

35 1 0.0%

11 4 0.0%

36 7 0.0%

12 159 0.4%

37 132 0.3%

13 640 1.5%

38 7 0.0%

14 1 0.0%

39 150 0.4%

15 89 0.2%

40 2 0.0%

16 14 0.0%

41 64 0.2%

17 25 0.1%

42 6,200 14.8%

18 2 0.0%

43 7 0.0%

19 7 0.0%

44 7 0.0%

20 10,609 25.4%

45 4,971 11.9%

21 1 0.0%

46 3 0.0%

22 7 0.0%

47 4 0.0%

23 1 0.0%

48 11 0.0%

24 324 0.8%

49 877 2.1%

25 6 0.0%

50 1,781 4.3%

Page 76: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

69

Anexo 2

Tabla B. Matriz de componentes Rotados

Rotated Component Matrixa

Variable Component

1 2 3 4 5 6 7 8 9 10 11 12 13 MESES_ULTIMO_DESEMB -.068 .421 -.184 .156 -.390 -.002 -.418 -.019 -.274 -.024 .016 -.054 -.021

DESEMBOLSOS_PERIODO .008 -.100 .457 -.135 .495 -.018 .478 .059 .246 .018 -.035 .241 .115

NRO_PRODUCTOS_INICIO .204 .147 .036 .036 -.001 .185 -.018 -.018 -.029 .074 .015 .253 -.052

NRO_PRODUCTOS_FIN .227 .185 .305 .132 .218 .237 .065 .106 .176 .108 -.002 -.149 .180

NRO_PRODUCTOS .158 .128 .275 .021 .216 .149 .188 .117 .175 .111 .031 .090 .141

CAPITAL_SI_INICIO .029 -.305 .006 -.755 .304 -.178 .010 .005 -.038 -.141 .021 -.073 .024

LINEA_SI_INICIO .046 -.256 -.057 .864 -.196 -.109 .043 -.028 -.040 -.085 .038 -.031 -.013

ESTACIONAL_SI_INICIO -.010 -.015 .355 -.008 .027 -.022 .009 .003 .008 -.010 -.010 .890 .005

LEASING_SI_INICIO .142 .006 -.026 -.031 -.049 .908 -.035 -.014 -.014 -.028 .021 -.015 -.084

ACTIVO_SI_FIJO_INICIO .001 .847 -.021 -.117 -.103 -.051 -.059 -.014 .058 -.043 -.076 .017 -.006

COMPRA_SI_DEUDA_INICIO .004 .001 -.004 -.038 .004 -.010 -.015 .078 .046 .887 .008 .008 -.004

CAPITAL_DESEMBOLSOS_PERIODO -.035 -.104 .000 -.242 .870 -.027 -.051 -.047 .016 .010 -.046 .040 -.017

LINEA_DESEMBOLSOS_PERIODO .077 -.094 -.020 .122 -.131 -.032 .919 -.023 -.016 -.015 -.002 .007 .000

ESTACIONAL_DESEMBOLSOS_PERIODO -.037 -.014 .808 -.038 .024 -.020 .031 -.004 .013 .002 .000 .353 -.015

LEASING_DESEMBOLSOS_PERIODO .068 -.004 .016 -.010 -.001 .177 .031 -.014 .031 -.005 .017 .013 .956

ACTIVO_FIJO_DESEMBOLSOS_PERIODO .031 .108 -.008 -.047 -.059 -.007 -.051 -.005 .887 .047 -.017 .002 -.026

COMPRA_DEUDA_DESEMBOLSOS_PERIODO -.015 .003 -.004 -.034 -.014 .014 .013 .871 .048 .041 .015 .011 -.006

MONTO_TOTAL_INICIO .885 .156 .009 .001 -.060 .181 -.057 -.027 -.125 .078 .095 .060 -.064

MONTO_TOTAL_FINAL .911 .139 .074 .047 .097 .145 .076 .116 .077 .047 .109 -.029 .072

CUOTA_TOTAL_INICIO .381 -.118 .409 .011 -.002 .035 -.030 -.023 -.076 -.001 .098 .601 .024

CUOTA_TOTAL_FINAL .359 -.104 .828 .023 .057 .035 .026 .023 -.026 -.017 .101 -.018 .048

SALDO_TOTAL_INICIO .897 .113 .012 -.025 -.087 .225 -.071 -.027 -.109 .080 .088 .065 -.062

SALDO_TOTAL_FINAL .877 .116 .095 .100 .184 .117 .199 .141 .176 .023 .105 -.011 .115

CAPITAL_SALDO_FINAL .197 -.108 .025 -.197 .818 -.064 -.123 .008 -.038 -.008 .090 .019 -.019

LINEA_SALDO_FINAL .336 -.188 -.011 .445 -.163 -.122 .570 -.030 -.062 -.063 .204 -.010 .028

ESTACIONAL_SALDO_FINAL .057 -.037 .912 -.030 -.032 -.019 -.047 -.009 -.018 -.016 .017 -.006 .013

LEASING_SALDO_FINAL .368 -.073 -.011 -.054 -.055 .762 -.030 -.025 -.039 -.026 -.005 .011 .283

ACTIVO_FIJO_SALDO_FINAL .601 .498 -.028 -.045 -.053 -.191 -.059 -.043 .403 -.062 -.064 -.022 -.035

COMPRA_DEUDA_SALDO_FINAL .240 -.043 .002 -.020 .023 -.071 -.017 .716 -.028 .420 -.007 -.015 -.008

SALDO_TOTAL_PROMEDIO .938 .118 .050 .052 .058 .180 .067 .063 .054 .052 .112 .028 .050

CAPITAL_SALDO_PROMEDIO .269 -.165 .034 -.342 .682 -.108 -.059 .047 -.065 -.019 .144 -.012 -.009

LINEA_SALDO_PROMEDIO .372 -.228 -.011 .516 -.175 -.139 .449 -.035 -.074 -.067 .224 -.013 .013

ESTACIONAL_SALDO_PROMEDIO .063 -.040 .807 -.037 .022 -.036 -.009 -.003 -.015 -.005 .047 .295 .020

LEASING_SALDO_PROMEDIO .369 -.073 -.013 -.055 -.058 .786 -.035 -.026 -.040 -.027 -.005 .011 .249

ACTIVO_FIJO_SALDO_PROMEDIO .601 .527 -.029 -.053 -.058 -.191 -.063 -.048 .357 -.064 -.070 -.019 -.038

COMPRA_DEUDA_SALDO_PROMEDIO .237 -.044 .002 -.023 .032 -.066 -.017 .691 -.020 .501 -.005 -.013 -.006

NROCUOTAS_MAX_INICIO .314 .841 -.075 -.069 -.107 .153 -.064 -.008 -.084 .111 -.047 -.055 -.037

CAPITAL_NROCUOTAS_INICIO .063 -.290 .000 -.747 .272 -.184 -.001 .013 -.056 -.143 .043 -.082 .021

LINEA_NROCUOTAS_INICIO .059 -.244 -.059 .862 -.192 -.112 .041 -.027 -.045 -.081 .047 -.034 -.016

ESTACIONAL_NROCUOTAS_INICIO -.004 -.012 .314 .002 .027 -.021 .020 .004 .008 -.010 -.003 .884 .011

LEASING_NROCUOTAS_INICIO .164 .002 -.027 -.035 -.052 .928 -.035 -.015 -.023 -.027 .022 -.014 -.083

ACTIVO_FIJO_NROCUOTAS_INICIO .169 .939 -.031 -.097 -.090 -.103 -.052 -.027 -.028 -.054 -.074 .001 -.011

COMPRA_DEUDA_NROCUOTAS_INICIO .085 .006 -.009 -.022 -.014 -.039 -.025 .103 .011 .959 -.012 -.006 -.005

NROCUOTAS_MAX_FINAL .362 .811 -.078 -.056 -.071 .143 -.046 .049 .131 .091 -.041 -.050 .075

CAPITAL_NROCUOTAS_FINAL .007 -.190 -.005 -.501 .669 -.103 -.178 -.027 -.031 -.036 -.003 -.048 -.017

LINEA_NROCUOTAS_FINAL .091 -.268 -.060 .714 -.338 -.139 .304 -.038 -.076 -.085 .060 -.047 .004

ESTACIONAL_NROCUOTAS_FINAL -.015 -.013 .879 -.031 -.006 -.013 -.008 -.005 .003 .003 -.007 -.027 -.019

LEASING_NROCUOTAS_FINAL .173 .001 -.013 -.033 -.040 .886 -.013 -.013 -.008 -.029 .031 -.015 .278

ACTIVO_FIJO_NROCUOTAS_FINAL .217 .898 -.023 -.084 -.090 -.117 -.062 -.013 .217 -.047 -.066 -.021 -.003

COMPRA_DEUDA_NROCUOTAS_FINAL .110 -.003 -.004 -.021 -.025 -.047 -.024 .460 .000 .795 -.009 -.020 -.004

NROCUOTAS_MAX_PERIODO .140 -.014 -.019 -.108 .378 -.001 .402 .131 .659 .020 -.018 .024 .264

CAPITAL_NROCUOTAS_PERIODO -.023 -.093 -.008 -.252 .879 -.032 -.064 -.037 .027 .013 -.036 .023 -.018

LINEA_NROCUOTAS_PERIODO .082 -.091 -.023 .143 -.135 -.030 .907 -.025 -.011 -.014 .000 .002 -.006

ESTACIONAL_NROCUOTAS_PERIODO -.040 -.007 .750 -.038 .055 -.025 .049 -.006 .016 .007 .009 .265 -.016

LEASING_NROCUOTAS_PERIODO .074 -.004 .014 -.017 -.004 .186 .034 -.012 .031 -.006 .019 .015 .961

ACTIVO_FIJO_NROCUOTAS_PERIODO .139 .139 -.013 -.013 -.024 -.042 -.033 .024 .931 .013 -.004 -.015 -.012

Page 77: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

70

COMPRA_DEUDA_NROCUOTAS_PERIODO .030 .006 -.005 -.022 .000 .002 .014 .926 .056 .053 .011 .005 -.004

MESES_ACTIVO .045 .028 -.026 .074 -.066 .019 -.082 -.035 -.041 .006 .005 -.013 -.001

TOTAL_CON_SALDO .061 .078 .001 -.041 .022 .044 -.005 -.012 -.023 .017 .035 .005 .002

MIN_TOTAL_SALDO .886 .186 .021 .059 -.030 .208 .012 -.008 -.048 .079 .058 .046 -.031

MAX_TOTAL_SALDO .922 .071 .069 .040 .118 .153 .100 .113 .111 .034 .130 .009 .088

NUMERO_DISPOSICIONES_LINEA .120 -.170 -.035 .570 -.100 -.085 .116 -.011 -.032 -.047 .101 -.027 .010

MIMEPE_ULTIMO .440 -.024 .060 .061 .047 .054 .076 .031 .063 -.025 .766 .010 .038

MIMEPE_IBK_ULTIMO .877 .115 .095 .100 .184 .119 .199 .141 .175 .023 .105 -.011 .114

DIFER_SOW .001 .135 .077 .134 .337 .063 .312 .132 .071 -.021 .015 -.044 .068

MIMEPE_PROMEDIO .470 -.021 .041 .047 .008 .101 .022 .014 .002 -.013 .775 .026 .016

MAX_LINEA_TCCONSUMO -.004 -.017 -.008 .028 -.021 -.036 .000 -.012 -.008 .030 .546 -.023 .006

MAX_NRO_ENT .008 -.115 .043 .047 .028 .028 -.022 .024 -.024 -.004 .751 .028 -.013

EDAD .015 .006 -.031 -.016 -.042 .017 .006 -.009 .020 .031 -.034 -.011 -.014

VENTA_ANUAL_EVALUADA .394 -.199 .069 .049 .088 -.039 .097 -.039 -.093 -.067 .464 .035 .020

NumEmpleados -.012 .055 -.002 -.004 -.003 .036 -.001 .001 .018 -.001 .003 .004 .006

NumSucursales .087 -.027 -.003 .003 .027 -.076 .029 -.007 -.011 -.010 .074 .005 -.014

MESES_ANTIGUEDAD_BPE -.024 .141 .014 .237 .051 -.131 -.026 .018 -.110 -.092 .066 .031 -.025

MESES_EXPERIENCIA_GIRO .020 .018 .016 .023 -.032 -.027 .008 -.007 .003 .017 .021 .014 -.008

MESES_INICIO_NEGOCIO -.013 .033 -.003 .046 -.016 -.026 .001 -.005 .002 .008 .035 .002 -.008

SALDO_DIFER .044 .014 .124 .181 .392 -.140 .391 .245 .410 -.076 .031 -.107 .255

Page 78: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

71

Anexo 3

Tabla C. Tabal total de caracterización de segmento

VARIABLES DE

CARACTERIZACIÓN

CFF7

1 2 3 4 5 6 7

% % % % % % %

SALDO_TOTAL_

PROMEDIO

<= 20M 0.0% 4.1% 2.1% 1.5% 36.8% 1.8% 0.0%

20M - 40M 0.0% 18.2% 6.7% 6.9% 32.4% 9.1% 4.3%

40M - 60M 0.0% 27.6% 12.1% 10.6% 19.7% 13.5% 12.0%

60M - 100M 0.0% 36.4% 29.6% 32.6% 11.0% 35.2% 24.6%

100M+ 100.0% 13.6% 49.5% 48.3% .0% 40.4% 59.1%

VARIACION_SA

LDO

<= -45M 52.8% 15.8% 25.6% 27.8% 6.9% 21.0% 40.9%

-45M - -15M 11.6% 24.3% 20.9% 17.2% 25.6% 21.4% 17.2%

-15M - ,0 3.3% 16.3% 12.5% 13.4% 29.2% 14.2% 9.5%

0 - 15M 2.6% 14.3% 9.6% 9.3% 20.9% 12.2% 4.8%

15M - 45M 5.4% 17.9% 11.6% 12.9% 12.6% 15.4% 10.3%

45M+ 24.3% 11.5% 19.9% 19.4% 4.7% 15.8% 17.2%

DISPOSICIONES_

MAS_DESEMBO

LSOS

0 35.6% 28.2% 27.3% 27.2% 38.8% 24.5% 33.3%

Mas de una 64.4% 71.8% 72.7% 72.8% 61.2% 75.5% 66.7%

NRO_PRODUCT

OS_INICIO

1 53.4% 89.0% 82.0% 87.2% 93.1% 83.9% 81.6%

2 37.4% 10.6% 16.6% 11.9% 6.7% 15.0% 15.5%

3 7.8% .4% 1.4% .9% .2% 1.1% 2.9%

4 1.3% 0.0% .1% 0.0% 0.0% 0.0% 0.0%

NRO_PRODUCT

OS_FIN

1 40.0% 88.6% 78.6% 85.1% 92.8% 82.1% 80.2%

2 50.7% 11.0% 19.5% 14.1% 6.9% 16.4% 16.5%

3 8.0% .4% 1.9% .8% .3% 1.5% 3.3%

4 1.3% 0.0% 0.0% 0.0% 0.0% .0% 0.0%

CAPITAL_SI_INI

CIO

NO 77.8% 65.4% 65.2% 64.9% 63.8% 70.1% 65.3%

SI 22.2% 34.6% 34.8% 35.1% 36.2% 29.9% 34.7%

LINEA_SI_INICI

O

NO 55.6% 49.7% 48.4% 43.6% 60.6% 43.2% 41.5%

SI 44.4% 50.3% 51.6% 56.4% 39.4% 56.8% 58.5%

ESTACIONAL_SI

_INICIO

NO 97.9% 97.1% 96.5% 97.0% 98.5% 97.3% 99.0%

SI 2.1% 2.9% 3.5% 3.0% 1.5% 2.7% 1.0%

LEASING_SI_INI

CIO

NO 70.4% 94.8% 84.5% 90.6% 97.3% 89.1% 83.5%

SI 29.6% 5.2% 15.5% 9.4% 2.7% 10.9% 16.5%

ACTIVO_SI_FIJO

_INICIO

NO 54.2% 85.2% 88.5% 91.4% 76.1% 86.4% 89.3%

SI 45.8% 14.8% 11.5% 8.6% 23.9% 13.6% 10.7%

COMPRA_SI_DE

UDA_INICIO

NO 87.1% 96.4% 97.4% 98.9% 96.5% 96.8% 100.0%

SI 12.9% 3.6% 2.6% 1.1% 3.5% 3.2% 0.0%

CAPITAL_SI_FIN

AL

NO 80.1% 65.9% 67.0% 71.5% 63.6% 70.2% 71.3%

SI 19.9% 34.1% 33.0% 28.5% 36.4% 29.8% 28.7%

LINEA_SI_FINAL NO 52.0% 49.3% 46.2% 39.1% 60.2% 44.0% 39.1%

Page 79: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

72

SI 48.0% 50.7% 53.8% 60.9% 39.8% 56.0% 60.9%

ESTACIONAL_SI

_FINAL

NO 97.4% 96.7% 95.9% 96.2% 98.2% 96.6% 98.8%

SI 2.6% 3.3% 4.1% 3.8% 1.8% 3.4% 1.2%

LEASING_SI_FIN

AL

NO 66.0% 94.0% 82.2% 87.7% 97.0% 87.0% 82.6%

SI 34.0% 6.0% 17.8% 12.3% 3.0% 13.0% 17.4%

ACTIVO_FIJO_SI

_FINAL

NO 48.0% 85.4% 88.3% 90.7% 76.6% 85.8% 86.6%

SI 52.0% 14.6% 11.7% 9.3% 23.4% 14.2% 13.4%

COMPRA_DEUD

A_SI_FINAL

NO 85.9% 96.9% 97.2% 99.1% 97.0% 96.8% 98.4%

SI 14.1% 3.1% 2.8% .9% 3.0% 3.2% 1.6%

MAX_NRO_ENT 1 6.9% 4.2% .6% 0.0% 27.3% 3.5% 0.0%

2 20.1% 19.1% 6.5% 2.9% 36.8% 10.2% 3.1%

3 34.2% 36.2% 21.7% 19.4% 24.1% 25.0% 12.4%

4 22.4% 30.3% 35.2% 31.8% 10.0% 36.9% 30.4%

5 12.1% 9.1% 26.3% 31.8% 1.7% 20.1% 29.8%

6 4.2% 1.1% 8.4% 11.3% .1% 3.8% 20.5%

7 .2% .1% 1.0% 2.8% .0% .5% 3.7%

9 0.0% 0.0% .1% 0.0% 0.0% 0.0% 0.0%

SOW_COMPORT AUMENTO

SOW 46.1% 42.0% 42.3% 38.6% 30.5% 43.4% 27.1%

DISMINUYO

SOW 44.4% 50.4% 54.4% 58.3% 36.8% 50.5% 70.5%

MANTUVO

SOW 9.3% 4.7% .8% 0.0% 27.2% 3.8% 0.0%

SALDO FINAL

0 .2% 2.9% 2.6% 3.1% 5.5% 2.3% 2.3%

RANGO CUOTAS

FINAL

Menor a 12 .7% 2.4% 1.7% 1.5% 2.0% 1.8% 1.0%

12-17 .5% 20.8% 16.9% 20.0% 28.5% 15.6% 13.0%

18-23 5.6% 54.9% 51.2% 56.5% 43.1% 54.3% 55.4%

24-35 4.1% 4.9% 4.2% 4.6% 7.2% 5.7% 4.3%

36-59 37.7% 12.6% 20.4% 13.7% 14.8% 15.6% 18.4%

Mayor a 60 51.5% 4.4% 5.6% 3.7% 4.4% 7.1% 7.9%

CON_MICRO NO 95.4% 94.4% 97.9% 97.1% 60.9% 96.9% 96.5%

SI 4.6% 5.6% 2.1% 2.9% 39.1% 3.1% 3.5%

CON_PEQUEÑA NO 69.6% .3% 54.9% 74.5% 8.3% 10.0% 77.5%

SI 30.4% 99.7% 45.1% 25.5% 91.7% 90.0% 22.5%

CON_MEDIANA NO .5% 97.8% 2.0% .5% 99.8% 51.4% 0.0%

SI 99.5% 2.2% 98.0% 99.5% .2% 48.6% 100.0%

CON_BANCOS NO 9.3% 7.8% 1.3% .8% 41.2% 4.3% 1.6%

SI 90.7% 92.2% 98.7% 99.2% 58.8% 95.7% 98.4%

CON_CMAC NO 82.5% 77.4% 80.7% 80.6% 82.0% 80.3% 80.8%

SI 17.5% 22.6% 19.3% 19.4% 18.0% 19.7% 19.2%

CON_CRAC NO 95.4% 95.7% 98.0% 97.7% 95.9% 96.3% 95.0%

SI 4.6% 4.3% 2.0% 2.3% 4.1% 3.7% 5.0%

CON_EDPYME NO 100.0% 97.4% 99.1% 98.4% 96.6% 99.1% 99.6%

Page 80: UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE …cybertesis.uni.edu.pe/bitstream/uni/3399/1/bazan_pf.pdf · ESTADÍSTICA Y CIENCIAS SOCIALES Escuela Profesional de ... cual es el

73

SI 0.0% 2.6% .9% 1.6% 3.4% .9% .4%

CON_ARRE_FIN

A

NO 94.0% 99.2% 97.0% 94.7% 99.6% 98.7% 91.9%

SI 6.0% .8% 3.0% 5.3% .4% 1.3% 8.1%

CON_FINANCIER

AS

NO 90.8% 83.5% 91.6% 92.8% 83.0% 88.4% 94.8%

SI 9.2% 16.5% 8.4% 7.2% 17.0% 11.6% 5.2%

TIPO_PERSONA PERSONA

JURIDICA 70.1% 43.1% 70.8% 80.9% 26.4% 62.7% 90.3%

PERSONA

NATURAL 29.9% 56.9% 29.2% 19.1% 73.6% 37.3% 9.7%

MESES_INICIO_

NEGOCIO

<= 60 17.0% 21.0% 15.2% 11.9% 21.8% 18.0% 13.4%

61 - 90 21.4% 24.1% 25.8% 28.5% 23.8% 24.4% 24.0%

91 - 120 19.9% 15.1% 17.2% 20.6% 14.9% 18.0% 22.1%

121 - 180 20.9% 18.8% 22.8% 20.6% 17.5% 19.0% 18.8%

181+ 20.8% 20.9% 18.9% 18.5% 22.0% 20.6% 21.7%

SECTOR COMERCIO 48.5% 71.0% 63.7% 62.5% 66.1% 67.3% 53.7%

PRODUCCION 13.1% 12.8% 14.0% 12.0% 14.2% 13.8% 12.4%

SERVICIO 38.4% 16.2% 22.3% 25.6% 19.8% 18.9% 33.9%

SEGMENTO S1 12.6% 25.0% 6.3% 4.7% 62.8% 11.5% 4.1%

S2 21.7% 54.3% 37.8% 27.7% 29.8% 48.1% 8.3%

S3/M1 65.7% 20.7% 55.9% 67.6% 7.4% 40.4% 87.6%

TipoFormal Si 100.0% 93.5% 99.0% 99.8% 86.6% 98.5% 100.0%

No 0.0% 6.5% 1.0% .2% 13.4% 1.5% 0.0%

TipoSociedad E.I.R.L. 54.9% 72.7% 52.3% 46.6% 83.8% 59.8% 37.4%

S.R.L. 9.8% 7.5% 11.3% 12.6% 4.8% 11.2% 16.9%

S.A.C. 34.2% 18.8% 33.5% 38.0% 11.0% 27.1% 41.5%

S.A. 1.1% .9% 2.8% 2.7% .4% 1.9% 4.3%

NumSucursales <= 0 32.8% 41.2% 38.5% 36.6% 49.2% 36.0% 37.2%

1 - 1 38.2% 35.8% 33.3% 34.8% 34.4% 36.7% 38.0%

2 - 2 12.6% 14.2% 16.8% 16.2% 11.2% 15.8% 13.6%

3+ 16.3% 8.8% 11.4% 12.4% 5.1% 11.5% 11.2%

NumEmpleados <= 1 9.2% 32.9% 13.9% 9.4% 47.1% 21.4% 5.4%

2 - 2 18.1% 22.1% 20.5% 14.6% 20.9% 21.5% 9.3%

3 - 5 37.6% 28.7% 31.1% 39.0% 21.9% 33.1% 30.8%

6+ 35.1% 16.3% 34.5% 37.0% 10.1% 24.0% 54.5%