“Modelo predictivo para determinar deserción de ...

125
1 Facultad de Ingeniería Ingeniería de Sistemas e Informática Trabajo de Investigación: “Modelo predictivo para determinar deserción de estudiantes en la Universidad Tecnológica del Perú” Luque Calderón Ricardo Antonio Sarazu Rivera Carolina Para optar al Grado Académico de Bachiller en Ingeniería de Sistemas e Informática (Lima, Diciembre 2019)

Transcript of “Modelo predictivo para determinar deserción de ...

Page 1: “Modelo predictivo para determinar deserción de ...

1

Facultad de Ingeniería

Ingeniería de Sistemas e Informática

Trabajo de Investigación:

“Modelo predictivo para determinar deserción de estudiantes

en la Universidad Tecnológica del Perú”

Luque Calderón Ricardo Antonio

Sarazu Rivera Carolina

Para optar al Grado Académico de Bachiller en Ingeniería de Sistemas e Informática

(Lima, Diciembre 2019)

Page 2: “Modelo predictivo para determinar deserción de ...

2

RESUMEN

El presente trabajo de investigación se centra fundamentalmente en la importancia de tener un

modelo predictivo que permita determinar la deserción de estudiantes en la Universidad

Tecnológica del Perú. Al respecto, este plan permitirá enfocar los esfuerzos que necesita el centro

de estudios para poder tomar mejores decisiones y definir estrategias más eficientes con ayuda de

esta tecnología. En ese sentido, el objetivo de nuestra investigación se centró en el diseño un

modelo predictivo que permitirá tecnologizar y establecer un proceso mejor definido para la

deserción estudiantil, permitiéndole tener un mejor control y seguimiento. Por lo tanto, la

metodología de investigación que se utilizó fue la descriptiva funcional que permite establecer la

relación entre las variables y objetos que actúan en su diseño. Por su parte, para su desarrolló se

realizó una investigación de tipo no experimental porque no incluye la fase de implementación de

un sistema informático. En consecuencia, para determinar los resultados de la investigación se

desarrolló un esquema que permita observar el comportamiento de los datos indicando el

porcentaje de estudiantes con riesgo de desertar y los patrones que actuaron en consecuencia de

este, lo que se podrá evidenciar en el modelo predictivo. Para tal efecto, se recurrió a cálculos

probabilísticos y el modelado se realizó con la técnica de minería de datos, el árbol de decisiones.

Palabras clave: Deserción de estudiantes, Estadístico, Modelo predictivo, Esquema, Minería de

datos

Page 3: “Modelo predictivo para determinar deserción de ...

3

INDICE

RESUMEN ..................................................................................................................................... 2

INDICE ........................................................................................................................................... 3

INTRODUCCIÓN .......................................................................................................................... 5

I CAPITULO: IDENTIFICACIÓN DEL PROBLEMA ................................................................. 8

1.1. Planteamiento del problema ................................................................................................. 8

1.2. Objetivos de la investigación ............................................................................................... 8

1.2.1. Objetivo General ............................................................................................................ 8

1.2.2. Objetivos Específicos .................................................................................................... 8

1.3. Hipótesis. .............................................................................................................................. 9

1.3.1. Hipótesis general ........................................................................................................... 9

1.3.2. Hipótesis específica ...................................................................................................... 9

1.4. Identificación de la Variable .............................................................................................. 10

1.5. Justificación de la investigación ......................................................................................... 11

1.6. Alcance de la investigación ................................................................................................ 11

II CAPITULO: MARCO TEÓRICO ............................................................................................ 12

2.1. Estado del Arte ................................................................................................................... 12

2.1.1 Técnicas de predicción ................................................................................................. 12

2.2. Bases Teóricas .................................................................................................................... 14

2.2.1. El modelo predictivo ................................................................................................... 14

2.2.2. Metodología para el diseño de un modelo predictivo .................................................. 15

2.2.3. Modelo predictivo basado en KDD ............................................................................. 16

2.2.4. La técnica de minería de datos: el árbol de decisiones ................................................ 17

2.2.5. Herramientas de desarrollo para árboles de decisión .................................................. 19

III CAPITULO MARCO METODOLÓGICO ............................................................................. 21

3.1. Tipo de investigación ......................................................................................................... 21

3.2. Diseño de investigación ..................................................................................................... 21

3.3. Universo ............................................................................................................................. 22

3.4. Población ............................................................................................................................ 22

3.5. Muestra ............................................................................................................................... 23

3.6. Técnicas e instrumentos de medición................................................................................. 23

3.6.1. El método no probabilístico ......................................................................................... 23

Page 4: “Modelo predictivo para determinar deserción de ...

4

3.6.2. La encuesta .................................................................................................................. 23

3.7. Elaboración de la encuesta ................................................................................................. 24

IV CAPITULO: DESARROLLO DE LA SOLUCIÓN ............................................................... 25

4.1 Análisis y comprensión de los datos ................................................................................... 25

4.1.1 Definición de los datos ................................................................................................. 25

4.1.2 Definición del proceso de aplicación del Modelo Predictivo ....................................... 26

4.2. Preparación de los datos ..................................................................................................... 27

4.2.1. Etapa 1: Limpieza de los datos .................................................................................... 27

4.2.2. Etapa 2: Selección de los datos .................................................................................... 28

4.2.3. Etapa 3: Construcción de los datos .............................................................................. 39

4.2.4. Etapa 4: Transformación de los datos.......................................................................... 78

4.3. Desarrollo del modelo predictivo ..................................................................................... 101

V CAPITULO: ANÁLISIS DE RESULTADOS ....................................................................... 103

5.1. Análisis de la recolección de datos .................................................................................. 103

5.2. Evaluación de los objetivos .............................................................................................. 103

5.3. Evaluación de la limpieza de datos .................................................................................. 104

5.4. Evaluación de la selección de datos ................................................................................. 104

5.5. Evaluación de la transformación de datos .................................................................... 104

5.6. Análisis del modelado .................................................................................................. 105

5.7. Propuesta de valor ........................................................................................................ 105

5.8. Resultados del Modelo predictivo para la toma decisiones ............................................. 105

CRONOGRAMA ........................................................................................................................ 106

PRESUPUESTO ......................................................................................................................... 107

CONCLUSIONES ...................................................................................................................... 113

RECOMENDACIONES ............................................................................................................. 113

INDICE DE TABLAS ................................................................................................................ 121

INDICE DE FIGURAS............................................................................................................... 122

REFERENCIAS BIBLIOGRÁFICAS........................................................................................ 123

Page 5: “Modelo predictivo para determinar deserción de ...

5

INTRODUCCIÓN

Las tecnologías de la información representan un campo de interés para los investigadores y

desarrolladores de nuevas tecnologías en el que los datos han adquirido un valor importante para

las organizaciones. En ese contexto, se presenta el modelo predictivo como una nueva tecnología

que permitirá procesar una mayor cantidad de información del cual se podrá generar nuevo

conocimiento que permita abordar la problemática de la deserción estudiantil. Al respecto, el

modelo permite a los datos expresarse a través de patrones que servirá para el estudio del

comportamiento de los mismos que son determinantes para la toma de decisiones.

En referencia a lo anterior, está técnica utiliza la metodología CRIPS-DM (Proceso estándar de la

industria cruzada para la minería de datos) para su desarrollo aplicando el proceso KDD

(Descubrimiento de Conocimiento en Bases de Datos) que utiliza fuentes de información a partir

de una recolección e integración de datos que tienen carácter histórico, actualizado y homogéneo

el cual comprende el procesamiento, extracción y limpieza de los datos. Además, este proceso

contempla la selección de una técnica de minera de datos a utilizar en el que para esta investigación

será el del árbol de decisiones con el que se realizará el modelado. Dentro de ese marco, se

evaluarán los patrones obtenidos el cual servirá para medir la precisión de la data y

consecuentemente de la información.

En consecuencia, esta técnica tiene entre sus características su adaptación a los cambios que

permite aprovechar los datos actuales e históricos para su análisis. Igualmente, está técnica se

presenta como una estrategia tecnológica que permite definir las funcionalidades de un sistema de

análisis predictivo que se basa en la información analizada. Por su parte, otra de las características

que posee, es su amplitud en relación con su capacidad para ordenar la información en variables

predictoras más populares y de uso más extendido.

Page 6: “Modelo predictivo para determinar deserción de ...

6

Por ello, es el propósito para esta investigación estudiar una técnica tecnológica que permita

valorar el comportamiento de los estudiantes a medida de las posibilidades de abandono de estos.

Por lo tanto, se pretende diseñar un modelo predictivo que permita identificar los estudiantes con

mayor probabilidad de deserción. De igual manera, este modelado permitirá detectar los rasgos

predictivos comunes y específicos para cada caso.

En virtud de lo anterior, la identificación de los estudiantes con mayor probabilidad de abandono

de la Universidad Tecnológica del Perú permitirá poner en marcha estrategias de fidelización

específicas y adaptadas a los involucrados, con el fin de mantener y mejorar sus hábitos

académicos. En ese sentido, el presente trabajo de investigación contemplará los siguientes

capítulos descritos a continuación:

En el capítulo I, Se identifica la problemática que afecta a la institución Universidad Tecnológica

del Perú desde un enfoque tecnológico para luego determinar los objetivos principales, las

hipótesis, los problemas específicos y la justificación de la aplicación del modelo predictivo.

Además, se conoce la matriz operacional del modelo, identificando la variable independiente y sus

dimensiones.

En el capítulo II, Se establecen las bases teóricas del estado del arte. Además, se definen los

conceptos de modelo predictivo, minería de datos, técnica de minería de datos y sus distintas

aplicaciones para su desarrollo. Así mismo, Se habla de las metodologías KDD y CRISP-DM.

En el capítulo III, Se establece el marco metodológico de la investigación, la técnica de recolección

de datos, la población y la muestra a utilizar para el diseño del modelo predictivo.}

Page 7: “Modelo predictivo para determinar deserción de ...

7

En el capítulo IV: Se realiza el desarrollo del modelo predictivo analizando los datos recolectados

mediante las metodologías de investigación elegidas para este estudio. Así mismo, se realiza los

cálculos probabilísticos que permitan determinar las rutas críticas a través del árbol de decisiones.

En el capítulo V: Se establecen el análisis de los resultados obtenidos en el desarrollo del modelo

predictivo que servirá de base para el estudio y toma de decisiones sobre los patrones determinados

en la herramienta tecnológica.

En síntesis, el desarrollo del modelo predictivo es una propuesta tecnológica que se espera pueda

ser utilizado para estudiar a la problemática de la deserción en la Universidad Tecnológica del

Perú. Finalmente, lo que se busca con el modelo predictivo es agilizar las decisiones y ser una

alternativa tecnológica efectiva con un alto nivel de precisión en sus resultados.

Page 8: “Modelo predictivo para determinar deserción de ...

8

I CAPITULO: IDENTIFICACIÓN DEL PROBLEMA

1.1. Planteamiento del problema

El problema que se ha identificado es la ausencia de contar con un método tecnológico que permita

prevenir la deserción estudiantil del cual no se tiene información de cómo se manifiesta por lo que

estos datos se encuentran en el campo de lo desconocido. Además, su ausencia se manifiesta

debido a su desconocimiento en su aplicación por la gran cantidad de información que se estudia.

En ese sentido, las herramientas tecnológicas que se utilizan en la institución no cuentan con una

precisión en la información que entregan, siendo que esta es elaborada y estudiada por áreas que

no cuentan con el conocimiento para el estudio de datos y las habilidades necesarias que permitan

entender esta información. Así mismo, se presenta la desconfianza de utilizar un nuevo proceso

tecnológico que permita abordar la problemática de la deserción. Además, debido a esta ausencia

no se ha realizado una verificación de la veracidad de los daos que tengan valor que permita su

estudio. Por lo que, para la presente investigación surge la siguiente pregunta a contestar: ¿Es el

modelo predictivo una solución definitiva a la problemática de la deserción estudiantil en la

Universidad Tecnológica del Perú?

1.2. Objetivos de la investigación

1.2.1. Objetivo General

Diseñar un modelo predictivo para determinar la deserción estudiantil en la Universidad

Tecnológica del Perú

1.2.2. Objetivos Específicos

Analizar el modelo de negocio que actualmente utiliza la Universidad Tecnológica del

Perú respecto a la deserción estudiantil.

Page 9: “Modelo predictivo para determinar deserción de ...

9

Validar los datos recolectados por la Universidad Tecnológica del Perú respecto a la

deserción estudiantil

Modelar los datos recolectados que evidencia los motivos de deserción de estudiantes con

la técnica de minería de datos el árbol de decisiones

Analizar los resultados de la información obtenida que evidencie los resultados obtenidos

por la Universidad Tecnológica del Perú respecto a la deserción estudiantil

1.3. Hipótesis.

1.3.1. Hipótesis general

El modelo predictivo permitirá determinar la deserción estudiantil en la Universidad Tecnológica

del Perú

1.3.2. Hipótesis específica

H0: El modelo predictivo no podrá determinar con exactitud los requerimientos en la

Universidad Tecnológica del Perú con respecto a la deserción estudiantil.

H1: El modelo predictivo permitirá atender los requerimientos en la Universidad

Tecnológica del Perú con respecto a la deserción estudiantil.

H0: El modelo predictivo no podrá determinar resultados en la Universidad Tecnológica

del Perú con respecto a la deserción estudiantil.

H1: El modelo predictivo permitirá analizar resultados probabilísticos y crear estrategias

de respuesta a los requerimientos en la Universidad Tecnológica del Perú con respecto a la

deserción estudiantil.

Page 10: “Modelo predictivo para determinar deserción de ...

10

1.4. Identificación de la Variable

Variable Independiente Definición Operacional Dimensiones

Modelo Predictivo

La técnica del modelo predictivo

identifica diferentes relaciones

entre las variables de eventos

pasados, para luego explotar

dichas relaciones y predecir

eventos futuros. (Timón, 2015)

Comprensión de la

problemática y sus

datos asociados

Integración de los

datos

Desarrollo del

Modelado

Evaluación y

resultados de los datos

Variable Dependiente Definición Operacional Dimensiones

La Deserción

Es la acción de abandonar o dejar

algo inconcluso por diferentes

motivos . Deserción por edad

Deserción por motivos

económicos

Deserción por cambio

de institución

Deserción por

mudanza del lugar de

residencia

Deserción por motivos

de salud

Tabla 1. Matriz de la identificación de la variable

Fuente: Elaboración Propia

Page 11: “Modelo predictivo para determinar deserción de ...

11

1.5. Justificación de la investigación

Para esta investigación, el modelo predictivo es el método tecnológico que mejor se ajusta a la

problemática de la deserción con el que la institución podrá identificar los patrones que lo

ocasionan. En ese sentido, la aplicación del modelo predictivo aportará una nueva forma de

estudiar los datos de la deserción y así disminuir sus indicadores. Por ello, se destaca las

capacidades que tiene el modelo predictivo que es el de poder identificar patrones y convertir estos

datos en información valiosa para la institución.

1.6. Alcance de la investigación

Para esta investigación, el modelo predictivo es el esquema tecnológico que mejor se ajusta a la

problemática de la deserción con el que se podrá identificar los patrones que están detrás de este

escenario estudiantil. Por ello, la aplicación del modelo predictivo es una nueva forma de estudiar

los datos asociados a la deserción que busca ser una herramienta de soporte para cumplir con su

propósito. Este trabajo de investigación tiene como alcance sistematizar el fenómeno de la

deserción a través del diseño de este modelo predictivo. Así mismo, está investigación enfoca sus

esfuerzos en la importancia de tener un medio tecnológico que ayude a determinar la deserción de

estudiantes dentro de la Universidad Tecnológica del Perú. En ese contexto, este proyecto se

relaciona directamente con la base de estudiantes de esta institución que han desertado antes de la

ejecución de este modelo tecnológico. Finalmente, la investigación en curso no contempla la fase

de implementación del modelo predictivo y solo se centrará en el diseño.

Page 12: “Modelo predictivo para determinar deserción de ...

12

II CAPITULO: MARCO TEÓRICO

2.1. Estado del Arte

2.1.1 Técnicas de predicción

La asociación de las variables y sus dependencias requieren de un ordenamiento de sus datos y

una forma de llevar a cabo esta acción es mediante la clasificación basada en árboles de decisiones.

Por lo tanto, esta técnica divide una población de datos en ramas que constituyen el árbol y se

utiliza para predecir una variable. Por ello, está técnica puede manejar grandes cantidades de

datos. (Ramírez y Grandón, 2018).

En sus resultados, se obtuvo un 87,27% de precisión a partir de dos muestras de diferentes

proporciones.

Así también, los datos requieren de asociaciones para tener relevancia y necesitan estar

relacionados para llevar a cabo el análisis y la investigación de los mismos.

Por ello, los algoritmos actúan y permiten desarrollar lógicas basados en relaciones y

estándares definidas para su aplicación y deben cumplir el propósito de identificar las

variables relevantes para el propósito deseado. Para ello, utilizó la herramienta tecnológica

SAP Predictive Analytics para evaluar sus datos. (Castro y Hernández, 2016)

En ese contexto, las empresas bancarias son dependientes de los sistemas de información y utilizan

grandes cantidades de datos que para definir el modelo predictivo se utilizó estas técnicas de

minería de datos en datos estructurados y no estructurados.

Page 13: “Modelo predictivo para determinar deserción de ...

13

Es así como, se muestra las capacidades de un modelo predictivo que gestiona una gran cantidad

de datos para llevar un control ordenado de la información.

De esta manera, se menciona también modelos predictivos aplicados para estimar resultados.

Por lo que, para estimar la deserción, se aplicó Spady: modelo basado en la teoría del

suicidio y el modelo basado en la teoría del intercambio de Bean basado en la productividad

del ambiente laboral para estudiar las principales causas de la deserción. Para ello, utilizó

las técnicas del árbol de decisiones y redes neuronales. (Vásquez, 2016)

Para su aplicación, encontró estrategias determinadas por el modelo predictivo.

Así mismo, se sabe que la información es un activo importante para los sistemas informáticos que

utilizan lógicas estructurales aplicando modelos tecnológicos. Sifuentes (2018) afirma que:

Para esta investigación aplicó la metodología CRISP que generó resultados explícitos y

diferentes donde utilizó diferentes algoritmos. En consecuencia, determinó que la

eficiencia del modelo no solo depende de las técnicas sino también del orden en el que se

consolidan los datos y las variables que participan en el diseño del modelado.

En consecuencia, el orden en el que se maneja los datos determinará la precisión y confiabilidad

del mismo.

Así también, se tiene diferentes maneras de utilizar el modelo predictivo para estudiar grandes

cantidades de datos.

En ese sentido, se toma en conocimiento de otra aplicación del modelo predictivo

utilizando la técnica de Naïve Bayes que permite cuantificar los datos a partir del cálculo

de probabilidades que hacen énfasis en su capacidad de determinar los factores que actúan

Page 14: “Modelo predictivo para determinar deserción de ...

14

sobre los datos. Para su construcción, se utilizó las probabilidades a priori y a posteriori

que permita clasificar un nuevo registro y determinar las probabilidades de sus atributos.

En consecuencia, se conoce que los algoritmos deben enfocarse al escenario de sus datos

siguiendo la secuencia lógica. (Rico y Sánchez, 2018)

Por último, se conoce que un l modelo predictivo debe aplicar algoritmos para su construcción.

En ese sentido, en esta investigación se utilizó la técnica del árbol de regresión para el

diseño del modelo. En ese proceso, realizó ajustes y eliminó de manera manual las

variables que no eran significativas para el sistema. De esta manera, los resultados

muestran un consolidado de 23 parámetros para su análisis. (Clavel San Emeterio, 2017)

En ese sentido, se destaca la importancia del modelo predictivo como un sistema informático que

puede tener un rol importante en las organizaciones deportivas y puede repercutir financieramente.

2.2. Bases Teóricas

2.2.1. El modelo predictivo

Los datos, la información y finalmente el conocimiento se han vuelto en la actualidad activos

importantes en la vida cotidiana y en el de los negocios porque permiten analizar, revisar y tomar

decisiones a partir del análisis de los datos. De esta forma, aparece una nueva forma de estudiar

los datos a partir de la aplicación de los modelos predictivos. Por ello, Timón (2017) afirma que:

El análisis predictivo se fundamenta en la identificación de relaciones entre variables de

eventos pasados, para luego explotar dichas relaciones y predecir posibles resultados en

futuras situaciones. Es así, que es indispensable disponer de una considerable cantidad de

datos tanto actuales como pasados.

Page 15: “Modelo predictivo para determinar deserción de ...

15

En ese sentido, un correcto entendimiento de la información permitirá tener un mayor

conocimiento de los datos que finalmente reposan en un sistema de información de análisis

predictivo. Así mismo, uno de los beneficios de aplicar un modelo predictivo es que se puede

ajustar a diferentes situaciones.

2.2.2. Metodología para el diseño de un modelo predictivo

El modelo predictivo está basado en la metodología CRIPS-DM, que muestra todos los pasos para

diseñar un modelo predictivo divididos en cinco fases. En ese sentido, ISACA (2018) lo divide en:

a) Plan de los datos:

Hace referencia a la situación actual de la organización. En ese sentido, esta fase debe

estar alineado al planteamiento del problema

b) Desarrollo de los datos:

En esta fase, se establece la naturaleza de los datos que permita entender su entorno en el

que trabaja.

c) Preparación de los datos:

Resulta de realizar cálculos y obtener valores para obtener mejor transparencia en la

información mediante un ordenamiento de los datos.

d) Modelamiento y evaluación:

Aplica una técnica de minería de datos el cual se usará posteriormente para diseñar la

interacción de los datos.

e) Despliegue del proyecto:

Para su puesta en funcionamiento, toma en cuenta todo el potencial del modelo el cual está

integrado al sistema y servirá para la toma de decisiones.

Page 16: “Modelo predictivo para determinar deserción de ...

16

De esta manera, mediante este marco de trabajo se podrá desarrollar el diseño de un modelo

predictivo.

2.2.3. Modelo predictivo basado en KDD

El desarrollo de un sistema requiere de una metodología tecnológica para su implementación

donde se principal fuente son los datos. Por lo que, Ñaupas (2016) afirma que:

Surge el concepto de KDD (Descubrimiento de Conocimiento en Bases de Datos) que

aplica seis etapas que permita el análisis, diseño e implementación de un modelo

predictivo.

De esta manera, las etapas para aplicar KDD son:

a) Selección de datos

Se encarga de generar datos a fin de que determine un objetivo y un significado a partir de un

estudio detallado de los mismos.

b) Limpieza e integración de datos

Permite normalizar los datos para tener una única fuente de datos que sea entendible y legible

para el usuario.

c) Transformación de los datos:

Hace referencia a la consolidación de los datos para proceder a la creación de información,

operaciones y resultados de los datos que genere valor.

d) Minería de datos:

Hace referencia al modelado de los datos definido por minería de datos en forma de patrones

y determina las características del modelo predictivo.

Page 17: “Modelo predictivo para determinar deserción de ...

17

e) Interpretación y evaluación:

Se valida la información que permitirá evaluar el grado de precisión del modelo para luego

aplicarlo a las evaluaciones que requiera el sistema.

f) Conocimiento:

Hace referencia a un sistema de información que aplica el conocimiento encontrado y es

transparente a los usuarios.

2.2.4. La técnica de minería de datos: el árbol de decisiones

La minería de datos forma parte de un conjunto de pasos a partir de la aplicación de lógicas

estructuradas para el desarrollo de herramientas predictivas. De esta manera, está lógica se

configura en variables definidas para identificar parámetros. Es así como, el árbol de decisión

Gavilanes y Sánchez (2017) definen que:

Un árbol de decisión es un diagrama compuesto por un nodo raíz donde se muestra la

variable principal y está formado por nodos internos que incluyen a los nodos de división

y los nodos hoja que contiene la información final para realizar análisis de resultados.

De esta forma, genera datos relacionados entre sí, donde aplica una serie de reglas simples donde

cada regla asigna valores de interés para su construcción basado en atributos, clases y validaciones

donde cada segmento se llama nodo y se representa mediante raíces, hojas y ramas para formar el

árbol de decisiones.

Page 18: “Modelo predictivo para determinar deserción de ...

18

Por otro lado, se sabe que está técnica posee distintas formas de construcción y Lopera (2018) lo

divide en:

a) Árbol de clasificación o binario:

Permite aplicar sucesivas reglas para la clasificación de un conjunto de datos en subgrupos.

En ese sentido, se usa cuando hay varias opciones para obtener resultados más predecibles.

Para ello, se debe generar conjuntos binarios y utilizar diferentes ramas del árbol.

b) Árbol de regresión:

En ella, determina un único resultado a partir de una ruta establecida y divide la

información en secciones o subgrupos.

c) Árbol de mejora:

Busca el resultado más preciso para reducir la incertidumbre y los errores en la toma de

decisiones.

d) Árboles mixtos entre regresión y clasificación:

Enfoca sus esfuerzos en prevenir resultados con variables impredecibles por lo que utiliza

indicadores que ya han ocurrido en el pasado.

e) Árboles binomiales y trinomiales:

Recrea el comportamiento de las ramas varias veces en el tiempo a través de un modelo

binomial.

Así también, como parte del conocimiento en la construcción del árbol de decisión compuestos

por nodos, ramas y hojas se requiere establecer sus significados. En ese sentido, (Berlanga et al.,

2013), define los siguientes conceptos:

Page 19: “Modelo predictivo para determinar deserción de ...

19

a) Nodo de decisión:

Define los datos que representan las decisiones del objeto de estudio y está representado

por un cuadrado.

b) Nodo de probabilidad:

Establece las Probabilidades de que ocurra un evento incierto como resultado de las

decisiones y se representa por un círculo.

c) Nodo terminal:

Nodo en el que todos los casos tienen el mismo valor para la variable dependiente. Es un

nodo homogéneo que no requiere ninguna división adicional, ya que es “puro”.

d) Rama:

Establece los caminos que toma el dato según cada evento aleatorio y muestra los

resultados de las interacciones entre las alternativas de decisión y los eventos.

Por ello, esta técnica se encuentra basado en cómo está construido un árbol en el mundo real que

permite determinar distintas salidas para la toma de decisiones.

2.2.5. Herramientas de desarrollo para árboles de decisión

La tecnología está centrada en sistemas que permitan optimizar los recursos. De esta manera, un

modelo predictivo necesita de una herramienta tecnológica para su construcción. Debido a que, un

modelo predictivo no solo depende de los datos sino también de la herramienta tecnológica

asociada. En ese sentido, León (2018) define distintas técnicas de desarrollo para su desarrollo.

Page 20: “Modelo predictivo para determinar deserción de ...

20

Estos son:

a) J48:

Es una herramienta para construir un árbol donde administra valores numéricos y crea

reglas en base a vectores con el fin de clasificarlos para cada instancia de los datos.

b) REPTree:

Construye un árbol de decisión siguiendo la lógica de un árbol de regresión y crea múltiples

árboles hasta seleccionar el más representativo.

c) Random Tree:

Está basado en bosques que hace referencia a un conjunto de árboles que utiliza un valor

de entrada para clasificarlo en diferentes árboles para generar el promedio de los resultados

obtenidos.

d) Logistic Modelo Tree (LMT):

Es una estructura de árbol de decisión de serie con funciones de regresión logística que

permite determinar las variables del árbol dependiendo del valor de su atributo. Así mismo,

este puede formarse de distintos tipos de datos.

e) Random Forest:

Utiliza una combinación de árboles que depende de valores aleatorios muestreado de

manera independiente con una misma distribución para todos los árboles del bosque.

Page 21: “Modelo predictivo para determinar deserción de ...

21

III CAPITULO MARCO METODOLÓGICO

3.1. Tipo de investigación

En esta presente investigación, se utilizará la metodología de tipo descriptiva funcional

que definirá la relación de las variables y objetos que actúan directamente con el modelo

predictivo con el propósito de describir los fenómenos, características y rasgos

importantes relacionados con la deserción estudiantil. En ese sentido, Arias (2006)

menciona sobre esta metodología que:

La investigación descriptiva hace referencia a un hecho, fenómeno, individuo o

grupo para determinar su comportamiento. Por ello, para hacer efectivo este tipo

de trabajo es necesario realizar una investigación a profundidad que genere los

conocimientos requeridos para realizar la investigación.

En consecuencia, la investigación descriptiva estudia características de un fenómeno o

población, con el objetivo de diseñar un esqueleto o estructura. Este tipo de investigación

se adecua perfectamente al tipo de trabajo que se realizará con la data recolectada que

las áreas encargadas a cargos de esta problemática dentro de la institución.

3.2. Diseño de investigación

En esta investigación, se utilizará el diseño de investigación no experimental para el desarrollo de

la investigación. Está metodología permitirá determinar el grado de atención que se tiene sobre la

deserción estudiantil lo que permitirá observar el método actualmente utilizado por la universidad

y su nivel de aplicación. Al respecto, Sampieri (2014) define que:

Hace referencia a la no variación de las variables independientes sobre otras variables para

que permita observar fenómenos tal como ocurren en su contexto natural determinando

más variables de las que se pudiera evidenciar en otra situación.

Page 22: “Modelo predictivo para determinar deserción de ...

22

De esta manera, Se busca dar explicación a la deserción estudiantil en la universidad donde utilizar

el modelo predictivo debe significar obtener mejoras en la forma en el que se tiene mapeado sus

datos.

3.3. Universo

Por un lado, se toma al área académica de la UTP debido a que ellos son los encargados de brindar

toda información recaudada durante los periodos lectivos a investigar, ya que, al ser la unidad

encargada de la data académica, tienen identificados patrones de estudio, que servirán como base

para su diseño.

Por otro lado, se toma como parte de la población al área de Tecnología de la UTP, debido a que

ellos aportarán las metodologías utilizadas con anterioridad sobre de la deserción estudiantil.

3.4. Población

La presente investigación tiene como propósito el estudio de una agrupación numerosa de actores,

patrones y data. A dicho conjunto también se le llama población. Está Arias (2006) la define como:

La población es el conjunto total de elementos con diferentes características a los cuales

será extensiva los resultados de la investigación. De esta manera, se encuentra delimitado

por el planteamiento del problema y su lugar de estudio.

En ese sentido, para esta investigación se toma como población a las áreas de tecnología y

académica de admisión de la Universidad Tecnológica del Perú que conforman un total de 20

personas.

Page 23: “Modelo predictivo para determinar deserción de ...

23

3.5. Muestra

Tener identificado un conjunto de individuos o entidades a estudiar resulta más útil al momento

de recaudar nueva información. Sin embargo, por distintas razones, a veces resulta muy difícil o

hasta imposible abarcar en su totalidad a todos los elementos que conforman la población. De esta

manera, Arias (2006) define que:

La muestra es una parte de toda la población de estudio del cual se podrá determinar la

información más importante de una investigación.

Sin embargo, para esta investigación se toma a toda la población como muestra debido al pequeño

número de esta y que se puede acceder a ellos sin restricciones.

3.6. Técnicas e instrumentos de medición

3.6.1. El método no probabilístico

Su utilizara el método de muestreo no probabilístico, debido a que se está abarcando a toda la

población como muestra ya que es un número representativo para el estudio de la investigación.

De esta forma, esta técnica Sampieri (2014 menciona que:

Las muestras no probabilísticas son elementos que no dependen de la probabilidad, sino de

las características de la investigación o los propósitos del investigador

La finalidad de está es determinar de una forma adecuada todos los resultados confiables de las

predicciones.

3.6.2. La encuesta

La encuesta es una técnica de recolección muy utilizada en investigaciones con distintos enfoques.

En ese sentido, Arias (2006) menciona define que:

Page 24: “Modelo predictivo para determinar deserción de ...

24

La encuesta es una técnica que pretende obtener información a partir de la relación entre ellos,

pudiendo evidenciar múltiples resultados al final de la investigación y determinar decisiones.

Esta técnica se ajusta adecuadamente a la investigación debido a que permite la validación de los

datos que son la base de este diseño de modelo predictivo.

3.7. Elaboración de la encuesta

¿Actualmente poseen un sistema o modelo para estudiar la deserción estudiantil? SI NO

Si la respuesta es Si, detalle:

Si la respuesta es 1 es No, indique los documentos que utilizan o con los que cuenta:

Documentos última actualización

MAPA DE PROCESO

PLAN ESTRATEGICO

OTROS

Detallo Otros (tipo de documento, nombre de documento)

1. ¿Cuántas Personas tienen acceso a la información de la deserción y a que áreas lo administran?

2. ¿Dónde almacenan la información que obtienen cuando un estudiante deserta?

3. ¿Qué aspectos no le gusta de su modelo actual?

4. ¿Qué piensa de la efectividad de la universidad para dar respuesta a este tema?

5. ¿Tiene la organización un programa escrito y presupuesto asignado a la innovación y desarrollo de nuevo servicios o procesos? (DETALLE)

Tabla 2: Encuesta para la recolección de datos.

Fuente: Elaboración Propia

Page 25: “Modelo predictivo para determinar deserción de ...

25

IV CAPITULO: DESARROLLO DE LA SOLUCIÓN

4.1 Análisis y comprensión de los datos

4.1.1 Definición de los datos

Para esta investigación, se tomará los datos obtenidos del primer ciclo de estudios de la carrera de

ingeniería de sistemas e informática en el curso de introducción a la ingeniería de sistemas

correspondientes al periodo lectivo 2018-2 e inicios de 2019, donde 80 estudiantes desertaron de

la universidad. Estos están constituidos de la siguiente manera:

TOTAL,

POBLACIÓN

TOTAL,

POBLACIÓN

(ND)

TOTAL,

POBLACIÓN

(D)

PERIODO

ACADEMICO

1200 1120 80 2018 - 2

Tabla 3: Total población estudiantil desertora y no desertora

Fuente: Elaboración Propia

Donde:

ND = No Desertó

D = Desertó

Se muestra el consolidado de los datos de los alumnos que se han retirado según como se

muestra:

MOTIVO INGENIERIA DE SISTEMAS Total general

cambio 15 15

económico 18 18

laboral 18 18

mudanza 15 15

salud 14 14

Total general 80 80

Tabla 4: Tabla de motivos de deserción

Fuente: Elaboración Propia

Page 26: “Modelo predictivo para determinar deserción de ...

26

Gráficamente esta data refleja el siguiente resultado:

Ilustración 1: Gráfica de motivos de deserción

Fuente: Elaboración Propia

4.1.2 Definición del proceso de aplicación del Modelo Predictivo

Se define el proceso de implementación del diseño y aplicación modelo predictivo para la

Universidad Tecnológica del Perú:

Ilustración 2: Proceso de aplicación del Modelo Predictivo

Fuente: Elaboración Propia

0

2

4

6

8

10

12

14

16

18

20

INGENIERIA DE SISTEMAS

cambio

economico

laboral

mudanza

salud

Page 27: “Modelo predictivo para determinar deserción de ...

27

4.2. Preparación de los datos

La principal actividad para preparar los datos es mediante el cálculo de probabilidades que

previamente han sido identificados, seleccionados y comprendidos en el anterior punto. Para esta

fase se va a determinar las probabilidades de deserción con el que se armara un modelo gráfico a

través del árbol de decisiones para tener una mejor visualización, está incluye:

Limpieza de los datos: Para ello se toma en cuenta la información que será útil para la

elaboración del modelo predictivo y ayudará a eliminar o agregar patrones de deserción

Selección de los datos: Se obtienen todos los datos que brinden información relevante para

el modelo predictivo

Construcción de los datos: Es la información que se obtiene que resulta en las

probabilidades encontradas que servirán de base para el diseño del modelo predictivo

Transformación de los datos: Determinación de las probabilidades de los patrones

identificados

4.2.1. Etapa 1: Limpieza de los datos

Para poder limpiar los datos se debe filtrar los valores con el uso de la herramienta Excel se

presenta los pasos para este proceso:

Fuente: Elaboración Propia

Tabla 5: Vista de datos sin filtro

Page 28: “Modelo predictivo para determinar deserción de ...

28

Para esta investigación se realizará las filtraciones por Distrito, Género, Motivo de deserción y

edad. Con ello, se podrá obtener una visión general de los valores de la variable dependiente, que

serían los patrones. Para este caso se elimina el estado civil porque no es un dato relevante que se

considere necesario incluirlo.

4.2.2. Etapa 2: Selección de los datos

La información relevante se obtiene a partir de las combinaciones que se puedan realizar para el

desarrollo de la selección de datos, para este paso se toma en cuenta la siguiente formula

combinatoria que nos dará el total de combinaciones que serán los datos seleccionados:

Formula Combinaciones sin repetición: 𝐶𝑘𝑛 =

𝑛!

𝑘!∗(𝑛−𝑘)!

Ilustración 3: Fórmula de probabilidades combinatorio

Combinaciones: Permite calcular el número de arreglos con todos los elementos de los

datos. En ese sentido, las variables se definen como:

C = Operador que hace referencia a un cálculo de combinación.

N = Cantidad de objetos identificados previamente en la limpieza de datos

K = Cantidad de objetos a evaluar para la selección de datos

Solución:

Combinatorio tomando dos datos: 𝐶14 =

4!

1!∗(4−1)! = 4

Combinatorio tomando dos datos: 𝐶24 =

3!

1!∗(3−1)! = 6

Combinatorio tomando tres datos: 𝐶34 =

3!

3!∗(3−2)! = 4

Combinatorio tomando cuatro datos: 𝐶44 =

4!

4!∗(4−2)! = 1

Page 29: “Modelo predictivo para determinar deserción de ...

29

En total, para la selección de datos encontraremos 15 combinaciones que permitirán identificar

como se comunican los datos y de esa manera obtener la información relevante que servirá para

la construcción de los datos:

4.2.2.1. Selección por Distrito

DISTRITO Total

BREÑA 17

COMAS 8

JESUS MARIA 7

LA MOLINA 1

LOS OLIVOS 44

SANTA ANITA 3

Total general 80

Tabla 6: Cantidad de deserciones por distrito

Fuente: Elaboración Propia

4.2.2.2. Selección por Generó

MASCULINO FEMENINO Total general

49 31 80

Tabla 7: Cantidad de deserciones por Género

Fuente: Elaboración Propia

4.2.2.3. Selección por Motivo

MOTIVO Total

cambio 15

económico 18

laboral 18

mudanza 15

salud 14

Total general 80

Tabla 8: Cantidad de deserciones por Motivo de deserción

Fuente: Elaboración Propia

Page 30: “Modelo predictivo para determinar deserción de ...

30

4.2.2.4. Selección por Edad

EDAD Total

17 5

18 7

19 10

20 9

21 7

22 5

23 7

24 7

25 8

26 8

28 2

29 4

30 1

Total general 80

Tabla 9: Cantidad de deserciones por edad

Fuente: Elaboración Propia

4.2.2.5. Selección por Distrito y Género

DISTRITO GENERO

MASCULINO FEMENINO Total general

BREÑA 10 7 17

COMAS 5 3 8

JESUS MARIA 3 4 7

LA MOLINA 1 1

LOS OLIVOS 28 16 44

SANTA ANITA 3 3

Total general 49 31 80

Tabla 10: Selección de datos de deserción por Distrito y Género

Fuente: Elaboración Propia

Page 31: “Modelo predictivo para determinar deserción de ...

31

4.2.2.6. Selección por Distrito y Motivo

DISTRITO MOTIVO

cambio económico laboral mudanza salud Total general

BREÑA 2 4 2 4 5 17 COMAS 1 2 4 1 8

JESUS MARIA 1 2 1 2 1 7 LA MOLINA 1 1 LOS OLIVOS 11 7 10 9 7 44

SANTA ANITA 2 1 3

Total general 15 18 18 15 14 80

Tabla 11: Selección de datos de deserción por Distrito y Motivo

Fuente: Elaboración Propia

4.2.2.7. Selección por Distrito y Edad

EDAD DISTRITO

BREÑA COMAS JESUS

MARIA LA MOLINA LOS OLIVOS

SANTA ANITA

Total general

17 1 4 5

18 2 1 4 7

19 3 2 1 3 1 10

20 2 2 5 9

21 1 6 7

22 2 1 2 5

23 7 7

24 1 5 1 7

25 1 1 4 2 8

26 2 1 4 1 8

28 2 2

29 1 1 1 1 4

30 1 1

Total general 17 8 7 1 44 3 80

Tabla 12: Selección de datos de deserción por Distrito y Edad

Fuente: Elaboración Propia

Page 32: “Modelo predictivo para determinar deserción de ...

32

4.2.2.8. Selección por Género y Motivo

GENERO MOTIVO

cambio económico laboral mudanza salud Total general

MASCULINO 9 11 12 8 9 49

FEMENINO 6 7 6 7 5 31

Total general 15 18 18 15 14 80

Tabla 13: Selección de datos de deserción por Género y Motivo

Fuente: Elaboración Propia

4.2.2.9. Selección por Género y Edad

EDAD GENERO

MASCULINO FEMENINO Total

general

17 3 2 5 18 6 1 7 19 6 4 10 20 8 1 9 21 3 4 7 22 3 2 5 23 5 2 7 24 5 2 7 25 3 5 8 26 4 4 8 28 1 1 2 29 1 3 4 30 1 1

Total general 49 31 80

Tabla 14: Selección de datos de deserción por Género y Edad

Fuente: Elaboración Propia

Page 33: “Modelo predictivo para determinar deserción de ...

33

4.2.2.10. Selección por Motivo y Edad

EDAD MOTIVO

cambio económico laboral mudanza salud Total general

17 1 1 2 1 5

18 2 2 2 1 7

19 2 1 4 1 2 10

20 2 2 1 1 3 9

21 2 1 3 1 7

22 3 1 1 5

23 1 1 3 2 7

24 1 1 5 7

25 2 3 1 2 8

26 2 2 1 3 8

28 1 1 2

29 1 1 2 4

30 1 1

Total general 15 18 18 15 14 80

Tabla 15:Selección de datos de deserción por Motivo y Edad

Fuente: Elaboración Propia

4.2.2.11. Selección por Distrito, Género y Edad

GENERO DISTRITO EDAD

17 18 19 20 21 22 23 24 25 26 28 29 30 Total general

MASCULINO BREÑA 2 2 2 1 1 1 1 10

COMAS 1 2 1 1 5

JESUS MARIA 1 2 3

LOS OLIVOS 2 4 2 4 3 1 5 3 2 1 1 28

SANTA ANITA 1 1 1 3

Total HOMBRE 3 6 6 8 3 3 5 5 3 4 1 1 1 49

FEMENINO BREÑA 1 1 1 1 1 1 1 7

COMAS 1 2 3

JESUS MARIA 2 1 1 4

LA MOLINA 1 1

LOS OLIVOS 2 1 1 3 1 2 2 2 2 16

Total MUJER 2 1 4 1 4 2 2 2 5 4 1 3 31

Total general 5 7 10 9 7 5 7 7 8 8 2 4 1 80

Tabla 16: Selección de datos de deserción por Distrito, Género y Edad

Fuente: Elaboración Propia

Page 34: “Modelo predictivo para determinar deserción de ...

34

4.2.2.12. Selección por Distrito, Motivo y Edad

Tabla 17: Selección de datos de deserción por Distrito, Motivo y Edad

Fuente: Elaboración Propia

Page 35: “Modelo predictivo para determinar deserción de ...

35

4.2.2.13. Selección por Género, Edad y Motivo

GENERO EDAD cambio económico laboral mudanza salud Total general

MASCULINO

17 1 1 1 3

18 1 2 2 1 6

19 1 1 2 2 6

20 2 2 1 1 2 8

21 1 1 1 3

22 2 1 3

23 1 1 1 2 5

24 1 4 5

25 1 1 1 3

26 1 2 1 4

28 1 1

29 1 1

30 1 1

Total MASCULINO 9 11 12 8 9 49

FEMENINO

17 1 1 2

18 1 1

19 1 2 1 4

20 1 1

21 2 2 4

22 1 1 2

23 2 2

24 1 1 2

25 1 3 1 5

26 1 1 2 4

28 1 1

29 1 1 1 3

Total FEMENINO 6 7 6 7 5 31

Total general 15 18 18 15 14 80

Tabla 18: Selección de datos de deserción por Género, Edad y Motivo

Fuente: Elaboración Propia

Page 36: “Modelo predictivo para determinar deserción de ...

36

4.2.2.14. Selección por Distrito, Motivo y Género

GENERO DISTRITO cambio económico laboral mudanza salud Total general

MASCULINO

BREÑA 2 2 1 2 3 10

COMAS 2 2 1 5

JESUS MARIA 1 1 1 3

LOS OLIVOS 6 5 7 5 5 28

SANTA ANITA 2 1 3

Total MASCULINO 9 11 12 8 9 49

FEMENINO

BREÑA 2 1 2 2 7

COMAS 1 2 3

JESUS MARIA 2 1 1 4

LA MOLINA 1 1

LOS OLIVOS 5 2 3 4 2 16

Total FEMENINO 6 7 6 7 5 31

Total general 15 18 18 15 14 80

Tabla 19: Selección de datos de deserción por Distrito, Motivo y Género

Fuente: Elaboración Propia

Page 37: “Modelo predictivo para determinar deserción de ...

37

4.2.2.15. Selección por Distrito, Motivo, Género y Edad

GENERO DISTRITO EDAD cambio económico laboral mudanza salud Total general

MASCULINO

BREÑA

18 1 1 2

19 1 1 2

20 1 1 2

22 1 1

24 1 1

26 1 1

28 1 1

Total 2 2 1 2 3 10

COMAS 17 1 1

20 1 1 2

22 1 1

25 1 1

Total 2 2 1 5

JESUS MARIA 19 1 1

25 1 1 2

Total 1 1 1 3

LOS OLIVOS

17 1 1 2

18 1 2 1 4

19 1 1 2

20 2 1 1 4

21 1 1 1 3

22 1 1

23 1 1 1 2 5

24 3 3

26 1 1 2

29 1 1

30 1 1

Total 6 5 7 5 5 28

SANTA ANITA

19 1 1

24 1 1

26 1 1

Total 2 1 3

Total HOMBRE 9 11 12 8 9 49

Page 38: “Modelo predictivo para determinar deserción de ...

38

MUJER BREÑA 19 1 1

21 1 1

22 1 1

25 1 1

26 1 1

28 1 1

29 1 1

Total 2 1 2 2 7

COMAS 18 1 1

19 2 2

Total 1 2 3

JESUS MARIA

25 2 2

26 1 1

29 1 1

Total 2 1 1 4

LA MOLINA 29 1 1

Total 1 1

LOS OLIVOS

17 1 1 2

19 1 1

20 1 1

21 2 1 3

22 1 1

23 2 2

24 1 1 2

25 1 1 2

26 1 1 2

Total 5 2 3 4 2 16

Total MUJER 6 7 6 7 5 31

Total general 15 18 18 15 14 80

Tabla 20: Selección de datos de deserción por Distrito, Género, Motivo y Edad

Fuente: Elaboración Propia

Page 39: “Modelo predictivo para determinar deserción de ...

39

4.2.3. Etapa 3: Construcción de los datos

En esta etapa, se realiza los cálculos probabilísticos que permitan determinar las ramas más largas

y cortas para identificar el indicador más alto de deserción de los estudiantes según los parámetros

seleccionados. Este se realizará siguiendo la lógica combinatoria anteriormente trabajada para

seleccionar los datos que serán los utilizados para obtener estos cálculos:

Para hacer efectivo se hará uso de la siguiente fórmula probabilística:

𝑃(𝐴) = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑑𝑒 𝐴

𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠

Ilustración 4: Fórmula probabilística de eventos aleatorios

Fuente: Elaboración Propia

Donde:

Número de casos de A = n(A)

Número de casos posibles = n(S)

4.2.3.1. Probabilidad de deserción por Distrito

DISTRITO Total

BREÑA 17

COMAS 8

JESUS MARIA 7

LA MOLINA 1

LOS OLIVOS 44

SANTA ANITA 3

Total general 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

H = Breña

I = Comas

J = Jesus Maria

K = La Molina

Page 40: “Modelo predictivo para determinar deserción de ...

40

L = Los Olivos

M = Santa Anita

+ Breña:

𝑃(𝐻) = 17

80= 21,3%

+ Comas:

𝑃(𝐼) = 8

80= 10%

+ Jesús María:

𝑃(𝐼) = 7

80= 8,8%

+ La Molina:

𝑃(𝐼) = 1

80= 1,3%

+ Los Olivos:

𝑃(𝐼) = 44

80= 55%

+ Santa Anita:

𝑃(𝐼) = 3

80= 3,8%

4.2.3.2. Probabilidad de deserción por Género

MASCULINO FEMENINO Total general

49 31 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

A = Masculino

B = Femenino

+ Masculino

𝑃(𝐴) = 49

80= 61,2%

Page 41: “Modelo predictivo para determinar deserción de ...

41

+ Femenino

𝑃(𝐵) = 31

80= 38,8

4.2.3.3. Probabilidad de deserción por Motivo

MOTIVO Total

cambio 15

económico 18

laboral 18

mudanza 15

salud 14

Total general 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

C= Cambio

D= Económico

E= Laboral

F= Mudanza

G= Salud

+ Cambio:

𝑃(𝐶) = 15

80= 18,8%

+ Económico:

𝑃(𝐷) = 18

80= 22,5%

+ Laboral:

𝑃(𝐸) = 18

80= 22,5%

+ Mudanza:

𝑃(𝐹) = 15

80= 18,8%

+ Salud:

𝑃(𝐺) = 14

80= 17,5%

Page 42: “Modelo predictivo para determinar deserción de ...

42

4.2.3.4. Probabilidad de deserción por Edad

EDAD Total

17 5

18 7

19 10

20 9

21 7

22 5

23 7

24 7

25 8

26 8

28 2

29 4

30 1

Total general 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

N= 17

O= 18

P= 19

Q= 20

R= 21

S= 22

T= 23

U= 24

V= 25

W= 26

X= 28

Y = 29

Z= 30

Page 43: “Modelo predictivo para determinar deserción de ...

43

+ 17 años:

𝑃(𝑁) = 5

80= 6,3%

+ 18 años:

𝑃(𝑂) = 7

80= 8,8%

+ 19 años:

𝑃(𝑃) = 10

80= 12,5%

+ 20 años:

𝑃(𝑄) = 9

80= 11,3%

+ 21 años:

𝑃(𝑅) = 7

80= 8,8%

+ 22 años:

𝑃(𝑆) = 5

80= 6,3%

+ 23 años:

𝑃(𝑇) = 7

80= 8,8%

+ 24 años:

𝑃(𝑈) = 7

80= 8,8%

+ 25 años:

𝑃(𝑉) = 8

80= 10%

+ 26 años:

𝑃(𝑊) = 8

80= 10%

Page 44: “Modelo predictivo para determinar deserción de ...

44

+ 28 años:

𝑃(𝑋) = 2

80= 2,5%

+ 29 años:

𝑃(𝑌) = 4

80= 5%

+ 30 años:

𝑃(𝑍) = 1

80= 1,3%

4.2.3.5. Probabilidad de deserción en la relación Distrito y Género

DISTRITO GENERO

MASCULINO FEMENINO Total general

BREÑA 10 7 17

COMAS 5 3 8

JESUS MARIA 3 4 7

LA MOLINA 1 1

LOS OLIVOS 28 16 44

SANTA ANITA 3 3

Total general 49 31 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

+ Masculino:

Breña = 𝑃(𝐻) = 10

49= 20%

Comas = 𝑃(𝐼) = 5

49= 10,2%

Jesús María = 𝑃(𝐽) = 3

49= 6,3%

Los Olivos = 𝑃(𝐿) = 28

49= 57,2%

Santa Anita = 𝑃(𝑀) = 3

49= 6,3%

Page 45: “Modelo predictivo para determinar deserción de ...

45

+ Femenino:

Breña = 𝑃(𝐻) = 7

31= 22,5%

Comas = 𝑃(𝐼) = 3

31= 9,7%

Jesús María = 𝑃(𝐽) = 4

31= 12,3%

La Molina = 𝑃(𝑘) = 1

31= 3,3%

Los Olivos = 𝑃(𝐿) = 16

31= 51,7%

4.2.3.6. Probabilidad de deserción en la relación Distrito y Motivo

DISTRITO MOTIVO

cambio económico laboral mudanza salud Total general

BREÑA 2 4 2 4 5 17 COMAS 1 2 4 1 8

JESUS MARIA 1 2 1 2 1 7 LA MOLINA 1 1 LOS OLIVOS 11 7 10 9 7 44

SANTA ANITA 2 1 3

Total general 15 18 18 15 14 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

+Breña:

Cambio = P(C) = 2

17 = 11.8%

Económico= P(D) = 4

17 = 23.6%

Laboral = P(E) = 2

17 = 11.8%

Mudanza= P(F) = 4

17 = 23.6%

Salud= P(G) = 5

17 = 29.4%

+ Comas:

Cambio = P(C) = 1

8 = 12.5%

Económico= P(D) = 2

8 = 25%

Page 46: “Modelo predictivo para determinar deserción de ...

46

Laboral = P(E) = 4

8 = 50%

+ Jesús María:

Cambio = P(C) = 1

7 = 14.3%

Económico = P(D) = 2

7 = 28.6%

Laboral = P(E) = 1

7 = 14.3%

Mudanza = P(F) = 2

7 = 28.6%

Salud = P(G) = 1

7 = 14.3%

+ La Molina:

Económico = P(D) = 1

1 = 100%

+ Los Olivos:

Cambio = P(C) = 11

44 = 25%

Económico = P(D) = 7

44 = 15.9%

Laboral = P(𝐸) = 10

44 = 22.7%

Mudanza = P(F) = 9

44 = 20.5%

Salud = P(G) = 7

44 = 15.9%

+ Santa Anita

Cambio = P(C) = 2

3 = 66.7%

Económico = P(D) = 1

3 = 33.3%

Page 47: “Modelo predictivo para determinar deserción de ...

47

4.2.3.7. Probabilidad de deserción en la relación Distrito y Edad

EDAD DISTRITO

BREÑA COMAS JESUS

MARIA LA MOLINA LOS OLIVOS

SANTA ANITA

Total general

17 1 4 5

18 2 1 4 7

19 3 2 1 3 1 10

20 2 2 5 9

21 1 6 7

22 2 1 2 5

23 7 7

24 1 5 1 7

25 1 1 4 2 8

26 2 1 4 1 8

28 2 2

29 1 1 1 1 4

30 1 1

Total general 17 8 7 1 44 3 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

+ Breña:

18 años = P(O) = 2

17 = 11.8%

19 años = P(P) = 3

17 = 17.7%

20 años = P(Q) = 2

17 = 11.8%

21 años = P(R) = 1

17 = 5.9%

22 años = P(S) = 2

17 = 11.8%

24 años = P(U) = 1

17 = 5.9%

25 años = P(V) = 1

17 = 5.9%

26 años = P(W) = 2

17 = 11.8%

28 años = P(X) = 2

17 = 11.8%

29 años = P(Y) = 1

17 = 5.9%

Page 48: “Modelo predictivo para determinar deserción de ...

48

+ Comas:

17 años = P(N) = 1

8 = 12.5%

18 años = P(O) = 1

8 = 12.5%

19 años = P(P) = 2

8 = 25%

20 años = P(Q) = 2

8 = 25%

22 años = P(S) = 1

8 = 12.5%

25 años = P(V) = 1

8 = 12.5%

+ Jesús María:

19 años = P(P) = 1

7 = 14.2%

25 años = P(V) = 4

7 = 57.2%

26 años = P(W) = 1

7 = 14.2%

29 años = P(Y) = 1

7 = 14.2%

+ La Molina:

29 años = P(Y) = 1

1 = 100%

+ Los Olivos:

17 años = P(N) = 4

44 = 9.1%

18 años = P(O) = 4

44 = 9.1%

19 años = P(P) = 3

44 = 6.9%

20 años = P(Q) = 5

44 = 11.4%

21 años = P(R) = 6

44 = 13.7%

22 años = P(S) = 2

44 = 4.6%

23 años = P(T) = 7

44 = 15.92%

24 años = P(U) = 5

44 = 11.4%

Page 49: “Modelo predictivo para determinar deserción de ...

49

25 años = P(V) = 2

44 = 4.6%

26 años = P(W) = 4

44 = 9.1%

29 años = P(Y) = 1

44 = 2.3%

30 años = P(Z) = 1

44 = 2.3%

+ Santa Anita:

19 años = P(Y) = 1

3 = 33.3%

24 años = P(Y) = 1

3 = 33.3%

26 años = P(Y) = 1

3 = 33.3%

4.2.3.8. Probabilidad de deserción en la relación Generó y Motivo

GENERO MOTIVO

cambio económico laboral mudanza salud Total general

MASCULINO 9 11 12 8 9 49

FEMENINO 6 7 6 7 5 31

Total general 15 18 18 15 14 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

Masculino:

Cambio = P(N) =9

49=18.3%

Económico = P(D) =11

49=22.4%

Laboral = P(E) =12

49=24.5%

Mudanza = P(F) =8

49=16.3%

Salud = P(G) = 9

49 = 18.3%

Femenino:

Cambio = P(N) =6

31=19.4%

Page 50: “Modelo predictivo para determinar deserción de ...

50

Económico = P(D) =7

31=22.6%

Laboral = P(E) =6

31=19.4%

Mudanza = P(F) =7

31=22.6%

Salud = P(G) = 5

31 = 16.1%

4.2.3.9. Probabilidad de deserción en la relación Generó y Edad

EDAD GENERO

MASCULINO FEMENINO Total general

17 3 2 5

18 6 1 7

19 6 4 10

20 8 1 9

21 3 4 7

22 3 2 5

23 5 2 7

24 5 2 7

25 3 5 8

26 4 4 8

28 1 1 2

29 1 3 4

30 1 1

Total general 49 31 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

Masculino:

17 años = P(N) = 3

49 = 6.2%

18 años = P(O) = 6

49 = 12.3%

19 años = P(P) = 6

49 = 12.3%

20 años = P(Q) = 8

49 = 16.4%

21 años = P(R) = 3

49 = 6.2%

22 años = P(S) = 3

49 = 6.2%

Page 51: “Modelo predictivo para determinar deserción de ...

51

23 años = P(T) = 5

49 = 10.3%

24 años = P(U) = 5

49 = 10.3%

25 años = P(V) = 3

49 = 6.2%

26 años = P(W) = 4

49 = 8.2%

28 años = P(X) = 1

49 = 20.5%

29 años = P(Y) = 1

49 = 20.5%

30 años = P(Z) = 1

49 = 20.5%

Femenino:

17 años = P(N) = 2

31 = 6.2%

18 años = P(O) = 1

31 = 12.3%

19 años = P(P) = 4

31 = 12.3%

20 años = P(Q) = 1

31 = 16.4%

21 años = P(R) = 4

31 = 6.2%

22 años = P(S) = 2

31 = 6.2%

23 años = P(T) = 2

31 = 10.3%

24 años = P(U) = 2

31 = 10.3%

25 años = P(V) = 5

31 = 6.2%

26 años = P(W) = 4

31 = 8.2%

28 años = P(X) = 1

31 = 20.5%

29 años = P(Y) = 3

31 = 20.5%

Page 52: “Modelo predictivo para determinar deserción de ...

52

4.2.3.10. Probabilidad de deserción en la relación Motivo y Edad

EDAD MOTIVO

cambio económico laboral mudanza salud Total general

17 1 1 2 1 5

18 2 2 2 1 7

19 2 1 4 1 2 10

20 2 2 1 1 3 9

21 2 1 3 1 7

22 3 1 1 5

23 1 1 3 2 7

24 1 1 5 7

25 2 3 1 2 8

26 2 2 1 3 8

28 1 1 2

29 1 1 2 4

30 1 1

Total general 15 18 18 15 14 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

+ Estudiantes de 17 años:

Cambio = P(C) = 1

5 = 20%

Económico = P(D) = 1

5 = 20%

Laboral = P(E) = 2

5 = 40%

Mudanza = P(F) = 1

5 = 20%

+ Estudiantes de 18 años:

Cambio = P(C) = 2

7 = 28.5%

Económico = P(D) = 2

7 = 28.5%

Laboral = P(E) = 2

7 = 28.5%

Mudanza = P(F) = 1

7 = 14.2%

Page 53: “Modelo predictivo para determinar deserción de ...

53

+ Estudiantes de 19 años:

Cambio = P(C) = 2

10 = 20%

Económico = P(D) = 1

10 = 10%

Laboral = P(E) = 4

10 = 40%

Mudanza = P(F) = 1

10 = 10%

Salud = P(G) = 2

10 = 20%

+ Estudiantes de 20 años:

Cambio = P(C) = 2

9 = 22.3%

Económico = P(D) = 2

9=22.3%

Laboral = P(E) = 1

9 = 11.1%

Mudanza = P(F) = 1

9 = 11.1%

Salud = P(G) = 3

9 = 33.4%

+ Estudiantes de 21 años:

Cambio = P(C) = 2

7 = 28.5%

Económico = P(D) = 1

7 = 14.2%

Laboral = P(E) = 3

7 = 42.9%

Salud = P(F) = 1

7 = 14.2%

+ Estudiantes de 22 años:

Económico = P(D) = 3

5 = 60%

Laboral = P(E) = 1

5 = 20%

Salud = P(F) = 1

5 = 20%

Page 54: “Modelo predictivo para determinar deserción de ...

54

+ Estudiantes de 23 años:

Cambio = P(C) = 1

7 = 14.2%

Laboral = P(E) = 1

7 = 14.2%

Mudanza = P(F) = 3

7 = 42.9%

Salud = P(G) = 2

7 = 28.5%

+ Estudiantes de 24 años:

Económico = P(D) = 1

7 = 14.2%

Laboral = P(E) = 1

7 = 14.2%

Mudanza = P(F) = 5

7 = 71.4%

+ Estudiantes de 25 años:

Cambio = P(C) = 2

8 =25%

Económico = P(D) = 3

8 = 37.5%

Laboral = P(E) = 1

8 = 12.5%

Mudanza = P(F) = 2

8 = 25%

+ Estudiantes de 26 años:

Cambio = P(C) = 2

8 = 25%

Económico = P(D) = 2

8 = 25%

Laboral = P(E) = 1

8 = 12.5%

Salud = P(F) = 3

8 = 37.5%

+ Estudiantes de 28 años:

Cambio = P(C) = 1

2 = 50%

Económico = P(D) = 1

2 = 50%

Page 55: “Modelo predictivo para determinar deserción de ...

55

+ Estudiantes de 29 años:

Económico = P(D) = 1

4 =25%

Mudanza = P(F) = 1

4 = 25%

Salud = P(G) = 2

4 = 50%

+ Estudiantes de 30 años:

Laboral = P(E) = 1

1 = 100%

4.2.3.11. Probabilidad de deserción en la relación Distrito, Género y Edad

GENERO DISTRITO EDAD

17 18 19 20 21 22 23 24 25 26 28 29 30 Total general

MASCULINO BREÑA 2 2 2 1 1 1 1 10

COMAS 1 2 1 1 5

JESUS MARIA 1 2 3

LOS OLIVOS 2 4 2 4 3 1 5 3 2 1 1 28

SANTA ANITA 1 1 1 3

Total HOMBRE 3 6 6 8 3 3 5 5 3 4 1 1 1 49

FEMENINO BREÑA 1 1 1 1 1 1 1 7

COMAS 1 2 3

JESUS MARIA 2 1 1 4

LA MOLINA 1 1

LOS OLIVOS 2 1 1 3 1 2 2 2 2 16

Total MUJER 2 1 4 1 4 2 2 2 5 4 1 3 31

Total general 5 7 10 9 7 5 7 7 8 8 2 4 1 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

Masculino - Breña:

18 años = P(O) = 2

10 = 20%

19 años = P(P) = 2

10 = 20%

20 años = P(Q) = 2

10 = 20%

22 años = P(S) = 1

10 = 10%

Page 56: “Modelo predictivo para determinar deserción de ...

56

24 años = P(U) = 1

10 = 10%

26 años = P(W) = 1

10 = 10%

28 años = P(X) = 1

10 = 10%

Masculino - Comas:

17 años = P(N) = 1

5 = 20%

20 años = P(Q) = 2

5 = 40%

22 años = P(S) = 1

5 = 20%

25 años = P(V) = 1

5 = 20%

Masculino – Jesús María:

19 años = P(P) = 1

3 = 33.3%

25 años = P(V) = 2

3 = 66.7%

Masculino – Los Olivos:

17 años = P(N) = 2

28 = 7.2%

18 años = P(O) = 4

28 = 14.3%

19 años = P(P) = 2

28 = 7.2%

20 años = P(Q) = 4

28 = 14.3%

21 años = P(R) = 3

28 = 10.8%

22 años = P(S) = 1

28 = 3.6%

23 años = P(T) = 5

28 = 17.9%

24 años = P(U) = 3

28 = 10.8%

26 años = P(W) = 2

28 = 7.2%

29 años = P(Y) = 1

28 = 3.6%

30 años = P(Z) = 1

28 = 3.6%

Page 57: “Modelo predictivo para determinar deserción de ...

57

Masculino – Santa Anita:

19 años = P(P) = 1

3 = 33.3%

24 años = P(T) = 1

3 = 33.3 %

26 años = P(W) = 1

3 = 33.3 %

Femenino - Breña:

19 años = P(P) = 1

7 = 14.3%

20 años = P(Q) = 1

7 = 14.3%

21 años = P(R) = 1

7 = 14.3%

22 años = P(S) = 1

7 = 14.3%

25 años = P(V) = 1

7 = 14.3%

26 años = P(W) = 1

7 = 14.3%

28 años = P(X) = 1

7 = 14.3%

29 años = P(Y) = 1

7 = 14.3%

Femenino - Comas:

18 años = P(O) = 1

3 = 33.3%

19 años = P(P) = 2

3 = 66.7%

Femenino – Jesús María:

25 años = P(V) = 2

4 = 50%

26 años = P(W) = 1

4 = 25%

29 años = P(Y) = 1

4 = 25%

Femenino – La Molina:

29 años = P(Y) = 1

1 = 100%

Page 58: “Modelo predictivo para determinar deserción de ...

58

Femenino – Los Olivos:

17 años = P(N) = 2

16 = 12.5%

19 años = P(P) = 1

16 = 6.3%

20 años = P(Q) = 1

16 = 6.3%

21 años = P(R) = 3

16 = 18.8%

22 años = P(S) = 1

16 = 6.3%

23 años = P(T) = 2

16 = 12.5%

24 años = P(U) = 2

16 = 12.5%

25 años = P(V) = 2

16 = 12.5%

26 años = P(W) = 2

16 = 12.5

4.2.3.12. Probabilidad de deserción en la relación Distrito, Motivo y Edad

Page 59: “Modelo predictivo para determinar deserción de ...

59

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

Breña:

+ Estudiante 18 años:

𝑃(𝐶) = 1

2 = 50%

𝑃(𝐷) = 1

2 = 50%

+ Estudiante 19 años:

𝑃(𝐸) = 1

3 = 33%

𝑃(𝐹) = 1

3 = 33%

𝑃(𝐺) = 1

3 = 33%

+ Estudiante 20 años:

𝑃(𝐹) = 1

2 = 50%

𝑃(𝐺) = 1

2 = 50%

+ Estudiante 21 años:

𝑃(𝐸) = 1

1 = 100%

+ Estudiante 22 años:

𝑃(𝐷) = 2

2 = 100%

+ Estudiante 24 años:

𝑃(𝐹) = 1

1 = 100%

+ Estudiante 25 años:

𝑃(𝐹) = 1

1 = 100%

+ Estudiante 26 años:

𝑃(𝑆) = 2

2 = 100%

+ Estudiante 28 años:

𝑃(𝐶) = 1

2 = 50%

Page 60: “Modelo predictivo para determinar deserción de ...

60

𝑃(𝐷) = 1

2 = 50%

+ Estudiante 29 años:

𝑃(𝐺) = 1

1 = 100%

Comas:

+ Estudiante 17 años:

𝑃(𝐸) = 1

1 = 100%

+ Estudiante 18 años:

𝑃(𝐶) = 1

1 = 100%

+ Estudiante 19 años:

𝑃(𝐸) = 2

2 = 100%

+ Estudiante 20 años:

𝑃(𝐷) = 1

2 = 50%

𝑃(𝐺) = 1

2 = 50%

+ Estudiante 22 años:

𝑃(𝐷) = 1

1 = 100%

+ Estudiante 25 años:

𝑃(𝐹) = 1

1 = 100%

Jesús María:

+ Estudiante 19 años:

𝑃(𝐸) = 1

1 = 100%

+ Estudiante 25 años:

𝑃(𝐶) = 1

4 = 25%

𝑃(𝐷) = 2

4 = 50%

𝑃(𝐹) = 1

4 = 25%

+ Estudiante 26 años:

Page 61: “Modelo predictivo para determinar deserción de ...

61

𝑃(𝐺) = 1

1 = 100%

+ Estudiante 29 años:

𝑃(𝐹) = 1

1 = 100%

La Molina:

+ Estudiante 29 años:

𝑃(𝐷) = 1

1 = 100%

Los Olivos:

+ Estudiante 17 años:

𝑃(𝐶) = 1

4 = 25%

𝑃(𝐷) = 1

4 = 25%

𝑃(𝐸) = 1

4 = 25%

𝑃(𝐹) = 1

4 = 25%

+ Estudiante 18 años:

𝑃(𝐷) = 1

4 = 25%

𝑃(𝐸) = 2

4 = 25%

𝑃(𝐹) = 1

4 = 25%

+ Estudiante 19 años:

𝑃(𝐶) = 2

3 = 63%

𝑃(𝐺) = 1

3 = 33%

+ Estudiante 20 años:

𝑃(𝐶) = 2

5 = 40%

𝑃(𝐷) = 1

5 = 20%

𝑃(𝐸) = 1

5 = 20%

𝑃(𝐺) = 1

5 = 20%

Page 62: “Modelo predictivo para determinar deserción de ...

62

+ Estudiante 21 años:

𝑃(𝐶) = 2

6 = 33%

𝑃(𝐷) = 1

6 = 16%

𝑃(𝐸) = 2

6 = 33%

𝑃(𝐺) = 1

6 = 16%

+ Estudiante 22 años:

𝑃(𝐸) = 1

2 = 50%

𝑃(𝐺) = 1

2 = 50%

+ Estudiante 23 años:

𝑃(𝐶) = 1

7 = 14%

𝑃(𝐸) = 1

7 = 14%

𝑃(𝐹) = 3

7 = 42%

𝑃(𝐺) = 2

7 = 28%

+ Estudiante 24 años:

𝑃(𝐷) = 1

5 = 20%

𝑃(𝐹) = 4

5 = 80%

+ Estudiante 25 años:

𝑃(𝐶) = 1

2 = 50%

𝑃(𝐷) = 1

2 = 50%

+ Estudiante 26 años:

𝑃(𝐶) = 2

4 = 50%

𝑃(𝐷) = 1

4 = 20%

𝑃(𝐸) = 1

4 = 20%

Page 63: “Modelo predictivo para determinar deserción de ...

63

+ Estudiante 29 años:

𝑃(𝐺) = 1

1 = 100%

+ Estudiante 30 años:

𝑃(𝐸) = 1

1 = 100%

Santa Anita:

+ Estudiante 19 años:

𝑃(𝐷) = 1

1 = 100%

+ Estudiante 24 años:

𝑃(𝐸) = 1

1 = 100%

+ Estudiante 26 años:

𝑃(𝐷) = 1

1 = 100%

Page 64: “Modelo predictivo para determinar deserción de ...

64

4.2.3.13. Probabilidad de deserción en la relación Generó, Edad y Motivo

GENERO EDAD cambio económico laboral mudanza salud Total general

MASCULINO

17 1 1 1 3

18 1 2 2 1 6

19 1 1 2 2 6

20 2 2 1 1 2 8

21 1 1 1 3

22 2 1 3

23 1 1 1 2 5

24 1 4 5

25 1 1 1 3

26 1 2 1 4

28 1 1

29 1 1

30 1 1

Total HOMBRE 9 11 12 8 9 49

FEMENINO

17 1 1 2

18 1 1

19 1 2 1 4

20 1 1

21 2 2 4

22 1 1 2

23 2 2

24 1 1 2

25 1 3 1 5

26 1 1 2 4

28 1 1

29 1 1 1 3

Total MUJER 6 7 6 7 5 31

Total general 15 18 18 15 14 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

17 años - Hombre:

Cambio = 𝑃(𝐶) = 1

3 = 33.3%

Económico = 𝑃(𝐷) = 1

3 = 33.3%

Page 65: “Modelo predictivo para determinar deserción de ...

65

Laboral = 𝑃(𝐸) = 1

3 = 33.3%

18 años - Hombre:

Cambio = 𝑃(𝐶) = 1

6 = 16.7%

Económico = 𝑃(𝐷) = 2

6 = 33.3%

Laboral = 𝑃(𝐸) = 2

6 = 33.3%

Mudanza = 𝑃(𝐹) = 1

6 = 16.7%

19 años - Hombre:

Cambio = 𝑃(𝐶) = 1

6 = 16.7%

Económico = 𝑃(𝐷) = 1

6 = 16.7%

Laboral = 𝑃(𝐸) = 2

6 = 33.3%

Salud = 𝑃(𝐺) = 2

6 = 33.3%

20 años – Hombre:

Cambio = 𝑃(𝐶) = 2

8 = 25%

Económico = 𝑃(𝐷) = 2

8 = 25%

Laboral = 𝑃(𝐸) = 1

8 = 12.5%

Mudanza = 𝑃(𝐹) = 1

8 = 12.5%

Salud = 𝑃(𝐺) = 2

8 = 25%

21 años – Hombre:

Económico = 𝑃(𝐷) = 1

3 = 33.3%

Laboral = 𝑃(𝐸) = 1

3 = 33.3%

Salud = 𝑃(𝐺) = 1

3 = 33.3%

22 años – Hombre:

Económico = 𝑃(𝐷) = 2

3 = 66.7%

Page 66: “Modelo predictivo para determinar deserción de ...

66

Laboral = 𝑃(𝐸) = 1

3 = 33.3%

23 años – Hombre:

Cambio = 𝑃(𝐶) = 1

5 = 20%

Laboral = 𝑃(𝐸) = 1

5 = 20%

Mudanza = 𝑃(𝐹) = 1

5 = 20%

Salud = 𝑃(𝐺) = 2

5 = 40%

24 años – Hombre:

Laboral = 𝑃(𝐸) = 1

5 = 20%

Mudanza = 𝑃(𝐹) = 4

5 = 80%

25 años – Hombre:

Cambio = 𝑃(𝐶) = 1

3 = 33.3%

Laboral = 𝑃(𝐸) = 1

3 = 33.3%

Mudanza = 𝑃(𝐹) = 1

3 = 33.3%

26 años – Hombre:

Cambio = 𝑃(𝐶) = 1

4 = 25%

Económico = 𝑃(𝐷) = 2

4 = 50%

Salud = 𝑃(𝐺) = 1

4 = 25%

28 años – Hombre:

Cambio = 𝑃(𝐶) = 1

1 = 100%

29 años – Hombre:

Salud = 𝑃(𝐺) = 1

1 = 100%

30 años – Hombre:

Laboral = 𝑃(𝐸) = 1

1 = 100%

17 años – Mujer:

Page 67: “Modelo predictivo para determinar deserción de ...

67

Laboral = 𝑃(𝐸) = 1

2 = 50%

Mudanza = 𝑃(𝐹) = 1

2 = 50%

18 años – Mujer:

Cambio = 𝑃(𝐶) = 1

1 = 100%

19 años – Mujer:

Cambio = 𝑃(𝐶) = 1

4 = 25%

Laboral = 𝑃(𝐸) = 2

4 = 50%

Mudanza = 𝑃(𝐹) = 1

4 = 25%

20 años – Mujer:

Salud = 𝑃(𝐺) = 1

1 = 100%

21 años – Mujer:

Cambio = 𝑃(𝐶) = 2

4 = 50%

Laboral = 𝑃(𝐸) = 2

4 = 50%

22 años – Mujer:

Económico = 𝑃(𝐷) = 1

2 = 50%

Salud = 𝑃(𝐺) = 1

2 = 50%

23 años – Mujer:

Mudanza = 𝑃(𝐹) = 2

2 = 100%

24 años – Mujer:

Económico = 𝑃(𝐷) = 1

2 = 50%

Mudanza = 𝑃(𝐹) = 1

2 = 50%

25 años – Mujer:

Cambio = 𝑃(𝐶) = 1

5 = 20%

Económico = 𝑃(𝐷) = 3

5 = 60%

Page 68: “Modelo predictivo para determinar deserción de ...

68

Mudanza = 𝑃(𝐹) = 1

5 = 20%

26 años – Mujer:

Cambio = 𝑃(𝐶) = 1

4 = 25%

Laboral = 𝑃(𝐸) = 1

4 = 25%

Salud = 𝑃(𝐺) = 2

4 = 50%

28 años – Mujer:

Económico = 𝑃(𝐷) = 2

8 = 25%

29 años – Mujer:

Económico = 𝑃(𝐷) = 1

3 = 33.3%

Mudanza = 𝑃(𝐹) = 1

3 = 33.3%

Salud = 𝑃(𝐺) = 1

3 = 33.3%

4.2.3.14. Probabilidad de deserción en la relación Distrito, Motivo y Género

GENERO DISTRITO cambio económico laboral mudanza salud Total general

MASCULINO

BREÑA 2 2 1 2 3 10

COMAS 2 2 1 5

JESUS MARIA 1 1 1 3

LOS OLIVOS 6 5 7 5 5 28

SANTA ANITA 2 1 3

Total MASCULINO 9 11 12 8 9 49

FEMENINO

BREÑA 2 1 2 2 7

COMAS 1 2 3

JESUS MARIA 2 1 1 4

LA MOLINA 1 1

LOS OLIVOS 5 2 3 4 2 16

Total FEMENINO 6 7 6 7 5 31

Total general 15 18 18 15 14 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

Masculino

Page 69: “Modelo predictivo para determinar deserción de ...

69

Breña:

𝑃(𝐶) = 2

10 = 20%

𝑃(𝐷) = 2

10 = 20%

𝑃(𝐸) = 1

10 = 10%

𝑃(𝐹) = 2

10 = 20%

𝑃(𝐺) = 3

10 = 30%

Comas:

𝑃(𝐷) = 2

5 = 40%

𝑃(𝐸) = 2

5 = 40%

𝑃(𝐺) = 1

5 = 20%

Jesús María:

𝑃(𝐶) = 1

3 = 33%

𝑃(𝐸) = 1

3 = 33%

𝑃(𝐹) = 1

3 = 33%

Los Olivos:

𝑃(𝐶) = 6

28 = 21%

𝑃(𝐷) = 5

28 = 17%

𝑃(𝐸) = 7

28 = 25%

𝑃(𝐹) = 5

28 = 17%

𝑃(𝐺) = 5

28 = 17%

Santa Anita:

𝑃(𝐷) = 2

3 = 67%

𝑃(𝐸) = 1

3 = 33%

Page 70: “Modelo predictivo para determinar deserción de ...

70

Femenino

Breña:

𝑃(𝐷) = 2

7 = 28%

𝑃(𝐸) = 1

7 = 14%

𝑃(𝐹) = 2

7 = 28%

𝑃(𝐺) = 2

7 = 28%

Comas:

𝑃(𝐶) = 1

3 = 33%

𝑃(𝐸) = 2

3 = 67%

Jesús María:

𝑃(𝐷) = 2

4 = 50%

𝑃(𝐹) = 1

4 = 25%

𝑃(𝐺) = 1

4 = 25%

La Molina:

𝑃(𝐷) = 1

1 = 100%

Los Olivos:

𝑃(𝐶) = 5

16 = 31%

𝑃(𝐷) = 2

16 = 12.5%

𝑃(𝐸) = 3

16 = 18%

𝑃(𝐹) = 4

16 = 25%

𝑃(𝐺) = 2

16 = 12.5%

Page 71: “Modelo predictivo para determinar deserción de ...

71

4.2.3.15. Probabilidad de deserción en la relación Distrito, Motivo, Género y Edad

GENERO DISTRITO EDAD cambio económico laboral mudanza salud Total general

MASCULINO

BREÑA

18 1 1 2

19 1 1 2

20 1 1 2

22 1 1

24 1 1

26 1 1

28 1 1

Total 2 2 1 2 3 10

COMAS 17 1 1

20 1 1 2

22 1 1

25 1 1

Total 2 2 1 5

JESUS MARIA 19 1 1

25 1 1 2

Total 1 1 1 3

LOS OLIVOS

17 1 1 2

18 1 2 1 4

19 1 1 2

20 2 1 1 4

21 1 1 1 3

22 1 1

23 1 1 1 2 5

24 3 3

26 1 1 2

29 1 1

30 1 1

Total 6 5 7 5 5 28

SANTA ANITA

19 1 1

24 1 1

26 1 1

Total 2 1 3

Total HOMBRE 9 11 12 8 9 49

Page 72: “Modelo predictivo para determinar deserción de ...

72

MUJER

BREÑA

19

1

1

21 1 1

22 1 1

25 1 1

26 1 1

28 1 1

29 1 1

Total 2 1 2 2 7

COMAS 18 1 1

19 2 2

Total 1 2 3

JESUS MARIA

25 2 2

26 1 1

29 1 1

Total 2 1 1 4

LA MOLINA 29 1 1

Total 1 1

LOS OLIVOS

17 1 1 2

19 1 1

20 1 1

21 2 1 3

22 1 1

23 2 2

24 1 1 2

25 1 1 2

26 1 1 2

Total 5 2 3 4 2 16

Total MUJER 6 7 6 7 5 31

Total general 15 18 18 15 14 80

Para obtener la probabilidad de ocurrencia se realizará el siguiente cálculo:

Donde:

Masculino:

Breña – Edad 18 años:

𝑃(𝐶) = 1

2 = 50%

𝑃(𝐷) = 1

2 = 50%

Page 73: “Modelo predictivo para determinar deserción de ...

73

Breña – Edad 19 años:

𝑃(𝐸) = 1

2 = 50%

𝑃(𝐺) = 1

2 = 50%

Breña – Edad 20 años:

𝑃(𝐹) = 1

2 = 50%

𝑃(𝐺) = 1

2 = 50%

Breña – Edad 22 años:

𝑃(𝐷) = 1

1 = 50%

Breña – Edad 24 años:

𝑃(𝐹) = 1

1 = 50%

Breña – Edad 26 años:

𝑃(𝐺) = 1

1 = 50%

Breña – Edad 28 años:

𝑃(𝐶) = 1

1 = 50%

Comas:

Comas – Edad 17 años:

𝑃(𝐸) = 1

1 = 100%

Comas – Edad 20 años:

𝑃(𝐷) = 1

2 = 50%

𝑃(𝐺) = 1

2 = 50%

Comas – Edad 22 años:

𝑃(𝐷) = 1

1 = 100%

Comas – Edad 25 años:

𝑃(𝐸) = 1

1 = 100%

Page 74: “Modelo predictivo para determinar deserción de ...

74

Jesús María:

Jesús María – Edad 19 años:

𝑃(𝐸) = 1

1 = 100%

Jesús María – Edad 25 años:

𝑃(𝐶) = 1

2 = 50%

𝑃(𝐹) = 1

2 = 50%

Los Olivos:

Los Olivos – Edad 17 años:

𝑃(𝐶) = 1

2 = 50%

𝑃(𝐷) = 1

2 = 50%

Los Olivos – Edad 18 años:

𝑃(𝐷) = 1

4 = 25%

𝑃(𝐸) = 2

4 = 50%

𝑃(𝐹) = 1

4 = 25%

Los Olivos – Edad 19 años:

𝑃(𝐶) = 1

2 = 50%

𝑃(𝐺) = 1

2 = 50%

Los Olivos – Edad 20 años:

𝑃(𝐶) = 2

4 = 50%

𝑃(𝐷) = 1

4 = 25%

𝑃(𝐸) = 1

4 = 25%

Los Olivos – Edad 21 años:

𝑃(𝐷) = 1

3 = 33%

𝑃(𝐸) = 1

3 = 33%

Page 75: “Modelo predictivo para determinar deserción de ...

75

𝑃(𝐺) = 1

3 = 33%

Los Olivos – Edad 22 años:

𝑃(𝐸) = 1

1 = 100%

Los Olivos – Edad 23 años:

𝑃(𝐶) = 1

5 = 20%

𝑃(𝐸) = 1

5 = 20%

𝑃(𝐹) = 1

5 = 20%

𝑃(𝐺) = 2

5 = 40%

Los Olivos – Edad 24 años:

𝑃(𝐹) = 3

3 = 100%

Los Olivos – Edad 26 años:

𝑃(𝐶) = 1

2 = 50%

𝑃(𝐷) = 1

2 = 50%

Los Olivos – Edad 29 años:

𝑃(𝐺) = 1

1 = 100%

Los Olivos – Edad 30 años:

𝑃(𝐸) = 1

1 = 100%

Santa Anita:

Santa Anita – Edad 19 años:

𝑃(𝐷) = 1

1 = 100%

Santa Anita – Edad 24 años:

𝑃(𝐸) = 1

1 = 100%

Santa Anita – Edad 26 años:

𝑃(𝐷) = 1

1 = 100%

Page 76: “Modelo predictivo para determinar deserción de ...

76

Femenino:

Breña – 19 años:

𝑃(𝐹) = 1

1 = 100%

Breña – 21 años:

𝑃(𝐸) = 1

1 = 100%

Breña – 22 años:

𝑃(𝐷) = 1

1 = 100%

Breña – 25 años:

𝑃(𝐹) = 1

1 = 100%

Breña – 26 años:

𝑃(𝐺) = 1

1 = 100%

Breña – 28 años:

𝑃(𝐷) = 1

1 = 100%

Breña – 29 años:

𝑃(𝐺) = 1

1 = 100%

Comas:

Comas – 18 años:

𝑃(𝐶) = 1

1 = 100%

Comas – 19 años:

𝑃(𝐸) = 2

2 = 100%

Jesús María:

Jesús María – 25 años:

𝑃(𝐷) = 2

2 = 100%

Jesús María – 26 años:

𝑃(𝐺) = 1

1 = 100%

Page 77: “Modelo predictivo para determinar deserción de ...

77

Jesús María – 29 años:

𝑃(𝐹) = 1

1 = 100%

La Molina:

La Molina – 29 años:

𝑃(𝐷) = 1

1 = 100%

Los Olivos:

Los Olivos – 17 años:

𝑃(𝐸) = 1

2 = 50%

𝑃(𝐹) = 1

2 = 50%

Los Olivos – 19 años:

𝑃(𝐶) = 1

1 = 100%

Los Olivos – 20 años:

𝑃(𝐺) = 1

1 = 100%

Los Olivos – 21 años:

𝑃(𝐶) = 2

3 = 67%

𝑃(𝐸) = 1

3 = 33%

Los Olivos – 22 años:

𝑃(𝐺) = 1

1 = 100%

Los Olivos – 23 años:

𝑃(𝐹) = 2

2 = 100%

Los Olivos – 24 años:

𝑃(𝐷) = 1

2 = 50%

𝑃(𝐹) = 1

2 = 50%

Los Olivos – 25 años:

𝑃(𝐶) = 1

2 = 50%

Page 78: “Modelo predictivo para determinar deserción de ...

78

𝑃(𝐷) = 1

2 = 50%

Los Olivos – 26 años:

𝑃(𝐶) = 1

2 = 50%

𝑃(𝐸) = 1

2 = 50%

4.2.4. Etapa 4: Transformación de los datos

En esta etapa, se determinarán los patrones a partir del cálculo de las probabilidades de deserción,

determinando el de mayor relevancia. Para ello, se realizará un análisis de los datos que mayor

injerencia tienen sobre la problemática de estudio, el cual se define en patrones.

4.2.4.1. Patrón de deserción por Distrito

DISTRITO Total

BREÑA 17 COMAS 8

JESUS MARIA 7

LA MOLINA 1 LOS OLIVOS 44

SANTA ANITA 3

Total general 80 Para obtener el patrón para esta combinación se realizará el siguiente análisis lógico:

Donde:

H: Tiene una probabilidad de desertar del 21.3%

I: Tiene una probabilidad de desertar del 10%

J: Tiene una probabilidad de desertar del 8.8%

K: Tiene una probabilidad de desertar del 1.3%

L: Tiene una probabilidad de desertar del 55%

M: Tiene una probabilidad de desertar del 3.8%

Análisis del Patrón por Distrito:

Existe una mayor probabilidad de un estudiante del Distrito de Los Olivos.

Page 79: “Modelo predictivo para determinar deserción de ...

79

4.2.4.2. Patrón de deserción por Género

MASCULINO FEMENINO Total general

49 31 80

Para obtener el patrón para esta combinación se realizará el siguiente análisis lógico:

Donde:

A: Tiene una probabilidad de desertar del 61.2%

B: Tiene una probabilidad de desertar del 38.8%

Análisis del Patrón por Género:

Existe una mayor probabilidad de un estudiante del género masculino.

4.2.4.3. Patrón de deserción por Motivo

MOTIVO Total

cambio 15

económico 18

laboral 18

mudanza 15

salud 14

Total general 80

Para obtener el patrón para esta combinación se realizará el siguiente análisis lógico:

Donde:

C: Tiene una probabilidad de desertar del 18.8%

D: Tiene una probabilidad de desertar del 22.5%

E: Tiene una probabilidad de desertar del 22.5%

F: Tiene una probabilidad de desertar del 18.8%

G: Tiene una probabilidad de desertar del 17.5%

Análisis del Patrón por Motivo:

Existe mayor probabilidad de deserción de un estudiante por motivos económicos o laborales.

Page 80: “Modelo predictivo para determinar deserción de ...

80

4.2.4.4. Patrón de deserción por Edad

EDAD Total

17 5

18 7

19 10

20 9

21 7

22 5

23 7

24 7

25 8

26 8

28 2

29 4

30 1

Total general 80

Para obtener el patrón para esta combinación se realizará el siguiente análisis lógico:

Donde:

N = Tiene una probabilidad de desertar 6.3%

O = Tiene una probabilidad de desertar 8.8%

P = Tiene una probabilidad de desertar 12.5%

Q = Tiene una probabilidad de desertar 11.3%

R = Tiene una probabilidad de desertar 8.8%

S = Tiene una probabilidad de desertar 6.3%

T = Tiene una probabilidad de desertar 8.8%

U = Tiene una probabilidad de desertar 8.8%

V = Tiene una probabilidad de desertar 10%

W = Tiene una probabilidad de desertar 10%

X = Tiene una probabilidad de desertar 2.5%

Y = Tiene una probabilidad de desertar 5%

Z = Tiene una probabilidad de desertar 1.3%

Análisis del Patrón por Motivo:

Existe una mayor probabilidad de deserción de un estudiante de 19 años

Page 81: “Modelo predictivo para determinar deserción de ...

81

4.2.4.5. Patrón de deserción en la relación Distrito y Generó

DISTRITO GENERO

MASCULINO FEMENINO Total general

BREÑA 10 7 17

COMAS 5 3 8

JESUS MARIA 3 4 7

LA MOLINA 1 1

LOS OLIVOS 28 16 44

SANTA ANITA 3 3

Total general 49 31 80

Para obtener el patrón para esta combinación se realizará el siguiente análisis lógico:

Donde:

Hombre:

o H: Tiene una probabilidad de desertar del 20%

o L: Tiene una probabilidad de desertar del 57.2%

o J: Tiene una probabilidad de desertar del 6.3%

o I: Tiene una probabilidad de desertar del 10.2%

o K: Tiene una probabilidad de desertar del 0%

o M: Tiene una probabilidad de desertar del 6.2%

Mujer:

o H: Tiene una probabilidad de desertar del 22.5%

o L: Tiene una probabilidad de desertar del 51.7%

o J: Tiene una probabilidad de desertar del 12.3%

o I: Tiene una probabilidad de desertar del 9.7%

o K: Tiene una probabilidad de desertar del 3.3%

o M: Tiene una probabilidad de desertar del 0%

Análisis del Patrón por Distrito y Género:

Existe una mayor probabilidad de deserción de un estudiante del Género Masculino del Distrito

de Los Olivos

Page 82: “Modelo predictivo para determinar deserción de ...

82

4.2.4.6. Patrón de deserción en la relación Distrito y Motivo

DISTRITO MOTIVO

cambio económico laboral mudanza salud Total general

BREÑA 2 4 2 4 5 17 COMAS 1 2 4 1 8

JESUS MARIA 1 2 1 2 1 7 LA MOLINA 1 1 LOS OLIVOS 11 7 10 9 7 44

SANTA ANITA 2 1 3

Total general 15 18 18 15 14 80

Para obtener el patrón para esta combinación se realizará el siguiente análisis lógico:

Donde:

Breña:

o C: Tiene una probabilidad de desertar de 11.8%

o D: Tiene una probabilidad de desertar de 23.6%

o E: Tiene una probabilidad de desertar de 11.8%

o F: Tiene una probabilidad de desertar de 23.6%

o G: Tiene una probabilidad de desertar de 29.4%

Comas:

o C: Tiene una probabilidad de desertar de 12.5%

o D: Tiene una probabilidad de desertar de 25%

o E: Tiene una probabilidad de desertar de 50%

o F: Tiene una probabilidad de desertar de 0%

o G: Tiene una probabilidad de desertar de 0%

Jesús María:

o C: Tiene una probabilidad de desertar de 14.3%

o D: Tiene una probabilidad de desertar de 28.6%

o E: Tiene una probabilidad de desertar de 14.3%

o F: Tiene una probabilidad de desertar de 28.6%

o G: Tiene una probabilidad de desertar de 14.3%

Page 83: “Modelo predictivo para determinar deserción de ...

83

Los Olivos:

o C: Tiene una probabilidad de desertar de 25%

o D: Tiene una probabilidad de desertar de 15.9%

o E: Tiene una probabilidad de desertar de 22.7%

o F: Tiene una probabilidad de desertar de 20.5%

o G: Tiene una probabilidad de desertar de 15.9%

La Molina:

o C: Tiene una probabilidad de desertar de 0%

o D: Tiene una probabilidad de desertar de 100 %

o E: Tiene una probabilidad de desertar de 0%

o F: Tiene una probabilidad de desertar de 0%

o G: Tiene una probabilidad de desertar de 0%

Santa Anita:

o C: Tiene una probabilidad de desertar de 66.7%

o D: Tiene una probabilidad de desertar de 33.3%

o E: Tiene una probabilidad de desertar de 0%

o F: Tiene una probabilidad de desertar de 0%

o G: Tiene una probabilidad de desertar de 0%

Análisis del Patrón por Distrito y Motivo:

Existe una mayor probabilidad de deserción de un estudiante del Distrito de la Molina por

motivos económicos.

Page 84: “Modelo predictivo para determinar deserción de ...

84

4.2.4.7. Patrón de deserción en la relación Distrito y Edad

EDAD DISTRITO

BREÑA COMAS JESUS

MARIA LA MOLINA LOS OLIVOS

SANTA ANITA

Total general

17 1 4 5

18 2 1 4 7

19 3 2 1 3 1 10

20 2 2 5 9

21 1 6 7

22 2 1 2 5

23 7 7

24 1 5 1 7

25 1 1 4 2 8

26 2 1 4 1 8

28 2 2

29 1 1 1 1 4

30 1 1

Total general 17 8 7 1 44 3 80

Para obtener el patrón para esta combinación se realizará el siguiente análisis lógico:

Donde:

Edad:

Personas de 17 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 5.9%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 9.1%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Personas de 18 años:

o Breña: Tiene una probabilidad de desertar de 11.7%

o Comas: Tiene una probabilidad de desertar de 12.5%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

Page 85: “Modelo predictivo para determinar deserción de ...

85

o Los Olivos: Tiene una probabilidad de desertar de 9.1%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Personas de 19 años:

o Breña: Tiene una probabilidad de desertar de 17.7%

o Comas: Tiene una probabilidad de desertar de 25%

o Jesús María: Tiene una probabilidad de desertar de 14.2%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 6.9%

o Santa Anita: Tiene una probabilidad de desertar de 33.3%

Personas de 20 años:

o Breña: Tiene una probabilidad de desertar de 11.8%

o Comas: Tiene una probabilidad de desertar de 25%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 11.4%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Personas de 21 años:

o Breña: Tiene una probabilidad de desertar de 5.9%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 13.7%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Personas de 22 años:

o Breña: Tiene una probabilidad de desertar de 11.8%

o Comas: Tiene una probabilidad de desertar de 12.5%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

Page 86: “Modelo predictivo para determinar deserción de ...

86

o Los Olivos: Tiene una probabilidad de desertar de 4.6%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Personas de 23 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 15.92%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Personas de 24 años:

o Breña: Tiene una probabilidad de desertar de 5.9%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 11.4%

o Santa Anita: Tiene una probabilidad de desertar de 33.3%

Personas de 25 años:

o Breña: Tiene una probabilidad de desertar de 5.9%

o Comas: Tiene una probabilidad de desertar de 12.5%

o Jesús María: Tiene una probabilidad de desertar de 57.2%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 4.6%

o Santa Anita: Tiene una probabilidad de desertar de 33.3%

Personas de 26 años:

o Breña: Tiene una probabilidad de desertar de 11.8%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 14.3%

o La Molina: Tiene una probabilidad de desertar de 0%

Page 87: “Modelo predictivo para determinar deserción de ...

87

o Los Olivos: Tiene una probabilidad de desertar de 9.1%

o Santa Anita: Tiene una probabilidad de desertar de 33.3%

Personas de 28 años:

o Breña: Tiene una probabilidad de desertar de 11.8%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 0%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Personas de 29 años:

o Breña: Tiene una probabilidad de desertar de 5.9%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 14.3%

o La Molina: Tiene una probabilidad de desertar de 100%

o Los Olivos: Tiene una probabilidad de desertar de 2.3%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Personas de 30 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 2.3%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Análisis del Patrón por Distrito y Edad:

Existe una mayor probabilidad de deserción de un estudiante del Distrito de La Molina de la

edad de 29 años.

Page 88: “Modelo predictivo para determinar deserción de ...

88

4.2.4.8. Patrón de deserción en la relación Género y Motivo

GENERO MOTIVO

cambio económico laboral mudanza salud Total general

MASCULINO 9 11 12 8 9 49

FEMENINO 6 7 6 7 5 31

Total general 15 18 18 15 14 80

Para obtener el patrón para esta combinación se realizará el siguiente análisis lógico:

Donde:

Masculino:

o Cambio: Tiene una probabilidad de desertar de 18.3%

o Económico: Tiene una probabilidad de desertar de 22.4%

o Laboral: Tiene una probabilidad de desertar de 24.5%

o Mudanza: Tiene una probabilidad de desertar de 16.3%

o Salud: Tiene una probabilidad de desertar de 18.3%

Femenino:

o Cambio: Tiene una probabilidad de desertar de 19.4%

o Económico: Tiene una probabilidad de desertar de 22.6%

o Laboral: Tiene una probabilidad de desertar de 19.4%

o Mudanza: Tiene una probabilidad de desertar de 22.6%

o Salud: Tiene una probabilidad de desertar de 16.1%

Análisis del Patrón por Género y Motivo:

Existe una mayor probabilidad de deserción de un estudiante del Género Masculino por motivo

Laboral.

Page 89: “Modelo predictivo para determinar deserción de ...

89

4.2.4.9. Patrón de deserción en la relación Género y Edad

EDAD GENERO

MASCULINO FEMENINO Total general

17 3 2 5

18 6 1 7

19 6 4 10

20 8 1 9

21 3 4 7

22 3 2 5

23 5 2 7

24 5 2 7

25 3 5 8

26 4 4 8

28 1 1 2

29 1 3 4

30 1 1

Total general 49 31 80

Para obtener el patrón para esta combinación se realizará el siguiente análisis lógico:

Donde:

A = Masculino

B = Femenino

Masculino

o Estudiantes de 17 años tienen una probabilidad de desertar del 6.3%

o Estudiantes de 18 años tienen una probabilidad de desertar del 12.3%

o Estudiantes de 19 años tienen una probabilidad de desertar del 12.3%

o Estudiantes de 20 años tienen una probabilidad de desertar del 16.4%

o Estudiantes de 21 años tienen una probabilidad de desertar del 6.3%

o Estudiantes de 22 años tienen una probabilidad de desertar del 6.3%

o Estudiantes de 23 años tienen una probabilidad de desertar del 10.2%

o Estudiantes de 24 años tienen una probabilidad de desertar del 10.2%

o Estudiantes de 25 años tienen una probabilidad de desertar del 6.3%

o Estudiantes de 26 años tienen una probabilidad de desertar del 8.2%

o Estudiantes de 28 años tienen una probabilidad de desertar del 2.1%

Page 90: “Modelo predictivo para determinar deserción de ...

90

o Estudiantes de 29 años tienen una probabilidad de desertar del 2.1%

o Estudiantes de 30 años tienen una probabilidad de desertar del 2.1%

Femenino:

o Estudiantes de 17 años tienen una probabilidad de desertar del 6.5%

o Estudiantes de 18 años tienen una probabilidad de desertar del 3.3%

o Estudiantes de 19 años tienen una probabilidad de desertar del 12.9%

o Estudiantes de 20 años tienen una probabilidad de desertar del 3.3%

o Estudiantes de 21 años tienen una probabilidad de desertar del 12.9%

o Estudiantes de 22 años tienen una probabilidad de desertar del 6.5%

o Estudiantes de 23 años tienen una probabilidad de desertar del 6.5%

o Estudiantes de 24 años tienen una probabilidad de desertar del 6.5%

o Estudiantes de 25 años tienen una probabilidad de desertar del 16.2%

o Estudiantes de 26 años tienen una probabilidad de desertar del 12.9%

o Estudiantes de 28 años tienen una probabilidad de desertar del 3.3%

o Estudiantes de 29 años tienen una probabilidad de desertar del 9.7%

o Estudiantes de 30 años tienen una probabilidad de desertar del 0%

Análisis del Patrón por Género y Edad:

Existe una mayor probabilidad de deserción de un estudiante del Género Femenino de la edad de

25 años.

Page 91: “Modelo predictivo para determinar deserción de ...

91

4.2.4.10. Patrón de deserción en la relación Motivo y Edad

EDAD MOTIVO

cambio económico laboral mudanza salud Total general

17 1 1 2 1 5

18 2 2 2 1 7

19 2 1 4 1 2 10

20 2 2 1 1 3 9

21 2 1 3 1 7

22 3 1 1 5

23 1 1 3 2 7

24 1 1 5 7

25 2 3 1 2 8

26 2 2 1 3 8

28 1 1 2

29 1 1 2 4

30 1 1

Total general 15 18 18 15 14 80

Para obtener el patrón para esta combinación se realizará el siguiente análisis lógico:

Donde:

+ Estudiantes de 17 años:

o Cambio: Tiene una probabilidad de desertar de 20%

o Económico: Tiene una probabilidad de desertar de 20%

o Laboral: Tiene una probabilidad de desertar de 40%

o Mudanza: Tiene una probabilidad de desertar de 20%

o Salud: Tiene una probabilidad de desertar de 0%

+ Estudiantes de 18 años:

o Cambio: Tiene una probabilidad de desertar de 28.5%

o Económico: Tiene una probabilidad de desertar de 28.5%

o Laboral: Tiene una probabilidad de desertar de 28.5%

o Mudanza: Tiene una probabilidad de desertar de 14.2%

o Salud: Tiene una probabilidad de desertar de 0%

Page 92: “Modelo predictivo para determinar deserción de ...

92

+ Estudiantes de 19 años:

o Cambio: Tiene una probabilidad de desertar de 20%

o Económico: Tiene una probabilidad de desertar de 10%

o Laboral: Tiene una probabilidad de desertar de 40%

o Mudanza: Tiene una probabilidad de desertar de 10%

o Salud: Tiene una probabilidad de desertar de 20%

+ Estudiantes de 20 años:

o Cambio: Tiene una probabilidad de desertar de 22.3%

o Económico: Tiene una probabilidad de desertar de 22.3%

o Laboral: Tiene una probabilidad de desertar de 11.1%

o Mudanza: Tiene una probabilidad de desertar de 11.1%

o Salud: Tiene una probabilidad de desertar de 33.4%

+ Estudiantes de 21 años:

o Cambio: Tiene una probabilidad de desertar de 28.5%

o Económico: Tiene una probabilidad de desertar de 0%

o Laboral: Tiene una probabilidad de desertar de 0%

o Mudanza: Tiene una probabilidad de desertar de 0%

o Salud: Tiene una probabilidad de desertar de 28.5%

+ Estudiantes de 22 años:

o Cambio: Tiene una probabilidad de desertar de 60%

o Económico: Tiene una probabilidad de desertar de 0%

o Laboral: Tiene una probabilidad de desertar de 20%

o Mudanza: Tiene una probabilidad de desertar de 0%

o Salud: Tiene una probabilidad de desertar de 20%

+ Estudiantes de 23 años:

o Cambio: Tiene una probabilidad de desertar de 14.2%

o Económico: Tiene una probabilidad de desertar de 0%

o Laboral: Tiene una probabilidad de desertar de 14.2%

Page 93: “Modelo predictivo para determinar deserción de ...

93

o Mudanza: Tiene una probabilidad de desertar de 42.9%

o Salud: Tiene una probabilidad de desertar de 28.5%

+ Estudiantes de 24 años:

o Cambio: Tiene una probabilidad de desertar de 0%

o Económico: Tiene una probabilidad de desertar de 14.2%

o Laboral: Tiene una probabilidad de desertar de 14.2%

o Mudanza: Tiene una probabilidad de desertar de 71.4%

o Salud: Tiene una probabilidad de desertar de 0%

+ Estudiantes de 25 años:

o Cambio: Tiene una probabilidad de desertar de 25%

o Económico: Tiene una probabilidad de desertar de 37.5%

o Laboral: Tiene una probabilidad de desertar de 12.5%

o Mudanza: Tiene una probabilidad de desertar de 25%

o Salud: Tiene una probabilidad de desertar de 0%

+ Estudiantes de 26 años:

o Cambio: Tiene una probabilidad de desertar de 25%

o Económico: Tiene una probabilidad de desertar de 25%

o Laboral: Tiene una probabilidad de desertar de 12.5%

o Mudanza: Tiene una probabilidad de desertar de 0%

o Salud: Tiene una probabilidad de desertar de 37.5%

+ Estudiantes de 28 años:

o Cambio: Tiene una probabilidad de desertar de 50%

o Económico: Tiene una probabilidad de desertar de 50%

o Laboral: Tiene una probabilidad de desertar de 0%

o Mudanza: Tiene una probabilidad de desertar de 0%

o Salud: Tiene una probabilidad de desertar de 0%

Page 94: “Modelo predictivo para determinar deserción de ...

94

+ Estudiantes de 29 años:

o Cambio: Tiene una probabilidad de desertar de 0%

o Económico: Tiene una probabilidad de desertar de 25%

o Laboral: Tiene una probabilidad de desertar de 0%

o Mudanza: Tiene una probabilidad de desertar de 25%

o Salud: Tiene una probabilidad de desertar de 50%

+ Estudiantes de 30 años:

o Cambio: Tiene una probabilidad de desertar de 0%

o Económico: Tiene una probabilidad de desertar de 0%

o Laboral: Tiene una probabilidad de desertar de 100%

o Mudanza: Tiene una probabilidad de desertar de 0%

o Salud: Tiene una probabilidad de desertar de 0%

Análisis del Patrón por Motivo y Edad:

Existe una mayor probabilidad de deserción de un estudiante de 30 años por motivos laboral.

4.2.4.11. Patrón de deserción en la relación Distrito, Género y Edad

GENERO DISTRITO EDAD

17 18 19 20 21 22 23 24 25 26 28 29 30 Total general

MASCULINO BREÑA 2 2 2 1 1 1 1 10

COMAS 1 2 1 1 5

JESUS MARIA 1 2 3

LOS OLIVOS 2 4 2 4 3 1 5 3 2 1 1 28

SANTA ANITA 1 1 1 3

Total HOMBRE 3 6 6 8 3 3 5 5 3 4 1 1 1 49

FEMENINO BREÑA 1 1 1 1 1 1 1 7

COMAS 1 2 3

JESUS MARIA 2 1 1 4

LA MOLINA 1 1

LOS OLIVOS 2 1 1 3 1 2 2 2 2 16

Total MUJER 2 1 4 1 4 2 2 2 5 4 1 3 31

Total general 5 7 10 9 7 5 7 7 8 8 2 4 1 80

Para obtener el patrón para esta combinación se realizará el siguiente análisis lógico:

Page 95: “Modelo predictivo para determinar deserción de ...

95

- Masculino:

+ Estudiante de 17 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 20%

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 7.2%

o Santa Anita: Tiene una probabilidad de desertar de 0%

+ Estudiante de 18 años:

o Breña: Tiene una probabilidad de desertar de 20%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 14.3%

o Santa Anita: Tiene una probabilidad de desertar de 0%

+ Estudiante de 19 años:

o Breña: Tiene una probabilidad de desertar de 20%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 33.3%

o Los Olivos: Tiene una probabilidad de desertar de 7.2%

o Santa Anita: Tiene una probabilidad de desertar de 33.3%

+ Estudiante de 20 años:

o Breña: Tiene una probabilidad de desertar de 20%

o Comas: Tiene una probabilidad de desertar de 40%

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 14.3%

o Santa Anita: Tiene una probabilidad de desertar de 0%

+ Estudiante de 21 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 0%

Page 96: “Modelo predictivo para determinar deserción de ...

96

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 10.8%

o Santa Anita: Tiene una probabilidad de desertar de 0%

+ Estudiante de 22 años:

o Breña: Tiene una probabilidad de desertar de 10%

o Comas: Tiene una probabilidad de desertar de 20%

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 3.6%

o Santa Anita: Tiene una probabilidad de desertar de 0%

+ Estudiante de 23 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 17.9%

o Santa Anita: Tiene una probabilidad de desertar de 0%

+ Estudiante de 24 años:

o Breña: Tiene una probabilidad de desertar de 10%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 10.8%

o Santa Anita: Tiene una probabilidad de desertar de 33.3%

+ Estudiante de 25 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 20%

o Jesús María: Tiene una probabilidad de desertar de 66.7%

o Los Olivos: Tiene una probabilidad de desertar de 0%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Page 97: “Modelo predictivo para determinar deserción de ...

97

+ Estudiante de 26 años:

o Breña: Tiene una probabilidad de desertar de 10%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 7.2%

o Santa Anita: Tiene una probabilidad de desertar de 33.3%

+ Estudiante de 28 años:

o Breña: Tiene una probabilidad de desertar de 10%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 0%

o Santa Anita: Tiene una probabilidad de desertar de 0%

+ Estudiante de 29 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 3.6%

o Santa Anita: Tiene una probabilidad de desertar de 0%

+ Estudiante de 30 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 3.6%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Page 98: “Modelo predictivo para determinar deserción de ...

98

- Femenino:

Estudiante de 17 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 12.5%

Estudiante de 18 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 33.3%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 0%

Estudiante de 19 años:

o Breña: Tiene una probabilidad de desertar de 14.3%

o Comas: Tiene una probabilidad de desertar de 66.7%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 6.3%

Estudiante de 20 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 6.3%

Estudiante de 21 años:

o Breña: Tiene una probabilidad de desertar de 14.3%

Page 99: “Modelo predictivo para determinar deserción de ...

99

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 18.8%

Estudiante de 22 años:

o Breña: Tiene una probabilidad de desertar de 14.3%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 6.3%

Estudiante de 23 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 12.5%

Estudiante de 24 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 12.5%

Estudiante de 25 años:

o Breña: Tiene una probabilidad de desertar de 14.3%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 50%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 12.5%

Page 100: “Modelo predictivo para determinar deserción de ...

100

Estudiante de 26 años:

o Breña: Tiene una probabilidad de desertar de14.3%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 25%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 12.5%

Estudiante de 28 años:

o Breña: Tiene una probabilidad de desertar de 14.3%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o La Molina: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 0%

Estudiante de 29 años:

o Breña: Tiene una probabilidad de desertar de 14.3%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 25%

o La Molina: Tiene una probabilidad de desertar de 100%

o Los Olivos: Tiene una probabilidad de desertar de 0%

Estudiante de 30 años:

o Breña: Tiene una probabilidad de desertar de 0%

o Comas: Tiene una probabilidad de desertar de 0%

o Jesús María: Tiene una probabilidad de desertar de 0%

o Los Olivos: Tiene una probabilidad de desertar de 0%

o Santa Anita: Tiene una probabilidad de desertar de 0%

Análisis del Patrón por Motivo y Edad:

Existe una mayor probabilidad de deserción de un estudiante del Género Femenino con residencia

en La Molina y de la edad 29 años.

Page 101: “Modelo predictivo para determinar deserción de ...

101

4.3. Desarrollo del modelo predictivo

Se procede a diseñar el modelo predictivo mediante la técnica de minería de datos el árbol de

decisiones J4.8 que permitirá determinar las rutas y los caminos que toman los datos. El objetivo

es analizar, observar y dar seguimiento a todos los caminos que el dato puede tomar. Este modelo

permitirá encontrar información útil que permitirá atender la problemática con el cual la

Universidad Tecnológica del Perú podrá obtener una mejor toma de decisiones. Para ello, se

determina el resumen de los Nodos de decisión que serán los pilares para el desarrollo de la técnica

de minería de datos del árbol de decisiones e identificar la ruta crítica.

Tabla 21: Tabla de nodos del árbol de decisiones

Elaboración Propia

Page 102: “Modelo predictivo para determinar deserción de ...

102

Tabla 22: Tabla de nodos del árbol de decisiones

Elaboración Propia

Fuente: Elaboración Propia

lustración 5: Ruta crítica del árbol de decisiones

Page 103: “Modelo predictivo para determinar deserción de ...

103

V CAPITULO: ANÁLISIS DE RESULTADOS

5.1. Análisis de la recolección de datos

Los resultados se dieron en base a la información que la Universidad nos brindó y que forman

parte de nuestra población inicial, que serán aquellos actores que actúan directamente con estos

datos. Para ello se trabajó los siguientes datos:

Población

Encuestada

Número de

preguntas Datos encontrados Datos Elegidos

20 7 1620 80

Tabla 22: Resumen de los datos recolectados en el trabajo de campo

Fuente: Elaboración Propia

En base a los datos elegidos se obtuvieron los siguientes datos relevantes:

Datos Elegidos Generó Edad Motivo Distrito

80

Masculino

y

Femenino

De 17 hasta los

30 años

Cambio

Económico

Mudanza

Salud

Laboral

Breña

Los Olivos

La Molina

Santa Anita

Comas

Jesús María

Tabla 23: Resumen de la toma de datos para el análisis

Fuente: Elaboración Propia

5.2. Evaluación de los objetivos

Cumplimiento de Objetivo General:

Se observa que se cumple el objetivo de diseñar un modelo predictivo para poder determinar la

deserción de estudiantes de la Universidad Tecnológica del Perú

Cumplimiento de Objetivos Específicos:

Se Analiza el modelo de negocio que actualmente utiliza la Universidad Tecnológica del

Perú respecto a la deserción estudiantil.

Page 104: “Modelo predictivo para determinar deserción de ...

104

Se Valida los datos recolectados por la Universidad Tecnológica del Perú respecto a la

deserción estudiantil

Se Modela los datos recolectados que evidencia los motivos de deserción de estudiantes

con la técnica de minería de datos el árbol de decisiones

Se Analizar los resultados de la información obtenida que evidencie los resultados

obtenidos por la Universidad Tecnológica del Perú respecto a la deserción estudiantil

5.3. Evaluación de la limpieza de datos

Se encontró que los datos no se encontraban bien consolidados por lo que se determinó que algunos

datos si bien son básicos no determinaban una información clara sobre la problemática. Por ello,

para este proceso en base a los datos recolectado se eligió los datos más relevantes donde se pudo

encontrar: Distrito, Edad, Motivo y Género.

5.4. Evaluación de la selección de datos

En este trabajo nos concentramos en encontrar todas las combinaciones para establecer las

relaciones que forman entre ellos permitiendo tener una data limpia y ordenada para ser procesada

y trabajada para el desarrollo del modelo predictivo

5.5.Evaluación de la transformación de datos

En esta última etapa se trabajó con los patrones más relevantes encontrados a partir de los datos

previamente obtenidos que permite analizar cómo está actuando el dato. Esta fase permitirá definir

el diseño del modelo, permitiendo tener una imagen panorámica del trabajo de investigación

realizado.

Page 105: “Modelo predictivo para determinar deserción de ...

105

5.6.Análisis del modelado

En el modelado determinamos la ruta crítica, que es el patrón de deserción con mayor probabilidad

y que se compone de una serie de datos para llegar a esa respuesta. Además, se comprobó que el

grado de confiabilidad del modelo permitió determinar un criterio para establecer su aplicabilidad,

con lo que se comprueba que el árbol de decisiones es una técnica de minería de datos óptima para

el estudio de grandes cantidades de datos.

5.7. Propuesta de valor

La propuesta de valor es la capacidad del modelo de mostrar los resultados de forma gráfica, lo

que brinda un mayor entendimiento de la información obtenida, el cual sigue el siguiente flujo

básico:

Ilustración 6: Funcionamiento de la técnica del árbol decisiones

Fuente: Elaboración Propia

5.8. Resultados del Modelo predictivo para la toma decisiones

El resultado final del trabajo de investigación nos muestra la cantidad de decisiones que se pueden

tomar para poder hacer frente a la problemática de la deserción y muestra como un correcto manejo

de datos que se basa en un marco de trabajo como la metodología CRISP DM la cual estima aplicar

técnicas de desarrollo; en donde para este presente trabajo se eligió el árbol de decisiones.

Finalmente, el resultado que obtenemos con el diseño del modelo predictivo es la cantidad de

información que puede estudiar tomando en cuenta que permite analizar patrones para la toma de

decisiones.

DATO

INICIAL ND Nodo Final

% Patrón

Patrón

Page 106: “Modelo predictivo para determinar deserción de ...

106

CRONOGRAMA

ITEM FASES Y ACTIVIDADES MES 1 MES 2 MES 3 MES 4

F1 FASE 1: ANALISIS Y COMPRENSIÓN DE LOS DATOS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

A01 Modelo Predictivo mediante técnica del árbol de clasificación x

A02 Establecer los requerimientos x

A03 Recolectar y ordenar los datos x

A04 Integrar y seleccionar los datos x x

A05 Establecer los patrones de los datos x x

F2 FASE 2: DISEÑO Y PREPARACIÓN DE LOS DATOS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

A06 Establecer los datos de entrada: nodos del árbol de decisiones x x

A07 Establecer las rutas del algoritmo utilizado en árbol de decisiones x x

A08 Establecer las condicionales del árbol de decisiones x x x

A09 Establecer los datos de salida del árbol de decisiones x x

F3 FASE 3: DESARROLLO DEL MODELADO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

A10 Modelo de datos del árbol de decisiones con Lucidchart x x x x

A11 Elaboración del Árbol de decisiones con Lucidchart x x x

A12 Elaboración de los cálculos probabilísticos con análisis combinatorio

x x x

F4 FASE 4: RESULTADOS Y PRUEBAS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

A13 Análisis de los datos x x

A14 Análisis de los resultados obtenidos x x

A15 Verificación del diseño del modelo predictivo x x

Page 107: “Modelo predictivo para determinar deserción de ...

107

PRESUPUESTO

COSTOS DIRECTOS

RECURSO HUMANO

Aplica para toda la duración del proyecto

RESPONSABLE Cantidad Horas dedicadas

(x Día) Meses de trabajo Monto Subtotal

Experto en BigData 1 8 5 S/. 3,000.00 S/. 15,000.00

Analista de datos Senior 1 8 5 S/. 1,800.00 S/. 9,000.00

Analista de datos Junior 1 8 5 S/. 1,500.00 S/. 7,500.00

TOTAL S/. 31,500.00

RECURSOS HARDWARE

Aplica para toda la duración del proyecto

Recurso Cantidad Modelo Costo Subtotal

Laptop 3 HP Pavilion 15-cs0002la Intel Core i5

Windows 10 S/. 2,859.00 S/. 8,577.00

SUBTOTAL S/. 8,577.00

Page 108: “Modelo predictivo para determinar deserción de ...

108

COSTOS INDIRECTOS

INVERSIÒN 2020

RECURSOS SOFTWARE

Aplica para toda la duración del proyecto

Recurso Cantidad Meses de trabajo Precio Costo

SQL Server Developer 2 4 S/ 0.00 S/. 0.00

Lucidchart 3 4 S/. 15.00 S/. 180.00

Microsoft Office 365 3 4 S/. 18.00 S/. 216

SUBTOTAL S/. 396.00

SERVICIOS PRESTADOS POR TERCEROS

Aplica para toda la duración del proyecto

Recurso Cantidad Meses de trabajo Precio Costo

Infraestructura ambiental 1 4 S/. 0.00 S/. 0.00

Servicio de luz 1 4 S/. 120.00 S/. 480.00

Servicio de internet 1 4 S/. 150.00 S/. 600.00

Servicio de mantenimiento 1 4 S/. 100.00 S/. 400.00

SUBTOTAL S/. 1,480.00

ANALISIS DE COSTO RECURSO/SERVICIO COSTO

Costos Directos Recurso Humano S/. 31,500.00

Page 109: “Modelo predictivo para determinar deserción de ...

109

INVERSIÒN 2021

INVERSIÒN 2022

Hardware S/. 8,577.00

Software S/. 396.00

Costos Indirectos Servicios por terceros S/. 1,480.00

COSTO TOTAL NETO S/. 41,953.00

ANALISIS DE COSTO RECURSO/SERVICIO COSTO

Costos Directos

Recurso Humano S/. 31,500.00

Hardware S/. 8,577.00

Software S/. 396.00

Costos Indirectos Servicios por terceros S/. 1,480.00

COSTO TOTAL NETO S/. 41,953.00

ANALISIS DE COSTO RECURSO/SERVICIO COSTO

Costos Directos

Recurso Humano S/. 31,500.00

Hardware S/. 8,577.00

Software S/. 396.00

Costos Indirectos Servicios por terceros S/. 1,480.00

Page 110: “Modelo predictivo para determinar deserción de ...

110

BENEFICIOS

DATOS BENEFICIO TANGIBLE:

Fórmula: p = 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 é𝑥𝑖𝑡𝑜

𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎

Tamaño de muestra 40

Probabilidad de éxito 0.5

Proporción muestral (p) 0.0125

Estimación Retención 12 % por ciclo

Datos Conocidos de la UTP:

- Periodo ciclo regular = 5 meses

- Periodo ciclo verano = 2 meses

- Pago por mes ciclo regular (6 cursos) = S/. 850.00

- Pago por mes ciclo verano (3 cursos) = S/. 420.00

- Pago pensión anual por estudiante = S/. 9,340.00 (2 ciclos regulas y 1 ciclo verano)

Probabilidad Total Retenidos 15 estudiantes

COSTO TOTAL NETO S/. 41,953.00

Page 111: “Modelo predictivo para determinar deserción de ...

111

DATOS BENEFICIO INTANGIBLE:

Pago pensión estudiante = S/. 850.00

Periodo: 1 año

Ingreso anual = S/. 9,340.00

Estudiantes retenidos 15

Probabilidad de éxito 0.5

Proporción muestral (p) 0.034

Estrategias de ayuda definidas para estudiantes:

- Aumento de horas de HUGO

- Aumento de horas de tutorías

Estimación de asistencia y uso 34% por ciclo

Probabilidad de asistencia y uso 9 estudiantes

RESUMEN BENEFICIOS

Beneficio Tangible Tiempo

Proyectado

T1 Aumento en Ganancias por

matriculas por alumnos retenidos 12 meses

Beneficio Intangible Tiempo

Proyectado

I1 Capacidad estratégica contra la

deserción 12 meses

Page 112: “Modelo predictivo para determinar deserción de ...

112

INDICE DEL RETORNO DE LA INVERSIÓN

𝐑𝐎𝐈 =Beneficio Neto − Costo Neto

Costo Neto%

𝐑𝐎𝐈 =212,952 − 163372

163372%

𝐑𝐎𝐈 = +30%

Esto significa que por cada sol de inversión se obtendrá S/… 30.

Page 113: “Modelo predictivo para determinar deserción de ...

113

CONCLUSIONES

o Se concluye que el modelo predictivo permitirá ayudar a la Universidad a encontrar respuesta a la

problemática de la deserción

o Los datos que actualmente se utilizan en la institución no cubren todos los datos necesarios para

poder utilizar este modelo predictivo, debido a que es una investigación no experimental.

o El modelo predictivo surge como una herramienta tecnológica para el estudio y análisis de datos

pudiéndose implementar para futuros estudios respecto a otras problemáticas.

RECOMENDACIONES

o Se recomienda realizar una nueva tarea de recolección de datos a través del diseño de un modelo

predictivo

o Se debe tener en cuenta que los patrones determinarán las decisiones que se vayan a tomar en el

futuro

o Para obtener un grado de precisión alto se debe realizar mediante el proceso y metodología

aplicados en este trabajo de investigación.

o Se recomienda utilizar un software gratuito de análisis de datos.

Page 114: “Modelo predictivo para determinar deserción de ...

114

Anexo 1: Turnitin

Page 115: “Modelo predictivo para determinar deserción de ...

115

Anexo 2: Ficha de investigación

FICHA DE TAREA INVESTIGACIÓN - FISE

CARRERA: Ingeniería de Sistemas e Informática.

1. Título del trabajo de la tarea de investigación propuesta

Título: Modelo Predictivo para determinar deserción de estudiantes de una Universidad

2. Indique la o las competencias del modelo del egresado que serán desarrolladas

fundamentalmente con esta Tarea de investigación:

Aplica Inteligencia Artificial en el diseña soluciones viables para problemas complejos.

3. Indique el número de alumnos posibles a participar en este trabajo. (máximo 2) Número de

Alumnos: 2

4. Indique si el trabajo tiene perspectivas de continuidad después que el alumno obtenga el

Grado Académico para la titulación por la modalidad de tesis o no.

El alumno podría continuar con este tema para obtener el título de ingeniero en sistemas e

informática.

5. Enuncie 4 o 5 palabras claves que le permitan al alumno realizar la búsqueda de información

para el Trabajo en Revistas Indizadas en WOS, SCOPUS, EBSCO, SciELO, etc desde el

comienzo del curso y obtener información de otras fuentes especializadas. Ejemplo:

Palabras Claves REPOSITORIO 1 REPOSITORIO 2 REPOSITORIO

3

1.- Inteligencia artificial WOS SCIELO EBSCO

2.- Aprendizaje

automático

WOS SCIELO EBSCO

3.- Aprendizaje

supervisado

WOS SCIELO EBSCO

4.- Machine Learning WOS SCIELO EBSCO

Page 116: “Modelo predictivo para determinar deserción de ...

116

6. Como futuro asesor de investigación para titulación colocar:

(Indique sus datos personales)

a. Nombre JESU ARIAS CAYCHO

b. Código Docente C09138

c. Correo [email protected] Teléfono 994619833

7. Especifique si el Trabajo de investigación:

(Marcar con un círculo la que corresponde, puede ser más de una)

a. Contribuye a un trabajo de investigación de una Maestría o un doctorado de algún

profesor de la UTP,

b. si está dirigido a resolver algún problema o necesidad propia de la organización,

c. si forma parte de un contrato de servicio a terceros,

d. corresponde a otro tipo de necesidad o causa (Explicar cuál)

___________________________________________________________________

__________________________________________________________________________

8. Explique de forma clara y comprensible al alumno los objetivos o propósitos del trabajo de

investigación.

El objetivo del presente proyecto es diseñar e implementar un modelo predictivo para

determinar que estudiantes de una Universidad dejaran la Universidad, de esta manera la

institución puede cuantificar las consecuencias de producirse la deserción.

9. Brinde al alumno una primera estructuración de las acciones específicas que debe realizar

para que le permita al alumno iniciar organizadamente su trabajo.

El alumno con la finalidad de implementar el Modelo Predictivo deberá investigar sobre

estudios similares al proyecto, el cual permitirá sustentar los antecedes y el marco teórico,

para ello deberá utilizar repositorios especializados e investigaciones en diversas

universidades tanto nacionales e internacionales

10. Incorpore todas las observaciones y recomendaciones que considere de utilidad al alumno y

a los profesores del curso para poder desarrollar con éxito todas las actividades.

Los docentes y los alumnos antes de partir con este proyecto deberán investigar sobre el

estado del arte, además los asesores deben estar enseñando cursos relacionados al tema

propuesto; asimismo los alumnos deben haber llevado los cursos relacionados al tema,

además del curso de investigación.

Page 117: “Modelo predictivo para determinar deserción de ...

117

11. Fecha y docente que propone la tarea de investigación

Fecha de elaboración de ficha: _____20______/________03______/ 20189

Docente que propone la tarea de investigación: JESUS ARIAS CAYCHO

12. Esta Ficha de Tarea de Investigación ha sido aprobada como Tarea de Investigación para el

Grado de Bachiller en esta carrera por:

(Sólo para ser llenada por la Dirección Académica)

Nombre: __________________________________________________________________

Código: ___________________________________________________________________

Cargo: ____________________________________________________________________

Fecha de aprobación de ficha ______/____________/_______ Vo.Bo. FISE

Page 118: “Modelo predictivo para determinar deserción de ...

118

Anexo 3: Declaración de Autenticidad y No Plagio

Por el presente documento, yo Ricardo Antonio Luque Calderón identificados/as con DNI N°

______________47014014___________________, egresado de la carrera de Ingeniería de Sistemas e

informática, informó que he elaborado el Trabajo de investigación denominado “Modelo Predictivo para

determinar la deserción estudiantil en la Universidad Tecnológica del Perú”, para optar por el Grado

Académico de Bachiller en la carrera de Ingeniería de Sistemas e Informática, declaro que este trabajo ha

sido desarrollado íntegramente por el/los autor/es que lo suscribe/n y afirmo que no existe plagio de ninguna

naturaleza. Así mismo, dejo constancia de que las citas de otros autores han sido debidamente identificadas

en el trabajo, por lo que no se ha asumido como propias las ideas vertidas por terceros, ya sea de fuentes

encontradas en medios escritos como en Internet.

Así mismo, afirmo que soy responsable solidario de todo su contenido y asumo, como autor, las

consecuencias ante cualquier falta, error u omisión de referencias en el documento. Sé que este compromiso

de autenticidad y no plagio puede tener connotaciones éticas y legales. Por ello, en caso de incumplimiento

de esta declaración, me someto a lo dispuesto en las normas académicas que dictamine la Universidad

Tecnológica del Perú y a lo estipulado en el Reglamento de SUNEDU.

Lima , 26 de ____Marzo_____ de 2019

…………………………………………..

Firma

Page 119: “Modelo predictivo para determinar deserción de ...

119

Por el presente documento, yo Carolina Sarazu Rivera identificados/as con DNI N°

______________72721787___________________, egresado de la carrera de Ingeniería de Sistemas e

informática, informó que he elaborado el Trabajo de investigación denominado “Modelo Predictivo para

determinar la deserción estudiantil en la Universidad Tecnológica del Perú”, para optar por el Grado

Académico de Bachiller en la carrera de Ingeniería de Sistemas e Informática, declaro que este trabajo ha

sido desarrollado íntegramente por el/los autor/es que lo suscribe/n y afirmo que no existe plagio de ninguna

naturaleza. Así mismo, dejo constancia de que las citas de otros autores han sido debidamente identificadas

en el trabajo, por lo que no se ha asumido como propias las ideas vertidas por terceros, ya sea de fuentes

encontradas en medios escritos como en Internet.

Así mismo, afirmo que soy responsable solidario de todo su contenido y asumo, como autor, las

consecuencias ante cualquier falta, error u omisión de referencias en el documento. Sé que este compromiso

de autenticidad y no plagio puede tener connotaciones éticas y legales. Por ello, en caso de incumplimiento

de esta declaración, me someto a lo dispuesto en las normas académicas que dictamine la Universidad

Tecnológica del Perú y a lo estipulado en el Reglamento de SUNEDU.

Lima , 26 de ____Marzo_____ de 2019

…………………………………………..

Firma

Page 120: “Modelo predictivo para determinar deserción de ...

120

INDICE DE ANEXOS

Anexo 1: Turnitin ...................................................................................................................................... 114

Anexo 2: Ficha de investigación ................................................................................................................ 115

Anexo 3: Declaración de Autenticidad y No Plagio .................................................................................. 118

Page 121: “Modelo predictivo para determinar deserción de ...

121

INDICE DE TABLAS

Tabla 1. Matriz de la identificación de la variable ...................................................................................... 10

Tabla 2: Encuesta para la recolección de datos. .......................................................................................... 24

Tabla 3: Total población estudiantil desertora y no desertora…………………………………………….25

Tabla 4: Tabla de motivos de deserción ...................................................................................................... 25

Tabla 5: Vista de datos sin filtro .................................................................................................................. 27

Tabla 6: Cantidad de deserciones por distrito .............................................................................................. 29

Tabla 7: Cantidad de deserciones por Género ............................................................................................. 29

Tabla 8: Cantidad de deserciones por Motivo de deserción ........................................................................ 29

Tabla 9: Cantidad de deserciones por edad ................................................................................................. 30

Tabla 10: Selección de datos de deserción por Distrito y Género ............................................................... 30

Tabla 11: Selección de datos de deserción por Distrito y Motivo ............................................................... 31

Tabla 12: Selección de datos de deserción por Distrito y Edad .................................................................. 31

Tabla 13: Selección de datos de deserción por Género y Motivo ............................................................... 32

Tabla 14: Selección de datos de deserción por Género y Edad ................................................................... 32

Tabla 15:Selección de datos de deserción por Motivo y Edad .................................................................... 33

Tabla 16: Selección de datos de deserción por Distrito, Género y Edad ..................................................... 33

Tabla 17: Selección de datos de deserción por Distrito, Motivo y Edad ..................................................... 34

Tabla 18: Selección de datos de deserción por Género, Edad y Motivo ..................................................... 35

Tabla 19: Selección de datos de deserción por Distrito, Motivo y Género ................................................. 36

Tabla 20: Selección de datos de deserción por Distrito, Género, Motivo y Edad ....................................... 38

Tabla 21: Tabla de nodos del árbol de decisiones……………………………………………………….101

Tabla 22: Resumen de los datos recolectados en el trabajo de campo………………………………..…103

Tabla 23: Resumen de la toma de datos para el análisis…………………………………………………103

Page 122: “Modelo predictivo para determinar deserción de ...

122

INDICE DE FIGURAS

Ilustración 1: Gráfica de motivos de deserción ........................................................................................... 26

Ilustración 2: Proceso de aplicación del Modelo Predictivo ....................................................................... 26

Ilustración 3: Fórmula de probabilidades combinatorio .............................................................................. 28

Ilustración 4: Fórmula probabilística de eventos aleatorios ........................................................................ 39

lustración 5: Modelo del árbol de decisiones ............................................................................................ 102

Ilustración 6: Funcionamiento de la técnica del árbol decisiones ............................................................. 105

Page 123: “Modelo predictivo para determinar deserción de ...

123

REFERENCIAS BIBLIOGRÁFICAS

Arias, Fidias (2006). El proyecto de investigación. En editorial Episteme. Edición: 6ta.En Caracas,

Venezuela.

Berlanga Silvente, V., Rubio Hurtado, M. J., Vilà Baños, R. (2013). Cómo aplicar árboles de decisión en

SPSS. [En línea] REIRE, Revista d’Innovació i Recerca en Educació, 6 (1), 65-79. Accesible en:

http://www.ub.edu/ice/reire.htm

Blanca, C; Wilma, G. y Sanchez, R. (2017). Modelo predictivo de deserción estudiantil basado en árboles

de decisión. Revista Espacios. Volumen (38). Recuperado de:

https://www.revistaespacios.com/17385517.html

Castro Porras, Alexandra Pollette (2016). Implementación de un modelo predictivo basado en datamining y

soportdo por sap predictive Analytics en retails. En Universidad de Ciencias aplicadas. Recuperado de:

https://repositorioacademico.upc.edu.pe/handle/10757/620850

Clark Andrew (2018). La auditoría del aprendizaje automático. Revista ISACA Volumen 1. Consultado

en: (https://www.isaca.org/Journal/archives/2018/Volume-1/Pages/the-machine-learning-audit-crisp-dm-

framework-spanish.aspx?utm_referrer=#article-top)

Espino Timón, C. (2017). Análisis predictivo: técnicas y modelos utilizados y aplicaciones del mismo-

herramientas Open Source que permiten su uso. http://hdl.handle.net/10609/59565

Page 124: “Modelo predictivo para determinar deserción de ...

124

Fayyad 1996. Fayyad, G. Piatetsky-Shapiro and P. Smyth. 1996. “From data mining to Knowledge

Discovery in Databases: an overview”.

https://www.aaai.org/ojs/index.php/aimagazine/article/view/1230/1131

Ñaupas Caraza, C. M. (2016). Minería de datos aplicada a la detección de fraude electrónico en

entidades bancarias.

http://cybertesis.unmsm.edu.pe/handle/cybertesis/5080

Piscoya Ordoñez, L. E. (2017). Aplicación de técnicas de minería de datos para predecir la deserción

estudiantil en la educación básica regular en la Región de Lambayeque.

http://repositorio.uss.edu.pe/handle/uss/4066

Rico Páez, Andrés, & Sánchez Guzmán, Daniel. (2018). Diseño de un modelo para automatizar la

predicción del rendimiento académico en estudiantes del IPN. RIDE. Revista Iberoamericana para la

Investigación y el Desarrollo Educativo, 8(16), 246-266. https://dx.doi.org/10.23913/ride.v8i16.340

R. A. Barrueta Meza and E. J. P. Castillo Villarreal, “Modelo de análisis predictivo para determinar

clientes con tendencia a la deserción en bancos peruanos,” Universidad Peruana de Ciencias Aplicadas

(UPC)., Lima, Perú, 2018. Doi: http://doi.org/ 10.19083/tesis/626023

Ramírez, Patricio E., & Grandón, Elizabeth E. (2018). Predicción de la Deserción Académica en una

Universidad Pública Chilena a través de la Clasificación basada en Árboles de Decisión con Parámetros

Page 125: “Modelo predictivo para determinar deserción de ...

125

Optimizados. Formación universitaria, 11(3), 3-10. https://dx.doi.org/10.4067/S0718-

50062018000300003

Sampieri, Roberto (2014). Metodología de la investigación. En Editorial McGRAW-HILL. Edición

6ta.En México D.F, México.

San Emeterio, I. C. (2017). Creación de un modelo predictivo de bajas en centros deportivos. Revista

Española de Educación Física y Deportes, (418), 91-92. http://hdl.handle.net/2183/19162

Vásquez, J. (2016-05). Modelo predictivo para estimar la deserción de estudiantes en una institución de

educación superior. Disponible en http://repositorio.uchile.cl/handle/2250/144169