ESCUELA POLITÉCNICA NACIONALbibdigital.epn.edu.ec/bitstream/15000/1859/1/CD-2795.pdf · modelo de...
Transcript of ESCUELA POLITÉCNICA NACIONALbibdigital.epn.edu.ec/bitstream/15000/1859/1/CD-2795.pdf · modelo de...
ESCUELA POLITÉCNICA NACIONAL
FACULTAD DE CIENCIAS
CARRERA DE INGENIERÍA MATEMÁTICA
ELABORACIÓN DE PERFILES DE INDIVIDUOS Y HOGARES DE
ACUERDO AL GRADO DE EXPOSICIÓN A LA VICTIMIZACIÓN.
UN ANÁLISIS PARA QUITO Y GUAYAQUIL.
PROYECTO PREVIO A LA OBTENCIÓN DEL
TÍTULO DE INGENIERO MATEMÁTICO
LARA CAPA WASHINGTON RICARDO
Correo: [email protected]
DIRECTOR: Dr. HOLGER CAPA SANTOS
Correo: [email protected]
DECLARACIÓN:
Yo, Washington Ricardo Lara Capa, declaro bajo juramento que el trabajo aquí
escrito es de mi autoría; que no ha sido previamente presentado para ningún
grado o calificación profesional; y que he consultado las referencias bibliográficas
que se incluyen en este documento.
A través de la presente declaración cedo mis derechos de propiedad intelectual
correspondientes a este trabajo, a la Escuela politécnica Nacional, según lo
establecido por la Ley de Propiedad Intelectual, por su reglamento y por la
normatividad institucional vigente.
__________________________
Washington Ricardo Lara Capa
CI: 171590514-5
CERTIFICACIÓN
Certifico que el presente trabajo fue desarrollado por el Sr. Washington Ricardo
Lara Capa, bajo mi supervisión.
_________________________
Dr. Holger Capa Santos
DIRECTOR DE PROYECTO
AGRADECIMIENTOS
A Dios, por bendecirme durante toda mi vida y, una vez más, al permitirme
alcanzar esta meta.
A mis padres, por darme el amor y formación necesaria para alcanzar mis sueños.
Al Dr. Holger Capa Santos, pilar fundamental en el desarrollo de este proyecto, por
su guía y apoyo permanente.
A la Escuela Politécnica Nacional, en especial a los docentes del Departamento de
Matemática, por formarme de manera competitiva en conocimiento e integridad.
A todos quienes hicieron posible alcanzar este primer escalón en mi formación
profesional.
CONTENIDO
CAPÍTULO 1: _________________________________________ 1
INTRODUCCIÓN ______________________________________ 1
CAPÍTULO 2: _________________________________________ 7
PRINCIPALES RESULTADOS SOBRE VICTIMIZACIÓN ___ 7
A PERSONAS _________________________________________ 7
2.1 ANTECEDENTES _____________________________________7
2.2 DEFINICIONES _______________________________________9
2.3 ANÁLISIS DESCRIPTIVO _____________________________ 10
2.4 ANÁLISIS PERCEPCIÓN _____________________________ 25
CAPITULO 3: ________________________________________ 37
SCORE DE VICTIMIZACIÓN __________________________ 37
3.1 SELECCIÓN DE LA MUESTRA ________________________ 38
3.2 DEFINICIÓN DE BUENOS Y MALOS (VICTIMIZADOS / NO
VICTIMIZADOS) _______________________________________ 39
3.3 ANÁLISIS DE LA INFORMACIÓN _____________________ 39
3.4 CONSTRUCIÓN DEL MODELO _______________________ 43
3.5 VALIDACIÓN _______________________________________ 54
3.6 APLICACIÓN _______________________________________ 56
I
CAPITULO 4 ________________________________________ 82
PERFILES DE VICTIMIZACIÓN _______________________ 82
ETAPAS DE DESARROLLO PARA UN ANÁLISIS DE
AGRUPAMIENTO ______________________________________ 83
AGRUPAMIENTO PARA QUITO _________________________ 88
AGRUPAMIENTO PARA GUAYAQUIL __________________ 109
CAPITULO 5: _______________________________________ 119
CONCLUSIONES Y RECOMENDACIONES ______________ 119
BIBLIOGRAFÍA _____________________________________ 126
ANEXO 1 ___________________________________________ 127
VARIABLES GENERADAS POR LOS ÁRBOLES __________ 127
DE DECISIÓN _________________________________________ 127
ANEXO 2 ___________________________________________ 137
VARIABLES INICIALMENTE CONSIDERADAS EN EL
DESARROLLO DE LA REGRESIÓN LOGÍSTICA __________ 137
ANEXO 3: __________________________________________ 155
DISTRIBUCIONES DE CONGLOMERADOS PARA
GUAYAQUIL __________________________________________ 155
II
CONTENIDO
(Cuadros)
CAPÍTULO 2 Cuadro 2.1: Tamaños Muestrales ..................................................................................................................... 9
Cuadro 2.2: Tamaño Muestral por Provincia .................................................................................................. 9
Cuadro 2.3: Victimización por Región ........................................................................................................... 10
Cuadro 2.4: Prueba Chi-Cuadrado ................................................................................................................. 10
Cuadro: 2.5: Victimización por provincia ...................................................................................................... 11
Cuadro 2.6: Prueba Chi-Cuadrado ................................................................................................................. 13
Cuadro 2.7: Victimización por Rango de Edad .............................................................................................. 13
Cuadro 2.8: Prueba Chi-Cuadrado ................................................................................................................. 14
Cuadro 2.9: Victimización por Género ........................................................................................................... 15
Cuadro 2.10: Prueba Chi-Cuadrado ............................................................................................................... 15
Cuadro 2.11: Victimizción por Etnia .............................................................................................................. 16
Cuadro 2.12: Victimización por Nivel de Educación ..................................................................................... 17
Cuadro 2.13: Prueba Chi-Cuadrado ............................................................................................................... 18
Cuadro 2.14: Victimización por Estado Civil ................................................................................................. 18
Cuadro 2.15: Prueba Chí-Cuadrado ............................................................................................................... 19
Cuadro 2.16: Victimización por Ocupación ................................................................................................... 20
Cuadro 2.17: Prueba Chi-Cuadrado ............................................................................................................... 21
Cuadro 2.18: Porcentaje del Tipo de Victimización ....................................................................................... 21
Cuadro 2.19: Comparación entre Percepción y Victimización por Región ................................................... 22
Cuadro 2.20: Comparación entre Percepción y Victimización por Provincia ............................................... 24
Cuadro 2.21: Comparación entre Percepción y Victimización por Rango de Edad ...................................... 25
Cuadro 2.22: Comparación entre Percepción y Victimización por Género .................................................. 26
Cuadro 2.23: Comparación entre Percepción y Victimización por Estado Civil ........................................... 27
Cuadro 2.24: Comparación entre Percepción y Victimización por Nivel de Educación ............................... 28
III
Cuadro 2.25: Comparación entre Percepción y Victimización por Ocupación .............................................. 29
Cuadro 2.26: Victimización a Hogares y Personas por Provincia ................................................................. 31
CAPÍTULO 3
Cuadro 3.1: DISTRIBUCIÓN SCORE Y DISTRIBUCIÓN EQUITATIVA ................................................ 49
Cuadro 3.2: ANÁLISIS EXPLORATORIO ................................................................................................... 54
Cuadro 3.3: CHÍ-CUADRADO VARIABLES ANSWER TREE ................................................................... 55
Cuadro 3.4: ÁRBOL GENERADO POR PROVINCIA ................................................................................. 58
Cuadro 3.5: ÁRBOL GENERADO POR NIVEL DE INSTRUCCIÓN ........................................................ 59
Cuadro 3.6: ÁRBOL GENERADO POR INGRESO PERCÁPITA .............................................................. 59
Cuadro 3.7: ÁRBOL GENERADO POR PARENTEZCO CON EL JEFE DE HOGAR ............................. 60
Cuadro 3.8: ÁRBOL GENERADO POR PORCENTAJE DE PERSONAS QUE TRABAJA POR CANTON
........................................................................................................................................................................... 60
Cuadro 3.9: ÁRBOL GENERADO POR EDAD ............................................................................................ 60
Cuadro 3.10: ÁRBOL GENERADO POR INSTRUCCIÓN Y EDAD .......................................................... 60
Cuadro 3.11: ÁRBOL GENERADO POR ÁREA .......................................................................................... 60
Cuadro 3.12: CHI-CUADRADO VARIABLES ANSWER TREE ................................................................. 60
Cuadro 3.13: VARIABLES SELECCIONADAS EN EL MODELO ............................................................ 61
Cuadro 3.14: RESUMEN DEL MODELO ..................................................................................................... 62
Cuadro 3.15: PRUEBA OMNIBUS DE LOS COEFICIENTES .................................................................. 64
Cuadro 3.16: RESUMEN VARIABLES SELECCIONADAS ....................................................................... 64
Cuadro 3.17: DISTRIBUCIÓN DE BUENOS Y MALOS ............................................................................. 65
Cuadro 3.18: PRUEBA DE HOSMER LEMESHOW ................................................................................... 67
Cuadro 3.19: TABLA DE CONTINGENCIA DE HOSMER LEMESHOW ................................................ 68
Cuadro 3.20: PRUEBA DE KOLMOGOROV SMIRNOV ............................................................................. 69
Cuadro 3.21: DISTRIBUCIÓN PARA CÁLCULO DE GINI ....................................................................... 69
Cuadro 3.22: ANÁLISIS ESTADÍSTICO VARIABLES EN EL MODELO ............................................... 70
Cuadro 3.23: ANÁLISIS DE DISCRIMINACIÓN K-S Y ODDS ................................................................ 72
Cuadro 3.24: PRUEBA DE KOLMOGOROV - SMIRNOV .......................................................................... 73
IV
Cuadro 3.25: DISTRIBUCIÓN PARA CÁLCULO DE GINI ....................................................................... 74
Cuadro 3.26: DISTRIBUCIÓN SCORE POR QUINTILES ......................................................................... 75
Cuadro 3.27: PERFILES DEFINIDOS POR PUNTAJE DE SCORE ......................................................... 75
Cuadro 3.28: FRECUENCIAS VARIABLES POR GRUPO PERFIL ......................................................... 76
Cuadro 3.29: PORCENTAJE DE INCIDENCIA DE VARIABLES POR GRUPO PERFI76 ..................... 76
Cuadro 3.30: DESCRIPCIÓN DE GRUPO PERFIL ..................................................................................... 76
CAPÍTULO 4
Cuadro 4.1: VARIABLES CONSIDERADAS ............................................................................................... 81
Cuadro 4.2: CRITERIO BAYESIANO DE SCHWARZ ................................................................................ 85
Cuadro 4.3: CARATERÍSTICAS DE GRUPOS DEFINIDOS ..................................................................... 91
Cuadro 4.4: VICTIMIZACIÓN POR GRUPO ............................................................................................... 92
Cuadro 4.5: PRUEBA DE HOMOGEIDAD DE VARIANZAS PARA LA VICTIMIZACIÓN A
PERSONAS ..................................................................................................................................................... 93
Cuadro 4.6: PRUEBA DE IGUALDAD DE MEDIAS PARA LA VICTIMIZACIÓN A PERSONAS ........ 94
Cuadro 4.7: COMPARACIONES MÚLTIPLES PARA LA VICTIMIZACIÓN A PERSONAS ................. 94
Cuadro 4.8: PERCEPCIÓN DE VICTIMIZACIÓN POR GRUPO .............................................................. 96
Cuadro 4.9: PRUEBA DE HOMOGENEIDAD DE LAS VARIANZAS PARA LA PERCEPCIÓN ........... 96
Cuadro 4.10: PRUEBA DE IGUALDAD DE MEDIAS PARA LA PERCEPCIÓN .................................... 96
Cuadro 4.11: COMPARACIONES MÚLTIPLES PARA LA PERCEPCIÓN .............................................. 97
Cuadro 4.12: ÍNDICE DE VICTIMIZACIÓN A HOGARES ....................................................................... 99
Cuadro 4.13: GRUPOS BARRIOS DEFINIDOS POR ELÁRBOL DE DECISIÓN ................................. 101
Cuadro 4.14: VICTIMIZACIÓN A HOGARES POR GRUPO ................................................................... 102
Cuadro 4.15: VICTIMIZACIÓN A PERSONAS POR GRUPO .................................................................. 102
Cuadro 4.16: VICTIMIZACIÓN A HOGARES Y PERSONAS .................................................................. 103
Cuadro 4.17: VICTIMIZACIÓN GRUPOS BARRIOS Y PERFILES SOCIALES ................................... 104
Cuadro 4.18: REPRESENTATIVIDAD GRUPOS BARRIOS Y PERFILES SOCIALES ........................ 105
Cuadro 4.19: INCIDENCIA DE VICTIMIZACIÓN EN GRUPOS BARRIOS Y PERFILES SOCIALES
......................................................................................................................................................................... 105
V
Cuadro 4.20: ÍNDICE DE VICTIMIZACIÓN A PERSONAS .................................................................... 106
Cuadro 4.21: ÍNDICE DE PERCEPCIÓN DE VICTIMIZACIÓN ............................................................ 106
Cuadro 4.22: ÍNDICE DE VICTIMIZACIÓN A HOGARES ..................................................................... 107
Cuadro 4.23: CARACTERÍSTICAS DE GRUPOS DEFINIDOS ............................................................... 107
Cuadro 4.24: VICTIMIZACIÓN A PERSONAS POR GRUPO ................................................................... 108
Cuadro 4.25: PERCEPCIÓN DE VICTIMIZACIÓN POR GRUPO .......................................................... 108
Cuadro 4.26: PRUEBA DE IGUALDAD DE MEDIAS PARA LA VICTIMIZACIÓN ............................. 108
Cuadro 4.27: COMPARACIONES MÚLTIPLES PARA LA VICTIMIZACIÓN A PERSONAS .............. 109
Cuadro 4.28: COMPARACIONES MÚLTIPLES PARA LA PERCEPCIÓN DE LAVICTIMIZACIÓN 110
Cuadro 4.29: GRUPOS BARRIOS DEFINIDOS POR EL ÁRBOL ............................................................ 112
Cuadro 4.30: GRUPOS DE BARRIOS EN GUAYAQUIL ........................................................................... 113
Cuadro 4.31: VICTIMIZACIÓN A HOGARES POR GRUPO ................................................................... 113
Cuadro 4.32: PERCEPCIÓN DE VICTIMIZACIÓN POR GRUPO .......................................................... 113
Cuadro 4.33: VICTIMIZACIÓN POR GRUPOS BARRIOS Y PERFILES SOCIALES ........................... 114
Cuadro 4.34: SEGMENTOS CON MAYOR VICTIMIZACIÓN ................................................................. 114
Cuadro 4.35: REPRESENTATIVIDAD GRUPOS BARRIOS Y PERFILES SOCIALES ........................ 115
VI
CONTENIDO
(GRÁFICOS)
CAPÍTULO 2
Gráfico 2.1: Nivel de Victimización por región .............................................................................................. 10
Gráfico 2.2: Distribución de la Población por Provincia ............................................................................... 12
Gráfico 2.3: Victimización por Provincia ....................................................................................................... 12
Gráfico 2.4: Nivel de Victimización por Rango de Edad ............................................................................... 14
Gráfico 2.5: Nivel de Victimización por Género ............................................................................................ 15
Gráfico 2.6: Nivel de Victimización por Etnia ................................................................................................ 16
Gráfico 2.7: Nivel de Victimización por Nivel de Educación ......................................................................... 17
Gráfico 2.8: Nivel de Victimización por Estado Civil ..................................................................................... 19
Gráfico 2.9: Nivel de Victimización por Ocupación ........................................................................................ 20
Gráfico 2.10: Porcentaje del Tipo de Victimización ....................................................................................... 22
Gráfico 2.11: Comparación entre Percepción y Victimización por Región ................................................... 23
Gráfico 2.12: Nivel Percepción y Victimización por Provincia ...................................................................... 25
Gráfico 2.13: Comparación entre Percepción y Victimización por Rango de Edad ..................................... 26
Gráfico 2.14: Nivel de Percepción y Victimización por Género .................................................................... 27
Gráfico 2.15: Nivel de Percepción y Victimización por Estado Civil .............................................................. 28
Gráfico 2.16: Nivel de Percepción y Victimización por Nivel de Educación ................................................. 29
Gráfico 2.17: Comparación entre Percepción y Victimización por Ocupación ............................................ 30
Gráfico 2.18: Nivel de Victimización a Hogares y Personas por Provincia .................................................. 32
CAPÍTULO 3
Gráfico 3.1: FUNCIÓN DE DISTRIBUCIÓN DE BUENOS Y MALOS ..................................................... 48
Gráfico 3.2: CURVA DE LORENZ ................................................................................................................ 49
Gráfico 3.3: ÁREAS CURVA DE LORENZ .................................................................................................. 50
VII
Gráfico 3.4: ÁRBOL DE DECISIÓN POR PROVINCIA ............................................................................. 57
Gráfico 3.5: DISTRIBUCIÓN BUENOS Y MALOS ...................................................................................... 66
Gráfico 3.6: DISTRIBUCIÓN K-S ................................................................................................................. 68
Gráfico 3.7: ODDS - DISTRIBUCIÓN DE BUENOS Y MALOS ................................................................ 72
CAPÍTULO 4
Gráfico 4.1: DISTRIBUCIÓN PORCENTUAL DE GRUPO OCUPACIÓN POR CONGLOMERADO .... 86
Gráfico 4.2: DISTRIBUCIÓN PORCENTUAL DEL RANGO DE EDAD POR CONGLOMERADO ........ 86
Gráfico 4.3: DISTRIBUCIÓN PORCENTUAL DEL GENERO POR CONGLOMERADO ....................... 87
Gráfico 4.4: DISTRIBUCIÓN PORCENTUAL DEL ESTADO CIVIL POR CONGLOMERADO ............. 87
Gráfico 4.5: DISTRIBUCIÓN PORCENTUAL DEL NIVEL DE INSTRUCCIÓN POR
CONGLOMERADO ........................................................................................................................................ 88
Gráfico 4.6: PRUEBA CHÍ - CUADRADO GRUPO OCUPACIÓN ............................................................ 89
Gráfico 4.7: PRUEBA CHÍ - CUADRADO RANGO DE EDAD ................................................................... 89
Gráfico 4.8: PRUEBA CHI - CUADRADO GÉNERO .................................................................................. 90
Gráfico 4.9: PRUEBA CHÍ - CUADRADO ESTADO CIVIL ........................................................................ 90
Gráfico 4.10: PRUEBA CHI-CUADRADO NIVEL DE INSTRUCCIÓN .................................................... 91
Gráfico 4.11: VICTIMIZACIÓN A PERSONAS POR GRUPO ................................................................... 95
Gráfico 4.12: PERCEPCIÓN POR GRUPO .................................................................................................. 98
Gráfico 4.13: VICTIMIZACIÓN Y PERCEPCIÓN ....................................................................................... 98
Gráfico 4.14: ÁRBOL GENERADO POR BARRIOS .................................................................................. 100
Gráfico 4.15: VICTIMIZACIÓN A PERSONAS POR GRUPO ................................................................. 103
Gráfico 4.16: VICTIMIZACIÓN A HOGARES Y PERSONAS .................................................................. 104
Gráfico 4.17: VICTIMIZACIÓN A PERSONAS POR GRUPO ................................................................. 107
Gráfico 4.18: PERCEPCIÓN POR GRUPO ................................................................................................ 110
Gráfico 4.19: PERCEPCIÓN Y VICTIMIZACIÓN .................................................................................... 111
VIII
IX
RESUMEN
El objetivo de este trabajo consiste en desarrollar modelos que cuantifiquen el
riesgo de victimización a personas, tanto a nivel nacional como para las dos
ciudades más grandes del Ecuador, Quito y Guayaquil, con el propósito de
encontrar segmentos de alto riesgo sobre el cual aplicar posibles estrategias que
permitan disminuir el riesgo a ser victimizados.
A nivel nacional se ha creado un indicador que cuantifique el grado de exposición
de los individuos a ser victimizados, analizando los factores de riesgo en forma
multivariada. Este indicador se construye mediante un modelo de regresión
logística, en el cual las variables exógenas relevantes se han elegido con un
proceso de árboles de decisión, obteniendo de esta manera un modelo
compuesto, desarrollado en la lógica de un modelo de score generalmente
utilizado en el campo financiero. En el desarrollo del modelo se presenta la
descripción conceptual y metodológica de construcción de un modelo de score así
como las pruebas estadísticas necesarias para validar su funcionamiento en la
etapa de desarrollo y de prueba.
Para las ciudades más grandes, Quito y Guayaquil, debido a su representatividad
a nivel nacional, se han creado grupos de acuerdo a sus similitudes que permitan
enfocar estrategias de acción diferenciadas que minimicen la exposición a la
victimización y por ende la victimización misma. Para esto, se desarrolla un
modelo de conglomerados que describa el nivel de victimización de cada grupo.
Este segundo análisis, al ser más específico para cada una de las ciudades,
considera el estudio de la victimización a hogares y su incidencia en la
victimización a personas.
CAPÍTULO 1:
INTRODUCCIÓN
Uno de los problemas más graves que actualmente vivimos en nuestro país es la
inseguridad. Los medios de comunicación muestran constantemente delitos que
ocurren en todo el país; los ciudadanos manifiestan reclamos frecuentes por la
falta de seguridad en que se desenvuelven.
Un primer paso para tratar este terrible mal es conocer el significado de
victimización, la incidencia de ésta en el país y en cada uno de los lugares que lo
conforman.
El concepto de delito es diferente para los individuos. Éste tiene dos aspectos: el
natural que considera al delito como una acción sin moral que afecta la vida de
otro miembro de la sociedad directa o indirectamente; por otro lado, existen los
delitos jurídicos que son resultado de la violación de una ley jurídica que por tanto
tiene un marco legal. Estas dos definiciones muchas veces no coinciden debido al
desequilibrio que existe entre la evolución de la ética y el derecho. Esta es una
valiosa razón por la cual la victimización y su percepción desde el punto de la
sociedad son motivos de estudio.
Otro punto a tratar en el estudio de este problema es la diferencia que existe entre
la percepción de la victimización y la realidad de la misma. Entre lo sucedido
denunciado y lo no denunciado; nunca será posible conocer la cifra real pero es
posible tener cifras que se aproximen a través de diferente información que no
necesariamente es de denuncia. La denuncia es solo una parte de la criminalidad
real ya que existen eventos que no son denunciados por temor, falta de confianza
en la gestión del organismo a cargo o porque simplemente la denuncia toma un
tiempo y trabajo que los ciudadanos no pueden o quieren disponer. Sea cual sea
1
la causa es de vital importancia conocer las cifras que más cerca estén de la
realidad ya que estas indican el marco de gobernabilidad que la sociedad tiene
sobre sí misma. La forma de obtenerlas son las encuestas a la población cuyas
edades mínimas varían entre 14 y 16 años; estas deberían indicar el
comportamiento delictivo producido en la vida social que es declarado por las
personas víctimas y sobre el conocimiento de víctimas en su grupo familiar. Este
proceso pretende dar una medida empírica del delito en la sociedad.
La diferencia que existe entre la cantidad de denuncias policiales o judiciales y la
cantidad de denuncias obtenidas en una encuesta, es llamada la “cifra negra de la
criminalidad” y debe servir para conocer la diferencia de lo denunciado y lo real
para posteriores estimaciones de victimización a partir de la información
denunciada. Además, la información que es obtenida en las encuestas debe servir
para validar la información obtenida en las denuncias observando que las
tendencias sean similares pero con diferente escala. Otro punto que también es
importante mencionar es que la información denunciada y la obtenida mediante
una encuesta generalmente son diferentes ya que la denunciada es referente a
hechos delictivos graves como crímenes, violaciones, robos de automotores, etc.;
por otro lado, las encuestas contienen también información de robos, hurtos,
arranches, etc., mostrando así una criminalidad diferente en las dos fuentes de
información.
Es importante notar que aunque la información denunciada tenga deficiencia
comparada con la obtenida en una encuesta, es de vital importancia como una
medida, siempre y cuando se mantengan presentes sus limitaciones.
Adicionalmente, la encuesta es una metodología para el conocimiento del delito
relativamente nueva, usada desde la década de los 90; aún está en etapa de
perfeccionamiento en sus técnicas de recolección y de análisis de resultados. La
información utilizada para el presente trabajo es la primera de este tipo a nivel
nacional.
2
Como toda encuesta a la población, las de victimización tienen períodos de
referencia; es decir, es una investigación de corte transversal en el cual deben
haber ocurrido los hechos de victimización sobre los cuales se pregunta. Los
resultados pueden ser utilizados para medir la extensión de la criminalidad, de la
misma manera que el volumen comparativo de la denuncia referentes a un
determinado tiempo.
Aunque una encuesta sea la manera más adecuada de acercarnos a la cifra real
de la criminalidad, tiene sus limitaciones. Los delitos sexuales, por ejemplo, al ser
investigados mediante operativos de campo pueden ser motivo de revictimización
de los declarantes; penetrar en su intimidad sin la debida preparación del
investigador y del investigado, no resulta en cifras consistentes y más aún no es
éticamente correcto sin un protocolo de aceptación y un abordaje que permita
restablecer a la víctima del shock que causa el recuerdo de su victimización.
Sesgos similares y otros diferentes pueden ocurrir al investigar el maltrato infantil.
Percepción y Victimización
La población tiene una percepción de victimización que generalmente es distinta
de la real, ya que la percepción está fundamentada en sucesos imaginarios ó
sobredimensionados que alteran la verdadera naturalidad del delito. Esta
sobredimensionada percepción se debe en gran medida a los medios de
comunicación, que inducen al ciudadano a un combate a la delincuencia. El
concepto de inseguridad se ha alimentado por sucesos exagerados o inusuales
suscitados especialmente en las ciudades de Quito y Guayaquil. Es muy peligroso
construir el miedo social que a falta de presencia fuerte del Estado en unos casos
y de una justicia penal ágil en otros, ponga en manos de la población la justicia, el
castigo y la ejecución de penas: la llamada justicia con las propias manos.
3
OBJETIVOS
Si bien manejar una cifra de victimización cercana a la realidad permite medir el
nivel de delincuencia en el Ecuador y de posibles estrategias para combatirla,
existen herramientas matemáticas que pueden generar decisiones focalizadas que
ayuden a mitigar este mal de manera más efectiva. En este proyecto de titulación
se utilizarán modelos estadísticos que permitan estudiar más profundamente este
tema de gran importancia social, con la finalidad de poder definir estrategias de
acción que minimicen la victimización en la medida de lo posible, tomando
información de la encuesta Victimización en el Ecuador, contratada por la Unidad
de Ejecución Especializada en Seguridad Pública (UEE) del Ministerio de
Gobierno.
En este sentido, el objetivo general de este trabajo consiste en crear perfiles para
personas, mediante la creación de un indicador que cuantifique el grado de
exposición que los individuos tienen a ser victimizados y la integración de de
grupos de acuerdo a sus similitudes, que permitan enfocar estrategias de acción
diferenciadas para minimizar la exposición a la victimización y por ende la
victimización misma. Se realiza un análisis nacional, así como también para Quito
y Guayaquil. En el análisis nacional se desarrolla un modelo de score que
cuantifique el riesgo que un individuo tiene de ser victimizado. Para las ciudades
de Quito y Guayaquil se desarrolla un modelo de conglomerados que describe el
perfil social de cada grupo permitiendo estudiar la victimización de manera
difernciada. Por tanto los objetivos específicos se plantean de la siguiente forma:
I. Desarrollar un modelo de Score que permita cuantificar el grado de
exposición que cada individuo tiene para ser victimizado.
II. Validar el modelo de Score obtenido mediante indicadores estadísticos
de discriminación del modelo, a trvés de dos muestras: una de
desarrollo y otra de validación.
III. Desarrollar un modelo de agrupamiento que permita clasificar a los
individuos de una población dada y en función de ella estudiar la
4
victimización a personas conjuntamente con la victimización de hogares.
Este estudio se realiza separadamente para Quito y Guayaquil.
Se consideran las siguientes hipótesis:
I. El nivel de victimización nacional (y de otros indicadores) es diferente al
de las provincias.
II. Las características sobre la victimización entre las dos principales
ciudades del Ecuador, Quito y Guayaquil, son diferentes.
III. Es posible identificar perfiles de individuos con diferentes niveles de
victimización mediante el uso de regresión logística.
IV. Es posible generar segmentos de individuos en función de sus
semejanzas y que tengan diferentes niveles de victimización.
Para alcanzar los objetivos planteados, en el segundo capítulo se detallan los
principales resultados descriptivos obtenidos en la encuesta a nivel nacional, con
un buen nivel de desagregación, como por ejemplo, por género, por edad, etc., así
como ciertos análisis comparativos.
En el tercer capítulo se presenta la aplicación del modelo estadístico de regresión
logística que intenta explicar el uso del mismo para la creación de un score de
victimización a nivel nacional, que cuantifique el riesgo de que un ecuatoriano sea
victimizado. Este puede mostrar un resultado en cierto sentido muy general,
ocasionado por el nivel de agregación, que en este caso es a nivel país, pero que
sin embargo como se verá es una adecuada herramienta para la discriminación de
la victimización, brindando la posibilidad de priorizar y especializar la gestión en
los individuos con mayor riesgo. La metodología aplicada podría implementarse
para el nivel de detalle deseado, como puede ser por ciudad, cuyos resultados
serán más precisos y útiles para cada comunidad.
5
En el capítulo cuatro se presenta un análisis más especifico. Se han seleccionado
las ciudades de Quito y Guayaquil para el estudio por ser de las más victimizadas
y las más grandes del Ecuador. Se realiza un modelo de agrupación para los
individuos de cada ciudad con el fin de determinar los diferentes niveles de
victimización que cada grupo tiene y las posibles estrategias que se podrían
aplicar a cada uno de ellos, considerando la tipología de cada grupo.
Para terminar, en el capítulo cinco se presentan las conclusiones y
recomendaciones obtenidas a lo largo del desarrollo de este estudio.
6
CAPÍTULO 2:
PRINCIPALES RESULTADOS SOBRE VICTIMIZACIÓN
A PERSONAS
2.1 ANTECEDENTES
La metodología sobre la cual se obtuvo la información de la encuesta es mediante
entrevista directa. Este método aunque supone costos operativos elevados tiene
las ventajas de obtener información con una alta confiabilidad y cobertura,
superando a métodos como las encuestas telefónicas y los correos electrónicos,
que demandan la conciencia de la importancia de estos estudios para una
declaración verídica por parte de los entrevistados, siendo su nivel de respuesta
bastante bajo.
El muestreo fue aplicado sobre las viviendas, una opción mejor que la de los
lugares aglomerados que no poseen un diseño muestral. Las viviendas, al tener
un lugar específico, permiten tener un diseño muestral sobre el cuál se puede usar
factores de expansión.
Población Objetivo
La población objetivo de estudio concierne a las personas mayores a 16 años, de
las capitales provinciales de todas las provincias del país, con excepción de
Galápagos.
7
La encuesta se la realizó por muestreo y la entrevista a un informante que tenga
una edad mínima de 18 años (en la medida de lo posible se intentó entrevistar al
jefe de hogar).
El diseño de la muestra es multietápico. A continuación se describen las fases
correspondientes1:
Las unidades primarias de muestreo son los estratos, que corresponden a cada
uno de los cantones al que pertenece cada capital provincial. Esta estratificación
permitirá calcular indicadores nacionales o regionales, de ser necesario.
En cada una de las capitales provinciales se estratificó la población en urbana y
rural (sectores urbanos de las parroquias rurales; sectores amanzanados, no los
dispersos, por cuanto los costos de recolección se elevan considerablemente). Se
realizó una asignación proporcional de la muestra para cada estrato. Para evitar
una exagerada dispersión geográfica en el área rural, previamente se
seleccionaron parroquias rurales, con el criterio de que en cada una de ellas se
investigarán, en general, 2 sectores censales, pero no más de 3.
En cada estrato se seleccionaron sectores censales con igual probabilidad.
En la cuarta fase se seleccionaron con probabilidad igual 12 viviendas en cada
sector censal (también se seleccionarán 4 adicionales como posibles remplazos).
En los casos en que exista más de un hogar en la vivienda (situación excepcional)
se sorteó un hogar para la entrevista.
Finalmente, en la quinta fase, se entrevistó en cada hogar seleccionado a todos
los miembros con al menos 16 años de edad. No se entrevistó a todos pero se
recobró información sobre todos.
1Mayores detalles se encuentran en el Informe Final sobre Estudio de Percepción y Victimización en el Ecuador!Diseño Metodológico, 2008.
8
Cuestionario de personas
Las preguntas se organizaron en capítulos consecutivos, que corresponden a los
temas de investigación de la encuesta. La información es referente a2:
INFORMACIÓN SOBRE PERSONAS
DATOS DEMOGRÁFICOS DE LOS MIEMBROS DEL HOGAR
DATOS EDUCATIVOS
DATOS ÉTNICOS!CULTURALES
MIGRACIÓN
DATOS ECONÓMICOS
DATOS SOBRE ROBOS Y ASALTOS
DATOS SOBRE INSEGURIDAD
DATOS SOBRE MALTRATO
VIOLENCIA INTRAFAMILIAR
PERCEPCIÓN DE INSEGURIDAD
ACOSO Y ABUSO SEXUAL
2.2 DEFINICIONES
El indicador de victimización es obtenido mediante el análisis de varias variables
que intentan comprender el fenómeno de la inseguridad. El concepto de
victimización a personas, victimización a hogares y percepción de victimización se
especifica en las siguientes definiciones:
Índice de Victimización a Personas (IVP): Indica el porcentaje de personas (16
años de edad en adelante) que fueron víctimas en el transcurso de los últimos 12
meses de al menos uno de los siguientes delitos: robo con fuerza, robo sin fuerza,
ataques y amenazas.
2 La base dispone de más información que para este análisis no es objeto de estudio.
9
Índice de Percepción de Inseguridad (IPI): Indica el porcentaje de personas que
han manifestado cualquiera de las siguientes opciones:
En las últimas dos semanas ha conversado con sus familiares, amigos o
compañeros sobre delincuencia y seguridad.
Comparado con un año atrás, considera que en su barrio el problema de la
inseguridad frente al delito es más grave.
Comparado con un año atrás, diría que su barrio es hoy menos seguro.
Considera que hoy en la Ciudad la inseguridad respecto al delito es un problema
bastante importante o muy importante.
Se sienten nada o poco seguro al caminar en su barrio en la noche.
Se sienten nada o poco seguro cuando está solo/a en su casa.
Se sienten nada o poco seguro cuando está solo/a en su auto.
Índice de Victimización a Hogares (IVH): Indica el porcentaje de hogares que
fueron víctimas en el transcurso de los últimos 12 meses de al menos uno de los
siguientes delitos: robo a viviendas y robo de vehículos, motocicletas, bicicletas u
otros accesorios.
2.3 ANÁLISIS DESCRIPTIVO
El objetivo del presente capítulo es mostrar los índices de victimización a personas
y su percepción a nivel nacional en sus diferentes segmentaciones.
Se presentará un análisis descriptivo de las variables más importantes de la
población. Para esto se ha utilizado un ponderador que fue utilizado en el estudio
y que corresponden según el caso a la representatividad que tiene cada capital
provincial en los indicadores nacionales. Para este análisis se han excluido a los
menores de 16 años.
10
Tamaño de la muestra y asignación por provincias
El tamaño de la muestra fue obtenido considerando una precisión del 6,20 % y un
nivel de confianza del 95% para variables multinomiales (respuestas múltiples) en
cada capital provincial, resultando en una precisión a nivel nacional menor a 1,5%.
En Guayas y pichincha la precisión fue del 4,20%. A continuación se muestra las
distribución de los tamaños de muestra:
Cuadro 2.1: Tamaños Muestrales
Cantón capital PrecisiónNo.
Hogares
No. Sect. Cens.
Guayaquil 4,20% 732 61
Quito 4,20% 732 61
Zamora 6,20% 312 26
Otro cantón 6,20% 336 28
8.496 708Total nacional
Tamaños Muestrales
Considerando que los tamaños de muestra, pese a ser representativos para cada
capital provincial, no se obtuvieron con asignación proporcional, se aplicó un
ponderador de acuerdo al tamaño poblacional3:
3 Mayores detalles en el calculo de la muestra se encuentran en el Informe Final sobre Estudio de Percepción
y Victimización en el Ecuador!Diseño Metodológico, 2008.
11
Cuadro 2.2: Tamaño Muestral por Provincia
PROVINCIAFrecuencia Personas
PonderadorPoblación Estimada
AZUAY 944 228 215.125
BOLIVAR 864 20 17.376
CAÑAR 936 26 24.557
CARCHI 945 42 39.600
COTOPAXI 802 52 41.581
CHIMBORAZO 928 110 101.834
EL ORO 1.016 138 140.708
ESMERALDAS 962 73 70.650
GUAYAS 2.264 667 1.509.778
IMBABURA 953 91 86.976
LOJA 999 91 91.152
LOS RIOS 932 77 72.128
MANABI 1.013 132 134.188
MORONA SANTIAGO 840 13 11.024
NAPO 904 14 12.561
PASTAZA 933 19 17.509
PICHINCHA 2.075 604 1.252.677
TUNGURAHUA 930 143 132.946
ZAMORA 907 9 8.115
SUCUMBIOS 816 30 24.808
ORELLANA 871 14 11.990
SANTO DOMINGO DE LOS
TSACHILAS 778 220 171.312
SANTA ELENA 1.029 22 22.352
Total 23.641 2.836 4.210.947
VICTIMIZACIÓN POR REGIÓN
Cuadro 2.3: Victimización por Región
RegiónTamaño de
muestra
Frecuencia población estimada
% población
estimada
%victimización a personas
Victimización
Lím.inf. (95%)
Victimización
Lím.sup. (95%)
SIERRA 12.183 2.197.488 52,2% 11,9% 11,2% 12,5%COSTA 6.187 1.927.452 45,8% 13,9% 13,4% 14,4%AMAZONIA 5.271 86.007 2,0% 6,4% 6,3% 6,6%
Total 23.641 4.210.948 100,0% 12,7% 11,8% 13,5%
Victimización por Región
12
La mayor parte de la población4 se encuentra concentrada en la Costa y en la
Sierra.
Gráfico 2.1: Nivel de Victimización por región
0,0%
10,0%
20,0%
30,0%
40,0%
50,0%
60,0%
SIERRA COSTA AMAZONIA
DISTRIBUCIÓN DE LA POBLACIÓN
POR REGIÓN
0,0%
10,0%
20,0%
SIERRA COSTA AMAZONIA
VICTIMIZACIÓN POR REGIÓN
% victimización a personas
La Costa presenta la mayor victimización mientras que la Amazonía tiene el menor
porcentaje de victimización. Se verifica que estadísticamente exista una diferencia
en la distribución de la victimización de acuerdo a la región. Para esto se contrasta
la hipótesis nula e 5 d independencia entre la victimización y la región
!"# $%&'()*(+(,%)(-.&/0&(.1/2/.1(/.*/&1/&3%&4/5(-.!6# $%&'()*(+(,%)(-.&.7&/0&(.1/2/.1(/.*/&1/&3%&4/5(-.
.
Cuadro 2.4: Prueba Chi-Cuadrado
Prueba Chi-Cuadrado
6798,618a 2 ,000
7339,933 2 ,000
1114,330 1 ,000
4210947
Pearson Chi-Square
Likelihood Ratio
Linear-by -LinearAssociation
N of Valid Cases
Valor dfAsy mp. Sig.
(2-sided)
No existen f recuencias esperadas menores a 5. Lamínima f recuencia esperada es 10890,14.
a.
4 Se considera como Población a la muestra expandida por el ponderador. 5 Para las posteriores variables se omitirá la formulación de las pruebas de hipótesis mostrando
directamente el p!valor del estadístico chi!cuadrado.
13
La victimización muestra que existe relación entre la victimización y la Región.
VICTIMIZACIÓN POR PROVINCIA
Cuadro: 2.5: Victimización por provincia
ProvinciaTamaño de
muestra
Frecuencia población estimada
% población
estimada% victimización a
personasVictimización
Lím.inf. (95%)
Victimización
Lím.sup. (95%)
AZUAY 944 215.125 5,1% 5,6% 4,9% 6,3%
BOLIVAR 864 17.376 0,4% 2,2% 1,7% 2,7%
CAÑAR 936 24.557 0,6% 3,3% 2,7% 3,9%
CARCHI 945 39.600 0,9% 7,3% 6,5% 8,1%
COTOPAXI 802 41.580 1,0% 16,7% 15,4% 18,0%
CHIMBORAZO 928 101.835 2,4% 11,1% 10,1% 12,1%
EL ORO 1.016 140.708 3,3% 11,5% 10,6% 12,5%
ESMERALDAS 962 70.650 1,7% 8,5% 7,7% 9,4%
GUAYAS 2.264 1.509.778 35,9% 14,7% 14,0% 15,4%
IMBABURA 953 86.976 2,1% 5,9% 5,1% 6,6%
LOJA 999 91.151 2,2% 11,7% 10,7% 12,7%
LOS RIOS 932 72.127 1,7% 19,1% 17,9% 20,3%
MANABI 1.013 134.189 3,2% 6,7% 6,0% 7,5%
MORONA SANTIAGO 840 11.024 0,3% 7,7% 6,9% 8,6%
NAPO 904 12.561 0,3% 6,6% 5,8% 7,4%
PASTAZA 933 17.509 0,4% 2,1% 1,7% 2,6%
PICHINCHA 2.075 1.252.677 29,7% 14,7% 14,0% 15,5%
TUNGURAHUA 930 132.946 3,2% 9,0% 8,1% 9,9%
ZAMORA 907 8.115 0,2% 4,6% 4,0% 5,3%
SUCUMBIOS 816 24.808 0,6% 8,8% 7,9% 9,8%
ORELLANA 871 11.990 0,3% 7,5% 6,6% 8,3%
STO. DOM. TSACHILAS 778 171.313 4,1% 6,9% 6,1% 7,8%
SANTA ELENA 1.029 22.351 0,5% 7,9% 7,1% 8,7%
Total 23.641 4.210.946 100,0% 12,7% 11,8% 13,5%
VICTIMIZACIÓN POR PROVINCIA
Las provincias de Guayas y Pichincha son las más pobladas, representan el
65,6% de toda la población.
14
Gráfico 2.2: Distribución de la Población por Provincia
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
30,0%
35,0%
40,0%DISTRIBUCIÓN DE LA POBLACIÓN POR PROVINCIA
Gráfico 2.3: Victimización por Provincia
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
AZUAY
BOLIVAR
CAÑAR
CARCHI
COTOPAXI
CHIMBORAZO
EL ORO
ESMERALDAS
GUAYAS
IMBABURA
LOJA
LOS RIOS
MANABI
MORONA
…
NAPO
PASTAZA
PICHINCHA
TUNGURAHUA
ZAMORA
SUCUMBIOS
ORELLANA
STO. DOM. …
SANTA
ELENA
VICTIMIZACIÓN POR PROVINCIA% victimización a personas L.S(95%) L.I(95%)
La victimización está relacionada con las Provincias. Las provincias de Cotopaxi y
Los Ríos son las más elevadas con un porcentaje de victimización mayor al 15%
15
aunque no son significativas puesto que representan menos del 5% de la
población. Guayas y Pichincha también se encuentran con una victimización por
encima del promedio de la población; al realizar un análisis sobre estas dos
provincias se cubriría gran parte de la población y se centraría el análisis en solo
dos segmentos. A continuación se presenta la prueba chi-cuadrado para la
distribución de victimizados en las provincias:
Cuadro 2.6: Prueba Chi-Cuadrado
Prueba Chi-Cuadrado
48409,667a 22 ,000
55355,320 22 ,000
793,914 1 ,000
4210946
Pearson Chi-Square
Likelihood Ratio
Linear-by -LinearAssociation
N of Valid Cases
Valor dfAsy mp. Sig.
(2-sided)
No existen f recuencias esperadas menores a 5. Lamínima f recuencia esperada es 1027,51.
a.
La victimización es diferente de acuerdo a las provincias.
VICTIMIZACIÓN POR RANGO DE EDAD
Cuadro 2.7: Victimización por Rango de Edad
Rango de edadTamaño de
muestra
Frecuenciapoblaciónestimada
% población
estimada% victimización a
personasVictimización
Lím.inf. (95%)
Victimización
Lím.sup. (95%)
No Responde 22 9.883 0,2% 0,0% 0,0% 0,0%
16 ! 20 años 3.573 584.063 13,9% 14,9% 12,5% 17,4%
21 ! 25 años 3.283 555.394 13,2% 16,7% 14,2% 19,2%
26 ! 30 años 2.850 526.134 12,5% 15,0% 12,5% 17,4%
31 ! 35 años 2.213 382.616 9,1% 13,8% 11,0% 16,6%
36 ! 40 años 2.303 406.410 9,7% 12,2% 9,7% 14,8%
41 ! 50 años 3.805 668.514 15,9% 10,9% 9,0% 12,9%
51 ! 60 años 2.715 535.699 12,7% 10,7% 8,5% 12,8%
mayor 60 años 2.877 542.233 12,9% 7,7% 5,8% 9,6%
Total 23.641 4.210.948 100,0% 12,7% 11,8% 13,5%
Victimización por Rango de edad
16
Como se puede observar en el análisis realizado para la población mayor a 16
años, la distribución de la población estimada por rango de edad se muestra muy
equilibrada, no hay rangos de edad que tengan una notable acumulación.
Gráfico 2.4: Nivel de Victimización por Rango de Edad
0,0%2,0%4,0%6,0%8,0%10,0%12,0%14,0%16,0%18,0%
16
!20
años
21
!25
años
26
!30
años
31
!35
años
36
!40
años
41
!50
años
51
!60
años
mayor 60
años
DISTRIBUCIÓN DE LA POBLACIÓN POR
RANGO DE EDAD
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
16
!20
años
21
!25
años
26
!30
años
31
!35
años
36
!40
años
41
!50
años
51
!60
años
mayor
60
años
VICTIMIZACIÓN POR RANGO DE EDAD% victimización a personas
En los primeros rangos de edad el mayor porcentaje de victimización corresponde
a la población de 21 a 25 años. Además, se observa una victimización decreciente
de acuerdo al rango de edad por lo que se podría tener una incidencia de la
victimización inversamente proporcional al rango de edad.
Cuadro 2.8: Prueba Chi-Cuadrado
Prueba Chi-Cuadrado
31490,911a 8 ,000
33742,474 8 ,000
25321,385 1 ,000
4210946
Pearson Chi-Square
Likelihood Ratio
Linear-by-LinearAssociation
N of Valid Cases
Valor dfAsy mp. Sig.
(2-sided)
No existen f recuencias esperadas menores a 5. Lamínima f recuencia esperada es 1251,38.
a.
Con un p-valor de 0,000 se rechaza la hipótesis nula de independencia
entre la victimización y el rango de edad.
17
VICTIMIZACIÓN POR GÉNERO
Cuadro 2.9: Victimización por Género
GéneroTamaño de
muestra
Frecuencia población estimada
% población
estimada% victimización a
personasVictimización
Lím.inf. (95%)
Victimización
Lím.sup. (95%)
HOMBRE 11.184 2.010.205 47,7% 13,9% 0,0% 0,0%
MUJER 12.457 2.200.743 52,3% 11,6% 0,0% 0,0%
Total 23.641 4.210.948 100,0% 12,7% 11,8% 13,5%
Victimización por Género
La distribución por género muestra un equilibrio entre la cantidad de hombres y
mujeres.
Gráfico 2.5: Nivel de Victimización por Género
0,0%
20,0%
40,0%
60,0%
HOMBRE
MUJER
DISTRIBUCIÓN DE LA POBLACIÓN
POR GÉNERO
0,0%
5,0%
10,0%
15,0%
20,0%
HOMBRE
MUJER
VICTIMIZACIÓN POR GÉNERO% victimización a personas
Al igual que en el rango de edad se realiza una prueba chi-cuadrado para las
proporciones de cada género.
Cuadro 2.10: Prueba Chi-Cuadrado
Prueba Chi-Cuadrado
5145,840b 1 ,000
5145,629 1 ,000
5139,985 1 ,000
,000 ,000
5145,839 1 ,000
4210948
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
Linear-by-LinearAssociation
N of Valid Cases
Valor dfAsy mp. Sig.
(2-sided)Exact Sig.(2-sided)
Exact Sig.(1-sided)
Cálculos para tabla 2x2a.
No existen f recuencias esperadas menores a 5. La mínima f recuencia esperadaes 254531,1.
b.
18
La prueba chi-cuadrado muestra una diferente distribución de victimizados de
acuerdo al género. Los hombres son más victimizados que las mujeres, tienen 1,2
puntos porcentuales mayor al promedio de la población. Esto también se puede
deducir de los intervalos de confianza correspondientes.
VICTIMIZACIÓN POR ETNIA
Cuadro 2.11: Victimización por Etnia
EtniaTamaño de
muestra
Frecuencia población estimada
% población
estimada% victimización a
personasVictimización
Lím.inf. (95%)
Victimización
Lím.sup. (95%)
INDIGENA 866 102.479 2,4% 11,7% 0,0% 0,0%BLANCO 1.504 378.766 9,0% 13,6% 0,0% 0,0%MESTIZO 20.155 3.493.180 83,0% 12,4% 0,0% 0,0%NEGRO 553 86.417 2,1% 14,9% 0,0% 0,0%MULATO 537 145.670 3,5% 15,7% 0,0% 0,0%NS/NR 26 4.436 0,1% 15,0% 0,0% 0,0%Total 23.641 4.210.948 100,0% 12,7% 11,8% 13,5%
Victimización por Etnia
La etnia se encuentra mayoritariamente conformada por la mestiza con el 83%
seguida por la etnia blancos con el 9%.
Gráfico 2.6: Nivel de Victimización por Etnia
0,0%
20,0%
40,0%
60,0%
80,0%
100,0%
INDIGENA
BLANCO
MESTIZO
NEGRO
MULATO
NS/NR
DISTRIBUCIÓN DE LA POBLACIÓN POR
ETNIA
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
INDIGENA
BLANCO
MESTIZO
NEGRO
MULATO
NS/NR
VICTIMIZACIÓN POR ETNIA
% victimización a personas
19
Las etnias indígena y mestiza tienen niveles de victimización similares, bajo el
promedio, mientras que los blancos, mulatos y negros tienen índices superiores al
promedio. Los intervalos de confianza bastante amplios aparecen por los tamaños
de muestra reducidos.
VICTIMIZACIÓN POR NIVEL DE EDUCACIÓN
Cuadro 2.12: Victimización por Nivel de Educación
Nivel de
EducaciónTamaño de
muestra
Frecuencia población estimada
% población
estimada
%victimización a personas
Victimización
Lím.inf. (95%)
Victimización
Lím.sup. (95%)
Ninguno 517 95.104 2,3% 6,8% 3,2% 10,3%
Primaria 6.419 965.891 23,0% 8,1% 6,5% 9,6%
Secundaria 10.746 2.052.455 48,9% 13,3% 12,0% 14,5%
Superior 5.861 1.068.148 25,4% 16,3% 14,4% 18,2%
Otros 74 17.135 0,4% 11,5% 2,5% 20,6%Total 23.617 4.210.948 100,0% 12,7% 11,8% 13,5%
Cuadro 2.12
Victimización Nivel de Educación
El cuadro del nivel de educación muestra que el 23% de la población estudió sólo
primaria, 48,9% secundaria y el 25,4% superior.
Gráfico 2.7: Nivel de Victimización por Nivel de Educación
0,0%
10,0%
20,0%
30,0%
40,0%
50,0%
60,0%
Ninguno
Primaria
Secundaria
Superior
Otros
DISTRIBUCIÓN DE LA POBLACIÓN
POR NIVEL DE EDUCACIÓN
0,0%
10,0%
20,0%
30,0%
Ninguno
Primaria
Secundaria
Superior
Otros
VICTIMIZACIÓN POR NIVEL DE
EDUCACIÓN% victimización a personas
20
La victimización en los grupos de educación superior es mayor al promedio
poblacional. Este resultado es consistente con la mayor victimización que se
presenta entre los 21 y 25 años, edad en la que se desarrollan los estudios
superiores, como se verá más adelante en la variable ocupación.
Cuadro 2.13: Prueba Chi-Cuadrado
Prueba Chi-Cuadrado
35020,309a 4 ,000
37062,848 4 ,000
32358,028 1 ,000
4198733
Pearson Chi-Square
Likelihood Ratio
Linear-by-LinearAssociation
N of Valid Cases
Valor dfAsy mp. Sig.
(2-sided)
No existen f recuencias esperadas menores a 5. Lamínima f recuencia esperada es 2173,21.
a.
La victimización no es independiente al nivel de estudios; sin embargo, esta
relación puede estar vinculada al rango de edad y a la ocupación.
VICTIMIZACIÓN POR ESTADO CIVIL
Cuadro 2.14: Victimización por Estado Civil
Estado CivilTamaño de
muestra
Frecuencia población estimada
% población
estimada
%victimización a personas
Victimización
Lím.inf.
(95%)
Victimización
Lím.sup.
(95%)
Soltero 7.673 1.386.122 32,9% 14,93% 13,37% 16,49%
Casado o Unión
Libre13.307 2.279.329 54,1% 11,29% 10,24% 12,34%
Separado o
Divorciado1.657 352.924 8,4% 15,22% 11,90% 18,53%
Viudo 1.004 192.573 4,6% 7,88% 4,17% 11,59%
Total 23.641 4.210.948 100,0% 12,7% 11,8% 13,5%
Victimización Estado Civil
Considerando que la población analizada es aquella de edad mayor o igual a 16
años, el 41,4% de ésta es casada, que al considerarla con la unión libre de 12,7%
forman un porcentaje de parejas que conviven en 54,1%. Los solteros representan
el 32,9%.
21
Gráfico 2.8: Nivel de Victimización por Estado Civil
0
0,1
0,2
0,3
0,4
0,5
0,6
Soltero Casado o
Unión LibreSeparado o
DivorciadoViudo
DISTRIBUCIÓN DE LA POBLACIÓN POR
ESTADO CIVIL
0,00%
10,00%
20,00%
Soltero Casado o
Unión LibreSeparado o
DivorciadoViudo
VICTIMIZACIÓN POR ESTADO CIVIL
% victimización a personas
Los viudos y casados son los menos victimizados mientras, los solteros,
separados o divorciados son los más victimizados. Esto puede justificarse por el
hecho que las personas sin obligaciones hogareñas pasan mayor tiempo fuera de
su casa y, por ende, se encuentran más expuestos al peligro.
Cuadro 2.15: Prueba Chi-Cuadrado
Prueba Chi-Cuadrado
16428,143a 3 ,000
16679,280 3 ,000
6275,196 1 ,000
4210946
Pearson Chi-Square
Likelihood Ratio
Linear-by-LinearAssociation
N of Valid Cases
Valor dfAsy mp. Sig.
(2-sided)
No existen f recuencias esperadas menores a 5. Lamínima f recuencia esperada es 24383,46.
a.
La victimización no es independiente del estado civil.
22
VICTIMIZACIÓN POR OCUPACIÓN
Cuadro 2.16: Victimización por Ocupación
OcupaciónTamaño de
muestra
Frecuencia población estimada
% población
estimada
%victimización a personas
Victimizació
n Lím.inf.
(95%)
Victimizació
n Lím.sup.
(95%)
TIENE UN TRABAJO O NEGOCIO
12.764 2.221.172 52,7% 14,0% 12,8% 15,2%
NO TIENE TRABAJO PERO LO ESTA BUSCANDO
1.543 350.305 8,3% 12,6% 9,7% 15,5%
ES RENTISTA 158 33.702 0,8% 11,3% 2,5% 20,0%ES JUBILADO PENSIONISTA
712 165.358 3,9% 9,0% 6,1% 11,9%
ES ESTUDIANTE 3.326 561.129 13,3% 15,5% 13,1% 18,0%
ES AMA DE CASA 4.697 808.451 19,2% 8,6% 7,1% 10,2%
ES INCAPACITADO /3ERA EDAD
357 51.005 1,2% 3,1% 0,0% 6,2%
NS/NR 84 19.823 0,5% 8,6% 2,9% 14,3%
Total 23.641 4.210.948 100,0% 12,7% 11,8% 13,5%
Victimización por Ocupación
Gráfico 2.9: Nivel de Victimización por Ocupación
0,0%
10,0%
20,0%
30,0%
40,0%
50,0%
60,0%
DISTRIBUCIÓN DE LA POBLACIÓN POR
OCUPACIÓN
0
0,05
0,1
0,15
0,2
0,25
TIENE UN
TRABAJO
O NEGOCIO
NO
TIENE TRABAJO
PERO
LO
ESTA
BUSCANDO
ES RENTISTA
ES JUBILADO
PENSIONISTA
ES ESTUDIANTE
ES AMA
DE CASA
ES INCAPACITADO
/3ERA
EDAD
NS/NR
VICTIMIZACIÓN POR OCUPACIÓN% victimización a personas
23
Los estudiantes con el 15,5% de victimización son los más victimizados en la
población, seguidos por quienes tienen un trabajo o negocio. Son quienes se
exponen más al peligro y poseen cosas que son atractivas para los delincuentes.
Cuadro 2.17: Prueba Chi-Cuadrado
Prueba Chi-Cuadrado
26279,942a 7 ,000
29092,555 7 ,000
10610,295 1 ,000
4210945
Pearson Chi-Square
Likelihood Ratio
Linear-by-LinearAssociation
N of Valid Cases
Valor dfAsy mp. Sig.
(2-sided)
No existen f recuencias esperadas menores a 5. Lamínima f recuencia esperada es 2509,97.
a.
La victimización también se relaciona con la actividad de los individuos.
TIPO DE VICTIMIZACIÓN
Cuadro 2.18: Porcentaje del Tipo de Victimización
Victimización Frecuencia
% Victimizada de la
población
Victimización con fuerza 326.039 7,70%
Victimización sin fuerza 173.299 4,10%
Amenazas 68.510 1,60%
Victimización total 533.187 12,70%
Porcentaje tipo de Victimización
24
Gráfico 2.10: Porcentaje del Tipo de Victimización
0,00%
1,00%
2,00%
3,00%
4,00%
5,00%
6,00%
7,00%
8,00%
9,00%
!
50.000
100.000
150.000
200.000
250.000
300.000
350.000
Victimización con fuerza Victimización sin fuerza Amenazas
Porcentaje tipo de Victimización
Frecuencia % Victimizada de la población
La victimización con fuerza es la más representativa de la victimización a
personas, esta representa el 60,5% de todas las victimizaciones suscitadas a
personas; esto implica un mayor peligro para las personas que sufren de esta
situación.
2.4 ANÁLISIS PERCEPCIÓN
La percepción de la victimización como se indicó en el principio del presente
capítulo indica la presencia indirecta de la victimización; es decir, los hechos
sucedidos en su entorno o en medios de comunicación que producen un
sentimiento de inseguridad. A continuación se presenta un análisis comparativo
entre la percepción y la victimización6.
6 Debido al análisis comparativo entre la victimización y la percepción no se realizan pruebas de
proporciones para la percepción.
25
REGIÓN
Cuadro 2.19: Comparación entre Percepción y Victimización por Región
Región%
victimización personas
% Percepción
SIERRA 11,9% 47,6%COSTA 13,9% 40,6%AMAZONIA 6,4% 46,5%
Total 12,7% 44,4%
Región
Gráfico 2.11: Comparación entre Percepción y Victimización por Región
0,0%
10,0%
20,0%
30,0%
40,0%
50,0%
0,0%
2,0%
4,0%
6,0%
8,0%
10,0%
12,0%
14,0%
16,0%
SIERRA COSTA AMAZONIA
% Percepción
% victimización
personas
Victimización y Percepción por Región
% victimización personas % Percepción Línea de Referencia
Nótese que la línea segmentada de color verde, línea de referencia, coincide con
el promedio de victimización en la escala del eje izquierdo y la percepción de
victimización en el eje derecho; esto permite una mejor interpretación comparativa
de los valores, leyendo adecuadamente ambas escalas.
La región Costa tiene la percepción más baja pese a ser la más victimizada
mientras que las otras regiones muestran una percepción mayor al promedio
nacional y una victimización menor al promedio nacional; es decir, inversamente
proporcional a la región Costa.
26
PROVINCIA
Cuadro 2.20: Comparación entre Percepción y Victimización por Provincia
Provincia%
victimización personas
% Percepción
AZUAY 5,6% 40,4%
BOLIVAR 2,2% 41,0%
CAÑAR 3,3% 38,4%
CARCHI 7,3% 42,3%
COTOPAXI 16,7% 51,0%
CHIMBORAZO 11,1% 43,5%
EL ORO 11,5% 41,8%
ESMERALDAS 8,5% 38,8%
GUAYAS 14,7% 40,5%
IMBABURA 5,9% 40,3%
LOJA 11,7% 41,8%
LOS RIOS 19,1% 46,7%
MANABI 6,7% 38,8%
MORONA SANTIAGO 7,7% 41,9%
NAPO 6,6% 42,9%
PASTAZA 2,1% 40,8%
PICHINCHA 14,7% 44,4%
TUNGURAHUA 9,0% 42,5%
ZAMORA 4,6% 39,7%
SUCUMBIOS 8,8% 56,0%
ORELLANA 7,5% 47,9%
STO. DOM. TSACHILAS 6,9% 95,2%
SANTA ELENA 7,9% 52,0%
Total 12,7% 44,4%
Provincia
27
Gráfico 2.12: Nivel Percepción y Victimización por Provincia
0,0%
10,0%
20,0%
30,0%
40,0%
50,0%
60,0%
70,0%
80,0%
90,0%
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
% percepción
% victimización
personas
Victimización y Percepción por Provincia% victimización personas % Percepción
La percepción que se observa por provincia no explica la victimización que existe
en cada una de ellas de forma general. Para las provincias: Los Ríos, Cotopaxi,
Guayas y Pichincha, las más victimizadas, no se observa en la percepción un
comportamiento diferente a las otras provincias, pues se encuentran cercanas al
promedio. Esto podría significar que la victimización es un componente estructural.
RANGO DE EDAD
Cuadro 2.21: Comparación entre Percepción y Victimización por Rango de Edad
Rango de edad% victimización
personas% Percepción
No Responde 0,0% 15,2%
16 ! 20 años 14,9% 30,3%
21 ! 25 años 16,7% 38,1%
26 ! 30 años 15,0% 44,7%
31 ! 35 años 13,8% 45,0%
36 ! 40 años 12,2% 51,0%
41 ! 50 años 10,9% 48,1%
51 ! 60 años 10,7% 50,1%
mayor 60 años 7,7% 50,7%
Total 12,7% 44,4%
Rango de edad
28
Gráfico 2.13: Comparación entre Percepción y Victimización por Rango de Edad
0,0%
10,0%
20,0%
30,0%
40,0%
50,0%
60,0%
0,0%
2,0%
4,0%
6,0%
8,0%
10,0%
12,0%
14,0%
16,0%
18,0%
16 ! 20
años21 ! 25
años26 ! 30
años31 ! 35
años36 ! 40
años41 ! 50
años51 ! 60
añosmayor 60
años
% Percepción
% victimización
personas
Victimización y Percepción por Rango de edad
% victimización personas % Percepción Línea de Referencia
La victimización y la percepción son inversamente proporcionales. En los rangos
de edad más bajos se tiene el mayor nivel de victimización y el menor porcentaje
de percepción, lo que indica una menor precaución de este grupo con el peligro
mientras que en los rangos de edad mayores se observa lo opuesto.
GÉNERO
Cuadro 2.22: Comparación entre Percepción y Victimización por Género
Género% victimización
personas% Percepción
HOMBRE 13,9% 37,70%
MUJER 11,6% 50,50%
Total 12,7% 44,40%
Género
29
Gráfico 2.14: Nivel de Percepción y Victimización por Género
0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
0,0%
2,0%
4,0%
6,0%
8,0%
10,0%
12,0%
14,0%
16,0%
HOMBRE MUJER
% Percepción
% victimización
personas
Victimización y Percepción por Género
% victimización personas % Percepción Línea de Referencia
Los hombres muestran un mayor grado de victimización que el de las mujeres;
este hecho podría deberse al mayor grado de exposición al peligro que podría
explicarse por el menor grado de percepción al peligro que éstos tienen.
ESTADO CIVIL
Cuadro 2.23: Comparación entre Percepción y Victimización por Estado Civil
Estado civil%
victimización personas
% Percepción
CASADO 10,9% 49,2%SEPARADO 14,7% 54,3%
DIVORCIADO 16,7% 55,0%
VIUDO 7,9% 56,2%
UNION LIBRE 12,6% 51,6%
SOLTERO 14,9% 31,4%
Total 12,7% 44,4%
Estado Civil
30
Gráfico 2.15: Nivel de Percepción y Victimización por Estado Civil
0,0%
10,0%
20,0%
30,0%
40,0%
50,0%
60,0%
0,0%
2,0%
4,0%
6,0%
8,0%
10,0%
12,0%
14,0%
16,0%
18,0%
% Percepción
% victimización
personas
Victimización y Percepción por Estado Civil
% victimización personas % Percepción Línea de Referencia
La percepción del soltero es la más baja, siendo esta una de las posibles razones
de que la victimización de este grupo sea de las más altas. Los porcentajes de
victimización y de percepción de los divorciados son altos.
NIVEL DE EDUCACIÓN
Cuadro 2.24: Comparación entre Percepción y Victimización por Nivel de Educación
Nivel de Educación% victimización
personas% percepción
Ninguno 7% 37,8%
Primaria 8% 48,5%
Secundaria 13% 45,4%
Superior 16% 39,4%
Otros 12% 59,1%
Total 13% 44,5%
Nivel de Educación
31
Gráfico 2.16: Nivel de Percepción y Victimización por Nivel de Educación
0,0%
10,0%
20,0%
30,0%
40,0%
50,0%
60,0%
0%
2%
4%
6%
8%
10%
12%
14%
16%
18%
Ninguno Primaria Secundaria Superior Otros
% percepción
% victimización
personas
Victimización y Percepción por Nivel de Educación
% victimización personas % percepción Línea de Referencia
Las personas con educación universitaria tienen una percepción menor al
promedio mientras el porcentaje de victimización es alto. Esto concuerda
plenamente con el análisis hecho por rango de edad que muestra una mayor
victimización y menor percepción para el rango de edad entre 21 y 25 años.
OCUPACIÓN
Cuadro 2.25: Comparación entre Percepción y Victimización por Ocupación
Ocupación% victimización
personas% Percepción
TIENE UN TRABAJO O NEGOCIO
14,0% 43,7%
NO TIENE TRABAJO PERO LO ESTA BUSCANDO
12,6% 37,8%
ES RENTISTA 11,3% 55,1%ES JUBILADO PENSIONISTA
9,0% 54,3%
ES ESTUDIANTE 15,5% 29,4%ES AMA DE CASA 8,6% 58,8%
ES INCAPACITADO /3ERA EDAD
3,1% 21,1%
NS/NR 8,6% 41,6%
Total 12,7% 44,4%
Victimización por Ocupación
32
Gráfico 2.17: Comparación entre Percepción y Victimización por Ocupación
0,0%
10,0%
20,0%
30,0%
40,0%
50,0%
60,0%
0,0%
2,0%
4,0%
6,0%
8,0%
10,0%
12,0%
14,0%
16,0%
18,0%
TIENE UN
TRABAJO
O
NEGOCIO
NO
TIENE
TRABAJO
PERO
LO ESTA
BUSCANDO
ES RENTISTA
ES JUBILADO
PENSIONISTA
ES ESTUDIANTE
ES AMA
DE
CASA
ES
INCAPACITADO
/3ERA
EDAD
% Percepción
% victimización
personas
Victimización y Percepción por Ocupación% victimización personas % Percepción % Promedio Percepción
Las ocupaciones con percepción alta tienen porcentajes de victimización bajos.
Los estudiantes tienen la percepción más baja con la victimización más alta. Esto
confirma la relación inversa, en general, entre victimización y percepción; es decir,
quien más se cuida también tiene menor probabilidad de ser victimizado.
VICTIMIZACIÓN A HOGARES
En el estudio de la victimización a personas es de gran importancia estudiar la
asociación o incidencia que la victimización a hogares pueda tener. Este tema es
tratado con mayor detalle en el capítulo cuatro. A continuación se presenta los
índices de victimización a hogares que se tiene en cada una de las provincias:
33
Cuadro 2.26: Victimización a Hogares y Personas por Provincia
PROVINCIA Población % Población % Vict. Hogares % Vict. Personas
AZUAY 215.124 5,1% 14,5% 5,6%
BOLIVAR 17.377 0,4% 6,0% 2,2%
CAÑAR 24.558 0,6% 12,5% 3,3%
CARCHI 39.600 0,9% 14,0% 7,3%
COTOPAXI 41.581 1,0% 19,8% 16,7%
CHIMBORAZO 101.835 2,4% 17,6% 11,1%
EL ORO 140.708 3,3% 10,6% 11,5%
ESMERALDAS 70.650 1,7% 10,4% 8,5%
GUAYAS 1.509.778 35,9% 16,1% 14,7%
IMBABURA 86.976 2,1% 12,7% 5,9%
LOJA 91.152 2,2% 14,7% 11,7%
LOS RIOS 72.127 1,7% 11,4% 19,1%
MANABI 134.188 3,2% 12,9% 6,7%
MORONA SANTIAGO 11.023 0,3% 20,5% 7,7%
NAPO 12.561 0,3% 17,9% 6,6%
PASTAZA 17.509 0,4% 19,0% 2,1%
PICHINCHA 1.252.677 29,7% 19,5% 14,7%
TUNGURAHUA 132.946 3,2% 17,8% 9,0%
ZAMORA 8.115 0,2% 15,1% 4,6%
SUCUMBIOS 24.808 0,6% 18,9% 8,8%
ORELLANA 11.989 0,3% 19,9% 7,5%
SANTO DOMINGO DE
LOS TSACHILAS171.312 4,1% 7,2% 6,9%
SANTA ELENA 22.352 0,5% 10,5% 7,9%
Total 4.210.946 100,0% 16,2% 12,7%
34
Gráfico 2.18: Nivel de Victimización a Hogares y Personas por Provincia
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
AZUAY
BOLIVAR
CAÑAR
CARCHI
COTOPAXI
CHIMBORAZO
EL ORO
ESMERALDAS
GUAYAS
IMBABURA
LOJA
LOS RIOS
MANABI
MORONA
…
NAPO
PASTAZA
PICHINCHA
TUNGURAHUA
ZAMORA
SUCUMBIOS
ORELLANA
SANTO
…
SANTA
ELENA
% Vict.
Personas
% Vict.
Hogares
HOGARES
% Vict. Hogares % Vict. Personas
Existen provincias como Cotopaxi, Pichincha y Guayas que presentan niveles
altos de victimización a personas y a viviendas. Otras provincias presentan niveles
altos de victimización a hogares pero no a viviendas o viceversa; no se vislumbra
una estructura diferenciada.
En el análisis descriptivo de cada una de las variables se observó que los jóvenes,
estudiantes o universitarios y solteros son más victimizados que el resto de la
población. También, el grupo con estas características tiene una percepción de
inseguridad menor al resto de la población, siendo esta una de las posibles
razones de su mayor victimización. Estos dos hecho pueden ser fruto del
comportamiento natural y social que estos individuos tienen de acuerdo a su edad
y estado civil.
Los divorciados también tienen un alto porcentaje de victimización que puede ser
asociado a un comportamiento similar al de los jóvenes.
35
En cada una de las regiones se tiene niveles de inseguridad muy diferentes; por
ejemplo la región Costa tiene un porcentaje de victimización de 13,9% casi dos
puntos más que la Sierra con 11,95 y esta a su vez 5,5 puntos más que la región
Amazónica que tiene un porcentaje de victimización de 6,4%.
Las provincias también mostraron niveles de inseguridad muy diferentes; las
provincias de Cotopaxi, los Ríos, Pichincha y Guayas resultaron ser las más
victimizadas a nivel nacional.
36
CAPITULO 3:
SCORE DE VICTIMIZACIÓN
Un modelo de score7 es un conjunto de decisiones que se obtienen mediante
técnicas estadísticas que ayudan a estimar la probabilidad de que suceda un
determinado evento de interés. Mediante esta probabilidad estimada es posible
definir estrategias que ayuden a que el evento de estudio suceda o no. Son varias
las técnicas estadísticas utilizadas para construir uno de estos modelos y se
aplican en campos como la medicina, la banca, etc.
En el presente capítulo se utilizará un modelo de regresión logística para la
creación del score, para usarlo en un tema de gran importancia social como es la
victimización.
ESQUEMA METODOLÓGICO DE UN MODELO DE SCORE
En este capítulo se presentan los pasos para efectuar un modelo de score, así
como una aplicación a los datos de victimización. Los puntos a tratar en este
capítulo son:
1. Selección de la muestra
2. Definición de buenos y malos
3. Análisis de la información
4. Construcción del modelo
5. Validación del modelo
6. Aplicación
7 Se denomina score a la probabilidad multiplicada por un factor; expresada como un puntaje generalmente
entre 0 y 1.000.
37
Los puntos del 1 al 5 representan el esquema metodológico de un modelo de
score.
3.1 SELECCIÓN DE LA MUESTRA
Para desarrollar un modelo que calcule la probabilidad de un evento de interés es
necesario tener una determinada experiencia, que permita definir a priori el tipo de
información relevante que podría ser necesaria para el desarrollo del modelo;
cuando el investigador no tiene la suficiente experiencia en el tema es necesario
recurrir a un criterio experto, sobre todo cuando la información va ser extraída de
una muestra.
La información de la muestra debe ser representativa de la población8.
Hay que recalcar que para la construcción del modelo de regresión logística se
tomó el 70% de los elementos de la base total, dejándose el 30% como muestra
de prueba para la validación del modelo.
Con el objetivo de desarrollar un modelo de score (o scoring) de victimización se
considera la siguiente información:
Información demográfica
Información Económica
Información Antropométrica
Información de Victimización
En el presente caso, esta información ha sido recogida en la Encuesta de
Victimización y Percepción en el Ecuador facilitada por la Unidad Ejecutora
Especializada en Seguridad Pública (UEE)
8 Conocido como el Throw the door population en el libro Credit Scoring and its applacations, Lyn C Thomas, 1997.
38
3.2 DEFINICIÓN DE BUENOS Y MALOS (VICTIMIZADOS / NO VICTIMIZADOS)
En el desarrollo de modelos de score es necesario definir el indicador de buenos y
malos, desde el punto de vista estadístico, que corresponde al evento que
deseamos analizar; el concepto de bueno y malo es crucial ya que se buscará la
relación entre esta variable definida y la información disponible. Generalmente se
define como Bueno al registro que presenta positivo a la característica de
estudio.Para este trabajo el indicador ya está definido y se presenta a
continuación:
VICTIMIZADO
Se considera como BUENO a los individuos que en la encuesta presentan
afirmativo en el Índice de Victimización a Personas (IVP): personas (16 años de
edad en adelante) que fueron víctimas en el transcurso de los últimos 12 meses
de al menos uno de los siguientes delitos: robo con fuerza, robo sin fuerza,
ataques y amenazas.
NO VICTIMIZADO
Se considera como MALO a personas de 16 años en adelante que no fueron
víctimas en el transcurso de los últimos 12 meses de ninguno de los siguientes
delitos: robo con fuerza, robo sin fuerza, ataques y amenazas.
3.3 ANÁLISIS DE LA INFORMACIÓN
En el proceso de desarrollo de cualquier modelo, la parte fundamental y que más
tiempo necesita es la de extracción de información, pues es sobre ella que se
39
cimientan todo tipo de análisis y posteriormente acciones. Cuando la información
no es adecuadamente obtenida los costos de corrección son elevados, pudiendo
llegar a ser incluso más que el costo de obtención.
Para un análisis efectivo de la información se deben considerar los siguientes
puntos:
Consistencia de la información
Tratamiento de datos de nulos
Análisis Multivariado
CONSISTENCIA DE LA INFORMACIÓN
El análisis de la consistencia de la información, como se había mencionado
anteriormente, es una de las partes más importantes en un estudio. Para realizar
una prueba adecuada de consistencia es recomendable considerar una pequeña
submuestra de individuos (parte de la muestra para el desarrollo del modelo), de
tal manera que se pueda validar con la información física la veracidad de la misma
(control de calidad). Esto ha sido realizado, como una etapa previa a la recepción
de la información, por lo que no forma parte del presente trabajo.
TRATAMIENTO DE DATOS NULOS
Al disponer de una base entregada se trata de analizar la completitud de la los
datos obtenidos, de tal manera que se pueda determinar las variables que serán
útiles en el estudio.
De la información disponible en la base se encontró que a excepción de la variable
tipo de trabajo que tenía el 84% de la información en blanco, todas las variables
consideradas no tenían valores perdidos. No se consideró en el análisis esta
variable.
40
En total se tienen 23.641 registros de personas.
Las variables que originalmente se consideraron para el desarrollo del modelo
son:
PROVINCIA
DATOS DEMOGRAFICOS –SEXO
DATOS DEMOGRAFICOS -AÑOS CUMPLIDOS
DATOS EDUCATIVOS -NIVEL DE INSTRUCCIÓN
DATOS EDUCATIVOS -ESTADO CIVIL
DATOS ECONOMICOS –TRABAJO
PROPORCIÓN DE PERSONAS QUE TRABAJAN FAMILIA
PERSONAS POR DORMITORIO
POBREZA (CRITERIOS COMUNIDAD ANDINA)
POBREZA EXTREMA (CRITERIOS COMUNIDAD ANDINA)
POBREZA (CRITERIOS COMUNIDAD ANDINA)
PROPORCIÓN DE POBRES POR CANTÓN
ANÁLSISIS MULTIVARIADO
El modelo debería ser el más sencillo posible; que explique de mejor manera las
relaciones entre las variables de interés, y que además sea congruente e
interpretable. Hay que tener en cuenta que un mayor número de variables en el
modelo implicará mayores errores de estimación. Un análisis univariado (como el
realizado en el capítulo 2) sirve para tener una idea de la información contenida en
los datos como un análisis exploratorio no obstante la selección de las variables; la
agrupación de los atributos dentro de una misma variable o la agrupación de
atributos de variables combinadas es posible realizarlo mediante análisis
multivariado que permite realizar estos procesos en forma eficiente y sin criterios
subjetivos. Para realizar este análisis se ha empleado la técnica de árboles de
decisión que permite un agrupamiento de fácil interpretación.
41
A continuación se describe brevemente el funcionamiento de los árboles de
decisión.
ÁRBOLES DE DECISIÓN
Se define como un árbol de decisión a una estructura que tiene forma de árbol en
el cual las ramas presentan conjuntos de decisiones que a su vez generan
sucesivas reglas de clasificación de un conjunto de datos en subgrupos disjuntos.
Las ramificaciones se realizan en forma recursiva hasta el momento en que se
cumplen determinados criterios de parada. Las ramificaciones empiezan
considerando un nodo inicial que es a partir del cual el grupo de individuos se
divide en grupos y subgrupos discriminando la variable objetivo en función de las
variables explicativas.
El objetivo esencial de estos métodos es obtener grupo de individuos más
homogéneos con respecto a la variable que se desea discriminar dentro de cada
grupo y muy diferentes entre los grupos.
Dependiendo de la estructura del árbol, el número de ramas que se permiten
generar a partir de cada nodo, son de dos tipos:
Árboles CART: que generan dos ramificaciones a partir de cada nodo.
Árboles CHAID: que generan dos o más ramificaciones a partir de cada nodo.
Su funcionamiento es como sigue:
A partir de una base de datos con una variable Y a discriminar, y un conjunto finito
de variables explicativas, se trata de seleccionar a las variables que mejor
discriminen a la variable Y, encontrando la mejor regla de clasificación de la
variable respuesta.
42
CRITERIO DE BÚSQUEDA PARA LAS REGLAS DE CLASIFICACIÓN
Hay diferentes formas de efectuar divisiones en función de los valores que tomen
las variables explicativas.
El método que se usará en el análisis multivariado para la selección de las
variables será el CHAID. Esta es un técnica no paramétrica de árboles de
clasificación que estudia distintas particiones seleccionando finalmente la mejor (el
óptimo). El procedimiento utiliza una tabla de contingencia para cada partición, en
la cual se estudia la dependencia de la variable objetivo en función de las
variables explicativas; la partición seleccionada será aquella que muestre una
mayor asociación con respecto a la variable objetivo; es decir, aquella que tenga el
menor valor-p al realizar la prueba chi-cuadrado. Por esto el nombre del algoritmo
CHAID de sus siglas en inglés: Chi-square Automatic Interaction Detection.
3.4 CONSTRUCIÓN DEL MODELO
Para la fase de construcción se consideran las siguientes fases:
La regresión logística
La significación del modelo y las variables
Multicolinealidad
Ajuste global del modelo
La interpretación del modelo
43
REGRESIÓN LOGÍSTICA
La ecuación de partida en los modelos de regresión logística es como sigue:
Donde:
P(y=1|X): La probabilidad de que y tome el valor 1, dado X (las covariables del
modelo).
b0: es la constante del modelo o término independiente
n: el número de covariables
bi: los coeficientes de las covariables
xi: las covariables que forman parte del modelo.
Esta se denomina regresión logística. En esta distribución, la relación entre la
probabilidad de la variable dependiente (cualitativa dicotómica) y una covariable
continua, no está definida por una recta (lo que correspondería un modelo lineal),
sino que describe una forma sigmoidea (distribución logística).
El modelo de regresión logística es un modelo estadístico en el que se desea
conocer la relación entre:
Una variable dependiente cualitativa dicotómica (regresión logística binaria
o Bernoulli) o con más de dos valores (regresión logística multinomial).
Una o más variables explicativas independientes, o covariables, ya sean
cualitativas o cuantitativas.
44
Siendo la ecuación inicial del modelo de tipo exponencial, su transformación
logarítmica (logit) permite su uso como una función lineal.
LA SIGNIFICACIÓN DEL MODELO Y LAS VARIABLES
Como se observa, las covariables pueden ser cuantitativas o cualitativas. Las
covariables cualitativas deben ser dicotómicas, tomando valores 0 para su
ausencia y 1 para su presencia (esta codificación es importante, ya que cualquier
otra codificación provocaría modificaciones en la interpretación del modelo). Pero
si la covariable cualitativa tuviera más de dos categorías, para su inclusión en el
modelo deberíamos realizar una transformación de la misma en varias covariables
cualitativas dicotómicas ficticias o de diseño (variables dummy), que para este
estudio fueron determinadas usando árboles de decisión, de forma que una de las
categorías se tomaría como categoría de referencia. Con ello cada categoría
entraría en el modelo de forma individual. También se puede crear la variable
indicadora de la presencia de un grupo de categorías del total que tiene la variable
original; por ejemplo, si una variable tiene 5 categorías puede crearse una variable
indicadora que indique la presencia de dos de las cinco categorías. En general, si
la covariable cualitativa posee n categorías, habrá que utilizar máximo n-1
covariables ficticias9.
Para la estimación de los coeficientes del modelo se recurre al cálculo de
estimaciones de verosimilitud, es decir, estimaciones que maximicen la
probabilidad de obtener los valores de la variable dependiente, dados los datos de
las covariables. Estas estimaciones no son de cálculo directo, como ocurre en el
caso de las estimaciones de los coeficientes de regresión lineal por el método de
los mínimos cuadrados. Para el cálculo de estimaciones máximo-verosímiles se
recurre a métodos iterativos, como el método de Newton-Raphson. Dado que el
9 Este procedimiento se encuentra en el documento: Modelos de Regresión Logística Incondicional; Servicio
de Medicina Interna Hospital Punta de Europa Algeciras. http://saei.org/hemero
45
cálculo es complejo, normalmente hay que recurrir al uso de rutinas de
programación o a paquetes estadísticos10.
El modelo final deberá ser probado mediante pruebas de significación del modelo
total y de cada uno de los coeficientes de cada variable.
El siguiente paso será comprobar la significación estadística del modelo en
general y cada uno de los coeficientes de regresión en el modelo.
El estadístico razón de verosimilitud: Se trata de ir contrastando cada modelo
que surge de eliminar de forma aislada cada una de las covariables frente al
modelo completo. La ausencia de significación implica que el modelo sin la
covariable no empeora respecto al modelo completo (es decir, da igual su
presencia o su ausencia), por lo que según la estrategia de obtención del modelo
más reducido, dicha covariable debe ser eliminada del modelo ya que no aporta
nada al mismo. Esta prueba no asume ninguna distribución concreta, por lo que es
la más recomendada para estudiar la significación de los coeficientes.
El resultado de la prueba del estadístico razón de verosimilitud permite probar la
hipótesis nula Ho de que todos los coeficientes del modelo son iguales a cero.
Esta se obtiene de la fórmula:
Estadístico Razón de verosimilitud=-2 [ln (Lmo) – ln (Lms)]
Donde:
ln (Lmo) es el logaritmo natural de la verosimilitud del modelo inicial (sin variables).
ln (Lms) es el logaritmo atural de la verosimilitud del modelo seleccionado.
Este estadístico sigue una distribución chi-cuadrado con p (número de variables)
grados de libertad y permite rechazar la hipótesis nula de que todos los
10
Para una presentación más detallada ver Econometría de Alfonso Novales, 1993, pag 541.
46
coeficientes son iguales a cero, si el p-valor es inferior al 0,05 (con un nivel de
significación del 5%).
!"#$%& ' ($$$)*!+#$,*$-./$012$%& 3 (
El estadístico de Wald: Contrasta la hipótesis de que un coeficiente aislado es
distinto de 0. Su valor para un coeficiente concreto viene dado por el cociente
entre el valor del coeficiente y su correspondiente error estándar, que siguen una
distribución chi-cuadrado con un grado de libertad. La obtención de significación
indica que dicho coeficiente es diferente de 0 y merece la pena su conservación
en el modelo.
!"#$%& ' ($!+#$%& 3 ( $
LA MULTICOLINEALIDAD
Se dice que existe multicolinealidad cuando dos o más de las covariables del
modelo mantienen una relación lineal.
Generalmente, siempre existe un cierto grado de multicolinealidad entre variables
explicativas en un modelo; no obstante, se intenta que la existencia de esa
multicolinealidad sea mínima de manera que no afecte mayormente en la precisión
de los estimadores de los parámetros del modelo.
Cuando la colinealidad es perfecta, es decir, cuando una covariable puede
determinarse según una ecuación lineal de una o más de las restantes
covariables, debe eliminarse la covariable que actúa como dependiente. La
presencia de variables que presentan multicolinealidad ocasionan aumentos
exagerados en lo errores estándar y del valor estimado para los coeficientes de la
regresión, lo que resulta en estimaciones pocos creíbles.
47
Un primer paso para analizar este aspecto puede ser examinar la matriz de
coeficientes de correlación entre las covariables. Coeficientes de correlación muy
elevados nos llevarán a investigar en mayor profundidad. Sin embargo este
método, bueno para detectar colinealidad entre dos covariables, puede llevar a no
poder detectar multicolinealidad entre más de dos de ellas.
Existen otros procedimientos analíticos para detectar multicolinealidad. Se puede
olvidar, por el momento, de la variable dependiente y realizar modelos en los que
una de las covariables actuará como variable dependiente y las restantes
covariables como independientes de aquella. Para cada uno de estos modelos
podemos calcularle su 45; en caso de existir colinealidad en alguna variable o
algunas variables, retirarlas de acuerdo al mayor valor de su 45.
Índice de Kaiser-Meyer-Olkin (KMO)
Otra forma de estudiar la multicolinealidad es mediante el índice Keiser-Meyer-
Olkin. Este índice permite comparar las magnitudes de los coeficientes de
correlación con las magnitudes de los coeficientes de correlación parcial. El índice
KMO se calcula:
Donde:
6&7 $28$2/$9"2:*9*2;-2$<2$9"662/.9*ó;$2;-62$/.8$=.6*.>/28$*$?$@$A* 3 @BC
8&7 $28$2/$9"2:*9*2;-2$<2$9"662/.9*ó;$D.69*./$2;-62$/.8$=.6*.>/28$*$?$@$A* 3 @BC
48
El índice KMO, que varía entre 0 y 1, se utiliza cuando se desea hacer un análisis
factorial. Un KMO bajo indica que la intercorrelación entre las variables no es
grande y por tanto no será de utilidad un análisis factorial debido a que se
necesitaría un número de factores parecido al número de variables para tener un
porcentaje aceptable de la información.
Para Keiser (1974):
KMO entre 0,9 y 1 es considerado excelente para la aplicación de un
análisis factorial, lo que implicaría multicolinealidad en el modelo de
regresión logística.
KMO entre 0,7 y 0,9 es considerado aceptable.
KMO entre 0,6 y 0,7 es considerado mediocre o regular.
KMO inferior a 0,6 es malo para aplicar un análisis factorial, lo que
significaría ausencia de multicolinealidad en las variables explicativas de
modelo de regresión logística.
AJUSTE GLOBAL DEL MODELO
Cuando se ha definido el modelo final se debe medir que tan bien se ajusta a los
datos. Se entiende que dicho modelo tiene, por el método que se haya elegido,
todas las covariables que son necesarias, una vez que se han resuelto posibles
problemas de multicolinealidad. Medir el ajuste del modelo también permitirá
comparar diferentes modelos permitiendo seleccionar el que mejor se ajuste.
Existen varias formas de medir la adecuación del modelo (pruebas de bondad de
ajuste):
PRUEBA DE HOSMER-LEMESHOW
ESTADISTICO DE KOLMOGOROV-SMIRNOV (COEFICIENTE K-S)
COEFICIENTE GINI
49
Prueba de Hosmer-Lemeshow
La prueba de Hosmer-Lemeshow agrupa a los individuos en deciles de la
probabilidad estimada; a partir de esto se construye una tabla de contingencia de
10x2 entre los deciles de la probabilidad estimada y el indicador de buenos y
malos. Por otro lado, se puede hacer la misma tabla con los valores estimados de
buenos y malos, y sobre estas dos distribuciones, de valores observados y
estimados, construirse el estadístico chi-cuadrado con el cual contrastar la
hipótesis de que las dos distribuciones son independientes con un nivel de
significación dado (0,05 en este trabajo).
Estadístico de Kolmogorov-Smirnov (Coeficiente K-S)
Otra forma de medir el ajuste del modelo es mediante las funciones de distribución
empírica de buenos y malos, en las cuales se puede observar la máxima distancia,
para determinar si son equivalentes estadísticamente. La prueba de hipótesis es la
siguiente:
!"#$E.$<*8-6*>19*ó;$<2$/"8$>12;"8$28$201*=./2;-2$.$/.$<2$/"8$F./"8!+# E.$<*8-6*>19*G;$<2$/"8$>12;"8$;"$28$201*=./2;-2$.$/.$<2$/"8$F./"8$
Se acepta o rechaza la hipótesis nula de acuerdo al valor alcanzado por la máxima
distancia entre las dos distribuciones, esta distancia será comparada con el valor
crítico de distancia máxima Dmax(n,a) con el que se aceptará o no la hipótesis
nula con nivel de significación dado a para el número de datos n.
Formalmente el estadístico K-S se calcula como sigue:
Dmax = max I Fb(x) – Fm(x)I
50
Donde:
Fb(x) es la función de distribución empírica de los buenos en el valor x.
Fm(x) es la función de distribución empírica de los malos en el valor x.
Dependiendo del área de investigación el valor de la máxima distancia entre la
distribución empírica de los buenos y la distribución empírica de malos es un valor
de aceptable discriminación.
Gráfico 3.1: FUNCIÓN DE DISTRIBUCIÓN DE BUENOS Y MALOS
Coeficiente Gini
El coeficiente de Gini se calcula sobre la curva de Lorenz, la que se explica a
continuación:
La curva de Lorenz es una forma gráfica de presentar la distribución relativa de
una variable en un dominio determinado. Por ejemplo, para nuestro estudio nos
interesa estudiar en los deciles de la variable score de victimización la distribución
acumulada del porcentaje de malos y buenos (como un punto del plano
cartesiano). Interesa que en cada decil el porcentaje de buenos acumulado vaya
aumentando mientras que en el porcentaje acumulado de malos suceda de forma
inversa. Si el porcentaje de buenos y malos no cambiaría en cada uno de los
deciles se puede decir que la variable score de victimización no discrimina a los
51
buenos y malos sino que todos estos se encuentran distribuidos en forma
equitativa. A continuación se presenta un ejemplo:
Cuadro 3.1: DISTRIBUCIÓN SCORE Y DISTRIBUCIÓN EQUITATIVA
Deciles Score Victimización
% F. acumulada Malos
% F. acumulada Buenos
% F. acumulada Malos
% F. acumulada Buenos
D1 6 2 10 10D2 19 5 20 20D3 25 8 30 30D4 33 12 40 40D5 57 25 50 50D6 68 40 60 60D7 77 55 70 70
D8 81 63 80 80D9 88 78 90 90
D10 100 100 100 100
% Distribución Score % Distribución Equitativa: Y = X
En el gráfico se puede observar la diferencia que existe entre la curva de completa
equidad y la curva de Lorenz del score de victimización.
Gráfico 3.2: CURVA DE LORENZ
0
10
20
30
40
50
60
70
80
90
100
0 10 20 30 40 50 60 70 80 90 100
% F. acumulada
Buenos
% F. acumulada Malos
CURVA DE LORENZ
% Distribución Score % Distribución Equitativa: Y = X
Mediante la construcción de la curva de Lorenz para el score de victimización en
función de los buenos y malos es posible calcular el coeficiente de Gini. Éste es
una medida de la desigualdad entre dos distribuciones. Este, a diferencia del K-S
que mide la máxima distancia entre dos distribuciones, mide el área que existe
52
entre la curva de Lorenz (de la variable objeto de estudio) y la curva de completa
equidad (no discriminativa).
Gráfico 3.3: ÁREAS CURVA DE LORENZ
El coeficiente de Gini se calcula como una razón de las áreas en el diagrama de la
curva de Lorenz. Si el área entre la línea de perfecta igualdad y la curva de Lorenz
es A, y el área por debajo de la curva de Lorenz es B, entonces el coeficiente de
Gini es A/(A+B)=2A. Esta razón se expresa como porcentaje o como equivalente
numérico de ese porcentaje, que es siempre un número entre 0 y 1. Este valor es
una medida de discriminación entre el score de victimización y la función de
equidad; mientras mayor sea su valor habrá una mayor diferencia y por ende
mayor discriminación.
LA INTERPRETACIÓN DEL MODELO
El desarrollo de un modelo de score obedece a dos posibles objetivos:
Un modelo de predicción
Un modelo de explicación
53
Para desarrollar un modelo de predicción se debe estudiar además del poder de
discriminación, su estabilidad en el transcurso del tiempo, así como el proceso,
continuo y automático en caso de ser necesario, de recolección de la información
que alimente el modelo y permita monitorearlo.
En el caso que se desee realizar un modelo de explicación se debe realizar el
análisis de discriminación del modelo antes de referenciarlo como una herramienta
de decisión para el tema objetivo en ese periodo de tiempo.
Para el presente trabajo es de interés validar la aplicabilidad de utilizar un modelo
de regresión logística, generando reglas de decisión que permitan proponer
estrategias de acción que minimicen, en la medida de lo posible, la victimización;
es decir, se trata de un modelo explicativo.
3.5 VALIDACIÓN
La validación del modelo se debe realizar en una muestra que no haya formado
parte de la muestra de desarrollo. El análisis debe contener las siguientes etapas:
Análisis de significancion de las variables.
Análisis de polaridad de las variables
Ajuste del modelo
Análisis de significación de las variables.
Utilizando tablas de contingencia se debe probar si las variables que resultaron
significativas en la fase de desarrollo lo son en la muestra de prueba; es decir, con
el estadístico chi-cuadrado se debe realizar un análisis de significación de cada
una de las variables del modelo con la variable objetivo en la muestra de prueba.
Si existen variables que son independientes de la variable objetivo se debe re-
54
hacer el modelo sin la inclusión de estas ya que no aseguran predicción ni
interpretación.
Análisis de polaridad de las variables
Aun que las variables seleccionadas en el modelo del desarrollo sean
significativas en la muestra de prueba es posible que estas no estén
correctamente polarizadas en la muestra de prueba.
La polaridad se refiere al signo positivo o negativo que acompaña al coeficiente de
cada variable. Si el signo del coeficiente es negativo quiere decir que la presencia
de esa variable penaliza la probabilidad del evento (en la regresión logística) y se
debe a que los individuos que tienen la presencia de esa variable (por ejemplo, los
jubilados), en su mayoría no muestran la presencia de la variable objetivo (no son
victimizados).
Se esperaría que la polaridad de los coeficientes de las variables en la base de
desarrollo, se mantenga en la base de prueba ya que de otro modo la variable,
que puede ser significativa en la base de desarrollo y de prueba, mostraría
inestabilidad en la predicción, siendo positiva/negativa en la base de desarrollo y
de signo opuesto en la base de prueba, por lo que también debería ser retirada del
modelo. La aplicación es de la siguiente manera:
Si el porcentaje de buenos en una muestra es de a%, una variable dicotómica
premia al modelo (coeficiente positivo en la regresión logística) si de los individuos
que presentan esta variable el b% son buenos con b%>a%. Una variable
dicotómica está alineada cuando esta relación se mantiene en la base de
desarrollo y de prueba.
El análisis expuesto en el párrafo anterior también puede realizarse con otra
medida llamada en inglés odds ratio. Para un individuo dado, se define como el
cociente entre la probabilidad de que y sea igual a 1 dado el patrón x y la
probabilidad de que ya sea igual a 0 dado x; es decir:
55
Así obtener un odds ratio de por ejemplo 1/3 se interpreta diciendo que la
probabilidad de ser bueno (y=1) es un tercio de la probabilidad de ser malo o que
la probabilidad de ser malo es tres veces mayor que la probabilidad de ser bueno
(dado el patrón x).
Para comprobar que la polaridad de las variables tenga sentido con el signo de los
coeficientes en la base de prueba se compara el odds ratio de cada variable con el
odds ratio de esa misma muestra, esperando que si el coeficiente de una variable
premia la probabilidad de evento (es positivo) entonces el odds de esa variable
sea mayor al odds de la muestra.
3.6 APLICACIÓN
ANÁLISIS DE LA INFORMACIÓN
Como se explicó en la sección tres de este capítulo, no se tienen valores en
blanco a excepción de la variable tipo de trabajo que tenía un porcentaje
significativo de valores en blanco (mayor al 5%) que no se consideró para el
desarrollo del modelo.
El análisis exploratorio de cada una de las variables se muestra a continuación:
56
Cuadro 3.2: ANÁLISIS EXPLORATORIO
VARIABLE DESCRIPCIÓN Validos Perdidos Tipo VariableCategorías
RepresentativasCategorías poco Representativas
ProvinciaIndica la provincia del individuo 23.641 - Nominal Pichincha, Guayaquil
Todas excepto Pichincha, Guayas
Datos demográficos - SexoIndica el género del individuo 23.641 - Nominal
Todas: masculino, femenino
Datos demográficos - Años Indica la edad en años del individuo 23.641 - Continua Media: 38,5 años
Datos educativos - Nivel de Instrucción
Indica el nivel de instrucción del individuo 23.641 - Nominal
Primaria; Secundaria; Sup. Universitaria; Educ. Media Todas no Representativas
Datos educativos - Estado Indica el estado civil del individuo 23.641 - Nominal Casado, Soltero DivorciadoDatos económicos - Trabajo Indica el tipo de actividad que realiza 23.641 - Nominal
Trabajo, Estudiante, ama de casa
Rentista, Jubilado, Incapacitado
Proporción de personas que trabajan en la familia
Es el cociente entre las personas que trabajan y el total de integrantes de la familia 23.641 - Continua Media: 130,12 USD
Personas por dormitorio Es el cociente entre las personas y el número de cuartos en la vivienda 23.641 - Continua Media: 1,97
Pobreza (CCA)Indica si el individuo es pobre de acuerdo al Criterio de la Comunidad Andina 23.641 - Nominal No es representativa No es representativa
Pobreza Extrema (CCA)Indica si el individuo es pobre extremo de acuerdo al CCA 23.641 - Nominal No es representativa No es representativa
Proporción de trabajadores por cantón
Es el cociente entre trabajadores y el total de individuos en el cantón 23.641 - Continua Media: 0,539
Área RuralIndica el área en que vive el individuo 23.641 - Nominal
Todas Significativas: Rural / Urbana
Existen variables indicadoras como la pobreza que no son representativas y que
por tal razón no son consideradas en el modelo. La variable provincia tiene a la
mayoría de categorías provincias no representativas; es decir contienen menos del
5% de la población. Estas categorías no representativas de esta variable, así
como de otras serán agrupadas utilizando árboles de decisión.
ANÁLISIS MULTIVARIADO
Se generaron árboles de decisión para obtener la mejor segmentación que cada
una de las variables debería considerar para la discriminación de la victimización.
En este análisis se incorporó también el análisis de conjunto de dos variables
combinadas.
57
La variable objetivo sobre la cual se realizará las particiones es el indicador de
victimización de personas, para el cual se definió como bueno al individuo que es
victimizado y malo al que no lo es. Considerando esta variable en el nodo inicial el
algoritmo CHAID selecciona las variables más significativas para la discriminación
de la variable objetivo.
Cuadro 3.3: CHÍ-CUADRADO VARIABLES ANSWER TREE
La clasificación que presenta el cuadro de arriba muestra las variables ordenadas
de acuerdo al valor estadístico chi-cuadrado, estadístico que mide la dependencia
de cada una de las variables con la variable objetivo. Se puede observar que la
variable que más discrimina la victimización es la provincia, después la variable
que más discrimina es la variable nivel de instrucción y así sucesivamente11. Es
importante saber que el nivel de discriminación de cada una de las variables sobre
la variable objetivo considera una relación directa, es decir no considera variables
combinadas por lo que este análisis muestra cuáles son las variables originales
simples más significativas para el análisis. Una vez conocida la importancia de
cada una de las variables será necesario realizar árboles de variables combinadas
que pueden mostrar otras relaciones que el análisis con variables simples no lo
hace, alcanzando mayores niveles de discriminación e interpretación. 11
La variable con mayor chi!cuadrado tiene mayor relación con la variable dependiente.
58
Este análisis es realizado en el paquete estadístico Answer tree 3.1. También
puede efectuarse en el SPSS 15.0, con la dificultad que este programa no muestra
la clasificación ranqueada de todas las variables por lo que se debe realizar el
análisis generando el árbol para cada variable y posteriormente comparar su chi-
cuadrado, mientras que el Answer tree 3.1 lo realiza automáticamente (es un es
un programa especializado y específico para el uso de árboles de decisión).
Las variables que resultaron significativas después de este análisis son:
1. Categoría Victimización por Provincia
2. Categoría Victimización por Pobreza (Directa)
3. Categoría Victimización por Nivel de Instrucción
4. Categoría Victimización por Ingreso Per cápita
5. Categoría Victimización por Parentesco con el Padre
6. Categoría Victimización Porcentaje que trabajan por Cantón
7. Categoría Victimización por Rango de Edad
8. Categoría Victimización por Género
9. Categoría Victimización por Edad y Sexo
10. Categoría Victimización Instrucción y Edad
11. Categoría Victimización por Área
Por ejemplo para la variable Categoría Victimización por Provincia se desarrolló el
siguiente análisis:
59
Gráfico 3.4: ÁRBOL DE DECISIÓN POR PROVINCIA
Se generó el árbol de decisión entre la variable dependiente Victimización y la
variable Provincia.
60
Con base a este árbol se construyó la variable categórica para la variable
Provincia.
Categoría Victimización por Provincia
Esta variable presenta las siguientes Categorías:
Cuadro 3.4: ÁRBOL GENERADO POR PROVINCIA
Categoría Victimización por ProvinciaCHIMBORAZO; LOJA; EL ORO
PICHINCHA; GUAYASAZUAY; IMBABURA; ZAMORA
CARCHI; MANABÍ; MORONA S; NAPO; ORELLANA; STO DOMINGO; STA ELENACOTOPAXI; LOS RÍOS
ESMERALDAS; TUNGURAHUA;SUCUMBÍOSOTROS
Para Cada una de estas categorías se generó una variable dicotómica para
incluirlas en el modelo a excepción de una, la que presente menor discriminación
en el árbol:
V1: Si el individuo vive en una de las siguientes provincias: Chimborazo, Loja, El Oro.
V2: Si el individuo vive en una de las siguientes provincias: Pichincha, Guayas.
V3: Si el individuo vive en una de las siguientes provincias: Azuay, Imbabura, Zamora
V4: Si el individuo vive en una de las siguientes provincias: Carchi, Manabí, Morona Santiago, Napo, Orellana, Sto Domingo
V5: Si el individuo vive en una de las siguientes provincias: Cotopaxi, Los Ríos
61
V6: Si el individuo vive en una de las siguientes provincias: Esmeraldas, Tungurahua, Sucumbíos
Este proceso se desarrolló para todas las variables originales arriba mencionadas
y se las ingresó para el desarrollo del modelo. La agrupación realizada para cada
una de las variables es12:
Cuadro 3.5: ÁRBOL GENERADO POR NIVEL DE INSTRUCCIÓN
Categoría Victimización por Nivel de InstrucciónPRIMARIA; OTROS
SECUNDARIANINGUNOSUPERIOR
Cuadro 3.6: ÁRBOL GENERADO POR INGRESO PERCÁPITA
Categoría Victimización por PercapitaING PER CAPITA <=60ING PERCAPITA > 60
Cuadro 3.7: ÁRBOL GENERADO POR PARENTEZCO CON JEFE DE HOGAR
Categoría Victimización por ParentezcoPADRES; SUEGROS; OTROS NO PARIENTES
JEFE; NIETO NIETO/ACONYUGE; EMPLEADA; YERNA O NUERA
OTROS PARIENTES; HIJO/A
Cuadro 3.8: ÁRBOL GENERADO POR PORCENTAJE DE PERSONAS QUE TRABAJA POR CANTON
Categoría Victimización Porcentaje que trabajan por CantónMENOR O IGUAL A 48%
MAYOR A 48% Y MENOR A 57%IGUAL AL 57%
MAYOR A 57% Y MENOR O IGUAL A 59%MAYOR A 59%
12
Al igual que en la Provincia se generaron variables dicotómicas para las categorías de cada variable
definidas por lo árboles de decisión. Estos se muestran en el Anexo 1.
62
Cuadro 3.9: ÁRBOL GENERADO POR EDAD
Categoría Victimización por Rango de Edad<= 18 AÑOS
MAYOR A 18 AÑOS Y MENOR O IGUAL A 35MAYOR A 35 Y MENOR O IGUAL A 53 AÑOSMAYOR A 53 Y MENOR O IGUAL A 63 AÑOS
MAYOR A 63 AÑOS
Cuadro 3.10: ÁRBOL GENERADO POR INSTRUCCIÓN Y EDAD
Categoría Victimización Instrucción EdadSUPERIOR MENOR A 35 AÑOSSUPERIOR MAYOR A 35 AÑOS
OTROS
Cuadro 3.11: ÁRBOL GENERADO POR ÁREA
Categoría Victimización por AreaAREA URBANAAREA RURAL
En el cuadro de abajo se puede observar como la combinación de variables aumenta los niveles de discriminación.
Cuadro 3.12: CHI-CUADRADO VARIABLES ANSWER TREE
63
Observe que la combinación de la variable nivel de instrucción y edad alcanza un
valor chi-cuadrado mayor al de las variables solas; en este caso, el nivel de
educación alcanza el siguiente lugar (tercero) mientras que la edad sola se
encuentra en quinto lugar. La asociación que tienen las variables combinadas con
la variable objetivo muestra una perspectiva diferente al de las variables simples.
CONSTRUCCIÓN DEL MODELO
El modelo fue desarrollado con regresión logística, en el cual se desea estimar la
probabilidad de ser victimizado. Las variables dicotómicas que se seleccionaron
son:
Cuadro 3.13: VARIABLES SELECCIONADAS EN EL MODELO
Variable Descripción Tipo VariableV_2 Provincia: Pichincha Guayas Indicadora (1/0)V_3 Provincia: Azuay Imbabura, Zamora Indicadora (1/0)V_4 Provincia: Bolívar Cañar Pastza Indicadora (1/0)
V_5Provincia: Carchi Manabí; Moro. Sant; Napo; Orellano; Sto. Dom. Tsáchilas; Sta. Elena
Indicadora (1/0)
V_6 Provincia: Coptopaxi, Los Ríos Indicadora (1/0)V_20 Edad mayor a 63 años Indicadora (1/0)V_28 Mujer entre 18 y 35 años Indicadora (1/0)V_30 Educación Superior menor a 35 años Indicadora (1/0)V_31 Area Rural Indicadora (1/0)P3_3 Edad Continua
SIGNIFICACIÓN DEL MODELO Y DE LAS VARIABLES
Una vez consideradas todas las variables originales y transformadas en variables
dicotómicas, se aplicó el método de máxima verosimilitud para la estimación del
modelo con pasos hacia delante, que va seleccionando las variables más
significativas hasta no tener ninguna con un p-valor menor a 0,05. Por cada
inclusión de una variable se calcula la verosimilitud del modelo con la nueva
variable.
64
Cuadro 3.14: RESUMEN DEL MODELO
RESUMEN DEL MODELO
10068,822a ,007 ,015
9913,565a ,016 ,035
9825,450a ,021 ,047
9751,042b ,026 ,056
9707,472b ,028 ,062
9683,339b ,030 ,065
9659,800b ,031 ,068
9630,283b ,033 ,072
9623,534b ,033 ,072
9619,372b ,034 ,073
Step1
2
3
4
5
6
7
8
9
10
-2 Loglikelihood
Cox & SnellR
CuadradoNagelkerkeR Cuadrado
La estimacion terminó en la iteración numero 5porque los parámetros cambiaron en menos de 0,001
a.
La estimacion terminó en la iteración numero 5porque los parámetros cambiaron en menos de 0,001
b.
El estadístico de razón de verosimilitud se calcula para el último paso con el que se contrastará la hipótesis de que el modelo no es significativo mediante la diferencia de la verosimilitud inicial y final.
Verosimilitud del modelo inicial: Lo=10.183,977
Verosimilitud del modelo final: Lf=9.619,372
4.HG;$<2$I26"8*F*/*-1< ' $ JK LM NOPOQR ' STUVT(S$$$9";$W($X6.<"8$<2$/*>26-.<
Esto se muestra en el siguiente cuadro:
65
Cuadro 3.15: PRUEBA OMNIBUS DE LOS COEFICIENTES
Prueba Omnibus para los Coeficientes
115,155 1 ,000
115,155 1 ,000
115,155 1 ,000
155,257 1 ,000
270,412 2 ,000
270,412 2 ,000
88,115 1 ,000
358,527 3 ,000
358,527 3 ,000
74,408 1 ,000
432,934 4 ,000
432,934 4 ,000
43,570 1 ,000
476,505 5 ,000
476,505 5 ,000
24,133 1 ,000
500,638 6 ,000
500,638 6 ,000
23,539 1 ,000
524,177 7 ,000
524,177 7 ,000
29,516 1 ,000
553,693 8 ,000
553,693 8 ,000
6,749 1 ,009
560,443 9 ,000
560,443 9 ,000
4,162 1 ,041
564,605 10 ,000
564,605 10 ,000
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Paso 1
Paso 2
Paso 3
Paso 4
Paso 5
Paso 6
Paso 7
Paso 8
Paso 9
Paso10
Chi-square df Sig.
Con este valor de chi-cuadrado (564,605) se rechaza la hipótesis nula de que todos los coeficientes del modelo son iguales a cero con un nivel de significación =0,05.
Significancia de las variables
Con el uso del estadístico de Wald se analizó la significación de cada una de las variables.
66
Cuadro 3.16: RESUMEN VARIABLES SELECCIONADAS
Variable Descripción B S.E. Wald df Sig. Exp(B)V_2 Provincia: Pichincha Guayas 0,42 0,07 31,48 1,00 0,00 1,52V_3 Provincia: Azuay Imbabura, Zamor -0,69 0,11 37,61 1,00 0,00 0,50V_4 Provincia: Bolívar Cañar Pastza -1,36 0,15 84,15 1,00 0,00 0,26
V_5Provincia: Carchi Manabí; Moro. Sant; Napo; Orellano; Sto. Dom. Tsáchilas; Sta. Elena -0,43 0,08 28,15 1,00 0,00 0,65
V_6 Provincia: Coptopaxi, Los Ríos 0,72 0,09 62,85 1,00 0,00 2,06V_20 Edad mayor a 63 años -0,49 0,16 9,61 1,00 0,00 0,61V_28 Mujer entre 18 y 35 años -0,19 0,09 4,07 1,00 0,04 0,83V_30 Superior menor a 35 años 0,34 0,07 22,25 1,00 0,00 1,40V_31 Area Rural -0,57 0,11 27,32 1,00 0,00 0,57P3_3 Edad -0,01 0,00 9,05 1,00 0,00 0,99Constant -1,85 0,10 318,44 1,00 0,00 0,16
Como se observa en el cuadro precedente todos los coeficientes de las variables
seleccionadas son estadísticamente diferentes de cero con nivel de significación
menor del 0,05.
MULTICOLINEALIDAD
Kayser - Meyer - OlkinKaiser-Meyer-Olkin
Measure of Sampling 0,308
Para este análisis se obtuvo un KMO menor a 0,4 por lo que se concluye que la
multicolinealidad es baja y no es un problema para la construcción del modelo.
67
AJUSTE GLOBAL DEL MODELO
Distribución de Buenos y Malos
Cuadro 3.17: DISTRIBUCIÓN DE BUENOS Y MALOS
DECILESFrecuencia
% NO VICTIMIZADOS
% Acum. No Victimizados
Frecuencia%
VICTIMIZADOS% Acum.
Victimizados
1 1627 10,8% 10,8% 37 2,42% 2,4% 0,08 44
2 1578 10,5% 21,4% 53 3,47% 5,9% 0,15 30 3 1582 10,5% 31,9% 86 5,63% 11,5% 0,20 18 4 1491 9,9% 41,8% 106 6,94% 18,5% 0,23 14 5 1535 10,2% 52,1% 106 6,94% 25,4% 0,27 14 6 1544 10,3% 62,3% 148 9,69% 35,1% 0,27 10 7 1513 10,1% 72,4% 155 10,15% 45,3% 0,27 10 8 1454 9,7% 82,1% 200 13,10% 58,3% 0,24 7 9 1374 9,2% 91,3% 278 18,21% 76,6% 0,15 5
10 1312 8,7% 100,0% 358 23,44% 100,0% - 4 Total 15010 100,0% 1527 100,00% 10
ODDS
DISTRIBUCIÓN BUENOS VS MALOSNO VICTIMIZADOS VICTIMIZADOS
KS
Para medir el nivel de discriminación del modelo se divide la muestra de desarrollo
en deciles y esta a su vez en dos grupos; en buenos, que para el estudio son los
victimizados, y en malos o sea los no victimizados.
Mediante la división de los dos grupos se observa la distribución en cada uno de
ellos en los deciles; se espera, como en efecto sucede, que para mayores deciles
el porcentaje relativo de victimizados aumente mientras que disminuya para los no
victimizados.
Gráfico 3.5: DISTRIBUCIÓN BUENOS Y MALOS
5!
10!
15!
20!
25!
30!
35!
40!
45!
50!
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
1 2 3 4 5 6 7 8 9 10
DISTRIBUCIÓN BUENOS / MALOS
%!NO!VICTIMIZADOS %!VICTIMIZADOS ODDS
68
El porcentaje de victimizados comienza en el primer decil con 2,4% y aumenta a
medida que crece el grupo decil, terminando en el último, con 23,44%, mostrando
así un correcto ordenamiento. En los odds se puede observar que para el primer
decil se tiene 44 no victimizados por cada victimizado, mientras que en el último la
relación es de cuatro a uno.
Prueba de Hosmer y Lemeshow
La medida de ajuste global del modelo se calcula por el valor chi-cuadrado
obtenido entre los valores observados y esperados en la muestra de desarrollo. La
hipótesis a contrastar es que las distribuciones observada y esperada no son
diferentes estadísticamente.
Cuadro 3.18: PRUEBA DE HOSMER LEMESHOW
Prueba de Hosmer y Lemeshow
,000 0 .
,000 1 1,000
4,679 8 ,791
8,771 8 ,362
4,329 8 ,826
3,927 8 ,864
4,400 8 ,819
4,402 8 ,819
12,822 8 ,118
10,416 8 ,237
Step1
2
3
4
5
6
7
8
9
10
Chi-square df Sig.
El valor observado chi-cuadrado es de 10,416, que proporciona un p-valor de
0,237, lo que lleva a aceptar la hipótesis nula de que las distribuciones no son
diferentes estadísticamente. Abajo se presenta la tabla de contingencia:
69
Cuadro 3.19: TABLA DE CONTINGENCIA DE HOSMER LEMESHOW
Estadístico Kolmogorov-Smirnov (estadístico K-S)
En el estadístico de Kolmogorov-Smirnov se contrastó la hipótesis de que las
distribuciónes de buenos y malos siguen distribuciones iguales sobre la variable
de Score.
Cuadro 3.20: PRUEBA DE KOLMOGOROV SMIRNOV
Prueba Kolmogorov - Smirnova
,266
,266
,000
9,902
,000
Absolute
Positive
Negative
Most ExtremeDifferences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Score_Mod2
Grouping Variable: Índice de victimización a personasa.
Con un nivel de significación de 0,05 rechazamos la hipótesis de que las
distribuciones de buenos y malos son equivalentes.
70
Gráfico 3.6: DISTRIBUCIÓN K-S
El KS del modelo alcanza una máxima distancia de 0,27, estadístico con el cual se
rechazó la hipótesis de que la distribución de victimizados y no victimizados son
equivalentes.
Coeficiente de Gini
Se calcula el coeficiente de Gini que es el área expresada en porcentaje que
existe entre la función del score de victimización y la función de igualdad, que no
discrimina a buenos y malos.
Cuadro 3.21: DISTRIBUCIÓN PARA CÁLCULO DE GINI
DECILES % NO % Acum. No % Acum. GINI % % Acum. % Acum. GINI 1 10,8% 10,8% 10,8% 2,42% 2,4% 2,4% 0,26%2 10,5% 21,4% 10,5% 3,47% 5,9% 8,3% 0,87%3 10,5% 31,9% 10,5% 5,63% 11,5% 17,4% 1,84%4 9,9% 41,8% 9,9% 6,94% 18,5% 30,0% 2,98%5 10,2% 52,1% 10,2% 6,94% 25,4% 43,9% 4,49%6 10,3% 62,3% 10,3% 9,69% 35,1% 60,5% 6,22%7 10,1% 72,4% 10,1% 10,15% 45,3% 80,4% 8,10%8 9,7% 82,1% 9,7% 13,10% 58,3% 103,6% 10,04%9 9,2% 91,3% 9,2% 18,21% 76,6% 134,9% 12,35%
10 8,7% 100,0% 8,7% 23,44% 100,0% 176,6% 15,43%Total
general 100,0% 100,00% 37,42%
DISTRIBUCIÓN BUENOS VS MALOSNO VICTIMIZADOS VICTIMIZADOS
GINI
71
El coeficiente de GINI alcanza un área de discriminación de 37,42%.
Este coeficiente al igual que el estadístico de Kolmogorov-Smirnov nos dará
medidas de discriminación del modelo en área (Gini) y en Distancia (K-S) con la
cual compararemos la muestra de prueba.
VALIDACIÓN DEL MODELO
Una vez definido el modelo final se realiza la validación del mismo, con base en la
muestra de prueba. Esta se seleccionó como un 30% de la base original, de
manera aleatoria, y no fue utilizada para establecer el modelo.
ANÁLISIS ESTADÍSTICO
Es indispensable evaluar la consistencia de cada una de las variables para lo cual
se realiza el análisis estadístico de cada una de ellas:
Cuadro 3.22: ANÁLISIS ESTADÍSTICO VARIABLES EN EL MODELO
NO VICTIMIZADOS VICTIMIZADOS ODDS6422 682 0,11
Variable Descripción B Exp(B) SIG TEST VICTIMIZADOSNO
VICTIMIZADOS ODDS RELEVANCIAV_2 Provincia: Pichincha Guayas 0,418 1,519 0.000 205 1150 0,178 19%V_3 Provincia: Azuay Imbabura, Zamora -0,691 0,501 0.000 43 745 0,058 11%V_4 Provincia: Bolívar Cañar Pastza -1,359 0,257 0.000 16 785 0,020 11%
V_5Provincia: Carchi Manabí; Moro. Sant; Napo; Orellano; Sto. Dom. Tsachilas; Sta. Elena
-0,428 0,652 0.039 163 1772 0,092 27%
V_6 Provincia: Coptopaxi, Los Ríos 0,721 2,057 0.000 82 422 0,194 7%V_20 Edad mayor a 63 años -0,493 0,611 0.003 50 712 0,070 11%V_28 Mujer entre 18 y 35 años -0,189 0,828 0.000 60 1045 0,057 16%V_30 Educación Superior menor a 35 años 0,338 1,402 0.000 156 936 0,167 15%V_31 Indicador Area Rural -0,569 0,566 0.000 46 773 0,060 12%P3_3 Edad -0,008 0,992
72
Significación de las variables
Para cada una de las variables artificiales (dummy) seleccionadas se realiza un
análisis de correspondencia entre la variable independiente y la variable
dependiente para la muestra de prueba. En esta etapa de la modelación se
encontraron variables dummy que aunque fueron seleccionadas en el desarrollo
del modelo no resultaron ser significativas, a partir de las pruebas de hipótesis
correspondientes, por lo que considerarlas ocasionaría un error de estimación y de
interpretación del score de victimización; por esta razón se volvió a la fase de
desarrollo en la cual se retiró dicha variable y así hasta llegar al modelo final. Se
seleccionaron solamente las variables dummy que resultaron significativas en la
muestra de prueba. Adicionalmente, se validó que las variables seleccionadas
sean representativas; es decir, que contengan al menos el 5% de la muestra de
prueba.
Polaridad de las variables
Una vez que las variables significativas sean seleccionadas puede ser que no
estén correctamente polarizadas en la muestra de prueba; es decir, se desea ver
las variables que en el modelo tengan coeficientes positivos tengan odds mayores
al odds de la muestra de prueba y si tienen coeficiente negativo tengan odds
menores al odds de la muestra de prueba. Que el odds de la variable explicativa
en la muestra de prueba no tenga relación con el signo del coeficiente indicaría
que aunque la variable sea significativa para explicar la variable objetivo en las
dos muestras, de desarrollo y de prueba, el sentido en que la variable explica es
opuesto en cada una de ellas, por lo que la variable podría considerarse como
inestable y debería ser retirada del modelo.
En la base de prueba se puede observar que todas las variables están alineadas;
es decir, la relación del odds de cada variable con el odds de la muestra tiene
relación con el signo del coeficiente de cada variable.
73
Para llegar a este resultado se realizaron varios modelos en los cuales se fueron
excluyendo variables que resultaron significativas pero no estaban alineadas en la
base de prueba.
Luego de realizar las pruebas respectivas de significación y polaridad de las
variables13, entre modelos obtenidos con la muestra de desarrollo y con la
muestra de prueba, se retuvieron las variables que se muestran en el cuadro
precedente y que conforman el modelo final.
AJUSTE DEL MODELO
Una vez que el modelo seleccionado considera variables significativas y alineadas
en la muestra de prueba, se debe medir como se ajusta el modelo a la muestra de
prueba estableciendo este como el escenario más probable de discriminación.
Distribución de Buenos y Malos
Cuadro 3.23: ANÁLISIS DE DISCRIMINACIÓN K-S Y ODDS
DECILESFrecuencia
% NO VICTIMIZADOS
% Acum. No Victimizados
Frecuencia%
VICTIMIZADOS% Acum.
Victimizados
1 696 10,8% 10,8% 14 2,05% 2,1% 0,09 50 2 677 10,5% 21,4% 33 4,84% 6,9% 0,14 21 3 667 10,4% 31,8% 43 6,30% 13,2% 0,19 16 4 654 10,2% 41,9% 47 6,89% 20,1% 0,22 14 5 631 9,8% 51,8% 77 11,29% 31,4% 0,20 8 6 645 10,0% 61,8% 63 9,24% 40,6% 0,21 10 7 660 10,3% 72,1% 66 9,68% 50,3% 0,22 10 8 622 9,7% 81,8% 88 12,90% 63,2% 0,19 7 9 609 9,5% 91,3% 106 15,54% 78,7% 0,13 6
10 561 8,7% 100,0% 145 21,26% 100,0% - 4 Total 6422 100,0% 682 100,00% 9
ODDS
DISTRIBUCIÓN BUENOS VS MALOSNO VICTIMIZADOS VICTIMIZADOS
KS
13
!Detalles!de!este!análisis!se!muetran!en!el!Anexo!2.!
74
Gráfico 3.7: ODDS - DISTRIBUCIÓN DE BUENOS Y MALOS
10!
20!
30!
40!
50!
60!
0,0%
5,0%
10,0%
15,0%
20,0%
25,0%
1 2 3 4 5 6 7 8 9 10
ODDS ! DISTRIBUCIÓN BUENOS / MALOS
%!NO!VICTIMIZADOS %!VICTIMIZADOS ODDS
En la distribución de buenos y malos para cada uno de los deciles se observa que
el modelo ordena bien a los buenos y malos en la muestra de prueba, pues a
mayores deciles corresponden un mayor porcentaje de victimizados.
Estadísticos de Kolmogorov - Smirnov
Al igual que en la muestra de desarrollo se prueba si las distribuciones de buenos
y malos no son equivalentes en la muestra de prueba.
Cuadro 3.24: PRUEBA DE KOLMOGOROV - SMIRNOV
Prueba Kolmogorov-Smirnova
,223
,223
,000
5,538
,000
Absolute
Positive
Negative
Most ExtremeDifferences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
Score_Mod2
Grouping Variable: Índice de victimización a personasa.
75
Con una significancia menor a 0.05 rechazamos la hipótesis nula de que las
distribuciones de buenos y malos sean equivalentes por lo que el modelo
discrimina las distribuciones de buenos y malos en la muestra de prueba. La
distancia máxima entre la distribución de buenos y malos fue de 0,223, muy
cercana a la obtenida en la muestra de desarrollo: 0,266. Es normal que la
discriminación disminuya en las muestras de prueba ya que son más pequeñas
que las bases de desarrollo.
Coeficiente de Gini
El coeficiente de Gini, como se ha mencionado anteriormente, mide el área entre
dos distribuciones, la de equidad o no discriminativa y la distribución objeto de
estudio.
Cuadro 3.25: DISTRIBUCIÓN PARA CÁLCULO DE GINI
El coeficiente de GINI es de 31,66% menor al de desarrollo 37,42%, pero no muy
diferente de ésta.
Una vez aprobadas todas las pruebas estadísticas aplicadas al modelo, se
procede a utilizarlo para la creación de perfiles de victimización a nivel nacional.
76
INTERPRETACIÓN DEL MODELO
Como se mencionó anteriormente, un modelo de regresión logística obedece a
dos posibles objetivos: la interpretación y la predicción. En este estudio,
considerando que la información fue obtenida mediante una encuesta,
fundamentalmente con datos cualitativos, se ha puesto énfasis en la
interpretación, buscando así encontrar patrones que permitan focalizar y
diferenciar la gestión de acuerdo a la exposición a la victimización.
Para encontrar los perfiles de acuerdo a la exposición a la victimización
cuantificada en el modelo de score14, presentado en una escala de cero a mil, es
importante estudiar la incidencia de cada una de las variables del modelo en
diferentes grupos de victimización.
Se ha dividido la muestra de prueba en quintiles sobre la cual se definirán
perfiles15:
Cuadro 3.26: DISTRIBUCIÓN SCORE POR QUINTILES
Rango Puntaje Score % No Victimizado % VicitimizadoQUINTIL 1 - 46,10 96,69% 3,31%QUINTIL 2 46,11 - 70,62 93,62% 6,38%QUINTIL 3 70,63 - 97,71 90,11% 9,89%QUINTIL 4 97,72 - 143,80 89,28% 10,72%QUINTIL 5 143,81 - 82,34% 17,66%
A partir del porcentaje de victimizados para cada quintil, se observa que los
quintiles uno y dos, entre 0 y 70,62 puntos en el puntaje score, tienen un nivel de
victimización menor a 7%; los quintiles 2 y 3, entre 70,63 y 97,71 puntos en el
puntaje score, tienen un porcentaje de victimización similar, alrededor del 10%, y
el último quintil, mayor o igual a 143,81 puntos en el puntaje score, tiene el
porcentaje de victimización más alto con el 17,66%. En función del porcentaje de
victimización de cada quintil se han agrupado a los quintiles uno con el dos y el
14
!Un!modelo!de!score!presenta!la!probabilidad!generalmente!en!una!escala!de!0!a!1000!y!no!de!0!a!1.!15
!Se!generan!estrategias! sobre! la!muestra!de!prueba!ya!que! se! considera!a!esta! como!el!escenario!más!probable!y!pesimista!al!no!formar!parte!de!la!muestra!de!construcción!del!modelo.!!
77
tres con cuatro, obteniendo los siguientes perfiles referenciados por el puntaje de
score.
Cuadro 3.27: PERFILES DEFINIDOS POR PUNTAJE DE SCORE
Rango Puntaje Score % No Victimizado % VicitimizadoGRUPO 1 - 70,6 95,16% 4,84%GRUPO 2 70,9 - 143, 89,69% 10,31%GRUPO 3 144, - 82,34% 17,66%
Para definir el perfil de cada grupo se estudia la incidencia de cada una de las
variables en el mismo; para esto, se considera la matriz de frecuencias entre los
grupos y las variables seleccionadas en el modelo:
Cuadro 3.28: FRECUENCIAS VARIABLES POR GRUPO PERFIL
V2 V3 V4 V5 V6 V20 V28 V30 V31 TOTALGRUPO 1 37 670 801 1010 10 584 673 166 643 2831GRUPO 2 567 118 925 111 178 385 362 172 2852GRUPO 3 751 383 47 564 4 1421TOTAL 1355 788 801 1935 504 762 1105 1092 819 7104
Cuadro 3.29: PORCENTAJE DE INCIDENCIA DE VARIABLES POR GRUPO PERFIL
V2 V3 V4 V5 V6 V20 V28 V30 V31GRUPO 1 1% 24% 28% 36% 0% 21% 24% 6% 23%GRUPO 2 20% 4% 0% 32% 4% 6% 13% 13% 6%GRUPO 3 53% 0% 0% 0% 27% 0% 3% 40% 0%TOTAL 19% 11% 11% 27% 7% 11% 16% 15% 12%
Observando los perfiles de cada grupo y comparando la incidencia que tiene cada
variable entre el grupo y la población, se establecen los perfiles de cada grupo.
78
Cuadro 3.30: DESCRIPCIÓN DE GRUPO PERFIL
PERFIL VARIABLEPichincha, GuayaquilCotopaxi, Los Ríos
Educación y edad: Educación Superior y edad menor a 35 años
Provincia:
Azuay, Imbabura, ZamoraBolívar, Cañar, Pastza
Edad Edad mayor a 63 añosEdad y Género Mujer entre 18 y 35 añosArea Area Rural
DETALLE
GRUPO 3
GRUPO 2
Provincia:
Provincia-Edad-Género
Provincias:Carchi Manabí; Moro. Sant; Napo; Orellano; Sto. Dom. Tsáchilas; Sta. Elena
GRUPO 1
Provoncia:
Si son de las provincias del grupo 3 son de la tercera edad o mujeres entre 18 y 35 años
Como se puede observar, las variables seleccionadas por el modelo son la
provincia, el área rural o urbana, edad y género. La provincia resultó ser la más
importante, contribuyendo casi con todas sus variables indicadoras, mientras que
las demás contribuyen con el modelo con una de sus variables indicadoras
representando solo una parte de la variable original. Este hecho se presenta
debido a que al realizarse un score de victimización a nivel nacional, las variables
seleccionadas son aquellas estadísticamente significativas a nivel nacional; por
tanto, la variable provincia es la más importante pues la realidad socio-económica
de cada provincia es diferente. Se debería realizar un análisis como el presentado
en este capítulo para las provincias grandes, de manera que se puedan evidenciar
factores socioeconómicos más específicos que discriminen el tipo de victimización
por lugar, edad, género o situación económica, que permitan definir acciones
específicas propias de cada provincia.
El modelo de este capítulo, como se ha visto en las páginas anteriores, ordena y
discrimina la victimización considerando la información más relevante a nivel
nacional; de este modo el grupo tres tiene el mayor riesgo de victimización, en el
cual se evidencia que las personas de educación superior y de edad menor a 35
años tienen un grado de exposición o preferencia por parte de la delincuencia
79
superior al resto de la población. Las provincias de Pichincha y Guayas, las dos
más grandes del Ecuador, se encuentran en el grupo de mayor riesgo de
victimización. A continuación se describe un detalle de cada grupo:
GRUPO 1:
El grupo uno está conformado por tres subgrupos: el primero, los individuos de las
provincias de Azuay, Imbabura, Zamora, Bolívar, Cañar y Pastaza. Estas
provincias tienen porcentajes de victimización bajas, menores al 6%, en relación
con el índice de victimización nacional que es del 12,7%. En el segundo,
individuos de la tercera edad o mujeres de 18 a 35 años que pertenecen a las
provincias: Carchi, Manabí, Morona Santiago, Napo, Orellana, Santo Domingo de
los Tsáchilas y Santa Elena. Finalmente en el tercero se encuentran los individuos
que viven en áreas rurales que no son de la provincia de Pichincha y Guayas. Este
grupo tiene un índice de victimización del 4,84%, mostrando que no tiene niveles
altos de victimización. En el caso de las provincias de Carchi, Manabí, Morona
Santiago, Napo, Orellana, Santo Domingo de los Tsáchilas y Santa Elena puede
verse que el comportamiento de las mujeres e individuos de la tercera edad los
mantiene en riego de victimización bajo. Los que pertenecen a áreas rurales
mantienen un nivel bajo de victimización debido a la realidad comercial y
económica que no es tentativa para la delincuencia.
GRUPO 2:
Considera dos grupos: los que pertenecen a las provincias de: Carchi, Manabí,
Morona Santiago, Napo, Orellana, Santo Domingo de los Tsáchilas y Santa
Elena, que tienen educación superior y son menores a treinta años; el segundo
subgrupo que considera a los individuos de las provincias de Pichincha y Guayas,
que son de la tercera edad, mujeres de treinta y cinco años o viven en áreas
rurales. El porcentaje de victimización de este grupo es de 10,31%, por lo que
80
puede verse que existe una notable diferencia en la exposición al peligro en los
individuos hombres menores a treinta y cinco años, de educación superior al resto
de individuos, ya que éstos tienen aproximadamente cuatro puntos porcentuales
más de exposición a la victimización que aquellos que viven en las mismas
provincias con otras características.
GRUPO 3
El grupo 3 está conformado por tres subgrupos: el primero, que está en las
provincias de Pichincha o Guayas y no son de la tercera edad, ni viven en áreas
rurales, ni son mujeres de edad menor a 35 años; el segundo: Cotopaxi y Los
Ríos; el tercero es el conformado por los que tienen estudios superiores con edad
menor a 35 años y que no viven en las provincias agrupadas en ninguno de los
grupos antes mencionados. Pichincha y Guayas tienen un porcentaje de
victimización de 14,7%, mientras que Cotopaxi y los Ríos presentan niveles de
16,7% y 19,1%, respectivamente, siendo los más altos en todo el país.
81
CAPITULO 4
PERFILES DE VICTIMIZACIÓN
La heterogeneidad de la población constituye la materia prima de un análisis
cuantitativo y cualitativo; sin embargo, el estudio del individuo u objeto particular
aislado resulta un elemento de heterogeneidad demasiado pequeño con relación
al objetivo de análisis, por lo cual se trata entonces de agrupar a los individuos con
el objetivo de hacer el análisis sobre los grupos y no sobre cada uno de los
individuos, utilizando técnicas estadísticas adecuadas.
Las técnicas de agrupación recurren a cálculos algorítmicos que realizan
operaciones recursivas y repetitivas que pueden considerar una jerarquía en el
número de agrupaciones ascendente/descendente o considerar un número
determinado de grupos sobre el cual se hace la clasificación de cada uno de los
individuos.
En general se puede decir que para un conjunto de información para varios
individuos se puede medir la asociación que existe entre ellos a través de la
similitud o distancia que exista entre sus variables asociadas.
Para realizar un análisis de agrupamiento se debe considerar que el análisis y
resultado del modelo sirven solo para ese diseño y que éste se caracteriza por la
elección de individuos, las variables utilizadas, criterio de asociación utilizado y
nivel de agrupación elegido; todas las especificidades definen diferentes
soluciones y, por tanto, la solución final depende del interés particular del
investigador.
Los análisis discriminante y de agrupación son diferentes, pues el primero intenta
explicar una estructura definida a priori mientras el segundo intenta determinarla.
82
En el presente capítulo se intenta encontrar conglomerados para las ciudades de
Quito y Guayaquil, que permitan identificar localmente perfiles de exposición a la
victimización sin considerar alguna estructura a-priori.
Adicionalmente, al análisis de conglomerados, se estudiará la victimización en
hogares y la relación que ésta pueda tener con la victimización a personas.
Como una aproximación a las ciudades de Quito y Guayaquil se han considerado
las cabeceras cantonales de estas ciudades, de acuerdo a la división política-
administrativa que entrega el INEC.
ETAPAS DE DESARROLLO PARA UN ANÁLISIS DE AGRUPAMIENTO
1. SELECCIÓN!DE!LA!MUESTRA!DE!DATOS!
2. SELECCIÓN!Y!TRANSFORMACIÓN!DE!LAS!VARIABLES!A!UTILIZAR!
3. SELECCIÓN!DE!DISTANCIA!O!SIMILITUD!Y!CÁLCULO!DE!LA!MISMA!
4. SELECCIÓN!DEL!CRITERIO!DE!AGRUPACIÓN!
5. DETERMINACIÓN!DE!LA!ESTRUCTURA!CORRECTA!
!
1. SELECCIÓN DE LA MUESTRA
Se debe adecuar al máximo la muestra que será objeto de análisis, considerando
los valores en blanco y atípicos. Este aspecto ya se trató en el capítulo
precedente.
2. SELECCIÓN DE VARIABLES
No se deben elegir variables indiscriminadamente. El grupo de variables
seleccionadas representan una determinada estructura; la inclusión de una
variable no relevante para el análisis podría definir una estructura de agrupación
diferente que puede no es estar alineada con el objetivo. En este estudio el
objetivo es determinar la victimización de los individuos de Quito y Guayaquil de
83
acuerdo su perfil social. Luego de los resultados analizados en los dos capítulos
precedentes, a continuación se presentan las variables utilizadas:
Cuadro 4.1: VARIABLES CONSIDERADAS
Nombre Tipo Variable
RANGO!DE!EDAD Categórica
GÉNERO Categórica
ESTADO!CIVIL Categórica
NIVEL!DE!ESTUDIOS Categórica
OCUPACIÓN Categórica
3. SELECCIÓN DEL CRITERIO DE AGRUPACIÓN
La técnica utilizada para determinar los conglomerados es la de agrupación en dos
fases o bietápica. Este método puede trabajar con variables continuas o
categóricas, con grandes cantidades de información, y se realiza en dos etapas:
La primera, construye un árbol de características en la cual se agrupan los
individuos en pequeños conglomerados disminuyendo de esta manera
significativamente el tamaño de la base.
La segunda, agrupa los pequeños conglomerados (de la primera etapa) con la
técnica aglomerativa jerárquica tratando a los pequeños conglomerados como
individuos.
4. SELECCIÓN DE DISTANCIA O SIMILITUD Y CÁLCULO DE LA MISMA
La distancia utilizada para este análisis es la distancia log-verosimilitud debido a
que las variables son categóricas. A continuación se especifica el cálculo de la
distancia utilizada:
N
! Número total de variables continuas
otaciones:
84
" Número total de variables categóricas
Número de categorías de la k-ésima variable #$
Rango de la k-ésima variable continua %$
Número de datos &
$ Número de datos en el conglomerado k. &
Media estimada de la k-ésima variable continua. '($
$) Es la varianza estimada de la k-ésima variable continua *+
Es la media estimada de la k-ésima variable continua en el conglomerado j. '(,$
*+), Es la varianza estimada de la k-ésima variable continua en el conglomerado j. $
&,$- Número de casos en el conglomerado j cuya variable categórica k toma la
tegoría l. ca
&$- Número de casos en la categoría l de la variable categórica k.
d(j,s)
./0 12 Índice que muestra el nuevo conglomerado formado por la combinación de
los conglomerados j y s.
Distancia entre los conglomerados j y s.
La distancia log-verosimilitud que se utilizará, se define de la siguiente manera:
d(i,j)= i+ j! <i,j>
donde:
85
!"#$%"&'()(%"('"()*+',*)-$"('$.,!"('/"0123456"78 9 "+#'('")$.',+,'.%,*'":!&
9 "0;<3=345">5">;3"?@6453A
El primer sumando de la ecuación anterior, mide la dispersión de las variables
continuas dentro del conglomerado v. El segundo sumando es una medida de
entropía utilizada para medir la dispersión de las variables categóricas, donde;
5. DETERMINACIÓN DE LA ESTRUCTURA CORRECTA
El número adecuado de conglomerados para la segunda etapa se obtiene
mediante el Criterio Bayesiano de Schwarz (BIC), que consiste en el siguiente
análisis:
Primero se realiza una serie de particiones sobre los conglomerados pequeños
definidos en la primera fase del conglomerado bietápico, utilizando la técnica
jerárquica aglomerativa. Para cada número de conglomerados J se calcula el BIC
de la siguiente manera:
Donde:
86
El máximo número de conglomerados K se obtiene mediante la razón entre el
BIC(J) y el BIC(1), para el primer valor de J, con el cual se obtenga un cociente
menor a 0,0416, valor obtenido en simulaciones realizadas por los técnicos de
SPSS. Una vez que se tiene el máximo número posible de conglomerados K, el
objetivo es encontrar el número óptimo de conglomerados (de acuerdo a este
modelo de agrupación). Para esto se utiliza la razón de cambio R1(J) para el BIC
en todos los J conglomerados (J=1,…,K) definida como:
donde:
Representa la distancia cuando los J+1 conglomerados pasan a formar J
conglomerados.
El número de conglomerados final se obtiene con el cociente entre las dos
razones de cambio más grandes R1(.), definidas como R1 (J1) y R1 (J2). Cuando el
cociente R1 (J1)/ R1 (J2) es mayor que 1,1517 el número de conglomerados es
igual a J1 de otro modo el número de conglomerados es igual al máximo entre J1
y J218.
16
Este valor está basado en estudios de simulación de los Autores de SPSS Two Step Conglomeradoing.
Mayores detalles en el documento SPSS TWO STEP CONGLOMERADO – A FIRST EVALUATION by Johann
Bacher, Knut Wensing, Melanie, 2004!02. 17
Idem referencia 16. 18
Mayores detalles documento en la referencia 16.
87
AGRUPAMIENTO PARA QUITO
ANÁLISIS DESCRIPTIVO DE QUITO
La provincia de Pichincha es una de la más grandes del País cuyo índice de
victimización a personas es de 14,7%, victimización a hogares del 21% y con una
percepción de inseguridad del 44%; este alto porcentaje de percepción de
inseguridad se debe también a la gran difusión de delitos que son noticia de
titulares en los diferentes medios de comunicación.
CONGLOMERADOS EN QUITO
A continuación se muestra el cuadro resumen del BIC con el cual se define el
número seleccionado de grupos.
Cuadro 4.2: CRITERIO BAYESIANO DE SCHWARZ
Auto-Clustering
21614,216
18484,643 -3129,573 1,000 1,861
16868,499 -1616,144 ,516 1,420
15772,549 -1095,950 ,350 1,042
14726,030 -1046,519 ,334 1,868
14231,628 -494,403 ,158 1,228
13855,500 -376,128 ,120 1,021
13490,005 -365,495 ,117 1,034
13141,403 -348,602 ,111 1,014
12799,735 -341,668 ,109 1,289
12566,494 -233,241 ,075 1,110
12370,517 -195,977 ,063 1,045
12189,103 -181,414 ,058 1,019
12013,815 -175,288 ,056 1,037
11849,823 -163,992 ,052 1,029
Number of Clusters1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Schwarz'sBayesian
Criterion (BIC) BIC Changea
Ratio of BICChanges
b
Ratio ofDistanceMeasures
c
The changes are from the previous number of clusters in the table.a.
The ratios of changes are relative to the change for the two cluster solution.b.
The ratios of distance measures are based on the current number ofclusters against the previous number of clusters.
c.
88
La técnica del conglomerado a dos fases seleccionó 5 grupos mediante el criterio
Bayesiano de Schwarz. A continuación se describe la distribución de cada una de
las variables para cada conglomerado.
Gráfico 4.1: DISTRIBUCIÓN PORCENTUAL DE GRUPO OCUPACIÓN POR CONGLOMERADO
Gráfico 4.2: DISTRIBUCIÓN PORCENTUAL DEL RANGO DE EDAD POR CONGLOMERADO
89
Gráfico 4.3: DISTRIBUCIÓN PORCENTUAL DEL GENERO POR CONGLOMERADO
Gráfico 4.4: DISTRIBUCIÓN PORCENTUAL DEL ESTADO CIVIL POR CONGLOMERADO
90
Gráfico 4.5: DISTRIBUCIÓN PORCENTUAL DEL NIVEL DE INSTRUCCIÓN POR
CONGLOMERADO
La interpretabilidad de cada conglomerado viene en función de la importancia de
cada variable para la formación del conglomerado o grupo. A continuación se
muestra la incidencia de cada variable en la formación de cada grupo; las barras
superiores a la línea segmentada en azul muestran que las variables son
representativas para el grupo (se contrasta la hipótesis nula H0: igualdad de la
distribución en el conglomerado y la de la población):
91
Gráfico 4.6: PRUEBA CHÍ - CUADRADO GRUPO OCUPACIÓN
Gráfico 4.7: PRUEBA CHÍ - CUADRADO RANGO DE EDAD
92
Gráfico 4.8: PRUEBA CHI - CUADRADO GÉNERO
Gráfico 4.9: PRUEBA CHÍ - CUADRADO ESTADO CIVIL
93
Gráfico 4.10: PRUEBA CHI-CUADRADO NIVEL DE INSTRUCCIÓN
Con base en las distribuciones e incidencia de cada una de las variables se
muestran las características de cada grupo:
Cuadro 4.3: CARATERÍSTICAS DE GRUPOS DEFINIDOS
Grupo Ocupación Rango de Edad Sexo Estado Civil Nivel Instrucción
Grupo 1 Trabajo o Negocio Mayor a 30 años Hombre Casado / Unión Libre
Grupo 2 Trabajo o Negocio Entre 20 y 30 años ! Soltero / Separado Secundaria / Superior
Grupo 3 Otros Mayor a 60 años ! ! !
Grupo 4 Es Estudiante de 16 a 25 años ! Soltero Secundaria / Superior
Grupo 5 Trabajo / Ama de Casa Mayor a 30 años Mujer Casado / Unión Libre !
GRUPO 1
Este grupo se caracteriza por los hombres casados o que viven en unión libre y
son mayores a 30 años de edad. A este grupo se lo llamará hombres-familia.
94
GRUPO 2
Son individuos que tienen empleo o su propio negocio, que mayoritariamente
tienen una edad entre 20 y 30 años y que son solteros o separados. A este grupo
se lo llamará solteros-trabajo.
GRUPO 3
Se caracterizan por aquellas personas de la tercera edad. A este grupo se le
denominará adultos-mayores.
GRUPO 4
Son individuos solteros entre 16 y 25 años que son estudiantes de secundaria o
universidad. A este grupo se lo llamará jóvenes-estudiantes.
GRUPO 5
Son mujeres casadas mayores a 30 años que tienen trabajo o son amas de casa.
A este grupo se lo denominaremos mujeres-familia.
De acuerdo a los grupos definidos se observa el nivel de victimización y
percepción en cada uno de ellos.
VICTIMIZACIÓN
Cuadro 4.4: VICTIMIZACIÓN POR GRUPO
Total
No Si
hombres - familia 84,50% 15,50% 100,00%
solteros - trabajo78,70% 21,30% 100,00%
adultos - mayores88,90% 11,10% 100,00%
jóvenes - estudiantes84,00% 16,00% 100,00%
mujeres - familia86,10% 13,90% 100,00%
84,00% 16,00% 100,00%
Índice de victimización a personas
CONGLOMERADOS QUITO
Total
Se observan diferentes niveles de victimización para cada uno de los
conglomerados por lo que se realiza un análisis ANOVA de la victimización en
95
función de los grupos. Para esto se realiza una prueba de homogeneidad de las
varianzas para sustentar el uso del estadístico F. La prueba es de la siguiente
manera:
BC D E;>@3"1@3"7@6=@<F@3">5"1;3"G62?;3"3;<"=G2@153
CHD IJ=345"@1"K5<;3"2<"G62?;"0;<"7@6=@<F@">=L565<451"@"1;3">5KM3"G62?;3
Cuadro 4.5: PRUEBA DE HOMOGEIDAD DE VARIANZAS
PARA LA VICTIMIZACIÓN A PERSONAS
Prueba de Homogeneidad de Varianzas
Índice de victimización a personas
12,780 4 1731 ,000
LeveneStatistic df1 df2 Sig.
Con un p-valor de 0,000 se rechaza la hipótesis nula de igualdad de las varianzas
(con los niveles de significación usuales), por lo que se procede a utilizar el
estadístico de Welch o el estadístico de Brown-Forsythe para análisis ANOVA
para grupos de varianzas desiguales. La prueba de hipótesis se plantea de la
siguiente manera.
BC D N@3"K5>=@3">5"1;3"G62?;3"3;<"=G2@153
CHD IJ=345"@1"K5<;3"2<"G62?;"0;<"2<@"K5>=@">53=G2@1"@1"6534;">5"G62?;3
96
Cuadro 4.6: PRUEBA DE IGUALDAD DE MEDIAS PARA LA VICTIMIZACIÓN A PERSONAS
Prueba Robusta de Igualdad de Medias
Índice de victimización a personas
3,130 4 759,826 ,014
3,391 4 1599,098 ,009
Welch
Brown-Forsythe
Statistica
df1 df2 Sig.
Asymptotically F distributed.a.
Para un nivel de significación del 5%, en ambos casos, se rechaza hipótesis nula
de igualdad de medias para los conglomerados; por esta razón, se realiza una
prueba múltiple comparativa de medias para encontrar los grupos que presentan
diferentes niveles de victimización.
Cuadro 4.7: COMPARACIONES MÚLTIPLES PARA LA VICTIMIZACIÓN A PERSONAS
Comparaciones Múltiples
Dependent Variable: Índice de victimización a personas
Tamhane
-,05799 ,02765 ,309 -,1356 ,0197
,04447 ,02913 ,744 -,0375 ,1264
-,00461 ,02769 1,000 -,0824 ,0732
,01623 ,02433 ,999 -,0521 ,0845
,05799 ,02765 ,309 -,0197 ,1356
,10246* ,03093 ,010 ,0155 ,1895
,05338 ,02958 ,524 -,0297 ,1365
,07422 ,02646 ,050 -,0001 ,1485
-,04447 ,02913 ,744 -,1264 ,0375
-,10246* ,03093 ,010 -,1895 -,0155
-,04908 ,03096 ,701 -,1362 ,0380
-,02824 ,02800 ,977 -,1071 ,0506
,00461 ,02769 1,000 -,0732 ,0824
-,05338 ,02958 ,524 -,1365 ,0297
,04908 ,03096 ,701 -,0380 ,1362
,02084 ,02650 ,996 -,0536 ,0953
-,01623 ,02433 ,999 -,0845 ,0521
-,07422 ,02646 ,050 -,1485 ,0001
,02824 ,02800 ,977 -,0506 ,1071
-,02084 ,02650 ,996 -,0953 ,0536
(J) CONGLOMERADOSQUITOsolteros - trabajo
adultos - mayores
jóvenes - estudiantes
mujeres - familia
hombres - familia
adultos - mayores
jóvenes - estudiantes
mujeres - familia
hombres - familia
solteros - trabajo
jóvenes - estudiantes
mujeres - familia
hombres - familia
solteros - trabajo
adultos - mayores
mujeres - familia
hombres - familia
solteros - trabajo
adultos - mayores
jóvenes - estudiantes
(I) CONGLOMERADOSQUITOhombres - familia
solteros - trabajo
adultos - mayores
jóvenes - estudiantes
mujeres - familia
MeanDifference
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.*.
97
Se observa en el intervalo de confianza para las medias de las diferencias de cada
pareja de grupos que existen dos diferentes entre sí, mostrados con (*), y que
corresponden a los grupos adultos-mayores y solteros-trabajo. Esto se puede ver
mejor en el siguiente gráfico:
Gráfico 4.11: VICTIMIZACIÓN A PERSONAS POR GRUPO
Los intervalos de confianza para la media son diferentes para los grupos solteros-
trabajo y adultos-mayores. Podrían existir diferencias estadísticas para la media
en los demás grupos, sin embargo con este tamaño de muestra, entre 200 y 400
para cada grupo, no se pueden realizar inferencias más desagregadas con mucha
confiabilidad.
98
PERCEPCIÓN
Cuadro 4.8: PERCEPCIÓN DE VICTIMIZACIÓN POR GRUPO
Total
No Si
hombres - familia 61,00% 39,00% 100,00%
solteros - trabajo 64,90% 35,10% 100,00%
adultos - mayores 44,20% 55,80% 100,00%
jóvenes - estudiantes 72,60% 27,40% 100,00%
mujeres - familia 39,00% 61,00% 100,00%
56,30% 43,70% 100,00%
Percepción
CONGLOMERADOS QUITO
Total
Al igual que en la victimización se hace un ANOVA de la percepción de la
victimización en función de los grupos establecidos.
Cuadro 4.9: PRUEBA DE HOMOGENEIDAD DE LAS VARIANZAS PARA LA PERCEPCIÓN
Prueba de Homogeneidad de Varianzas
Percepción de victimización
22,894 4 1731 ,000
LeveneStatistic df1 df2 Sig.
Con un p-valor de 0,000 se rechaza la hipótesis de igualdad de varianzas para
cada uno de los grupos por lo que se aplican los estadísticos de Welch y Brown-
Forsythe, que no asumen este supuesto.
Cuadro 4.10: PRUEBA DE IGUALDAD DE MEDIAS PARA LA PERCEPCIÓN
Prueba Robusta de Igualdad de Medias
Percepción de v ictimización
31,237 4 749,159 ,000
30,725 4 1463,605 ,000
Welch
Brown-Forsy the
Stat istica
df1 df2 Sig.
Asy mptotically F distributed.a.
99
Con un p-valor de 0,00 se rechaza la hipótesis nula de igualdad de varianzas de
percepción de inseguridad para los grupos, por lo que se hace un análisis múltiple
de medias para encontrar aquellas que sean diferentes.
Cuadro 4.11: COMPARACIONES MÚLTIPLES PARA LA PERCEPCIÓN
Comparaciones Múltiples
Dependent Variable: Percepción de v ictimización
Tamhane
,03935 ,03448 ,947 -,0575 ,1362
-,16789* ,04360 ,001 -,2907 -,0451
,11638* ,03530 ,010 ,0173 ,2155
-,22013* ,03349 ,000 -,3141 -,1261
-,03935 ,03448 ,947 -,1362 ,0575
-,20725* ,04357 ,000 -,3300 -,0845
,07703 ,03525 ,256 -,0220 ,1760
-,25948* ,03344 ,000 -,3533 -,1656
,16789* ,04360 ,001 ,0451 ,2907
,20725* ,04357 ,000 ,0845 ,3300
,28428* ,04421 ,000 ,1598 ,4088
-,05224 ,04278 ,920 -,1728 ,0683
-,11638* ,03530 ,010 -,2155 -,0173
-,07703 ,03525 ,256 -,1760 ,0220
-,28428* ,04421 ,000 -,4088 -,1598
-,33652* ,03427 ,000 -,4328 -,2403
,22013* ,03349 ,000 ,1261 ,3141
,25948* ,03344 ,000 ,1656 ,3533
,05224 ,04278 ,920 -,0683 ,1728
,33652* ,03427 ,000 ,2403 ,4328
(J) CONGLOMERADOSQUITOsolteros - t rabajo
adultos - may ores
jóvenes - estudiantes
mujeres - f amilia
hombres - familia
adultos - may ores
jóvenes - estudiantes
mujeres - f amilia
hombres - familia
solteros - t rabajo
jóvenes - estudiantes
mujeres - f amilia
hombres - familia
solteros - t rabajo
adultos - may ores
mujeres - f amilia
hombres - familia
solteros - t rabajo
adultos - may ores
jóvenes - estudiantes
(I) CONGLOMERADOSQUITOhombres - familia
solteros - t rabajo
adultos - may ores
jóvenes - estudiantes
mujeres - f amilia
MeanDif f erence
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Conf idence Interv al
The mean dif f erence is signif icant at the .05 lev el.*.
Como se observa en la comparación múltiple, existen varios grupos que presentan
promedios de percepción diferentes.
100
Gráfico 4.12: PERCEPCIÓN POR GRUPO
Los adultos-mayores junto con las mujeres-familia muestran una mayor
percepción mientras que los jóvenes estudiantes muestran la menor percepción.
PERCEPCIÓN Y VICTIMIZACIÓN
Gráfico 4.13: VICTIMIZACIÓN Y PERCEPCIÓN
0,00
10,00
20,00
30,00
40,00
50,00
60,00
70,00
0,00
5,00
10,00
15,00
20,00
25,00
adultos !mayores
mujeres !familia
hombres !familia
jóvenes !estudiantes
solteros !trabajo
Victimización Y Percepción
Victimización Percepción
101
La victimización y la percepción de cada grupo muestra como los grupos más
victimizados tienen menos percepción y los grupos menos victimizados tienen
mayor percepción. Este hecho muestra la aversión al riesgo que tiene cada uno de
los grupos y como consecuencia de esa aversión la victimización misma.
VICTIMIZACIÓN HOGARES
Otro factor importante es el estudio de la victimización a hogares que es el
porcentaje de hogares que fueron víctimas en alguno de los siguientes delitos:
robo de viviendas, vehículos o motorizados. El objetivo de estudiar esta
victimización es conocer su incidencia y la relación que ésta pueda tener con la
victimización a personas.
Cuadro 4.12: ÍNDICE DE VICTIMIZACIÓN A HOGARES
Índice de victimización a hogares
561 79,0 79,0 79,0
149 21,0 21,0 100,0
710 100,0 100,0
No
Si
Total
ValidFrequency Percent Valid Percent
CumulativePercent
Para la cabecera cantonal de Quito tenemos un índice de victimización a hogares
del 21%. Se han empleado árboles de decisión para agrupar los barrios en función
de la exposición de los hogares a ser victimizados (en función de los individuos en
cada hogar).
102
Gráfico 4.14: ÁRBOL GENERADO POR BARRIOS
El árbol de decisión define seis nodos que muestran diferentes niveles de
victimización a hogares en los diferentes grupos de barrios. Los grupos definidos
por el árbol se muestran a continuación:
103
Cuadro 4.13: GRUPOS BARRIOS DEFINIDOS POR ELÁRBOL DE DECISIÓN
Nodo Barrio
Nodo 1 PIO 12
LA FLORESTA
COOP.UNION Y PROGRESO
COOP. PABLO ARTURO SUAREZ
LA GASCA
BATAN BAJO
Nodo 2 CARCELEN BAJO
TURUBAMBA
VALLE HERMOSO
LA TOLITA
Nodo 3 BARRIO NUEVO
MONTUFAR
SAN JOSE DE JARRIN
DELICIA
CARLOS ANDRADE MARIN
CIUDADELA EL ROCIO
SANTA BARBARA
FERROVIARIA ALTA
PRIMAVERA
NO RESPONDE
Nodo 4 SOLANDA
EL BATAN
YAGUACHI
LA ARGELIA
SAN JUAN
EL INCA
LA FORERSTAL
COMITE DELPUEBLO
ANDALUCIA
SANTA CLARA
Nodo 5 OBRERO INDEPENDIENTE
JARAMILLO ARTEAGA
ACACIAS
SANTIAGO
LULUNCOTO
MIRAVALLE
SAN MARCOS
VILLAFLORA
LAS CASAS
SAN CARLOS
CUERPO DE BOMBEROS
Nodo 6 BENALCAZAR NORTE
SAN CARLOS
QUITO NORTE
CANGAGUA
BALCON DEL VALLE
LA LIBERTAD
ELOISA
BASILICA
VICENTINA
104
Cuadro 4.14: VICTIMIZACIÓN A HOGARES POR GRUPO
% within Grupos Victimización Hogares
49,0% 51,0% 100,0%
94,2% 5,8% 100,0%
61,8% 38,2% 100,0%
85,0% 15,0% 100,0%
73,0% 27,0% 100,0%
100,0% 100,0%
79,0% 21,0% 100,0%
Grupo 1
Gripo 2
Grupo 3
Grupo 4
Grupo 5
Grupo 6
GruposVictimizaciónHogares
Total
No Si
Índice de victimizacióna hogares
Total
Como se observa en el cuadro precedente, existen grupos de barrios con un alto
nivel de victimización a hogares como el nodo uno y tres, con niveles mayores al
38% y que son diferentes estadísticamente. El nodo seis no muestra victimización
(cabe mencionar que la encuesta fue diseñada para cabeceras cantonales y no
para subgrupos contenidos en ésta, pero que sin embargo son utilizados en este
trabajo con el objetivo mostrar como se pueden aplicar técnicas matemáticas en el
tratamiento de este tema social).
Se observa también los índices de victimización a personas en los grupos de
barrios agrupados en función de la victimización a hogares.
Cuadro 4.15: VICTIMIZACIÓN A PERSONAS POR GRUPO
% within Grupos Victimización Hogares
81,0% 19,0% 100,0%
86,3% 13,8% 100,0%
78,1% 21,9% 100,0%
85,6% 14,4% 100,0%
81,5% 18,5% 100,0%
91,4% 8,6% 100,0%
84,0% 16,0% 100,0%
Grupo 1
Grupo 2
Grupo 3
Grupo 4
Grupo 5
Grupo 6
GruposVictimizaciónHogares
Total
No Si
Índice de victimizacióna personas
Total
105
Gráfico 4.15: VICTIMIZACIÓN A PERSONAS POR GRUPO
La victimización a personas de los barrios en los grupos tres y seis son diferentes
estadísticamente mostrando así que la victimización a personas depende no solo
del perfil social sino también de la ubicación geográfica.
Se observa la victimización a personas y hogares en los grupos de barrios
establecidos para observar gráficamente la relación que existe entre ambas:
Cuadro 4.16: VICTIMIZACIÓN A HOGARES Y PERSONAS
Grupo
Victimización
Hogares
Victimización
Personas
Grupo 6 0,0 8,6
Grupo 2 5,8 13,8
Grupo 4 15,0 14,4
Grupo 5 27,0 18,5
Grupo 3 38,2 21,9
Grupo 1 51,0 19,0
Total 21,0 16,0
Vict. Hagares Y Vict. Personas
106
Gráfico 4.16: VICTIMIZACIÓN A HOGARES Y PERSONAS
0,0
5,0
10,0
15,0
20,0
25,0
0,0
10,0
20,0
30,0
40,0
50,0
60,0
Grupo 6 Grupo 2 Grupo 4 Grupo 5 Grupo 3 Grupo 1
% Vict.
Personas
% Vict.
Hogares
Victimización Hogares Victimización Personas
La victimización a hogares y personas muestra un coeficiente de correlación lineal
(R-cuadrado de 0,76), mostrando de esta manera una relación lineal fuerte entre la
victimización de hogares y la victimización de personas. Este valor podría indicar
que la victimización de los diferentes perfiles de individuos se suscita de acuerdo
a los barrios en que habitan. En este punto es importante conocer el origen de la
victimización, si es producto de un comportamiento social, situación
geográfica/económica o ambas a la vez. Para esto se estudia la victimización a
personas en la matriz que conforman los perfiles sociales y los grupos de barrios.
Cuadro 4.17: VICTIMIZACIÓN GRUPOS BARRIOS Y PERFILES SOCIALES
% Victimización
Perfiles Sociales Nodo 1 Nodo 2 Nodo 3 Nodo 4 Nodo 5 Nodo 6Total Perfiles
Sociales
hombres ! familia 28,1% 6,0% 20,3% 18,5% 16,7% 2,4% 15,5%
solteros ! trabajo 18,4% 27,7% 32,7% 21,7% 19,8% 9,8% 21,3%
adultos ! mayores 6,3% 0,0% 18,5% 5,7% 19,3% 5,1% 11,1%
jóvenes ! estudiantes 24,1% 11,4% 16,9% 11,1% 21,0% 14,6% 16,0%
mujeres ! familia 12,5% 16,0% 21,0% 9,2% 16,0% 10,0% 13,9%
Total Grupos Barrio 19,0% 13,8% 21,9% 14,4% 18,5% 8,6% 16,0%
Nodos (Grupos de Barrio)
107
La matriz de los perfiles sociales y los grupos de barrios nos permite visualizar la
victimización de cada una de ellas o ambas al mismo tiempo, permitiendo definir
estrategias diferenciadas. La victimización del perfil solteros-trabajo se mantiene
alta en la mayoría de grupos barrios por lo que se recomendaría diseñar una
estrategia específica para este perfil social. Por otro lado, se observa que los
barrios que pertenecen al grupo barrio tres tienen una victimización alta en cada
uno de sus perfiles sociales, por lo que se debería crear una estrategia específica
para este conjunto de barrios.
Si se aplicaran estrategias sobre los barrios y grupos sociales más victimizados,
como en este caso, son los grupos barrios 1 y 3, los solteros-trabajo y hombres-
familia para los perfiles sociales, y se estimara una reducción del 20% de la
victimización en estos grupos; se obtuviera una variación negativa del 13,6% de la
victimización de toda la ciudad, enfocándonos en solo el 60% de los ciudadanos,
como se muestra en el cuadro a continuación:
Cuadro 4.18: REPRESENTATIVIDAD GRUPOS BARRIOS Y PERFILES SOCIALES
% Población
Perfiles Sociales Nodo 1 Nodo 2 Nodo 3 Nodo 4 Nodo 5 Nodo 6 Total Nodos
hombres ! familia 1,8% 3,9% 4,0% 7,1% 3,8% 2,4% 23,0%
solteros ! trabajo 2,2% 2,7% 3,0% 6,1% 4,7% 3,5% 22,2%
adultos ! mayores 0,9% 0,9% 1,6% 2,0% 3,3% 2,2% 10,9%
jóvenes ! estudiantes 1,7% 2,0% 3,4% 4,7% 3,6% 2,4% 17,7%
mujeres ! familia 1,8% 4,3% 4,7% 8,1% 4,3% 2,9% 26,2%
Total Grupos 8,5% 13,8% 16,6% 28,1% 19,6% 13,4% 100,0%
Nodos (Grupos de Barrio)
Cuadro 4.19: INCIDENCIA DE VICTIMIZACIÓN EN GRUPOS BARRIOS
Y PERFILES SOCIALES
% Victimización
Perfiles Sociales Nodo 1 Nodo 2 Nodo 3 Nodo 4 Nodo 5 Nodo 6 Total Nodos
hombres ! familia 22,5% 4,8% 16,2% 14,8% 13,3% 1,9% 12,4%
solteros ! trabajo 14,7% 22,1% 26,2% 17,4% 15,8% 7,9% 17,0%
adultos ! mayores 5,0% 0,0% 14,8% 5,7% 19,3% 5,1% 10,4%
jóvenes ! estudiantes 19,3% 11,4% 13,6% 11,1% 21,0% 14,6% 14,9%
mujeres ! familia 10,0% 16,0% 16,8% 9,2% 16,0% 10,0% 13,0%
Total Grupos 15,2% 12,3% 17,5% 12,5% 16,9% 8,0% 13,8%
Nodos (Grupos de Barrio)
108
Los segmentos seleccionados (en amarillo en el cuadro 4.18) representan el 60%
de la población. Alcanzar una disminución del 20% de la victimización en estos
segmentos, de características similares, representaría un disminución del 13,6%
en toda la ciudad.
AGRUPAMIENTO PARA GUAYAQUIL
Para la ciudad de Guayaquil se realiza un análisis similar al de la ciudad de Quito,
razón por la cual se mencionan los resultados en forma resumida19.
Cuadro 4.20: ÍNDICE DE VICTIMIZACIÓN A PERSONAS
Índice de victimización a personas
1902 85,3 85,3 85,3
328 14,7 14,7 100,0
2230 100,0 100,0
No
Si
Total
ValidPROVINCIAGUAYAS
Frequency Percent Valid PercentCumulative
Percent
Cuadro 4.21: ÍNDICE DE PERCEPCIÓN DE VICTIMIZACIÓN
Percepción de victimización
1342 60,2 60,2 60,2
888 39,8 39,8 100,0
2230 100,0 100,0
No
Si
Total
ValidPROVINCIAGUAYAS
Frequency Percent Valid PercentCumulative
Percent
19
Detalles del agrupamiento se muestran en el Anexo 3.
109
Cuadro 4.22: ÍNDICE DE VICTIMIZACIÓN A HOGARES
Índice de victimización a hogares
744 87,0 87,0 87,0
111 13,0 13,0 100,0
855 100,0 100,0
No
Si
Total
ValidPROVINCIAGUAYAS
Frequency Percent Valid PercentCumulative
Percent
En el análisis de conglomerados se obtuvieron los siguientes grupos:
Cuadro 4.23: CARACTERÍSTICAS DE GRUPOS DEFINIDOS
Grupo Ocupación Rango de Edad Sexo Estado Civil Nivel Instrucción
Grupo 1 Estudiante, trabajo o Negocio Menores a 30 años Soltero Secundaria / Superior
Grupo 2 Amas de casa Mayores a 30 años Mujer Casado/Unión Libre !
Grupo 3 Trabajo o Negocio Mayores a 30 años Hombre Casado/Unión Libre !
De acuerdo a las características de cada grupo se han puesto nombres a cada
uno de los grupos para una mejor comprensión de los mismos. Al grupo 1 se lo ha
llamado como jóvenes, al grupo 2 como mujeres-familia y al grupo 3 como
hombres-familia
Los porcentajes de Victimización y Percepción para cada conglomerado se
muestran a continuación:
110
Cuadro 4.24: VICTIMIZACIÓN A PERSONAS POR GRUPO
% within CONGLOMERADOS_GUAYAQUIL
81,1% 18,9% 100,0%
90,1% 9,9% 100,0%
84,6% 15,4% 100,0%
85,3% 14,7% 100,0%
jóvenes
mujeres - familia
hombres - familia
CONGLOMERADOS_GUAYAQUIL
Total
No Si
Índice de victimizacióna personas
Total
Cuadro 4.25: PERCEPCIÓN DE VICTIMIZACIÓN POR GRUPO
% within CONGLOMERADOS_GUAYAQUIL
73,0% 27,0% 100,0%
50,0% 50,0% 100,0%
58,7% 41,3% 100,0%
60,1% 39,9% 100,0%
jóvenes
mujeres - familia
hombres - familia
CONGLOMERADOS_GUAYAQUIL
Total
No Si
Percepción devictimización
Total
Se observa que la victimización para cada grupo es muy diferente no obstante se
hace un análisis Anova para cada grupo:
Cuadro 4.26: PRUEBA DE IGUALDAD DE MEDIAS PARA LA VICTIMIZACIÓN
Prueba Robusta de Igualdad de Medias
Índice de victimización a personas
11,985 2 1378,115 ,000
10,919 2 1952,723 ,000
Welch
Brown-Forsythe
Statistica
df1 df2 Sig.
Asymptotically F distributed.a.
Con un p-valor de 0,00 se rechaza la hipótesis de igualdad de medias de
victimización para los grupos.
111
Cuadro 4.27: COMPARACIONES MÚLTIPLES PARA LA VICTIMIZACIÓN A PERSONAS
Comparaciones Múltiples
Dependent Variable: Índice de victimización a personas
Tamhane
,09060* ,01950 ,000 ,0440 ,1372
,03548 ,01968 ,200 -,0116 ,0825
-,09060* ,01950 ,000 -,1372 -,0440
-,05513* ,01655 ,003 -,0947 -,0156
-,03548 ,01968 ,200 -,0825 ,0116
,05513* ,01655 ,003 ,0156 ,0947
(J) CONGLOMERADOS_GUAYAQUILmujeres - familia
hombres - familia
jóvenes
hombres - familia
jóvenes
mujeres - familia
(I) CONGLOMERADOS_GUAYAQUILjóvenes
mujeres - familia
hombres - familia
MeanDifference
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.*.
Para la victimización se observa que existe diferencia estadística entre los tres
grupos:
Gráfico 4.17: VICTIMIZACIÓN A PERSONAS POR GRUPO
112
Existe diferencia estadística de los dos grupos más victimizados con el grupo
mujeres-familia. Para la percepción el análisis es similar. A continuación se
muestra el cuadro de las comparaciones múltiples para la percepción.
Cuadro 4.28: COMPARACIONES MÚLTIPLES PARA LA PERCEPCIÓN DE LA VICTIMIZACIÓN
Comparaciones Múltiples
Dependent Variable: Percepción de victimización
Tamhane
-,23034* ,02630 ,000 -,2932 -,1675
-,14368* ,02404 ,000 -,2012 -,0862
,23034* ,02630 ,000 ,1675 ,2932
,08665* ,02522 ,002 ,0264 ,1469
,14368* ,02404 ,000 ,0862 ,2012
-,08665* ,02522 ,002 -,1469 -,0264
(J) CONGLOMERADOS_GUAYAQUILmujeres - familia
hombres - familia
jóvenes
hombres - familia
jóvenes
mujeres - familia
(I) CONGLOMERADOS_GUAYAQUILjóvenes
mujeres - familia
hombres - familia
MeanDifference
(I-J) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.*.
Para la percepción se observa que todos los grupos tienen une media
estadísticamente diferente.
Gráfico 4.18: PERCEPCIÓN POR GRUPO
113
La victimización y la percepción de victimización muestran un comportamiento
inversamente proporcional:
Gráfico 4.19: PERCEPCIÓN Y VICTIMIZACIÓN
0
10
20
30
40
50
60
0
2
4
6
8
10
12
14
16
18
20
jóvenes hombres ! familia mujeres ! familia
% Percepción
% Victimización Pe
rson
as
Índice de victimización a hogares Percepción de victimización
VICTIMIZACIÓN A HOGARES
Mediante árboles de decisión se obtienen 5 grupos de victimización a hogares,
que muestran los siguientes resultados:
114
Cuadro 4.29: GRUPOS BARRIOS DEFINIDOS POR EL ÁRBOL
Grupo Barrio
Grupo 1 FLORESTA
GUASMO
MARTHA ROLDOS
SAN EDUARDO
SANTIAGO ROLDOS
GUERROS DEL FORTIN
URDESA
SANTA MONICA
Grupo 2 PANCHO JACOME
ATARAZANA
NIGERIA
Grupo 3 GARAY
GUAYACANES
SAMANES
LA CHALA
TECHO PARA TODOS
CLAVELES 1
DIGNIDAD POPULAR
URDENOR
COOPERATIVA OLIVOS
Grupo 4 BARRIO LINDO
SUBURBIO
ALBORADA
ROSALES
SAUCES
ORQUIDEAS
PRIMERO DE MAYO
FLOR DE FORTIN
PASCUALES
PISO Y TECHO
NO RESPONDE
Grupo 5 25 DE JULIO
ACACIAS
COOPERATIVA 5 DE DICIEMBRE
115
Cuadro 4.30: GRUPOS DE BARRIOS EN GUAYAQUIL
Grupos Barrios Guayaquil
998 45,0 45,0 45,0
631 28,4 28,4 73,4
310 14,0 14,0 87,3
98 4,4 4,4 91,8
183 8,2 8,2 100,0
2220 100,0 100,0
Grupo 1
Grupo 2
Grupo 3
Grupo 4
Grupo 5
Total
ValidFrequency Percent Valid Percent
CumulativePercent
Cuadro 4.31: VICTIMIZACIÓN A HOGARES POR GRUPO
% within Grupos Hogares Guayaquil
83,8% 16,2% 100,0%
91,6% 8,4% 100,0%
66,8% 33,2% 100,0%
100,0% 100,0%
76,0% 24,0% 100,0%
83,7% 16,3% 100,0%
1
2
3
4
5
GruposHogaresGuayaquil
Total
No Si
Índice de victimizacióna hogares
Total
Cuadro 4.32: PERCEPCIÓN DE VICTIMIZACIÓN POR GRUPO
% within Grupos Hogares Guayaquil
55,2% 44,8% 100,0%
64,0% 36,0% 100,0%
68,1% 31,9% 100,0%
63,3% 36,7% 100,0%
57,9% 42,1% 100,0%
60,1% 39,9% 100,0%
1
2
3
4
5
GruposHogaresGuayaquil
Total
No Si
Percepción devictimización
Total
116
Los grupos barrios de hogares muestran que existen niveles de victimización a
personas diferenciados para cada grupo; así, por ejemplo, los grupos de barrios 1
y 3 representan el 50% de la ciudad con los niveles de victimización más altos.
PERFILES Y GRUPOS DE HOGARES
Cuadro 4.33: VICTIMIZACIÓN POR GRUPOS BARRIOS Y PERFILES SOCIALES
% Victimización
Perfiles Sociales Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5Total Perfiles
Sociales
jóvenes 26% 9% 21% 14% 17% 19%
mujeres ! familia 11% 5% 17% 15% 9% 10%
hombres ! familia 17% 13% 16% 12% 14% 15%
Total Barrios 18% 9% 18% 13% 14% 15%
Grupos Barrios Guayaquil
Una posible estrategia sería trabajar sobre el perfil jóvenes y los grupos barrios
uno y tres que muestran niveles de victimización más altos:
Cuadro 4.34: SEGMENTOS CON MAYOR VICTIMIZACIÓN
% Victimización
Perfiles Sociales Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5Total Perfiles
Sociales
jóvenes 26% 9% 21% 14% 17% 19%
mujeres ! familia 11% 5% 17% 15% 9% 10%
hombres ! familia 17% 13% 16% 12% 14% 15%
Total Barrios 18% 9% 18% 13% 14% 15%
Grupos Barrios Guayaquil
117
Cuadro 4.35: REPRESENTATIVIDAD GRUPOS BARRIOS Y PERFILES SOCIALES
% Población
Perfiles Sociales Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5Total Perfiles
Sociales
jóvenes 12% 8% 4% 1% 3% 28%
mujeres ! familia 13% 9% 4% 1% 2% 30%
hombres ! familia 20% 11% 6% 2% 3% 42%
Total Barrios 45% 28% 14% 4% 8% 100%
Grupos Barrios Guayaquil
Considerando la representatividad que cada grupo seleccionado (marcado en
amarillo en el cuadro 4.32) tiene sobre la población, se podrían generar
estrategias que minimicen la victimización de manera focalizada y optimizando
recursos.
Las estadísticas del lugar, hora del día, tipo de agresión y objeto robado podrán
definir si la victimización se debe al perfil social o a la ubicación geográfica de
residencia del individuo, permitiendo así definir estrategias para el perfil social o el
sector, según corresponda.
El estudio de las estadísticas del lugar, hora del día, tipo de agresión y objeto
robado no son parte del presente estudio debido a que en la encuesta no se
encuentra declarado el lugar del robo y además no se cuenta con tamaños de
muestra suficientes de casos como para inferir resultados confiables.
Finalmente, los índices de victimización en cada barrio y perfil social pueden ser
una medida de la gestión de las organizaciones encargadas de generar
estrategias para que este índice disminuya.
118
CAPITULO 5:
CONCLUSIONES Y RECOMENDACIONES
PARA EL ANÁLISIS DESCRIPTIVO
1. En el análisis descriptivo de cada una de las variables se observó que los
jóvenes, estudiantes o universitarios y solteros son más victimizados que el
resto de la población. También se observó que el grupo con estas
características tiene una percepción de inseguridad menor al resto de la
población, siendo esta una de las posibles razones de su mayor
victimización. Estos dos hechos pueden ser fruto del comportamiento
natural y social que estos individuos tienen de acuerdo a su edad y estado
civil. En general, se observa que existe una relación inversa entre el nivel
de victimización y el nivel de percepción de inseguridad.
2. Los divorciados también tienen un alto porcentaje de victimización que
puede ser asociado a un comportamiento similar al de los jóvenes.
3. En cada una de las regiones se tienen niveles de inseguridad muy
diferentes; por ejemplo, la región Costa tiene un porcentaje de victimización
de 13,9%, casi dos puntos más que la Sierra con 11,95% y 5,5 puntos
porcentuales más que la región Amazónica, que tiene un porcentaje de
victimización de 6,4%.
4. Las provincias también mostraron niveles de inseguridad muy diferentes;
las provincias de Cotopaxi, los Ríos, Pichincha y Guayas resultaron ser las
más victimizadas a nivel nacional con un porcentaje de victimización mayor
al promedio nacional de 12,7%.
119
PARA EL SCORE DE VICTIMIZACIÓN
5. Para desarrollar un modelo de score al igual que para cualquier otro modelo
es indispensable contar con información consistente; usualmente, la
obtención de la información demanda el 80% del desarrollo de todo el
modelo. Se requiere siempre contrastar el modelo de desarrollo con una
muestra de prueba.
6. La definición de elemento bueno o malo debe ser cuidadosamente
establecida, pues a partir de ella serán seleccionadas y agrupadas las
diferentes variables explicativas. Una definición exageradamente flexible
puede terminar en modelos con baja capacidad discriminativa o baja
capacidad predictiva aunque el proceso de modelamiento sea el correcto.
7. En el análisis multivariado es indispensable encontrar las variables y la
combinación de las mismas que permitan la construcción de un modelo que
eficiente, que equilibre los requerimientos de menor información y mayor
explicación. Para esto, el uso de árboles de decisión permite encontrar las
variables y la combinación de las mismas, que discriminen mejor los
buenos y malos elementos, permitiendo una interpretación lógica y evitando
criterios subjetivos por parte del investigador; además, permite encontrar
relaciones que podrían indicar características hasta ese momento no
conocidas.
8. La regresión logística, para objetivos explicativos, es un modelo que
debería considerar solamente variables indicadoras (dummy), ya que estas
indican la incidencia de un determinado evento con la probabilidad del
evento de estudio, permitiendo así la interpretación del modelo y la
construcción de perfiles.
9. Antes de estudiar la discriminación de un modelo de score se debe hacer el
análisis estadístico del modelo en general y luego de cada una de sus
120
variables, verificando que cada una de estas sea representativa (el número
de elementos afirmativos debe ser al menos el 5% de la población), que
tenga correlación con la variable objetivo y que se encuentre alineada de
acuerdo al odds de cada variable, esperando la misma relación en la
muestra de desarrollo y la de prueba.
10. Mediante la discriminación en cada rango percentil se pueden obtener
perfiles y mediante estos obtener estrategias diferenciadas de decisión
que permitan realizar una gestión más oportuna y eficiente para tratar de
disminuir la victimización (los ejemplos presentados constituyen solamente
una primera aproximación, pues se requeriría mayor información para
análisis más profundos). El análisis de odds, por ejemplo, mostró en la
distribución por deciles en el score una relación de 20 no victimizados a un
victimizado en el primer decil mientras que el último decil, una relación de 4
a 1.
11. La clasificación de perfiles a partir de quintiles en el Score de Victimización
mostró que geográficamente las provincias de Pichincha, Guayas, Cotopaxi
y Los Ríos son las más victimizadas y los individuos de educación superior
con edad menor a 35 años tienen también un alto índice de victimización.
Las variables seleccionadas para el modelo de regresión logística son la
provincia, el área geográfica (rural o urbana), edad y género.
12. La provincia resultó ser la más importante, contribuyendo casi con todas las
variables indicadoras, mientras que las demás variables contribuyen con el
modelo con una parte de las variables indicadoras de sus categorías. Este
hecho se presenta debido a que al realizarse un score de victimización a
nivel nacional, las variables seleccionadas son aquellas estadísticamente
significativas a nivel nacional; por tanto, la variable provincia es la más
importante pues la realidad socio-económica de cada provincia es diferente.
Este hecho conduce a que variables como género, edad, tipo de ocupación,
121
nivel de instrucción, etc no sean tan relevantes en el modelo; sin embargo,
para estudios más detallados (por ejemplo, por ciudad) estas variables
serían de gran importancia.
PARA LOS PERFILES DE VICTIMIZACIÓN
13. El objetivo de crear perfiles de victimización es identificar grupos
homogéneos de individuos que por sus características puedan ser
victimizados en diferente forma e intensidad. En este trabajo se ha utilizado
el análisis de conglomerados, con una metodología bastante reciente (a dos
etapas), que permite trabajar con grandes cantidades de información y
determinar automáticamente el número óptimo de conglomerados.
14. Para el análisis de conglomerados la selección de las variables es de suma
importancia ya que estas son las que definirán los grupos a formarse; por
tanto, no se deben considerar variables que no tengan interpretabilidad
para el estudio y si contribuyan para la agrupación. En este sentido, las
varibles que se seleccionaron fueron: el rango de edad, el género, estado
civil, nivel de estudios y la ocupación.
15. Para la ciudad de Quito el análisis determinó cinco grupos definidos como;
jóvenes estudiantes; solteros con trabajo; padres de familia; madres de
familia y adultos mayores. Los solteros con trabajo mostraron ser los más
victimizados con un índice de victimización del 21,3%, los jóvenes
estudiantes con un 16%, los padres de familia con un 15.5%, las madres de
familia 13,9% y los adultos mayores en un 11,1%. La percepción de los
jóvenes estudiantes fue 27,4%, solteros con trabajo 35%, padres de familia
39%, adultos mayores 56% y madres de familia 61%.
16. Para estos grupos se realizaron estudios ANOVA de la victimización y
percepción, encontrando que los conglomerados de jóvenes estudiantes y
122
solteros con trabajo tienen una mayor victimización que los adultos mayores
y que la percepción es inversamente proporcional a la victimización en
estos conglomerados; estos resultados son similares a los encontrados en
el análisis descriptivo a nivel nacional.
17. En el estudio de la victimización también se incluyó en el análisis el estudio
de la victimización a hogares. Se generó un árbol de decisión que agrupara
los barrios de acuerdo a su nivel de victimización con el objetivo de estudiar
la asociación que pueda existir entre la victimización a personas y la
victimización a hogares. Se generaron seis grupos de barrios; el grupo con
mayor victimización a hogares mostró un índice del 51% mientras el más
bajo un índice del 0%. En este punto, es importante mencionar que el
marco muestral de la información fue considerado a nivel de cabeceras
cantonales y por tanto su uso a un nivel más desagrtegado intenta mostrar
solamente una propuesta como referente para el estudio de este tema,
pues sería poco confiable realizar inferencias con tan pocos datos para
cada barrio; por eso se realizaron análisis sobre grupos de barrios.
18. La victimización a personas y hogares mostró una correlación lineal de
0,87, lo que sugiere que la victimización no solo se debe por el perfil social
del individuo sino también por la posición geográfica en la que habita. El
estudio profundo de la posible causa de victimización considerando estos
dos factores puede generar estrategias que minimicen la exposición a la
victimización. Para esto, es relevante disponer de otras características de la
victimización, como son la hora, el lugar, el objeto robado, el objeto usado
para la victimización y el tipo de agresión.
19. En la encuesta no se dispone del lugar del delito, información importante
para corroborar si la victimización es por sector o perfil social. Se
recomienda considerar esta información en estudios posteriores.
123
20. El análisis realizado para Guayaquil es similar al realizado para Quito. Se
obtuvieron tres perfiles sociales y cinco grupos barrios. Los grupos barrios
uno y tres son los más victimizados con un índice del 18%; el perfil social
jóvenes es el más victimizado con el 19%.
ESTRATEGIAS PLANTEADAS
21. En Quito, la victimización del perfil solteros-trabajo se mantiene alta en la
mayoría de grupos barrios (o independiente de estos), por lo que se
recomendaría investigar profundamente sobre el tipo de victimización de
este grupo acerca de la hora, lugar, razón y tipo de victimización con el
objetivo de generar controles de vigilancia y dar información a este grupo
sobre el tipo de victimización al que son expuestos en determinadas
condiciones. En la encuesta se encuentran detalles del objeto robado, día
de la semana, hora del día y tipo de victimización (pero no se encuentra el
lugar del robo), sin embargo no es posible inferir resultados estadísticos
debido a que el número de casos en cada provincia no son suficientes ya
que la unidad de estudio son las cabeceras cantonales y no subconjuntos
más pequeños a estos, debido a que la encuesta es a nivel nacional. Por tal
razón, no es posible generar estrategias totalmente definidas para las
ciudades, sin embargo pueden ser consideradas para estudios posteriores
en los que los tamaños de muestra por ciudades sean más grandes.
22. En Quito, se observa que los barrios que pertenecen al grupo barrio uno y
tres tienen una victimización alta en cada uno de sus perfiles sociales, por
lo que podría ser una estrategia generar comites barriales de vigilancia que
muestren el conocimiento de la delincuencia en el barrio, generar marchas
pacíficas de rachazo que íntimiden a la delicuencia al saberse conocida.
Otra alternativa podría ser instalar alarmas en cada uno de los hogares con
la intención de brindar apoyo en caso de ser victimizado solicitando de igual
manera mayor ayuda a la policía en los diferentes sectores del barrio.
124
Incluso la policía del sector podría formar parte de estos comites barriales
con el objetivo de ayudar a organizarlos frente a la victimización y perduren
el mayor tiempo posible.
23. Si se aplicaran estrategias sobre los barrios y grupos sociales más
victimizados (en este caso fueron los grupos barrios 1 y 3) y los perfiles
sociales (solteros con trabajo y padres de familia) y se alcanzara una
reducción del 20% de la victimización en estos grupos, se obtendría una
reducción del 13,6% de la victimización de toda la ciudad, enfocándose en
el 60% de los ciudadanos.
24. Con el uso de la matriz de victimización por perfil social y situación
geográfica se puede generar un sistema de medida que evalúe la gestión
social y de seguridad policial encargadas de controlar la inseguridad
existente en la ciudad. Adicionalmente, esta matriz puede orientar sobre el
tipo de gestión a realizar: por perfil social o perfil geográfico. Generar está
información en los sucesivos años permitira ver la tendencia que tiene la
victimización en función de la gestión direccionada.
25. El análisis descriptivo mostró que la percepción resultó ser inversamente
proporcional a la victimización, por lo que podría considerarse que los
individuos que tienen alta percepción son menos expuestos a la
victimización; en general, se podría considerar crear campañas que
aumenten la percepción de victimización en los individuos que tengan una
mayor probabilidad de ser victimizados.
125
BIBLIOGRAFÍA
BACHER JOHANN, WENSING KNUT, SPSS Two Step Conglomerado – A First
Evaluation, Melanie, 2004-02
CABALLERO GRANADO FRANCISCO JAVIER; Modelos de Regresión Logística
Incondicional; Servicio de Medicina Interna Hospital Punta de Europa Algeciras.
http://saei.org/hemero
DIJK JAN VAN, KESTEREN JOHN VAN, SMIT PAUL; Victimización en la
Perspectiva Internacional; ICESI, Instituto Ciudadano de Estudios Sobre la
Inseguridad; 2008
DOBSON J. ANNETE; An introduction to Generalized Linear Models; Chapman
and Hall; 1990.
LYN C THOMAS, EDELMAN DAVID B, CROOK JONATHAN N., Credit Scoring
and its Applications; SIAM, Society for industrial Applied Mathematics; 2002.
MARTORI CAÑAS JUAN CARLOS; Análisis Estadístico con SPSS para Windows
Volumen II Estadística Multivariante. 2003
NOVALES CINCA ALFONSO; Econometría; 1993
SOZZO MÁXIMO; Inseguridad, Prevención y Policía; Crearimagen; 2008.
URIEL ALDAS EZEQUIEL JOAQUÍN; Análisis Multivariante Aplicado; Thomson;
2005.
126
ANEXO 1
VARIABLES GENERADAS POR LOS ÁRBOLES
DE DECISIÓN
PROVINCIA
Node 0
Category % n
90.7 21432No9.3 2209Si
Total 100.0 23641
PROVINCIAAdj. P-value=0.000, Chi-square=551.565,
df=6Índice de victimización a personas
Node 1
Category % n
88.5 2606No11.5 337Si
Total 12.4 2943CHIMBORAZO; LOJA; EL ORO
Node 2
Category % n
85.3 3700No14.7 639Si
Total 18.4 4339PICHINCHA; GUAYAS
Node 3
Category % n
94.6 2653No5.4 151Si
Total 11.9 2804AZUAY; IMBABURA; ZAMORA
Node 4
Category % n
97.4 2663No2.6 70Si
Total 11.6 2733BOLIVAR; CAÑAR; PASTAZA
Node 5
Category % n
92.8 5918No7.2 462Si
Total 27.0 6380
CARCHI; MANABI; MORONA
SANTIAGO; NAPO; ORELLANA; SANTO
DOMINGO DE LOS TSACHILAS;
SANTA ELENA
Node 6
Category % n
82.0 1422No18.0 312Si
Total 7.3 1734COTOPAXI; LOS RIOS
Node 7
Category % n
91.2 2470No8.8 238Si
Total 11.5 2708ESMERALDAS; TUNGURAHUA;
SUCUMBIOS
NoSi
127
POBREZA
128
NIVEL DE INSTRUCCIÓN
Node 0
Category % n
90.7 21409No9.3 2208Si
Total 100 .0 23617
NIVEL DE INSTRUCCIÓNAdj. P-value=0.000, Chi-square=144.
527, df=3
Índice de victimización a personas
Node 1
Category % n
93.7 6084No6.3 409Si
Total 27.5 6493
Primaria; Otros
Node 2
Category % n
90.0 9672No10.0 1074Si
Total 45.5 10746
Secundaria
Node 3
Category % n
96.1 497No3.9 20Si
Total 2.2 517
Ninguno
Node 4
Category % n
88.0 5156No12.0 705Si
Total 24.8 5861
Superior
NoSi
129
EDAD
130
GÉNERO
Node 0
Category % n
90.7 21432No9.3 2209Si
Total 100 .0 23641
2. DATOS DEMOGRAFICOS -SEXOAdj. P-value=0.000, Chi-square=17.691,
df=1
Índice de victimización a personas
Node 1
Category % n
91.4 11387No8.6 1070Si
Total 52.7 12457
MUJER
Node 2
Category % n
89.8 10045No10.2 1139Si
Total 47.3 11184
HOMBRE
NoSi
131
AREA GEOGRÁFICA
Node 0
Category % n
90.7 21432No9.3 2209Si
Total 100 .0 23641
areaAdj. P-value=0.000, Chi-square=59.742,
df=1
Índice de victimización a personas
Node 1
Category % n
90.1 18841No9.9 2064Si
Total 88.4 20905
URBANA
Node 2
Category % n
94.7 2591No5.3 145Si
Total 11.6 2736
RURAL
NoSi
132
ESTADO CIVIL
Node 0
Category % n
90.7 21432No9.3 2209Si
Total 100 .0 23641
ESTADO CIVILAdj. P-value=0.000, Chi-square=51.182,
df=2
Índice de victimización a personas
Node 1
Category % n
94.1 945No5.9 59Si
Total 4.2 1004
Viudo
Node 2
Category % n
89.1 8314No10.9 1016Si
Total 39.5 9330
Soltero; Separado o Divorciado
Node 3
Category % n
91.5 12173No8.5 1134Si
Total 56.3 13307
Casado o Unión Libre
NoSi
133
PROPORCIÓN DE PERSONAS QUE TRABAJAN POR CANTÓN
134
VARIABLES COMBINADAS
GÉNERO-EDAD
135
NIVEL DE INSTRUCCIÓN-EDAD
136
ANEXO 2
VARIABLES INICIALMENTE CONSIDERADAS EN EL
DESARROLLO DE LA REGRESIÓN LOGÍSTICA
Se consideran todas las variables indicadoras para cada uno de los grupos
definidos por los árboles de decisión sobre las variables originales.
Variables not in the Equationa
15,795 1 ,000
122,509 1 ,000
41,169 1 ,000
108,210 1 ,000
45,593 1 ,000
142,049 1 ,000
1,739 1 ,187
54,795 1 ,000
4,423 1 ,035
45,085 1 ,000
34,828 1 ,000
32,178 1 ,000
90,189 1 ,000
22,274 1 ,000
39,630 1 ,000
17,232 1 ,000
57,968 1 ,000
5,964 1 ,015
6,360 1 ,012
47,364 1 ,000
8,282 1 ,004
12,172 1 ,000
34,034 1 ,000
10,027 1 ,002
,010 1 ,920
7,746 1 ,005
,402 1 ,526
26,628 1 ,000
34,787 1 ,000
70,904 1 ,000
42,846 1 ,000
36,398 1 ,000
V_1
V_2
V_3
V_4
V_5
V_6
V_7
V_8
V_9
V_10
V_11
V_12
V_13
V_14
V_15
V_16
V_17
V_18
V_19
V_20
V_21
V_22
V_23
V_24
V_25
V_26
V_27
V_28
V_29
V_30
V_31
V_32
VariablesStep0
Score df Sig.
Residual Chi-Squares are not computed because of redundancies.a.
137
En el paso 14 se muestra el primer conjunto de variables seleccionadas para el
modelo original.
Variables in the Equation
B S.E. Wald df Sig. Exp(B) Step 1(a)
V_6 ,910 ,079 133,788 1 ,000 2,484 Constant -2,380 ,029 6722,624 1 ,000 ,093
Step 2(b)
V_2 ,815 ,063 168,651 1 ,000 2,260 V_6 1,117 ,081 189,060 1 ,000 3,054 Constant
-2,586 ,035 5367,898 1 ,000 ,075
Step 3(c)
V_1 ,707 ,081 76,993 1 ,000 2,028 V_2 ,965 ,066 211,732 1 ,000 2,624 V_6 1,266 ,084 227,374 1 ,000 3,546 Constant -2,735 ,041 4405,766 1 ,000 ,065
Step 4(d)
V_1 ,712 ,081 77,751 1 ,000 2,038 V_2 ,978 ,066 216,233 1 ,000 2,658 V_6 1,267 ,084 226,413 1 ,000 3,550 V_17 ,424 ,054 60,713 1 ,000 1,529 Constant -2,934 ,050 3463,981 1 ,000 ,053
Step 5(e)
V_1 ,726 ,081 80,472 1 ,000 2,067 V_2 1,001 ,067 224,767 1 ,000 2,720 V_6 1,265 ,085 223,988 1 ,000 3,543 V_11 ,481 ,057 70,352 1 ,000 1,617 V_17 ,546 ,057 92,641 1 ,000 1,727 Constant -3,190 ,060 2797,347 1 ,000 ,041
Step 6(f)
V_1 ,601 ,082 53,608 1 ,000 1,824 V_2 ,875 ,068 165,320 1 ,000 2,399 V_4 -,937 ,145 41,853 1 ,000 ,392 V_6 1,139 ,086 177,322 1 ,000 3,125 V_11 ,482 ,057 70,494 1 ,000 1,619 V_17 ,545 ,057 91,883 1 ,000 1,724 Constant -3,064 ,062 2460,257 1 ,000 ,047
Step 7(g)
V_1 ,580 ,082 49,815 1 ,000 1,786 V_2 ,861 ,068 159,545 1 ,000 2,366 V_4 -,948 ,145 42,721 1 ,000 ,388 V_6 1,132 ,086 174,532 1 ,000 3,103 V_11 ,575 ,060 92,581 1 ,000 1,777 V_17 ,491 ,058 72,526 1 ,000 1,634 V_32 ,358 ,058 37,412 1 ,000 1,430 Constant -3,222 ,068 2240,972 1 ,000 ,040
Step 8(h)
V_1 ,586 ,082 50,656 1 ,000 1,796 V_2 ,873 ,068 163,375 1 ,000 2,394 V_4 -,935 ,145 41,532 1 ,000 ,393 V_6 1,140 ,086 176,405 1 ,000 3,128 V_11 ,599 ,060 100,261 1 ,000 1,820
138
V_17 ,408 ,059 48,429 1 ,000 1,503 V_20 -,700 ,126 30,774 1 ,000 ,496 V_32 ,326 ,059 31,004 1 ,000 1,385 Constant -3,133 ,069 2056,071 1 ,000 ,044
Step 9(i)
V_1 ,544 ,083 43,388 1 ,000 1,723 V_2 ,850 ,068 154,234 1 ,000 2,339 V_4 -,933 ,145 41,366 1 ,000 ,393 V_6 1,142 ,086 176,047 1 ,000 3,132 V_11 ,595 ,060 98,682 1 ,000 1,812 V_17 ,405 ,059 47,668 1 ,000 1,500 V_20 -,698 ,126 30,506 1 ,000 ,498 V_31 -,589 ,109 29,345 1 ,000 ,555 V_32 ,325 ,059 30,688 1 ,000 1,384 Constant -3,066 ,070 1929,310 1 ,000 ,047
Step 10(j)
V_1 ,511 ,083 37,911 1 ,000 1,667 V_2 ,844 ,068 151,790 1 ,000 2,325 V_4 -,951 ,145 42,931 1 ,000 ,386 V_6 1,132 ,086 172,644 1 ,000 3,101 V_11 ,613 ,060 103,496 1 ,000 1,846 V_17 ,295 ,065 20,338 1 ,000 1,342 V_20 -,704 ,126 31,023 1 ,000 ,495 V_30 ,327 ,079 17,323 1 ,000 1,387 V_31 -,563 ,109 26,757 1 ,000 ,569 V_32 ,284 ,060 22,572 1 ,000 1,328 Constant -3,059 ,070 1916,925 1 ,000 ,047
Step 11(k)
V_1 ,507 ,083 37,191 1 ,000 1,660 V_2 ,832 ,069 147,178 1 ,000 2,298 V_4 -,955 ,145 43,275 1 ,000 ,385 V_6 1,116 ,086 167,283 1 ,000 3,052 V_11 ,633 ,061 109,176 1 ,000 1,883 V_17 ,243 ,067 13,223 1 ,000 1,274 V_20 -,789 ,128 37,802 1 ,000 ,454 V_28 -,310 ,090 11,857 1 ,001 ,734 V_30 ,312 ,079 15,787 1 ,000 1,366 V_31 -,532 ,109 23,702 1 ,000 ,587 V_32 ,265 ,060 19,498 1 ,000 1,303 Constant -2,980 ,073 1664,536 1 ,000 ,051
Step 12(l)
V_1 ,506 ,083 37,081 1 ,000 1,659 V_2 ,835 ,069 147,874 1 ,000 2,304 V_4 -,955 ,145 43,223 1 ,000 ,385 V_6 1,111 ,086 165,534 1 ,000 3,037 V_11 ,805 ,081 98,251 1 ,000 2,236 V_12 ,319 ,100 10,160 1 ,001 1,375 V_17 ,252 ,067 14,223 1 ,000 1,287 V_20 -,771 ,129 36,009 1 ,000 ,462 V_28 -,327 ,090 13,180 1 ,000 ,721 V_30 ,336 ,079 18,098 1 ,000 1,400
139
V_31 -,526 ,109 23,141 1 ,000 ,591 V_32 ,417 ,076 29,785 1 ,000 1,518 Constant -3,200 ,101 1002,436 1 ,000 ,041
Step 13(m)
V_1 ,431 ,086 25,050 1 ,000 1,538 V_2 ,760 ,072 111,560 1 ,000 2,139 V_3 -,341 ,111 9,477 1 ,002 ,711 V_4 -1,030 ,147 49,162 1 ,000 ,357 V_6 1,037 ,089 135,680 1 ,000 2,820 V_11 ,799 ,081 97,011 1 ,000 2,224 V_12 ,313 ,100 9,806 1 ,002 1,367 V_17 ,247 ,067 13,623 1 ,000 1,280 V_20 -,766 ,129 35,463 1 ,000 ,465 V_28 -,326 ,090 13,092 1 ,000 ,722 V_30 ,351 ,079 19,592 1 ,000 1,420 V_31 -,524 ,109 22,985 1 ,000 ,592 V_32 ,416 ,076 29,643 1 ,000 1,516 Constant -3,123 ,103 910,801 1 ,000 ,044
Step 14(n)
V_1 ,233 ,108 4,649 1 ,031 1,263 V_2 ,563 ,098 33,244 1 ,000 1,755 V_3 -,539 ,129 17,461 1 ,000 ,583 V_4 -1,228 ,161 58,131 1 ,000 ,293 V_5 -,294 ,102 8,296 1 ,004 ,746 V_6 ,839 ,111 57,363 1 ,000 2,314 V_11 ,797 ,081 96,362 1 ,000 2,218 V_12 ,309 ,100 9,541 1 ,002 1,361 V_17 ,255 ,067 14,498 1 ,000 1,290 V_20 -,772 ,129 36,020 1 ,000 ,462 V_28 -,319 ,090 12,555 1 ,000 ,727 V_30 ,343 ,079 18,641 1 ,000 1,408 V_31 -,524 ,109 22,928 1 ,000 ,592 V_32 ,413 ,076 29,261 1 ,000 1,512 Constant -2,924 ,123 567,500 1 ,000 ,054
a Variable(s) entered on step 1: V_6. b Variable(s) entered on step 2: V_2. c Variable(s) entered on step 3: V_1. d Variable(s) entered on step 4: V_17. e Variable(s) entered on step 5: V_11. f Variable(s) entered on step 6: V_4. g Variable(s) entered on step 7: V_32. h Variable(s) entered on step 8: V_20. i Variable(s) entered on step 9: V_31. j Variable(s) entered on step 10: V_30. k Variable(s) entered on step 11: V_28. l Variable(s) entered on step 12: V_12. m Variable(s) entered on step 13: V_3. n Variable(s) entered on step 14: V_5.
140
Sobre este primer modelo se estudia la significancia y la polaridad en la base de
prueba para posteriormente seleccionar las variables del modelo final. A
continuación se presenta el análisis de significancia de cada una de las variables
en la muestra de prueba:
V_1 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_1 ,00 5610 581 6191
1,00 812 101 913Total 6422 682 7104
1,00 V_1 ,00 13216 1291 145071,00 1794 236 2030
Total 15010 1527 16537
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 2,581(b) 1 ,108 Continuity Correction(a)
2,391 1 ,122
Likelihood Ratio 2,488 1 ,115 Fisher's Exact Test ,117 ,063Linear-by-Linear Association 2,581 1 ,108
N of Valid Cases 7104 1,00 Pearson Chi-Square 15,795(c) 1 ,000
Continuity Correction(a)
15,471 1 ,000
Likelihood Ratio 14,864 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 15,794 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 87,65. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 187,45.
141
V_2 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_2 ,00 5272 477 5749
1,00 1150 205 1355Total 6422 682 7104
1,00 V_2 ,00 12460 1093 135531,00 2550 434 2984
Total 15010 1527 16537
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 58,977(b) 1 ,000 Continuity Correction(a)
58,192 1 ,000
Likelihood Ratio 53,066 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 58,969 1 ,000
N of Valid Cases 7104 1,00 Pearson Chi-Square 122,509(c) 1 ,000
Continuity Correction(a)
121,737 1 ,000
Likelihood Ratio 109,885 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 122,502 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 130,08. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 275,54.
142
V_3 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_3 ,00 5677 639 6316
1,00 745 43 788Total 6422 682 7104
1,00 V_3 ,00 13102 1419 145211,00 1908 108 2016
Total 15010 1527 16537
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 17,533(b) 1 ,000 Continuity Correction(a)
17,000 1 ,000
Likelihood Ratio 20,105 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 17,530 1 ,000
N of Valid Cases 7104 1,00 Pearson Chi-Square 41,169(c) 1 ,000
Continuity Correction(a)
40,644 1 ,000
Likelihood Ratio 46,934 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 41,166 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 75,65. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 186,15.
143
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 60,128(b) 1 ,000 Continuity Correction(a)
59,145 1 ,000
Likelihood Ratio 83,129 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 60,120 1 ,000
N of Valid Cases 7104 1,00 Pearson Chi-Square 108,210(c) 1 ,000
Continuity Correction(a)
107,342 1 ,000
Likelihood Ratio 140,663 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 108,203 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 76,90. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 178,40.
V_5 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_5 ,00 4650 519 5169
1,00 1772 163 1935Total 6422 682 7104
1,00 V_5 ,00 10864 1228 120921,00 4146 299 4445
Total 15010 1527 16537
144
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 4,241(b) 1 ,039 Continuity Correction(a)
4,057 1 ,044
Likelihood Ratio 4,346 1 ,037 Fisher's Exact Test ,042 ,021Linear-by-Linear Association 4,240 1 ,039
N of Valid Cases 7104 1,00 Pearson Chi-Square 45,593(c) 1 ,000
Continuity Correction(a)
45,184 1 ,000
Likelihood Ratio 48,401 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 45,590 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 185,76. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 410,44.
V_6 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_6 ,00 6000 600 6600
1,00 422 82 504Total 6422 682 7104
1,00 V_6 ,00 14010 1297 153071,00 1000 230 1230
Total 15010 1527 16537
145
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 27,806(b) 1 ,000 Continuity Correction(a)
26,985 1 ,000
Likelihood Ratio 23,833 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 27,802 1 ,000
N of Valid Cases 7104 1,00 Pearson Chi-Square 142,049(c) 1 ,000
Continuity Correction(a)
140,832 1 ,000
Likelihood Ratio 115,155 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 142,041 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 48,39. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 113,58.
V_11 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_11 ,00 4016 393 4409
1,00 2406 289 2695Total 6422 682 7104
1,00 V_11 ,00 9563 856 104191,00 5447 671 6118
Total 15010 1527 16537
146
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 6,314(b) 1 ,012 Continuity Correction(a)
6,107 1 ,013
Likelihood Ratio 6,238 1 ,013 Fisher's Exact Test ,013 ,007Linear-by-Linear Association 6,313 1 ,012
N of Valid Cases 7104 1,00 Pearson Chi-Square 34,828(c) 1 ,000
Continuity Correction(a)
34,501 1 ,000
Likelihood Ratio 34,151 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 34,826 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 258,73. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 564,93.
V_12 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_12 ,00 4624 538 5162
1,00 1798 144 1942Total 6422 682 7104
1,00 V_12 ,00 10784 1201 119851,00 4226 326 4552
Total 15010 1527 16537
147
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 14,705(b) 1 ,000 Continuity Correction(a)
14,360 1 ,000
Likelihood Ratio 15,428 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 14,703 1 ,000
N of Valid Cases 7104 1,00 Pearson Chi-Square 32,178(c) 1 ,000
Continuity Correction(a)
31,838 1 ,000
Likelihood Ratio 33,734 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 32,176 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 186,44. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 420,32.
V_17 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_17 ,00 3854 340 4194
1,00 2568 342 2910Total 6422 682 7104
1,00 V_17 ,00 8886 750 96361,00 6124 777 6901
Total 15010 1527 16537
148
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 26,311(b) 1 ,000 Continuity Correction(a)
25,893 1 ,000
Likelihood Ratio 25,921 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 26,308 1 ,000
N of Valid Cases 7104 1,00 Pearson Chi-Square 57,968(c) 1 ,000
Continuity Correction(a)
57,554 1 ,000
Likelihood Ratio 57,205 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 57,964 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 279,37. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 637,23.
V_20 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_20 ,00 5710 632 6342
1,00 712 50 762Total 6422 682 7104
1,00 V_20 ,00 13430 1451 148811,00 1580 76 1656
Total 15010 1527 16537
149
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 9,081(b) 1 ,003 Continuity Correction(a)
8,693 1 ,003
Likelihood Ratio 9,986 1 ,002 Fisher's Exact Test ,002 ,001Linear-by-Linear Association 9,079 1 ,003
N of Valid Cases 7104 1,00 Pearson Chi-Square 47,364(c) 1 ,000
Continuity Correction(a)
46,750 1 ,000
Likelihood Ratio 56,093 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 47,361 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 73,15. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 152,91.
V_28 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_28 ,00 5377 622 5999
1,00 1045 60 1105Total 6422 682 7104
1,00 V_28 ,00 12503 1350 138531,00 2507 177 2684
Total 15010 1527 16537
150
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 26,223(b) 1 ,000 Continuity Correction(a)
25,657 1 ,000
Likelihood Ratio 29,860 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 26,219 1 ,000
N of Valid Cases 7104 1,00 Pearson Chi-Square 26,628(c) 1 ,000
Continuity Correction(a)
26,253 1 ,000
Likelihood Ratio 28,802 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 26,626 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 106,08. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 247,84.
V_30 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_30 ,00 5486 526 6012
1,00 936 156 1092Total 6422 682 7104
1,00 V_30 ,00 12798 1177 139751,00 2212 350 2562
Total 15010 1527 16537
151
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_30 ,00 5486 526 6012
1,00 936 156 1092Total 6422 682 7104
1,00 V_30 ,00 12798 1177 139751,00 2212 350 2562
Total 15010 1527 16537
V_31 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_31 ,00 5649 636 6285
1,00 773 46 819Total 6422 682 7104
1,00 V_31 ,00 13192 1428 146201,00 1818 99 1917
Total 15010 1527 16537
152
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 16,927(b) 1 ,000 Continuity Correction(a)
16,412 1 ,000
Likelihood Ratio 19,272 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 16,925 1 ,000
N of Valid Cases 7104 1,00 Pearson Chi-Square 42,846(c) 1 ,000
Continuity Correction(a)
42,299 1 ,000
Likelihood Ratio 49,297 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 42,844 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 78,63. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 177,01.
V_32 * Índice de victimización a personas
Crosstab
Count
Indicador_Muestra
Índice de victimización a personas Total
No Si No ,00 V_32 ,00 3918 378 4296
1,00 2504 304 2808Total 6422 682 7104
1,00 V_32 ,00 9200 815 100151,00 5810 712 6522
Total 15010 1527 16537
153
Chi-Square Tests
Indicador_Muestra Value df Asymp. Sig.
(2-sided) Exact Sig. (2-sided)
Exact Sig. (1-sided)
,00 Pearson Chi-Square 8,042(b) 1 ,005 Continuity Correction(a)
7,810 1 ,005
Likelihood Ratio 7,951 1 ,005 Fisher's Exact Test ,005 ,003Linear-by-Linear Association 8,041 1 ,005
N of Valid Cases 7104 1,00 Pearson Chi-Square 36,398(c) 1 ,000
Continuity Correction(a)
36,067 1 ,000
Likelihood Ratio 35,838 1 ,000 Fisher's Exact Test ,000 ,000Linear-by-Linear Association 36,396 1 ,000
N of Valid Cases 16537
a Computed only for a 2x2 table b 0 cells (,0%) have expected count less than 5. The minimum expected count is 269,57. c 0 cells (,0%) have expected count less than 5. The minimum expected count is 602,23.
Las variables que presentan un p-valor menor a 0,05 y muestran estar
correctamente polarizadas son seleccionadas para el modelo final que se presenta
en el capítulo 3.
154
ANEXO 3:
DISTRIBUCIONES DE CONGLOMERADOS PARA
GUAYAQUIL
A continuación se presentan los cuadros del análisis de conglomerados para la
ciudad de Guayaquil.
Auto-Conglomeradoing
Number of Conglomerados
Schwarz's Bayesian
Criterion (BIC) BIC
Change(a) Ratio of BIC Changes(b)
Ratio of Distance
Measures(c)
1 28106,541 2 24469,229 -3637,313 1,000 1,699 3 22388,119 -2081,110 ,572 1,669 4 21199,515 -1188,604 ,327 1,169 5 20203,669 -995,846 ,274 1,422 6 19546,550 -657,118 ,181 1,027 7 18910,215 -636,336 ,175 1,049 8 18310,256 -599,959 ,165 1,298 9 17881,575 -428,681 ,118 1,125 10 17516,611 -364,964 ,100 1,063 11 17181,784 -334,826 ,092 1,048 12 16869,109 -312,675 ,086 1,029 13 16569,342 -299,767 ,082 1,077 14 16301,553 -267,789 ,074 1,186 15 16098,696 -202,858 ,056 1,074
155
156
157
158