ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

36
ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE INCIDEN EN LA SEVERIDAD DE LOS SINIESTROS VIALES EN EL ÁREA URBANA DE BOGOTÁ Tesis propuesta para optar el título de Magister en Ingeniería Civil con énfasis en Transporte Elaborado por: Yuly Alexandra Cubillos Rojas Asesor: Ph.D. Álvaro Rodríguez Valencia Departamento de Ingeniería Civil y Ambiental Universidad de los Andes Facultad de Ingeniería Departamento de Ingeniería Civil y Ambiental Bogotá D.C. 2019

Transcript of ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

Page 1: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE INCIDEN EN LA SEVERIDAD DE

LOS SINIESTROS VIALES EN EL ÁREA URBANA DE BOGOTÁ

Tesis propuesta para optar el título de Magister en Ingeniería Civil con énfasis en

Transporte

Elaborado por:

Yuly Alexandra Cubillos Rojas

Asesor:

Ph.D. Álvaro Rodríguez Valencia

Departamento de Ingeniería Civil y Ambiental

Universidad de los Andes

Facultad de Ingeniería

Departamento de Ingeniería Civil y Ambiental

Bogotá D.C. 2019

Page 2: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

2

CONTENIDO

1 INTRODUCCIÓN 3

2 OBJETIVOS 4

2.1 OBJETIVO GENERAL 4

2.2 OBJETIVOS ESPECÍFICOS 4

3 SINIESTRALIDAD VIAL BOGOTÁ 4

3.1 CARACTERÍSTICAS DE LOS SINIESTROS VIALES REPORTADOS EN BOGOTÁ 5

3.2 CARACTERÍSTICAS DE LA VÍCTIMA DEL SINIESTRO VIAL 8

4 REVISIÓN DE LITERATURA 9

5 METODOLOGÍA 12

5.1 RECOLECCIÓN DE INFORMACIÓN 12

5.2 GEORREFERENCIACIÓN Y ANÁLISIS ESPACIAL DE DATOS 13

5.3 MODELO LOGIT 15

5.3.1 R2 MCFADDEN 17

5.4 PROCESAMIENTO EN R STUDIO 17

6 RESULTADOS 18

6.1 ANÁLISIS COMPARATIVO GRUPO DE MODELOS 21

7 CONCLUSIONES Y RECOMENDACIONES 26

8 REFERENCIAS 27

9 CARTOGRAFÍA 29

Page 3: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

3

1 INTRODUCCIÓN

En Bogotá en el año 2017 murieron 546 personas en siniestros viales (6.8 muertos por cada

100.000 habitantes) convirtiéndose en la segunda causa de muerte de los bogotanos

después del homicidio (Secretaria Distrital de Movilidad, 2018). Por lo anterior la

administración distrital ha adoptado políticas que apuntan a la disminución de estos

indicadores, como la política internacional de Visión Cero, mediante la cual se estable que

“ninguna muerte en el tránsito es aceptable, todas son evitables”. Esta política se

fundamenta principalmente en la movilidad sostenible y en la generación de infraestructura

segura, especialmente para los actores más vulnerables, como lo son los peatones, ciclistas

y motociclistas.

La literatura existente y los datos disponibles en los recursos bibliográficos nacionales e

internacionales sugieren que existen patrones de problemas persistentes de seguridad

vial relacionados con la infraestructura vial, esto plantea la necesidad de una mayor

comprensión de la identificación de factores de riesgo específicos y su impacto en los

resultados de seguridad vial. Sin embargo, los resultados obtenidos en estos estudios varían

de acuerdo a las características propias lugar de análisis, así como de la combinación de

variables analizadas.

Para el caso de Bogotá se han realizado múltiples estudios, uno de los más recientes es el

estudio realizado por el Instituto de Recursos Mundiales WRI “Entorno Urbano y Seguridad Vial,

Implicaciones de los puentes peatonales, el uso del suelo y la infraestructura del transporte

público masivo en Bogotá” mediante el cual se buscaba determinar relación de los siniestros

viales con su cercanía a los puentes peatonales o al sistema de troncales de la ciudad, en este

estudio se analizaron las variables de manera independiente, por ejemplo se evaluó cada uso

de suelo por separado.

En este sentido, en este estudio se pretende determinar los factores (operativos y físicos)

presentes en el entorno urbano (número de intersecciones, cercanía a puente peatonal,

cercanía a infraestructura exclusiva de ciclistas, etc.) que inciden en la gravedad de los

siniestros viales en el área urbana de Bogotá, a través de un modelo, mediante el cual se

determine de manera conjunta las variables estadísticamente significativas con la gravedad

de los siniestros en períodos anuales completos, desde el año 2016 hasta el año 2018.

Este documento se encuentra organizado de la siguiente manera, en el primer capítulo se

establecen los objetivos generales y específicos de la investigación. Luego se presenta un

análisis de la situación de siniestralidad de la ciudad para los tres años de análisis, describiendo

principalmente las características de la víctima. Seguido de esto, se relaciona y presenta una

síntesis de la revisión de literatura representativa y utilizada como guía para la elaboración de

este documento. En el capítulo 5 se presenta el proceso metodológico adelantado para la

elaboración del modelo. Y por último en los capítulos 6 y 7 se presenta el análisis de resultados,

los hallazgos significativos del estudio y las conclusiones.

Page 4: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

4

2 OBJETIVOS

2.1 OBJETIVO GENERAL

Identificar a través de un modelo la relación entre factores geográficos del entorno urbano

y su influencia en la severidad de los siniestros viales en Bogotá.

2.2 OBJETIVOS ESPECÍFICOS

Generar un modelo de predicción de siniestros desagregado que permita predecir

cómo la naturaleza del entorno urbano, con sus características asociadas a la

movilidad influyen en la gravedad de los siniestros viales en Bogotá.

Realizar un análisis descriptivo de los datos recopilados sobre los accidentes

ocurridos en la ciudad de Bogotá entre los años 2016 y 2018.

Predecir las variaciones de siniestralidad asociadas con el entorno urbano para

establecer recomendaciones de planificación.

3 SINIESTRALIDAD VIAL BOGOTÁ

Bogotá es la ciudad con mayor población del país, 8.080.734 habitantes que corresponden

al 16,4% de la población total de Colombia. En la capital colombiana también se concentra

el mayor registro de vehículos activos, 2.433.446 vehículos que corresponden al 17,8% de

los vehículos registrados en el país. (Secretaria Distrital de Movilidad, 2018)

Figura 1 Índice de mortalidad por cada 100.000 habitantes, Bogotá y Nacional 2000 – 2017. Fuente: Anuario de siniestralidad vial de Bogotá 2017. (Secretaria Distrital de Movilidad, 2018)

Aunque actualmente Bogotá tiene una tasa baja de muertes por cada 100.000 habitantes

(6,76 en el año 2017), esta tasa equivale a la mitad de la tasa reportada del país, como se

muestra en la gráfica anterior. (Secretaria Distrital de Movilidad, 2018).

Page 5: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

5

De acuerdo con la información de siniestralidad disponible en las bases de datos de la

Secretaria Distrital de Movilidad Bogotá, se realiza un resumen del análisis de la información

registrada en el periodo de enero de 2016 y diciembre de 2018.

Figura 2 Mapa de calor siniestralidad Bogotá 2016-2018. Fuente: Elaboración propia con base en datos suministrados

por la SDM

Se identifica que los corredores viales arteriales de la ciudad son los que presentan mayor

cantidad de registros de víctimas de siniestros viales en la ciudad, como se evidencia en la

Figura 2 Mapa de calor siniestralidad Bogotá 2016-2018, en la que se grafican los siniestros

a través de puntos calientes mediante la densidad de Kernel, esta metodología asigna los

rangos densidad de acuerdo a la cercanía entre entidades, asignando rangos de color en las

áreas en las cuales se presenta mayor densidad de puntos.

En las vías arteriales de Bogotá se reportaron 18.798 víctimas, equivalentes al 40% del total

reportadas durante los 3 años de análisis.

3.1 Características de los siniestros viales reportados en Bogotá

De acuerdo con la información disponible de siniestros viales ocurridos en la ciudad, se

cuenta con la siguiente caracterización según la gravedad, clase, perfil temporal y horario.

Page 6: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

6

No se incluyeron los registros de siniestros “solo daños”, ya que estos presentan errores de

georreferenciación y un alto porcentaje de datos atípicos.

En Bogotá en el periodo de tiempo comprendido entre enero de 2016 y diciembre de 2018,

se tuvieron 46.472 registros de víctimas, dentro de los cuales el 3.5% corresponde a víctimas

fatales.

Figura 3 registros de Víctimas por año según gravedad. Fuente: Elaboración propia con base en datos suministrados por la SDM

De acuerdo con la anterior gráfica, es de resaltar que los registros de víctimas fatales

disminuyeron en un 7%. En cuanto a los registros de lesionados del año 2018 presentan un

aumento significativo frente a los registros del 2017 y 2016, esto no significa que haya un

aumento en los indicadores de siniestralidad de la ciudad, sino puede deberse a variables

externas que afectan los reportes de los siniestros con víctimas lesionadas, entre los cuales

se encuentra el tiempo de atención del agente de tránsito, el tiempo de atención de las

ambulancias, los cambios en la operación del sistema de emergencias, el incremento del

apoyo del Centro de Gestión de la Secretaria Distrital de Movilidad para reportar los

siniestros y solicitar atención en menor tiempo, entre otras.

14036 14330

16460

585 547 514

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

2016 2017 2018

LESIONADO MUERTO

Page 7: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

7

Figura 4 registros de siniestros según clase. Fuente: Elaboración propia con base en datos suministrados por la SDM

De acuerdo con la anterior gráfica, la mayor cantidad de siniestros viales en las cuales

mueren las víctimas son choque y atropellos, lo cual refleja que los peatones, los ciclistas y

los conductores son las víctimas más frecuentes de los siniestros viales de la ciudad.

Figura 5 Registro de víctimas en siniestros por mes (2016-2018.) Fuente: Elaboración propia con base en datos suministrados por la SDM

De acuerdo con la Figura 5 Registro de víctimas en siniestros por mes (2016-2018.), en el

periodo de análisis (2016-2018), los meses en los cuales se registran más víctimas son

octubre y agosto. El mes que registra menor siniestralidad es enero. En cuanto a días el

viernes y el martes registran el mayor número de víctimas en la ciudad.

0 5000 10000 15000 20000 25000 30000 35000

ATROPELLO

AUTOLESION

CAIDA DE OCUPANTE

CHOQUE

INCENDIO

OTRO

VOLCAMIENTO

LESIONADO

MUERTO

0

500

1000

1500

2000

2500

3000

3500

4000

4500

MUERTO

LESIONADO

Page 8: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

8

Figura 6 Registros de víctimas en siniestros por día de la semana (2016-2018). Fuente: Elaboración propia con base en datos suministrados por la SDM

3.2 Características de la víctima del siniestro vial

En cuanto a clasificación por género las víctimas tanto heridas como fallecidas en mayoría

corresponden a hombres, superando por más de la mitad a las mujeres, como se evidencia

en la Figura 7 Registros de víctimas según género a continuación.

Figura 7 Registros de víctimas según género. Fuente: Elaboración propia con base en datos suministrados por la SDM

De acuerdo con el gráfico se obtiene que, para el período de análisis, el rango etario con

mayor cantidad de víctimas son mujeres y hombres de 21 a 30 años, en mayor proporción

son víctimas de sexo masculino.

0 1000 2000 3000 4000 5000 6000 7000 8000

DOMINGO

LUNES

MARTES

MIERCOLES

JUEVES

VIERNES

SABADO

LESIONADO

MUERTO

36%

63%

1%

LESIONADO

FEMENINO MASCULINO SIN INFORMACION

19%

74%

7%

MUERTO

FEMENINO MASCULINO SIN INFORMACION

Page 9: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

9

Figura 8 rango etario de población en Bogotá. Fuente DANE Figura 9 Registros de víctimas según rango etario. Fuente:

Elaboración propia con base en datos suministrados por la SDM

De acuerdo con los datos de población del DANE para el año 2016, tiene que los rangos

etarios con mayor población son personas entre 31 y 40 años y 21 a 30 años, sin embargo,

la proporción de personas en la que resultan heridas y muertas es mayor para el rango de

los 21 a 30 años.

Figura 10 Registros de víctimas por condición. Fuente: Elaboración propia con base en datos suministrados por la SDM.

De total de víctimas de siniestros viales registrados de la ciudad durante el periodo de enero

2016 a diciembre de 2018 se tiene que el 26% corresponde a peatones, el 29% a pasajero,

el 30% a motociclistas, el 6% corresponde a conductores y el 10% a ciclista.

4 REVISIÓN DE LITERATURA

La búsqueda bibliográfica, la selección de estudios, la codificación y el análisis para cada

factor de riesgo se llevaron a cabo durante todo el proceso de elaboración de este

0-10

11-20

21-30

31-40

41-50

51-60

61-70

71-80

>80

-20% -10% 0% 10% 20%

Hombres Mujeres

0-10

11-20

21-30

31-40

41-50

51-60

61-70

71-80

>80

-40% -20% 0% 20%

MASCULINO FEMENINO

C I C L I S T A

C O N D U C T O R

M O T O C I C L I S T A

P A S A J E R O

P E A T O N

4372

2818

13235

13302

11099

193

31

476

149

797

LESIONADO

MUERTO

Page 10: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

10

documento. Las principales bases de datos utilizadas para buscar estudios relacionados

sobre modelos y análisis de siniestralidad se obtuvieron a partir de la búsqueda en el

sistema de recursos electrónicos de la Universidad de los Andes Science Direct y en Google

Scholar.

(Wier et al, 2009) realizaron una investigación denominada “An area-level model of vehicle-

pedestrian injury collisions with implications for land use and transportation planning” en la

cual evaluaron un modelo de regresión multivariada agregado de accidentes con peatones

lesionados en las vías locales de San Francisco California, para este estudio utilizaron

variables de las vías, usos de suelo, características de la población y comportamientos de

viajes. Concluyeron que los peatones representan el 11% de las muertes por colisión de

vehículos motorizados, y el 15% de las personas murieron mientras caminaban en

California. De acuerdo con los hallazgos se identificó que el volumen vehicular es un factor

importante en los accidentes en los cuales se ven involucrados peatones. Además del

volumen vehicular, la población de empleados y residentes, calles arteriales sin transporte

público, proporciones de área de tierra dividida para uso comercial de vecindario y uso

comercial de barrio residencial, son predictores estadísticamente significativos de

accidentes de lesiones vehiculares-peatonales. Este estudio se utilizó como insumo para la

determinación y caracterización de variables de uso de suelo y de las vías a ser incluidas

dentro de la evaluación del modelo.

(Gómez et al, 2014) Gómez y Bocarejo realizaron una investigación “Accident prediction

Models for bus rapid transit systems: Generalized linear models versus neural network” en

la cual consistió en una comparación de tres modelos basados en regresión de Poisson,

regresión binomial negativa y redes neuronales mediante los cuales se analizan los factores

que influyen en la frecuencia de accidentes en el sistema BRT de Bogotá y comparan los

resultados. Encontraron que el modelo basado en redes neuronales presenta mejores

indicadores predictivos, sin embargo, las mejoras en la predictibilidad del modelo de red

neuronal no son lo suficientemente relevantes como para afirmar categóricamente que

este modelo es mejor en la predicción de accidentes en los sistemas de BRT. Asimismo,

dadas las características de los accidentes en el sistema BRT modelado, la regresión de

Poisson es más apropiada que la regresión binomial negativa para el análisis de los

siniestros. A partir de los resultados de esta investigación, la cual está enfocada a vías de

Bogotá, se determinan las posibles variables a analizar y se realiza el proceso de selección

del modelo más acorde con los datos disponibles.

(Patil, 2012) en su investigación “Analysis of crash severities using nested logit model—

Accounting for the underreporting of crashes” realizó un modelo con el fin de determinar la

importancia de variables e información asociada a los siniestros viales, su área de estudio

fueron las carreteras del estado de Texas. Para la evaluación del modelo incluyeron

variables sobre la gravedad del accidente, el tipo de accidente, la información de la

carretera, la condición ambiental, el sexo y la edad del conductor, la edad del vehículo y la

Page 11: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

11

conducción bajo la influencia del alcohol. En cuanto a severidad del accidente utilizaron 4

categorías, fatal, incapacitante, no incapacitante y sin lesiones. Como resultados se obtuvo

que los ciclistas entre 25 y 30 años son los más accidentados, y su gravedad aumenta cuanto

hay presencia de alcohol. También resultaron relevantes las variables de luminosidad y

velocidad del vehículo con la gravedad del siniestro. Este estudio permitió establecer una

metodología para el análisis de variables asociadas a la gravedad de los siniestros utilizando

un modelo de elección discreta.

(Fan Ye, 2014) en su estudio titulado “Comparing three commonly used crash severity

models on sample size requirements: Multinomial logit, ordered probit and mixed logit

models” realizó una comparación de tres modelos de gravedad de siniestros, uno fue un

logit multinomial, otro un modelo probit ordenado y por último un modelo logit mixto, con

el fin de determinar el efecto de la muestra de datos, como es el comportamiento y cual

tiene un mejor ajuste utilizando 27 variables independientes para cinco tipos de gravedad.

Para el modelo logit multinomial, se trabajaron 10 variables significativas, para el modelo

probit ordenado se utilizaron 18 variables y para el modelo logit mixto se utilizaron las 27

variables. Finalmente, comparando los tres modelos, se encuentra que el modelo logit

mixto es más interpretativo que el modelo logit multinomial, ya que el primero incluye la

aleatoriedad asociada con algunas variables. El modelo probit ordenado no tiene el mismo

poder interpretativo que el logit multinomial y los modelos logit mixtos. En conclusión y

como aporte para la elaboración de este documento, se tiene obtiene una metodología

para el análisis de modelos predictivos de siniestralidad, así como el uso de variables

representativas dentro de cada modelo.

(Gomes, 2013) en su estudio “The influence of the infrastructure characteristics in urban

road accidents occurrence” Gomes desarrolló varios modelos para estimar la frecuencia de

accidentes viales de las intersecciones y segmentos de vía en de Lisboa. A partir de la

distribución de Poisson-gamma determinó las variables relacionadas con el entorno vial y

la accidentalidad. Este estudio presenta diferentes modelos desagregados con diferentes

variables de análisis como características físicas de la carretera, las intersecciones y los

segmentos viales. Determinó que las variables explicativas significativas asociadas con los

aumentos en la frecuencia de los accidentes fueron el tráfico, el ancho promedio de carril,

la presencia de carriles de giro a la derecha, los dispositivos de control de tráfico, el número

total de carriles y el número de tramos de la intersección. Esta investigación define variables

de la infraestructura vial representativas dentro de los análisis de siniestralidad, que pueden

ser evaluadas de igual forma en el modelo de gravedad de siniestros viales.

(Greibe, 2003) realizó una investigación titulada “Accident prediction models for urban

roads” cuyo objetivo principal fue establecer modelos de accidentes simples y factibles que

puedan predecir el número esperado de accidentes en las uniones urbanas y enlaces de

carreteras con la mayor precisión posible en las carreteras de Dinamarca. Se utilizaron

técnicas de modelado lineal generalizadas para relacionar las frecuencias de accidentes con

Page 12: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

12

las variables explicativas. Las variables explicativas que describen el diseño de la carretera

y la geometría de la carretera demostraron ser significativas para los modelos de enlace de

carreteras, pero menos importantes en los modelos de cruce. La variable más poderosa

para todos los modelos fue el flujo de tráfico de vehículos motorizados.

(Francesca La Torre et al, 2019) “Accident prediction models for urban roads” en este

estudio desarrollaron dos modelos de predicción de accidentes utilizando un conjunto de

datos que incluye información sobre 884 km de segmentos de autopistas en un período de

5 años. Los modelos de predicción de accidentes se desarrollaron con variables como tipo

de carretera, segmento de la autopista tipo de área, sección transversal. Los modelos

permitieron estimar accidentes fatales y lesiones por año en una dirección de viaje con las

variables descritas.

En consecuencia, de acuerdo con los hallazgos evidenciados en las referencias

bibliográficas, en este estudio se realizó un modelo de gravedad de siniestros tipo logit, el

cual se ajusta con las variables seleccionadas en el entorno geográfico de la ciudad de

Bogotá

5 METODOLOGÍA

La metodología aplicada para el modelo aplicado de siniestros viales en Bogotá se

fundamentó en los 5 pasos que se muestran en la Figura 11 Esquema de la metodología

planteada y se describe a continuación:

Figura 11 Esquema de la metodología planteada. Fuente: Elaboración propia

5.1 Recolección de información

Para la elaboración del modelo se requirió información de siniestralidad de la ciudad,

características físicas, operativas y usos de suelo.

La información obtenida de las bases de datos de siniestralidad georreferenciadas, fueron

suministradas por la Secretaria Distrital de Movilidad, se utilizaron las bases completas de

accidentes, heridos y muertos, para un periodo de tres años (2016-2018).

Page 13: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

13

Los datos de siniestralidad son obtenidos utilizando la base de datos del Sistema de

Información Geográfica de Accidentes de Tránsito (SIGAT) que incluye los accidentes

reportados por la Policía de Tránsito con diligenciamiento de IPAT y georreferenciados por

la Secretaria Distrital de Movilidad.

En cuanto a la información de malla vial, puentes peatonales, red semafórica, red de

ciclorrutas, usos de suelo y red de transporte público fueron descargadas del geo portal del

Instituto de Desarrollo Urbano IDU y de las bases de metadatos del IDECA cuya fuente es la

Secretaría Distrital de Planeación.

Figura 12 Información Secundaria obtenida. Fuente: Elaboración propia

5.2 Georreferenciación y análisis espacial de datos

Para el análisis de datos y generación de las bases de datos para el modelo se empleó el

Software Arcgis y sus herramientas de análisis geográfico. Los datos de siniestros con

heridos y muertos, son unas capas o shape de puntos georrefenciados que contienen las

características de la víctima (edad, sexo, condición) y un reporte del siniestro (hora, fecha

mes, día dirección exacta).

Mediante el uso de esta herramienta se asociaron las características de las otras capas de

geometrías diferentes (puntos, polígonos, líneas), siempre vinculándolas al ID del registro

del siniestro, para mantener la georreferenciación.

Se utilizaron datos de conteo para las variables de infraestructura y operativas, por ejemplo,

el número de intersecciones semaforizadas en un radio de 300 metros del lugar donde

ocurrió el siniestro. Y para las variables categóricas, posteriormente se realizó la

codificación de las variables para facilitar su procesamiento de la siguiente forma:

Page 14: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

14

NOMBRE NOMBRE DE LA VARIABLE TIPO DESCRIPCIÓN VALORES

CODIGO_ACC CÓDIGO DE ACCIDENTE TEXTO CÓDIGO DE ACCIDENTE

FORMULARIO FORMULARIO DEL ACCIDENTE TEXTO FORMULARIO DEL ACCIDENTE

ANO_OCURRE AÑO DE OCURRENCIA DEL ACCIDENTE

NUMERO AÑO DE OCURRENCIA DEL ACCIDENTE

MES_OCURRE MES DE OCURRENCIA DEL ACCIDENTE

NUMERO 1 A 12 MES DE OCURRENCIA DEL ACCIDENTE

DIA_OCURRE DÍA DE OCURRENCIA DEL ACCIDENTE

NUMERO 1 A 7 DÍAS DE LA SEMANA

DIRECCIÓN DIRECCIÓN DONDE OCURRIÓ EL ACCIDENTE

TEXTO DIRECCIÓN DONDE OCURRIÓ EL ACCIDENTE

CLASE CLASE DE ACCIDENTE NUMERO 1 CHOQUE, 2 ATROPELLO, 3 AUTOLESIÓN, 4 CAÍDA DE OCUPANTE, 5 VOLCAMIENTO, 6 INCENDIO, 7 OTRO

LOCALIDAD LOCALIDAD EN LA CUAL OCURRIÓ EL ACCIDENTE

NUMERO 1 a 20 LOCALIDAD EN LA CUAL OCURRIÓ EL ACCIDENTE

CONDICIÓN CONDICIÓN DEL ACCIDENTADO NUMERO 1 PEATÓN, 2 CICLISTA, 3 MOTOCICLISTA, 4 CONDUCTOR, 5 PASAJERO

GENERO GENERO DE LA VICTIMA NUMERO 1 FEMENINO, 2 MASCULINO, 3 SIN INFORMACIÓN

EDAD EDAD DE LA VICTIMA NUMERO EDAD DE LA VICTIMA

LES_MUER GRAVEDAD DE LA VICTIMA NUMERO 0 LESIONADO, 1 MUERTO

MVITCLA

CLASIFICACIÓN DE LA MALLA VIAL EN DONDE OCURRIÓ EL ACCIDENTE

NUMERO 1 ARTERIAL, 2 INTERMEDIA, 3 LOCAL, 6 PEATONAL

USO SUELO USO DE SUELO DONDE OCURRIÓ EL ACCIDENTE

NUMERO

1 RESIDENCIAL, 2 INDUSTRIAL, 3 DOTACIONAL, 4 COMERCIO Y SERVICIOS, 5 ÁREA DE ACTIVIDAD CENTRAL, 6 ÁREA URBANA INTEGRAL, 7 ÁREA DE ACTIVIDAD MINERA, 8 SUELO PROTEGIDO.

UPLCODIGO CÓDIGO DE LA UPZ UNIDAD DE PLANEAMIENTO ZONAL

NUMERO CÓDIGO DE LA UPZ UNIDAD DE PLANEAMIENTO ZONAL

UPLNOMBRE NOMBRE DE LA UPZ TEXTO NOMBRE DE LA UPZ

POBLACIÓN POBLACIÓN DE LA UPZ NUMERO POBLACIÓN DE LA UPZ

NO_VEH

TASA DE VEHÍCULOS POR CADA 100.000 HAB (ENCUESTA DE MOVILIDAD 2015)

NUMERO TASA DE VEHÍCULOS REGISTRADOS EN LA UPZ (ENCUESTA DE MOVILIDAD 2015)

DP DENSIDAD POBLACIONAL DE LA UPZ

NÚMERO DE HABITANTES POR HA

CICLORRUTA CICLORRUTA CERCANA (500 M) NUMERO 0 NO 1 SI

RUTAS_SITP

NUMERO DE RUTAS QUE TRANSITAN EL PUNTO DONDE SE REGISTRO EL ACCIDENTE

NUMERO NUMERO DE RUTAS QUE TRANSITAN EL PUNTO DONDE SE REGISTRO EL ACCIDENTE

PUENTES_PE

NUMERO DE PUENTES PEATONALES A 300 METROS DE RADIO

NUMERO NUMERO DE PUENTES CERCANOS A EL PUNTO DONDE SE REGISTRO EL ACCIDENTE

Tabla 1 Variables de análisis. Fuente: Elaboración propia con base en datos suministrados por la SDM

Finalmente, se obtuvo una base de datos con la siguiente información:

Page 15: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

15

46472 registros de lesionados y muertos en siniestros viales para tres años de

análisis (2016-2018)

44826 lesionados y 1646 muertos.

8 columnas de registros de características de las Víctimas

9 columnas de registros de caracterización del entorno vial en el cual ocurrió el

siniestro.

Las variables independientes fueron cuantificadas y codificadas de acuerdo con lo

enunciado en la Tabla 1 Variables de análisis. El modelo final resulta a partir de los atributos

de los datos geográficos que se ilustran en la Figura 13 Variables de análisis incluidas en el

modelo.

Figura 13 Variables de análisis incluidas en el modelo. Fuente: Elaboración propia

5.3 Modelo Logit

De acuerdo con la literatura para la modelación de siniestros viales, el modelo Logit es que

mejor se ajusta el análisis de datos de gravedad, debido a la flexibilidad en términos de la

captura de los efectos de las variables independientes. (John C. Milton, 2007). Diferentes

estudios realizados en el área de seguridad vial relacionados en el capítulo 4 de este

documento, han demostrado la utilidad de los modelos Logit para modelar la gravedad de

los siniestros viales, e identificar el efecto de diferentes factores que inciden es su gravedad.

En general en estos modelos se asume la misma probabilidad de ocurrencia para cada nivel

de gravedad de la lesión en los datos. (Sunil Patil, 2012)

En los últimos años se han desarrollado metodologías apoyadas en el uso de herramientas

SIG y regresión múltiple, que tratan de estimar la siniestralidad en función de un reducido

Page 16: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

16

número de variables, con el fin de identificar las que más inciden en la ocurrencia de los

siniestros y de esta forma implementar medidas para su reducción. Este tipo de modelos

tienen la ventaja de su simplicidad y la facilidad para interpretar sus resultados. Sin

embargo, estos modelos usan análisis de regresión múltiple (OLS) que asume estabilidad

paramétrica y que no funcionan como modelos predictores para variables cuantificables,

como en este caso. (Gutiérrez Puebla, 2012)

Así mismo, el uso de la gravedad de los siniestros como fuente para la planeación de

medidas encaminadas a la seguridad vial es diferente, ya que la frecuencia no determina la

gravedad, por lo tanto, la aplicación de modelos de regresión múltiple requiere del análisis

de un modelo diferente para cada nivel de gravedad. (John C. Milton, 2007). La frecuencia

de los siniestros con diferencias de gravedad es independiente entre sí, porque a medida

que cambia la frecuencia de un tipo de gravedad, la frecuencia de otros tipos también

cambiará.

Por otro lado, se revisó como afecta la proporcionalidad de los datos, dado que los

lesionados (96.5%) tienen una proporción mayor frente a las víctimas fatales (3.5%) y de

acuerdo a lo indicado Gary King y Langche Zeng en su artículo Logistic Regression in Rare

Events Data, los procedimientos estadísticos populares, como la regresión logística, pueden

subestimar la probabilidad de eventos raros, por lo cual se recomienda utilizar correcciones

que superen los métodos existentes con el fin de no descartar variables cuantificadas. (Gary

King, 2001).

Por lo anterior, se utilizó un modelo Logit para datos desagrupados y se calcula Rho-

cuadrado de McFadden para determinar su correlación. La variable dependiente

seleccionada es la gravedad del siniestro, asignando 0 para víctima lesionado y 1 para

víctima fatal. Cabe resaltar que, aunque se cuenta con información con gravedad de “solo

daños” no se utilizaron estos datos. Los siniestros en Bogotá reportados con gravedad de

solo daños, presentan información más dispersa, menos detallada y con más presencia de

datos atípicos, debido a que los informes policiales no son tan completos como cuando se

registran víctimas, así como factores externos expuestos posteriormente.

El modelo logit en este caso se expresa como:

𝐿𝑖 = ln (𝑃𝑖

1 − 𝑃𝑖)

𝐿𝑖 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝛽3𝑋3 + 𝛽𝑛𝑋𝑛 + 𝜖

𝑃𝑖 = 0 sí es lesionado y 𝑃𝑖 = 1 si es muerto.

Page 17: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

17

Para la evaluación de este modelo debemos tener en cuenta las siguientes observaciones

generales:

1. Como empleamos el método de máxima verosimilitud, que en general es para muestras

grandes, los errores estándar estimados son asintóticos.

2. Como resultado, en vez del estadístico t para evaluar la importancia estadística de un

coeficiente, empleamos el estadístico (normal estandarizado) Z, por lo que las inferencias

se basan en la tabla normal. Si el tamaño de la muestra es razonablemente grande, la

distribución t converge a la distribución normal.

3. La medida convencional de la bondad de ajuste, R2, no es particularmente significativa

para los modelos con variable independiente binaria. Existen diversas medidas similares a

R2, llamadas pseudo R2 o R2 McFadden, denotada como R2McF, cuyo valor varía entre 0 y 1.

(Damodar N. Gujarati, 2009).

5.3.1 R2 McFadden

Los modelos de regresión logit se ajustan utilizando el método de máxima verosimilitud, es

decir, las estimaciones de los parámetros son aquellos valores que maximizan la

probabilidad de los datos observados. La medida al cuadrado de McFadden se define como

𝑅𝑀𝑐𝐹2 = 1 −

log(𝐿𝑐)

log(𝐿𝑛𝑢𝑙𝑙)

donde denota el valor de probabilidad (maximizado) del modelo ajustado actual, y denota

el valor correspondiente para el modelo nulo. (Bartlett, 2014)

5.4 Procesamiento en R Studio

Para la obtención del modelo se realizó el análisis mediante el software estadístico R Studio, el cual cuenta con un paquete para estimar los modelos logit con base en datos no agrupados y cuantitativos. El procesamiento de los datos se realizó a través del modelo de estimación logit (modelo

lineal de probabilidades), para lo cual es necesario usar la función GLM utilizando la familia

de probabilidad. Los datos utilizados son los obtenidos después del procesamiento de

información georreferenciados de siniestros en ArcGis, tal y como se describió en el

subcapítulo de Georreferenciación y análisis espacial de datos.

Después de cargar la base de datos, se debe convertir en Data Frame para trabajarlos en R

Studio, debido a que cuando se realiza un estudio estadístico sobre los objetos de una

muestra, la información se organiza en una nueva hoja de datos, en los que cada fila

corresponde a un objeto y cada columna a una variable de ese objeto. Luego se define la

Page 18: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

18

variable dependiente y se convierte como factor binario, y posteriormente se procede a

correr el modelo, con las variables determinadas.

Tabla 2 visualización de primeros 20 filas cargadas en R Studio. Fuente: Elaboración propia con base en datos suministrados por la SDM

6 RESULTADOS

Los resultados del modelo permiten identificar la significancia estadística y relación de las

variables independientes con la gravedad del siniestro (variable dependiente). Con los

resultados obtenidos se realizó un análisis de sensibilidad variando las variables

independientes del modelo y su vez eliminado las variables menos representativas, esto

con el fin de determinar el modelo que presenta mejor ajuste estadístico.

Los resultados indican que características como el mes de ocurrencia del siniestro, la

ubicación geográfica dentro de una UPZ (Unidad de planeamiento zonal) y la población, no

son variables que inciden en la gravedad de los siniestros viales. Por el contrario, las

variables de características de las víctimas como la edad, el género y la condición son muy

representativas, así como las características físicas como la cercanía a un puente peatonal

o una intersección semaforizada.

Modelo 1: 16 variables

Variable Estimate Std. Error z value Pr(>|z|)

(Intercept) -4,77E+03 2,13E+02 -22.417 < 2e-16 ***

EDAD 1,50E+01 1,21E+00 12.377 < 2e-16 ***

GENERO 9,97E+02 6,00E+01 16.617 < 2e-16 ***

CONDICION -4,03E+02 1,95E+01 -20.703 < 2e-16 ***

MES_OCURRE -6,19E+00 7,51E+00 -0.824 0.40994

DIA_OCURRE 2,83E+01 1,33E+01 2.125 0.03360 *

CLASE 2,27E+02 2,37E+01 9.594 < 2e-16 ***

LOCALIDAD 9,55E+00 5,24E+00 1.824 0.06815 .

MVITCLA -1,31E+02 3,16E+01 -4.139 3.49e-05 ***

UPLCODIGO -3,43E-01 9,11E-01 -0.377 0.70649

POBLACIÓN 2,23E-04 3,57E-04 0.626 0.53160

Page 19: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

19

NO_VEH -2,78E-03 3,18E-03 -0.874 0.38238

RUTAS_SITP 4,40E+00 2,78E+00 1.583 0.11347

COD_USO -7,35E+00 1,61E+01 -0.457 0.64747

INT_SEM -1,72E+02 6,87E+01 -2.508 0.01215 *

RED_BICI -1,61E+02 6,64E+01 -2.429 0.01513 *

PUENTE_PE 2,46E+02 8,41E+01 2.926 0.00344 **

Tabla 3 resultados de evaluación modelo logit (todas las variables). Fuente: Elaboración propia

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1) Null deviance: 14221 on 46443 degrees of freedom Residual deviance: 13039 on 46427 degrees of freedom (28 observations deleted due to missingness) AIC: 13073

Deviance Residuals:

Min 1Q Median 3Q Max

-10.871 -0.2874 -0.2271 -0.1544 34.746 Tabla 4 desviación de los residuales modelo 1, Fuente: Elaboración propia

En la interpretación de los p-valores se puede ver que las variables de edad, genero,

condición, clase y clasificación vial son altamente significativas, mientras que la variable de

cercanía a puente peatonal es significativa; y las variables de red semafórica, red de

ciclistas, localidad y día de ocurrencia son moderadamente significativas (p-valor entre 0.01

y 0.05)

El R2 McFadden en este caso es bajo, sin embargo, se encuentra dentro del rango admisible

de 0 a 1 y sirve para realizar comparación entre modelos.

R2 McFadden = 0.18369575

Coeficientes del modelo (la proporción de probabilidades estimada)

(Intercept) EDAD GENERO CONDICIÓN MES_OCURRE DIA_OCURRE CLASE LOCALIDAD MVITCLA

0.0085 1.0151 2.7107 0.6682 0.9938 1.0287 1.2551 1.0096 0.8774

UPLCODIGO POBLACIÓN NO_VEH RUTAS_SITP COD_USO INT_SEM RED_BICI PUENTE_PE

0.9997 1.0000 0.9999 1.0044 0.9927 0.8417 0.8511 1.2791

Modelo 2: 10 variables

Los resultados del modelo anterior en el cual se incluyeron todas las variables, sugieren que

algunas de estas no son estadísticamente significativas para predecir la gravedad del

siniestro, por lo cual se omiten y se vuelve a realizar la modelación.

Page 20: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

20

Variable Estimate Std. Error z value Pr(>|z|)

(Intercept) -4.802706 0.189214 -25.382 < 2e-16 ***

EDAD 0.015062 0.001211 12.439 < 2e-16 ***

GENERO 0.996646 0.060005 16.609 < 2e-16 ***

CONDICION -0.404611 0.019428 -20.826 < 2e-16 ***

DIA_OCURRE 0.028984 0.01331 2.178 0.02943 *

CLASE 0.227678 0.023648 9.628 < 2e-16 ***

LOCALIDAD 0.010397 0.005084 2.045 0.04084 *

MVITCLA -0.136557 0.029675 -4.602 4.19E-06 ***

INT_SEM -0.163332 0.067729 -2.412 0.01589 *

RED_BICI -0.16561 0.06551 -2.528 0.01147 *

PUENTE_PE 0.224316 0.082635 2.715 0.00664 **

Null deviance: 14221 on 46443 degrees of freedom Residual deviance: 13044 on 46433 degrees of freedom (28 observations deleted due to missingness) AIC: 13066

El criterio de información de Akaike (AIC) es una medida de la calidad relativa de un modelo

estadístico, para un conjunto dado de datos. Como tal, el AIC proporciona un medio para la

selección del modelo. La metodología AIC intenta encontrar el modelo que mejor explica

los datos con un mínimo de parámetros libres y, por lo tanto, penaliza a los modelos con un

gran número de parámetros. El modelo con el AIC más bajo se considera el mejor modelo

entre todos los modelos disponibles.

En este segundo modelo la interpretación de los p-valores podemos ver que las variables

de edad, genero, condición, clase y clasificación vial continúan siendo las variables más

significativas.

Deviance Residuals:

Min 1Q Median 3Q Max

-1.0828 -0.2867 -0.2277 -0.1548 3.4997 Tabla 5 desviación de los residuales modelo 2

El R2 McFadden en este caso es 0.18333943 un poco más bajo que el anterior, sin embargo,

la significancia mejoró en algunas variables.

Coeficientes del modelo (la proporción de probabilidades estimada)

(Intercept) EDAD GENERO CONDICIÓN DIA_OCURRE CLASE

0.0082 1.0151 2.7091 0.6672 1.0294 1.2556

LOCALIDAD MVITCLA INT_SEM RED_BICI PUENTE_PE

1.0104 0.8723 0.8493 0.8473 1.2514

Page 21: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

21

El valor de los estimados no tiene una interpretación directa, dado que se trata de

coeficientes de una función logit, sin embargo, el signo de este valor si es importante, el

signo negativo indica una relación negativa (a medida que aumenta el valor de la variable

disminuye la severidad del siniestro) y el signo positivo indica una relación positiva (si

aumenta el valor aumenta la gravedad del siniestro).

Por lo anterior y de acuerdo con los resultados del modelo, las variables con estimadores

negativos son la condición, el mes de ocurrencia, la clasificación vial, la cercanía una

intersección semaforizada y la cercanía a red de biciusuarios. En cuanto a la condición del

siniestro los peatones y los ciclistas son los que más inciden en la gravedad. Las vías más

críticas son las que pertenecen a la malla vial arterial, y las que cuentan con menor cercanía

de la red de ciclorrutas o de una intersección semaforizada.

Asimismo, los resultados del modelo indican que entre mayor sea la edad de la víctima,

mayor su gravedad. En cuanto a la clase del siniestro, el choque y el atropello tienen mayor

gravedad, así como la cercanía a un puente peatonal.

6.1 ANÁLISIS COMPARATIVO GRUPO DE MODELOS

Se analizaron tres grupos de modelos utilizando las variables de infraestructura, uso de

suelo y demográficas, con el fin de analizarlas dentro del modelo de gravedad de siniestros.

Grupo 1 de modelos

En el primer grupo, se analizaron todas las variables de cada categoría en un solo modelo

(modelo A), luego se evaluaron cada una de manera independiente (modelo B) y por último

se evaluaron por pares de categorías de variables (modelo C), los resultados se muestran a

continuación:

MODELO A

INFRAESTRUCTURA ARTERIAL 1.88.E-01 INTERMEDIA -1.65.E-01 LOCAL -1.37.E-01 PEATONAL NA RUTAS SITP 2.53.E-03

INTERSECCIÓN SEMAFORIZADA -7.69.E-02 RED DE CICLORRUTAS -1.20.E-01 .

PUENTE PEATONAL 2.55.E-01 ** USOS DE SUELO

RESIDENCIAL -1.87.E-01 . DOTACIONAL -1.97.E-01 INDUSTRIAL 1.33.E-01

COMERCIO -2.41.E-01 * ÁREA DE ACTIVIDAD INTEGRAL NA ÁREA DE ACTIVIDAD CENTRAL -5.48.E-01 ** SUELO DE PROTECCIÓN -4.93.E-01

Page 22: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

22

DEMOGRÁFICAS

TASA DE VEHÍCULOS POR HABITANTES -2.97.E-07 DENSIDAD POBLACIONAL -1.87.E-04 TASA DE OCUPACIÓN LABORAL -2.41.E-02 ***

R2 de McFadden 0.1024339

En el modelo A en el cual se incluyeron todas las variables de cada categoría, se tiene que,

dentro de las variables de infraestructura las más significativas son la cercanía al puente

peatonal y a la red de ciclorrutas. La gravedad del siniestro aumenta cuando se encuentra

cerca un puente peatonal y cuando no hay cercanía a la red de ciclorrutas.

En cuanto a los usos de suelo, son variables significativas dentro del modelo, resaltando que

la gravedad del siniestro disminuye no se presenta uso comercial, el área de actividad

central y el uso residencial.

Y por último de las variables demográficas, la más significativa dentro de la categoría y

dentro del grupo es la tasa de ocupación laboral, entre menor es la tasa de ocupación en la

zona, mayor es la gravedad de los siniestros.

MODELO B

INFRAESTRUCTURA

ARTERIAL 8.39.E-02

INTERMEDIA -2.70.E-01

LOCAL -2.13.E-01

PEATONAL

RUTAS SITP 4.35.E-03

INTERSECCIÓN SEMAFORIZADA -1.47.E-01 *

RED DE CICLORRUTAS -1.71.E-01 *

PUENTE PEATONAL 2.16.E-01 **

USOS DE SUELO

RESIDENCIAL

-1.99.E+00 ***

DOTACIONAL -1.94.E+00 **

INDUSTRIAL -1.63.E+00 **

COMERCIO -2.06.E+00 ***

ÁREA DE ACTIVIDAD INTEGRAL -1.79.E+00 **

ÁREA DE ACTIVIDAD CENTRAL -2.55.E+00 ***

SUELO DE PROTECCIÓN -2.17.E+00 **

DEMOGRÁFICAS

TASA DE VEHÍCULOS POR HABITANTES

-2.45.E-08

DENSIDAD POBLACIONAL -5.52.E-04 *

TASA DE OCUPACIÓN LABORAL -2.66.E-02 ***

R2 de McFadden 0.09954258 0.09813682 0.09675876

Page 23: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

23

En el Modelo B se evaluaron las categorías de variables de manera independiente. Dentro

de las variables de infraestructura las más significativas son la cercanía a los puentes

peatonales, la red de ciclorrutas y las intersecciones semaforizadas, si no se cuenta con este

tipo de infraestructura en un entorno de 300 metros, mayor es la gravedad del siniestro. En

cuanto a los usos de suelo los más significativos son el uso de suelo residencial, comercial y

las áreas de actividad central. Por último, dentro de las variables demográficas, la más

significativa es la tasa de ocupación laboral seguido de la densidad poblacional.

MODELO C

INFRAESTRUCTURA

ARTERIAL 1.10.E-01 1.83.E-01

INTERMEDIA -2.32.E-01 -1.83.E-01 LOCAL -1.86.E-01 -1.52.E-01 PEATONAL NA NA RUTAS SITP 3.81.E-03 2.82.E-03 INTERSECCIÓN SEMAFORIZADA -1.05.E-01 -1.03.E-01 RED DE CICLORRUTAS -1.54.E-01 * -1.22.E-01 * PUENTE PEATONAL 2.19.E-01 ** 2.51.E-01 **

USOS DE SUELO

RESIDENCIAL -2.04.E-01 *

-1.78.E-01 *

DOTACIONAL -2.41.E-01 -1.21.E-01 INDUSTRIAL 6.79.E-02 1.90.E-01 COMERCIO -3.23.E-01 ** -2.09.E-01 * ÁREA DE ACTIVIDAD INTEGRAL -7.18.E-01 ÁREA DE ACTIVIDAD CENTRAL -6.27.E-01 ** SUELO DE PROTECCIÓN -5.12.E-01 -3.93.E-01

DEMOGRÁFICAS

TASA DE VEHÍCULOS POR HABITANTES

-3.29.E-07 -2.34.E-07

DENSIDAD POBLACIONAL -2.96.E-04 -4.13.E-04 *

TASA DE OCUPACIÓN LABORAL -2.74.E-02 *** -2.23.E-02 ***

R2 de McFadden 0.1014447 0.1009549 0.09857269

Para el modelo C se incluyeron las variables por grupos de dos categorías, se tiene que tiene

mayor relación las variables de uso de suelo con las variables de infraestructura. Las

variables más significativas en este caso son el uso de suelo comercial y residencial y la

cercanía al puente peatonal o la red de ciclorrutas. En el modelo en el cual se evaluaron las

variables de infraestructura y las variables demográficas siguen siendo significativas las

variables de la cercanía al puente peatonal y la tasa de ocupación laboral.

Grupo 2 de modelos

En este grupo se evaluaron las tres categorías de variables (infraestructura, usos de suelo y

demográficas) para determinar su significancia en la clase del siniestro reportada.

Page 24: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

24

ATROPELLO CHOQUE CAÍDA VOLCAMIENTO

INFRAESTRUCTURA

ARTERIAL 1.45.E-01 9.54.E-01 . 2.11.E+13 -4.96.E-01

INTERMEDIA -1.96.E-01 5.96.E-01 2.11.E+13 -7.18.E-01

LOCAL -1.36.E-01 6.59.E-01 2.11.E+13 -6.18.E-01

PEATONAL NA NA 2.11.E+13 NA

RUTAS SITP 1.66.E-03 -7.62.E-03 . -6.62.E-03 2.22.E-02 *

INTERSECCIÓN SEMAFORIZADA

-1.26.E-01 . -1.13.E-01 1.85.E-01 -1.62.E-01

RED DE CICLORRUTAS -1.38.E-01 * 3.03.E-02 -1.65.E-01 -5.78.E-02

PUENTE PEATONAL 1.99.E-01 * 3.43.E-01 ** -9.74.E+00 1.33.E-01

USOS DE SUELO

RESIDENCIAL -1.85.E+00 ** 1.08.E+01 -5.95.E+12 -1.58.E+01

DOTACIONAL -1.87.E+00 ** 1.10.E+01 -5.95.E+12 -1.56.E+01

INDUSTRIAL -1.55.E+00 ** 1.11.E+01 -5.95.E+12 -1.48.E+01

COMERCIO -1.87.E+00 ** 1.07.E+01 -5.95.E+12 -1.55.E+01

ÁREA DE AC. INTEGRAL -1.72.E+00 ** 1.08.E+01 -5.95.E+12 -1.54.E+01

ÁREA DE AC. CENTRAL NA NA NA NA

SUELO DE PROTECCIÓN -2.02.E+00 ** 1.05.E+01 -5.95.E+12 -1.64.E+01

DEMOGRÁFICAS

TASA DE VEH/HAB -1.04.E-06 -1.13.E-06 -2.90.E-05 2.64.E-06

DENSIDAD POBLACIONAL 2.08.E-06 -5.24.E-04 1.23.E-04 1.89.E-03 *

TASA DE OCUPACIÓN LABORAL

-2.55.E-02 *** -2.26.E-02 * 5.22.E-02 -1.40.E-02

R2 de McFadden 0.052814 0.09185384 0.134303 0.051884

Con los registros de siniestros reportados de acuerdo a la clase del siniestro se identificó

que las víctimas registradas en siniestros de clase choque, tienden a ser más graves cuando

hay ausencia de ciclorrutas y de intersecciones semaforizadas. En cuanto a usos de suelo

todos presentan significancia para la gravedad del siniestro, y la tasa de ocupación laboral

dentro de este modelo es la variable más significativa.

Para las víctimas de atropello, las variables más significativas son la cercanía al puente

peatonal, el tránsito de rutas de transporte público y las vías arteriales. En las variables

demográficas analizadas presenta significancia la tasa de ocupación laboral.

Dentro de la clase reportada como volcamiento son significantes, la densidad poblacional y

el tránsito de rutas de transporte público. Para la clase caída no se presentan variables

significativas, aunque este modelo es el que presenta mejor R2.

Page 25: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

25

Grupo 3 de modelos

En el grupo 3 de modelos, se evaluaron las variables para los registros de siniestros de

acuerdo a la condición de la víctima, peatón, ciclista y motociclistas, los cuales son los

actores más vulnerables en las vías. Los resultados se muestran en la tabla resumen a

continuación.

PEATÓN CICLISTA MOTOCICLISTA

INFRAESTRUCTURA

ARTERIAL 1.10E+00 * -2.21E-01 -1.96E-01

INTERMEDIA 6.66E-01 -4.24E-01 -5.74E-01

LOCAL 7.53E-01 -5.88E-01 -6.61E-01 .

PEATONAL NA NA NA

RUTAS SITP -3.84E-03 5.00E-03 -3.47E-03

INTERSECCIÓN SEMAFORIZADA -1.34E-01 -2.35E-01 1.27E-01

RED DE CICLORRUTAS 2.97E-02 -4.98E-01 ** -1.79E-01

PUENTE PEATONAL 3.36E-01 ** -2.52E-01 2.78E-01 .

USOS DE SUELO

RESIDENCIAL 1.09E+01 1.05E+01 -2.78E+00 ***

DOTACIONAL 1.10E+01 9.84E+00 -2.66E+00 ***

INDUSTRIAL 1.12E+01 1.06E+01 -2.34E+00 **

COMERCIO 1.08E+01 1.03E+01 -2.91E+00 ***

ÁREA DE ACTIVIDAD INTEGRAL 1.09E+01 1.04E+01 -2.30E+00 **

ÁREA DE ACTIVIDAD MINERA

ÁREA DE ACTIVIDAD CENTRAL 1.05E+01 9.41E+00 -3.36E+00 ***

SUELO DE PROTECCIÓN 9.72E+00 9.58E+00 -2.39E+00 **

DEMOGRÁFICAS

TASA VEHÍCULOS POR HABITANTE -1.68E-06 -1.44E-06 4.93E-08

DENSIDAD POBLACIONAL -5.11E-04 3.14E-04 9.72E-05

TASA DE OCUPACIÓN LABORAL -1.64E-02 . -4.81E-02 * -1.92E-02

R2 de McFadden 0.08791836 0.08791836 0.01984743

Para los peatones reportados como víctimas, aumenta la gravedad del siniestro cuando hay

cercanía a un puente peatonal y cuando la vía se clasifica como arterial. En cuanto a los

ciclistas esta gravedad aumenta cuando no se cuenta con red de ciclorrutas y se tiene una

baja tasa de ocupación laboral en la zona. Por último, la gravedad de los siniestros de los

motociclistas aumenta en las vías locales de la ciudad y cerca de un puente peatonal. En

este caso los usos de suelo toman gran importancia, destacándose el uso residencial,

dotacional y e industrial.

Page 26: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

26

7 CONCLUSIONES Y RECOMENDACIONES

Este documento propone un modelo logit binomial con datos de siniestralidad para analizar

los factores clave que afectan el nivel de gravedad de los siniestros en las vías de Bogotá.

Se utilizaron registros de víctimas heridas y muertas de la base de datos de la Secretaria

Distrital de Movilidad. Estas bases de datos corresponden a las víctimas registradas en un

periodo de tres años, datos suficientes para calibrar el modelo y con el fin de que funcionara

el modelo logit planteado.

Los resultados sugieren correlaciones espaciales significativas en los datos registros de

siniestros con víctimas y las variables seleccionadas. En los hallazgos se encontró que la

combinación de factores asociados a la infraestructura vial y características de la víctima

inciden directamente en la gravedad de la víctima.

En resumen, es más probable que ocurran siniestros con mayor severidad: i) cuando están

involucrados peatones, ciclistas y motociclistas; ii) en vías arteriales; iii) vías que no cuentan

con ciclorrutas cercana; iv) cuando no se tienen intersecciones semaforizadas cerca; v)

entre mayor sea la edad de la víctima; vi) cuando se presentan choques o atropellos; y vii)

cuando se encuentra cerca de un puente peatonal.

Los hallazgos anteriores permiten la identificación de factores que permiten definir las

medidas de gestión adecuadas para reducir los siniestros en las vías de la ciudad. En este

sentido, las medidas pueden ir encaminadas al incremento de intersecciones semaforizadas

y la ampliación de la red de ciclorrutas, ya que, de acuerdo a los resultados de los modelos,

la presencia de este tipo de infraestructura reduce la gravedad de los siniestros.

Asimismo, debe notarse que el modelo general propuesto no considera una gran cantidad

de variables que también hubieran podido incidir en los resultados, es decir asociar un

mayor número de variables a cada siniestro. Por esta razón, no se encontró

satisfactoriamente una relación con algunas de las variables planteadas, por lo cual sería

útil complementar el análisis con otros factores que se considere que pueden incidir en la

gravedad de los siniestros.

Por otro lado, cabe resaltar que los datos recopilados del periodo de tiempo analizado,

constituyen una buena fuente de análisis para el caso de Bogotá. Sin embargo, en este

estudio los coeficientes encontrados y las relaciones empíricas encontradas no son

transferibles a otra área geográfica. Para lograr esto, sería necesario contar con una

muestra tipo panel que permita controlar las asociaciones con variables adicionales a las

utilizadas en el presente estudio.

En general el presente estudio contó con datos suficientes para el alcance que se planteó

desde el principio, sin embargo, sería útil contar con una muestra más grande y con más

variables que permitieran hacer más robusto el análisis. Entre estas, sería útil contar con

información más específica para cada uno de los diferentes modos, e información adicional

Page 27: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

27

como volúmenes o velocidades puntuales de operación, los cuales ya han sido identificados

como factores relevantes en la severidad de los siniestros.

8 REFERENCIAS

Bartlett, J. (8 de February de 2014). The Stats Geek. Obtenido de The Stats Geek:

https://thestatsgeek.com/2014/02/08/r-squared-in-logistic-regression/

Damodar N. Gujarati, D. C. (2009). Econometría. Quinta edición. Mexico.: Mc Graw-Hill.

Fan Ye, D. L. (2014). Comparing three commonly used crash severity models on sample size

requirements: Multinomial logit, ordered probit and mixed logit models. Analytic

Methods in Accident Research, 72-85.

Fidel Gómez, J. P. (2014). Accident prediction Models for bus rapid transit systems:

Generalized linear models versus neural network. TRB 2015 Annual Meeting.

Francesca La Torre, M. M. (2019). Accident prediction models for urban roads. Accident

Analysis & Prevention, , 1-11.

Gary King, L. Z. (2001). Logistic Regression in Rare Events Data. Political Analysis, 9(2), 137-

163.

Gomes, S. V. (2013). The influence of the infrastructure characteristics in urban road

accidents occurrence. Accident Analysis & Prevention, 289-297.

Greibe, P. (2003). Accident prediction models for urban roads. Accident Analysis &

Prevention, 273-285.

Gutiérrez Puebla, J. G.-P.-C. (2012). Regresión Geográficamente Ponderada (GWR) y

estimación de la demanda de las estaciones del Metro de Madrid. Madrid: XV

Congreso Nacional de Tecnologías de la Información Geográfica.

John C. Milton, V. N. (2007). Highway accident severities and the mixed logit model: An

exploratory empirical analysis. Accident Analysis and Prevention.

R, M. G. (2016). Modelos de regresión lineal múltiple. Granada: Documentos de Trabajo en

Economía Aplicada. Universidad de Granada.

Secretaria Distrital de Movilidad. (2018). Anuario de siniestralidad vial de Bogotá 2017.

Bogotá D.C.: Secretaria Distrital de Movilidad.

Sunil Patil, S. R. (2012). Analysis of crash severities using nested logit model—Accounting

for the underreporting of crashes. Accident Analysis & Prevention, 646-653.

Page 28: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

28

Wier, W. E. (2009). An area-level model of vehicle-pedestrian injury collisions with

implications for land use and transportation planning. Accident Analysis and

Prevention, 137-145.

Page 29: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

29

9 CARTOGRAFÍA Figura 14 SINIESTRALIDAD VIAL BOGOTÁ 2016-2018

Fuente: Elaboración propia con base en información SDM

Page 30: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

30

Figura 15 RED SEMAFÓRICA BOGOTÁ

Fuente: Elaboración propia con base en información SDM

Page 31: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

31

Figura 16 puentes peatonales Bogotá

Fuente: Elaboración propia con base en información SDM

Page 32: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

32

Figura 17 USOS DE SUELO

Fuente: Elaboración propia con base en información SDM

Page 33: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

33

Figura 18 LESIONADOS Y MUERTOS EN SINIESTROS VIALES EN BOGOTÁ 2016-2018

Fuente: Elaboración propia con base en información SDM

Page 34: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

34

Figura 19 RED VIAL DE BOGOTÁ

Fuente: Elaboración propia con base en información SDM

Page 35: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

35

Figura 20 RED DE TRANSPORTE DE BOGOTÁ

Fuente: Elaboración propia con base en información SDM

Page 36: ANÁLISIS GEOGRÁFICO PARA IDENTIFICAR FACTORES QUE …

36

Figura 21 UPZ DE BOGOTÁ

Fuente: Elaboración propia con base en información SDM