Construcción de Matriz Origen-Destino para rutas de ...
Transcript of Construcción de Matriz Origen-Destino para rutas de ...
Metodología para la construcción de la matriz origen-destino de las rutas
de alimentación de las fases I y II de Transmilenio con base en los registros
del Sistema Integrado de Recaudo y del Sistema de Ayuda a la Explotación
TESIS II
Presentado por: Katherine Ariza Beltrán
Álvaro Rodríguez Valencia
Universidad de los Andes
Facultad de Ingeniería - Departamento de Ingeniería Civil
Maestría en Ingeniería Civil
Bogotá
2018
Contenido
1. Introducción ................................................................................................................................ 5
2. Marco Teórico ............................................................................................................................. 8
2.1. Estado del arte en explotación de información de sistemas de recaudo y de ayuda a la
explotación .......................................................................................................................................... 8
2.1.1. Inferencia Destino ............................................................................................................. 10
2.2. Antecedentes del sistema de transporte público de Bogotá y su Sistema de Recaudo
Electrónico (SRE) ............................................................................................................................... 13
2.2.1. Transmilenio ...................................................................................................................... 13
3. Metodología .............................................................................................................................. 15
3.1. Fuentes de información ........................................................................................................ 15
3.2. Etapas de la investigación ........................................................ ¡Error! Marcador no definido.
3.2.1. Etapa 1 - Análisis y transformación de los datos de entrada ............................................ 17
▪ Puntos de recarga externa ................................................................................................ 17
▪ Rutas alimentadoras de Transmilenio ............................................................................... 18
▪ Validaciones en estaciones de Transmilenio .................................................................... 20
▪ Transacciones en la red de recarga ................................................................................... 21
3.2.2. Etapa 2- Identificar destino ............................................................................................... 21
3.2.3. Etapa 3 - Inferencia del origen .......................................................................................... 23
▪ Paquete de trabajo 1 – Análisis de proximidad entre puntos de recarga externa y
paraderos .................................................................................................................................. 24
▪ Paquete de trabajo 2 – Identificación de transacciones de recargas de los potenciales
usuarios de alimentación .......................................................................................................... 26
▪ Paquete de trabajo 3 – Geo-referenciación de transacciones de recarga ........................ 27
3.2.4. Etapa 4 - Construcción de perfiles de carga por ruta ........... ¡Error! Marcador no definido.
3.2.5. Etapa 5 - Validación ........................................................................................................... 27
3.2.6. Etapa 6 - Comprobación y expansión ................................................................................ 27
3.2.7. Etapa 7 - Resultados .......................................................................................................... 27
4. Análisis estadístico del sistema de recaudo del SITP de Bogotá ............................................... 29
5. Resultados ................................................................................................................................. 34
Anexo 1 – Estructura de registros de validaciones .......................................................................... 42
Anexo 2 – Estructura de registros de transacciones de la red de recarga externa .......................... 46
Anexo 3 – Listado detallado de rutas alimentadoras de Transmilenio ............................................. 54
Anexo 4 – Algoritmos Posgres ........................................................................................................... 48
▪ Consultas realizadas para análisis estadístico ....................................................................... 48
Bibliografía ........................................................................................................................................ 57
Figuras Figura 1- Ejemplo integración información de orígenes y posición de vehículos ............................... 9
Figura 2-Ejemplo de inferencia en destinos a partir de la función de distancia ............................... 12
Figura 3 – Ejemplo de trayectorias con funciones de minimización de tiempo vs distancia ............ 13
Figura 4 – Etapas de la investigación ................................................................................................ 17
Figura 5 – Mapa de Bogotá con los puntos de recarga externa geo-referenciados ......................... 17
Figura 6 – Mapa de Bogotá con los paraderos de las rutas alimentadoras ...................................... 20
Figura 7 – Representación esquemática de la identificación de las tarjetas con validaciones en
servicios de alimentación .................................................................................................................. 23
Figura 8 – Flujograma de los paquetes de trabajo de la etapa de inferencia de origen ................... 23
Figura 9 – Mapa con análisis de proximidad entre puntos de recargas externa y paraderos de
alimentación para zona cercana al Portal Norte ............................................................................... 25
Figura 10 – Representación esquemática de la asociación de las tarjetas con validaciones en
servicios de alimentación a transacciones de la red de recarga ....................................................... 26
Figura 11 - Distribución % de validaciones asociada a servicios de alimentación ............................ 29
Figura 12 – Distribución de recargas promedio según día de la semana (%) ................................... 30
Figura 13 - Distribución % del monto diario recargado perfil de usuarios para todos los canales ... 30
Figura 14 - % de recargas por hora en puntos de recarga externo y estaciones .............................. 31
Figura 15 - Perfil validaciones y recargas externas ........................................................................... 32
Tablas
Tabla 1 – Ventanas de tiempo para transbordo ............................................................................... 10
Tabla 2 – Número de rutas alimentadores por fase ......................................................................... 19
Tabla 3 – Salida del análisis de proximidad ....................................................................................... 26
Tabla 4 - Porcentaje de validaciones por nombre de perfil para todo el sistema BRT y en los
accesos de alimentación ................................................................................................................... 29
Tabla 5 - No. de puntos de recarga según número de recargas diarias ............................................ 32
Tabla 6 – Estructura de validaciones en las estaciones del BRT ....................................................... 44
Tabla 7 – Estructura de transacciones de recarga en estaciones y en la red externa del BRT ......... 46
1. Introducción
El patrón de viajes en transporte público (origen-transbordo-destino) de la población es una
información de vital importancia para la planeación y gestión del transporte en una ciudad. La matriz
O-D permite llevar a cabo análisis de operación de sistemas, determinar las zonas más importantes
en términos de afluencia de personas y verificar la capacidad ofertada frente a la demanda. A partir
de estos datos es posible proponer y evaluar mejoras operacionales en el servicio. Sin embargo,
debido a restricciones presupuestarias de tiempo y costo, el levantamiento de información para
construir la matriz O-D de una ciudad no puede hacerse muchas veces con la periodicidad deseada,
por lo que no es posible contar con información actualizada y oportuna sobre los cambios en el
comportamiento de viajes de los habitantes o del impacto de iniciativas destinadas a optimizar la
operación de transporte público.
Hasta hace unos años, la única manera de obtener la matriz origen-destino era a través de encuestas
origen-destino, encuestas de interceptación de viajes y aforos; que conllevan un elevado costo
monetario y de tiempo. De manera alternativa, la matriz origen-destino se puede construir a partir
de los datos de sistemas integrados de recaudo y de control de flota. Londres, Santiago y Chicago
son algunas de las ciudades que han explotado la información de recaudo y de control de flota para
la planeación y gestión del transporte urbano.
Para evaluar la viabilidad de aplicar métodos alternativos de estimación de la matriz origen-destino
del transporte público en Bogotá, es necesario conocer el contexto y características del Sistema
Integrado de Transporte Público (SITP), que es un sistema organizado e integrado de buses de (BRT
y colectivos) que busca el cubrimiento efectivo del transporte en Bogotá (Transmilenio, 2017).
Transmilenio es el sistema de Bus Rapid Transit (BRT) de la ciudad de Bogotá, que presta su servicio
a través de una red corredores con carril exclusivo donde operan 11 líneas troncales y un sistema
de alimentación para la red troncal. La demanda diaria de Transmilenio fue de 2.3 millones en 2015,
con el 50% de los usuarios accediendo a través del servicio de alimentación.
Actualmente en Transmilenio, el único medio de pago aceptado es la tarjeta inteligente de pago sin
contacto (TISC), en sus modalidades tarjeta con desarrollo propietario (Tullave) y Mifare Classic
(Cliente Frecuente y Monedero). El sistema electrónico de recaudo está diseñado de tal forma que
los usuarios que inician su viaje en el servicio troncal deben validar en los torniquetes de acceso a
las estaciones. Por su parte, los usuarios que inician su viaje en el servicio de alimentación acceden
al autobús sin efectuar pago, y solo validan su tarjeta al llegar a los puntos de acceso a la red troncal
en los portales de Transmilenio.
Si bien los usuarios de alimentadores realizan una validación al llegar a un portal, no existe validación
a bordo de los alimentadores (ni a la entrada ni a la salida de estos buses). El que no exista validación
a bordo genera dos problemas principales en el servicio de alimentación. El primer inconveniente,
es que no se dispone de información periódica y automatizada del número total de usuarios de cada
una de las rutas de alimentación. El segundo inconveniente es que no se conoce de forma
automática el origen de viajes de los usuarios. Por esta razón, existen restricciones para desarrollar
las actividades de planeación y programación de los servicios, que permitan un adecuado diseño del
trazado, de la frecuencia del servicio y de la capacidad de los buses. Para subsanar estos problemas,
Transmilenio y debe realizar aforos anualmente para identificar el origen de los viajes y el perfil de
carga de las rutas alimentadoras. Estos aforos algunas veces no pueden hacerse con la periodicidad
deseada, debido a restricciones presupuestarias de tiempo y costo..
La Empresa de Transporte del Tercer Milenio - Transmilenio S.A contrató en 2011 a la sociedad
Recaudo Bogotá S.A.S. para el diseño, suministro, implementación, operación y mantenimiento del
subsistema de recaudo, del subsistema de control de flota, del subsistema de información y servicio
al usuario y del subsistema de integración y consolidación de la información. En el SIRCI se genera
un volumen diario de transacciones de pago de viajes y recargas de tarjeta en el sistema de recaudo,
y se supervisa el cumplimiento de la programación de la flota a través del sistema de gestión y
control de flota. Por tanto, existe una base de datos que permitiría inferir la matriz origen-destino
del transporte público como se ha hecho en otras ciudades del mundo. La diferencia principal en la
inferencia de la matriz origen-destino de Bogotá, respecto de otras ciudades donde se han realizado
estudios similares, es que el servicio de alimentación del sistema Transmilenio tiene validación a la
salida y no a la entrada.
En este sentido, esta investigación se sustenta en la necesidad de generar una matriz origen-destino
del sistema de alimentación de forma automatizada, utilizando las diferentes bases de datos sobre
transporte en la ciudad de Bogotá. Este proceso alternativo, permitiría tener un mayor alcance
(muestras más grandes de datos) y a un menor costo (al no necesitar personal en campo) frente a
las alternativas tradicionales de medición a través de encuestas de ascensos y descensos. Por otro
lado, esta herramienta presenta el beneficio adicional de poder ser actualizada frecuentemente, a
un costo relativamente bajo.El desarrollo de este estudio busca desarrollar una metodología para
construir la matriz origen-destino de las rutas de alimentación de las fases I y II de Transmilenio con
base en los registros del Sistema Integrado de Recaudo y del Sistema de Ayuda a la Explotación. Los
objetivos específicos del trabajo de investigación son los siguientes:
▪ Definir una metodología que permita identificar el destino e inferir el origen de los viajes realizados en las rutas de alimentación de las Fase I y II de Transmilenio a partir de las transacciones realizadas en la red de recarga externa, y las validaciones realizadas en los portales de las Fases I y II.
▪ Estimar el número de abordajes por punto de parada para los servicios de alimentación.
▪ Estimar el perfil de carga de cada una de las rutas alimentadoras con base en los puntos de abordaje que se infieren a partir de las transacciones realizadas en la red de recarga externa.
▪ Validar los resultados obtenidos con los aforos que realiza periódicamente Transmilenio para cada una de las rutas de alimentación.
▪ Evaluar la eficiencia de la herramienta generada para el procesamiento periódico de los datos.
El documento está organizado de la siguiente manera: en la primera parte, se explica el marco
teórico relevante donde se desarrolla una revisión de literatura. En el segundo capítulo se presenta
la metodología utilizada para la construcción de la matriz origen-destino de alimentación y los
perfiles de carga. El tercer capítulo corresponde a un análisis estadístico de los datos de validaciones
en estaciones y de las transacciones de recarga. En el siguiente capítulo, se explican los resultados
obtenidos tras aplicar la metodología. Finalmente, se incluye una sección de conclusiones y
recomendaciones, donde se explican también cuáles podrían ser próximos pasos para mejorar o
ampliar la investigación.
.
2. Marco Teórico
2.1. Estado del arte en explotación de información de sistemas de recaudo
y de ayuda a la explotación
La implementación de sistemas integrados de recaudo (SIR) basados en tarjetas inteligentes de pago
sin contacto inicio a finales de los noventas, siendo algunas de las ciudades pioneras en este tipo de
sistemas Washington (SmarTrip), Nueva York (Metro Card) y Tokyo (Suica). El advenimiento de
medios de pago electrónicos para transporte público, generó la posibilidad de explotar las
transacciones de pago almacenadas en los sistemas de recaudo para analizar el comportamiento de
viaje de los usuarios y retroalimentar la planeación de los servicios de transporte público.
Actualmente, las principales ciudades a nivel mundial cuentan con sistemas integrados de recaudo,
que colocan a disposición un registro completa de las transacciones diarias de viaje.
La línea de investigación sobre la explotación de información de sistemas pasivos, como son el
sistema integrado de recaudo y el sistema de gestión y control de flota, ha evolucionado en la última
década. Iniciando con trabajos preliminares, donde se realizaba solo un análisis estadístico de los
registros hasta el desarrollo de metodologías y herramientas que permiten construir la matriz
origen-destino de transporte público, tanto en sistemas donde existe validación a la entrada y a la
salida como en aquellos donde existe solo validación a la entrada.
El nivel de penetración de la tarjeta inteligente como medio de pago es un elemento fundamental
para desarrollar análisis de viajes según la franja horaria, el tipo de ruta o las características de los
usuarios (Utsunomiya, Attanucci, & Wilson, 2006). Por ello, las investigaciones parten de una
evaluación de la calidad de la información disponible y del nivel de penetración de la tarjeta frente
a otros medios de pago que coexistan con esta como son el efectivo, el billete impreso, códigos de
barra, entre otros. Al respecto de estos niveles de penetración se tiene un 98% para la Oyster en
Londres (Gordon, 2012), 97% para la tarjeta bip! en Santiago (Beltrán, y otros, 2011)y del 90% con
la tarjeta Card Plus CTA en Chicago (Zhao, Rahbee, & Wilson, 2007). A continuación se presenta una
línea de tiempo en la incorporación de tecnologías de pago sin contacto en ciudades que aceptan
como único medio de pago tarjeta. Dentro de este grupo de ciudades, la explotación de los registros
de los sistemas pasivos que operan en transporte público se ha abordado por ejemplo, en Londres
con la tarjeta Oyster, Santiago con la tarjeta bip!, Chicago donde la tarjeta Card Plus CTA, entre
otros.
Una de las aplicaciones de la explotación de información de sistemas de recaudo fue la construcción
de matrices origen-destino para sistemas donde existe validación a la entrada y a la salida, porque
a partir de una tarjeta con identificación única es posible definir el origen y destinos de viaje; así
como, los transbordos. Los estudios han sido realizados para algunos sistemas férreos como el de
Londres (Chan, 2007). Este proceso requiere una lógica para depurar datos incorrectos o
sospechosos dentro de la base de datos de recaudo que han desarrollado investigaciones como la
de Chapleau & Chu (2011).
En el caso de los sistemas de autobús, donde la validación de la transacción de recaudo no se realiza
en un punto conocido fijo como lo es una estación, ha sido necesario cruzar la información de
recaudo con el sistema de ayuda a la explotación (SAE). De esta manera es posible identificar para
cada pago, la ruta en la que se realizó, la hora de la transacción, la tarjeta/usuario que la utilizó y la
ubicación del paradero. La identificación se paradero se realiza con base las coordenadas
geográficas que reporta el sistema de localización (GPS) que opera en las consolas del sistema de
ayuda a la explotación de autobuses. El nivel de efectividad obtenido al cruzar las dos fuentes
permitió a Gordon (2012) asociar al 89% de los pagos con Oyster en los buses de Londres sus
coordenadas.
La metodología aplicada por Gordon (2012) tiene en cuenta elementos como el ajuste en los
registros de transacciones de validación y del sistema de control de flota, debido a las diferencias
entre los relojes de los validadores del sistema integrado de recaudo y el de los componentes de
control de flota. Adicionalmente, tiene en cuenta si existen transacciones reportadas por fuera de
los periodos de parada de los autobuses para el ascenso y descenso de pasajeros. En este caso, se
desarrolla un proceso de asignación de transacciones del Sistema Integrado de Recaudo (SIR) a
eventos más próximos del Sistema de Ayuda a la Explotación (SAE), utilizando la hora en que se
registra cada evento. A continuación se presenta una representación gráfica de los intervalos de
inicio-fin de una parada registrados en el sistema de control y gestión de flota, y los eventos de
validación en los buses en una sección del recorrido.
Figura 1- Ejemplo integración información de orígenes y posición de vehículos
Fuente: Elaboración propia con base en Gordon (2012)
La posibilidad de cruzar la información de los sistemas de ayuda a la explotación con los registros de
pago, dependen en buena medida del nivel de precisión de los GPS, el mecanismo de transmisión
de datos y el tipo de información que estos sistemas almacenan a lo largo del recorrido. Al respecto
Hounsell et al. (2012), describieron el sistema iBus de Londres, a través del cual se monitorea la flota
de autobuses. En su estudio utilizaron mediciones de ubicación y velocidad obtenidas del GPS del
8:02 8:05 8:07 8:08 8:11 8:13
Parada 1
Parada 2 Parada 3
Transacción de validación con tarjeta dentro del periodo de parada Transacción de validación fuera del periodo de parada
Inicio parada / apertura de puertas
Fin de parada / cierre de puerta
vehículo y otros detectores a bordo del autobús, como sensores de eventos de apertura y cierre de
puertas, para definir una metodología que calcular el tiempo promedio de parada y establecer
criterios para priorizar transporte público en el sistema semafórico. El proceso de cálculo del tiempo
medio de parada fue automatizado por Wong (2012), quien además utilizo esta información para
proponer indicadores para mejorar la operación y planeación de rutas de autobuses. El análisis
permitió identificar que las variaciones en los tiempos promedios de parada son más complejas que
la simple caracterización de la hora pico y la hora valle. Se demostró que en ciertas horas del día
otros factores como el propósito del viaje, el tipo de pasajero y la ubicación de la parada ayudan a
definir el tiempo promedio de parada del autobús.
Una vez se cuenta con la información de orígenes georreferenciada, se debe analizar si la siguiente
validación corresponde al inicio del último viaje del día o a una etapa de viaje. Para ello, se han
explorado dos perspectivas para determinar la si la validación corresponde a un transbordo. El
mecanismo más sencillo es definir una ventana de tiempo en la cual todas las validaciones
secuenciales que se realicen corresponden a etapas de un mismo viaje. Esta opción requiere conocer
la duración media de los viajes en la ciudad, y tiene la desventaja que puede distorsionar la
información de los viajes cortos, puesto que estos se pueden confundir como etapas de un solo
viaje. La estimación de ventanas de viaje ha sido desarrollada por múltiples autores y se resumen
por ciudad en la siguiente tabla:
Tabla 1 – Ventanas de tiempo para transbordo
Ciudad (Investigación) Ventana de tiempo
Londres (Seaborn, Attanucci, & Wilson, 2009) 35 min Bus a Metro 45 min Bus a bus
Santiago (Munizaga & Palma, 2012) 30 min Bus a bus San Francisco (Metropolitan Transportation Commission, 2003)
30 min
Hiroshima (Okamura, J, & F., 2004) 90 min
Cabe anotar, que las anteriores ventanas de tiempo son inferiores a las que se definen en los
sistemas de recaudo del transporte público para realizar el cobro por trasbordo. En el segundo caso,
la ventana de tiempo está pensada para garantizar que los usuarios de realizan viajes más largos y
que generalmente son aquellos de menor ingreso, reciben un subsidio.
El segundo mecanismo que han propuesto investigaciones previas consiste en verificar que la
trayectoria de la ruta de autobús donde se realiza la subsecuente validación no ocurra en una
dirección opuesta a la primera (McCaig & Yip, 2010). Esta opción tiene mayores requerimientos a
nivel de procesamiento y almacenamiento, pues requeriría guardar en base de datos todas las rutas
de transporte público y realizar una comparación de las trayectorias de las rutas donde se
registraron las transacciones de pago.
2.1.1. Inferencia Destino
Finalmente, es necesario inferir el destino en aquellos sistemas de transporte público donde existe
un sistema con tarjeta inteligente de pago sin contacto, y por tanto no hay validación a la salida. El
esquema de recaudo con validación solo en la entrada más utilizado puesto que evita generar una
tabla compleja de tarifas en función de las distancias recorridas, y el impacto operacional de una
validación a la salida de estaciones o autobuses. Este problema fue inicialmente abordado por Barry
et al (2002) con el estudio el comportamiento de viajes en el Metro de Nueva York a través de las
transacciones de pago con la tarjeta MetroCard. La investigación permitió obtener dos principios
base sobre las características de los viajes en transporte público. El primer principio se conoce como
la regla de proximidad y establece que los viajeros descienden en la parada más cercana a su
siguiente transacción. El segundo es el principio de simetría, el cual define que los usuarios
descienden en su último viaje en la parada más cercana al origen de su primer viaje del día. Estas
reglas fueron probadas a través de diarios de viajes recolectados por el New York Metropolitan
Transportation Council para una muestra de usuarios del sistema Metro. Adicionalmente, los
resultados de viajes inferidos fueron comparados con los volúmenes de entrada y salida de las
estaciones.
La inferencia de la ubicación de destinos de viajes se ha desarrollado en torno a dos metodologías.
La primera fue presentada por Trépanier et al (2007) y en ella se deduce la ubicación de los
descensos basado en la distancia más corta a la parada donde se realiza la última validación del día.
Dentro de esta metodología, se identifica la secuencia en que las etapas de viaje fueron realizadas
con la tarjeta y se distinguen inicio de viajes de inicios de etapas de viaje. Como ejemplo se tiene
para una tarjeta que registra dos viajes en un día, como parte de la metodología se verifica si la
parada en la que se valida el segundo viaje se encuentra próximo a otro punto de parada en la ruta
donde se validó el primer viaje. En este caso para definir el paradero más próximo se utiliza una
función que minimiza la distancia entre el paradero de la ruta 2 respecto de la ruta 1
Figura 2-Ejemplo de inferencia en destinos a partir de la función de distancia
Fuente: Elaboración propia
La segunda metodología fue desarrollada por Munizaga y Palma (2012), quienes estimaron la matriz
origen-destino de Santiago de Chile con base en las transacciones registradas de recaudo de
Transantiago, sistema que integra física y tarifariamente el transporte colectivo y el Metro de la
Ciudad. La tarjeta inteligente sin contacto bip! es el único medio de pago aceptado en los buses de
Santiago, mientras que en el Metro es posible adquirir billetes de viaje único y también utilizar la
tarjeta. En todos los sistemas de transporte público de la ciudad solo se realiza validación a la
entrada, por lo que no existen registros de salida que permitan definir los destinos de los viajes. Por
ello, los autores desarrollaron un análisis de las 35 millones de transacciones que se realizan
semanalmente en el sistema y pudieron inferir el 80% de los destinos asociados a validaciones al
acceso teniendo en cuenta tanto la base de datos de recaudo como la del sistema de ayuda a la
explotación. Una particularidad adicional del sistema es que existen paraderos donde se realiza
validación para acceder a una zona paga y no es posible conocer la ruta que el usuario utiliza, caso
similar a lo que ocurriría en estaciones del BRT.
La investigación aporta dos resultados importantes, el primero es que permite generar una matriz
origen-destino para una ciudad con cerca de 6 millones de habitantes y viajes con transbordos entre
subsistemas de transporte público. Los investigadores lograron conseguir un 98% de coincidencias
entre los registros del sistema de control de flota y las transacciones que debían asociarse del
sistema integrado de recaudo. El segundo es que cambia la metodología para inferir la ubicación
del destino del viaje utilizando una función que tiene en cuenta la separación en tiempo, entre la
parada donde se originó el primer viaje del día y la parada donde finaliza el último viaje del día. Esta
función objetivo corrige el fenómeno donde el usuario se desplaza caminando hasta la parada más
próxima para tomar otra ruta que si bien no es la más próxima en distancia, le permite reducir su
tiempo de viaje.
A continuación una representación gráfica del esquema de inferencia de destino mediante una
minimización de distancia, respecto de uno donde se realiza una minimización del tiempo de viaje.
Figura 3 – Ejemplo de trayectorias con funciones de minimización de tiempo vs distancia
Fuente: (Munizaga & Palma, 2012)
Dentro de los estudios desarrollados hasta el momento, ha sido necesario expandir la información
de viajes que se obtiene del cruce de los registros del Sistema integrado de recaudo y del sistema
de ayuda a la explotación para obtener la matriz origen-transbordo-destino del transporte público
de la ciudad. Lo anterior, para cubrir aquellos casos donde no se tiene información completa de
transporte público, como son:
▪ Aquellos viajes donde se conoce el origen porque se registra una validación de un primer
viaje pero no es posible estimar el destino, porque no existe una validación de un segundo
viaje dentro del mismo día.
▪ Las tarjetas de usuarios para los que se registra una validación a bordo de un autobús pero
no fue posible identificar la ubicación de la transacción, porque no existe un registro
completo y una hora cercana en el sistema de control de posición de los autobuses.
▪ Los viajes realizados en el transporte público colectivo que aún opera sin sistema integrado
de recaudo, o donde existen como medios de pago tanto la tarjeta como el efectivo.
2.2. Antecedentes del sistema de transporte público de Bogotá y su Sistema
de Recaudo Electrónico (SRE)
2.2.1. Transmilenio
Transmilenio es el sistema de Bus Rapid Transit (BRT) de la ciudad de Bogotá, el cual inició su
operación en Diciembre de 2000. El sistema está compuesto por 113 kilómetros de corredores con
carril exclusivo donde operan 11 líneas troncales, y un sistema de alimentación para la red troncal.
La demanda diaria del sistema fue de 2.3 millones en 2015, por lo que cubre el 13.4% de los viajes
diarios de la ciudad y el 62% de los viajes en transporte motorizado. El sistema cuenta con 134
estaciones, 122 rutas y una flota aproximada de 2024 buses articulados y biarticulados.
La operación de alimentación se realiza con una flota de 913 buses con capacidad aproximada de
90 pasajeros cada uno, que ayudan a los usuarios a movilizarse desde y hacia las zonas aledañas a
los portales y estaciones intermedias del Sistema TransMilenio. El servicio se alimentación se presta
en los portales Norte, Suba, Calle 80, Amércica, Sur, Usme, Tunal, El Dorado y 20 de Julio, y en las
estaciones Granja Carrera 77, Molinos, Calle 40 Sur, Banderas y General Santander. En el Anexo 1
se encuentra el listado completo de las rutas de alimentación por portal o estación.
La implementación del sistema de recaudo electrónico para el transporte público de la ciudad de
Bogotá se ha desarrollado de forma gradual. Con el inicio de operación de Transmilenio en el año
2000, se implementó un sistema de recaudo que tienen como medio de pago las tarjetas
inteligentes sin contacto (TISC) para el componente troncal de Transmilenio. La implementación,
mantenimiento y operación del sistema integrado de recaudo de las Fase I y II de Transmilenio
estuvo a cargo de la empresa Angelcom.
El Sistema de Recaudo Electrónico para transporte público (SRE) es el conjunto de servicios y
procedimientos operacionales, apoyados por una plataforma tecnológica, que permite a las
autoridades de transporte recaudar dinero por el pago de tarifas, controlar la evasión, recolectar
información sobre los ingresos económicos y los viajes, así como gestionar los pagos a los
operadores de transporte y de recaudo. Los SRE facilitan la implementación de políticas tarifarias
complejas, promueven la integración del transporte regional y fomentan una imagen de
modernidad (CTS Embarq, 2015).
En la actualidad, el sistema BRT y la mayor parte del transporte colectivo se encuentra integrado a
nivel tarifario a través de una tarjeta inteligente. Por tanto, se cuenta con información más completa
de los transbordos que los usuarios realizan diariamente entre los diferentes sistemas. Existen
algunos servicios que aún no están integrados a nivel de recaudo y donde aún se recibe pago en
efectivo, que corresponde a rutas del transporte colectivo.
La Empresa de Transporte del Tercer Milenio - Transmilenio S.A contrató en 2011 a la sociedad
Recaudo Bogotá S.A.S. para el diseño, suministro, implementación, operación y mantenimiento del
subsistema de recaudo, del subsistema de control de flota, del subsistema de información y servicio
al usuario y del subsistema de integración y consolidación de la información. Desde 2011, Recaudo
Bogotá S.A.S es responsable de la concesión del SIRCI de la ciudad r implementó como medio de
pago la tarjeta inteligente de pago sin contacto que los usuarios conocen como tarjeta Tullave.
3. Metodología
Con el objetivo de construir la matriz origen-destino de las rutas de alimentación de las fases I y II
de Transmilenio con base en los registros del Sistema Integrado de Recaudo y del Sistema de Ayuda
a la Explotación, se aplicaron los principios de inferencia de origen y destino presentados en la
revisión de literatura. Las metodologías consultadas sobre depuración de datos, explotación de
datos de sistemas inteligentes de transporte y construcción de matriz origen-destino, fueron
aplicadas con técnicas y herramientas avanzadas de minería de datos y de análisis geoespacial.
La primera sección de este capítulo explica las etapas de la investigación, que han permitido cumplir
con los objetivos propuestos. Las siguientes secciones presentan la metodología a utilizar para el
proceso de construcción del origen-destino de las rutas de alimentación de las Fases I y II de
Transmilenio. En cada una de las etapas propuestas se presentará el alcance de las actividades a
desarrollar, el proceso a utilizar para el análisis o inferencia de los resultados, los supuestos y las
restricciones impuestas.
La sección 3.2 presenta las fuentes de información que se utilizarán dentro del proceso. Mientras
en la sección ¡Error! No se encuentra el origen de la referencia. se presenta una descripción
detallada de las actividades efectuadas en cada etapa para obtener los resultados esperados,
identificando adicionalmente las herramientas de apoyo.
3.1. Proceso para desarrollar la metodología
Durante la investigación se ejecutaron X pasos, cuyo alcance se explica a continuación:
1. Planeación – donde se definió el alcance del trabajo a desarrollar, se identificaron las
entidades con las que debía existir interacción y se elaboró el cronograma de trabajo.
2. Revisión de literatura: dentro de esta etapa se consultaron metodologías para la
construcción de matriz O-D, y las técnicas para su procesamiento a partir de datos de
sistemas inteligentes de transporte.
Adicionalmente, se revisó el contexto de los servicios de alimentación de Transmilenio y del
sistema SIRCI.
3. Solicitud a Transmilenio de la información secundaria que se describe en la sección 3.2. Esto
fue un proceso iterativo durante el estudio, porque se encontró información incompleta o
registros con errores durante todo el proceso.
4. Diseño de la metodología para construir la matriz origen-destino y otros resultados
esperados.
5. Construcción del modelo de inferencia, para lo cual se inició con un diseño de un
requerimiento funcional y un flujograma que se explica en la sección 3.3. Posteriormente,
se ejecutó el proceso de minería de datos y de análisis geo-espacial en las herramientas
Posgres y ArcGis, respectivamente.
6. Generación de los resultados y construcción de este informe donde se documentan los
mismos.
3.2. Fuentes de información para obtener la matriz O-D de alimentación
Las fuentes de información a utilizar son las siguientes:
i. El diccionario de datos de las bodegas de información del SIRCI – Sistema Integrado de
Recaudo, Control de flota e Información al usuario de Bogotá. Dentro de estos diccionarios
se encuentra una descripción base de los formatos de los campos y su contenido, que fue
complementada y es presentada en la Tabla 6 y Tabla 7
ii. Anexo 1 – Estructura de registros de validaciones de este documento.
iii. Datos proporcionados por Transmilenio S.A. que fueron extraídos de las bases de datos de
SIRCI, y que se encontraba en formatos de archivo CSV. La información solicitada para la
investigación incluyó:
• Las validaciones realizadas en los portales de las fases I y II de Transmilenio S.A. durante 5 días seleccionados aleatoriamente, los cuales corresponden al 4 de octubre, 26 de octubre, 3 de noviembre, 11 de noviembre y 16 de noviembre de 2016.
• Las transacciones de recarga registradas en la red de recarga externa del SITP para un periodo de 2 meses, comprendido entre el 30 de septiembre y el 30 de noviembre de 2016.
• Las transacciones de recarga realizadas en las estaciones de Transmilenio S.A. para un periodo de 2 meses, comprendido entre el 30 de septiembre y el 30 de noviembre de 2016. Estos datos se solicitaron con el objetivo de hacer un análisis estadístico del comportamiento de la recarga por tipo de usuario.
iv. Información georreferenciada sobre la trayectoria y paradas de 116 rutas de alimentación,
que fue proporcionada por Transmilenio S.A. en formato KML. Esta información fue
complementada con las trayectorias de servicios que se encuentran la página web del
sistema SITP, porque no se encontraban todas las rutas disponibles.
v. Listado de 4,899 puntos de recarga externa con su dirección, proporcionada por
Transmilenio S.A. en formato texto y que fue convertida a coordenadas para contar con
información georreferenciada.
vi. Como información complementaria se cuenta con los aforos para la alimentación realizados
por Transmilenio periódicamente, y que se encuentran disponibles para las rutas
alimentadoras analizadas.
Para el desarrollo de la investigación, se parte del supuesto de que los datos recopilados del
SIRCI tienen el registro completo de las validaciones y recargas de las tarjetas inteligentes, y de
las trayectorias de las rutas de alimentación.
3.3. Metodología para obtener la matriz O-D de alimentación
Para obtener la Matriz O-D de Alimentación, se desarrolló una secuencia de seis etapas, que
corresponden a un procesamiento inicial para analizar y transformar los datos recibidos, la
identificación del fin de la etapa de viaje en alimentación y la inferencia del origen del viaje a partir
de las transacciones de la red de recarga externa. Posteriormente se ejecutó un proceso de
validación de la información obtenida mediante un proceso de pruebas unitarias, se comprobaron
los resultados tomando como referencia los aforos para la alimentación de Transmilenio S.A., luego
se expande la matriz base y una etapa final de construcción de salidas que permitan visualizar los
resultados y analizarlos desde distintos niveles de agregación. Cada una de estas etapas será
explicada en detalle en esta sección. La siguiente figura muestra la secuencia propuesta.
Figura 4 – Etapas para obtener Matriz O-D de Alimentación
Fuente: Elaboración propia
3.3.1. Etapa 1 - Análisis y transformación de los datos de entrada Dentro de la primera etapa se analizaron y transformaron los datos de entrada listados en la sección
3.1. A continuación se describe la información disponible en las fuentes de información principales
y el proceso de depuración y transformación que se llevó a cabo para explotar los registros
disponibles en las diferentes bases de datos.
▪ Puntos de recarga externa Existen 4,889 puntos en la red de recarga externa de Bogotá. Transmilenio suministró para
cada uno de ellos un número de agente y una dirección en formato de texto. La transformación
inicial consistió en convertir las direcciones en un formato estandarizado que permitiera su
posterior transformación a una coordenada expresada en latitud y longitud. El 94% de los
puntos de recarga externa fueron georreferenciados, en 56 casos no se encontró la dirección y
otros 228 no se tuvieron en cuenta porque estaban ubicados fuera de Bogotá.
Cabe anotar que para puntos de recarga externa se utilizará un registro de tres campos: un
número de identificación de agente, un nombre y una coordenada. A continuación se presenta
el mapa con los puntos de recarga externa y las estaciones y portales del sistema BRT que se
subieron a ArcGis.
Figura 5 – Mapa de Bogotá con los puntos de recarga externa geo-referenciados
Análisis & transformació
n datos
Identificar destino
Inferir origen ValidaciónComprobación
y expansiónConstrucción
de salidas
Fuente: Elaboración propia con base en direcciones de Transmilenio S.A.
▪ Rutas alimentadoras de Transmilenio Las rutas alimentadoras de Transmilenio que se incorporan en el análisis son las de Fase I y II,
puesto que en estas rutas no existe un proceso de validación a bordo de los buses. La Fase I de
Transmilenio cuenta con 5 portales y 4 estaciones donde se ofrecen 66 rutas de alimentación.
Esta infraestructura corresponde a los portales de Usme, Norte, Portal 80, Tunal y Portal Sur,
y a las estaciones de Granja, Calle 40 Sur, Molinos y Tintal-Zona Franca. La Fase II de
Transmilenio cuenta con 1 portal y 2 estaciones donde se ofrecen 21 rutas de alimentación.
Esta infraestructura corresponde al portal Américas y a las estaciones Banderas y Santander.
La Fase III con los portales El Dorado y 20 de Julio y la estación Bicentenario no fue tenida en
cuenta porque principalmente se alimentan a través de rutas complementarias o del servicio
zonal.
La siguiente tabla muestra el número de rutas de alimentación habilitadas por portal o estación
y la fase a la cual pertenece. Adicionalmente, en el Anexo 4 – Listado detallado de rutas
alimentadoras de Transmilenio - se muestra el listado de rutas que operan en cada uno de los
portales y estaciones.
Tabla 2 – Número de rutas alimentadores por fase Fase Portal No. rutas alimentadoras
Fase I Portal Usme 13
Portal Norte 12
Portal 80 10
Portal Tunal 10
Portal Sur 9
Granja 4
Calle 40 Sur 4
Molinos 3
Tintal-Zona Franca 1
Fase II Américas 11
Banderas 7
Santander 3
Fase III Portal El Dorado 18
Portal 20 de Julio 7
Bicentenario 4
Total general 116 Fuente: Elaboración propia con datos de nombre de ruta de Transmilenio S.A.
Adicionalmente, Transmilenio proporcionó archivos KML individuales con la trayectoria de cada
ruta alimentadora y la ubicación geo-referenciada de los paraderos asociados a cada una de las
rutas. Esta información fue integrada en una capa única de ArcGIs, cuyo resultado se muestra
en la siguiente figura.
Figura 6 – Mapa de Bogotá con los paraderos de las rutas alimentadoras (incluye paradas en la plataforma del Portal)
Fuente: Elaboración propia con base archivos KML proporcionados por Transmilenio S.A.
▪ Validaciones en estaciones de Transmilenio Las validaciones corresponden a los registros que se generan cada vez que el usuario pasa la
tarjeta inteligente Tullave o Angelcom en los lectores ubicados en los torniquetes de acceso a
las estaciones. La base de datos recibida corresponde a los registros para 5 días de validaciones
en las estaciones troncales. Dentro de esta base de datos se crearon nuevos campos que
separaran la fecha y hora de la transacción, para así facilitar el procesamiento de la
información.
El Anexo 1 presenta una descripción detallada de la información almacenada cada vez que se
realiza una validación con tarjeta inteligente de pago sin contacto en las estaciones de
Transmilenio. Adicionalmente, se identifican aquellos campos que se requieren para la
construcción de la metodología de matriz O-D para alimentación.
▪ Transacciones en la red de recarga Las transacciones en la red de recarga corresponde a cada uno de los registros por eventos de
carga de saldo en una tarjeta o anulación de una carga previa. Para la investigación se utilizaron
únicamente los registros de los puntos de venta identificados como POS EXTERNO, que
corresponden a los puntos habilitados en los comercios fuera de estaciones para hacer recargas
de tarjeta. Los registros de transacciones de recarga en estaciones del sistema troncal solo se
tienen para hacer un diagnóstico del sistema de recarga de la ciudad que se desarrolla en la
sección 4. Dentro de esta base de datos se crearon nuevos campos que separaran la fecha y
hora de la transacción, para así facilitar el procesamiento de la información.
La base de datos está compuesta por transacciones para un periodo de 60 días comprendidos
entre el 30 de septiembre y el 30 de noviembre de 2016, que equivale a un promedio de 350
mil transacciones diarias.
3.3.2. Etapa 2- Identificar destino en el sentido paradero a Portal El destino de los viajes de alimentación se identificará a partir de las validaciones realizadas en los
torniquetes habilitados para la transferencia de usuarios desde el servicio de alimentación al servicio
troncal en los portales de las fases I y II de Transmilenio. Dentro de las estaciones de Transmilenio
cada uno de los lectores de tarjeta ubicados en los torniquetes tiene una identificación asociada al
punto de acceso, que permite diferenciar aquellos que son utilizados por los usuarios de los servicios
de alimentación y des-alimentación. De tal forma que se realizará una selección de registros por día,
estación y punto de acceso de alimentación. A continuación se presenta el esquema de
funcionamiento del servicio de alimentación y los elementos que se tendrán en cuenta en el análisis:
Figura 7 – Esquema del servicio de alimentación
Fuente: Elaboración propia con mapa base de infraestructura de Transmilenio
Para aquellas transacciones que cumplan los criterios anteriores, se extraerán los siguientes
campos:
i. La fecha de uso que corresponde a la fecha y hora en que se realizó la transacción.
ii. La ubicación dónde se realizó la validación, para lo cual se utilizan campos de línea que corresponde a cada una de las zonas que conforman el sistema BRT, el nombre de la estación, el tipo de acceso y el número del dispositivo donde realizó la lectura de la tarjeta. Adicionalmente, en algunos casos se encuentra disponible en este campo información de las rutas alimentadoras que se atienden desde ese punto o al menos si corresponden a rutas de servicios que se dirigen al norte, sur occidente u oriente de la ciudad. De esta forma, en el Portal Norte se tienen por dispositivos de acceso identificados como (05) Acceso Plataforma 1 - Desalimentación - Mirandela / Jardines / Guaimaral (Oriente), o (08) Acceso Plataforma 2 - Alimentación (Occidente).
De los 1,196 puntos de acceso que se encuentran habilitados en el sistema Transmilenio, 347 corresponden a torniquetes en portales de las Fase I y II, 71 se encuentran ubicados en portales de las Fase III y otros 778 están instalados en estaciones donde solo se ofrece servicio troncal. Para el propósito de la investigación, son relevantes los 244 puntos de acceso donde existe una asociación directa con los servicios de alimentación y estos corresponden a:
• 178 torniquetes instalados en los portales de las Fase I y II donde se identifica que el equipo está en Plataforma y la ruta de alimentación que atiende.
• 38 torniquetes de los Portales Sur y Tunal que se encuentran ubicados en Plataformas, pero donde no existe una asociación de las rutas de alimentación.
• 28 torniquetes de las estaciones Molinos, Tintal-Zona Franca, Calle 40 Sur y Granja, donde no existe una identificación de la ubicación del dispositivo y se procesarán todas las tarjetas identificadas.
iii. Información base de la tarjeta que incluye su emisor, tipo y el número único de identificación de la tarjeta.
iv. Información sobre el usuario obtenida en el campo Nombre Perfil, el cual permite diferenciar estudiantes, adultos mayores, discapacitados y usuarios con puntaje menor a 30.56 en SISBEN.
El número único de identificación de las tarjetas que se utilizaron en los torniquetes de des-
alimentación y alimentación es el componente más relevante de este registro y fue el punto de
enlace con las etapas siguientes del proceso. Los destinos de viajes se analizaron para cinco días
laborales de 2016 que corresponden al 4 de octubre, 26 de octubre, 3 de noviembre, 11 de
noviembre y 16 de noviembre.
Figura 8 – Representación esquemática de la identificación de las tarjetas con validaciones en
servicios de alimentación
Fuente: Elaboración propia
3.3.3. Etapa 3 - Inferencia del origen La inferencia del origen de los viajes de alimentación se desarrollará en los tres paquetes de trabajo
que se detallan a continuación.
Figura 9 – Flujograma de los paquetes de trabajo de la etapa de inferencia de origen
Fuente: Elaboración propia
▪ Paquete de trabajo 1 – Análisis de proximidad entre puntos de recarga externa y
paraderos
El primer paquete de trabajo tiene como objetivo asignar a cada punto de recarga externa, los
puntos de parada de las rutas de alimentación que sean más cercanos, teniendo en cuenta la
distancia en metros entre ambos puntos. Para ello se utilizaron tres fuentes principales de
información: i) el mapa con la ubicación geo-referenciada de los puntos de recarga externa que
fue presentado en la sección, ii) el mapa con la ubicación geo-referenciada de los paraderos de
las rutas alimentadoras de Transmilenio y iii) las capas disponibles para la malla vial de Bogotá
en la que se identifican vías e intersecciones, debido a que no existe una capa que permita
identificar los pasos peatonales disponibles en la ciudad.
La evaluación de proximidad corresponde a la minimización de la distancia de caminata sobre
la red entre el punto de recarga y los paraderos de las rutas alimentadoras, dentro de una zona
de cobertura previamente delimitada. La distancia se calculó con la trayectoria que recorrería
el usuario en los andenes que conforman la malla vial de Bogotá, y considerando que el sentido
de circulación es bidireccional sobre el andén y no asociado al sentido de la vía. Esta es la mejor
aproximación posible con la información disponible, debido a que no se encontraron capas
detalladas de todos los pasos peatonales de la ciudad.
Adicionalmente, se colocó una restricción que permitiera descartar aquellos puntos de recarga
externa que se encuentran lejos de las zonas de alimentación, y que no serían puntos válidos
de inferencia del origen de un viaje. Esta restricción permite también acotar la distancia
máxima a ambos lados del punto de recarga externa, desde la cual un usuario se podría
desplazar caminando hasta un paradero de ruta alimentadora. La accesibilidad de un paradero
desde un punto de recarga externa, fue evaluado para una distancia máxima de 500 m y otra
de 1,000 m. Estos escenarios se utilizaron para comparar los resultados del número de usuarios
por ruta alimentadora y paradero frente a los registrados en los aforos realizados por
Transmilenio.
El ejercicio de proximidad se ejecutó con la herramienta de análisis de ubicación de
instalaciones más cercanas del módulo de análisis de red de ArcGis. Esta funcionalidad mide
para un conjunto de incidentes e instalaciones cuál es el costo de viajar entre ellos, determina
cuáles están más próximos entre sí, las mejores rutas entre puntos, entre otras salidas (ESRI,
2017). Por tanto, constituye una herramienta útil para definir la estación de bomberos idónea
para atender un incendio y la trayectoria que debería seguir el camión de bomberos. Para este
ejercicio se aplicó la herramienta, definiendo como instalaciones los paraderos de las rutas
alimentadoras y como incidentes los puntos de recarga externa.
A continuación se presenta el mapa en el que se pueden visualizar para un conjunto de puntos
de recarga externa cercanos al Portal Norte los paraderos de las rutas de alimentación que son
más cercanos.
Figura 10 – Mapa con análisis de proximidad entre puntos de recargas externa y paraderos de alimentación para zona cercana al Portal Norte
Fuente: Elaboración propia
El resultado de esta etapa es una tabla donde se asigna a cada número de identificación de
punto de recarga externa hasta un máximo de cinco paraderos más cercanos de una o varias
rutas de alimentación. El número de paraderos a evaluar fue definido como parámetro de
entrada en el ejercicio. La tabla también contiene en un campo separado el número de la ruta
de alimentación al que dicho paradero pertenece, la distancia en metros desde el punto de
recarga hasta el paradero y la jerarquía (1 a 5) que tiene dicho paradero en función de su nivel
de proximidad. Si bien se desarrolló el análisis de proximidad para cinco paraderos, para la
inferencia del origen solo se utilizó el paradero que se encuentra más cercano al punto de
recarga externa.
Tabla 3 – Salida del análisis de proximidad
Punto de recarga externa Drogueria Mirandela 100
Portal Norte
Ruta 2- 1 Mirandela
Jerarquía Id. Paradero cercano
Distancia PRE-Paradero (m) Restricción 500m
Distancia PRE-Paradero (m) Restricción 1,000m
1 2. 285A02 304 304 2 5. 287A02 363 363 3 6. 169A02 375 375 4 7. 597A01 407 407 5 3. 286A02 - 582
Fuente: Elaboración propia
▪ Paquete de trabajo 2 – Identificación de transacciones de recargas de los potenciales
usuarios de alimentación En el segundo paquete de trabajo, se filtran las transacciones de recarga realizadas por los usuarios de alimentación que fueron identificados en la etapa 2. El proceso consistió en seleccionar dentro de la base de datos de transacciones de recarga, los números de tarjetas inteligentes que fueron utilizados en los validadores de las zonas de alimentación/des-alimentación de los portales y que se habían obtenido en la etapa 2 de identificación del destino del viaje. Este proceso fue desarrollado en Posgres mediante el proceso presentado en el Anexo 3 –
Procesamiento de datos y algoritmos Posgres.
Figura 11 – Representación esquemática de la asociación de las tarjetas con validaciones en
servicios de alimentación a transacciones de la red de recarga
Fuente: Elaboración propia
▪ Paquete de trabajo 3 – Geo-referenciación de transacciones de recarga
Finalmente, se asignó a cada uno de las transacciones de la red externa que están asociadas a usuarios del servicio de alimentación, el paradero y ruta de alimentación más próximo. Como resultado, se tiene un registro completo que identifica para cada transacción con una tarjeta inteligente utilizada en un validador ubicado en plataforma de alimentación, el punto de recarga externa georreferenciado, la ruta de alimentación que está dentro del área de cobertura del punto de recarga externa y los paraderos más próximos a ese punto de recarga dentro de un área de cobertura de 500 m. Este mismo ejercicio se repitió para un área de cobertura de 1,000 m. Este proceso fue desarrollado en Posgres mediante el proceso presentado en el Anexo de algoritmos.
3.3.4. Etapa 4 - Validación La validación corresponde a una prueba del código donde coloco un punto de recarga y una
validación en el destino conocida, y se ingresan tramas de transacciones y registros con la estructura
de datos del SIR. El objetivo fue hacer un conjunto de pruebas unitarias e integradas que permitan
garantizar que el programa desarrollado funcione adecuadamente.
3.3.5. Etapa 5 - Comprobación y expansión Se anticipa la necesidad de realizar una expansión teniendo en cuenta que la evasión es un
comportamiento habitual de los usuarios. De allí, que los resultados obtenidos mediante el proceso
descrito en las etapas previas subestimen el número de viajes realizados en los servicios de
alimentación. Para determinar el factor de expansión, se utilizaron los aforos de ascensos/descensos
proporcionados para algunas rutas de alimentación. Adicionalmente, se compararon los resultados
obtenidos mediante la metodología de inferencia con los aforos de cada una de las rutas.
Transmilenio S.A. está desarrollando un estudio de los niveles de evasión del sistema, que podría
incorporarse en una etapa posterior debido a que está proyectado se finalice en febrero de 2018.
Finalmente en esta etapa, se evaluó la proporción de usuarios que utilizan los servicios de
alimentación pero que recargan en las estaciones del sistema troncal, o que sí realizan recargas en
la red externa pero los puntos no se encuentran próximos a las paradas de los servicios de
alimentación.
3.3.6. Etapa 6 – Construcción de resultados matrices O-D y perfiles de carga La construcción de perfiles de carga se basa en una identificación de los usuarios que validan en los
dispositivos de lectura de tarjeta ubicados en las plataformas de alimentación y desalimentación,
dentro de un intervalo de tiempo que tiene en cuenta el intervalo de salidas de las rutas
alimentadoras. Se trabaja bajo el supuesto de que estos usuarios desembarcan de un bus de
alimentación. Posteriormente, se asocia a cada uno de los usuarios que validan en la estación
troncal, el número de ruta y el paradero del que se infiere embarcó. La asociación del punto de
embarque proviene de los resultados de la Etapa 2 – Inferencia de origen.
Las salidas de la metodología descrita son los perfiles de carga y matrices origen-destino de las
rutas alimentadoras de las fases I y II de Transmilenio.
4. Análisis estadístico del sistema de recaudo del SITP de Bogotá
En el sistema BRT Transmilenio se realizan diariamente 3.4 millones de validaciones. Dentro de este conjunto de validaciones, la participación por perfil muestra que el 76% de las transacciones son realizadas por usuarios que tienen una tarjeta anónima o una tarjeta personalizada de adulto y un 17% son validaciones de usuarios que reciben subsidios por cumplir con un puntaje menor a 30.56 bajo la metodología SISBEN III. Los perfiles de adulto mayor y personas con discapacidad, representan respectivamente, el 5% y el 2% de las validaciones.
Tabla 4 - Porcentaje de validaciones por nombre de perfil para todo el sistema BRT y en los accesos de alimentación
Fuente: Elaboración propia
La Tabla 4 permite evidenciar que los usuarios que reciben subsidios del gobierno tienen una mayor participación dentro de las validaciones que se realizan en el sistema de alimentación. En algunos portales es más significativa la participación de grupos preferenciales dentro del total de usuarios, debido a las condiciones socioeconómicas de los barrios circundantes al portal. En el Portal Usme es más significativo este comportamiento, puesto que cerca del 30% de las validaciones son efectuadas por usuarios con perfil apoyo ciudadano frente a solo el 15% de todo el sistema BRT.
Figura 12 - Distribución % de validaciones asociada a servicios de alimentación
Fuente: Elaboración propia
En promedio, se realizaron 1.1 millones de recargas al día en días hábiles, de las cuales un 72% se realizó en estaciones y el 28% restante en puntos externos de recarga. No se evidenció una
Perfil de Usuario BRT Alimentadores
Adulto 76% 71%
Adulto Mayor 5% 5%
Discapacidad 2% 2%
Apoyo Ciudadano 17% 22%
Total 100% 100%
83%
80%
78%
70%
64%
8%
13%
16%
24%
30%
7%
6%
5%
4%
4%
1%
1%
1%
1%
2%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Calle 80
Portal Norte
Suba
Portal Sur
Usme
Adulto Apoyo Ciudadano Adulto mayor Discapacitado
diferencia significativa en el monto promedio recargado según punto de venta (alrededor de 3 viajes en ambos casos). Por otro lado, la Figura 12 permite identificar que los martes y miércoles son los días en que se realiza un mayor número de recargas, mientras que los sábados y sobre todo los domingos se reduce la frecuencia de recarga.
Figura 13 – Distribución de recargas promedio según día de la semana (%)
Fuente: Elaboración propia con datos de Transmilenio
La red de recarga está conformada por los puntos habilitados en estaciones y puntos de recarga
externa que cuentan con dispositivos de recarga. La recarga promedio en la red externa de $5.748
para el periodo de análisis, esto equivale a 3 viajes con tarifa plena. Las recargas de menor valor son
habituales para los perfiles de estudiante, discapacitados y apoyo ciudadano. La distribución de las
transacciones de recarga por el monto recargado muestra que el 30% de los usuarios recarga un
viaje, el 25% recarga 2 viajes, un 43% 1 semana de viajes y solo un 3% recarga más de 1 semana de
viajes. La muestra la distribución de recarga diarias por el monto recargada para todos los usuarios
del sistema y para los usuarios con perfil de apoyo ciudadano.
Figura 14 - Distribución % del monto diario recargado perfil de usuarios para todos los canales
Fuente: Elaboración propia con datos de Transmilenio
14%
17%17% 16% 16%
12%
7%
0%
2%
4%
6%
8%
10%
12%
14%
16%
18%
20%
Lunes Martes Miércoles Jueves Viernes Sabado Domingo
30 25
43
2 1
35
26
38
1 0
1 viaje,< 2.000
2 viajes< 4.000
1 semana< 20.000
2 semanas< 40.000
1 mes
Todos los usuarios
Apoyo ciudadano
Los medios de pagos utilizados incluyen las tarjetas Capital Monedero, Usuario frecuente y otras modalidades del antiguo operador de recaudo Angelcom que aún se encuentran en operación, las tarjetas tullave y tu llave Plus emitidas por Recaudo Bogotá S.A.S, y las tarjetas híbridas emitidas por entidades bancaria (Bancolombia y Davivienda). El 97.6% de los viajes en el sistema se realizan con las tarjetas propias del sistema de Transporte, y solo el 2,4% de los usuarios realizan sus viajes utilizando tarjetas de entidades bancarias. Otro elemento, a considerar es que el 12% de los usuarios utiliza la funcionalidad de saldo negativo que permite la tarjeta personalizada. Esta funcionalidad permite que un usuario tenga hasta un viaje a crédito que será cobrado una vez realice la recarga de saldo en la tarjeta.
En cuanto a las horas de recarga, la Figura 12 confirma que existe un perfil diferente entre los puntos de recarga externo y las estaciones. Así, en los puntos de recarga externo existe las horas de mayor demanda se encuentran hacia el final de la tarde, en el periodo entre 5 y 7pm. En las estaciones se evidencian dos franjas de horas de recarga, el primero entre 5:30 y 7:30 am y luego entre 4:30 y 6pm.
Figura 15 - % de recargas por hora en puntos de recarga externo y estaciones
Fuente: Elaboración propia con datos de Transmilenio
Un elemento clave es la comparación del perfil de las validaciones diarias frente al perfil de transacciones en la red de recarga externa por hora del día. El comportamiento de viajes muestra una hora pico de la mañana, donde a las 6am se concentra el 11% de la demanda. La hora pico de la tarde es a las 5pm donde se registran el 10.5% de los viajes. Sin embargo, el periodo pico de recargas en la red externa es en la hora de la tarde entre 5pm y 6pm. Por tanto, los usuarios esperan el fin de su jornada laboral para realizar las recargas de sus tarjetas.
0%
2%
4%
6%
8%
10%
12%
0 1 2 3 4 5 6 7 8 9 1011121314151617181920212223
% d
el t
ota
l
HorasPOS Estaciones
Figura 16 - Perfil validaciones y recargas externas
Fuente: Elaboración propia con datos de Transmilenio
En relación a los puntos de recarga externa en operación, se evidencia que el 80% de estos hacen
menos de 100 transacciones. Existen algunos valores extremos en el sector norte de la ciudad donde
se realizan más de 1.000 transacciones al día.
Tabla 5 - No. de puntos de recarga según número de recargas diarias
No. recargas No. PRE
<50 2.677
<100 1.088
<200 687
<500 259
<1000 9
>1000 2
Total 4.722
Fuente: Elaboración propia con datos de Transmilenio
La Tabla 5 muestra las 15 principales estaciones donde se realiza el mayor número de recargas
diarias en promedio. Además de los portales, se observan otras ubicaciones importantes en la
ciudad donde se realizan intercambios a buses, como la Av. Jiménez, la Calle 100 o la Calle 63. Por
otro lado, en términos de recarga promedio por estación, cabe señalar que se encontró una
desviación estándar de $645 para las 156 estaciones analizadas, con un 95% de las mismas con un
monto promedio de recarga entre $4,300 y $6,800.
0%
2%
4%
6%
8%
10%
12%
0 1 2 3 4 5 6 7 8 9 1011121314151617181920212223
% d
el t
ota
l
HorasRecargas Validaciones
Tabla 5 – Monto y Número de Recargas Diario por Estación Transmilenio
Estación Monto ($M) No. Recargas
Portal Norte 174 31.241
Portal 80 142 25.300
Portal Américas 137 25.060
Portal Suba 132 24.220
Portal Sur 101 18.708
Portal El Dorado 97 17.969
Portal Usme 87 17.597
Portal Tunal 68 15.636
Portal 20 de Julio 74 14.270
Banderas 76 13.468
San Mateo 62 12.515
Av. Jiménez 52 11.194
Calle 100 59 9.636
Calle 63 43 8.770
Alcalá 55 8.741
Fuente: Elaboración propia con datos de Transmilenio
5. Resultados Los resultados se presentan en tres secciones. La sección 5.1 muestra un análisis de las cifras
agregadas por portal, para identificar aquellos donde la demanda total identificada es más cercana
a la que está consignada en los aforos de Transmilenio para el periodo junio a septiembre de 2016.
La sección 5.2 presenta los orígenes de viaje de los servicios de alimentación de Transmilenio,
cumpliendo así con el objetivo de la investigación de construir la matriz origen-destino. Finalmente
en la sección 5.3, se incluyen los perfiles de carga para aquellas rutas de alimentación donde el
volumen de pasajeros inferido presenta menores desviaciones respecto de los aforos de
Transmilenio.
5.1. Análisis por portal En la Figura 16 se puede apreciar el porcentaje de demanda de alimentación por portal que se
concentra en las horas punta de la mañana, entre las 6 y las 9 de la mañana. Este porcentaje va
desde un 45.5% en Portal Usme hasta un 52.1% en Portal 80, para un promedio de 48%. La demanda
es más significativa en la franja de la mañana, y es aquí donde se encuentra el periodo para el cual
se debe diseñar la capacidad máxima a ofertar por ruta. De otra parte, en el periodo de 5pm a 7pm
se registra en promedio solo el 11% de los viajes diarios, mientras en el horario restante se
distribuyen el 41% de la demanda.
Figura 16: Porcentaje de demanda alimentación por portal que se concentra entre 6 y 9am
Fuente: Elaboración propia con datos de Transmilenio
Por su parte, la Figura 17 realiza una comparación entre las cifras de recaudo vs las de aforos para
cada portal. Se pueden apreciar diferencias de hasta +/- 60% entre ambas cifras (+61% en Banderas,
- 59% en Portal Norte y -56% en Portal 80). Algunas de las razones que podrían explicar estas
diferencias: i) torniquetes mal identificados en plataformas vs pasos peatonales vs accesos
intermunicipales, y ii) evasión al ingresar al portal.
45,5%
46,0%
46,3%
46,9%
47,0%
48,1%
48,4%
48,9%
48,9%
49,3%
50,5%
52,1%
42% 44% 46% 48% 50% 52% 54%
Portal Usme
Américas
Portal Sur
Portal Norte
Calle 40 Sur
Promedio
Molinos
Portal Tunal
Banderas
Santander
Granja
Portal 80
Figura 17: Diferencias entre recaudos y aforos (%)*
Fuente: Elaboración propia con datos de Transmilenio. * No se cuentan con datos de aforo para Granja
Si bien en algunos portales la desviación entre recaudos y aforos es elevada, en otros casos las cifras
muestran un mayor grado de alineamiento. Son los casos de Santander, Calle 40 Sur y Portal Sur,
donde la diferencia entre ambos indicadores no excede el 10% en valor absoluto. Al respecto, cabe
señalar que el análisis de perfiles de carga se concentrará en aquellos portales donde existe un
comportamiento más cercano de la demanda a nivel agregado.
La Figura 18 permite comparar las cifras de recaudos y aforos en el Portal Sur (uno de los que registra
menores desviaciones entre ambas variables) para cada hora del día. Los picos de demanda entre
las 6 y las 9 de la mañana efectivamente muestran un comportamiento similar, con un pico hacia
las 6 de la mañana seguido por una tendencia decreciente en las siguientes horas. Los resultados
muestran que para el periodo de 6am a 9am, las cifras inferidas con la metodología expuesta se
encuentran solo un 10% por debajo de los resultados de aforos reportados por Transmilenio.
Figura 18: Recaudos y Aforos en Portal Sur por hora del día (número de pasajeros)
Fuente: Elaboración propia con datos de Transmilenio.
-59%
-56%
-37%
-37%
-15%
-10%
-2%
10%
22%
61%
-80% -60% -40% -20% 0% 20% 40% 60% 80%
Portal Norte
Portal 80
Portal Tunal
Portal Usme
Molinos
Portal Sur
Calle 40 Sur
Santander
Americas
Banderas
0
1.000
2.000
3.000
4.000
5.000
6.000
7.000
8.000
9.000
10.000
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Nú
mer
o d
e p
asaj
ero
s
Hora del día
Recaudo
Aforos
5.2. Orígenes de la Matriz de alimentación En esta sección, se presenta una distribución geográfica y de volúmenes de pasajeros de los orígenes
de la matriz de alimentación. La Figura 24 muestra la información agregada para todos los portales,
donde cada punto del mapa corresponde al volumen de demanda asociado a cada paradero.
Adicionalmente, en esta sección se exponen los mapas de detalle por Portal con el volumen de
pasajeros por punto de parada.
Figura 24: Orígenes de la matriz de alimentación
Fuente: Elaboración propia con datos de Transmilenio.
a. Portal Sur
En la Figura 25 se puede apreciar el detalle de los orígenes de la matriz de alimentación para el Portal Sur. Dos
paraderos destacan por el mayor flujo de pasajeros (representado por el alto de las barras): una corresponde
a la línea 10-8 Olarte-Timiza (499 pasajeros) y la otra a la 10-2 Bosa Centro (426 pasajeros).
Figura 25: Orígenes Matriz de Alimentación – Portal Sur
Fuente: Elaboración propia con datos de Transmilenio.
b. Portal Tunal
En la Figura 26 se puede apreciar el detalle de los orígenes de la matriz de alimentación para el Portal Tunal.
Dos paraderos destacan por el mayor flujo de pasajeros: el primero se encuentra dentro de la línea 6-7 San
Joaquín (307 pasajeros) y el segundo en la línea 6-6 J.J. Rendón (288 pasajeros).
Figura 26: Orígenes Matriz de Alimentación – Portal Tunal
Fuente: Elaboración propia con datos de Transmilenio.
c. Portal Norte
En la Figura 27 se puede apreciar el detalle de los orígenes de la matriz de alimentación para el Portal Norte.
Dos paraderos destacan por el mayor flujo de pasajeros: el primero se ubica dentro de la línea 2-5 San Cristóbal
(194 pasajeros) y el segundo en la línea 2-11 Andalucía (193 pasajeros). Cabe señalar que en el caso puntual
del Portal Norte, si bien hay rutas alimentadoras con paradas sobre la Autopista Norte hacia el Portal (como
se muestra en la Figura 24), en este trayecto casi no se cuenta con puntos externos de recarga.
Figura 27: Orígenes Matriz de Alimentación – Portal Norte
Fuente: Elaboración propia con datos de Transmilenio.
5.3. Perfil de carga en rutas alimentadoras seleccionadas En la esta sección se analiza el perfil de carga de rutas alimentadoras seleccionadas hacia el portal
correspondiente, con el objetivo de comparar los datos encontrados con los aforos realizados por
Transmilenio. Al respecto, cabe señalar que los perfiles de carga se construyeron con una muestra
de cinco días; así mismo, todos los gráficos toman información para la jornada del 16 de noviembre
de 2016, en la franja horaria de 6am.
a. Portal Sur : Ruta 10_1_Av.Bosa hacia
En la Figura 19 se muestra el perfil de carga para la ruta 10_1 hacia el Portal Sur. La ruta consta de
12 paradas (además de las 2 de inicio/fin en el punto de plataforma). En 2 de estas paradas no se
registraron pasajeros abordando. En total, se registraron 106 pasajeros en el trayecto, 2% por
encima de los 104 registrados por el aforador; una diferencia que en todo caso puede considerarse
baja dado que ambos procesos son muestreos.
Figura 19: Perfil de Carga de Ruta 10_1 hacia Portal Sur
Fuente: Elaboración propia con datos de Transmilenio.
b. Portal Tunal : Ruta 6-2 San Francisco
En la Figura 20 se muestra el perfil de carga para la ruta 6-2 hacia el Portal Tunal. La ruta consta de
10 paradas (además de las 2 de inicio/fin en el punto de plataforma). En 3 de estas paradas no se
registraron pasajeros abordando. En total, se registraron 54 pasajeros en el trayecto, 28% por
debajo de los 75 registrados por el aforador. La diferencia puede deberse al muestreo o bien porque
pasajeros salen por torniquetes cercanos a los de otras rutas alimentadoras.
14
137
8
24
314
0 0 911
5
0
20
40
60
80
100
120
Pas
ajer
os
Paradero
Existentes
Abordan
Aforo
Figura 20: Perfil de Carga de Ruta 6-2 San Francisco hacia Portal Tunal
Fuente: Elaboración propia con datos de Transmilenio.
c. Portal Norte : Ruta 2-5 San Cristóbal
En la Figura 21 se muestra el perfil de carga para la ruta 2-5 hacia el Portal Norte. La ruta consta de
15 paradas (además de las 2 de inicio/fin en el punto de plataforma). En 8 de estas paradas no se
registraron pasajeros abordando. En total, se registraron 64 pasajeros en el trayecto, 24% por
debajo de los 84 registrados por el aforador. La diferencia puede deberse al muestreo o bien porque
pasajeros salen por torniquetes cercanos a los de otras rutas alimentadoras.
Figura 21: Perfil de Carga de Ruta 2-7 San José de Bavaria hacia Portal Norte
Fuente: Elaboración propia con datos de Transmilenio.
d. Portal 80: Ruta 1-9 Villas del Dorado
En la Figura 22 se muestra el perfil de carga para la ruta 1-9 hacia el Portal de la 80. La ruta consta
de 7 paradas (además de las 2 de inicio/fin en el punto de plataforma). En una de estas paradas no
se registraron pasajeros abordando. En total, se registraron 60 pasajeros en el trayecto, 27% por
debajo de los 82 registrados por el aforador. La diferencia puede deberse al muestreo o bien porque
pasajeros salen por torniquetes cercanos a los de otras rutas alimentadoras.
2 4 0 0 1
16
20
92 0
0
10
20
30
40
50
60
70
80
Pas
ajer
os
Paradero
Existentes
Abordan
Aforo
80 0 0 0 3 2
160
31
2 0 0 0 2
0
10
20
30
40
50
60
70
80
90
Pas
ajer
os
Paradero
ExistentesAbordanAforo
Figura 22: Perfil de Carga de Ruta 1-9 Villas del Dorado hacia Portal 80
Fuente: Elaboración propia con datos de Transmilenio.
e. Estación Molinos: Ruta 4-1 Bochica
En la Figura 23 se muestra el perfil de carga para la ruta 4-1 hacia la Estación Molinos. La ruta consta
de 11 paradas (además de las 2 de inicio/fin en el punto de plataforma). En 2 de estas paradas no
se registraron pasajeros abordando. En total, se registraron 66 pasajeros en el trayecto, 21% por
debajo de los 83 registrados por el aforador. La diferencia puede deberse al muestreo o bien porque
pasajeros salen por torniquetes cercanos a los de otras rutas alimentadoras.
Figura 23: Perfil de Carga de Ruta 4-1 Bochica hacia Estación Molinos
Fuente: Elaboración propia con datos de Transmilenio.
102
145 0
28
1
0
20
40
60
80
100
Pas
ajer
os
Paradero
Existentes
Abordan
Aforo
0 610
4 010
0 64 1
23
3
0
10
20
30
40
50
60
70
80
90
Pas
ajer
os
Paradero
Existentes
Abordan
Aforo
6. Conclusiones y recomendaciones
Este capítulo presenta las conclusiones sobre el desarrollo de la metodología para la construcción
de la matriz origen-destino de alimentación, y la evaluación de cumplimiento de los objetivos de la
investigación. Adicionalmente, se exponen un conjunto de recomendaciones para aplicar la
metodología propuesta en un ambiente de producción en Transmilenio. Finalmente, se definen un
conjunto de próximos pasos que permitirían mejorar o ampliar el trabajo ejecutado.
Conclusiones
▪ Se definió una metodología que permite identificar el destino e inferir el origen de los viajes
realizados en las rutas de alimentación de las Fase I y II de Transmilenio a partir de las un
proceso de minería sobre datos generados por sistemas inteligentes de transporte y análisis
geoespacial. Bajo esta metodología se construyeron las matrices origen-destino para 7 de
los 10 portales o estaciones que conforman las cabeceras de las Fases I y II. Las desviaciones
para las cabeceras analizadas se encontraban en un rango de -37% y +22% respecto de los
aforos realizados por Transmilenio para septiembre de 2016. Tres de las cabeceras
presentaron desviaciones significativas, producto una combinación de factores. Entre estos
los más significativos pueden ser la evasión y errores en la identificación de torniquetes de
alimentación/desalimentación en el SIRCI.
▪ El perfil de carga se estimó para aquellas rutas alimentadoras donde la suma total de
pasajeros que llegaban al portal era cercano a los reportados por los aforos de Transmilenio,
y donde existía un conteo representativo de pasajeros por parada. Se intentó al menos
construir un perfil de carga por portal. Aunque en el Portal Norte y el Portal 80, los datos de
forma agregada se ajustan a los aforos de referencia (desviaciones -24%, +2%), algunas rutas
individuales si presentan coincidencias.
▪ Los resultados obtenidos mediante el proceso fueron contrastados con los aforos que
realiza periódicamente Transmilenio para cada una de las rutas de alimentación. Sin
embargo, existieron limitaciones en el proceso de análisis puesto que los aforos entregados
por Transmilenio corresponden a conteos de ascensos y descensos cuando llegan o salen
los servicios de alimentación de los portales.
▪ El análisis estadístico de los datos de SIRCI, arrojo información relevante sobre el recaudo en la ciudad de Bogotá. Entre estos destaca, que la recarga promedio en la red externa de $5.748 para el periodo de análisis, esto equivale a 3 viajes con tarifa plena. Este bajo monto de recarga promedio es consistente con el uso del viajes a crédito (12% de las transacciones). Ambas cifras son indicadores de un perfil de usuario con un bajo nivel de ingresos y que recibe su pago laboral de forma diaria.
Esta elevada frecuencia de recarga en la ciudad, es la que permite tener una base de datos con amplio número de registros y de puntos geo-referenciados para analizar el origen y destino de viajes.
De otra parte, se confirmó que existe un perfil diferente entre los puntos de recarga externo (28% total de recargas) y las estaciones (72% del total de recargas). Así, en los puntos de recarga externo existe las horas de mayor demanda se encuentran hacia el final de la tarde, en el periodo entre 5 y 7pm. En las estaciones se evidencian dos franjas de horas de recarga, el primero entre 5:30 y 7:30 am y luego entre 4:30 y 6pm.
▪ Se evaluó la eficiencia de la herramienta generada para el procesamiento periódico de los
datos, identificándose oportunidades de mejora que deberán aplicarse en un ambiente
productivo.
Consideraciones para el desarrollo de una herramienta para ambiente productivo
▪ Para el ejercicio desarrollado, el volumen de datos se encontraba cercano a 60 millones de
registros para los 2 meses de transacciones (30 de septiembre a 30 de noviembre de 2016)
de la red de recarga externa, y a cerca 15 millones de transacciones para los 5 días de
validaciones. El rendimiento de la herramienta Posgres permitió efectuar el estudio, pero
presentó inconvenientes en tiempos de respuesta para las etapas finales del análisis.
▪ Debido a que el conjunto de datos en un ambiente productivo sería mucho mayor que el
utilizado para la investigación, se propone contar con una herramienta más robusta como
Hadoop. Hadoop, al igual que Posgres, es un software abierto que permitiría almacenar y
procesar la información sin incurrir en altos costos de licenciamiento. En el ambiente de
producción, sería necesaria una planificación cuidadosa, especialmente si todos los datos
estén siempre disponibles para un procesamiento de datos flexible.
Próximos pasos y elementos para ampliar o mejorar la metodología
▪ Revisar con Transmilenio S.A la identificación asignada en el SIRCI a los torniquetes que
atienden las plataformas de alimentación y desalimentación de cada portal. El objetivo de
esta actividad es verificar si este es el motivo del menor de validaciones en plataforma de
alimentación/desalimentación, respecto de los aforos de los meses de junio o septiembre
de 2016. Este ejercicio debe desarrollarse principalmente para los portales Norte y Calle 80.
▪ Desarrollar un nuevo algoritmo donde se infieran los orígenes de viaje de los servicios de
alimentación, teniendo en cuenta aquellos paraderos que sean segundos óptimos en cuanto
a proximidad a los puntos de recarga externa. En este caso se podría validar cuál de
combinación presenta una mejor aproximación al perfil de carga de las rutas.
▪ Ejecutar aforos en los servicios de alimentación para determinar los abordajes y descensos
en cada uno de los paraderos de la ruta. La información de aforos proporcionada por
Transmilenio corresponde al total de pasajeros que desciende en las plataformas de
alimentación/desañimentación por portal, y sirve al propósito de verificar la demanda total.
Anexo 1 – Estructura de registros de validaciones
Tabla 6 – Estructura de validaciones en las estaciones del BRT
Campo Descripción Utilizado
Fecha de Liquidacion
Contiene la fecha en que se liquida la transacción -
Fecha de Uso Contiene fecha y hora de uso Si
Day Group Type Define un tipo de día. No se está utilizando, en todas las transacciones recibidas aparece como tipo de día 1.
-
Hora Pico S/N Define si la transacción se realizó en hora pico o no pico. No se está utilizando, todas las transaccion aparecen como hora pico.
-
Fase Esta campo aparece como Fase 3 en todas las transacciones, independiente de a qué fase de implementación de Transmilenio corresponde la estación.
-
Emisor Corresponde al emisor de la tarjeta. Existen cuatro alternativas:
• (1900001) Angelcom Card que era el operador de recaudo anterior • (3101000) Bogota Card(Citizen) se denomina a las tarjetas emitidas por
el operador actual de recaudo. • (3200101) Bancolombia tarjetas híbridas emitidas por la entidad
bancaria. • (3200301) Davivienda tarjetas híbridas emitidas por la entidad bancaria.
Si
Operador Clasificación como validación dentro de la operación troncal o de alimentación.
-
Linea Nombre de la línea dónde se realizó la validación. Las líneas disponibles son: (33) Zona B AutoNorte : desde la estación Héroes al Portal del Norte.
Si
Estacion Nombre de la estación dónde se realiza la validación. Si
Acceso de Estación
Nombre del acceso dentro de la estación dónde se realiza la validación. Si
Dispositivo Número del validador donde se utilizó la tarjeta.
Tipo de Tarjeta Tipo de tarjeta utilizada en la validación, donde se tienen las siguientes opciones:
• Tullave Básica que es la tarjeta anónima numerada que utilizan la mayor parte de los usuarios
• Tullave Plus que es la tarjeta personalizada que tiene los datos personales y la foto del usuario.
• Angelcom que es la tarjeta utilizada por el operador anterior del recaudo AngelCom.
Si
Nombre de Perfil
Perfil del usuario para cada tipo de tarjeta. En las tarjetas tullave Básica todos los usuarios son de tipo anónimo y tienen como nombre de perfil
• (001) Anonymous. En las tarjetas tullave Plus existen diferentes categorias:
• (001) Adulto tarjetas personalizadas que pueden ser solicitadas por cualquier usuario.
• (002) Adulto Mayor tarjetas personalizadas que pueden solicitar los mayores de 62 años y que les permite tener un descuento sobre el valor de la tarifa. (003) Estudiantil
• (005) Discapacidad para personas en condición de discapacidad. • (006) Apoyo Ciudadano para las personas mayores de 16 años que
califiquen con un puntaje entre 0 y 30.56 según la metodología SISBEN III. Esta tarjeta habilita el acceso con una tarifa preferencial a este grupo.
Si
Numero de Tarjeta
Número único que identifica la tarjeta. Si
Tipo de Tarifa Se utiliza una tarifa tipo 1 para el sistema. A la fecha no existe diferenciación de tarifas según la hora del día.
-
Saldo Previo a Transaccion
Saldo previo a la transacción. -
Valor Valor de la transacción, que corresponde a la tarifa que se descontará. Las opciones son:
• 300 para cobro por transferencia • 1000 tarifa preferencial para usuarios que son beneficiados por SISBEN • 1800 tarifa preferencial para adulto mayor • 2000 tarifa plena del sistema
Si
Saldo Despues de Transaccion
Saldo después de descontar el valor de la transacción. -
Fuente: Elaboración propia con base en la base de datos suministrada por Transmilenio S.A.
Anexo 2 – Estructura de registros de transacciones de la red de recarga externa
A continuación se presenta una descripción detallada de la información almacenada para cada transacción en la red de recarga externa.
Tabla 7 – Estructura de transacciones de recarga en estaciones y en la red externa del BRT
No Etiqueta Descripción Ejemplo 1 - Punto de Recarga
Externa Ejemplo 2 - Estación Utilizado
1 LSAM_ID No. identificación de SAM 820010010005735 304008209091408 -
2 LSAM_TRNSCTN_NUM No. De transacción que se realiza en la SAM
11738 352622 -
3 JOB_DT Fecha de transacción 20161002 20161002 Si
4 TRNSCTN_DATE Fecha y hora de transacción 20160821172737 20161002182319 Si
5 STATION_NM Nombre de estación Heroes(02304) -
6 STATION_ACCS_NM Nombre del acceso a la estación Acceso Sur (Taquilla Oriente)
-
7 SERV_ACCT_ID No. Identificación de la cuenta asociada al servicio
5873 6029 -
8 ISUER_ID Identificación del emisor 3101000 1900001 -
9 ISSUER_NM Nombre del emisor Bogota Card(Citizen) Angelcom Card Si
10 CARD_NUM No. de tarjeta 1010000044561480 36098543299880900 -
11 CARD_TRNSCTN_SEQ No. transacción en la tarjeta 473 201 -
12 RELOAD_BEF_BAL Saldo en COP de la tarjeta antes de la recarga
2900 1050 -
13 RELOAD_REQ_AMT Monto en COP de la recarga 15000 2000 Si
14 RELOAD_AFT_BAL Saldo en COP de la tarjeta después de la recarha
17900 3050 Si
15 LSAM_RELOAD_BEF_BAL Saldo en COP de la SAM antes de la recarga
156650 391500 -
16 LSAM_RELOAD_AFT_BAL Saldo en COP de la SAM después de la recarga
141650 393500 -
17 RELOAD_FEE_AMT Costo de la recarga que corresponde al monto que se le reconoce al agente.
150 0 Si
18 NGTBAL Cupo para Saldo en COP negativo de la tarjeta
-
19 PROFILE_NM Nombre del perfil de usuario Adulto(001) -14 Si
20 PAY_TYPE_NM Forma de pago (01) Efectivo Efectivo(01) Efectivo(01) -
21 RELOAD_TYPE_NM Recarga estándar o normal, o recarga de tarjetas que pueden tener saldo negativo
Normal(1) Normal(1) -
22 AGENT_TYPE_NM Tipo de equipo de venta Agente POS Externo Estación Troncal Si
23 CARD_TYPE_NM Tipo de tarjeta tullave Básica(1) Angelcom(5) Si
24 CARD_TYPE_CD Código del tipo de tarjeta 1 5 -
25 AGENT_TYPE_CD Código del tipo de agente que realiza la venta
10 20 Si
26 AGENT_NM Nombre de identificación del agente CAFEINTERNETQUINTADESTA
BARBARA(0005360) Agente RB(0000001) -
27 STATION_ID Número de estación 5873 2304 -
28 STATION_NM Nombre de estación CAFEINTERNETQUINTADESTA
BARBARA Heroes -
29 BRANCH_ADRES Dirección del punto de recarga Acceso Sur (Taquilla Oriente)()
-
30 STATION_ID Identificación único de la estación 0 2304 -
31 TRNSCTN_TYPE_NM Tipo de transacción: Carga de tarjeta Anulación de carga
Carga de Tarjeta Carga de Tarjeta -
Fuente: Elaboración propia con base en la base de datos suministrada por Transmilenio S.A.
Anexo 3 – Procesamiento de datos y algoritmos Posgres
a) Cargue de datos Para realizar la carga masiva de los archivos de recargas y validaciones hacia la base de datos en
PostgrSQL, se utilizaron herramientas de ETL con licenciamiento libre, las cuales fueron
desarrolladas con Pentaho Data Integration (PDI).
PDI, también llamada Kettle, es el componente de Pentaho responsable de los procesos de
extracción, transformación y carga (ETL). Aunque las herramientas ETL se utilizan con mayor
frecuencia en entornos de almacenes de datos, PDI también se puede utilizar para otros fines, como
por ejemplo:
• Migración de datos entre aplicaciones o bases de datos
• Exportar datos procedentes de bases de datos a archivos planos
• Carga masiva de datos en bases de datos
• Limpieza de datos
• Aplicaciones integradas El diseño de carga de los archivos para recargas se realizó con el siguiente modelo:
En la gráfica tenemos los siguientes componentes:
1. Archivos recargas: (CSV File Input) Este paso proporciona la capacidad de leer datos de un archivo delimitado; en este caso, archivos CSV.
2. Crear campos: (Calculator) Este paso de la calculadora proporciona funciones predefinidas que se pueden ejecutar en valores de un campo de entrada, el cual se utilizó para dar formato a la fecha de transacción y extraer la hora de la misma.
3. Filtrar registros: (Filter Rows) El paso de filtrar filas permite filtrar o redirigir según las condiciones y comparaciones establecidas, la cual se definió como agent_type_nm = “Agente POS Externo”.
4. Externo/Estación: (Table Output) El paso permite cargar datos en una tabla de la base de datos de PostgreSQL; este componente es equivalente al operador DML INSERT. Insertamos los datos en las tablas loadrefill_externo (datos correspondientes a Agentes POS Externo) y loadrefill_estacion (datos de estaciones).
El diseño de carga de los archivos para validaciones se realizó con el siguiente modelo:
En la gráfica tenemos los siguientes componentes:
1. Validaciones CSV: (CSV File Input) Este paso proporciona la capacidad de leer datos de un archivo delimitado; en este caso, archivos CSV.
5. loadValidation: (Table Output) El paso permite cargar datos en una tabla de la base de datos de PostgreSQL, este componente es equivalente al operador DML INSERT.
b) Particionamiento de datos
Se realizó división de las tablas de recargas para estaciones y puntos externos con inheritance. Esta
es una separación de los datos de una tabla en diferentes tablas secundarias, lo cual se le denomina
"partición" en PostgreSQL. Se incorporó esta partición porque se presentaba un rendimiento bajo
en consultas, a pesar de utilizar una indexación efectiva. Una de las causas del deterioro en el tiempo
de respuestas es el elevado número de registros. En este caso, el número de registros por tabla es
el siguiente:
Nombre tabla Número de registros
public.loadrefill_externo 16.986.903
public.loadrefill_estacion 42.742.190
El requisito más importante para una partición exitosa es encontrar un atributo que se pueda usar
para definir bloques de registros distribuidos de forma equitativa. La división de datos es más
efectiva cuando ninguna de las sub-tablas es más grande que las otras. Para este escenario el
particionamiento de los datos se realizó por fecha de transacción; por lo tanto, existirá una sub-
tabla por cada fecha de transacción contenida dentro de la información suministrada.
En la siguiente imagen se pueden observar las sub-tablas creadas para las recargas externas, donde
percibimos que cada tabla tiene identificado el periodo que se va a almacenar en cada una.
c) Consultas realizadas para análisis estadístico -- Número de recargas y monto por día para la tabla Recargas_POS Externo y Recargas_Extaciones /* tabla Recargas_POS Externo */ select trnsctn_shortdate, to_char(trnsctn_shorthour,'HH24:00:00'), count(*) as "Número de recargas", sum(RELOAD_REQ_AMT) as "Monto" from public.loadrefill_externo group by trnsctn_shortdate, to_char(trnsctn_shorthour,'HH24:00:00') order by trnsctn_shortdate, 2 /* tabla Recargas_Extaciones */ select trnsctn_shortdate, to_char(trnsctn_shorthour,'HH24:00:00'), count(*) as "Número de recargas" , sum(RELOAD_REQ_AMT) as "Monto" from public.loadrefill_estacion group by trnsctn_shortdate, to_char(trnsctn_shorthour,'HH24:00:00') order by trnsctn_shortdate, 2 -- ======================================================================================== -- No de recargas por tarjeta para todas las recargas, por tipo de canal (POS Externo, Estaciones), para el total de días y por tipo de tarjeta. -- Externo select trnsctn_shortdate, profile_nm, count(*) as "Numero de recargas" from public.loadrefill_externo group by trnsctn_shortdate, profile_nm order by trnsctn_shortdate, profile_nm -- Estaciones select trnsctn_shortdate, profile_nm, count(*) as "Numero de recargas" from public.loadrefill_estacion group by trnsctn_shortdate, profile_nm order by trnsctn_shortdate, profile_nm ======================================================================================== -- Monto promedio de recarga por tarjeta para todas las recargas, por tipo de canal (POS Externo, Estaciones), para el total de días y por tipo de tarjeta. -- Externo select trnsctn_shortdate, profile_nm, avg(RELOAD_REQ_AMT) as "Promedio de recarga" from public.loadrefill_externo group by trnsctn_shortdate, profile_nm order by trnsctn_shortdate, profile_nm -- Estaciones select trnsctn_shortdate, profile_nm,
avg(RELOAD_REQ_AMT) as "Promedio de recarga" from public.loadrefill_estacion group by trnsctn_shortdate, profile_nm order by trnsctn_shortdate, profile_nm ======================================================================================== -- No. de validaciones por día y hora en alimentación según la tabla de validaciones. -- Alimentadores select fecha_de_uso_date, to_char(fecha_de_uso_time,'HH24:00:00'), nombre_de_perfil, count(distinct numero_de_tarjeta) as "numero adultos" from loadvalidation where dispositivo in (select distinct dispositivo from accesoshabilitados) group by fecha_de_uso_date, to_char(fecha_de_uso_time,'HH24:00:00'), nombre_de_perfil -- troncales select fecha_de_uso_date, to_char(fecha_de_uso_time,'HH24:00:00'), nombre_de_perfil, count(distinct numero_de_tarjeta) as "numero adultos" from loadvalidation group by fecha_de_uso_date, to_char(fecha_de_uso_time,'HH24:00:00'), nombre_de_perfil ======================================================================================== -- No. y monto de recarga por punto de recarga externo y estación -- externo select trnsctn_shortdate, serv_acct_id, agent_nm, count(*) as "Numero de recargas", sum(RELOAD_REQ_AMT) as "Monto Recargado" from public.loadrefill_externo group by trnsctn_shortdate, serv_acct_id, agent_nm -- estaciones select trnsctn_shortdate, serv_acct_id, agent_nm, count(*) as "Numero de recargas", sum(RELOAD_REQ_AMT) as "Monto Recargado" from public.loadrefill_estacion group by trnsctn_shortdate, serv_acct_id, agent_nm
Anexo 4 – Listado detallado de rutas alimentadoras de Transmilenio
Fase Portal/Estación Nombre Ruta
Fase I Calle 40 Sur 7-1 Uribe-Uribe
7-2_Tunal_40s
7-3_Ingles_40s
7-3 Ingles
Granja 5-1 Suba Rincon
5-2 Cra 91
5-3 Serena Cerezos
5-4 Florida
Molinos 4-1 Bochica
4-2 Diana Turbay
4-3 Molinos Ii
Portal 80 1-1 Alamos
1-10 Bolivia Bochica
1-2 Garces Navas
1-3 Villas De Granada
1-4 Cortijo
1-5 Ciudadela Colsubsidio
1-6 Bolivia Oriental
1-7 Quirigua
1-8 Calle 80
1-9 V. Dorado
Portal Norte 2-1_Mirandela
2-10_Verbenal
2-11_Andalucia
2-12_Tibabita
2-2_Jardines
2-3_San_Antonio
2-4_El Codito
2-5_San Cristobal
2-6_Guaymaral
2-7_San_José
2-8_Expreso_170_Oriental
2-9_170_Occidental
Portal Sur 10-1 Av Bosa
10-1 Av Bosa V.2
10-2 Bosa Centro
10-3 Alban C.
10-3 Circular
10-4 Bosa Laureles
10-5 Terminal Sur
10-6 Perdomo
10-8 Olarte-Timiza
Portal Tunal 6-1 Candelaria_Pt
6-12_Villa_Gloria
6-2 San Francisco_Pt
6-3 Sierra Morena_Pt
6-4 Paraiso_Pt
6-5 Tesoro
6-6 J.J Rondon_Pt
6-7 San Joaquin_Pt
6-8 Vista Hermosa_Pt
6-9 Arborizadora Alta_Pt
Portal Usme 3-1 Aurora
3-2 Santa Librada
3-3 Chuniza
3-4 Alfonso Lopez
3-5 Usminia
3-6 Danubio
3-7 Av Caracas
3-8 Virrey
3-9 Marichuela
3-10 Usme Centro
3-11 Fiscala
3-13 Nebraska
3-15 Compostela
Tintal-Zona Franca Nueva Castilla
Fase II Américas 9-1 Casablanca
9-10 Roma
9-11 Franja Seca
9-2 Metrovivienda
9-3 La Libertad
9-4 Patio Bonito
9-5 Av Tintal
9-6 Av Villavicencio
9-7 Bosa Independencia
9-8 Porvenir
9-9 Bosa Santafe
Banderas 8-1 Kennedy Central
8-2 Ke Hospital Circ
8-2 Kennedy Hospital
8-4 Corabastos
8-6 Timiza
Castilla
Tintal
Santander 12-1 Fatima
12-1_Fatima_G.S
Nqs_Corferias
Fase III Portal 20 de Julio Altamira
Juan Rey
Libertadores
Peninsula
Resurreccion
Tihuaque
Villa_Del_Cerro
Portal El Dorado 16-10_Villemar
16-13 Hayuelos
16-7_La-Estancia
16-8 Zona Franca
16-9_Fontibon_Centro
Aeropuerto
Av.Cali - Hayuelos
Dorado Álamos
El Muelle
Engativá Centro
Fontibon-Centro
Gaviotas
La Estancia
La Faena
Tierra Grata
Villa Amelia
Villemar
Zona Franca
Bicentenario B_Girardot
Las Cruces
Ramirez
Los Laches No Operacion
Bibliografía Barry, J., Newhouser, R., Rahbee, A., & Sayeda, S. (2002). Origin and Destination Estimation in New
York City with Automated Fare System Data. Transportation Research Record: Journal of
the Transportation Research Board, 183-187.
Beltrán, P., Cortes, C., Gschwender, A., Ibarra, R., Munizaga, M., Ortega, M., . . . Zuñiga, M. (2011).
Obtención de información valiosa a partir de datos de Transantiago. XV Congreso Chileno
de Ingeniería de Transporte. Santiago.
Chan, J. (2007). Rail Transit OD Matrix Estimation and Journey Time. Massachusetts Institute of
Technology Master’s thesis.
Chapleau, R., Chu, K. K., & Allard, B. (2011). Synthesizing AFC, APC, GPS, and GIS Data to Generate
Performance and Travel Demand Indicators for Public Transit. 90th Annual Meeting of the
Transportation Research Board. Washington, DC.
CTS Embarq. (2015). MANUAL PARA EL DISEÑO Y LA IMPLEMENTACIÓN DE SISTEMAS DE RECAUDO
ELECTRÓNICO PARA TRANSPORTE PÚBLICO. México.
Cui, A. (2006). Bus Passenger Origin–Destination Matrix Estimation Using Automated Data
Collection Systems. Master’s thesis, Massachusetts Institute of Technology.
ESRI. (2017, 12 30). ArcMap Extensiones. Retrieved from
https://desktop.arcgis.com/es/arcmap/latest/extensions/network-analyst/closest-
facility.htm
Gordon, J. (2012). Intermodal Passenger Flows on London’s Public Transport Network. Boston:
Massachusetts Institute of Technology Master Thesis.
Hounsell, N., Shrestha, B., & Wong, A. (2012). Data management and applications in a world-
leading bus fleet. Transportation Research Part C, 78-87.
McCaig, E., & Yip, M. (2010). Technical note: A-BODS Stage 2.
Metropolitan Transportation Commission. (2003). Trip Linking Procedures: orking Paper #2: Bay
Area Travel Survey 2000.
Munizaga, M., & Palma, C. (2012). Estimation of a disaggregate multimodal public transport
Origin–Destination matrix from passive smartcard data from Santiago, Chile. Transport
Research.
Okamura, T., J, Z., & F., A. (2004). Finding Behavioral Rules of Urban Public Transport Passengers
by Using Boarding Records of Integrated Stored Fare Card System. 10th World Conference
on Transport Research. Istanbul.
Olsen Jr., D. (1999). Interacting in Chaos. In Interactions (pp. 42-54).
Peña, C., & Moreno, E. (2014). Delay at Bus Stops of Transmilenio Transport System According to
Parameters Measured “in situ”. Case Study Bogotá-Colombia. Procedia - Social and
Behavioral Sciences, 121-219.
Seaborn, C. W., Attanucci, J. P., & Wilson, N. H. (2009). Analyzing Multimodal Public Trasport
Journeys in London with Smart Card Fare Payment Data. Transportation Research Record:
Journal of the Transportation Research Board , 55–62.
Shi, Q., & Abdel-Aty, M. (2015). Big Data applications in real-time traffic operation and safety.
Transportation Research Part C, 380-384.
Stopher. (1992). Use of activity based diaries to collect travel data. Transportation 19, 159-176.
Trépanier, M., Tranchant, N., & Chapleau, R. (2007). Individual Trip Destination Estimation in a
Transit Smart Card Automated Fare Collection System. Journal of Intelligent
Transportation Systems.
Utsunomiya, M., Attanucci, J., & Wilson, N. H. (2006). Potential Uses of Transit Smart Card
Registration and Transaction Data to Improve Transit Planning. Transportation Research
Record: Journal of the Transportation Research Board, 119-126.
Wang, W., Attanucci, J. P., & Wilson., N. (2011). Bus Passenger Origin–Destination Estimation and
Related Analyses Using Automated Data Collection Systems. Journal of Public
Transportation, 131–150.
Wong, A. (2012, Julio). Automating bus stop dwell time measurements for London Buses using
iBus. Tesis Doctoral. South Hampton, Inglaterra.
Zhao, J., Rahbee, A., & Wilson, N. (2007). Estimating a rail passenger trip origin–destination matrix
using automatic data collection systems. Computer-Aided Civil and Infrastructure
Engineering, 376-387.