MODELACIÓN DEL RIESGO DE INUNDACIÓN EN...
Transcript of MODELACIÓN DEL RIESGO DE INUNDACIÓN EN...
MODELACIÓN DEL RIESGO DE
INUNDACIÓN EN BOGOTÁ D.C. EN EL
PERIODO DEL 2007 - 2016.
JUAN CAMILO QUINTERO QUIROGA
PROYECTO DE GRADO PARA OPTAR AL TÍTULO DE
INGENIERO CATASTRAL Y GEODESTA
DIRECTOR:
PhD. CARLOS EDUARDO MELO MARTÍNEZ
UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS
FACULTAD DE INGENIERÍA
BOGOTÁ D.C. COLOMBIA
2018
Universidad Distrital Francisco José de
Caldas
FACULTAD DE INGENIERÍA
INGENIERÍA CATASTRAL Y GEODESIA
Proyecto de Grado
MODELACIÓN DEL RIESGO DE INUNDACIÓN EN
BOGOTÁ D.C. EN EL PERIODO DEL 2007 - 2016.
DIRECTOR:
PhD. Carlos Eduardo Melo Martínez
PRESENTADO POR:
Juan Camilo Quintero Quiroga 20131025073
Bogotá D.C., 2018
III
Dedicatoria
A Dios, quien inspiro mi espíritu a la realización de este estudio, por
darme salud y bendición para alcanzar mis metas como persona y futuro
profesional. “Porque eres el principio y el fin, escrito esta” –
Apocalipsis 22:13; “Lampara es a mis pies tu palabra, y lumbrera a mi
camino” – Salmos 119:105 y “eres el único que estará con nosotros
todos los días, hasta el fin del mundo” – Mateo 28:20.
A mi madre María Quiroga, por su valentía, fortaleza, apoyo e
inagotable amor, por siempre escucharme y alentarme en todas las
circunstancias, su incondicional compañía en cada etapa de mi vida, su
voz de aliento.
A mi padre Javier Quintero por su apoyo económico y sus consejos de
vida.
A mi hermano Carlos Quintero quien ofreció su apoyo incondicional,
comprensión y ayuda; siendo más que un hermano mi mejor amigo.
A mis amigos, por acompañarme en esta etapa de formación académica
tan trascendental, por apoyarme a continuar en este proceso, ser otra
voz de aliento; especialmente a la familia FIT360 quienes además de
enseñarme el amor hacia el deporte y a nunca desfallecer, me han
apegado a Dios, siendo él, el único que todo lo ve.
IV
Agradecimientos
En primera instancia quiero agradecerle al director de este trabajo, Carlos Eduardo Melo Martínez,
por su amplia y oportuna orientación en los tópicos desarrollados en este proyecto de grado,
agradecido por tener un profesor que se preocupó y estuvo pendiente del trabajo, respondiendo a
las preguntas e inquietudes tanto en el transcurso de este como en las materias enseñadas.
Expresar mi gratitud con el Instituto Distrital de Gestión del Riesgo y Cambio Climático por
permitirme adquirir y procesar la información, quien sin su pronta respuesta y diligencia no hubiera
sido posible la realización de esta investigación. De la misma manera, al alma mater de mi
educación superior, la Universidad Distrital Francisco José de Caldas y mi proyecto curricular
Ingeniería Catastral y Geodesia por guiarme académica, profesional y éticamente el camino a
seguir.
V
Índice general
Capítulo I ................................................................................................................................................... 11
Presentación ............................................................................................................................................... 11
1.1. Introducción ............................................................................................................................... 11
1.2. Planteamiento del problema ..................................................................................................... 12
1.3. Justificación ............................................................................................................................... 13
1.4. Objetivos .................................................................................................................................... 14
1.4.1. Objetivo general ................................................................................................................ 14
1.4.2. Objetivos específicos .......................................................................................................... 14
1.5. Antecedentes .............................................................................................................................. 14
Capítulo II .................................................................................................................................................. 16
Marco Teórico ........................................................................................................................................... 16
2.1. Inundación ................................................................................................................................. 16
2.2. Econometría Espacial ................................................................................................................ 18
2.3. Autocorrelación Espacial .......................................................................................................... 18
2.4. Heterogeneidad Espacial .......................................................................................................... 19
2.5. Análisis exploratorio de Datos Espaciales (AEDE) ................................................................ 19
2.6. Matriz de Contigüidad (Pesos espaciales w) ........................................................................... 20
2.7. Criterios de Contigüidad .......................................................................................................... 20
2.8. Análisis de autocorrelación espacial ........................................................................................ 21
2.8.1. Contraste Global ................................................................................................................ 21
2.8.2. Contraste Local .................................................................................................................. 23
2.9. Evaluación Multicriterio – Método de Jerarquía Analítica (AHP por sus siglas en ingles) 24
2.10. Covariograma y Correlograma. ........................................................................................... 26
2.11. Análisis confirmatorio de datos espaciales. ......................................................................... 26
2.11.1. Modelo de Regresión Espacial .............................................................................................. 27
2.12. Regresión geográficamente ponderada (GWR por sus siglas en ingles) .......................... 30
Capítulo III ................................................................................................................................................ 31
Fuentes de Información ............................................................................................................................ 31
3.1. Softwares Utilizados ....................................................................................................................... 31
Capítulo IV ................................................................................................................................................. 33
Metodología ................................................................................................................................................ 33
4.1. Área de Estudio ......................................................................................................................... 33
4.2. Estructuración Base de Datos y especialización de los datos. ................................................ 34
VI
4.3. Análisis Exploratorio de Datos Espaciales .............................................................................. 44
4.3.1. Análisis estadístico descriptivo ............................................................................................. 44
4.3.2. Matriz de pesos espaciales .................................................................................................... 45
4.3.3. Análisis Global y Local ......................................................................................................... 46
4.4. Análisis Confirmatorio .............................................................................................................. 46
4.4.1. Construcción Modelo Autorregresivo Espacial .................................................................. 47
4.4.2. Selección Modelo Autorregresivo Espacial ......................................................................... 47
4.4.3. Validación del Modelo Autorregresivo Espacial ................................................................ 48
4.5. Interpretación del Modelo ........................................................................................................ 48
4.6. Cálculo de Impactos .................................................................................................................. 48
Capítulo V .................................................................................................................................................. 49
Resultados y Análisis ................................................................................................................................. 49
5.1. Análisis Exploratorio de Datos Espaciales .............................................................................. 49
5.1.1. Selección de Matriz de Pesos Espaciales ............................................................................. 54
5.1.2. Análisis Exploratorio Global ................................................................................................ 58
5.1.3. Análisis Exploratorio Local .................................................................................................. 62
5.1.4. Análisis Bivariado .................................................................................................................. 66
5.2. Análisis Confirmatorio de los Datos ........................................................................................ 68
5.2.1. Modelo Regresivo Clásico ..................................................................................................... 68
5.2.2. Modelo Regresivo Espacial ................................................................................................... 77
5.3. Impactos ..................................................................................................................................... 86
5.4. Regresión Geográficamente Ponderada .................................................................................. 89
5.5. Discusión y Contextualización del Modelo .............................................................................. 99
Capítulo VI ............................................................................................................................................... 102
Conclusiones y Recomendaciones .......................................................................................................... 102
A. Anexo: Correlogramas bivariados ................................................................................................. 104
Bibliografía .............................................................................................................................................. 108
VII
Lista de Figuras
Autocorrelación espacial. ............................................................................................................................ 19
Matriz de contigüidad de torre de orden 1 (B1), orden 2 (B2) .................................................................... 20
Matriz de contigüidad de alfil de orden 1 (B1), orden 2 (B2) ..................................................................... 21
Matriz de contigüidad de Reina de orden 1 (B1), orden 2 (B2). ................................................................. 21
Tratamiento de la autocorrelación espacial - primera tipología de modelos ............................................... 28
Ubicación Espacial de la región de estudio. ................................................................................................ 34
Distribución espacial del NivRiesgo en las localidades de Bogotá: 2007 - 2011 ...................................... 50
Distribución espacial del NivRiesgo en las localidades de Bogotá: 2014 - 2016 ...................................... 51
Histograma, Grafico Q-Q y Boxplot del NivRiesgo 2007 .......................................................................... 52
Histograma, Grafico Q-Q y Boxplot del NivRiesgo 2011 .......................................................................... 52
Histograma, Grafico Q-Q y Boxplot del NivRiesgo 2014 .......................................................................... 53
Histograma, Grafico Q-Q y Boxplot del NivRiesgo 2016 .......................................................................... 53
Gráficos, criterios seleccionados por año .................................................................................................... 56
Correlogramas de la variable respuesta. ...................................................................................................... 57
Análisis de autocorrelación espacial de la variable respuesta. .................................................................... 58
Mapa Clúster espacial LISA ........................................................................................................................ 62
Mapa Significancia LISA ............................................................................................................................ 63
Mapa Cluster Local (Getis) ......................................................................................................................... 64
Mapa Significancia Local (Getis) ................................................................................................................ 65
Mapa Análisis de autocorrelación en los Residuos. .................................................................................... 77
Distribución espacial del R-Cuadrado en Bogotá D.C., GWR - 2007. ....................................................... 91
Distribución espacial del coeficiente locales y P-Valores de las variables PPH y PRECP, modelo GWR -
2007. ............................................................................................................................................................ 91
Distribución espacial del R-Cuadrado en Bogotá D.C., GWR – 2011 ........................................................ 92
Distribución espacial del coeficiente locales y P-Valores de las variables PO_DET y PO_NDGN, modelo
GWR – 2011. ............................................................................................................................................... 93
Distribución espacial del coeficiente locales y P-Valores de la variable PRECP, modelo GWR – 2011. .. 94
Distribución espacial del R-Cuadrado en Bogotá D.C., GWR – 2014 ........................................................ 95
Distribución espacial del coeficiente locales y P-Valores de las variables AL_PH y PO_NDAL, modelo
GWR – 2014. ............................................................................................................................................... 95
Distribución espacial del coeficiente locales y P-Valores de las variables PO_NDGN y PO_NDRB,
modelo GWR – 2014. .................................................................................................................................. 96
Distribución espacial del coeficiente locales P-Valores de las variables PPH y TEMP, modelo GWR –
2014. ............................................................................................................................................................ 96
Distribución espacial del coeficiente locales y P-Valores de la variable PRECP, modelo GWR – 2014. .. 97
Distribución espacial del R-Cuadrado en Bogotá D.C., GWR – 2016 ........................................................ 98
Distribución espacial del coeficiente locales P-Valores de las variables PO_DET y PO_NDGN, modelo
GWR – 2016. ............................................................................................................................................... 98
Distribución espacial del coeficiente locales P-Valores de las variables PPH y TEMP, modelo GWR –
2016. ............................................................................................................................................................ 99
Moran Bivariado 2007............................................................................................................................... 104
Moran Bivariado 2011............................................................................................................................... 105
Moran Bivariado 2014............................................................................................................................... 106
Moran Bivariado 2016............................................................................................................................... 107
VIII
Lista de Tablas
Contrastes Globales análisis autocorrelación espacial ................................................................................ 23
Escala de 9 puntos para comparaciones apareadas. ..................................................................................... 25
Índices aleatorios de consistencia. ............................................................................................................... 26
Selección de la Variable respuesta. ............................................................................................................. 35
Matriz reciproca de comparaciones apareadas de eventos de inundación .................................................. 36
Multiplicación matricial entre la matriz A y el eigenvector W. .................................................................. 36
Datos para hallar NivRiesgo 2007-2011 ..................................................................................................... 37
Datos para hallar NivRiesgo 2014-2016 ..................................................................................................... 38
Variables explicativas seleccionadas para el estudio. ................................................................................. 39
Resumen de medidas estadísticas de la variable de estudio para cada año ................................................. 54
Criterios de Selección de matriz W 2007-2011 ........................................................................................... 55
Criterios de Selección de matriz W 2014-2016 ........................................................................................... 56
Contrastes globales de variabilidad respuestas y explicativo año 2007 ...................................................... 59
Contrastes globales de variabilidad respuestas y explicativo año 2011 ...................................................... 60
Contrastes globales de variabilidad respuestas y explicativo año 2014 ...................................................... 61
Contrastes globales de variabilidad respuestas y explicativo año 2016 ...................................................... 61
Moran Bivariado 2007 – 2011 ..................................................................................................................... 66
Moran Bivariado 2014 – 2016 ..................................................................................................................... 67
Estimación modelo de regresión Clásico (Año 2007) ................................................................................. 69
Supuestos modelo regresión clásico (Año 2007) ........................................................................................ 70
Supuestos VIF de Multicolinealidad (Año 2007) ........................................................................................ 71
Estimación modelo de regresión Clásico (Año 2011) ................................................................................. 71
Supuestos modelo regresión clásico (Año 2011) ........................................................................................ 72
Supuestos VIF de Multicolinealidad (Año 2011) ........................................................................................ 72
Estimación modelo de regresión Clásico (Año 2014) ................................................................................. 73
Supuestos modelo regresión clásico (Año 2014) ........................................................................................ 74
Supuestos VIF de Multicolinealidad (Año 2014) ........................................................................................ 74
Estimación modelo de regresión Clásico (Año 2016) ................................................................................. 75
Supuestos modelo regresión clásico (Año 2016) ........................................................................................ 75
Supuestos VIF de Multicolinealidad (Año 2014) ........................................................................................ 76
Test Global de Moran para los residuos de las regresiones. ........................................................................ 78
Diagnóstico inicial de dependencia espacial: Multiplicadores de Lagrange. .............................................. 79
Comparación Modelos Espaciales. Criterio Akaike (AIC) ......................................................................... 79
Comparación Modelos Espaciales. Criterio Bayesiano (BIC) .................................................................... 80
Estimación modelo de regresión espacial para el año 2007 (GNS) ............................................................ 81
Estimación modelo de regresión espacial para el año 2011 (GNS) ............................................................ 83
Estimación modelo de regresión espacial para el año 2014 (SDM) ............................................................ 84
Estimación modelo de regresión espacial para el año 2016 (GNS) ............................................................ 85
Impactos - 2007 ........................................................................................................................................... 87
Impactos - 2011 ........................................................................................................................................... 88
Impactos - 2014 ........................................................................................................................................... 88
Impactos - 2016 ........................................................................................................................................... 89
Estimación regresión geográficamente ponderada (GWR) - 2007 .............................................................. 90
Estimación regresión geográficamente ponderada (GWR) - 2011 .............................................................. 92
Estimación regresión geográficamente ponderada (GWR) - 2014 .............................................................. 94
IX
Estimación regresión geográficamente ponderada (GWR) - 2016 .............................................................. 97
11
Capítulo I
Presentación
El objetivo de este capítulo es servir de introducción a esta tesis. Durante su desarrollo se expondrá
el contexto, planteamiento del problema, alcance, objetivos, justificación y la estructura de la
presente investigación. Inicialmente se formulará una problemática que será la base del presente
trabajo investigativo, se presentarán las razones del por qué se desarrollará esta investigación y se
justificará el planteamiento de este. En lo referente a los objetivos, se especificarán aquellos de
carácter general, y que se pretende alcanzar a lo largo de la tesis; finalmente, se presentaran los
antecedentes cuyo objetivo es situar al lector en un pasado que vinculara la problemática con las
soluciones planteadas hasta el momento.
1.1. Introducción
Un desastre natural hace referencia a las enormes pérdidas materiales, naturales y de vidas humanas
ocasionadas por eventos o fenómenos naturales; tal es su magnitud, que afectan gravemente las
estructuras básicas y el funcionamiento normal de una sociedad, comunidad o territorio causados
por la naturaleza o los procesos naturales de la tierra (Espinosa Bordón, 2008), estos generan
efectos de gran impacto como lo son las reacciones sociales, enfermedades transmisibles,
desplazamientos de la población, exposición a la intemperie, entre otros (OMS & OPS, 2000), de
acuerdo con la United Nations Office for Disaster Risk Reduction - UNISDR, los desastres no son
naturales, sino que son el resultado de las omisiones y la falta de prevención y planificación ante
los fenómenos de la naturaleza. Los efectos de un desastre pueden amplificarse debido a una mala
planificación de los asentamientos humanos, falta de medidas de seguridad, planes de emergencia
y sistemas de alerta temprana (Bradley et al., 2015).
En la actualidad hay herramientas que permiten amortiguar los posibles efectos que tienen los
desastres naturales en nuestra sociedad, además los avances tecnológicos e investigativos de esta
índole, el continuo monitoreo de esto nos ayuda a visualizar la magnitud de los desastres alrededor
del mundo como por ejemplo el Global Active Archive of Large Flood Events, de la universidad
de Colorado (Flood observatory, 1990) donde se puede observar un histórico de grandes desastres
de esta índole alrededor del mundo y los efectos que estos han tenido. Se sabe por estadísticas
internacionales como la base de datos EM-DAT, que a nivel mundial las inundaciones se
encuentran en el primer lugar entre los 10 mayores desastres en un periodo estudiado de 22 años
(1990-2012) por el número de personas afectadas y las pérdidas económicas tan elevadas. Para
Colombia, hasta el año 2012 ocupó el décimo y octavo lugar a nivel mundial por el número de
muertos y daños respectivamente generados por desastres hidrometeorológicos (Guha-sapir,
Hoyois, & Below, 2011).
Por consiguiente, evaluar el riesgo que posee la población frente a las inundaciones y sus efectos
es fundamental para realizar programas y planes que busquen soluciones a las poblaciones con
mayor afectación de este tipo. Así mismo, al identificar las consecuencias con respecto a los
12
factores de riesgo posibilita la intervención en el territorio y mejora la toma de decisiones. Para el
caso de estudio Bogotá D.C, se propone analizar por medio de análisis de área el riesgo que ha
tenido la población en este tipo de desastre natural. Se desarrollará un modelo de autorregresión
espacial que modele la variabilidad de los datos y que identifique los principales factores que
determinan esta problemática en las diferentes localidades del territorio objeto de estudio.
Se realizará un estudio retrospectivo del riesgo por inundación en 19 de las 20 localidades de
Bogotá, en el intervalo de tiempo de 2007 – 2016; identificando la dependencia espacial entre los
datos. Los modelos de regresión espacial se estimarán usando una serie de variables predictoras
(que deben llegar a explicar el fenómeno) de índole Social, Ambiental y Económicos con el fin de
esperar que los resultados ilustren las variables y sus relaciones espaciales con las demás;
observando el grado de incidencia positiva o negativa en este riesgo y cómo estas pueden ayudar a
identificar las necesidades de la población afectada con el fin de desarrollar acciones y planes
beneficiosos para la comunidad teniendo en cuenta estos factores.
1.2. Planteamiento del problema
En Bogotá, el crecimiento urbano ha aumentado desde 1938 con una población de 325.650
habitantes hasta el 2014 de 7.776.845 habitantes esto quiere decir que ha aumentado en más del
100% en los últimos 76 años, Bogotá cuenta con un área total de 1.605 km^2 de los cuales 307
km^2 corresponden al área urbana, constituida por 20 localidades y 2.361.293 predios; En los
últimos estudios el 33% del área total de la ciudad presenta amenaza por inundación o remoción
en masa, de los cuales 1.394.760 habitantes de Bogotá viven en zonas inundables y 297.979 en
amenaza alta por inundación, esto conlleva a que hayan 28.299 predios en estas zonas, que son el
14% (Pava, 2015). Para esto es indispensable el desarrollo de nuevas metodologías que permitan
identificar los determinantes que llevan a que el riesgo por inundación aumente en la capital, resulta
necesario en lo que concierne posibilitar a las entidades que vigilan estas problemáticas y riesgos
naturales a información sobre los factores inmersos en el riesgo por inundación en el distrito capital
colombiano en un periodo del 2007 al 2016 (nueve años) con el fin de adoptar estrategias y/o planes
de gobierno que deriven acciones favorables para mitigar el riesgo además de preverlo en cuanto
el crecimiento constante que posee esta.
Un ejemplo clave de estos sucesos han sido las múltiples inundaciones que se han observado dentro
de la ciudad, se sabe que en la localidad de Bosa se presentan varias amenazas tecnológicas de
origen sísmico e inundaciones, en cuanto a las áreas de amenaza por inundación están relacionadas
con el humedal Tibanica, del cual el 5% de la localidad presenta amenaza alta y el 40% amenaza
media, estas amenazas son causadas principalmente por el rio Bogotá y Tunjuelo (Valenzuela &
Silva, 2005), también se resalta el gran problema alrededor del río Tunjuelito que ha generado
históricamente problemas por desbordamiento desde el año 1959, generando grandes impactos
sobre la población en localidades como Tunjuelito, Usme, Ciudad Bolívar entre otras y en múltiples
barrios ubicados alrededor de este (Arturo & Villalba, 2007).
Debido a la constante amenaza que se ha generado en algunos sectores de la ciudad, se plantea usar
la técnica de la estadística espacial análisis de datos de área, que es empleada para el análisis
regresivo en datos agregados (Cressie, 1994), y ampliamente desarrollado en distintos estudios de
diferentes índoles como la modelación de riesgos y los análisis espaciales de estos dado que este
13
método permite resumir e identificar los determinantes de algunos riesgos naturales distribuidos
directamente a través del espacio (Flooding, 2013), siendo así más fácil su manipulación y por lo
tanto la obtención de conclusiones prosiguiendo con una buena toma de decisiones (Anselin, 1998).
También por la naturaleza y el tipo de datos a manejar en esta investigación, hace que la técnica a
usar sea ideal pues los resultados permitirán la formulación y el mejoramiento de los planes y las
políticas existentes hasta el momento.
1.3. Justificación
En Colombia los desastres naturales y sus impactos ocurren cada vez con mayor frecuencia, se sabe
que entre el 2006 y el 2014 el 26% de la población total colombiana ha sido afectada por alguno
de dichos desastres, del cual la cuarta parte de esta: 12.298.849, han resultado damnificados y que
en resumidas de esta cifra solo el 19% de la población calculada aproximadamente en 9.390.554,
son el total de personas afectadas por inundaciones (DNP, 2015), esto gracias a una mala
planeación del territorio en donde se ubican viviendas en zonas con alto porcentaje a ser afectadas
por algún tipo de desastre natural, este riesgo amenaza continuamente las vidas, la sociedad, la
economía y varios aspectos que hacen que la calidad de vida disminuya notablemente.
En cuanto a los incidentes ocurridos en Bogotá se registraron desde el 2002 hasta el 2014 10.501
eventos de los cuales el 50.4% corresponde a inundaciones (SIRE-IDIGER, 2014), se ha estudiado
y varias de las causas de dichos eventos son: las lluvias fuertes y de gran duración, que a su vez
genera que los volúmenes de agua que fluyen por los ríos, quebradas y humedales aumenten sin
tener la capacidad suficiente para poder recolectarla y transportarla, la mala disposición en los
cauces de residuos sólidos y escombros hace que las corrientes y salidas de estos líquidos no sea
eficiente generando una acumulación en zonas no aptas para la circulación y acumulación de este,
La destrucción y el deterioro de los Jarillones que se construyen a la largo de los ríos como una
solución a corto plazo y las lluvias en áreas con pendientes considerables que con llevan a otro
riesgo mayor que no trataremos (SIRE-IDIGER, 2014).
Esto nos ha evidenciado que los riesgos por desastres naturales como las inundaciones afectan a
muchas personas a lo largo de los años dependiendo el lugar y sus características físicas; es por eso
que se deben proponer soluciones inteligentes e innovadoras que puedan tener un efecto notable a
lo largo del tiempo y en la sociedad, esto se puede lograr en conjunto con el gobierno, la comunidad,
las empresas y organizaciones además de los avances tecnológicos que a nivel mundial son de
gran ayuda para mejorar la calidad de vida y prevenir desastres como estos.
Por lo anterior y dándonos cuenta de la magnitud de estos desastres el presente trabajo pretende
encontrar una medida que represente el riesgo y sus cambios a través del tiempo, para identificar
las zonas de mayor riesgo, con el fin de prevenir desastres naturales por inundación en zonas
afectadas continuamente, mediante la implementación de estadística espacial, sistemas de
información geográfica y una adecuada gestión del riesgo que mediante los datos y variables
relevantes a esta problemática como la precipitación, calidad de vida, nivel del agua entre otros
(CENAPRED, 2001), nos lleve a lograr cumplir con los objetivos.
14
1.4. Objetivos
1.4.1. Objetivo general
Modelar el riesgo de inundación en Bogotá D.C. en un periodo del 2007 hasta el 2016.
1.4.2. Objetivos específicos
➢ Identificar las posibles variables exógenas y su relación frente a la problemática de estudio,
para así realizar un análisis de comportamiento espacial de estas.
➢ Analizar y modelar los datos para observar y determinar la auto correlación espacial
existente.
➢ Realizar las pruebas y análisis estadísticos comparativos de los modelos econométricos
espaciales posibles para el caso de estudio.
➢ Determinar los factores que contribuyen a la ocurrencia de estos eventos para poder ejercer
un mayor control a esta problemática.
➢ Ilustrar el comportamiento de este fenómeno a través del tiempo en la zona de estudio.
➢ Reconocer las zonas ubicadas en Bogotá que estén en un índice alto de riesgo por
inundación.
1.5. Antecedentes
El crecimiento de la población y de los bienes localizados en áreas expuestas a fenómenos
hidrometeorológicos son factores determinantes en el aumento del riesgo (Banco Mundial, 2012),
en la actualidad la susceptibilidad a inundaciones, deslizamientos y otros fenómenos han crecido
constantemente debido a la intervención humana sobre el territorio y al consecuente deterioro
ambiental. Los múltiples intentos y esfuerzos enfocados a fortalecer los procesos de planificación
ambiental y sociales han creado una cadena de sucesos que aumentan el riesgo ya que conllevan a
afectaciones ambientales tales como la desecación de humedales y ciénagas, la pérdida de bosques
y coberturas vegetales (Cabrera et al., 2011), afectando de manera importante las fuentes de agua
y la estabilidad del terreno, lo que lo hace susceptible a deslizamientos e, inundaciones en zonas
en las que antes no se observaban dichos problemas.
Si bien el riesgo es la suma de múltiples factores que dependiendo el estudio y su enfoque generan
variabilidad en ello, para el caso de estudio por riesgo de inundación se sabe que los factores más
relevantes, que posteriormente están explicados, son vulnerabilidad, costo de los bienes expuestos
y Peligro (Reyes Olvera & Gutiérrez González, 2016), que asociado a estos hay múltiples variables
que pueden explicar el fenómeno a modelar; el conocimiento de la variación y distribución a través
del espacio de este riesgo ha aumentado significativamente el entendimiento del desarrollo y
factores de la misma, aunque haya múltiples estudios de estos casos.
Para la mitigación de esta problemática se han propuesto también múltiples soluciones,
actualmente en Colombia y en Bogotá se encuentran grandes sistemas de alarmas como lo es el
15
Sistema Nacional de Información para la Gestión del Riesgo de Desastres - NGRD (“Sist. Nac.
Inf. para la Gestión del Riesgo Desastr.,” n.d.), el Sistema de Alerta Temprana para el Valle de
Aburrá - SIATA y el Sistema de Información para la Gestión del Riesgo y cambio climático - SIRE
(IDIGER, n.d.) de Bogotá que ofrecen páginas web con acceso a información de gran ayuda para
estar monitoreando indicios de posibles desastres naturales por inundación en tiempo real, además
de la página del Instituto de Hidrología, Meteorología y Estudios Ambientales - IDEAM, aunque
se resalta que actualmente ninguno de estos sistemas ofrece información de libre acceso de los
datos sobre las alertas anticipadas, el número de eventos predichos, el tiempo de respuesta de la
comunidad ante una emergencia o la confiabilidad de los pronósticos y de los datos que se emiten.
16
Capítulo II
Marco Teórico
En este capítulo se describirán los conceptos a desarrollar y emplear en el presente trabajo; los
temas relacionados a la problemática, los métodos estadísticos, estadísticos espaciales y métodos
adicionales que contribuirán a logar los objetivos planteados, estos seguirán una estructura y orden
respecto a su aplicación en esta, con el fin de que el lector comprenda la base teórica que se
empleara en este proyecto.
2.1. Inundación
Se sabe que las inundaciones son una amenaza constante y constituyen un fenómeno que se
desencadena de forma rápida y repentina a nivel global, representa una amenaza frecuente y de
mayor gravedad a nivel mundial siendo así la causante de miles de muertes y millones de dólares
en pérdidas económicas por daños (Chandrasekar & Cifelli, 2012), adicional un área se considera
más vulnerable cuando esta experimenta mayores pérdidas (Thieken & Merz, 2006), en la
actualidad se han desarrollado grandes avances y diversas investigaciones para evaluar estos
eventos y la forma de evaluar el riesgo que este conlleva, siendo el estudio de las inundaciones
complejo, ya que son muchas las variables que se ven afectadas por estos eventos como el daño
económico directo a los bienes inmuebles que no solamente depende de la profundidad del agua
sino también la destinación económica de estos, agregándoles características del inmueble,
variables socioeconómicas, calidad de la respuesta de emergencia, entre otras (Smith, 1994).
Existen diferentes formas de examinar las inundaciones, una de ellas es siendo analizadas como un
desastre natural en el que se deben identificar los peligros y la vulnerabilidad para poder superarlos
(Hunt, 2002), mientras que el UNISDR lo maneja como una falta de planificación de los
asentamientos urbanos lo que conlleva a unas condiciones de vulnerabilidad y exposición haciendo
importante mencionar que los efectos de estas en la sociedad no pueden ser representados con cifras
(monetario) por su complejidad. Por otra parte, hay estudios y discusiones sobre el análisis de
frecuencias de inundaciones utilizando diferentes métodos para incorporar datos históricos por
medio de estudios de los históricos de inundaciones (Bayliss & Reed, 2001), además de la
incorporación de información meteorológica que fortalecería la estimación del riesgo, siendo la
lluvia un indicador fiable de inundaciones (Collier, 2007).
Sin embargo, cuando se presenta un daño de cualquier magnitud, hay una interacción entre
amenaza o peligro (A) y la vulnerabilidad (V) lo que nos conduce a la configuración del riesgo
(Armadas & Herrera, 2015), de igual forma no habría ningún riesgo si no existe una de las dos
interacciones, es decir si no hay amenaza no habría vulnerabilidad y viceversa por eso es
indispensable que los dos factores interaccionen entre sí; aunque varios estudios para el cálculo de
riesgo por algún fenómeno natural (Ordaz & Yamín, 2004) incluyen un tercer factor siendo este el
costo (C) o valor de los bienes expuestos, con esto se puede concluir que el riesgo es un producto
de 3 factores:
17
Riesgo = A x V x C (1)
Cabe aclarar que estadísticamente es difícil modelar la representación del riesgo y su cambio a
través del tiempo debido a la gran cantidad de variables que deberían intervenir en los modelos,
para eso es posible introducir números índices, siendo estos una medida estadística que permite
comparar una magnitud simple o compleja en dos situaciones diferentes respecto al tiempo o al
espacio tomando una de ellas como referente (Fernández, 2009), por eso han llegado a ser
importantes siendo estos posibles indicadores de los diferentes cambios que rodean la sociedad.
• Vulnerabilidad
La vulnerabilidad no es general, esta debe entenderse en función de cada tipo de amenaza, de igual
forma esta se podría definir como “la susceptibilidad o la predisposición intrínseca de un elemento
de ser afectado gravemente” (Armadas & Herrera, 2015), que para su posible análisis se consideran
2 variables que se pueden ajustar a este término; por un lado, los servicios con los que cuenta la
comunidad (Energía, Acueducto, Alcantarillado y Recolección de basura, adicionalmente se podría
considerar el servicio de gas natural) y , por el otro, los principales fuentes hídricas (ríos y lagunas),
ya que entre todo, los hogares son totalmente vulnerables a una situación como esta, cuando estas
no tienen los servicios públicos básicos obligatorios para poder subsistir y en el caso de estudio los
grandes riesgos vendrían de la mano con los afluentes hídricos localizados en estas zonas.
• Costos
Cuando se habla de la variable costo, hace referencia a los costos de los bienes expuestos ya que
este mide la cuantía de lo que es susceptible de afectarse durante la ocurrencia de un fenómeno
perturbador (CENAPRED, 2001), entonces se consideran los bienes con los que cuenta la
población en la mayoría de los casos ( lavadora, nevera, equipo de sonido, televisor, computador,
motocicleta y carro) y el número de habitantes por localidad, esto se toma ya que se cuenta con el
supuesto de que “a mayor población, mayor riqueza”, esto quiere decir que las zonas donde haya
una mayor densidad poblacional se podría suponer que habrá un mayor número de bienes básicos
en los hogares.
• Peligro
Se define como la probabilidad de ocurrencia excesiva en situaciones potencialmente dañinas en
un área determinada y dentro de un periodo de tiempo específico (Thieken & Merz, 2006), se
identificó que para el análisis de este componente se utilizara todo lo relacionado al entorno de las
inundaciones, para esto con el fin de calcular un valor para el peligro tomando a la lluvia
(precipitación) como el influenciador fundamental del evento, adicional a este la temperatura
registrada.
18
2.2. Econometría Espacial
En el estudio de cualquier fenómeno la ubicación geográfica de los agentes constituye un aspecto
importante ya que estos pueden tener repercusiones sobre sus vecinos directos o incluso sobre
otros, siendo estos no tan remotos; actualmente su especialización juega un papel importante dentro
de las especificaciones de los modelos econométricos, ya que podría existir algún efecto espacial
que deba incluirse al modelo para una validez más allegada a la realidad (Bohórquez & Ceballos,
2008). Ante esta realidad y gracias a los avances tecnológicos se ve la necesidad de contar con
herramientas para el procesamiento, descripción y análisis de la información ya que los métodos
tradicionales de la estadística descriptiva no tienen en cuenta la localización geográfica de los
datos.
La econometría espacial se puede definir como la parte de la econometría que se dedica al estudio
de los fenómenos económicos espaciales, que aunque todas las actividades económicas se
desarrollan en un espacio determinado, los fenómenos económicos espaciales pueden definirse
como aquellos en los que la variable espacio, juega un rol tan importante que su exclusión podría
dar lugar a modelos econométricos con errores de especificaciones severos (Baronio, Vianco, &
Rabanal, 2012), adicional se conoce como una colección de técnicas que se ocupan de las
peculiaridades causadas espacialmente en el análisis estadístico de los modelos científicos
regionales (Anselin, 2001), esto nos asegura que los fenómenos económicos como sociales puedan
llegar a ser modelados obteniendo resultados muy cercanos a la realidad, por medio de modelos
que cumplan con los supuestos, adicional a la variable geográfica que juega un papel importante
para llegar a resultados aceptables en esta labor.
2.3. Autocorrelación Espacial
La autocorrelación espacial puede interpretarse como un índice descriptivo, que mide aspectos de
la distribución espacial de los objetos – fenómenos, pero al mismo tiempo se puede ver como un
proceso causal que mide el grado de influencia que ejerce algo sobre sus vecinos (Goodchild,
1987), en donde esta refleja el grado en que objetos o actividades en una unidad geográfica son
similares a otros en unidades geográficas próximas. Lo que implica en la existencia de una relación
funcional entre la ocurrencia de un evento en una región determinada con la ocurrencia de eventos
del mismo fenómeno en otra región contigua.
Dicha autocorrelación espacial puede ser positiva, lo que nos indica una concentración de los
valores similares en las diferentes regiones de estudio (Valores altos rodeados de altos y en sentido
contrario) a manera de ejemplo acoplado a nuestro ámbito, se podría decir que al valor de las
propiedades inmuebles en la ciudad, siendo este dependiente de diferentes factores como la
ubicación, la disponibilidad de servicios, el comercio entre otros, de esta forma un inmueble
tenderá a tener un valor más o menos similar al inmueble colindante (siempre que tengan
características similares o no muchas que los diferencie) mientras que los valores de los inmuebles
en la parte rural por medio al valor de las tierras en donde David Ricardo construyó el concepto de
renta se ajustaría a este.
Mientras que sí la autocorrelación espacial llegara a ser negativa nos indicaría que hay una
concentración de valores diferentes o disimilares en el espacio (valores altos rodeados de bajos y
19
viceversa) siendo como ejemplo claro la representación de un tablero de ajedrez; Chasco Yrigoyen
afirma que la dependencia espacial está determinada por una noción de espacio relativo o de
localización relativa, que realza el efecto de la distancia (Yrigoyen, 2003).
Figura 1: Autocorrelación espacial.
Autocorrelación Positiva
Autocorrelación Negativa Fuente: Elaboración propia
2.4. Heterogeneidad Espacial
Se define como la ausencia de estabilidad en el espacio implicando que los fenómenos espaciales
y sus variables asociadas varían con la localización geográfica no siendo homogéneos para toda la
matriz de datos (Yrigoyen, 2003), siendo las unidades espaciales en observación distantes a ser
homogéneas además de la falta de uniformidad de los efectos del espacio, en donde, este problema
podría en gran parte ser resuelto mediante procedimientos de la econometría estándar
2.5. Análisis exploratorio de Datos Espaciales (AEDE)
Se puede definir como el conjunto de técnicas o herramientas estadístico-gráficas que describen y
visualizan las distribuciones espaciales de uno o más fenómenos, en donde, se identifican
localizaciones atípicas o “atípicas espaciales”, descubren esquemas de asociación espacial
(autocorrelación o dependencia espacial), que a su vez, pueden ser de carácter global o local,
agrupamientos (clusters) o puntos calientes (hot spots) que en definitiva sugieren estructuras en el
espacio geográfico (heterogeneidad espacial) (Anselin, 1996), por lo tanto el AEDE posee un
carácter tanto descriptivo (estadístico) más que confirmatorio (econométrico) (Yrigoyen, 2003).
Este tipo de análisis se puede aplicar de una manera univariante, sobre uno o varios indicadores
geográficos, o multivariante, como una etapa propia del proceso econométrico espacial, previo al
análisis confirmatorio (el cual comprende la estimación y contrastes) como a todo ejercicio de
predicción espacial, utilizándose para identificar relaciones sistemáticas entre variables, o dentro
de una misma variable, cuando no existe un conocimiento claro sobre su distribución en el espacio
geográfico.
20
2.6. Matriz de Contigüidad (Pesos espaciales w)
Esta matriz se denomina como W en donde cada una de las filas (i) como las columnas (j)
representan una región en el espacio de objeto de estudio, representando así la relación que tiene
cada una de las regiones con las demás regiones (posee el mismo número de filas como de
columnas), esta matriz se puede construir de formas finitas, aunque se resalta que la forma más
sencilla y utilizada es la binaria, en la que el 1 representaría la presencia de contigüidad espacial
entre esas dos regiones, mientras que 0 significaría la ausencia de esta lo que conlleva a que esa
matriz inicialmente presentara simetría(Bohórquez & Ceballos, 2008).
𝑤𝑖𝑗 = (
0 𝑤12 … 𝑤1𝑁
𝑤21 0 … 𝑤2𝑁
… … … …𝑤𝑁1 𝑤𝑁2 … 0
) (2)
Para la construcción de esta matriz W se utilizan diferentes criterios de contigüidad y contigüidad
de órdenes superiores (estos con el fin de observar las posibles relaciones que puede tener esa
región al ir variando el orden del tipo de contigüidades), con el fin de definir la vecindad teniendo
en cuenta no solo los polígonos que están en contacto directo.
2.7. Criterios de Contigüidad
Para definir los distintos criterios de contigüidad se basa en las relaciones de los vecinos, en donde
el criterio de vecindad de A sobre B–unidades más cercanas se define a partir de distancias
euclidianas, las demás B+1, B+2, …, B+n se consideran no vecinas de A. Actualmente se conocen
múltiples algoritmos o criterios de contigüidad que varían en sus análisis de relaciones espaciales
dependiendo del fenómeno de estudio. Los criterios más comunes son:
• Contigüidad Efecto Torre
El criterio de contigüidad torre es el que se define 𝑤𝑖𝑗 = 1 para unidades que compartan un lado
común con la región de interés moviéndose en 4 direcciones únicamente (izquierda, derecha, arriba
o abajo).
Figura 2: Matriz de contigüidad de torre de orden 1 (B1), orden 2 (B2)
B2
B1
B2 B1 A B1 B2
B1
B2
Fuente: Elaboración propia
21
• Contigüidad Efecto Alfil
El criterio de contigüidad alfil es el que se define 𝑤𝑖𝑗 = 1 para unidades que comparten un vértice
común con la región de interés, moviéndose en diagonal dependiendo de los vértices.
Figura 3: Matriz de contigüidad de alfil de orden 1 (B1), orden 2 (B2)
B2 B2
B1 B1
A
B1 B1
B2 B2
Fuente: Elaboración propia
• Contigüidad Efecto Reina
El criterio de contigüidad reina es el que cual se define 𝑤𝑖𝑗 = 1 para unidades que comparten un
lado en común o un vértice con la región de interés, moviéndose en cualquier dirección del vértice
al cual se hace la estimación.
Figura 4: Matriz de contigüidad de Reina de orden 1 (B1), orden 2 (B2).
B2 B2 B2 B2 B2
B2 B1 B1 B1 B2
B2 B1 A B1 B2
B2 B1 B1 B1 B2
B2 B2 B2 B2 B2
Fuente: Elaboración propia
2.8. Análisis de autocorrelación espacial
En las clasificaciones técnicas de AEDE propuesta por Anselin (Anselin, 1998) se expone un
contraste doble en el análisis del fenómeno de dependencia espacial, lo que se denominaría como
contraste global (Smooth) y contraste local (Rough).
2.8.1. Contraste Global
El contraste global tiene como objetivo el análisis de la presencia de tendencias generales en la
distribución de una variable sobre el espacio geográfico de estudio, siendo este un examen conjunto
de todas las unidades que componen la muestra; existen varios contrastes que ayudan a verificar el
supuesto, además estos tienen las siguientes hipótesis:
22
𝐻0 =Ausencia de autocorrelación espacial.
𝐻𝛼 = Presencia de autocorrelación espacial.
Los supuestos más utilizados para esto son:
• Contraste de I de Moran
Inicialmente fue formulado como función de una variable (Y), considerada en los puntos del
espacio (i, j), en desviaciones a la media, y los elementos de la matriz binaria de interacciones
espaciales [𝛿𝑖,𝑗]. La expresión I de Moran está dada por:
𝐼 =𝑁
𝑆0
∑ 𝑤𝑖𝑗(𝑦𝑖−�̅�𝑁𝑖,𝑗=1 )(𝑦𝑗−�̅�)
∑ (𝑦𝑖−�̅�)2𝑁𝑖=1
(3)
Donde:
𝑤𝑖𝑗 es un elemento de la matriz de pesos espaciales correspondiente al par (i, j).
𝑆0 = ∑ ∑ 𝑤𝑖𝑗, es decir la suma de los pesos espaciales
�̅� es el valor medio o esperado de la variable
𝑁 es el número de observaciones o tamaño muestral
Se calcula un estadístico de prueba que tiene una distribución normal con el fin de aceptar o
rechazar la hipótesis nula:
𝑍(𝐼) =𝐼−𝐸(𝐼)
𝜎(𝐼) (4)
El estadístico I varía entre -1 y 1, cuanto más cercano a 1 sea el indicador, mayor será el nivel de
autocorrelación espacial. Pero si el estadístico se enfrente a una muestra suficientemente grande,
el contraste de I de Moran estandarizado, Z (I) seguiría una distribución asintótica N (0,1), esto
sería utilizando una matriz de asociación espacial estandarizada por filas, donde 𝑆0 = 𝑁 reduciendo
el estadístico de I al cociente del producto espacial cruzado de los valores de la variable partido
por la varianza (Yrigoyen, 2003).
• Test G (d) de Getis y Ord
El cálculo de este estadístico es para toda la muestra, en donde dos pares de regiones (i, j), serán
vecinas siempre que se encuentren dentro de una distancia d determinada, la expresión estaría dada
por:
23
𝐺(𝑑) =∑ ∑ 𝑤𝑖𝑗(𝑑)𝑦𝑖𝑦𝑗
𝑁𝐽=1
𝑁𝑖=1
∑ ∑ 𝑦𝑖𝑦𝑗𝑁𝑗=1
𝑁𝑖=1
𝑖 ≠ 𝑗 (5)
Donde 𝑤𝑖𝑗(𝑑) adopta el valor de 1 en los pares de regiones (i, j) situadas dentro de la distancia d y
cero. Su significancia estadística también se podría corroborar estandarizando el contraste, siendo
este cuando la muestra es suficientemente grande el estadístico seguiría una distribución N (0,1)
(Yrigoyen, 2003).
𝑍(𝐺) =𝐼−𝐸(𝐺)
𝜎(𝐺) (6)
Tabla 1: Contrastes Globales análisis autocorrelación espacial
Test Hipótesis nula
(Z no significativo)
Hipótesis alterna
(Z > 0)
Z es significativo
(Z < 0)
I de Moran No autocorrelación
espacial
Autocorrelación
espacial positiva
Autocorrelación
espacial Negativa
G(d) de
Getis y Ord
No autocorrelación
espacial
Autocorrelación
espacial Positiva
(Valores de Y altos)
Autocorrelación
espacial Positiva
(Valores de Y bajos)
2.8.2. Contraste Local
El contraste local es definido por una concentración, en un lugar del espacio global analizado, de
valores especialmente altos o bajos (“puntos calientes”, “picos”) de una variable en comparación
con el valor medio de la misma; observaremos 2 contrastes que ayudan a verificar los supuestos
los cuales son:
• Contraste Local de Moran
En este estadístico se mantiene la relación innata entre el estadístico global, que por sí podrían
arrojar valores muy similares al obtenido globalmente, aunque se sugiera que para una mejor
interpretación se puede estandarizar la matriz de pesos.
𝐿𝑖 =𝑦𝑖
∑ 𝑦𝑖𝑁𝑖=1
𝑁
∑ 𝑤𝑖𝑗𝑦𝑗𝑁𝑗 ∈ 𝐽𝑖 (7)
En donde:
𝑦𝑖 representa el valor de la región 𝑖para la variable normalizada
𝐽𝑖 conjunto de regiones vecinas a 𝑖 𝑁 es el número de observaciones o tamaño muestral
24
Pero si el estadístico se enfrenta a una muestra suficientemente grande, el contraste de I de Moran
estandarizado, Z (I) seguiría una distribución asintótica N (0,1) (Yrigoyen, 2003).
• Indicados local de Asociación espacial (LISA)
LISA es utilizado para detectar aglomeraciones (clúster) mediante la medición de la
autocorrelación espacial donde se localiza cada observación, los mapas LISA ilustran los valores
significativos y representan gráficamente los valores atípicos espaciales (Anselin, Syabri, & Kho,
2006), el estadístico local más utilizado es el I de Moran.
• Estadístico local de Geary
𝐺 (𝑑) =∑ 𝑤𝑖𝑗 𝑑(𝑦𝑗)𝑁
𝑗=1
∑ 𝑦𝑗 𝑁𝑗=1
𝑖 ≠ 𝑗 (8)
Siendo i y j vecinos siempre y cuando estés se encuentren en la distancia d, además sabemos qué y
es la variable de interés que en este caso no está normalizada, además como los contrastes anteriores
si el estadístico se enfrenta a una muestra suficientemente grande se utilizaría una expresión
estandarizada que se distribuiría asintóticamente N (0,1) (Baronio et al., 2012).
2.9. Evaluación Multicriterio – Método de Jerarquía Analítica (AHP por sus siglas
en inglés)
La evaluación multicriterio (EMC) se basa en la ponderación y compensación de variables, ya sean
determinantes o factores de aptitud (Rivera, Mendoza, Martínez, & Servin, 2010); la aplicación de
este exige, la indicación de pesos o ponderaciones, basados en la teoría de decisiones para explicar
y predecir el comportamiento de los agentes que toman la decisión. Para la aplicación de esta
evaluación, se basó bajo el método de jerarquía analítica (AHP) desarrollada por Thomas Saaty en
1980 (Saaty, 2008) y tradicionalmente se clasifica como una técnica multiatributos para la toma de
decisiones, donde analiza los factores que intervienen en el proceso de decisiones sin requerir que
estos se encuentren en una escala común.
Los niveles de importancia o ponderación de los criterios se estiman por medio de comparaciones
apareadas entre estos, esta se lleva a cabo usando una escala, como se observa en la Ecuación 9.
𝑆 = {1
9,
1
7,
1
5,
1
3, 1,3,5,7,9} (9)
En el caso de n atributos la comparación apareada del elemento 𝑖 con el elemento 𝑗 es colocado en
la posición de 𝑎𝑖𝑗 de una matriz que se denominara A de comparaciones que es por sus dimensiones
de tipo cuadrada; los valores recíprocos de estas comparaciones son colocados en la posición 𝑎𝑖𝑗
de A, con la finalidad de preservar la consistencia.
25
Aij = (
a11 a12 … a1𝑗
a21 0 … a2𝑗
… … … …a𝑖1 a𝑖2 … a𝑖𝑗
) (10)
Para la comparación de los criterios se debe comparar una importancia relativa de un elemento con
respecto a un segundo por medio de una escala que construyo Saaty de 9 puntos como se observa
en la tabla 2, lo valores intermedios entre los intervalos de importancia, son valores intermedios de
decisión.
Tabla 2: Escala de 9 puntos para comparaciones apareadas.
Importancia Significado
1 Igual Importancia
3 Ligeramente más importante
5 Notablemente más importante
7 Demostrablemente más importante
9 Absolutamente más importante
Para la asignación de valores a cada uno de los criterios de la matriz, por columnas comparando
los criterios de las filas con los de la primera columna y así sucesivamente, se puede observar que
en la posición 𝑎11 el criterio de este es igual de importante así mismo, por eso la diagonal principal
de esta matriz siempre va a ser 1 para todos los criterios; una vez ingresados los valores
correspondientes en la matriz, el problema se reduce al cálculo de eigenvalores y eigenvectores,
los que representan las prioridades y el índice de consistencia del proceso respectivamente .
𝐴 ∗ 𝑤 = 𝜆 ∗ 𝑤 (11)
Donde
A matriz recíproca de comparaciones apareadas.
𝜆 máximo eigenvalor de A
𝑤 eigenvector correspondiente a 𝜆
Para la verificación de la correcta comparación entre criterios el AHP permite identificar y tomar
en cuenta las inconsistencias de las decisiones tomadas, incorporando el análisis de índice de
consistencia (IC) y una relación de consistencia (RC), para medir la calidad de los juicios por un
decisor (Garcia, Salvador, Díaz, & de la riva, 2006); se considera que un RC<0.1 es aceptable, en
caso de que sea mayor, se deben volver a analizar la comparación de estos.
𝐼𝐶 =𝜆𝑚𝑎𝑥−𝑛
𝑛−1 (12)
26
𝑅𝐶 =𝐼𝐶
𝑅𝐼 (13)
Como se observa el índice RC está en función de IC y de RI, donde este último representa el valor
de un índice aleatorio en función del orden de la matriz, que es el estimado del promedio del IC de
500 matrices recíprocas positivas generadas de manera aleatoria (Saaty, 2008). El RC es una
medida de la relación del error cometido en la comparación y el error aleatorio, siendo este menor
al 10%.
Tabla 3: Índices aleatorios de consistencia.
N 3 4 5 6 7 8 9 10
IA 0.5 0.90 1.12 1.24 1.32 1.41 1.45 1.49
2.10. Covariograma y Correlograma.
La función de covarianza muestral entre parejas de observaciones que se encuentran a una distancia
h, se calcula empleando la fórmula clásica de la covarianza muestral siendo esta:
𝐶(ℎ) = 𝐶𝑂𝑉 (𝑧(𝑥 + ℎ), 𝑍(𝑥)) =∑ (𝑍(𝑥+ℎ)𝑍(𝑥))𝑛
𝑖=1
𝑛− 𝑚2 (14)
En donde
m = Valor promedio en todo punto de la región de estudio
n = Número de parejas de puntos que se encuentran a una distancia h.
Asumiendo que el fenómeno es estacionario y estimando la varianza de la variable regionalizada a
través de la varianza muestral, se tiene que el correlograma muestral está dado por:
𝑟(ℎ) =𝐶𝑂𝑉 (𝑍(𝑥+ℎ),𝑍(𝑥))
𝑆ℎ+ℎ𝑆𝑥=
𝐶 (ℎ)
𝑆𝑥2 =
𝐶 (ℎ)
𝐶(0) (15)
Bajo el supuesto de estacionariedad de dependencia espacial en las funciones de covariograma o
correlograma, estas pueden ser usadas en la determinación de la relación espacial entre los datos
(Giraldo, 2011).
2.11. Análisis confirmatorio de datos espaciales.
Hace referencia al correcto tratamiento de las especificaciones y los contrastes de los efectos
espaciales en un modelo de datos geográficos. Para ello, se ocupa primero de las diferentes
especificaciones posibles para la inclusión del fenómeno espacial en un modelo, para después poder
27
aplicar los diferentes contrastes diseñados para detectar la existencia de autocorrelación espacial
(Baronio et al., 2012).
2.11.1. Modelo de Regresión Espacial
Los modelos de dependencia espacial son modelos de regresión lineal que consideran
explícitamente la existencia del efecto espacial de autocorrelación espacial, la inclusión de este
efecto en un modelo de regresión requiere la utilización de una matriz de pesos espaciales (definida
como w), capaz de recoger las influencias mutuas presentes entre las unidades espaciales de la
muestra. A continuación, se muestran distintas formas de tratamiento de este fenómeno
(dependencia o autocorrelación espacial) presente en la variable endógena de modelos de regresión
lineal (Yrigoyen, 2003).
• Modelo Básico de regresión Lineal (MBRL)
El MBRL se implementa cuando existe la posibilidad de que no se produzca la dependencia
espacial en una variable o de que esta sea recogida correcta y totalmente por un grupo de regresoras.
Se expresa de la siguiente manera:
𝑦 = 𝑋𝛽 + 𝜇 (16)
𝜇 ≈ 𝑁(0, 𝜎2𝐼)
Donde
𝑋 es una matriz [K, N] de K variables exógenas y N observaciones
𝛽 vector [K,1] de parámetros de las variables exógenas
• Modelo del Error Espacial Autorregresivo (SEM por sus siglas en inglés)
Este modelo del error espacial, se usa cuando los modelos de tipo MBRL resultan ineficaces para
explicar un fenómeno con autocorrelación espacial. Siendo el efecto de dependencia espacial en la
variable endógena explicado, no solo por las variables independientes presentes en el modelo, sino
por otras que se encuentran ausentes (dependencia espacial residual).
𝑦 = 𝑋𝛽 + (𝐼 − 𝜆𝑊)−1𝜇 (17)
𝜇 ≈ 𝑁(0, 𝜎2𝐼)
Donde
𝜆 parámetro autorregresivo asociado al retardo espacial
𝜇 vector de perturbaciones aleatorio
28
• Modelo de Retardo Espacial (SAR por sus siglas en inglés)
Este modelo incorpora la influencia de las variables omitidas a través de una variable dependiente
espacialmente retardada, es decir, a través de los valores que, para cada punto i, adopta la
variable endógena en un grupo de localizaciones vecinas.
𝑦 = 𝜌𝑊𝑦 + 𝑋𝛽 + 𝜇 (18)
𝜇 ≈ 𝑁(0, 𝜎2𝐼)
Figura 5: Tratamiento de la autocorrelación espacial - primera tipología de modelos
Fuente: Chasco Yrigoyen – a partir de Baller et al. (2000)
29
Todos estos modelos pueden expresarse de forma general en el llamado modelo mixto regresivo
de regresión espacial, con perturbaciones aleatorias autorregresivas y heteroscedasticas, siendo este
un modelo general anidado de regresión espacial (GNS por sus siglas en inglés).
𝑦 = 𝜌𝑊1𝑦 + 𝑋𝛽1 + 𝑊2𝑅𝛽2 + 휀 (19)
휀 = 𝜆𝑊2휀 + 𝜇 𝜇 ≈ 𝑁(0, Ω); Ω𝑖 = h𝑖(𝑍𝛼); h𝑖 > 0
Donde:
𝑦 es el vector de la variable explicada
𝑊1𝑦 es el retardo espacial de la variable de estudio
𝑋 es una matriz de variables independientes no rezagadas espacialmente
𝑅 es una matriz de variables explicativas no necesariamente con los mismos elementos
de X rezagadas espacialmente
Los parámetros 𝜆 y 𝜌 miden el grado de la dependencia espacial
Ω matriz de covarianza generalizada con los elementos en la diagonal dados por Ω𝑖
h𝑖 perturbación heteroscedastica
Ya a partir de esta especificación se pueden definir modelos adicionales tales como:
• Modelo mixto autorregresivo regresivo espacial con error espacial autorregresivo
(SARAR por sus siglas en inglés)
𝑦 = 𝜌𝑊1𝑦 + 𝑋𝛽1 + 휀 (20)
휀 = (𝐼 − 𝜆𝑊2)−1𝜇
𝜇 ≈ 𝑁(0, Ω)
• Modelo mixto regresivo – regresivo espacial autorregresivo regresivo espacial con
error espacial autorregresivo (SDM por sus siglas en inglés)
𝑦 = 𝜌𝑊1𝑦 + 𝑋𝛽1 + 𝑊2𝑅𝛽2 + 𝜇 (21)
• Modelo mixto regresivo cruzado– regresivo espacial (SLX por sus siglas en inglés)
𝑦 = 𝑋𝛽1 + 𝑊2𝑅𝛽2 + 𝜇 (22)
• Modelo mixto regresivo cruzado– regresivo espacial con error espacial
autorregresivo (SDEM por sus siglas en inglés)
𝑦 = 𝑋𝛽1 + 𝑊2𝑅𝛽2 + (𝐼 − 𝜆𝑊2)−1𝜇 (23)
30
2.12. Regresión geográficamente ponderada (GWR por sus siglas en inglés)
La regresión geográficamente ponderada (GWR por sus siglas en inglés) tiene como finalidad
estimar un vector de parámetros diferente para cada observación, realizando la estimación debido
a la inestabilidad de los parámetros y la ausencia de estacionariedad espacial (Bohórquez
Castañeda, 2010), tomando de partida el siguiente modelo:
𝑦𝑖 = 𝑋𝑖𝛽(𝑣𝑖, 𝑣𝑖) + 𝜇 (24)
Para 𝑖 = 1,2, … . , 𝑛, con 𝑣𝑖 y 𝑣𝑖 como coordenadas geográficas. Mientras la estimación de 𝛽 queda
para este caso (ecuación 25), para 𝑊(𝑣𝑖, 𝑣𝑖) = 𝐷𝑖𝑎𝑔(∝𝑖 𝑗), donde ∝𝑖 𝑗 es la ponderación definida
en términos de la distancia de la observación espacial i a la observación espacial j con 𝑗 =1,2, … . , 𝑛.
�̂�(𝑣𝑖, 𝑣𝑖) = [𝑋′𝑊((𝑣𝑖, 𝑣𝑖)𝑋]−1𝑋′𝑊(𝑣𝑖, 𝑣𝑖)𝑦 (25)
31
Capítulo III
Fuentes de Información
Las fuentes de información para este trabajo se intentaron tomar en su mayoría de libre acceso,
como lo es la encuesta nacional de calidad de vida realizada por el Departamento Administrativo
Nacional de Estadística - DANE el cual proporciona anualmente datos como los servicios públicos
domiciliarios, bienes muebles de uso básico y su cobertura por hogares y viviendas, además se
complementó esta información con los indicadores y datos del Observatorio Ambiental de Bogotá
- OAB.
Se utilizó la base de datos del Instituto Distrital de Gestión del Riesgo y Cambio Climático –
IDIGER ya que manejan un histórico de datos sobre inundaciones en Bogotá según el tipo de
inundación que se clasifican por localidad y barrios, adjunto a esta información también se manejó
un histórico de los hechos validados por la prensa local y nacional. Adicional a la información de
libre acceso de esta entidad, también se consultó los datos de las estaciones que maneja el IDIGER,
incluyendo la clasificación del riesgo a trabajar; información que fue suministrada por la entidad
con el fin de poder ayudar a realizar un análisis de estos mismos desde otro ámbito en donde cuya
información si tiene restricción. El portal de Infraestructura de Datos Espaciales para el Distrito
Capital - IDECA proporcionó las bases de datos geográficas, las cuales fueron útiles a la hora de
espacializar todas las variables, incluyendo la distribución de los afluentes hídricos entorno a la
zona de estudio y el posible cálculo de su influencia por localidad, incluyendo los datos de la
población en relación al número de personas que habitan estas.
Finalmente se observó la Red de Monitoreo de Calidad del Aire de Bogotá - RMCAB, la cual
mediante sus 11 estaciones miden la calidad del aire, precipitación, temperatura y condiciones
ambientales diversas, nos ayudaron a estimar por localidad algunas variables importantes para este
trabajo, además de datos de precipitaciones mensuales obtenidas de la red de estaciones
hidrológicas de la Corporación Autónoma Regional de Cundinamarca - CAR.
3.1. Softwares Utilizados
El procedimiento y análisis de los datos se realizó en diferentes tipos de softwares que ayudan a
cumplir con los objetivos planteados, siendo estos de índole geográficos y estadísticos.
➢ R v3.5.0: Es un software libre donde se manejan paquetes estadísticos para el análisis de
datos y generación de gráficas (“Presentación de la herramienta R | Oficina Software
Libre,” n.d.), en este programa se realizó la mayoría del proceso de este proyecto, desde el
análisis estadístico descriptivo, el exploratorio, el estructural entre otros, hasta la
generación del modelo econométrico espacial y la validación del mismo. De la misma
manera se obtuvieron la mayoría de los gráficos; las ventajas de este programa es su fácil
instalación, su interfaz y la instalación de los paquetes que maneja, de igual manera al ser
de libre acceso se pueden programar funciones adicionales u obtener funciones ya
32
programadas por otros usuarios que se enfrentan a problemáticas similares.(R (V 3.5.0)
[Software], n.d.)
➢ GeoDa v1.12: Este software fue desarrollado en la Universidad de Chicago, siendo este
una herramienta que introduce el análisis de datos espaciales enfocado a la rama de la
estadística llamada econometría espacial. Este es de libre acceso, principalmente se utilizó
para la generación de los gráficos que representan la autocorrelación espacial, y algunos
estadísticos de este como el I de Moran entre otros. Sus ventajas consisten en que, además
de ser gratuito, su interfaz es amigable con el usuario proporcionando un fácil acceso a la
herramienta; el análisis y el modelamiento de los datos se pueden realizar con múltiples
herramientas enfocadas a los datos espaciales de dominio fijo y discreto (datos de área).
(Geoda (V 1.12) [Software], n.d.).
➢ QGis v2.18: Este es un software enfocado a la creación, edición, análisis, visualización de
la información espacial. Es de libre acceso, que para este estudio se usó para la visualización
de la información espacial inicial, poder espacializar las variables geográficamente para su
posterior análisis estadístico espacial, además de poder obtener mapas temáticos que
ayudan a que los lectores a interpretar de forma sencilla la información desde el inicio hasta
el final de esta. Las ventajas de este es que al ser de libre acceso se encuentran diferentes
herramientas y funciones que ayudan a obtener una mejor edición y visualización de la
información espacial. (QGIS (V 2.18) [Software], n.d.).
33
Capítulo IV
Metodología
El objetivo principal de este documento es poder modelar el riesgo de inundación en el periodo del
2007 hasta el 2016, con el fin de visualizar espacialmente el fenómeno en la capital del país, y así
proponer soluciones que ayuden a mitigar el riesgo que esto genera para la población. Por medio
de variables sociales, económicas y ambientales que pueden intentar explicar el riesgo de
inundación a través del espacio y el tiempo; para cumplir este objetivo se debe identificar y modelar
la dependencia espacial entre los diferentes factores y la variable respuesta.
Para el tratamiento y análisis de los datos del presente estudio se manejó una metodología que
posteriormente se explicara paso a paso, siendo este guiado por el análisis de datos de área para
datos de riesgo generados por fenómenos naturales, en este caso el de inundación.
4.1. Área de Estudio
La zona de estudio se tuvo con base a la concentración poblacional que posee la ciudad de Bogotá
D.C, su expansión urbanística a través de los años y las cuencas que pertenecen a esta zona que
desembocan al río Bogotá, haciendo que el agua fluya desde los cerros orientales por quebradas,
ríos y humedales hasta desembocar en este, atravesando la ciudad de oriente a occidente,
aumentando la probabilidad de riesgo por factores que puedan provocar desbordamiento de alguno
de estos afluentes que afectarían progresivamente a está; generando daños en el equipamiento del
espacio público, pérdida de la habitabilidad, daño en la infraestructura, suspensión de servicios
públicos y posibles mortalidades. En el análisis de los últimos 16 años reportados por el SIRE se
obtuvieron 16035 eventos múltiples de inundación afectando a la población económica, social y
ambientalmente (IDIGER, 2018).
Bogotá siendo la capital del país cuenta con una superficie total de 1775 𝑘𝑚2 que constituye el
7,3% de la superficie del departamento de Cundinamarca, yace a una altura media de 2.625
m.s.n.m, presenta una población actual de 8’181.047 aproximadamente con una densidad
poblacional de 5.184,44 habitantes por 𝑘𝑚2 según lo indica la Alcaldía mayor de Bogotá. Está
dividida en 20 localidades: Usaquén, Chapinero, Santa Fe, San Cristóbal, Usme, Tunjuelito, Bosa,
Kennedy, Fontibón, Engativá, Suba, Barrios Unidos, Teusaquillo, Los Mártires, Antonio Nariño,
Puente Aranda, Candelaria, Rafael Uribe, Ciudad Bolívar y Sumapaz. (Figura 6)
Para los años a trabajar según el DANE existían aproximadamente 7’035.156 habitantes para el
año 2007, que para el año final de estudio 2016 existían aproximadamente 7’993.000 habitantes,
obteniendo un rango por localidad desde 22.115 Hab. en la localidad de Candelaria hasta los
981.613 Hab. La localidad de Suba para el año 2007, que para el año 2016 el rango iría desde
25.126 Hab. hasta 1’115.261 respectivamente. Se observa que el rango de habitantes es
proporcional al área que poseen las localidades, ya que varía considerablemente entre aquellas con
mayor área a menor, siendo estas últimas en el centro de Bogotá, mientras que en el norte y en el
sur en su mayoría presentan un mayor número de habitantes, algunas zonas del sur y el oeste de la
34
ciudad presentan áreas escasamente pobladas debido a la agricultura rural puntual y la falta de
servicios públicos domiciliarios.
Figura 6: Ubicación Espacial de la región de estudio.
Fuente: Elaboración Propia
4.2. Estructuración Base de Datos y especialización de los datos.
Para desarrollar el proyecto se recolectó información de distintas fuentes, se estructuró una base de
datos con las variables que con base a la investigación previa puedan explicar el fenómeno. Una
vez identificado el riesgo de inundación, se procedió a conformar la Base de Datos Espacial en
formato Shapefile con las localidades y las variables que configuran el riesgo el cual está
establecido así; Riesgo = A x V x C.
35
Solo se estudian 19 localidades de las 20 que posee la ciudad (Usaquén, Chapinero, Santafé, San
Cristóbal, Usme, Tunjuelito, Bosa, Kennedy, Fontibón, Engativá, Suba, Barrios Unidos,
Teusaquillo, Los Mártires, Antonio Nariño, Puente Aranda, Candelaria, Rafael Uribe y Ciudad
Bolívar, no se consideró la localidad de Sumapaz ya que no fue posible encontrar una cantidad de
datos aceptables de esta zona por tanto no tendría un buen grado de fiabilidad para los años de
estudio), y se verificó el área de cada una de ellas tanto urbano como rural.
La base de datos del IDIGER de eventos de inundación y amenaza fue usada para obtener la
información de los niveles de riesgo por inundación en las localidades de Bogotá. Esta base de
datos registra el tipo de evento, la duración de este, las coordenadas de representación, la
descripción de la amenaza, el número de afectados entre otros datos en un periodo comprendido de
9 años (2007-2016).
Tabla 4: Selección de la Variable respuesta.
Tipo Variable Descripción Descriptiva Código Identificador de la localidad
Nombre Nombre de la Localidad
Área Superficie en Metros cuadrados por localidad
Variable
Respuesta
No_Even Número de eventos registrados por año en cada localidad
NivRiesgo Variable obtenida por medio del método AHP, de asignación de pesos
a criterios
Aunque el nivel de riesgo por inundación en Bogotá estaba segregado por el tipo de evento, las
coordenadas de este, el año, el número de afectados, y nivel de amenaza; se prosiguió a la
asignación de pesos espaciales con base al tipo de evento por medio del método AHP (Márquez,
2011) con el fin de que, con la cantidad de eventos registrados de ese tipo más el peso asignado a
esa variable, se pueda generar un nivel de riesgo por inundación por localidad; con el fin de que
represente los patrones espaciales de la distribución, después se estandarizó por el número de
hogares registrados por localidad, y así obtener una variable estandarizada por la población,
representada en hogares.
Para poder aplicar AHP se tiene 5 tipos de causales de los eventos: inundación por
desbordamiento [RepCau] que es producida por un exceso de agua en un cuerpo de agua
(quebradas, canales, ríos, humedales) que invade cubriendo áreas urbanizadas o no, que en
condiciones normales están secas; encharcamiento (Enc<30] siendo este cuando el sistema de
alcantarillado que recolecta, transporta y dispone las aguas lluvias, no es capaz de drenar las aguas
en las zonas urbanizadas y genera anegamiento por exceso de agua que en condiciones normales
están secas, inundaciones laminares mayores de 30 centímetros [Inu>30], que se generan cuando
hay precipitaciones repentinas y de mayor intensidad asociadas a problemas de drenajes y otros; y
daños en redes de servicios públicos (acueducto [DRSPAcu] y alcantarillado [DRSPAlc]) que
es producida cuando algún sistema de estos falla en su función natural provocando el escape o
recolecta de agua a grandes escalas.
36
Tabla 5: Matriz reciproca de comparaciones apareadas
de eventos de inundación
Inu > 30 Enc < 30 DRSPAlc DRSPAcu RepCau
Inu > 30 1.00 5.00 2.00 5.00 0.20
Enc < 30 0.02 1.00 0.33 3.00 0.14
DRSPAlc 0.50 3.00 1.00 4.00 0.20
DRSPAcu 0.20 0.33 0.25 1.00 0.13
RepCau 5.00 7.00 5.00 8.00 1.00
Fuente: Elaboración Propia
En la aplicación del AHP primero se debe conocer el tipo de criterio a evaluar, estos son los
mencionados anteriormente que posibilitarán la generación de la matriz A de comparaciones
apareadas, como se observa en la tabla 5, y cuyos pesos se obtendrán mediante el cálculo del
autovector principal de la matriz, que se puede calcular de forma general o usando métodos de
aproximación numérica; siendo W el vector de pesos asignados a cada criterio, este se obtuvo
normalizando cada columna a suma uno, sumando filas y volviendo a normalizar a uno, siendo esta
normalización la aplicación de la ecuación 26. Esto es, en otras palabras, sumar la primera columna
y dividir cada elemento de esta por la referida suma, analógicamente con el resto de las columnas.
𝑣𝑖𝑗 =𝑎𝑖𝑗
∑ 𝑎𝑖𝑗 (26)
Una vez obtenidos los pesos para cada uno de los criterios el siguiente paso consiste en calcular el
eigenvalor principal de la matriz A, el cual proporcionará una medida cuantitativa de los juicios de
valor asignados a los elementos de la matriz de comparación por pares. Esto se consigue por medio
de la ecuación 12; para estimar el 𝜆𝑚𝑎𝑥 se procede primero a multiplicar la matriz A por en
eigenvector W, obteniendo así otro vector denominado V que en la ecuación 11 se denominó como
la multiplicación vectorial entre 𝜆 ∗ 𝑤 obteniéndolo en la tabla 6. Finalmente se divide cada
componente de V por los de W generando un vector que al calcular la media de los componentes
se obtendría el valor del eigenvalor 𝜆𝑚𝑎𝑥, que asociándolo a la ecuación 12 del IC, nos daría como
resultado IC = 0.053. Y que para observar la inconsistencia de las decisiones tomadas mediante el
análisis del IC en relación de consistencia RC con el fin de medir la calidad de los juicios por medio
de la ecuación 13, como resultado tenemos un RC de 0.09 siendo esta medida la relación del error
cometido en la comparación y el error aleatorio siendo este aceptable dentro de la hipótesis
comprendida en el evaluador (RC<10%).
Tabla 6: Multiplicación matricial entre la matriz A y el eigenvector W.
1.00 5.00 2.00 5.00 0.20 0.20919831 1.12577646
0.02 1.00 0.33 3.00 0.14 0.06625521 0.31501466
0.50 3.00 1.00 4.00 0.20 0.13699875 = 0.71129417
0.20 0.33 0.25 1.00 0.13 0.04037397 0.20694511
5.00 7.00 5.00 8.00 1.00 0.54717376 3.06493729
Fuente: Elaboración Propia
37
Seguido de esto y de calcular el número de eventos por cada tipo de causa por localidad, se
estandarizaron estos eventos por el número de hogares registrados por localidad; como se observa
en la ecuación 27 en donde la variable exógena es el resultado de la interacción entre el número de
eventos registrados por localidad por el método AHP (donde el peso indica el grado de importancia
del tipo de evento) por 10.000 sobre el número de hogares. Finalmente, la variable NivRiesgo es
el riesgo por inundación por cada 10.000 hogares, cuyos resultados se pueden observar en las tablas
7 y 8.
𝑁𝑖𝑣𝑅𝑖𝑒𝑠𝑔𝑜 = 𝑁𝑜.𝐸𝑣𝑒𝑛𝑡𝑜𝑠 (𝐴𝐻𝑃)∗10000
𝐻𝑜𝑔𝑎𝑟𝑒𝑠 (27)
Tabla 7: Datos para hallar NivRiesgo 2007-2011
Año 2007 2011
Localidad Inu Enc DRAL DERAC Rca NivRiesgo Inu Enc DRAL DERAC Rca NivRiesgo
Usaquén 2 16 26 54 0 1.4858 38 125 31 75 0 3.4508
Chapinero 1 9 8 44 0 2.5760 32 35 20 52 0 4.8864
Santa Fe 2 2 10 35 0 3.3860 111 23 16 43 0 11.2843
San Cristóbal 2 11 8 24 0 0.8690 26 50 28 51 0 2.5326
Usme 0 5 7 15 0 0.7308 13 44 22 58 2 3.1832
Tunjuelito 0 1 4 16 1 0.9149 9 12 6 21 0 1.6890
Bosa 1 19 20 19 1 0.9139 139 77 50 55 0 4.1367
Kennedy 1 20 29 62 0 0.8886 203 96 71 106 0 3.1955
Fontibón 1 29 10 33 0 1.6636 25 47 11 25 0 2.0824
Engativá 9 29 15 62 0 0.9943 63 98 21 80 1 1.9239
Suba 1 25 30 68 0 0.9014 63 171 49 89 1 2.2942
Barrios Unidos 0 13 6 21 0 1.2217 6 19 4 23 0 1.3438
Teusaquillo 0 8 2 29 0 1.6809 8 25 5 42 0 2.9174
Los Mártires 0 1 4 23 0 2.1781 62 13 6 47 0 8.4248
Antonio Nariño 0 1 1 7 0 0.6173 11 6 2 24 0 2.4956
Puente Aranda 0 7 8 19 0 1.0065 3 18 15 35 0 1.7783
Candelaria 1 0 0 5 0 1.6051 67 6 5 10 0 19.9193
Rafael Uribe 0 11 7 27 1 0.9452 4 25 17 58 0 1.8080
Ciudad Bolívar 4 13 30 36 1 1.2090 23 59 36 79 1 2.4111
Fuente: Elaboración Propia
38
Tabla 8: Datos para hallar NivRiesgo 2014-2016
Año 2014 2016
Localidad Inu Enc DRAL DERAC Rca NivRiesgo Inu Enc DRAL DERAC Rca NivRiesgo
Usaquén ## 9 391 262 0 9.7972 47 25 154 256 2 5.6648
Chapinero 60 0 208 299 0 19.2448 9 4 50 181 4 7.9542
Santa Fe 20 1 138 130 0 16.3145 16 7 64 107 0 10.3487
San Cristóbal 36 0 164 193 3 6.2471 22 7 67 168 1 3.9505
Usme 8 0 106 128 0 5.3508 6 6 65 93 3 3.6146
Tunjuelito 28 2 76 55 1 5.5039 7 1 35 34 0 2.4721
Bosa 27 1 214 239 0 5.9848 5 4 96 125 0 2.7043
Kennedy 46 1 281 330 0 4.2650 23 10 129 225 0 2.3704
Fontibón 25 1 172 138 0 6.2552 13 7 57 99 0 3.0962
Engativá 67 8 377 290 0 5.2407 19 12 97 187 0 2.1024
Suba 71 2 400 391 0 5.1308 29 8 175 272 1 2.7216
Barrios Unidos 28 0 129 193 0 8.7328 4 1 36 78 0 2.8058
Teusaquillo 0 24 123 226 0 13.1334 16 2 32 115 0 5.4899
Los Mártires 19 0 50 98 0 10.6124 7 6 19 69 0 6.0651
Antonio Nariño 11 1 45 64 0 6.7801 6 1 13 89 0 5.7716
Puente Aranda 16 0 170 200 0 9.3345 8 9 44 153 0 4.8903
Candelaria 9 0 38 33 0 17.4842 1 1 10 35 0 9.7061
Rafael Uribe 24 1 149 179 0 5.9252 8 5 62 118 0 3.0613
Ciudad Bolívar 45 1 169 246 2 5.4437 35 7 168 173 0 4.2553
Fuente: Elaboración Propia
La selección de las variables explicativas fue guiada por el marco teórico y los factores del riesgo
por inundación. Estas variables son descritas en la Tabla 2 y en los siguientes párrafos. Se
seleccionaron los años 2007, 2011, 2014 y 2016, debido a que son representativos durante el
periodo de análisis y principalmente, por la disponibilidad de los datos obtenidos en las diferentes
fuentes de información, que, si bien registran varios factores, la mayoría se realizan con una
periodicidad anual, que para cuestión de la investigación se tuvo que realizar con periodicidad de
3-4 años aproximadamente por el tipo de riesgo que se está manejando.
Estas variables fueron derivadas de varias fuentes, todas ellas de libre acceso y de entidades del
estado, la Encuesta Nacional de Calidad de Vida - ENCV y los archivos del IDIGER fueron las
que mayor información sobre estas proveyeron, de igual forma en las fuentes de información se
detalla más sobre esto.
39
Tabla 9: Variables explicativas seleccionadas para el estudio.
Tipo Variable Descripción Fuente Servicios Públicos
Domiciliario
PO_NDEE Porcentaje de hogares que no disponen
de energía eléctrica.
ENCV, DANE
PO_NDGN Porcentaje de hogares que no disponen
de Gas Natural domiciliario.
ENCV, DANE
PO_NDA Porcentaje de hogares que no disponen
de acueducto.
ENCV, DANE, OAB
PO_NDAL Porcentaje de hogares que no disponen
de alcantarillado
ENCV, DANE, OAB
PO_NDRB Porcentaje de hogares que no disponen
de la recolección de Basura
ENCV, DANE
Fuentes Hídricas
PAH_PL Porcentaje de afluentes hídricos (de tipo
sencillo y doble) por localidad.
IDECA, IDIGER
Bienes PODL Porcentaje de hogares que disponen de
Lavadora.
ENCV, DANE
PODN Porcentaje de hogares que disponen de
Nevera
ENCV, DANE
PODES Porcentaje de hogares que disponen de
Equipo de Sonido
ENCV, DANE
PODT Porcentaje de hogares que disponen de
Televisor
ENCV, DANE
PODC Porcentaje de hogares que disponen de
Computador (uso en el hogar)
ENCV, DANE
PODSI Porcentaje de hogares que disponen de
Servicio de Internet
ENCV, DANE
PO_DET Porcentaje de hogares que disponen de
electrodomésticos.
Método AHP
PODM Porcentaje de hogares que disponen de
Motocicleta
ENCV, DANE
PODCP Porcentaje de hogares que disponen de
Carro Particular
ENCV, DANE
Habitantes PPH Número de personas que constituyen el
hogar por localidad
ENCV, DANE
AL_PH Área en metros cuadrados por localidad
que le corresponde a cada hogar.
ENCV, DANE,
IDECA
Datos ambientales
TEMP Temperatura media anual por año
RMCAB, CAR
PREP Precipitación media anual por año
RMCAB, CAR,
IDEAM
IDEAM (Instituto de hidrología, meteorología y estudios ambientales); RMCAB (Red de monitoreo y calidad de aire de Bogotá);
CAR (Corporación autónoma regional de Cundinamarca); IDIGER (Instituto Distrital de Gestión del Riesgo y Cambio Climático);
ENCV (Encuesta nacional de calidad de Vida); IDECA (Infraestructura de Datos Espaciales para el Distrito Capital); OAB
(observatorio ambiental de Bogotá); DANE (Departamento Administrativo Nacional de Estadística)
40
Descripción de las Variables
➢ Nivel de Riesgo (NivRiesgo): Esta variable es la representación del riesgo de inundación
por cada 10.000 hogares, está estandarizada, re-expresando los datos de tipo y número de
eventos de inundación. Es la variable endógena o la variable respuesta del presente estudio,
con el fin de aplicar las relaciones espaciales y econométricas con las variables explicativas
mencionadas en el marco teórico del presente estudio, esta variable sigue el supuesto de
que a mayor número de eventos de inundación a menor número de hogares mayor
posibilidad de riesgo, que se podría relacionar directamente a las localidades con menor
área.
➢ Energía Eléctrica (PO_NDEE): Valor porcentual (%) de los hogares que no disponen del
servicio de energía eléctrica en sus hogares. Es una variable exógena, de tipo
socioeconómico, relacionada a los servicios públicos domiciliarios que se clasifica como
posible factor influyente de la vulnerabilidad (Paola Andrea, 2014), esta varía en relación
al crecimiento poblacional por localidad siendo este de forma informal o formal. Al no
tener el acceso a este servicio básico obligatorio la posibilidad de tener un tipo de afectación
es mayor, lo que genera que la población sea más vulnerable a cualquier fenómeno.
➢ Gas natural (PO_NDGN): Valor porcentual (%) de hogares que no disponen del servicio
de gas natural de la red pública domiciliaria. Es una variable exógena de tipo
socioeconómico, relacionada a los servicios públicos domiciliarios que se clasifica como
posible factor influyente de la vulnerabilidad (Paola Andrea, 2014), esta varía en relación
al del crecimiento poblacional por localidad. Se considera que al no tener el acceso a este
servicio puede llegar a aumentar la vulnerabilidad de la población en condiciones de bajos
recursos o ubicadas en zonas donde es imposible instalar este por sus condiciones naturales
o de acceso. Este tipo de servicio aún no se considera básico obligatorio, pues hay servicios
que lo pueden suplementar, pero que para este estudio y por sus análisis temporales en las
fuentes de información se tiene en cuenta.
➢ Acueducto (PO_NDA): Valor porcentual (%) de hogares que no disponen del servicio de
acueducto. Es una variable exógena de tipo socioeconómico, relacionada a los servicios
públicos domiciliarios que se clasifica como posible factor influyente de la vulnerabilidad
(Paola Andrea, 2014), esta varía en relación al crecimiento poblacional por localidad, se
considera obligatoria bajo la ley 142 (Congreso de Colombia, 1994), y es fundamental para
la supervivencia y las actividades básicas, se tiene en cuenta el número de usuarios
registrados legalmente para poder obtener este valor porcentual de los habitantes que no se
benefician de este servicio.
➢ Alcantarillado (PO_NDAL): Valor porcentual (%) de hogares que no disponen del
servicio de alcantarillado. Es una variable exógena de tipo socioeconómico, relacionada a
los servicios públicos domiciliarios que se clasifica como posible factor influyente de la
vulnerabilidad (Paola Andrea, 2014), esta varía en relación al crecimiento poblacional por
localidad, se considera obligatoria bajo la ley 142 (Congreso de Colombia, 1994), y está
relacionada a diferentes problemas ambientales y sociales, además de la influencia en
cuanto a la informalidad habitacional.
41
➢ Recolección de Basura (PO_NDRB): Valor porcentual (%) de hogares que no disponen
del servicio de recolección de basuras. Es una variable exógena de tipo socioeconómico,
relacionada a los servicios públicos domiciliarios que se clasifica como posible factor
influyente de la vulnerabilidad (Paola Andrea, 2014), esta varía en relación al crecimiento
poblacional por localidad, se considera obligatoria bajo la ley 142 (Congreso de Colombia,
1994), y está relacionada a diferentes problemas ambientales y sociales.
➢ Afluentes Hídricos (PAH_PL): Valor porcentual (%) que mide el área de ocupación de
los afluentes hídricos en cada localidad. Es decir, es la ponderación del área de los drenajes
sencillos y dobles medidos a través de cada localidad y relacionado con el área de estas. Es
una variable exógena de tipo ambiental, que es considerada uno de los factores generadores
del riesgo a tratar en el presente trabajo (González Velandia, 2014), se asocia con el
crecimiento poblacional desordenado alrededor de zonas no permitidas en una buena
planeación del territorio, como lo serían las rondas hídricas o afluentes hídricos, se ha
considerado dentro del factor vulnerabilidad.
➢ Lavadora (PODL): En este indicador se relaciona el porcentaje (%) de hogares que
disponen del bien mueble denominado Lavadora, es la representación en porcentaje de los
hogares en relación a este bien, está relacionado al supuesto de que, a mayor población,
mayor riqueza, esto sería proporcional a las pérdidas que generaría la ocurrencia de un
fenómeno natural. Es una variable exógena de tipo económico, clasificada posteriormente
en el factor de costo frente a la representación del riesgo.
➢ Nevera (PODN): En este indicador se relaciona el porcentaje (%) de hogares que disponen
del bien mueble denominado nevera, es la representación en porcentaje de los hogares en
relación a este bien, está relacionado al supuesto de que, a mayor población, mayor riqueza,
esto sería proporcional a las pérdidas que generaría la ocurrencia de un fenómeno natural.
Es una variable exógena de tipo económico, clasificada posteriormente en el factor de costo
frente a la representación del riesgo.
➢ Equipo de Sonido (PODES): En este indicador se relaciona el porcentaje (%) de hogares
que disponen del bien mueble denominado equipo de sonido, es la representación en
porcentaje de los hogares en relación a este bien, está relacionado al supuesto de que, a
mayor población, mayor riqueza, esto sería proporcional a las pérdidas que generaría la
ocurrencia de un fenómeno natural. Es una variable exógena de tipo económico, clasificada
posteriormente en el factor de costo frente a la representación del riesgo.
➢ Televisor (PODT): En este indicador se relaciona el porcentaje (%) de hogares que
disponen del bien mueble denominado televisor, es la representación en porcentaje de los
hogares en relación a este bien, está relacionado al supuesto de que, a mayor población,
mayor riqueza, esto sería proporcional a las pérdidas que generaría la ocurrencia de un
fenómeno natural. Es una variable exógena de tipo económico, clasificada posteriormente
en el factor de costo frente a la representación del riesgo.
➢ Computador (PODC): En este indicador se relaciona el porcentaje (%) de hogares que
disponen del bien mueble denominado computador, es la representación en porcentaje de
los hogares en relación a este bien, se discriminan solamente los computadores de uso en
42
el hogar esto quiere decir que son aquellos que no se pueden llevar de forma portátil; está
relacionado al supuesto de que, a mayor población, mayor riqueza, esto sería proporcional
a las pérdidas que generaría la ocurrencia de un fenómeno natural. Es una variable exógena
de tipo económico, clasificada posteriormente en el factor de costo frente a la
representación del riesgo.
➢ Servicio de Internet (PODSI): En este indicador se relaciona el porcentaje (%) de hogares
que disponen del servicio de internet, es la representación de los hogares en relación a este
servicio, se discrimina solamente el servicio de internet del hogar sin tener en cuenta la
posibilidad que se tiene actualmente de incluir un paquete de datos a los dispositivos
móviles o Tablet; está relacionado al supuesto de que, a mayor población, mayor riqueza,
esto sería proporcional a las pérdidas que generaría la ocurrencia de un fenómeno natural.
Es una variable exógena de tipo económico, clasificada posteriormente en el factor de costo
frente a la representación del riesgo.
➢ Electrodomésticos (PO_DET): En este indicador se relaciona el porcentaje (%) de hogares
que disponen de electrodomésticos tales como: nevera, lavadora, equipo de sonido
televisor, computador y el servicio de internet, esto se analizó por medio del método AHP,
ya que al realizar en un posterior AEDE, y análisis estadísticos de las variables, se concluyó
que las variables antes mencionadas como PODN, PODL, PODES, PODT, PODC y PODSI
tenían un alto grado de correlación entre ellas, lo que hacía que en la modelación clásica y
autorregresiva espacial los modelos sufrieran un alto grado de multicolinealidad en estas
variables y por consiguiente se buscó una medida que relacionara estas sin perder el
significado de cada variable.
➢ Motocicleta (PODM): En este indicador se relaciona el porcentaje (%) de hogares que
disponen del bien mueble denominado motocicleta, es la representación de los hogares en
relación a este bien; está relacionado al supuesto de que, a mayor población, mayor riqueza,
esto sería proporcional a las pérdidas que generaría la ocurrencia de un fenómeno natural.
Es una variable exógena de tipo económico, clasificada posteriormente en el factor de costo
frente a la representación del riesgo.
➢ Carro Particular (PODCP): En este indicador se relaciona el porcentaje (%) de hogares
que disponen del bien mueble denominado carro particular, es la representación de los
hogares en relación a este bien; se discrimina cualquier otro tipo de vehículo que no sea de
uso familiar, excluyendo los carros de carga, de servicio público y demás; está relacionado
al supuesto de que, a mayor población, mayor riqueza, esto sería proporcional a las pérdidas
que generaría la ocurrencia de un fenómeno natural. Es una variable exógena de tipo
económico, clasificada posteriormente en el factor de costo frente a la representación del
riesgo.
➢ Personas (PPH): Este valor alude al número de personas que estarían conformando un
hogar por localidad, como los hogares no contienen la misma cantidad de personas, por tal
motivo esta variable es una estimación de las personas que lo componen; es una variable
exógena de tipo social. Clasificada posteriormente en el factor de costo frente a la
representación del riesgo.
43
➢ Área Hogares (AL_PH): Mide la proporción en metros cuadrados (Mts2) del área que se
dispondría por cada hogar dentro de la localidad; es una variable de tipo social, por
consiguiente, la relación sería entre menor área disponible por hogares mayor cantidad de
ellas por localidad, y mayor número de afectados frente a un fenómeno natural; finalmente
se clasifica en el factor de costo frente a la representación del riesgo.
➢ Temperatura (TEMP): Valor dado en grados centígrados (°C) obtenido a partir del
promedio de temperaturas medias registradas en los 12 meses del año para cada localidad
de Bogotá. Es una variable exógena de tipo ambiental, cuyos valores no fluctúan demasiado
en el área de estudio. Está incluida en el factor Peligro en cuanto a la representación de la
fórmula del riesgo.
➢ Precipitación promedia (PRECP): Valor dado en milímetros (mm) obtenido a partir del
promedio de precipitaciones medias registradas en los 12 meses del año para cada localidad
de Bogotá. Es una variable exógena de tipo ambiental, cuyos valores fluctúan en las
diferentes localidades, Además se considera un factor determinante en las inundaciones
(siendo estas de tipo fluvial que son consideradas un proceso natural por el cual el flujo
desborda los límites del cauce (Klement, Lorangb, & Stanford, 2009)) cuando son
persistentes, de larga duración o de corta duración pero intensas (Rojas, Mardones, Luis, &
Aguayo, 2014). Está incluida en el factor Peligro en cuanto a la representación de la fórmula
del riesgo.
Si bien las variables previamente analizadas y mencionadas fueron seleccionadas teniendo como
base el marco conceptual y previos estudios realizados sobre esta problemática, también fueron
seleccionadas con el fin de poder plantear acciones que puedan mitigar o prever los efectos que
estas generan. Las variables de tipo ambiental no se pueden controlar pero sí se pueden monitorear
constantemente además de posibles aplicaciones de sistemas de alertas tempranas que ayuden a
advertir antes de que el evento suceda; mientras, las variables de tipo socioeconómicas, objetivo
de múltiples políticas públicas, son sin duda los factores de mayor relevancia para el estado, pues
muchas de estas son de índole básicas y obligatorias para toda la población, que en la incurrencia
de estas generan que la vulnerabilidad de la población aumente y posiblemente se consideren de
mayor afectación. Las variables de tipo social son las que ayudan a visualizar la dimensión en que
los fenómenos afectan las localidades, con el fin de poder reorganizar y/o generar políticas públicas
que mitiguen las consecuencias de estos. Las variables de tipo económico son aquellas que nos
ayudan a cuantificar las pérdidas que el fenómeno genera en la población y la repercusión de esto.
que conlleva a los múltiples subsidios y ayudas que el estado imparte para estos.
Finalmente se espacializaron todas las variables exógenas mediante la ayuda del software de
edición de datos geográficos en donde se utilizó un archivo de tipo Shapefile del IDECA en donde
solo se tenía la espacialización de las localidades sin información adicional al nombre y el código
asignado por el estado; seguido de esto se prosiguió a cargar todas las variables explicadas
anteriormente, diferenciándolas por año para posteriormente realizar los análisis estadísticos
pertinentes para este proyecto.
44
4.3. Análisis Exploratorio de Datos Espaciales
El análisis exploratorio de datos espaciales (AEDE) incluye la inspección y visualización de datos
en un espacio geográfico. El AEDE utiliza un conjunto de técnicas o herramientas estadístico-
gráficas que describen y visualizan la distribución espacial del fenómeno y las posibles relaciones
entre sí mismo. Por consiguiente, este es el primer paso estadístico que se aplicará a los datos con
el fin de poder tener una primera visual de la dispersión de estos, la relación que poseen, las áreas
geográficas y sus particulares características. Adicional se pueden crear nuevas hipótesis o
supuestos sobre los datos generando nuevas investigaciones posteriores a esta que harán que el
resultado sea más apegado a la realidad.
En esta sección, se encontrarán ya plasmadas aplicaciones estadísticas de tipo espacial asociadas
al riesgo de inundación, sus variables y la ubicación de estas en el área de estudio, integrando ya
lo investigativo al campo de la aplicación (la realidad), ya que los métodos utilizados y las
estructuras de dependencia espacial se parecen más a la econometría en el dominio del espacio y
el tiempo. La comprensión de la estacionariedad y la isotropía propias de la estadística espacial se
trasladan a los estudios de datos de área.
Este ítem se realizó en diferentes etapas que comprenden todo lo descrito anteriormente, donde se
comprenda la relación espacial que hay implícitas en el estudio.
4.3.1. Análisis estadístico descriptivo
El primer paso para explorar los datos consiste en plasmar la información obtenida por medio de
un mapa que ayude a identificar posibles patrones en el comportamiento de la variable respuesta.
Para el caso de la variable respuesta NivRiesgo, se realizó un mapa de intervalos iguales para esta
variable en cada año de estudio. Este mapa permite determinar las locaciones espaciales en donde
el nivel de riesgo es mayor y esbozar relaciones iniciales entre los valores de la variable endógena
y las variables exógenas; lo más importante para esta etapa es la identificación de la autocorrelación
espacial tanto global como local para el área de estudio y si las variables relacionadas a esta siguen
su tendencia.
Adicional a la parte gráfica, se prosiguió a obtener las estadísticas descriptivas básicas para la
variable respuesta, incluyendo gráficos para la interpretación de estos como lo son los histogramas,
Boxplot y graficó de normalidad. Las variables de tendencia central y los gráficos estadísticos
permitieron dar una aproximación a las atipicidades en los datos al igual que sus distribuciones;
siendo posible establecer que localidades representan niveles más altos de riesgo, cuales se
encuentran por debajo de la media y cuales están en el rango normal aceptable en Bogotá. Los
estadísticos de dispersión facilitaron la interpretación de que tan compactos son los datos y cómo
se podrían agrupar estos.
Finalmente se realizaron análisis bivariados y multivariados para poder observar las relaciones
entre la variable respuesta y las variables explicativas, para así evitar la redundancia de la
información, identificar la dependencia e interdependencia y la contribución de los factores en la
variable a explicar, los factores con similitudes a otros y entre sí. Con estas estadísticas fue posible
ver las relaciones de linealidad entre el NivRiesgo y las variables independientes.
45
4.3.2. Matriz de pesos espaciales
La característica multidireccional de los datos espaciales se puede plasmar mediante matrices de
pesos espaciales o de contigüidad, donde se involucran los posibles pares de observaciones, para
así poder decidir la influencia que hay entre ellas y el entorno, en diferentes niveles de relación. Es
importante conocer la matriz y sus relaciones previo a la estimación de los modelos
autorregresivos, ya que hace parte intrínseca del modelo mismo, siendo un factor importante para
la correcta especificación de este pues explica la importancia relativa entre los individuos.
Actualmente está matriz se escoge conforme el comportamiento que se observa en el fenómeno a
estudiar, dando la libertad al investigador, para implementar los múltiples algoritmos de relación
espacial existentes que mejor se adapten a este o poder aplicar uno que describa las relaciones
espaciales. La elección de la matriz de contigüidad es de gran importancia, pues de ella dependerán
las relaciones espaciales de los datos. Para la aplicación y generación de esta existen múltiples
criterios, las de tipo binarias que asignan un valor de uno a las unidades contiguas y cero a las
demás, las de tipo estandarizada se construyen a partir de las relaciones binarias en donde cada
componente de la matriz se pondera por la suma de la fila a la que pertenece.
Con el fin de encontrar la matriz que mejor se relacione al fenómeno, se realiza una regresión entre
la variable de estudio y los vectores propios asociados a cada matriz de contigüidad considerando
el amplio conjunto de matrices de pesos espaciales y seleccionando la que presente menor criterio
de Akaike (AIC) (Dray, Legendre, & Peres-Neto, 2006), el objetivo de esto es estimar la pérdida
de información cuando la distribución de probabilidad de f , siendo f un grupo de datos con cierta
distribución, asociada con el modelo verdadero, es aproximada mediante la distribución de
probabilidad de g, asociada con el modelo a ser evaluado (Caballero D., 2011). Se resaltar que el
criterio AIC no pretende identificar el modelo verdadero, si no el modelo que mejor se ajuste entre
los modelos candidatos, proporcionando una aproximación más cercana a la realidad o al verdadero
modelo.
Los criterios utilizados para hallar las matrices de pesos espaciales fueron inicialmente los clásicos
siendo contigüidad Torre y Reina, explicando sus relaciones y criterios de vecindad en el marco
teórico del mismo; mientras las matrices de pesos espaciales basados en otros algoritmos poco
usados fueron: la Triangulación Delaunay que consiste en la relación de los polígonos por medio
de triángulos, formando estos con los puntos más próximos, sin que estos crucen sus
aristas(Fernández Asunción, 2008). El criterio Gabriel define la distancia de los polígonos siendo
esta menor o igual a la mínima distancia entre dos vértices de dos polígonos adyacentes. Los
Vecinos Relativos siendo este la pertenencia de una arista al grafo de vecinos relativos si sus
extremos son vecinos relativos entre sí. La Esfera de Influencia instala un conjunto de puntos
finitos y un radio entre un polígono y su vecino más cercano; de esta forma se genera una
circunferencia centrado en los polígonos y bajo este criterio las unidades se consideran vecinas si
las circunferencias de cada una de estas se intersecan en al menos dos puntos; y K – Vecinos más
cercanos que considera relaciones de distancias no simétricas bajo matrices de pesos
estandarizadas. Una vez generadas las matrices con los criterios previamente mencionados y los
clásicos, se determinó cual relacionaba mejor la relación espacial de las coordenadas euclidianas
de los polígonos a estudiar, posteriormente se basó en el menor valor de AIC para el periodo de
estudio.
46
Este proceso se ejecutó en el software R por medio de las librerías Adespatial y spdep, arrojando
los valores de AIC con su nivel de significancia permitiendo así la visualización de los criterios; se
calculó el estadístico de I de Moran y su correspondiente estandarización, generando los gráficos
de contigüidad por criterio, con el fin de observar las relaciones establecidas entre unidades de
análisis que representen la autocorrelación de los polígonos vecinos, comparando resultados.
4.3.3. Análisis Global y Local
Cuando se define una matriz de pesos adecuada entre las unidades de estudio, es posible comprobar
la existencia de autocorrelación espacial en la variable de estudio, así como determinar el tipo de
relación; se manejan dos tipos de contrastes, el Global y Local, siendo la Global la relación sobre
la estacionariedad de una variable sobre la totalidad de la muestra, mientras la local solamente
verifica la estacionariedad intrarregional.
En cuanto a los supuestos globales para detectar autocorrelación espacial se empleó el contraste
Global de I de Moran que es una media de correlación entre cada región y sus vecinas (Moreno &
Vayá, 2002); si su estadístico de prueba no es significativo sin importar su estandarización estará
asociado a que habrá una aleatoriedad espacial, por otro lado si el estadístico de prueba arroja
valores significativos y su estandarización mayor a cero significa la concentración de datos
similares en regiones vecinas, por el contrario, si su estandarización da valores menores a cero,
significaría la disparidad en las regiones vecinas (Agudelo, Franco, & Franco, 2015). Otro criterio
fue el test de Getis y Ord, estos test arrojan estadísticos junto un P-valor que permite determinar el
grado de autocorrelación global de NivRiesgo a través de las localidades de Bogotá. Adicional los
gráficos de dispersión de Moran, asociado a cada variable, sirvieron para analizar la presencia de
autocorrelación o aleatoriedad espacial en la región de estudio.
Por otro lado, los criterios locales permiten detectar concentraciones, en un lugar del espacio global
analizado, de valores especialmente altos o bajos (“puntos calientes”, “picos”) de una variable en
comparación con el valor medio de la misma. Los supuestos locales utilizados fueron el I de Moran
Local y el G de Geary. Estos estadísticos locales permiten identificar visualmente los clusters o hot
spots regionales y los valores atípicos de la variable en el espacio que presenta el I de Moran. Para
así observar en la variable independiente que localidades estaban rodeadas de valores similares y
cuáles de valores diferentes de NivRiesgo.
4.4. Análisis Confirmatorio
Mediante el AEDE se determina la existencia de autocorrelación espacial del NivRiesgo a nivel
localidad, sin embargo, éste no permite decidir sobre la estructura de esta dependencia espacial;
por consiguiente, se debe realizar un tratamiento de estos efectos espaciales en el proceso de
modelización espacial, para así generar la construcción de un modelo autorregresivo espacial y
generar posibles modelos que se puedan ajustar al fenómeno de estudio y explicar este lo más
cercano a la realidad.
47
4.4.1. Construcción Modelo Autorregresivo Espacial
Para la construcción de los modelos autorregresivos, se debe evaluar en primera instancia los
modelos más básicos hasta los más complejos para encontrar el que mejor se ajuste a la explicación
del fenómeno. A partir de la estimación por mínimos cuadrados ordinarios (MCO) del riesgo
explicado por las variables exógenas se realizó un modelo clásico de regresión que representara el
comportamiento de NivRiesgo en función de los factores ambientales, sociales y económicos. Se
genero la estimación de diversos modelos de regresión lineal para obtener un modelo que cumpliera
con las especificaciones y supuestos claves para la formulación de este. Para esto se aplican
diferentes tipos de test estadísticos que comprueban esto, como la prueba de heterocedasticidad,
prueba de multicolinealidad, prueba de autocorrelación en los residuos, prueba de significancia
global entre otros, con el fin de determinar qué tan preciso es el modelo y si este representa las
relaciones entre la variable respuesta y sus explicativas.
Para tener una previsualización de las variables que puedan explicar el modelo es importante
realizar las pruebas de autocorrelación espacial en los residuos pues esto ayudará a ver los posibles
resultados, si el resultado arroja una asociación espacial, es posible la búsqueda de una estructura
de modelo espacial que capte el efecto retardo espacial de la variable dependiente (Modelo de
rezago espacial); si esto no sucede, deben buscar alternativas no paramétricas y semiparamétricas
que permitan identificar y modelar la dependencia espacial de las variables.
4.4.2. Selección Modelo Autorregresivo Espacial
Para obtener el mejor modelo que se pueda ajustar al fenómeno, se propone, en primera instancia
la aplicación del test Multiplicadores de LaGrange (LM) para cada uno de los posibles modelos
espaciales; determinando cual puede ser el mejor modelo que personifique la dependencia espacial
y la relación de las variables. Este test muestra diferentes modelos espaciales (rezago espacial o
error espacial) asociados a un parámetro y un P-valor de significancia; Para escoger el modelo cuyo
P-valor sea el más significativo, pues se podría apreciar los casos de autocorrelación espacial, sea
esta residual, sustancial o ambas. Se aclara que para este cálculo se debió haber escogido la matriz
de pesos espaciales que tuviera la mejor especificación y así mismo el modelo clásico de regresión.
Finalmente, se obtiene un modelo econométrico espacial para cada año de estudio, que consolida
el comportamiento del Nivel de Riesgo por Inundación. Si bien, los LM determinan en gran medida
cuál modelo es el más apropiado, es necesario apoyarse en los resultados del análisis global y local
del AEDE. Interpretando, que, si el NivRiesgo se relaciona puntualmente entre localidades, podría
tratarse de un modelo espacial SMA, pero si el comportamiento de la variable respuesta es
significativo a través del territorio, se podría hablar de un modelo SAR. Estos análisis junto a las
pruebas de autocorrelación espacial permiten la consolidación de un modelo que mejor se ajuste al
fenómeno, con el fin de evitar deducciones erróneas y posibles errores posteriores con el modelo
espacial seleccionado.
48
4.4.3. Validación del Modelo Autorregresivo Espacial
Una vez establecidos los modelos autorregresivos espaciales, estos se someten a los supuestos de
multicolinealidad, significancia y heteroscedasticidad; analizando de la misma manera los residuos
en busca de no autocorrelación y normalidad. Si después, estos modelos aún son consistentes, se
determinarían como los modelos más óptimos que modelan la variable repuesta (NivRiesgo) por
inundación a través del espacio junto con las variables explicativas para las localidades de Bogotá.
Esto se debe realizar para cada año de estudio, con el fin de analizarlo en diferentes tiempos y
establecer relaciones temporales entre el fenómeno.
Las variables resultantes de todo este proceso son de gran importancia, siempre y cuando existe
una buena significancia, ya que están directamente relacionadas a la variable respuesta, en donde
la disminución o incremento de esta estimulan la perturbación negativa o positiva sobre la variable
respuesta, esto quiere decir que estas pueden variar el Nivel de Riesgo por Inundación alcanzando
a tener perturbaciones en sí mismas o trasmitidas por o hacia las localidades vecinas.
4.5. Interpretación del Modelo
Cuando ya se posee los modelos que cumplen con los supuestos y demás planteamientos, ya es
posible modelar el Nivel de Riesgo por Inundación en Bogotá por localidad, para cada año en
función de los factores de Vulnerabilidad, Amenaza y Costo que incluyen variables sociales,
económicas y ambientales, perdurando a través de la aplicación de pruebas y estadísticos con el fin
de obtener la modelación autorregresiva espacial; describiendo amenamente estas, y su relación
con la variable respuesta, encontrando por qué estas llegaron a repercutir en el comportamiento de
la variable endógena a través de la zona de estudio y en qué proporción genera cambios relativos
que repercuten en el Nivel de Riesgo por Inundación en cada localidad.
4.6. Cálculo de Impactos
Después de obtener los modelos y analizarlos, la mejor forma de realizar una correcta
interpretación de los cambios en los valores resultantes en los modelos frente al riesgo de
inundación es por medio del cálculo de impactos, donde se enseñan los cambios relativos en la
variable respuesta en función de las variables explicativas a través del espacio, suponiendo que el
aumento de alguna variable independiente del modelo afectará la variable respuesta positiva o
negativamente, incluyendo no solo el análisis de esta sino también de las localidades vecinas.
El cálculo de los impactos se realiza para verificar e identificar cómo las variables de este afectan
en diferentes proporciones (pequeñas o grandes) alterando el riesgo de inundación y su distribución
en las localidades del distrito capital.
49
Capítulo V
Resultados y Análisis
El objetivo de este capítulo es presentar, interpretar y exponer lo que se obtendrá de acuerdo a la
metodología planteada y los conceptos propuestos del marco teórico; donde el lector tendrá la
posibilidad de observar paso a paso el resultado de la investigación, además de comparar lo que se
planteó y lo que se obtendrá.
Se explicará inicialmente cada resultado que se genere; para el análisis exploratorio de datos
espaciales (AEDE) se observará la estadística básica de la variable respuesta y su comportamiento
en la zona de estudio; se aplicará y seleccionará el mejor criterio de correlación espacial entre las
unidades espaciales de la zona de estudio. Se realizará el análisis exploratorio global donde se
observará el comportamiento de las variables explicativos y respuestas de manera univariada,
después se analizará el análisis exploratorio local de la variable respuesta con el fin de que el lector
observe el comportamiento de esta variable localmente con las unidades espaciales vecinas. De la
misma forma en que se realizó el comportamiento univariado, se observará la relación entre la
variable respuesta y las explicativas (análisis bivariado).
Para realizar la modelación del fenómeno de estudio se aplicará el análisis confirmatorio de datos
espaciales, donde se modelará en primera instancia un modelo regresivo clásico con el fin de
observar las relaciones de las variables sin su espacialización, además de evaluar los supuestos
básicos para los modelos propuestos; como este no presenta una asociación espacial se proseguirá
a la modelación autorregresiva espacial, donde interactuará las variables de los modelos clásicos
con los resultados obtenidos en el análisis bivariado, aplicando diferentes modelos con el fin de
encontrar el que mejor se adapte a el riesgo por inundación.
Finalmente, se analizarán los modelos autorregresivos espaciales escogidos, y los impactos de estos
en la zona de estudio de manera global, esto quiere decir que este modelo está bajo el supuesto de
estacionariedad en la zona de estudio, el mismo comportamiento para todas las unidades espaciales.
Como el problema planteado puede que se comporte de la misma manera en toda la zona de estudio,
no se descarta la posibilidad de que el comportamiento de las variables no sea global si no local,
variando de una unidad espacial a otra, por consiguiente se proseguirá a realizar la regresión
geográficamente ponderada donde se considera la no estacionariedad en el modelo, se plantearan
modelos diferentes para cada año de estudio y se analizarán estos, observando las variables
significativas de este estudio y su comportamiento local en la zona de estudio. Esto con el fin de
discutir los resultados obtenidos en toda esta sección contextualizando los modelos autorregresivos
espaciales y las regresiones geográficamente ponderadas que se adoptaron mejor al fenómeno en
el transcurso del tiempo.
5.1. Análisis Exploratorio de Datos Espaciales
Debido a que el fenómeno de estudio presenta la existencia de datos espaciales en localizaciones
irregulares, se procedió a realizar el análisis exploratorio para entender la información de una
50
manera básica, mediante métodos estadísticos descriptivos y análisis exploratorios multivariados,
así encontrar relaciones entre variables respuesta y explicativas.
Para analizar la distribución geográfica de la variable estudiada se realizan los mapas de intervalos
cuantiles que agrupan los valores de datos a cada clase dependiendo del valor de los cuantiles para
este grupo de valores. En las figuras 7 y 8 se encuentran los mapas con intervalos definidos por
cuantiles para la variable endógena de los años de estudio, las localidades con color claro
representan los valores mínimos de la variable y en color verde más oscuro los valores más altos.
Figura 7: Distribución espacial del NivRiesgo en las localidades
de Bogotá: 2007 - 2011
Fuente: Elaboración Propia, Software R
Para el año 2007 los valores más altos registrados por localidad son respectivamente en
Teusaquillo, Los Mártires, Chapinero y Santafé variando en un intervalo de [2.83 a3.38], mientras
que las localidades de Antonio Nariño, San Cristóbal, Usme y Kennedy presentan los valores más
bajos dentro de un intervalo de [0.61 – 1.17]. En el mapa del 2011 se puede observar que las
localidades comprendidas en el intervalo que representa el mayor riesgo [4.43 – 19.91] son:
Candelaria, Los Mártires, Chapinero y Santafé, que, a diferencia del 2007 para este año la localidad
de Usme, Bosa y Kennedy presenta un aumento en el riesgo, mientras que las localidades de
Tunjuelito, Rafael Uribe, Barrios Unidos y Puente Aranda disminuyeron el índice de riesgo que
estas tenían. En la comparación de estos años (2007-2011) se puede observar una variación del
riesgo negativamente siendo este el aumento del riesgo en las localidades de Antonio Nariño, San
Cristóbal, Usme, Bosa, Kennedy, Fontibón, Engativá y Candelaria, mientras una variación positiva
siendo este la disminución del riesgo se presentó en la localidad de Tunjuelito, Rafael Uribe,
Barrios Unidos, Puente Aranda y Ciudad Bolívar.
51
Figura 8: Distribución espacial del NivRiesgo en las localidades
de Bogotá: 2014 - 2016
Fuente: Elaboración Propia, Software R
De igual manera para el año 2014 se observan que las localidades de Candelaria, Los Mártires,
Chapinero y Santafé presentan un mayor riesgo en un intervalo de [11.62-19.24], mientras que las
localidades con menor riesgo en este año se identificaron que son Usme, Kennedy, Engativá y
Suba. En el 2016 vuelven y se presenta en las localidades de Candelaria, Los Mártires, Chapinero
y Santafé un riesgo mayor comprendido en el intervalo de [5.88-10.34], adicional a este se observa
que las localidades de Antonio Nariño, Los Mártires, Usme, Ciudad Bolívar y Suba presentaron
una variación del fenómeno negativamente, esto quiere decir el aumento de este.
Finalmente, las localidades más afectadas en el periodo de estudio son Los Mártires, Chapinero y
Santafé ya que son las que mayor riesgo por cada 10.000 hogares presentan; seguido de Usaquén,
Usme, Ciudad bolívar, Bosa y Kennedy que, aunque en todo el estudio no presentan una constancia
en el riesgo, si muestran valores significativos para este. En el caso de las localidades como
Tunjuelito y Rafael Uribe mantuvieron un riesgo por inundación relativamente bajo en el estudio
donde las variaciones que se observaron, no aumentaron considerablemente.
Para examinar si la variable respuesta sigue una distribución normal, se utilizan diferentes gráficos
de análisis como histograma, diagrama de distribución empírica y diagrama de caja para cada año
de estudio, además se adjuntan un resumen de las medidas de tendencia central de la variable
endógena, que describe el comportamiento del conjunto de los datos.
52
Figura 9: Histograma, Grafico Q-Q y Boxplot del NivRiesgo 2007
Fuente: Elaboración Propia, Software R
El NivRiesgo en el año 2007 presenta una asimetría, ya que los valores tienden a reunirse a la
izquierda de la media (Figura 9). En cuanto a los datos estadísticos básicos se observa que tiene un
mínimo de 0.6173, una mediana de 1.0065 y una media de 1.3573, el valor de la curtosis nos indica
que hay una mayor concentración de datos entorno a la media, el coeficiente de variación para este
año es de 52%. Esto quiere decir que los datos no están tan dispersos. En el gráfico Q-Q se observa
que los puntos intentan ajustar a una función exponencial. El Boxplot expone que la variable
respuesta tiene algunos valores atípicos que se identificaron, además, la concentración de los datos
se ubica por encima de la mediana concluyendo que no es simétrica respecto a esta medida.
Figura 10: Histograma, Grafico Q-Q y Boxplot del NivRiesgo 2011
Fuente: Elaboración Propia, Software R
En el histograma del año 2011 se puede observar que también hay una asimetría hacia el lado
izquierdo de la media, aunque ya se observa en esta medida que se encuentra un valor alto plasmado
en ella (Figura 10). En cuanto a los datos estadísticos básicos se observa que tiene un mínimo de
1.3440, una mediana de2.5330 y una media de 4.3030, el valor de la curtosis para este año también
nos indica que hay una mayor concentración de datos entorno a la media. En el gráfico Q-Q se
53
observa que los puntos no tienen ninguna similitud a una recta, pero se tiene el indicio de que
podría seguir una exponencial. El Boxplot expone que la variable respuesta en este año es donde
más se presentan datos atípicos, la concentración de los datos se ubica por encima de la mediana
concluyendo que no es simétrica respecto a esta, y que la mayoría las localidades presentan un
mayor riesgo por inundación.
Figura 11: Histograma, Grafico Q-Q y Boxplot del NivRiesgo 2014
Fuente: Elaboración Propia, Software R
En el año 2014 se puede observar en el histograma que como en los dos años anteriores se sigue
presentando una asimetría hacia el lado izquierdo de la media (Figura 11). En cuanto a los datos
estadísticos básicos se observa que tiene un mínimo de 4.2650, una mediana de 6.2550 y una media
de 8.7780; el valor de la curtosis para este año nos indica que hay una menor concentración de
datos entorno a la media. En el gráfico Q-Q se observa que los datos no se ajustan uniformemente
ni se aproximan a una normal. El Boxplot expone que la variable respuesta tiene datos atípicos y
esta no se encuentra simétrica en torno a la mediana, aun así, como en los anteriores años la mayoría
de las localidades presentarían un mayor riesgo pues hay una mayor agrupación de datos sobre
este.
Figura 12: Histograma, Grafico Q-Q y Boxplot del NivRiesgo 2016
Fuente: Elaboración Propia, Software R
54
Finalmente, para el año 2016 se observa en el histograma que no hay simetría con respecto a la
media y la mediana; en cuanto a los datos estadísticos básicos se observa que tiene un mínimo de
2.1020, una mediana de 3.9500 y una media de 04.6870; el valor de la curtosis para este año
también nos indica que hay una menor concentración de los datos entorno a la media. En el gráfico
Q-Q se observa que los datos se podrían los valores ajustarse a uno normal, aunque no se tenga
certeza de esto. El Boxplot expone que la variable respuesta tiene datos atípicos, pero en este caso
se observa que los datos son simétricos entorno a la mediana queriendo decir que hay una
concentración similar de localidades con riesgo alto como bajo.
Tabla 10: Resumen de medidas estadísticas de la variable de estudio para cada año
Medida Estadística 2007 2011 2014 2016
Mínimo 0.6173 1.3440 4.2650 2.1020
Máximo 3.3860 19.9190 19.2450 10.3490
Media 1.3573 4.3030 8.7780 4.6870
Mediana 1.0065 2.5330 6.2550 3.9500
Desviación estándar 0.7077 4.5209 4.5844 2.4492
Desviación media 0.3191 1.0742 1.6671 2.1919
Asimetría 1.4089 2.3278 1.0610 0.9874
Curtosis 1.2738 4.8688 -0.2957 -0.1650
Coef. Var. Promedio 52.1394 105.0624 52.2264 52.2604
Coef. Var. Mediana 31.7048 42.4160 26.6509 55.4836
Fuente: Elaboración Propia, Software R
5.1.1. Selección de Matriz de Pesos Espaciales
La matriz W de pesos espaciales introduce la dependencia entre las unidades y especifica los
modelos espaciales, siendo este un atributo definitivo para la econometría de índole espacial; para
obtener la mejor matriz que se adapte al fenómeno de estudio, se analizan distintos criterios de
contigüidad que permiten determinar qué regiones tienen una influencia particular sobre las otras
en consideración expresada en nociones topológicas (Anselin, 1998). Las matrices de pesos
espaciales (w) comparadas inicialmente son por medio de criterios que se basan en contigüidad.
Los criterios Reina y Torre, se basan en geometrías; mientras que el criterio de Triangulación
Delaunay, Esfera de Influencia, Gabriel, Vecinos Relativos y Kn-vecinos más cercanos con n=1,
n=2 y n=4 se basan en distancia. Estas son seleccionadas por medio de la que tenga un menor valor
del coeficiente del criterio de información de Akaike (AIC), siempre y cuando haya evidencia de
que exista autocorrelación espacial y no aleatoriedad, en donde la hipótesis nula que se manejaría
sería un P-valor mayor a 0.
En las tablas 11 y 12 se encuentran los resultados obtenidos para cada criterio del I de Moran y el
resultado del AIC, esto con el fin de analizar la presencia de autocorrelación espacial en los criterios
de contigüidad espacial observando las matrices que también posean el menor AIC.
55
Para el año 2007 se selecciona la matriz de contigüidad con criterio Esfera de influencia que posee
un AIC de -32.26255, se observa que la variable endógena para este año tiene una estructura de
dependencia espacial ya que el estadístico de I de Moran es significativo y su P-valor es menor al
5%, lo que concluiría la ausencia de aleatoriedad espacial. En el año 2011 el menor valor del
coeficiente AIC lo posee el criterio de Kn-vecinos cercanos con Kn=1, la cual también presenta un
I de Moran significativo y su P-valor es menor al 5% por consiguiente representa que hay una
autocorrelación espacial. En comparación de estos dos años la mayoría de los criterios presentan
una significancia espacial representando una estructura de dependencia espacial, que por medio del
AIC ayudó a seleccionar el modelo que mejor se puede ajustar entre los presentes.
Tabla 11: Criterios de Selección de matriz W 2007-2011
Año 2007 2011
Criterio I AIC P-Value Z(I) I AIC P-Value Z(I)
Reina 1 0.27880 -21.39042 0.00540 2.54940 0.44060 27.04215 0.00000 4.57660
Reina 2 -0.17864 -30.96391 0.89100 -1.23180 -0.08255 46.25698 0.62710 -0.32414
Reina 3 -0.22777 -22.19183 0.92980 -1.47390 -0.24719 50.24488 0.97650 -1.98700
Torre 1 0.32624 -25.59996 0.00260 2.79480 0.44397 26.77713 0.00000 4.42390
Torre 2 -0.16697 -26.22880 0.87000 -1.12660 -0.06558 47.72394 0.54860 -0.12221
Torre 3 -0.27849 -27.67299 0.96980 -1.87780 -0.25053 32.77030 0.97690 -1.99310
T Delaunay 0.17208 -25.77020 0.02146 2.02440 0.18670 40.84246 0.00444 2.61630
Gabriel 0.26311 -30.61870 0.02354 1.98560 0.31260 48.28290 0.00270 2.78260
Esfera 0.25274 -32.26255 0.02388 1.97940 0.24342 46.56960 0.01008 2.32340
V. Relativos 0.38018 -23.60847 0.00963 2.34050 0.37045 41.89231 0.00275 2.77570
Kn1 0.02959 -29.08310 0.37550 0.31719 0.62618 13.29168 0.00107 3.06990
Kn2 0.25664 -26.73178 0.03257 1.84420 0.32646 44.89737 0.00328 2.71880
Kn4 0.23187 -26.39639 0.00466 2.59990 0.21398 28.19812 0.00178 2.91500
Fuente: Elaboración Propia, Software R
El menor AIC en el año 2014 lo posee el criterio Kn-Vecinos cercanos con Kn=4, siendo un valor
de 19.85068, se observa que la variable endógena para este año el estadístico I de Moran es
significativo y su P-valor es menor al 5% siendo esto la presencia de autocorrelación espacial.
Finalmente, para el año 2016 el criterio que se escogido es el criterio Reina siendo este de primer
orden, con un AIC de -3.94524 siendo este el menor AIC, además también este criterio presenta
significancia en el estadístico de I de Moran, con un P-valor menor al 5% siendo este un valor de
1% aproximadamente.
En la figura 13 se puede observar las relaciones de los polígonos en base a los criterios escogidos
anteriormente para cada año de estudio, para el año 2007 el criterio de Esfera de Influencia,
obteniendo en este 3,79 links en promedio (relaciones entre los polígonos), mientras que para el
año 2011 el criterio de K-Vecinos más cercanos de orden 1 nos muestra un promedio de 1 vecinos
; en el año 2014 con el de K-Vecinos más cercanos de orden 4 nos muestra un promedio de 4
vecinos para este tipo de relación, finalmente en el año 2016 para el criterio Reina de primer orden
nos muestra un promedio de 4.42 vecinos, así se puede concluir que el criterio que más vecinos
56
tiene en cuanto a su relación es el del año 2016 con un 23% de probabilidad de que no se encuentre
relaciones de contigüidad.
Tabla 12: Criterios de Selección de matriz W 2014-2016
Año 2014 2016
Criterio I AIC P-Value Z(I) I AIC P-Value Z(I)
Reina 1 0.48258 30.20841 0.00006 3.84610 0.54154 -3.94524 0.00001 4.28930
Reina 2 -0.03606 48.53600 0.42730 0.18329 -0.09610 1.53690 0.64910 -0.38296
Reina 3 -0.38232 51.95832 0.99560 -2.62040 -0.30169 31.05069 0.97640 -1.98390
Torre 1 0.55093 21.96027 0.00002 4.16120 0.59348 -2.78953 0.00000 4.47580
Torre 2 -0.05605 56.71255 0.50190 -0.00467 -0.09186 13.07447 0.63540 -0.34610
Torre 3 -0.38935 41.80171 0.99580 -2.63320 -0.31575 11.25306 0.98040 -2.06310
T Delaunay 0.44259 40.01469 0.00002 4.14830 0.41802 11.85773 0.00004 3.96410
Gabriel 0.57662 33.49146 0.00011 3.68950 0.49361 7.31179 0.00064 3.22150
Esfera 0.52418 38.38742 0.00024 3.48850 0.44956 5.86399 0.00113 3.05500
V. Relativos 0.53226 28.94972 0.00155 2.95730 0.53385 10.72700 0.00144 2.98050
Kn1 0.39432 34.70496 0.05806 1.57120 0.48951 18.93050 0.02785 1.91340
Kn2 0.44247 38.69348 0.00289 2.76050 0.41128 7.93930 0.00465 2.60060
Kn4 0.42679 19.85068 0.00002 4.10250 0.43498 11.95112 0.00001 4.19250
Fuente: Elaboración Propia, Software R
Figura 13: Gráficos, criterios seleccionados por año
Fuente: Elaboración Propia, Software R
57
Con el fin de encontrar estructuras de autocorrelación espacial en la variable con la matriz de
contigüidad seleccionada, se analizan los correlogramas para cada año (Figura 14) para así
identificar la asociación espacial que tiene la variable rezagada de estudio NivRiesgo consigo
misma, mostrando la correlación entre parejas de observaciones espaciales cuando se aumenta la
distancia o el rezago entre ellas.
Figura 14: Correlogramas de la variable respuesta.
Fuente: Elaboración Propia, Software R
En estos gráficos se encuentra que para el año 2007 los rezagos de primer orden son significativos,
pero en el resto de órdenes no se presenta evidencia estadística para afirmar la falta de significancia;
para el año 2011 también se observa que los rezagos de primer orden son significativos, mientras
que para el año 2014 se encuentra que los rezagos de orden 1 y de orden 3 son significativos.
Finalmente, para el año 2016 como en los dos primeros años de estudio se encuentra que los rezagos
son significativos a este nivel. Adicional a esto se analizan los correlogramas observando el tipo
de relación espacial que se pueda encontrar en los diferentes órdenes (Figura 15), inicialmente se
debería analizar solo el orden en que se encuentra significancia en sus rezagos, esto quiere decir
que para todos los años que presentan significancia de esta en el primer orden se denotaría que se
presenta una autocorrelación espacial positiva, esto quiere decir que los valores altos o bajos de la
58
variable de estudio tienden a estar agrupadas en el espacio, en cuanto a los demás órdenes de los
años después del primer orden se encontraría una autocorrelación espacial negativa, incluyendo
para el año 2014, que el 3 orden en los rezagos dio significativo, para este caso presentaría una
autocorrelación espacial negativa.
Figura 15: Análisis de autocorrelación espacial de la variable respuesta.
Fuente: Elaboración Propia, Software R
5.1.2. Análisis Exploratorio Global
Una vez seleccionada la matriz de pesos espaciales para cada año se procede a analizar la
dependencia espacial de cada variable tanto explicativas como respuesta en la región, por medio
de los contrastes Globales de I de Moran, G de Getis y Ord y C de Geary con el fin de establecer
la presencia de un efecto irradiado de las variables identificando las relaciones espaciales que se
puedan presentar de forma global. Los test fueron evaluados con una probabilidad asociada a un
intervalo de confianza del 95%, permitiendo además determinar si la variable respuesta se ha
relacionado con las regiones vecinas, presentando su mismo comportamiento.
59
En la tabla 13 se encuentran los valores obtenidos para cada test del año 2007 realizado con la
matriz de pesos espaciales del criterio gráfico de Esfera de Influencia. Se evidencia que la variable
Endógena y la mayoría de las variables explicativas presentan evidencia de autocorrelación
espacial positiva siendo esta la predominancia de concentración de valores similares en regiones
“vecinas”, las cuales poseen un P-valor menor al 0.05, evidenciándolas en la presente tabla con
color rojo, cuando se aplica el I de Moran, las variables como PO_NDEE, PO_NDRB, PODM
presentan evidencia de una posible ausencia de asociación espacial. Sin embargo, en el test de G
de Getis y Ord se evidencian variables no significativas que para el test de Moran lo son, siendo
las variables de PO_NDEE, PO_NDRB, PODM, PPH, AL_PH y TEMP las cuales evidenciarían
una presencia de aleatoriedad espacial, para las demás variables se rechaza la hipótesis nula y se
concluye que existe una asociación espacial.
Tabla 13: Contrastes globales de variabilidad respuestas y explicativo año 2007
Test I de Moran C de Geary G de Getis y Ord
Variable I P - Valor Z(I) C P - Valor Z(I) G P - Valor Z(I)
NivRiesgo 0.2527 0.0239 1.9794 0.6148 0.0178 2.1014 0.0579 0.2633 0.6333
PO_NDEE -0.0968 0.6090 -0.2768 1.0267 0.5566 0.1424 0.0510 0.5772 -0.1948
PO_NDGN 0.5439 0.0002 3.5718 0.4500 0.0008 -3.1389 0.0698 0.0070 2.4598
PO_NDA 0.3419 0.0080 2.4074 0.5980 0.0116 -2.2692 0.0735 0.0441 1.7047
PO_NDAL 0.1683 0.0239 1.9787 1.0010 0.5019 0.0046 0.1048 0.0170 2.1194
PO_NDRB -0.1565 0.7692 -0.7363 1.1906 0.8371 0.9826 0.0418 0.7200 -0.5829
PAH_PL 0.3035 0.0123 2.2480 0.7235 0.0630 -1.5299 0.0722 0.0132 2.2210
PO_DET 0.4403 0.0020 2.8715 0.5279 0.0030 -2.7492 0.0569 0.0764 1.4299
PODM -0.0446 0.4718 0.0706 1.0067 0.5146 0.0366 0.0536 0.8279 -0.9458
PODCP 0.3999 0.0034 2.7073 0.5608 0.0060 -2.5103 0.0715 0.0088 2.3728
PPH 0.5292 0.0002 3.5068 0.4713 0.0013 -3.0038 0.0556 0.4597 0.1013
AL_PH 0.2396 0.0088 2.3859 0.4628 0.0037 -2.6823 0.0696 0.1382 1.0884
TEMP 0.4442 0.0022 2.8462 0.5280 0.0027 -2.7842 0.0561 0.2177 0.7801
PRECP 0.4727 0.0005 3.2773 0.4969 0.0026 -2.7986 0.0590 0.0756 1.4352
Fuente: Elaboración Propia, Software R
Para el año 2011 (Tabla 14) cuyo criterio de contigüidad es K-Vecinos más cercanos con Kn=1,
las variables como PO_NDEE, PO_NDA, PO_NDRB, PAH_PL, PODM y PRECP son las que
indican una ausencia de asociación espacial, el resto de las variables presentes en el estudio
presentan autocorrelación espacial positiva en el espacio según el I de Moran, para el estadístico
de G de Getis y Ord se evidencia que la mayoría de las variables no presentan autocorrelación
espacial, que solo las variables como NivRiesgo, PO_NDGN, PO_NDAL y PODCP presentan una
asociación espacial.
60
Tabla 14: Contrastes globales de variabilidad respuestas y explicativo año 2011
Test I de Moran C de Geary G de Getis y Ord
Variable I P - Valor Z(I) C P - Valor Z(I) G P - Valor Z(I)
NivRiesgo 0.6262 0.0011 3.0699 0.9575 0.4535 -0.1167 0.1229 0.0000 3.9453
PO_NDEE -0.1227 0.6052 -0.2668 0.7967 0.2761 -0.5944 0.0070 0.8531 -1.0500
PO_NDGN 0.6586 0.0068 2.4697 0.5409 0.0678 -1.4925 0.1086 0.0009 3.1096
PO_NDA -0.0320 0.4658 0.0859 0.6650 0.1496 -1.0381 0.0323 0.7528 -0.6834
PO_NDAL 0.1418 0.0319 1.8537 0.8139 0.3278 -0.4460 0.2577 0.0242 1.9736
PO_NDRB -0.1401 0.6452 -0.3723 1.0750 0.5824 -0.2081 0.0073 0.6801 -0.4680
PAH_PL 0.0858 0.3039 0.5133 0.9031 0.3815 -0.3016 0.0597 0.3786 0.3091
PO_DET 0.6432 0.0092 2.3583 0.2444 0.0059 -2.5185 0.0558 0.4564 0.1095
PODM 0.0035 0.4128 0.2204 0.8650 0.3403 -0.4116 0.0493 0.9494 -1.6388
PODCP 0.5833 0.0138 2.2043 0.2619 0.0081 -2.4050 0.0725 0.0801 1.4045
PPH 0.4028 0.0559 1.5900 0.5331 0.0651 -1.5134 0.0561 0.3817 0.3011
AL_PH 0.3314 0.0356 1.8043 0.5807 0.1278 -1.1367 0.0787 0.1545 1.0175
TEMP 0.6082 0.0106 2.3059 0.3889 0.0240 -1.9780 0.0559 0.3714 0.3282
PRECP 0.1851 0.2067 0.8181 0.6144 0.1010 1.2759 0.0572 0.2612 0.6397
Fuente: Elaboración Propia, Software R
En el año 2014 (Tabla 15) cuyo criterio de contigüidad es K-Vecinos más cercanos con Kn=4, las
variables como PO_NDRB, PODM, TEMP Y PRECP son las únicas variables que no presentan
un esquema de autocorrelación espacial con el I de Moran, con P-valor menor al 0.05, pero se
observa que, el resto de las variables para este test presentan una autocorrelación espacial positiva
y un estadístico significativo, que corresponden a una concentración de valores similares en las
localidades. Sin embargo, para el test de G de Getis y Ord solamente las variables como NivRiesgo,
PO_NDGN, PO_DET y POCDCP aún siguen presentando la asociación espacial como se observó
en el test de Moran y el test de Geary; que para el resto de las variables se observa una aleatoriedad
espacial, siendo este año, comparado con los anteriores el que menor variables significativas
presenta en el estudio.
Finalmente, en la tabla 16 relacionada al año 2016 se observa que las variables PO_NDEE, PODM,
AL_PH, TEMP y PRECP no son significativas para el estadístico de Moran y de Geary, las demás
variables presentan una asociación espacial significativa y positiva. Para el test de Getis y Ord se
observa que la mayoría de las variables ahora no presentan asociación espacial, como lo son
PO_NDEE, PODM, PPH, AL_PH, TEMP y PRECP; por otra parte, se observa que, en todos los
años, la variable respuesta sigue una distribución de asociación espacial, concluyendo que los
valores de esta, en una localidad, especifica no depende solo de sí misma sino también de las
ocurrencias en regiones vecinas.
61
Tabla 15: Contrastes globales de variabilidad respuestas y explicativo año 2014
Test I de Moran C de Geary G de Getis y Ord
Variable I P - Valor Z(I) C P - Valor Z(I) G P - Valor Z(I)
NivRiesgo 0.4268 0.0000 4.1025 0.5168 0.0006 -3.2582 0.0666 0.0030 2.7523
PO_NDEE 0.1012 0.0455 1.6904 0.7380 0.1069 -1.2430 0.0859 0.1727 0.9435
PO_NDGN 0.4253 0.0000 4.0677 0.6153 0.0042 -2.6340 0.1045 0.0001 3.7502
PO_NDA 0.2702 0.0027 2.7878 0.6543 0.0109 -2.2934 0.0546 0.6206 -0.3070
PO_NDAL 0.0751 0.0306 1.8725 0.5820 0.0446 -1.6995 0.0575 0.4744 0.0643
PO_NDRB -0.0249 0.3699 0.3321 0.6700 0.0596 -1.5583 0.0155 0.7863 -0.7937
PAH_PL 0.3290 0.0005 3.2877 0.6199 0.0057 -2.5288 0.0636 0.1363 1.0972
PO_DET 0.3644 0.0003 3.4638 0.5049 0.0001 -3.6670 0.0576 0.0750 1.4395
PODM -0.0648 0.5334 -0.0837 1.2064 0.8871 1.2113 0.0567 0.3114 0.4920
PODCP 0.3410 0.0004 3.3340 0.5176 0.0004 -3.3612 0.0704 0.0103 2.3162
PPH 0.3184 0.0009 3.1245 0.5119 0.0003 -3.4663 0.0533 0.9595 -1.7445
AL_PH 0.1074 0.0344 1.8200 0.5938 0.0304 -1.8744 0.0510 0.6588 -0.4093
TEMP -0.1296 0.7277 -0.6059 1.0746 0.7153 0.5690 0.0552 0.7873 -0.7971
PRECP 0.0626 0.1627 0.9836 0.8682 0.1717 -0.9476 0.0550 0.6567 -0.4036
Fuente: Elaboración Propia, Software R
Tabla 16: Contrastes globales de variabilidad respuestas y explicativo año 2016
Test I de Moran C de Geary G de Getis y Ord
Variable I P - Valor Z(I) C P - Valor Z(I) G P - Valor Z(I)
NivRiesgo 0.5415 0.0000 4.2893 0.4838 0.0003 -3.4330 0.0657 0.0010 3.0901
PO_NDEE 0.0002 0.3283 0.4447 0.9282 0.3275 -0.4468 0.0747 0.1682 0.9613
PO_NDGN 0.5651 0.0000 4.4175 0.3370 0.0000 -4.4402 0.1072 0.0001 3.7332
PO_NDA 0.2976 0.0044 2.6162 0.7326 0.0410 -1.7392 0.0932 0.0048 2.5913
PO_NDAL 0.1581 0.0125 2.2411 0.8310 0.1712 -0.9495 0.0888 0.0179 2.1001
PO_NDRB 0.2263 0.0058 2.5231 0.7176 0.0477 -1.6674 0.1645 0.0079 2.4151
PAH_PL 0.1979 0.0347 1.8156 0.7159 0.0292 -1.8935 0.0655 0.0725 1.4572
PO_DET 0.5705 0.0000 4.3376 0.4261 0.0000 -3.9290 0.0574 0.0381 1.7731
PODM -0.1377 0.7347 -0.6271 1.0547 0.6365 0.3491 0.0555 0.5120 -0.0302
PODCP 0.5508 0.0000 4.2813 0.4422 0.0001 -3.7593 0.0756 0.0002 3.4863
PPH 0.4187 0.0005 3.3156 0.5123 0.0005 -3.3134 0.0559 0.3880 0.2847
AL_PH -0.0535 0.4922 0.0195 1.0316 0.5724 0.1826 0.0621 0.2744 0.5996
TEMP 0.0207 0.2999 0.5246 0.9413 0.3429 -0.4047 0.0558 0.1400 1.0803
PRECP 0.0091 0.3249 0.4541 0.9237 0.3027 -0.5167 0.0539 0.7834 -0.7838
Fuente: Elaboración Propia, Software R
62
5.1.3. Análisis Exploratorio Local
Se procede a determinar la existencia de estructuras de dependencia espacial local de la variable
endógena mediante mapas LISA para los periodos de estudio, en este se puede identificar las
regiones con valores significativos a partir de estadísticos de autocorrelación espacial local con el
test I de Moran, con el fin de determinar la ubicación de las conglomeraciones espaciales
destacando los hot spots (puntos calientes) y atípicos en la zona.
Figura 16: Mapa Clúster espacial LISA
2007 2011
2014 2016
Fuente: Elaboración Propia, Software R
63
En la figura 16 se muestran los Clusters espaciales LISA para cada uno de los años de estudio, en
el año 2007 se muestra valores altos rodeados de altos para la localidad de Candelaria y Chapinero.
Para el año 2011 se puede observar que se encuentran valores de altos rodeados de altos al igual
que en el 2007, representando los puntos calientes en las localidades de Candelaria, Los Mártires
y Santafé, adicional a esto se encuentra la atipicidad de que hay valores bajos rodeados de altos
para la localidad de San Cristóbal, mientras que para el año 2014 se visualiza una localidad que
representa valores de altos rodeados de altos, asignado a la Candelaria, adicional a esta se encuentra
que la localidad de Santafé presenta una atipicidad de valores altos rodeados de bajos; finalmente
en el año 2016 solo se encuentran hots spots para la localidad de Santafé y Candelaria.
Figura 17: Mapa Significancia LISA
2007 2011
2014 2016
Fuente: Elaboración Propia, Software R
64
Los mapas de significancia se utilizan para señalar la forma en que las variables están distribuidas
en la región de estudio y sus posibles aglomeraciones, mostrando probabilidades de las relaciones
de contigüidad que se puedan generar de manera aleatoria. En el mapa de significancia LISA del
año 2007 se encuentra que con un P-valor del 0.01% es significativa la localidad de Santafé, y que
al 1% es significativa la localidad de Chapinero; en el año 2011 se observa que las localidades de
Santafé, Candelaria y Los Mártires presentan una significancia del 0.01% y la localidad de San
Cristóbal presenta significancia al 5%. Para el año 2014 se encuentra que la localidad de Santafé
es significativa al 5% y la localidad de Candelaria al 1%; finalmente, en el año 2016 se observa un
P-valor al 5% en la localidad de Candelaria seguido de la localidad de Santafé que presenta una
significancia del 0.01%.
También se analizaron los mapas de autocorrelación espacial local de G de Getis y Ord siendo su
hipótesis nula la ausencia de asociación espacial alrededor de la región i, estos solo muestran la
presencia de clúster espaciales. En la figura 18 se observan los clusters espaciales obtenidos.
Figura 18: Mapa Cluster Local (Getis)
2007 2011
2014 2016
Fuente: Elaboración Propia, Software R
65
Para el año 2007 se puede observar que se encuentra un hot spot referenciado a la localidad de
Chapinero y Candelaria en donde hay valores altos rodeados de altos; para el año 2011 solo se
encuentran puntos calientes (hot spot) que se ubican en las localidades de Los Mártires, Candelaria,
Santafé y San Cristóbal. En el año 2014 y a diferencia de los anteriores resultados se observa que
la localidad de Engativá, Candelaria y San Cristóbal presentan valores significantes de altos
rodeados de altos; finalmente, para el año 2016 se observa una significancia de valores altos
rodeados de altos para la localidad de Santafé y Los Mártires.
En el mapa de significancia de Getis y Ord (figura 19), en el año 2007 se puede observar que la
localidad de Chapinero se presenta una significancia del 1%, y la localidad de Candelaria un 5%;
para el año 2011 siendo este el que presenta mayores localidades significativas, manifestándose
una significancia del 5% para la localidad de Candelaria, un 1% para las localidades de Los
Mártires y San Cristóbal, y para la localidad de Santafé 0.01%. En el año 2014 se observa que las
localidades de Engativá, Candelaria y San Cristóbal presentan P-valor del 5%. Finalmente, en el
2016 se encuentra la localidad de Santafé con una significancia del 0.1% y Los Mártires del 5%.
Figura 19: Mapa Significancia Local (Getis)
2007 2011
2014 2016
Fuente: Elaboración Propia, Software R
66
5.1.4. Análisis Bivariado
El propósito de esta sección es encontrar las variables independientes que presenten estructuras de
autocorrelación espacial con la variable endógena, con el fin de desarrollar modelos que describan
el comportamiento del riesgo por inundación presente en las localidades de estudio. Este análisis
bivariado se realiza a partir de la función I de Moran Bivariado, el cual permite determinar que
tanto se ve afectado el comportamiento de la variable dependiente con respecto a los valores de las
variables explicativas. En este análisis se puede realizar por medio del Software GeoDa e
igualmente en R. Para el estudio se realizó con Geoda y se verificó este en R. Se aclara que para el
año 2007 el criterio que mejor se ajustó a este fue Esfera de influencia y no se encuentra relacionado
a las matrices de contigüidad que maneja GeoDa.
En la tabla 17 se visualizan los resultados del análisis para los años 2007 y 2011; en el año 2007 se
pueden visualizar que las variables como PO_NDEE, PO_NDGN, PO_NDAL, PO_NDRB,
PAH_PL, PODCP_PPH, TEMP y PRECP poseen un P-valor que confirma la asociación espacial
con la variable endógena, en donde algunas de estas manifiestan presencia de autocorrelación
espacial positiva; mientras que para el año 2011 las variables que poseen un P-valor que sean
menores o cercanos al 5% se consideran que poseen un esquema de autocorrelación espacial con
respecto a la variable dependiente, siendo estas PO_NDGN, PAH_PL, PODM y PRECP como se
puede observar en la presente tabla, siendo estas variables señaladas con color rojo.
Tabla 17: Moran Bivariado 2007 – 2011
Año 2007 2011
Variable I P - Valor Z(I) I P - Valor Z(I)
PO_NDEE 0.1878 0.067 0.3051 -0.1076 0.376 -0.4996
PO_NDGN 0.4819 0.004 0.6141 0.5039 0.021 2.2823
PO_NDA 0.0768 0.237 0.0766 0.0307 0.334 0.1369
PO_NDAL -0.2806 0.009 -0.6346 -0.0869 0.391 -0.3846
PO_NDRB -0.2042 0.051 -0.5748 -0.0618 0.506 -0.2764
PAH_PL -0.1685 0.081 -0.5458 -0.3366 0.035 -1.4978
PO_DET 0.1425 0.123 0.2303 -0.1681 0.265 -0.7476
PODM -0.0854 0.249 -0.4824 -0.2971 0.07 -1.3685
PODCP 0.2146 0.035 0.3433 -0.1162 0.339 -0.5138
PPH -0.4532 0.006 -0.7557 -0.211 0.139 -0.9631
AL_PH 0.0214 0.33 -0.2335 -0.1064 0.381 -0.4326
TEMP 0.2875 0.017 0.4326 -0.1318 0.356 -0.5204
PRECP 0.389 0.01 0.5346 0.2134 0.185 0.9530
Fuente: Elaboración Propia, Software GeoDa y R.
67
En la tabla 18 se observan los resultados para los otros dos años (2014-2016). Se considera
igualmente que un P-valor menor al 5% o cercanos a este poseen un esquema de autocorrelación
espacial con respecto a la variable dependiente, siendo estas para el año 2014 PO_NDGN,
PO_NDA, PAH_PL, PODM, PPH y PRECP; que para el año 2016 las variables que cumplen con
esta condición son PO_NDEE, PO_NDGN, PO_NDA, PAH_PL, PODM, PPH, AL_PH y TEMP.
Tabla 18: Moran Bivariado 2014 – 2016
Año 2014 2016
Variable I P - Valor Z(I) I P - Valor Z(I)
PO_NDEE 0.0835 0.207 0.7569 0.2247 0.021 2.0260
PO_NDGN 0.4549 0.001 4.5082 0.4528 0.002 3.8169
PO_NDA 0.146 0.072 1.4734 0.3397 0.008 3.2661
PO_NDAL -0.0592 0.246 -0.6967 -0.135 0.116 -1.1681
PO_NDRB -0.0276 0.384 -0.3676 -0.0634 0.302 -0.5488
PAH_PL -0.2612 0.002 -2.7594 -0.254 0.015 -2.2726
PO_DET 0.0436 0.258 0.6802 -0.0205 0.429 -0.1330
PODM -0.1966 0.03 -2.1043 -0.1476 0.074 -1.4251
PODCP 0.0844 0.141 1.1318 0.0163 0.389 0.2050
PPH -0.2869 0.005 -2.9057 -0.3552 0.002 -3.0413
AL_PH 0.0727 0.205 0.6987 0.149 0.079 1.4355
TEMP 0.02 0.412 0.2329 -0.149 0.103 -1.2980
PRECP 0.2009 0.037 2.1070 -0.064 0.32 -0.4751
Fuente: Elaboración Propia, Software GeoDa y R.
Por último, se analizaron los correlogramas bivariados de la variable dependiente con las variables
independientes que presentan autocorrelación espacial según los resultados obtenidos en el I de
Moran Bivariado, éstos se encuentran en los anexos de la sección A, con el fin de encontrar rezagos
de órdenes superiores que sean significativos. En esta sección solo se evalúa el tipo de significancia
si es negativa o positiva, ya que no se tiene certeza si los órdenes superiores son o no significativos;
aunque, para los primeros ordenes de estas variables se encontró significancia como se observó
anteriormente. Para el año 2007, se observó los órdenes superiores los cuales para la PO_NDEE
presenta para el 1 y el 4 orden una posible significancia positiva, PO_NDGN se encontró que para
el 2 y 4 orden una posible significancia negativa, PO_NDAL se encontró para el orden 2 y 3 una
posible significancia positiva al igual que para el PO_NDRB y PAH_PL; para el PODCP se
encontró solo para el primer orden una significancia positiva, para el PPH se encontró que para el
orden 2 y 4 una posible significancia positivas, para la TEMP se encontró para el primer orden una
significancia positiva y finalmente para la variable PRECP se encontró que para órdenes 3 y 4 una
posible significancia positiva. Para el año 2011 la variable PO_NDGN se encontró para los 2
primeros ordenes una posible significancia positiva al igual que en la PRECP, y en la variable
PAH_PL se encontró para los 2 primeros ordenes una posible significancia negativa, al igual que
en el PODM.
68
Para el año 2014 en las variables significativas se observó que, para PO_NDGN el 4 orden una
posible significancia negativo, para el PO_NDA se encontró en el 3 orden una posible significancia
negativo, para PAH_PL de 2 orden una posible significancia positivo, en la variable PODM en los
órdenes 2 y 3 una posible significancia positiva, en la variable PPH para el orden 2 y 4 una posible
significancia positiva y en la variable precipitación en el orden 2 y 4 una posible significancia
siendo el de orden dos positiva. Finalmente, para el año 2016 en las variables significativas se
observó el siguiente comportamiento para los órdenes superiores, PO_NDEE en sus órdenes 1 y 2
una posible significancia positiva al igual que en la variable PO_NDGN, en la variable PO_NDA
se encontró que en el orden 2 y 3una posible significancia negativa, el resto de ordenes positiva,
en la variable PAH_PL se observó que en sus órdenes 2,3 y 4 una posible significancia siendo estas
positivas, para la variable PODM todos sus órdenes son posiblemente significativos, pero para el
orden 3 y 4 una posible significancia positiva, en PPH se observa para el orden 2 y 3 una posible
significancia negativa, en AL_PH se encontró una posible significancia en sus órdenes siendo para
el orden 1 y 3 positiva y para la variable TEMP se encontró una posible significancia en sus órdenes
siendo para el orden 3 el único que es positivo.
5.2. Análisis Confirmatorio de los Datos
Después de haber realizado el análisis exploratorio de los datos espaciales (AEDE) de la variable
respuesta (NivRiesgo) se comprobó que esta enseña un esquema significativo de dependencia
espacial en cada uno de los años analizados. Sin embargo, este no permite en primer lugar
identificar las razones que expliquen el fenómeno, y en segundo, determinar la estructura de esta
dependencia (Moreno & Vayá, 2002). Inicialmente, se trabajó bajo el supuesto de que el riesgo es
el producto de 3 factores generales (Ecuación 1), por eso al ver el análisis de los datos, se observa
que, para cada año se encuentran variables que representan estos factores; para el factor de
vulnerabilidad se encuentra PO_NDGN, PO_NDA, PO_NDRB y PAH_PL; para el factor de costos
se encuentran variables como PO_DET,PODM, PODCP, PPH, AL_PH y finalmente para el factor
de tipo peligro se encuentra PRECP y TEMP. Estas demostraron estar relacionadas en el espacio
con la variable independiente y por ello se consideran para el modelamiento espacial, pues
informan de problemas de dependencia espacial en una ecuación.
Se debe realizar en primera instancia una modelación regresiva clásica para tener una primicia de
las posibles variables que son significativas en la explicación de la variable endógena, este tipo de
modelamiento no implica relaciones espaciales, pues se debe verificar primero la relación que hay
en ellas para poder, enseguida, realizar el modelamiento de una regresión espacial, en donde ya se
incorporan las variables significativas del resultado de la modelación clásica y las variables de
asociación espacial que no fueron incluidas en este, que por medio del análisis bivariado se obtuvo
indicio de una relación espacial que puede llegar a ser significativa; y así obtener un modelo más
completo, que se ajuste en forma y espacialmente al fenómeno a explicar (NivRiesgo).
5.2.1. Modelo Regresivo Clásico
En primer lugar, se aborda el modelo clásico de regresión lineal sin efectos espaciales, estimados
por mínimos cuadrados ordinarios (MCO), siendo este el punto de partida previo para abordar los
69
modelos espaciales. El propósito de este análisis es encontrar relación entre una variable
dependiente y un conjunto de variables independientes, que si se estiman por MCO es capaz de
modelar los valores de predicción y los observados con un buen ajuste bajo criterios de hipótesis
básicos (Yrigoyen, 2003). Las variables exógenas que se ajusten y den buen resultado después del
análisis de la regresión clásica y a sus supuestos pueden convertirse en variables candidatas para
un modelo espacial, adicionales a las identificadas en el AEDE (Bohórquez & Ceballos, 2008).
Para cada año las variables independientes identificadas fueron incluidas en una regresión clásicas
estimada por MCO. Se aplicó el método de stepwise hacia adelante o introducción progresiva,
siendo este un modelo en el que se comienza sin ninguna variable regresoras y en cada etapa se
introduce la más significativa hasta encontrar el mejor ajuste de estas; y el método hacia atrás o
eliminación progresiva, es donde el modelo de regresión parte con todas las variables regresoras y
en cada etapa se elimina la variable menos influyente según el contraste individual hasta encontrar
el mejor ajuste de estas; este proceso se usó para todos los años con un nivel de significancia de P-
valor < 0.05, y con el criterio de Akaike (AIC) como un test parcial para determinar que variables
explicativas deben permanecer en el modelo final. Posterior al método stepwise se incluyeron las
variables que guardan correlación espacial con el NivRiesgo y se probó que tan significativo era
su aporte al modelo de regresión clásico.
Para el año 2007 la regresión stepwise se realizó en ambos métodos (hacia adelante y hacia atrás)
teniendo como criterio el P-valor y el AIC que mostraron las mismas variables significativas para
el estudio; las variables del mejor modelo de regresión encontrado se observan en la tabla 19, en
donde según éste, el NivRiesgo puede explicarse un 69% por: el porcentaje de hogares que no
disponen del servicio de energía eléctrica (PO_NDEE), porcentaje de hogares que disponen de
electrodomésticos (PO_DET), el porcentaje de hogares que disponen de motocicletas (PODM), el
número de personas por hogar (PPH) y la temperatura media anual del año en gestión (TEMP), si
bien como se observa no todas las variables son significativas a un P-valor < 0.05, pero todas
aportan al modelo que podría explicar la variable NivRiesgo, siendo su combinación la que
presenta el R – Cuadrado más alto de todas las posibles combinaciones.
Tabla 19: Estimación modelo de regresión Clásico (Año 2007)
Variables Estimado P-Valor
Intercepto 79.2879 0.0010
PO_NDEE -12.4963 0.0786
PO_DET -0.3418 0.0018
PODM -0.5791 0.0719
PPH -8.7150 0.0008
TEMP -1.2858 0.0946
R - Cuadrado 0.693
R - Cuadrado ajustado 0.575
AIC 101.78
Fuente: Elaboración Propia, Software R
70
Aunque el AEDE identifico variables como PO_NDA, PO_NDGN, PO_NDAL entre otras que
previamente se mencionaron, como variables relacionadas espacialmente con el NivRiesgo, éstas
no fueron significativas en la elección por stepwise. Sin embargo, algunas de estas fueron
incorporadas en el presente modelo y las que no se incorporarán en los modelos espaciales, donde
se determinara si son o no significativas para el mismo, la ecuación 28 representa el modelo
regresivo lineal clásico para el año 2007, en donde los 𝛽𝑘 aluden a los valores estimados para cada
variable de la tabla 19.
𝑁𝑖𝑣𝑅𝑖𝑒𝑠𝑔𝑜2007 = 𝛽0 + 𝛽1𝑃𝑂_𝑁𝐷𝐸𝐸 + 𝛽2𝑃𝑂_𝐷𝐸𝑇 + 𝛽3 𝑃𝑂𝐷𝑀 + 𝛽4𝑃𝑃𝐻 + 𝛽5𝑇𝐸𝑀𝑃 (28)
Se efectuaron pruebas diagnósticas formales para el modelo clásico del 2007, en la tabla 20 se
observan los supuestos del modelo regresivo con su respectiva prueba y resultados de las mismas.
El supuesto de heteroscedasticidad, propone que la varianza no es la misma para las variables del
modelo, se verificó esto a través del test Breush-Pagan cuya hipótesis nula 𝐻0 sostiene que la
varianza no depende de los regresores auxiliares, es decir, la existencia de homocedasticidad.
Debido a que el P-valor para este test es mayor al nivel de significancia (p < 0.05) no hay evidencia
suficiente para rechazar la hipótesis nula, por ende, el modelo es homoscedastico. De la misma
manera no se rechaza la hipótesis nula del test Shapiro-Wilk realizada a los residuos, está nos indica
que los datos siguen una distribución normal; para tener mayor certeza en los residuos se aplicó el
test Jarque-Bera de normalidad confirmándonos que estos siguen una distribución normal. Para el
test Reset y Rainbow los cuales aluden a una buena especificación del modelo y la linealidad del
mismo respectivamente, se encuentra que el modelo no está bien especificado por su nivel de
significancia lo cual hace que se rechace la hipótesis, pero en cuanto a su linealidad no presenta
problema alguno (Kramer & Sonnberger, 2014).
Tabla 20: Supuestos modelo regresión clásico (Año 2007)
Supuesto Test Contraste P-Valor
Heteroscedasticidad Breush-Pagan 10.3090 0.0670
Normalidad Shapiro Wilk 0.9897 0.9981
Jarque-Bera 0.1602 0.9230
Especificación Reset 11.0020 0.0024
Linealidad Rainbow 2.7803 0.2165
Autocorrelación I-Moran 1.1901 0.117
Fuente: Elaboración Propia, Software R
Para verificar el supuesto de multicolinealidad, la cual describe la dependencia lineal entre las
variables predictoras; puede ser determinada mediante el cálculo del Factor de Inflación de
Varianza (VIF) (Vega & Guzmán, 2011), siendo este un indicador de multicolinealidad específica
de cada variables predictora del modelo, siendo como regla general, si el 𝑉𝐼𝐹 ≥ 10 entonces existe
multicolinealidad, si el 𝑉𝐼𝐹 ≥ 4 se justifica una investigación adicional. En la tabla 20 se observan
los VIF para cada variable, ninguno de las variables superó el umbral que justifica investigación
71
adicional (4), ni tampoco el supuesto de multicolinealidad. El NivRiesgo para este año es explicado
por los factores de vulnerabilidad, costo y amenaza.
Tabla 21: Supuestos VIF de Multicolinealidad (Año 2007)
Variable VIF
PO_NDEE 1.1763
PO_DET 2.5899
PODM 1.0693
PPH 1.7643
TEMP 2.5373
Fuente: Elaboración Propia, Software R
Para el año 2011, es el que menor cantidad de variables exógenas incorporadas al modelo regresivo
lineal, la regresión stepwise se realizó en ambos sentidos (hacia adelante y hacia atrás) teniendo
como criterio el AIC que mostró más variables significativas que el criterio de P-valor; las variables
del mejor modelo de regresión encontrado se observan en la tabla 22, en donde según éste, el
NivRiesgo puede explicarse un 83% por: el porcentaje de hogares que no disponen del servicio de
gas natural (PO_NDGN), el porcentaje de hogares que dispone de electrodomésticos (PO_DET) y
de la precipitación media anual para el año de estudio, si bien como se observa todas las variables
son significativas a un P < 0.05, pero aún faltan incluir algunas variables que posiblemente aportan
al modelo, siendo su combinación la que presenta el R – Cuadrado más alto de todas las posibles
combinaciones.
Tabla 22: Estimación modelo de regresión Clásico (Año 2011)
Variables Estimado P-Valor
Intercepto 15.358 0.000
PO_NDGN 0.286 0.000
PO_DET -0.155 0.001
PRECP -1.061 0.075
R - Cuadrado 0.831
R - Cuadrado ajustado 0.7975
AIC 86.416
Fuente: Elaboración Propia, Software R
Aunque el AEDE identifico variables como PAH_PL y PODM, entre otras que previamente se
mencionaron, como variables relacionadas espacialmente con el NivRiesgo, éstas no fueron
significativas en la elección por stepwise. Sin embargo, algunas de estas fueron incorporadas en el
presente modelo y las que no se incorporarán en los modelos espaciales, donde se determinara si
son o no significativas para el mismo, la ecuación 29 representa el modelo regresivo lineal clásico
para el año 2011, en donde los 𝛽𝑘 aluden a los valores estimados para cada variable de la tabla 22.
72
𝑁𝑖𝑣𝑅𝑖𝑒𝑠𝑔𝑜2011 = 𝛽0 + 𝛽1𝑃𝑂_𝑁𝐷𝐺𝑁 + 𝛽2𝑃𝑂_𝐷𝐸𝑇 + 𝛽3 𝑃𝑅𝐸𝐶𝑃 (29)
Para los supuestos de heteroscedasticidad, normalidad en los residuos, especificación y linealidad
que se rechazan la hipótesis nula al 95% de confianza (Véase Tabla 23) indicando que el modelo
es homoscedastico, existe normalidad en los residuos, aunque se obtiene que el modelo no está
bien especificado y adicional no existe relación de linealidad, siendo estas variables óptimas para
explicar el comportamiento de la variable endógena.
Tabla 23: Supuestos modelo regresión clásico (Año 2011)
Supuesto Test Contraste P-Valor
Heteroscedasticidad Breush-Pagan 4.1080 0.2500
Normalidad Shapiro Wilk 0.9451 0.3253
Jarque-Bera 3.8545 0.1455
Especificación Reset 14.6830 0.0005
Linealidad Rainbow 6.5006 0.0260
Autocorrelación I-Moran -0.35707 0.6395
Fuente: Elaboración Propia, Software R
A las variables de este modelo, también se les aplicó el estadístico VIF para realizar el análisis de
multicolinealidad en el modelo, como se observa en la tabla 24, en donde se obtuvo que ninguna
de las variables presenta multicolinealidad; el NivRiesgo para este año al igual que en el pasado
también es explicado por los factores de vulnerabilidad, costo y amenaza.
Tabla 24: Supuestos VIF de Multicolinealidad (Año 2011)
Variable VIF
PO_NDGN 1.7210
PO_DET 1.0606
PRECP 1.7037
Fuente: Elaboración Propia, Software R
Para el año 2014, la regresión stepwise se realizó en ambos sentidos (hacia adelante y hacia atrás)
teniendo como criterio el AIC que mostró más variables significativas que el criterio de P-valor.
El porcentaje de hogares que no disponen del servicio de gas natural (PO_NDGN), el porcentaje
de hogares que no disponen de recolección de basura (PO_NDRB), el número de personas por
hogar (PPH), el área de localidad por hogar (AL_PH) y la temperatura promedio anual para el año
de estudio (TEMP) fueron las mejores candidatas para integrar el modelo regresivo clásico para
73
este año (Tabla 25), por tanto el NivRiesgo puede explicarse un 92%, siendo el porcentaje más alto
en los años de estudio; si bien como se observa no todas las variables son significativas a un P <
0.05, pero la combinación que presentan muestran un R – Cuadrado aceptable de todas las posibles
combinaciones.
Tabla 25: Estimación modelo de regresión Clásico (Año 2014)
Variables Estimado P-Valor
Intercepto 11.4134 0.1692
PO_NDGN 0.1524 0.0002
PO_NDRB 2.4707 0.0506
PPH -5.0037 0.0005
AL_PH 0.0013 0.0852
TEMP 0.6756 0.1853
R - Cuadrado 0.923
R - Cuadrado ajustado 0.893
AIC 76.061
Fuente: Elaboración Propia, Software R
Aunque el AEDE identifico variables como PO_NDA, PAH_PL, PODM y la PRECP que
previamente se mencionaron, como variables relacionadas espacialmente con el NivRiesgo, éstas
no fueron significativas en la elección por stepwise. Sin embargo, algunas de estas fueron
incorporadas en el presente modelo y las que no se incorporarán en los modelos espaciales, donde
se determinara si son o no significativas para el mismo, la ecuación 30 representa el modelo
regresivo lineal clásico para el año 2014, en donde los 𝛽𝑘 aluden a los valores estimados para cada
variable de la tabla 25.
𝑁𝑖𝑣𝑅𝑖𝑒𝑠𝑔𝑜2014 = 𝛽0 + 𝛽1𝑃𝑂𝑁𝐷𝐺𝑁 + 𝛽2𝑃𝑂𝑁𝐷𝑅𝐵 + 𝛽3 𝑃𝑃𝐻 + 𝛽4𝐴𝐿𝑃𝐻 + 𝛽5𝑇𝐸𝑀𝑃 (30)
Para los supuestos de heteroscedasticidad, normalidad en los residuos, especificación y linealidad
se debe observar si se rechazan la hipótesis nula al 95% de confianza (Véase Tabla 26) al analizarlas
se indica que el modelo es homoscedastico, existe normalidad en los residuos y existe relación de
linealidad, pero al igual que en los años anteriores se encuentra que el modelo no está bien
especificado por lo tanto se deben implementar otras variables que ayuden a la especificación de
la variable endógena.
74
Tabla 26: Supuestos modelo regresión clásico (Año 2014)
Supuesto Test Contraste P-Valor
Heteroscedasticidad Breush-Pagan 4.2991 0.5072
Normalidad Shapiro Wilk 0.9848 0.9831
Jarque-Bera 0.1919 0.9085
Especificación Reset 10.7150 0.0026
Linealidad Rainbow 4.2219 0.1313
Autocorrelación I-Moran 2.3103 0.0104
Fuente: Elaboración Propia, Software R
A las variables de este modelo, también se les aplicó el estadístico VIF para realizar el análisis de
multicolinealidad en el modelo, como se observa en la tabla 27, en donde se obtuvo que ninguna
variable excede valores de 4 que justifican una investigación adicional, por lo tanto, tampoco
exceden el umbral de 10, descartando una multicolinealidad grave. El NivRiesgo para este año es
explicado por los factores de vulnerabilidad, costo y amenaza.
Tabla 27: Supuestos VIF de Multicolinealidad (Año 2014)
Variable VIF
PO_NDGN 1.905
PO_NDRB 1.913
PPH 2.727
AL_PH 1.135
TEMP 1.337
Fuente: Elaboración Propia, Software R
El año 2016 La regresión stepwise se realizó en ambos sentidos (hacia adelante y hacia atrás)
teniendo como criterio el AIC y el P-valor pues ambos mostraron la misma cantidad de variables
significativas. El porcentaje de hogares que no disponen de la recolección de basura (PO_NDRB),
el porcentaje de hogares que no disponen de gas natural (PO_NDGN), el número de personas por
hogar (PPH), el área de localidad por hogar (AL_PH) y la temperatura media anual (TEMP) fueron
las mejores y únicas candidatas para integrar el modelo regresivo clásico para este año. En la tabla
28 se pueden observar estas; por tanto, el NivRiesgo puede explicarse en un 83%. Si bien como se
observa no todas las variables son significativas a un P < 0.05, pero la combinación que presentan
muestra un R – Cuadrado aceptable de todas las posibles combinaciones.
75
Tabla 28: Estimación modelo de regresión Clásico (Año 2016)
Variables Estimado P-Valor
Intercepto -4.0467 0.49343
PO_NDGN 0.0833 0.00196
PO_NDA 5.7194 0.03137
PPH -1.6957 0.01941
AL_PH 0.0012 0.06992
TEMP 0.7844 0.06718
R - Cuadrado 0.8306
R - Cuadrado ajustado 0.7655
AIC 67.195
Fuente: Elaboración Propia, Software R
En este año se observa que las variables relevantes en el AEDE no están en su totalidad implícitas
en la regresión clásica, ya que el PO_NDEE, PAH_PL, PODM entre otros no se tienen en cuenta;
la ecuación 31 representa el modelo regresivo lineal clásico para el año 2016, en donde los 𝛽𝑘
aluden a los valores estimados para cada variable de la tabla 28.
𝑁𝑖𝑣𝑅𝑖𝑒𝑠𝑔𝑜2016 = 𝛽0 + 𝛽1𝑃𝑂_𝑁𝐷𝐺𝑁 + 𝛽2𝑃𝑂_𝐷𝑁𝐴 + 𝛽3𝑃𝑃𝐻 + 𝛽4 𝐴𝐿_𝑃𝐻 + 𝛽5𝑇𝐸𝑀𝑃 (31)
Para los supuestos de heteroscedasticidad, normalidad en los residuos y linealidad se rechazan la
hipótesis nula al 95% de confianza (Véase Tabla 29) indicando que el modelo es homoscedastico,
existe normalidad en los residuos, el modelo está bien especificado y existe relación de linealidad,
siendo estas variables óptimas para explicar el comportamiento de la variable endógena.
Tabla 29: Supuestos modelo regresión clásico (Año 2016)
Supuesto Test Contraste P-Valor
Heteroscedasticidad Breush-Pagan 2.4503 0.784
Normalidad Shapiro Wilk 0.90743 0.0664
Jarque-Bera 2.4777 0.2897
Especificación Reset 0.74905 0.4955
Linealidad Rainbow 0.75737 0.6783
Autocorrelación I-Moran 2.9955 0.0014
Fuente: Elaboración Propia, Software R
76
A las variables de este modelo, al igual que en los anteriores, se les aplicó el estadístico VIF para
realizar el análisis de multicolinealidad en el modelo, como se observa en la tabla 30, se obtuvo
que ninguna variable excede valores de 4 que justifican una investigación adicional, por lo tanto,
tampoco exceden el umbral de 10, descartando una multicolinealidad grave. El NivRiesgo para
este año al igual que en los anteriores es explicado por los factores de vulnerabilidad, costo y
amenaza.
Tabla 30: Supuestos VIF de Multicolinealidad (Año 2016)
Variable VIF
PO_NDGN 1.659
PO_NDA 1.107
PPH 1.791
AL_PH 1.137
TEMP 1.166
Fuente: Elaboración Propia, Software R
Ahora que se conocen las variables que explican el NivRiesgo por inundación para cada año, se
necesita calcular los contrastes de autocorrelación espacial para determinar si los modelos
presentados anteriormente explican correctamente la variable respuesta, dependiendo de factores
propios de las localidades o por si lo contrario, existe algún tipo de interdependencia espacial entre
las localidades y el modelo clásico estimado por MCO no es el ideal para representar el fenómeno.
Finalmente se realiza un análisis de autocorrelación espacial en los residuos de los modelos
establecidos cuyos resultados se observan en la figura 20. En donde se parte de la formulación de
la hipótesis nula donde los residuos no están correlacionados espacialmente siempre y cuando el
valor de este sea igual a 0; por consiguiente se puede observar que gráficamente para el año 2007
la asociación de algunas localidades pero que en realidad esto no asegura una asociación espacial
global en la zona de estudio, basándose en el criterio de Esfera de influencia, para el año 2011 se
observa algo similar al año 2007, se observan localidades que poseen correlación espacial aunque
no predominan en la zona de estudio, por consiguiente, gráficamente no se podría decidir si hay o
no asociación espacial, siendo el criterio de K-Vecinos más cercanos con Kn=1; en el año 2014 el
criterio seleccionado es K-Vecinos más cercanos con Kn=4, se puede observar que ya hay más
localidades relacionadas con las vecinas esto gráficamente podría aportarnos que posiblemente se
encuentre asociación espacial o autocorrelación en los residuos del modelo clásica para este año,
finalmente para el año 2016 se observan zonas que están rodeadas de zonas con el mismo valor,
por consiguiente, observando esto y relacionándolo con el criterio para este año, siendo el criterio
reina de primer orden posiblemente se encuentre asociación espacial en los residuos; para la certeza
de este análisis grafico se debe realizar el análisis por medio del tes de Moran para los residuos.
77
Figura 20: Mapa Análisis de autocorrelación en los Residuos.
Fuente: Elaboración Propia, Software R
5.2.2. Modelo Regresivo Espacial
El modelo clásico estimado por MCO no es otra cosa que la simplificación de modelos espaciales
en ausencia de dependencia espacial en donde existe una matriz general de varianza parametrizada
para el término del error (Anselin, 1998); el principal problema en la utilización de estos modelos
tradicionales es la ausencia de la presencia de autocorrelación espacial en los residuos, haciendo
que estos modelos puedan mostrar problemas de especificación. Una consecuencia relevante es el
riesgo de estimar coeficientes ineficientes en los que las pruebas de significancia estadística serían
objetables debido a la inflación de los errores estándar.
78
En el AEDE se determinó que el NivRiesgo se encontraba autocorrelacionados en el espacio, por
lo que pensar que un modelo de regresión clásico podría funcionar es infundado; si bien existe
autocorrelación espacial, aún es incierto si ésta deba incorporarse en el modelo como rezago en
términos de error o en rezagos espaciales de las variables explicativas. Para identificar la estructura
de dependencia espacial del NivRiesgo, en primera instancia se debe realizar la prueba de I de
Moran a los residuos de la regresión por MCO. La detección de correlación espacial en los residuos
implicaría una relación no lineal entre la variable exógena y sus variables endógena, la omisión de
uno o más regresores espacialmente correlacionados o que una estructura de error autorregresivo
es la más apropiada (Florax & Folmer, 1992). Aunque el test de Moran funciona bien como prueba
general, el diagnóstico por multiplicadores de Lagrange es más específico, ya que provee una base
que ayuda a la elección de un modelo regresivo espacial apropiado (Anselin, 1988). En segunda
instancia, se realiza el diagnóstico Multiplicador de Lagrange (LM) con el fin de identificar si la
variable se encuentra rezagada espacialmente, existe autocorrelación espacial en el error o se
encuentran ambos fenómenos. Tanto la prueba de Moran como el LM, se basan en los residuales
del modelo por MCO con o sin efecto espacial (Yrigoyen, 2003).
En la tabla 31 se muestra el estadístico de I de Moran aplicado a los residuales de los modelos
regresivos clásicos seleccionados anteriormente. Para este se utilizaron las matrices de pesos
espaciales previamente seleccionadas y que mejor se ajustaran a las relaciones de contigüidad. En
los años 2007 y 2011 se observa que presentan una ausencia de autocorrelación espacial en los
residuos, esto basado en el P-valor (P-valor > 0.05), pero para los años 2014 y 2016 se observa que
hay autocorrelación espacial en los residuos, dicho esto, para estos años se debe analizar con mayor
precaución pues el test I de Moran podría indicar problemas de variables que fueron omitidas,
corrigiéndose a través de la inclusión del rezago espacial en el modelo. Para los demás, aunque no
se observe autocorrelación espacial en los residuos, se conoce a priori que el NivRiesgo está
autocorrelacionados en el espacio y por ende un modelo espacial debe ser calculado para éstos.
Tabla 31: Test Global de Moran para los residuos de las regresiones.
Año Matriz W P-Valor Z(I)
2007 Esfera de Influencia 0.1170 1.1901
2011 K - Vecinos 1 0.6395 -0.3571
2014 K - Vecinos 4 0.0104 2.3103
2016 Reina 1 0.0014 2.9955
Fuente: Elaboración Propia, Software R
El diagnóstico del ML para los modelos clásicos de cada año se presenta en la tabla 32, en donde
se asocia el valor del diagnóstico por medio de un P-valor. Para todos los años de estudio se observa
que ningún de estos modelos, modelo lineal de error espacial (LMerr), modelo lineal de rezago
espacial (LMlag), los modelos robustos de estos (RLMerr y RLMlag), ni el efecto de dependencia
espacial de forma autorregresiva en la variable endógena con un esquema de medias móviles en
las perturbaciones aleatorias (SARMA) podría explicar el fenómeno de estudio. En vista de que
los diagnósticos aplicados son versiones clásicas y robustas, es necesario calcular todos los posibles
modelos espaciales (SAR, SEM, SDM, SARAR, SDEM, GNS, SLX) y determinar cuál, de estos,
basados en el AIC, es el que mejor personifica la dependencia espacial y explica el NivRiesgo por
inundación para cada año.
79
Tabla 32: Diagnóstico inicial de dependencia espacial: Multiplicadores de Lagrange.
Modelo Lmerr Lmlag RLMerr RLMlag SARMA
Año P-Valor
2007 0.6826 0.8028 0.7261 0.8937 0.9116
2011 0.4226 0.7734 0.2750 0.4268 0.5287
2014 0.3097 0.9945 0.2448 0.5712 0.5085
2016 0.1640 0.1225 0.7221 0.4485 0.2849
Fuente: Elaboración Propia, Software R
Al tener las variables explicativas resultantes del modelo clásico y aquellas identificadas en el
análisis bivariado del AEDE, se determinó la composición de los modelos básicos para construir
modelos espaciales; se calculó cada uno de los siete modelos espaciales al modelo básico para cada
año, depurando las variables que no aportaban información a los mismos y afectaban
negativamente el criterio de información Akaike (AIC), (tabla 33).
Tabla 33: Comparación Modelos Espaciales. Criterio Akaike (AIC por sus siglas en inglés)
Modelo SAR SEM SDM SARAR SDEM GNS SLX
Año AIC
2007 34.7481 29.2555 27.0813 30.3020 38.4608 20.1001 34.8919
2011 88.3481 87.5455 82.6221 75.6169 85.6199 55.4083 83.1857
2014 83.4059 80.0927 71.2980 81.0560 91.2500 87.0723 80.3309
2016 67.9460 69.9250 57.3972 66.0780 56.1723 36.7856 64.0025
Fuente: Elaboración Propia, Software R
En la presente tabla se compararon los modelos que incorporan la dependencia espacial por medio
del AIC. Para el año 2007 se observa que el modelo más adecuado, seleccionado por este criterio,
es el Modelo anidado general (GNS) al igual que para el año 2011 y el 2016, siendo para este
modelo la interacción espacial de todas las posibles combinaciones entre variable endógena,
exógenas y el error se encuentra autocorrelacionados en el espacio; para el año 2014 se identificó
que el mejor modelo era el modelo mixto regresivo– regresivo espacial (SDM), es decir, las
variables exógenas y endógena se encuentran espacialmente rezagadas. El uso de este criterio
(AIC) radica en que se desempeña mejor con muestras de cualquier tamaño y provee una medida
simple y efectiva para la selección del modelo más apropiado a el modelo verdadero (Lee & Ghosh,
2014), es por ello que además se podría considerar que este podría no ser consistente en el número
adecuado de factores comunes (Caballero D., 2011), esto no quiere decir que se descarte la idea de
que este se adapta mejor.
Adicional a este se comparó por medio del criterio de información bayesiano (BIC) donde este
analiza el comportamiento de la probabilidad a posteriori del j-ésimo modelo cuando n tiende a
infinito, seleccionando aquel modelo que represente la menor cantidad (Posada & Rosero, 2007).
Siendo la diferencia entre el criterio AIC y BIC, que este considera el número n de observaciones
en el término de penalización. En la tabla 34 se observan los resultados aplicando el criterio BIC,
en donde, como resultado se seleccionan los mismos modelos que arrojó el criterio AIC por año;
80
comprobándonos de un criterio a otro cual es el mejor modelo que se pueda ajustar a la explicación
del fenómeno para el año de estudio.
Tabla 34: Comparación Modelos Espaciales. Criterio Bayesiano (BIC por sus siglas en inglés)
Modelo SAR SEM SDM SARAR SDEM GNS SLX
Año BIC
2007 42.3036 36.8110 36.5257 38.8020 52.6274 35.2111 38.6697
2011 94.0147 83.0188 91.1221 85.9170 75.8055 66.7416 87.9079
2014 90.9614 85.7593 84.5201 89.5560 99.7500 97.4611 85.9976
2016 74.0057 75.5916 71.5638 73.6335 64.6723 50.9522 64.0481
Fuente: Elaboración Propia, Software R
En los años de estudio se logró deducir que la variable dependiente presenta autocorrelación
espacial, resultado que se ratificó en las conclusiones arrojadas en el AEDE. En los años 2007 y
2011 se observó que no poseen autocorrelación espacial residual, mientras que el año 2014 y 2016
presentó una posible autocorrelación espacial residual, no obstante, el test I de Moran para los
residuos concluyó que no existía autocorrelación espacial en los mismos. El diagnóstico de
Multiplicadores de LaGrange (LM) no arrojó los mismos resultados que el criterio de AIC para los
modelos, este primero no permitió determinar por este diagnóstico los posibles modelos que se
adaptaban al fenómeno de estudio. Como se observa en el marco teórico en cuanto a la taxonomía
de modelos de regresión propuestos por Anselin y por Florax y Folmer, se especificaron modelos
para el NivRiesgo por inundación en cada año, teniendo como base el análisis exploratorio, el
modelo clásico y el modelo autorregresivo espacial seleccionados.
El modelo general anidado (GNS) se identificó como el más adecuado para el año 2007, en donde,
variables del factor vulnerabilidad como el porcentaje de hogares que no disponen de energía
eléctrica (PO_NDEE), el porcentaje de hogares que no disponen de recolección de basura
(PO_NDRB) y el porcentaje de afluentes hídricos por localidad (PAH_PL); para el factor de costo
se tienen las variables como el porcentaje de hogares que disponen de motocicletas (PODM), el
número de personas por hogar (PPH) y en el factor de amenaza se tiene la precipitación media
anual (PRECP); encontrando adicionalmente de las variables explicativas la interacción entre sus
rezagos y el error asociado espacialmente; en la ecuación 32 se presenta el modelo general anidado
(GNS) del año 2007, en donde 𝛽0 alude al intercepto, 𝜌 y λ los coeficientes de autocorrelación
espacial, , 𝑊 la matriz de pesos espaciales del criterio esfera de influencia, 𝑋𝛽 el vector de variables
explicativas con sus respectivos estimados y 𝑊𝑋𝜃 alude al retardo espacial de las variables
explicativas, se aclara que aunque la ecuación menciona el rezago espacial de la variable respuesta
esta no fue significativa para el estudio; los valores estimados de los componentes se encuentran
en la tabla 35.
𝑌 = 𝛽0 + 𝜌𝑊𝑌 + 𝑋𝛽 + 𝑊𝑅𝜃 + 𝜇 (32)
𝜇 = 𝜆𝑊𝜇 + 𝜖
Según los datos obtenidos se puede concluir que, por medio del 𝜌 alrededor del 69% de las
variaciones del fenómeno son extendidas a las localidades, incluyendo las perturbaciones aleatorias
que surgen en una localidad influyendo a sus vecinas, ambas de forma positiva, esto quiere decir
81
que el aumento de esta repercute a la variable respuesta disminuyéndola. El porcentaje de hogares
que no disponen de energía eléctrica y los hogares que disponen de motocicletas influencian en el
crecimiento del riesgo en la localidad, mientras que el aumento de porcentaje de hogares que no
disponen de recolección de basura, el porcentaje de afluentes hídricos, el número de personas por
hogar y la precipitación disminuyen para la localidad el riesgo de inundación. El efecto de las
siguientes variables en las localidades adyacentes repercutiría de la siguiente manera, el aumento
del porcentaje de hogares que no disponen de energía eléctrica, el porcentaje de hogares que no
disponen de alcantarillado y la temperatura media anual aumentarían el NivRiesgo, y el aumento
del porcentaje de hogares que no disponen de recolección de basura, el porcentaje de afluentes
hídricos por localidad y la precipitación media anual reduce el NivRiesgo. Según los test de
confirmación de los supuestos básicos de un modelo como lo son: test de Breush-Pagan que analiza
la heteroscedasticidad de este, la prueba de Shapiro-Wilk observa la distribución normal de los
datos y el test de I de Moran de autocorrelación espacial en base a un P-valor con significancia al
95%, nos indican para este modelo que, el modelo es homoscedastico, los residuos siguen una
distribución normal y se encontró que los residuos no poseen autocorrelación espacial. El Pseudo
R-Cuadrado presenta un valor del 97%, indicando que hay una muy buena bondad del ajuste; el R-
Cuadrado de Nagelkerle ratifica la buena bondad de este con un 93%. El modelo incluye todos los
factores que para el estudio pueden modelar el Riesgo por Inundación, por tanto, se podría decir
que este se ajusta bien, además de que la variabilidad del modelo es explicada en una proporción
considerable.
Tabla 35: Estimación modelo de regresión espacial para el año 2007 (GNS)
Variables Estimado P-Valor
Rho -0.69652 0.00001
lambda -1.19810 < 2.22e-16
Intercepto -6.96763 5.85E-05
PO_NDEE 6.50682 2.29E-13
PO_NDRB -1.13044 9.12E-09
PAH_PL -0.67060 4.75E-14
PODM 0.26587 1.85E-08
PPH -1.10675 3.33E-12
PRECP -0.17495 0.000769
WPO_NDEE 33.95989 9.10E-15
WPO_NDAL 2.965543 4.84E-09
WPO_NDRB -3.982529 1.74E-06
WPAH_PL -2.133478 6.66E-16
WTEMP 1.814826 < 2.2e-16
WPRECP -2.36132 1.24E-11
Pseudo R – Cuadrado 0.974
R – Cuadrado (NK) 0.934
Breush Pagan 0.2659
Shapiro – Wilk 0.767
I de Moran (Residuos) 0.997
Fuente: Elaboración Propia, Software R
82
Al igual que en el año 2007 el modelo más adecuado para el 2011 es el modelo general anidado
(GNS), en donde, variables del factor vulnerabilidad como el porcentaje de hogares que no
disponen de gas natural (PO_NDGN), el porcentaje de hogares que no disponen de alcantarillado
(PO_NDAL) y el porcentaje de afluentes hídricos por localidad (PAH_PL); para el factor de costo
se tienen las variables como el porcentaje de hogares que disponen de electrodomésticos
(PO_DET), el número de personas por hogar (PPH) y en el factor de amenaza se tiene la
precipitación media anual (PRECP) y la temperatura media anual (TEMP) explican la variable
respuesta en diferentes proporciones, también se observa la interacción entre los rezagos de las
variables explicativas y el error aleatorio asociado a este, como se identificó que la única variable
que afecta a las localidades vecinas es la precipitación, al igual que el anterior año, el rezago de la
variable respuesta no es significativa, concluyendo que el Riesgo por inundación no influencia el
de las localidades vecinas. En la ecuación 33 se presenta el modelo general anidado (GNS), en
donde 𝛽0 alude al intercepto, 𝜌 y λ los coeficientes de autocorrelación espacial, 𝑊 la matriz de
pesos espaciales del criterio K-Vecinos más cercanos con Kn=1, 𝑋𝛽 el vector de variables
explicativas con sus respectivos estimados y 𝑊𝑅𝜃 alude al retardo espacial de las variables
explicativas; los valores estimados de los componentes se encuentran en la tabla 36.
𝑌 = 𝛽0 + 𝜌𝑊𝑌 + 𝑋𝛽 + 𝑊𝑅𝜃 + 𝜇 (33)
𝜇 = 𝜆𝑊𝜇 + 𝜖
Según los datos obtenidos se puede concluir que, por medio de 𝜌 alrededor del 54% de las
variaciones del fenómeno son extendidas a las localidades, incluyendo las perturbaciones aleatorias
que surgen en una localidad son contagiadas a sus vecinas, pero de forma positiva, esto quiere decir
a medida en que la variable respuesta aumenta hace que está misma variable disminuya en las
localidades contiguas, al igual que el aumento del error aleatorio en una región específica, también
hace que disminuya en las regiones colindantes. El porcentaje de hogares que no disponen de gas
natural y el número de personas por hogar influencian en el crecimiento del riesgo en la localidad,
mientras que el aumento de porcentaje de electrodomésticos por hogar, la precipitación, el
porcentaje de afluentes hídricos, el porcentaje de hogares que no disponen de alcantarillado y la
temperatura disminuyen para la localidad el riesgo de inundación. El efecto de la variable
precipitación en las localidades adyacentes repercutiría negativamente, aumentando el fenómeno
de estudio. El modelo es homoscedastico, los residuos siguen una distribución normal y no están
correlacionados en el espacio según el P-valor de los estadísticos (Tabla 36). El Pseudo R-
Cuadrado presenta un valor del 99%, indicando que hay una muy buena bondad del ajuste; el R-
Cuadrado de Nagelkerle ratifica la buena bondad de este con un 98%. El modelo incluye todos los
factores que para el estudio pueden modelar el Riesgo por Inundación, por tanto, se podría decir
que este se ajusta bien, además de que la variabilidad del modelo es explicada en una proporción
considerable.
83
Tabla 36: Estimación modelo de regresión espacial para el año 2011 (GNS)
Variables Estimado P-Valor
Rho -0.54125 < 2.22e-16
lambda -0.98046 < 2.22e-16
Intercepto -16.70318 3.97E-11
PO_NDGN 0.43286 < 2.22e-16
PO_NDAL -8.01560 < 2.22e-16
PAH_PL -0.69870 3.20E-08
PO_DET -0.38772 < 2.22e-16
PPH 13.15648 < 2.22e-16
PRECP -1.99678 < 2.22e-16
TEMP -0.7330516 < 2.22e-16
WPRECP 5.15723 < 2.22e-16
Pseudo R - Cuadrado 0.999
R - Cuadrado (NK) 0.984
Breush Pagan 0.2373
Shapiro - Wilk 0.249
I de Moran (Residuos) 0.792
Fuente: Elaboración Propia, Software R
Para el 2014 el modelo más adecuado es el modelo mixto regresivo – regresivo espacial (SDM) en
donde, variables del factor vulnerabilidad como el porcentaje de hogares que no disponen de gas
natural (PO_NDGN) y el porcentaje de hogares que no disponen de recolección de basura
(PO_NDRB); para el factor de costo se tiene la variable área de localidad por hogares (AL_PH) y
en el factor de amenaza se tiene la precipitación media anual (PRECP) interaccionan espacialmente
para tratar de explicar la variable respuesta, se observa la interacción entre las variables explicativas
y sus rezagos; en la ecuación 34 se presenta el modelo mixto regresivo – regresivo espacial (SDM),
en donde 𝜌 representa el coeficiente de autocorrelación espacial, 𝑊 la matriz de pesos espaciales
del criterio K-Vecinos más cercanos con Kn=4, 𝑋𝛽 el vector de variables explicativas con sus
respectivos estimados, 𝑊2𝑅𝛽2 alude al retardo espacial de las variables explicativas y 𝑊1𝑌 alude
al retardo espacial en la variable respuesta; los valores estimados de los componentes se encuentran
en la tabla 37.
𝑌 = 𝜌𝑊1𝑌 + 𝑋𝛽1 + 𝑊2𝑅𝛽2 + 𝜇 (34)
𝜇 ≈ 𝑁(0, Ω)
Según los datos obtenidos se puede concluir que, por medio del 𝜌 alrededor del 80% de las
variaciones del fenómeno son extendidas a las localidades, siendo esta positivamente, esto quiere
decir que sí aumenta en una localidad en específico, en las vecinas disminuye; el porcentaje de
hogares que no disponen de gas natural, el porcentaje de hogares que no disponen de recolección
de basura influencian en el aumento del riesgo por inundación en la localidad, mientras que el
aumento del área por hogar en las localidades y la precipitación disminuyen para la localidad el
riesgo. El efecto que tienen las variables como el porcentaje de hogares que no disponen de gas
84
natural domiciliario, el porcentaje de hogares que no disponen de recolección de basura, el
porcentaje de hogares que no disponen de acueducto, el porcentaje de afluentes hídricos por
localidad en las localidades adyacentes repercutiría negativamente, aumentando el riesgo del
fenómeno, mientras que pasaría todo lo contrario, en las localidades adyacentes cuando se presenta
un aumento del porcentaje de hogares que disponen de motocicletas, el área de la localidad por
hogar y la precipitación. El modelo es homoscedastico, los residuos siguen una distribución normal
y no están correlacionados en el espacio según el P-valor de los estadísticos (Tabla 37). El Pseudo
R-Cuadrado presenta un valor del 97%, indicando que hay una muy buena bondad del ajuste; el R-
Cuadrado de Nagelkerle ratifica la buena bondad de este con un 97%. El modelo incluye todos los
factores que para el estudio pueden modelar el Riesgo por Inundación, por tanto, se podría decir
que este se ajusta bien, además de que la variabilidad del modelo es explicada en una proporción
considerable.
Tabla 37: Estimación modelo de regresión espacial para el año 2014 (SDM)
Variables Estimado P-Valor
Rho -0.80329 0.04073
Intercepto 5.50E+01 < 2.2e-16
PO_NDGN 3.02E-01 < 2.2e-16
PO_NDRB 7.49E+00 4.72E-12
AL_PH -2.64E-03 0.002749
PRECP -3.97E+00 5.77E-15
WPO_NDGN 7.71E-01 < 2.2e-16
WPO_NDRB 1.74E+01 0.000149
WPO_NDA 6.35E+01 6.73E-10
WPAH_PL 5.52E+00 1.98E-09
WPODM -1.19E+00 2.31E-07
WAL_PH -2.39E-02 1.79E-09
WPRECP -1.41E+01 < 2.2e-16
Pseudo R - Cuadrado 0.973
R - Cuadrado (NK) 0.971
Breush Pagan 0.469
Shapiro - Wilk 0.960
I de Moran (Residuos) 0.721
Fuente: Elaboración Propia, Software R
Finalmente, para el año 2016 el modelo que mejor se adapta en la explicación del riesgo de
inundación en las localidades, es el modelo general anidado (GNS), en donde se encuentran las
variables explicativas interactuando con sus rezagos, el rezago espacial de la variable respuesta y
el error aleatorio; como primera instancia se observa que el factor de vulnerabilidad está asociado
a las variables del porcentaje de hogares que no disponen de acueducto, el porcentaje de hogares
que no disponen de energía eléctrica y el porcentaje de afluentes hídricos localizados; para el factor
costo se encuentra la variable número de personas por localidad y finalmente en el factor de peligro
85
se encuentran las variables de temperatura media anual y la precipitación media anual; en la
ecuación 35 se puede observar la estructura del GNS, cuyos componentes se explicaron para los
años 2007 y 2011, a diferencia de esos años este año está bajo el criterio de contigüidad Reina de
primer orden; para este año también se observó que el rezago espacial en la variable respuesta no
fue significativo para el modelo.
𝑌 = 𝛽0 + 𝜌𝑊𝑌 + 𝑋𝛽 + 𝑊𝑅𝜃 + 𝜇 (35)
𝜇 = 𝜆𝑊𝜇 + 𝜖
Con los datos resultantes de esta modelación se concluye que, por medio del 𝜌 alrededor del 79%
de las variaciones del fenómeno son extendidas a las localidades de forma negativa, esto quiere
decir que si el fenómeno aumenta en la localidad de estudiada las vecinas aumentarían con esta, lo
contrario a lo que se observa con las perturbaciones aleatorias, en donde se observa que afecta
positivamente. El porcentaje de hogares que disponen de acueducto, el porcentaje de afluentes
hídricos por localidad son las únicas variables que disminuyen el Riesgo por inundación; a
diferencia del porcentaje de hogares que no disponen de energía eléctrica, el número de personas
por hogar, la temperatura y la precipitación que aumentan el riesgo por inundación. Para los rezagos
espaciales de estas variables se observa que, el porcentaje de ocupantes que no disponen de gas
natural, el porcentaje de hogares que no disponen de energía eléctrica y el número de personas por
hogar aumentan el riesgo estudiado en las localidades vecinas, lo contrario cuando el porcentaje de
hogares que no disponen de acueducto y el porcentaje de afluentes hídricos por localidad al
aumentar generan que el riesgo disminuya en las localidades vecinas. También se aplicaron los test
de confirmación de los supuestos básicos de un modelo como lo son: test de Breush-Pagan que
analiza la heteroscedasticidad de este, la prueba de Shapiro-Wilk observa la distribución normal de
los datos y el test de I de Moran de autocorrelación espacial en base a un P-valor con significancia
al 95%, que nos confirman que el modelo es homoscedastico, los residuos siguen una distribución
normal y estos no están correlacionados espacialmente. El Pseudo R-Cuadrado presenta un valor
del 99%, indicando que hay una muy buena bondad del ajuste; el R-Cuadrado de Nagelkerle ratifica
la buena bondad de este con un 98%. El modelo incluye todos los factores que para el estudio
pueden modelar el Riesgo por Inundación, por tanto, se podría decir que este se ajusta bien, además
de que la variabilidad del modelo es explicada en una proporción considerable.
Tabla 38: Estimación modelo de regresión espacial para el año 2016 (GNS)
Variables Estimado P-Valor
Rho 0.79711 6.66E-16
lambda -1.7119 < 2.22e-16
Intercepto -24.10965 < 2.22e-16
PO_NDA -13.50219 < 2.22e-16
PO_NDEE 5.012775 1.91E-12
PAH_PL -0.867555 < 2.22e-16
PPH 2.354336 < 2.22e-16
86
TEMP 0.938487 1.41E-09
PRECP 0.746906 < 2.22e-16
WPO_NDGN 0.179112 < 2.22e-16
WPO_NDA -50.286713 < 2.22e-16
WPO_NDEE 47.570314 < 2.22e-16
WPAH_PL -6.877874 < 2.22e-16
WPPH 4.919863 5.33E-15
Pseudo R - Cuadrado 0.996
R - Cuadrado (NK) 0.985
Breush Pagan 0.4266
Shapiro - Wilk 0.320
I de Moran (Residuos) 0.980
Fuente: Elaboración Propia, Software R
Conociendo los modelos de dependencia espacial para los años analizados, ya es posible inferir los
posibles resultados con respecto a estos, las variables y los coeficientes que ellos poseen. Otra
alternativa más eficiente que solo interpretar los coeficientes de los modelos establecidos es el
análisis de impactos, ya que este análisis permitirá obtener medidas escalares para cuantificar el
conjunto de impactos no lineales sobre todas las regiones, como resultado de los cambios de alguna
variable en una región (Azorín & Sánchez de la Vega, 2008).
5.3. Impactos
Los modelos de regresiones espaciales exponen en muchas ocasiones la complicada estructura de
dependencia entre observaciones de ciertos polígonos (localidades, municipios, países), debido a
esto, las estimaciones de los parámetros contienen una gran cantidad de información sobre las
relaciones entre las observaciones y sus regiones asociadas (LeSage & Pace, 2009), esto conlleva
a que un cambio en una sola observación (localidad) asociada con una variable explicativa dada
afectará a la región en sí (Impacto Directo) y posiblemente afectará a todas las demás regiones de
manera indirecta (Impacto Indirecto), adicional a estos se puede ver la suma de las afectaciones
tanto directas como indirectas (Impacto Total).
Como se identificó en la sección anterior, los modelos autorregresivos espaciales identificados por
año contienen en sus modelaciones el retardo espacial de la variable endógena, posibilitando el
cálculo de tres tipos de impactos basados en los coeficientes de las variables explicativas por cada
modelo; se aclara que si los modelos no poseen un retardo espacial aun así se podrían calcular estos
de diferentes formas, incluyendo el análisis gráfico, el cual indica el cambio de la variable respuesta
de una región de estudio por otro y observando los cambios que esto genera por medio de diferentes
supuestos que se deben analizar dependiendo del tema de estudio; pero para el estudio se puede
simplificar este proceso por medio de la función Impacts del software R, siempre y cuando los
modelos poseen el retardo espacial de la variable endógena (𝜌).
87
Para el año 2007 en términos de los impactos, hipotéticamente se plantea un aumento del 10% del
riesgo por inundación, observando que las variables explicativas se comportarían de la siguiente
manera; para el porcentaje de hogares que no disponen de energía eléctrica se destaca que es el de
mayor impacto tanto directo como indirecto, esto quiere decir que siguiendo la hipótesis el impacto
que generaría en la localidad en si es de un 75%, para el impacto indirecto se observa que como es
un valor distinto a cero (-3.71) se podría decir que los cambios en el porcentaje de hogares que no
disponen de energía eléctrica de todas las localidades respecto a una localidad i reduce el nivel de
riesgo por inundación de esta localidad, finalmente el total de impacto que genera esta variable es
de un 38% en el distrito capital; para el porcentaje de hogares que no disponen de recolección de
basura se observa que reduciría el riesgo de inundación en un 6% en las localidades, una reducción
del 13% en sí misma y un aumento del 6% en las localidades vecinas.
En el porcentaje de afluentes hídricos por localidad se observa que, reduciría el riesgo de
inundación en un 3% en las localidades, el 7% en sí misma y el aumento del 3% en las localidades
vecinas; para el porcentaje de hogares que disponen de motocicleta se observa que aumenta el
riesgo de inundación en un 1% en la zona de estudio, un 3% en la misma localidad y una
disminución del 1% aproximadamente en las localidades vecinas; por el número de personas por
hogar se concluyó que disminuye el riesgo por inundación en un 6% en las localidades, el 12% en
sí misma y aumenta el riesgo en un 6% en las localidades vecinas. Finalmente, la variable
precipitación disminuye el riesgo en un 1% en todo el distrito capital, el cual un 2% disminuye en
la localidad misma y aumenta un 1% en las localidades vecinas.
Tabla 39: Impactos - 2007
Variables Directo Indirecto Total
PO_NDEE 7.5549079 -3.71952 3.835388
PO_NDRB -1.31253 0.6462001 -0.66633
PAH_PL -0.778612 0.3833352 -0.395277
PODM 0.3086972 -0.151981 0.1567158
PPH -1.285024 0.6326577 -0.652366
PRECP -0.203125 0.1000047 -0.10312
Fuente: Elaboración Propia, Software R
Para el año 2011 se analiza de la misma forma que el año anterior, como se observa en la tabla 40,
la mayoría de las variables afectan positivamente, reduciendo el riesgo por inundación en las
localidades del distrito capital, se manejara la misma hipótesis que el año 2007 planteando un
aumento del 10% del riesgo por inundación, para eso se obtendría que el riesgo por inundación en
Bogotá disminuiría en un 74% aproximadamente si el porcentaje de hogares que no disponen de
alcantarillado, el porcentaje de afluentes hídricos, el porcentaje de hogares que disponen de
electrodomésticos, la precipitación y la temperatura aumentaran; y se produciría un aumento del
riesgo por inundación del 88% si aumenta el porcentaje de hogares que no disponen de gas natural
y el número de personas que conforman un hogar.
88
Tabla 40: Impactos - 2011
Variables Directo Indirecto Total
PO_NDGN 0.565007 -0.284157 0.2808505
PO_NDAL -10.46268 5.2619513 -5.200728
PAH_PL -0.912005 0.4586709 -0.453334
PO_DET -0.506091 0.2545264 -0.251565
PPH 17.173018 -8.636754 8.536264
PRECP -2.606376 1.3108136 -1.295562
TEMP -0.956845 0.4812219 -0.475623
Fuente: Elaboración Propia, Software R
El nivel de riesgo por inundación en el distrito capital para el año 2014 se aumenta en un 43%
aproximadamente si el porcentaje de hogares que no dispone de gas natural y el porcentaje de
hogares que no dispone de recolección de basura aumentan, mientras que se amino este riesgo en
un 22% si el área de la localidad por hogares y la precipitación aumentan. La influencia que posee
este riesgo para las localidades vecinas indica que si el porcentaje de hogares que no disponen de
gas natural, el porcentaje de hogares que no disponen de recolección de basura y la precipitación
aumenta en una localidad reducirá el riesgo de inundación. Por otro lado, características propias de
una localidad como el área destinada por hogar en esta y el aumento de la precipitación afectan
directamente a la misma, indicando que el aumento de estas reduciría el riesgo por inundación.
Tabla 41: Impactos - 2014
Variables Directo Indirecto Total
PO_NDGN 0.3250214 -0.157523 0.1674989
PO_NDRB 8.0626109 -3.907568 4.1550432
AL_PH -0.002842 0.0013773 -0.001465
PRECP -4.276456 -2.072597 -2.203859
Fuente: Elaboración Propia, Software R
Finalmente, se observa que, las variables como el porcentaje de hogares que no disponen de
acueducto y el porcentaje de afluentes hídricos por localidad sugieren en la disminución del riesgo
de inundación para todo Bogotá en el año 2016, siendo el impacto del cambio en el porcentaje de
hogares que no disponen de acueducto el que mayor influencia tiene en las localidades vecinas.
Mientras que se observa para este año que las variables que aumentan el riesgo de inundación para
toda Bogotá el aumento del porcentaje de hogares que no disponen de energía eléctrica, el número
de personas por hogar, la temperatura y la precipitación, en estas variables se observa que para la
localidad en sí y las vecinas el aumento de estas igualmente generaría el aumento del riesgo.
89
Tabla 42: Impactos - 2016
Variables Directo Indirecto Total
PO_NDA -18.08545 -48.46521 -66.55067
PO_NDEE 6.714343 17.993028 24.707371
PAH_PL -1.162043 -3.114032 -4.276075
PPH 3.1535064 8.450734 11.604241
TEMP 1.2570528 3.368637 4.62569
PRECP 1.0004408 2.680971 3.6814117
Fuente: Elaboración Propia, Software R
Como se puede observar en el presente numeral el impacto en el riesgo por inundación en las
localidades de Bogotá puede afectar la estructura mutua entre estas junto con las variables
explicativas, en tanto el cambio en esta estructura mutua puede afectar el impacto del riesgo por
inundación en el distrito capital.
5.4. Regresión Geográficamente Ponderada
La regresión geográficamente ponderada (GWR) hace posible explorar si la asociación entre el
fenómeno de estudio y las posibles variables explicativas es constante en toda la ciudad o si es
posible identificar variaciones por zonas, ya que esta permite la estimación de parámetros locales
y no sólo globales (Sánchez Peña, 2006), esto se tiene bajo el supuesto de estacionariedad espacial,
donde los parámetros derivados de los modelos autorregresivos espaciales cuya especificación y
aplicación es global; pero, bajo la inexistencia de estacionariedad espacial los parámetros podrían
no representar la verdadera situación de estudio, omitiendo la consideración de la variable local
sobre el espacio (Foody, 2003); por eso la identificación de la variación local a través del espacio,
es adecuado realizar un análisis propiamente local (GWR) en lugar del uso de modelos
autorregresivos espaciales (análisis global).
Este tipo de regresión es una técnica basada en un conjunto de estimaciones de parámetros locales
que esta produce para cada relación que se pueden mapear con el fin de producir una superficie de
parámetros en toda la región de estudio, proporcionando información más exacta del fenómeno y
su relación con las unidades adyacentes a esta (Charlton, Fotheringham, & Brunsdon, 2005), estos
autores proponen básicamente 3 razones por las cuales se debe sospechar que las relaciones varían
en el espacio; la primera razón es la consideración de la no estacionariedad , ya que hay variaciones
espaciales en las relaciones observadas, la segunda la estructuración espacial de la información, ya
que influye considerablemente en la estimación de las relaciones entre las variables del estudio, la
documentación cuantitativa de la variación del fenómeno en las unidades espaciales; la tercera es
la posibilidad de que la relación pueda tener comportamiento localizado y no global en donde se
refiere a la mala especificación del modelo a partir del cual se miden las relaciones que
posiblemente poseen especificaciones erróneas a las percibidas en la realidad, omitiendo variables
relevantes en el modelo o están representadas de formas incorrectas. Este método en definitiva
consiste en ajustar tantas regresiones como observaciones (unidades espaciales) se consideren en
el análisis, en base al concepto de “distance decay” donde se da más peso a las observaciones
90
próximas y menos a las más alejadas, por medio de la función kernel, simulando el efecto con la
distancia (Gutierrez Puebla, García Palomares, & Daniel Cardozo, 2012).
Una de las ventajas de usar este método es la posibilidad de estimar coeficientes de determinación
locales para cada unidad espacial a partir de los valores de un conjunto de observaciones vecinas,
permitiendo conocer la forma en que se combinan localmente las variables de la regresión para
obtener un mejor ajuste en una localización (Fotheringham, Charlton, & Brunsdon, 1998), además
se observa como los coeficientes de cada uno de los predictores (elasticidades) varían de una unidad
espacial a otra – representando la inestabilidad espacial. El uso de esta técnica para el presente
estudio permitirá entender desde otra perspectiva (global a local) la influencia de los determinantes
del riesgo de inundación para cada año y como esta afecta las diferentes unidades espaciales
(localidades) en Bogotá. Como ya se describió anteriormente en el AEDE se identificó la
autocorrelación espacial de la variable respuesta y las variables explicativas, con su posterior
análisis de correlación entre las mismas. De la misma manera como se realizó la modelación
clásica y autorregresiva espacial se busca explicar en gran medida el Riesgo por inundación
(NivRiesgo) en función de las variables explicativas agrupadas en diferentes factores que
configuran el riesgo, estos modelos y en su mayoría se trabajaron a un nivel de significancia del
0.10 con el fin de obtener la mayor cantidad de factores que pudieran explicar el fenómeno.
Para el año 2007 el modelo incorporo variables relacionadas a los factores de costo y peligro,
siendo estos el número de personas por hogar (PPH) y la precipitación media anual (PRECP),
siendo todas a una significancia del 5%; el R-Cuadrado del modelo es de 60%, que, aunque no es
una buena predicción, es aceptable para el estudio.
Tabla 43: Estimación regresión geográficamente ponderada (GWR) - 2007
Variables Min Max Media
Intercepto 2.7532 3.0284 2.8388
PPH -0.6927 -0.6580 -0.6808
PRECP 0.1857 0.2461 0.2290
R-Cuadrado 0.6052
R-Cuadrado Ajustado 0.4748
Fuente: Elaboración Propia, Software R
La distribución del R-Cuadrado local en la zona de estudio, se encuentra en un intervalo de (0.53-
0.62), figura 21, en donde las localidades como Barrios Unidos, Usaquén, Chapinero, Santafé y
Suba presentan los valores más altos del R-Cuadrado, lo contrario pasa con las localidades de
Tunjuelito, Rafael Uribe y Bosa siendo las que se ubican en el rango más bajo, mientras que en las
otras localidades oscilan en los intervalos de 0.56 a 0.59 aproximadamente.
91
Figura 21: Distribución espacial del R-Cuadrado en Bogotá D.C., GWR - 2007.
Fuente: Elaboración Propia, Software R
A continuación, se pueden observar el análisis de las variables explicativas significativas
resultantes de la regresión geográficamente ponderada, en donde se observan los coeficientes
obtenidos junto a los valores t (t-student) significativos o no estadísticamente para cada una de las
localidades. En la figura 22 se observa los mapas obtenidos de la variable PPH, en esta variable se
observa que las localidades de Teusaquillo, Puente Aranda, Los Mártires, Kennedy y Fontibón son
las únicas que presentan un valor significativo con valores negativos bajos, indicando que en estas
localidades es de importancia el número de personas por hogar para mitigar el riesgo por
inundación en estas zonas; mientras en los mapas obtenidos de la variable PRECP, en esta se
observa que las localidades de Tunjuelito y Bosa son las únicas que no dan significativas, para las
localidades del norte de la ciudad (Candelaria, Barrios Unidos, Teusaquillo, Usaquén, Chapinero,
Santafé, San Cristóbal, Engativá y Suba) presentan valores positivos altos indicando que entre
mayor precipitación halla mayor riesgo por inundación.
Figura 22: Distribución espacial del coeficiente locales y P-valores de las variables PPH y
PRECP, modelo GWR - 2007.
Fuente: Elaboración Propia, Software R
92
Para el año 2011 el modelo incorporo variables relacionadas a los factores de vulnerabilidad, costo
y peligro, siendo estos el porcentaje de hogares que no disponen de gas natural (PO_NDGN),
porcentaje de hogares que disponen de electrodomésticos (PO_DET) y la precipitación media anual
(PRECP), siendo todas a una significancia del 5%; el R-Cuadrado del modelo es de 84%, se
considera una buena predicción para el estudio.
Tabla 44: Estimación regresión geográficamente ponderada (GWR) - 2011
Variables Min Max Media
Intercepto 15.2287 17.0489 16.0593
PO_NDGN 0.2722 0.3114 0.2950
PO_DET -0.1636 -0.1468 -0.1586
PRECP -1.4171 -0.9154 -1.2744
R-Cuadrado 0.8427
R-Cuadrado Ajustado 0.7674
Fuente: Elaboración Propia, Software R
La distribución del R-Cuadrado local en la zona de estudio, se encuentra en un intervalo de (0.82-
0.89), figura 23, en donde las localidades del sur (Tunjuelito, Rafael Uribe, San Cristóbal, Usme y
Ciudad Bolívar) de Bogotá presentan los valores más altos del R-Cuadrado, lo contrario pasa con
las localidades del norte en especial Suba que es la que presenta el menor valor siendo de 0.82, las
otras localidades que se encuentran en la mitad de Bogotá están presentes en el intervalo de 0.84 a
0.86 aproximadamente.
Figura 23: Distribución espacial del R-Cuadrado en Bogotá D.C., GWR – 2011
. Fuente: Elaboración Propia, Software R
93
A continuación, se pueden observar el análisis de las variables explicativas significativas
resultantes de la regresión geográficamente ponderada, en donde se observan los coeficientes
obtenidos junto a los valores t (t-student) significativos o no estadísticamente para cada una de las
localidades. En la figura 24 se pueden observar las variables de PO_DET y PO_NDGN, para el
porcentaje de hogares que disponen de electrodomésticos se muestra que todas las localidades son
estadísticamente significativas presentando una relación con la variable respuesta negativa para
toda la zona, en las localidades del sur oriente (Tunjuelito, Ciudad Bolívar y Bosa) es posible que
a menor porcentaje presentado se presente mayor riesgo por inundación en términos de costos. De
la misma manera se observa en el porcentaje de hogares que no disponen de gas natural afectando
en la totalidad el sur (Tunjuelito, Rafael Uribe, San Cristóbal, Usme y Ciudad Bolívar) aunque para
esta variable se presenta una relación con el riesgo por inundación positiva, lo cual a mayor
porcentaje presentad, es probable que se presente mayor riego en términos de vulnerabilidad.
Figura 24: Distribución espacial del coeficiente locales y P-valores de las variables PO_DET y
PO_NDGN, modelo GWR – 2011.
Fuente: Elaboración Propia, Software R
En la figura 25 se pueden observar la variable de precipitación media anual (PRECP) no son
significativas las localidades del norte de Bogotá, mientras se observa que las localidades del centro
y sur (Tunjuelito, Rafael Uribe, Candelaria, Santafé, San Cristóbal, Usme, Ciudad Bolívar y Bosa)
son estadísticamente significativas presentan una relación negativa con el Riesgo de Inundación en
donde es posible que a menor precipitación se presente mayor riesgo por inundación en términos
de peligro.
94
Figura 25: Distribución espacial del coeficiente locales y P-valores de la variable PRECP,
modelo GWR – 2011.
Fuente: Elaboración Propia, Software R
El año 2014 es el que mayor número de variables incidentes en el Riesgo por inundación; el modelo
incorporo variables relacionadas a los factores de vulnerabilidad, costo y peligro, siendo estos el
porcentaje de hogares que no disponen de gas natural (PO_NDGN), porcentaje de hogares no
disponen de alcantarillado (PO_NDAL), porcentaje de hogares no disponen de recolección de
basura (PO_NDRB), el número de personas por hogar (PPH), el área de la localidad por hogar
(AL_PH), la temperatura media anual y la precipitación media anual (PRECP), siendo todas a una
significancia del 5%; el R-Cuadrado del modelo es de 96%, se considera una muy buena predicción
para el estudio.
Tabla 45: Estimación regresión geográficamente ponderada (GWR) - 2014
Variables Min Max Media
Intercepto 10.5932 12.9793 11.8002
PO_NDGN 0.1519 0.1570 0.1536
PO_NDAL -4.6077 -3.7359 -4.1606
PO_NDRB 6.3068 7.3598 6.8833
PPH -5.3675 -4.4541 -4.8895
AL_PH 0.0025 0.0036 0.0029
TEMP 0.8690 0.9086 0.8854
PRECP -1.2145 -0.9153 -1.0456
R-Cuadrado 0.96
R-Cuadrado Ajustado 0.91
Fuente: Elaboración Propia, Software R
La distribución del R-Cuadrado local en la zona de estudio, se encuentra en un intervalo de (0.96-
0.98), figura 26, en donde las localidades del sur ( San Cristóbal, Usme y Ciudad Bolívar) presentan
los valores más altos del R-Cuadrado, lo contrario pasa con las localidades del norte (Fontibón,
Engativá y Suba) presentando el menor valor, siendo de 0.96, las otras localidades que se
encuentran en la mitad de Bogotá están presentes en el intervalo de 0.965 a 0.975
aproximadamente.
95
Figura 26: Distribución espacial del R-Cuadrado en Bogotá D.C., GWR – 2014
Fuente: Elaboración Propia, Software R
A continuación, se pueden observar el análisis de las variables explicativas significativas
resultantes de la regresión geográficamente ponderada, en donde se observan los coeficientes
obtenidos junto a los valores t (t-student) significativos o no estadísticamente para cada una de las
localidades. En la figura 27 se pueden observar las variables de AL_PH y PO_NDAL, en ambas
variables se muestran que las localidades son estadísticamente significativas, pero para el AL_PH
se presentan una relación con la variable respuesta positiva en toda la zona, en las localidades del
occidente (Bosa y Fontibón) es posible que a un aumento de esta se presente mayor riesgo por
inundación en estas zonas; lo contrario pasaría con PO_NDAL, en donde las localidades del norte
en especial Usaquén es la que presenta una mayor relación negativa con el fenómeno, es decir que
a menor porcentaje de ocupantes que no disponen de alcantarillado se presentaría un mayor riesgo
por inundación.
Figura 27: Distribución espacial del coeficiente locales y P-valores de las variables AL_PH y
PO_NDAL, modelo GWR – 2014.
Fuente: Elaboración Propia, Software R
96
Para el caso de las variables porcentaje de hogares que no disponen de gas natural (PO_NDGN) y
el porcentaje de hogares que no disponen de recolección de basura (PO_NDRB) se observa que
todas las localidades son estadísticamente significativas, y ambas presentan una relación con la
variable respuesta positiva en toda la zona; esto se observa en la figura 28, en donde para el
PO_NDGN las localidades del sur occidente (Usme, Ciudad Bolívar y Bosa) presentarían un mayor
riesgo de inundación si hay un aumento de esta variables, mientras para el caso de PO_NDRB las
localidades del centro (Tunjuelito, Rafael Uribe, San Cristóbal) presentarían un mayor riesgo donde
el porcentaje de esta variable llegara aumentar. Ambas representarían el factor vulnerabilidad.
Figura 28: Distribución espacial del coeficiente locales y P-valores de las variables PO_NDGN y
PO_NDRB, modelo GWR – 2014.
Fuente: Elaboración Propia, Software R
En las variables de número de personas por hogar (PPH) y temperatura media anual (TEMP) se
representa una significancia estadística en toda la zona de estudio (figura 29), para el PPH se
presenta una relación negativa en toda la zona, donde las localidades del noroccidente (Bosa,
Kennedy, Fontibón, Engativá y Suba) , es decir que a menor porcentaje de esta se presentaría un
mayor riesgo por inundación; lo contrario pasaría con la TEMP, siendo Tunjuelito, Usme, Ciudad
Bolívar y Bosa las localidades que representan una relación positiva marcada, lo cual se plantea la
suposición de que si esta presentara un aumento el nivel de riesgo por inundación en esta zona
aumentaría.
Figura 29: Distribución espacial del coeficiente locales P-valores de las variables PPH y TEMP,
modelo GWR – 2014.
Fuente: Elaboración Propia, Software R
97
Finalmente, para la variable precipitación media anual (PRECP), solo las localidades del norte son
estadísticamente significativas (figura30), esta variable presenta una relación negativa en toda la
zona significativa, en donde las localidades como Bosa, Kennedy, Fontibón, Engativá y Suba son
las que en una probabilidad de aumento de esta variable en esta zona disminuiría el riesgo por
inundación.
Figura 30: Distribución espacial del coeficiente locales y P-valores de la variable PRECP,
modelo GWR – 2014.
Fuente: Elaboración Propia, Software R
Para el año 2016 el modelo incorporo variables relacionadas a los factores de vulnerabilidad, costo
y peligro, siendo estos el porcentaje de hogares que no disponen de gas natural (PO_NDGN),
porcentaje de hogares que disponen de electrodomésticos (PO_DET), el número de personas por
hogar (PPH) y la temperatura media anual (TEMP), siendo todas a una significancia del 5%; el R-
Cuadrado del modelo es de 80%, se considera una buena predicción para el estudio.
Tabla 46: Estimación regresión geográficamente ponderada (GWR) - 2016
Variables Min Max Media
Intercepto -4.2003 2.3824 -1.7648
PO_NDGN 0.0851 0.0898 0.0861
PO_DET -0.0916 -0.0549 -0.0724
PPH -2.8724 -2.2743 -2.4250
TEMP 0.8319 1.5126 1.2499
R-Cuadrado 0.8081
R-Cuadrado Ajustado 0.6781
Fuente: Elaboración Propia, Software R
La distribución del R-Cuadrado local en la zona de estudio, se encuentra en un intervalo de (0.78-
0.86), figura 31, en donde las localidades del sur (Tunjuelito, Rafael Uribe, San Cristóbal, Usme y
Ciudad Bolívar) de Bogotá presentan los valores más altos del R-Cuadrado, lo contrario pasa con
las localidades del norte (Usaquén y Suba) que son las que presentan el menor valor siendo de 0.78,
98
las otras localidades que se encuentran en la mitad de Bogotá están presentes en el intervalo de
0.80 a 0.84 aproximadamente.
Figura 31: Distribución espacial del R-Cuadrado en Bogotá D.C., GWR – 2016
. Fuente: Elaboración Propia, Software R
Al analizar las variables que fueron significativas para el estudio de este año resultantes de la
regresión geográficamente ponderada, observando los coeficientes obtenidos junto a los valores t
(t-student) significativos o no estadísticamente para cada una de las localidades. En la figura 32 se
pueden observar las variables de PO_DET y PO_NDGN, en ambas variables se muestran que todas
las localidades son estadísticamente significativas, pero para el PO_DET se presentan una relación
con la variable respuesta negativa en toda la zona, en las localidades del norte (Suba y Usaquén)
es posible que a menor porcentaje de hogares que disponen de electrodomésticos se presentaría
mayor riesgo; lo contrario pasaría con el PO_NDGN , donde presenta una relación con la variable
respuesta positiva, que para las localidades de Usme y Ciudad Bolívar un aumento porcentual de
esta generaría un aumento en el riesgo por inundación.
Figura 32: Distribución espacial del coeficiente locales P-valores de las variables PO_DET y
PO_NDGN, modelo GWR – 2016.
Fuente: Elaboración Propia, Software R
99
Figura 33: Distribución espacial del coeficiente locales P-valores de las variables PPH y TEMP,
modelo GWR – 2016.
Fuente: Elaboración Propia, Software R
La variable número de personas por localidad (PPH) muestra para este año una significancia en
todas las unidades de estudio, presentando una relación negativa con la variable a explicar, se
observa que la mayoría de las localidades presentan una mayor interacción con el fenómeno, en
donde es posible que a menor número de personas por hogar se presente un mayor riesgo, esto solo
excluiría a las localidades de Antonio Nariño, Tunjuelito, Rafael Uribe, Santafé y San Cristóbal.
Para la variable (TEMP), las localidades del norte (Usaquén, Suba, Engativá y barrios Unidos) no
presentan significancia estadística, para Tunjuelito, Rafael Uribe y San Cristóbal se observa que,
si aumentara la temperatura en estas el riesgo aumentaría considerablemente.
5.5. Discusión y Contextualización del Modelo
Según los resultados los factores que inicialmente se propusieron en la configuración del riesgo
por inundación como lo son: vulnerabilidad, costo y amenaza se vieron reflejados no en su
totalidad, pero sí gran parte en los años estudiados, afirmando que realmente el riesgo no solo es la
implicación de factores naturales, si no también sociales, económicos y políticos que van implícitos
en las variables que lograron adaptarse a todo el proceso estadístico aplicado en este proyecto,
además estos resultados van relacionados al nivel de riesgo por cada 10.000 hogares, esto quiere
decir que si hay mayor número de eventos en una zona en que hay menor cantidad de hogares
generaría un mayor riesgo por inundación.
A través de los años estudiados (2007-2011-2014-2016) se pusieron a prueba las mismas variables
sociales, ambientales y económicas, pero no todas participaron activamente en la determinación
del Riesgo que genera el fenómeno de inundación para los años correspondientes, aunque los
servicios públicos son importante en su mayoría no todos se reflejaron en los años, inicialmente se
pensó en que la mayoría de localidades tenían un cubrimiento de estos, por consiguiente se debió
observar el porcentaje que no disponen de este, pues esto como se explicó genera que los hogares
en esas zonas sean más vulnerables a cualquier fenómeno o suceso; en los costos, inicialmente se
100
plantearon muchas variables que van implícitas, pero se observó que la mayoría tenían una alta
correlación por eso se prosiguió a usar el método AHP para poder generar una estandarización
óptima, sin perder la importancia que implicaba el que un hogar tuviera televisor a que tuviera
lavadora u otro electrodoméstico que actualmente son esenciales para las labores diarias de
sostenimiento; se resalta que el análisis del riesgo en sí implica muchas variables que pueden como
no ser cuantificadas, además de la complejidad que tiene esto, ya que el riesgo no se puede medir
igualmente para todas las zonas, porque limitaría el conocimiento de las condiciones particulares
de los lugares a estudiar (Martínez, 2015).
El impacto que posee la variable de precipitación (PRECP) es evidente en todos los años y en
varios estudios (Sedano Cruz, Carvajal Escobar, & Ávila Díaz, 2016), en donde se menciona a esta
como el principal influyente, que no solo incrementa el riesgo sino que también impacta
ecosistemas y sectores socioeconómicos, aunque en los primeros 3 años de estudios esta variable
tuvo relación inversa al riesgo, esto quiere decir que realmente para estos años sucedió algo más
que la precipitación la que generó el riesgo, que mientras para el último año se evidencio que esta
si es un influyente del fenómeno. En cuanto a los servicios públicos y respecto a las estadísticas
del DANE, para el servicio público de energía eléctrica por hogares la cobertura oscila entre el
98% al 100% total de cobertura, el servicio de gas natural domiciliario oscila entre un 46% al 100
de cobertura, ya para este servicio se encuentra que en muchas localidades este servicio aún no
presenta un porcentaje aceptable de cobertura; para el servicio de acueducto ya se encuentra que
en las localidades se presenta una gran cobertura siendo en su mayoría del 99.5% al 100%, en
cuanto a la cobertura que posee el alcantarillado en la ciudad va desde un 97% al 100% aunque en
la mayoría de localidades la cobertura es buena, finalmente en el servicio de recolección de basura
oscila entre un 98% al 100%, se aclara que todos estos datos solo se pueden medir siempre y cuando
los barrios que hallan en cada localidad estén legalizados o que el servicio prestado sea legal, ya
que no se puede medir los hogares que usan de estos servicios sin pagar del (fraudulentamente) o
que se conectan de otros hogares que si pagan de este; en cuanto al análisis de estas variables a
través del tiempo, no se encuentra un servicio que influencie todos los años, pero si se encuentran
las combinaciones de estos, pues se analizó previamente que estos no estuvieran correlacionados o
esto afectaría la modelación del fenómeno creando falsas especulaciones.
Los afluentes hídricos han sido generalmente la consideración más importante en algunas zonas,
para la planificación de estos en contra de problemas específicos como el control de inundaciones
(Gobierno de Argentina Programa de Desarrollo Regional de la OEA, 2000) por eso para el estudio
también se considera esta variable pues este representa un papel importante para los hogares que
se encuentran cerca de él o las localidades que poseen una gran proporción de estos en ella pues,
como se planteó en el marco teórico de este, podría aumentar el factor vulnerabilidad para el
estudio; en cuanto a los modelos se observó que esta variable se referencia en todos los años, pues
es de gran importancia, aunque en los resultados esta variable actúa de manera inversa al riesgo,
afirmándonos que él aunque es una variable importante, hoy al pasar de los años se han tomado
acciones que mitigan el desbordamiento de estos, por lo tanto esta variable nos arrojaría que el
control gubernamental sobre este ha tenido repercusiones positivas para la sociedad.
Para las variables dentro del factor costo se encontraron que para todos los años se encuentra
relacionado alguna variable de estas, pues no todas son afectadas de la misma forma, por ejemplo
en todos los años se encontró relacionado el número de personas por hogar, este se relacionó al
supuesto de que a mayor personas por hogar mayores elementos que poseen un costo se
encontrarían ligados a ellos, como por ejemplo la ropa, objetos de valor que son de uso diario;
101
elementos como estos que son difícilmente de cuantificar o de hacer una medición de estos, en un
sector de estudio como el de Bogotá, adicional a esta variable se encuentra la combinación con el
porcentaje de hogares que disponen de electrodomésticos como también el porcentaje de hogares
que disponen de algún vehículo siendo este carro particular o motocicleta. Finalmente, como se
mencionó anteriormente la precipitación juega un papel fundamental, pero para el estudio también
se consideró la temperatura, la cual juega un papel fundamental al igual que la precipitación pues
esta presenta una relación lineal con la precipitación, ya que se ha demostrado que el aumento de
las lluvias está relacionado a la disminución de la temperatura (Puertas & Carvajal, 2011), estas
dos variables pueden presentar cambios drásticos generados por fenómenos externos como el
cambio climático y fenómenos como el del Niño y el de la Niña. En los modelos y para el estudio
estas son las variables del factor de amenaza, y están presentes en todos los modelos que a
diferencia de la precipitación la temperatura si genero un aumento del riesgo en la localidad y en
las vecinas.
Con respecto a lo anterior, se afirma que el estudio y conocimiento de los aspectos del riesgo por
inundación es la relación no solo de factores naturales si no la configuración de factores de tipo
social, económicos y ambientales que sus combinaciones expresan este fenómeno en Bogotá,
enriqueciendo y ayudando a posibles investigaciones posteriores a esta, cuyo fin podría ser la
implementación de programas que junto a los actuales pueden mitigar más el riesgo por inundación
presente en las localidades, igualmente no se descarta el uso de SAT que actualmente y en
investigaciones han demostrado ayudar a la comunidad en problemas como estos, también la
importancia de la aplicación espacial en el proceso de identificación de los múltiples factores de
riesgo y la distribución en el territorio.
102
Capítulo VI
Conclusiones y Recomendaciones
La relación de las nuevas herramientas informáticas como lo son los sistemas de información
geográfica y la estadística ayudan a generar análisis a diferentes tópicos (multidisciplinarios), que
para este estudio fueron aplicados a la modelación del riesgo de inundación en Bogotá D.C. en un
periodo del 2007 hasta el 2016.
Los estudios sobre los distintos riesgos por factores naturales son en otras palabras, estudios de
interaccionan entre grandes cantidades de factores tanto cualitativos como cuantitativos, por tal
razón y para intentar explicar estas medidas, una de las mejores alternativas frente a esta
problemática es el estudio espacial por medio de tecnologías geográficas.
Se destaca que esta investigación es posiblemente la primera aproximación desarrollada para
modelar el riesgo de inundación en la ciudad de Bogotá D.C que tiene en cuenta la interacción de
variables sociales, económicos y ambientales configuradas en factores de vulnerabilidad, costos y
peligros.
Estos estudios se generan por el afán del hombre en reducir el riesgo de inundación, y así poder
convivir en espacios geográficos con la menor cantidad de riesgos, o en las mejores condiciones
naturales posibles. Para esto es fundamental que el estudio esté acompañado no solo de variables
básicas, sino también de factores externos que lo determinen, con el fin de generar soluciones a los
problemas de inundación a partir de una metodología estadística bien definida, con calidad de
datos.
Al estudiar el comportamiento del riesgo por inundación, se evidencio que en el periodo inicial las
localidades de Teusaquillo, Los Mártires, Chapinero y Santafé son las que representan un mayor
riesgo de inundación por cada 10.000 hogares, esto en otras palabras es el registro de un mayor
número de eventos de inundación que generaron el aumento del riesgo para estas, y que para el año
final de estudio se encontraron estas y adicional la localidad de Candelaria.
Esto nos indicaría que, aunque se han realizado planes o alternativas que mitigan el riesgo en las
localidades, estos no se ven reflejados como si se puede visualizar en otras, posiblemente el
gobierno y el distrito se enfoque en la amenaza inmediata que genera el desbordamiento del río
Bogotá.
Para las alternativas de disminución del riesgo en estas localidades se propuso la ampliación de
cobertura de los servicios públicos domiciliarios como lo es el de gas natural, la recolección de
basura, acueducto y energía eléctrica, un mayor control en la precipitación, la temperatura y
adicionalmente control en la ubicación de los hogares.
En futuros trabajos se podría generar la relación entre la topografía del área de estudio, las
características geológicas y geomorfológicas de este, el nivel freático y posiblemente un análisis
más detallado de la precipitación y la temperatura en condiciones extremas, siendo para la
precipitación el mayor aumento que esta llegara a presentar en el tiempo de estudio, mientras que
inversamente para la temperatura, siendo el menor valor que este pudiera llegar a tener en el tiempo
de estudio; esto bajo el supuesto de que a mayor precipitación y menor temperatura se podrían
103
generar el aumento de fenómenos meteorológicos que aumentarían la probabilidad del riesgo bajo
la configuración planteada.
Se recomendaría a las entidades gubernamentales, en especial al instituto distrital de gestión del
riesgo y cambio climático, compensar en las variables previamente analizadas no solo con el fin de
reducir el riesgo por inundación, sino también el posible riesgo de otros factores ambientales que
influyan en Bogotá. Se recomienda un mejor control por las entidades en torno a estos temas y
estas variables, con el fin de tener una mayor exactitud informática, que, conllevaría a mejores
resultados, enriqueciendo la actividad investigativa en estudios similares.
Finalmente, se podría plantear para el mayor control de factores de peligro (temperatura y
precipitación), además de los afluentes hídricos (factor vulnerabilidad) la implementación de un
sistema de alerta temprana, que, por medio de la implementación del internet de las cosas ayudara
a que la población esté más informada y preparada en distintos factores que conllevan a la
configuración del riesgo, siendo para este estudio el riesgo que generan las inundaciones en los
hogares de Bogotá; adicionalmente para el factor de costo se sabe que presenta la integración de
diferentes variables, posiblemente se podría realizar una encuesta a escalas más detalladas
(municipal – barrio) con el fin tener un mayor control de estas.
104
A. Anexo: Correlogramas bivariados
Figura 34: Moran Bivariado 2007
Fuente: Elaboración Propia, Software R
105
Figura 35: Moran Bivariado 2011
Fuente: Elaboración Propia, Software R
106
Figura 36: Moran Bivariado 2014
Fuente: Elaboración Propia, Software R
107
Figura 37: Moran Bivariado 2016
Fuente: Elaboración Propia, Software R
108
Bibliografía
Agudelo, G., Franco, L., & Franco, L. (2015). Aplicación de la econometría espacial para el análisis de la
miseria en los municipios del departamento de Antioquia *. Semestre Económico, 18(37), 103–128.
Anselin, L. (1988). Lagrange multiplier test diagnostics for spatial dependence and spatial heterogeneity.
Geographical Analysis, 20(1), 1–17. https://doi.org/10.1111/j.1538-4632.1988.tb00159.x
Anselin, L. (1996). Interactive techniques and exploratory spatial data analysis, 253–266.
Anselin, L. (1998). Exploratory spatial data analysis in a geocomputational environment.
GeoComputation, 77–94.
Anselin, L. (2001). Spatial econometrics. A Companion to Theoretical Econometrics, 310–330.
https://doi.org/10.1002/9780470996249
Anselin, Syabri, & Kho. (2006). Local indicators of spatial association-LISA. Geographical Analysis,
27(2), 93–115. Retrieved from file:///Z:/MyDocs/Journal/PDF/GIS/Anselin1995.pdf
Armadas, F., & Herrera, G. (2015). Amenazas de origen natural, (May 2016).
https://doi.org/10.13140/RG.2.1.4616.8723
Arturo, M., & Villalba, R. (2007). Control de Inundaciones del Rio Tunjuelito. Revista de Topografia
AZIMUT, 1, 1–5.
Azorín, J. D., & Sánchez de la Vega, M. del M. (2008). Efectos del capital humano sobre la productividad
del trabajo bajo condiciones de dependencia espacial: el caso de las provincias españolas. Smart
Regions for a Smarter Growth Strategy, 39(5), 561–563.
Banco Mundial. (2012). Análisis de la Gestión del Riesgo de Desastres en Colombia: Un Aporte Para La
Construcción de Políticas Públicas. Sistema Nacional de Información Para La Gestión Del Riesgo de
Desastres, 438. https://doi.org/333.3109861/A56
Baronio, A., Vianco, A., & Rabanal, C. (2012). Una Introducción a la Econometría Espacial: Dependencia
y Heterogeneidad. Catedra de Econometría, 33.
Bayliss, A. C., & Reed, D. W. (2001). The Use of Historical Data in Flood Frequency Estimation. Center
for Ecology and Hydrology, (Wallingford, England), 92.
Bohorquez Castañeda, M. P. (2010). Estadistica Espacial. Universidad Nacional de Colombia
Departamento de Estadística.
Bohórquez, I. A., & Ceballos, E. V. (2008). Algunos conceptos de la econometría espacial y el análisis
exploratorio de datos espaciales. Ecos de Economia, (27), 9–34.
Bradley, D., Russell, D., Ferguson, I., Isaacs, J., Macleod, A., & White, R. (2015). The Internet of Things
- The future or the end of mechatronics. Mechatronics, 27, 57–74.
https://doi.org/10.1016/j.mechatronics.2015.02.005
Caballero D., F. F. (2011). Selección de modelos mediante criterios de información en análisis factorial.
Aspectos teóricos y computacionales. Tesis doctoral.
Cabrera, E., Vargas, D. M., Galindo, G., García, M. C., Ordóñez, M. F., Vergara, L. K., … Giraldo, P.
(2011). Memoria técnica de la cuantificación de la deforestación histórica nacional - Escalas gruesa
y fina. Director.
109
CENAPRED. (2001). Diagnóstico de peligros e identificación de riesgos de desastres en México. Centro
Nacional de Prevención de Desastres. Retrieved from http://www.cenapred.unam.mx
Chandrasekar, V., & Cifelli, R. (2012). Concepts and principles of rainfall estimation from radar: Multi
sensor environment and data fusion. Indian Journal of Radio and Space Physics, 41(4), 389–402.
Charlton, M., Fotheringham, S., & Brunsdon, C. (2005). Geographically Weighted Regression. ESRC
National Centre for Research Methods, 73(7), 4385–4390. https://doi.org/10.1111/1467-9884.00145
Collier, C. G. (2007). Flash flood forecasting: What are the limits of predictability? Quarterly Journal of
the Royal …, 133(October), 937–948. https://doi.org/10.1002/qj
Congreso de Colombia. (1994). Ley 142 de 1994. Retrieved from
http://www.sic.gov.co/sites/default/files/normatividad/Ley_142_1994.pdf
Cressie, N. A. C. (1994). Statistics for Spatial Data. Biometrics (Vol. 50).
https://doi.org/10.2307/2533238
DNP. (2015). 3.181 muertos y 12,3 millones de afectados: las cifras de desastres naturales entre 2006 y
2014. Retrieved from https://www.dnp.gov.co/Paginas/3-181-muertos,-21-594-emergencias-y-12,3-
millones-de-afectados-las-cifras-de-los-desastres-naturales-entre-2006-y-2014-.aspx
Dray, S., Legendre, P., & Peres-Neto, P. R. (2006). Spatial modelling: a comprehensive framework for
principal coordinate analysis of neighbour matrices (PCNM). Ecological Modelling, 196(3–4), 483–
493. https://doi.org/10.1016/j.ecolmodel.2006.02.015
Espinosa Bordón, O. (2008). Los desastres naturales y la sociedad. Revista Médica Electronica, (10), 30.
Retrieved from http://www.revmatanzas.sld.cu/revista medica/ano 2008/vol4 2008/tema10.htm
Fernández Asunción, O. (2008). Triangulación de Delaunay. Blog, 1–6. Retrieved from
http://www.dma.fi.upm.es/recursos/aplicaciones/geometria_computacional_y_grafos/web/triangulaci
ones/delaunay.html
Fernández, S. de la F. (2009). Estadística descriptiva: números índices. In Departamento de Economía
Aplicada (Vol. 4349463559, p. 23). Retrieved from
http://www.fuenterrebollo.com/Economicas2013/indices-teoria.pdf
Flood observatory. (1990). Global active archive of large flood events. Women Health, 16(2), 41–58.
https://doi.org/10.1080/10888705.2011.551630
Flooding, U. (2013). Precision flood models and spatial analysis of flood risk in Great Britain.
Florax, R., & Folmer, H. (1992). Specification and estimation of spatial linear regression models.
Regional Science and Urban Economics, 22(3), 405–432. https://doi.org/10.1016/0166-
0462(92)90037-2
Foody, G. M. (2003). Geographical weighting as a further refinement to regression modelling: An
example focused on the NDVI-rainfall relationship. Remote Sensing of Environment, 88(3), 283–
293. https://doi.org/10.1016/j.rse.2003.08.004
Fotheringham, A. S., Charlton, M. E., & Brunsdon, C. (1998). Geographically weighted regression: a
natural evolution of the expansion method for spatial data analysis. Environment and Planning A,
30(11), 1905–1927. https://doi.org/10.1068/a301905
Garcia, J., Salvador, A., Díaz, J., & de la riva, J. (2006). Aplicación del proceso de jerarquía analítica en la
selección de tecnología agrícola. Agronomía Costarricense, 1, 107–114.
110
Geoda (V 1.12) [Software]. (n.d.). The center for spatial data science. Retrieved November 3, 2018, from
https://spatial.uchicago.edu/content/about
Giraldo, R. (2011). Estadística Espacial - Notas de Clase. Universidad Nacional de Colombia, 136.
Gobierno de Argentina Programa de Desarrollo Regional de la OEA. (2000). Calidad Ambiental y
Desarrollo de Cuencas Hidrográficas: un Modelo para Planificación y Análisis Integrados. Calidad
Ambiental y Desarrollo de Cuencas Hidrográficas: Un Modelo Para Planificación y Análisis
Integrados, 105. Retrieved from http://www.oas.org/dsd/publications/unit/oea69s/oea69s.pdf
González Velandia, J. C. (2014). La gestión del riesgo de desastres en las inundaciones de Colombia: una
mirada crítica. Universidad Católica De Colombia Facultad De Ingeniería Programa De Ingeniería
Civil Especialización En Recursos Hídricos, XXXIII(2), 81–87. https://doi.org/10.1007/s13398-014-
0173-7.2
Goodchild, M. F. (1987). Spatial Autocorrelation. CATMOG - Concepts and Tecniques in Modem
Geography, (Geo Books, Norwich), 30.
Guha-sapir, D., Hoyois, P., & Below, R. (2011). Annual Disaster Statistical Review 2010: The numbers
and trends. Review Literature And Arts Of The Americas. https://doi.org/10.1093/rof/rfs003
Gutierrez Puebla, J., García Palomares, J. C., & Daniel Cardozo, O. (2012). Regresión Geográficamente
Ponderada (GWR) y estimación de la demanda de las estaciones del Metro de Madrid. XV Congreso
Nacional de Tecnologías de La Información Geográfica, 1–13. Retrieved from http://www.age-
geografia.es/tig/2012_Madrid/ponencia2/GutierrezPuebla_final_par.pdf
Hunt, J. (2002). Floods in a changing climate : A review. Philosophical Transactions : Mathematical ,
Physical and Engineering Sciences, 360(1796), 1531–1543.
IDIGER. (n.d.). SAB - SIRE. Retrieved January 10, 2018, from http://www.sire.gov.co/web/sab
IDIGER. (2018). Riesgo por Inundación. Retrieved August 24, 2018, from
http://www.idiger.gov.co/rinundacion
Klement, T., Lorangb, M. S., & Stanford, Ja. A. (2009). River flood plains are model ecosystems to test
general hydrogeomorphic and ecological concepts. Limnetica, 30(2), 76–86.
https://doi.org/10.1002/rra
Kramer, W., & Sonnberger, H. (2014). The linear regression model under test. American Statistical
Association Fovnded, 84(406), 618–619.
Lee, H., & Ghosh, & S. K. (2014). Performance of information criteria for spatial models. Statistical
Computation and Simulation, (December 2014), 37–41. https://doi.org/10.1080/00949650701611143
LeSage, J., & Pace, R. K. (2009). Introduction to Spatial Econometrics. https://doi.org/10.4000/rei.3887
Márquez, H. (2011). Métodos matemáticos de evalucación de factores de riesgo para el patrimonio
Arqueologico: Una aplicación GIS del método de jerarquias analíticas de T.L Saaty. Intellectual
Property, 8(12), 2–3.
Martínez, M. T. (2015). La Complejidad de los Riesgos de Desastre y su Investigacion Interdisciplinaria.,
16. Retrieved from http://www.pirna.com.ar/files/pirna/SICSYRD_PON_MARTINEZ_Martha.pdf
Moreno, R., & Vayá, E. (2002). Econometría espacial; nuevas técnicas para el análisis regional: una
aplicación a las regiones europeas. Investigaciones Regionales, (1), 83–106.
OMS, & OPS. (2000). Los desastres naturales y proteccion de la salud. Organizacion Panamericana De
111
La Salud, 11(575), 1–144. Retrieved from
http://apps.who.int/iris/bitstream/10665/167773/1/9275315752.pdf
Ordaz, M. G., & Yamín, L. E. (2004). Eventos Máximos Considerados (EMC) y Estimación de Pérdidas
Probables para el Cálculo del Índice de Déficit por Desastre (IDD) en Doce Países de las Américas.
Banco Interamericano de Desarrollo, 27.
Paola Andrea, P. H. (2014). De los servicios públicos domiciliarios como derecho fundamental. Un
derecho de la población vulnerable: estudio comparado – Colombia frente a España. Universidad
Católica de Colombia. Retrieved from
http://repository.ucatolica.edu.co/bitstream/10983/1926/1/Servicios_Publicos_Domiciliarios_un_der
echo_de_la_Poblacion_Vulnerable.pdf
Pava, J. (2015). La Gestión de Riesgos y el Cambio Climático en los POT de Bogotá. Foro Internacional-
Reducir El Riesgo, Nuestra Mejor Opción, 19.
Posada, S., & Rosero, R. (2007). Comparación de modelos matemáticos: una aplicación en la evaluación
de alimentos para animales. Rev. Col. Cienc. Pec., 20, 141–148.
Presentación de la herramienta R | Oficina Software Libre. (n.d.). Retrieved October 1, 2018, from
https://osluz.unizar.es/proyectos/r
Puertas, O., & Carvajal, Y. (2011). Incidencia de el niño-oscilación del sur en la precipitación y la
temperatura del aire en colombia, utilizando el Climate Explorer. Revista Científica Ingeniería y
Desarrollo, 23(23), 104–118. Retrieved from
http://rcientificas.uninorte.edu.co/index.php/ingenieria/article/viewArticle/2097
QGIS (V 2.18) [Software]. (n.d.). Bienvenido al proyecto QGIS! Retrieved November 3, 2018, from
https://www.qgis.org/es/site/
R (V 3.5.0) [Software]. (n.d.). R: The R Project for Statistical Computing. Retrieved November 3, 2018,
from https://www.r-project.org/
Reyes Olvera, A. L., & Gutiérrez González, E. (2016). Modelación del riesgo de inundaciones en el estado
de Tabasco en el periodo 1961-2007. Tecnología y Ciencias Del Agua, 11(2), 99–114. Retrieved
from
https://scholar.google.es/citations?view_op=view_citation&continue=/scholar%3Fhl%3Des%26as_s
dt%3D0,5%26scilib%3D1&citilm=1&citation_for_view=3LnqAmkAAAAJ:u-
x6o8ySG0sC&hl=es&oi=p
Rivera, N. A., Mendoza, G. G., Martínez, J. F., & Servin, C. C. (2010). Evaluación multicriterio y aptitud
agroclimática del cultivo de caña de azúcar en la región de Huasteca (México). Corpoica Ciencia y
Tecnología Agropecuaria, 11(2), 144. https://doi.org/10.21930/rcta.vol11_num2_art:207
Rojas, O., Mardones, M., Luis, J., & Aguayo, M. (2014). Una revisión de inundaciones fluviales en Chile ,
período 1574-2012 : causas , recurrencia y efectos geográ fi cos 1, 192, 177–192.
https://doi.org/10.4067/S0718-34022014000100012
Saaty, T. L. (2008). Decision making with the analytic hierarchy process. International Journal of
Services Sciences, 1(1), 83. https://doi.org/10.1504/IJSSCI.2008.017590
Sánchez Peña, L. L. (2006). Métodos para el análisis espacial. Una aplicación al estudio de la geografía de
la pobreza. I Congreso de La Asociación Latinoamericana de Población, 17. Retrieved from
http://www.alapop.org/Congreso06/DOCSFINAIS_PDF/ALAP_2006_mt10s10_1_04.pdf
Sedano Cruz, K., Carvajal Escobar, Y., & Ávila Díaz, Á. (2016). Análisis de aspectos que incrementan el
112
riesgo de inundaciones en Colombia, (November), 219–238.
https://doi.org/10.17151/luaz.2013.37.13
SIRE-IDIGER. (2014). Riesgo por Inundación - Idiger. Retrieved from
http://www.idiger.gov.co/rinundacion
Sistema Nacional de Información para la Gestión del Riesgo de Desastres. (n.d.). Retrieved January 10,
2018, from http://gestiondelriesgo.gov.co/snigrd/
Smith, D. (1994). Flood damage estimation - A review of urban stage damage curves and loss functions.
Wates S.A., 20, 231–238.
Thieken, A., & Merz, B. (2006). Methods for flood risk assessment: concepts and challenges.
International Workshop on Flash Floods in Urban Areas, (May 2016). Retrieved from
http://www.researchgate.net/profile/Heiko_Apel/publication/228677524_Methods_for_flood_risk_as
sessment_Concepts_and_challenges/links/02e7e51c1a4f7c8817000000.pdf
Valenzuela, E., & Silva, A. (2005). Evaluación De Riesgos De Origen Natural Y Plan De Contingencia.
Vega, J. C., & Guzmán, J. (2011). Regresión PLS y PCA como solución al problema de multicolinealidad
en regresión múltiple. Revista de Matemática: Teoría y Aplicaciones, 18(1), 9–20.
https://doi.org/10.1016/j.semreu.2010.04.004
Yrigoyen, C. C. (2003). Econometría Espacial Aplicada a la Predicción - Extrapolación de Datos
Microterritoriales (Consejería). Madrid (España): Comunidad de Madrid. Consejería de Economía e
Innovación Tecnológica.