MODELACIÓN DEL RIESGO DE INUNDACIÓN EN...

MODELACIÓN DEL RIESGO DE

INUNDACIÓN EN BOGOTÁ D.C. EN EL

PERIODO DEL 2007 - 2016.

JUAN CAMILO QUINTERO QUIROGA

PROYECTO DE GRADO PARA OPTAR AL TÍTULO DE

INGENIERO CATASTRAL Y GEODESTA

DIRECTOR:

PhD. CARLOS EDUARDO MELO MARTÍNEZ

UNIVERSIDAD DISTRITAL FRANCISCO JOSÉ DE CALDAS

FACULTAD DE INGENIERÍA

BOGOTÁ D.C. COLOMBIA

2018

Universidad Distrital Francisco José de

Caldas

FACULTAD DE INGENIERÍA

INGENIERÍA CATASTRAL Y GEODESIA

Proyecto de Grado

MODELACIÓN DEL RIESGO DE INUNDACIÓN EN

BOGOTÁ D.C. EN EL PERIODO DEL 2007 - 2016.

DIRECTOR:

PhD. Carlos Eduardo Melo Martínez

PRESENTADO POR:

Juan Camilo Quintero Quiroga 20131025073

Bogotá D.C., 2018

III

Dedicatoria

A Dios, quien inspiro mi espíritu a la realización de este estudio, por

darme salud y bendición para alcanzar mis metas como persona y futuro

profesional. “Porque eres el principio y el fin, escrito esta” –

Apocalipsis 22:13; “Lampara es a mis pies tu palabra, y lumbrera a mi

camino” – Salmos 119:105 y “eres el único que estará con nosotros

todos los días, hasta el fin del mundo” – Mateo 28:20.

A mi madre María Quiroga, por su valentía, fortaleza, apoyo e

inagotable amor, por siempre escucharme y alentarme en todas las

circunstancias, su incondicional compañía en cada etapa de mi vida, su

voz de aliento.

A mi padre Javier Quintero por su apoyo económico y sus consejos de

vida.

A mi hermano Carlos Quintero quien ofreció su apoyo incondicional,

comprensión y ayuda; siendo más que un hermano mi mejor amigo.

A mis amigos, por acompañarme en esta etapa de formación académica

tan trascendental, por apoyarme a continuar en este proceso, ser otra

voz de aliento; especialmente a la familia FIT360 quienes además de

enseñarme el amor hacia el deporte y a nunca desfallecer, me han

apegado a Dios, siendo él, el único que todo lo ve.

IV

Agradecimientos

En primera instancia quiero agradecerle al director de este trabajo, Carlos Eduardo Melo Martínez,

por su amplia y oportuna orientación en los tópicos desarrollados en este proyecto de grado,

agradecido por tener un profesor que se preocupó y estuvo pendiente del trabajo, respondiendo a

las preguntas e inquietudes tanto en el transcurso de este como en las materias enseñadas.

Expresar mi gratitud con el Instituto Distrital de Gestión del Riesgo y Cambio Climático por

permitirme adquirir y procesar la información, quien sin su pronta respuesta y diligencia no hubiera

sido posible la realización de esta investigación. De la misma manera, al alma mater de mi

educación superior, la Universidad Distrital Francisco José de Caldas y mi proyecto curricular

Ingeniería Catastral y Geodesia por guiarme académica, profesional y éticamente el camino a

seguir.

V

Índice general

Capítulo I ................................................................................................................................................... 11

Presentación ............................................................................................................................................... 11

1.1. Introducción ............................................................................................................................... 11

1.2. Planteamiento del problema ..................................................................................................... 12

1.3. Justificación ............................................................................................................................... 13

1.4. Objetivos .................................................................................................................................... 14

1.4.1. Objetivo general ................................................................................................................ 14

1.4.2. Objetivos específicos .......................................................................................................... 14

1.5. Antecedentes .............................................................................................................................. 14

Capítulo II .................................................................................................................................................. 16

Marco Teórico ........................................................................................................................................... 16

2.1. Inundación ................................................................................................................................. 16

2.2. Econometría Espacial ................................................................................................................ 18

2.3. Autocorrelación Espacial .......................................................................................................... 18

2.4. Heterogeneidad Espacial .......................................................................................................... 19

2.5. Análisis exploratorio de Datos Espaciales (AEDE) ................................................................ 19

2.6. Matriz de Contigüidad (Pesos espaciales w) ........................................................................... 20

2.7. Criterios de Contigüidad .......................................................................................................... 20

2.8. Análisis de autocorrelación espacial ........................................................................................ 21

2.8.1. Contraste Global ................................................................................................................ 21

2.8.2. Contraste Local .................................................................................................................. 23

2.9. Evaluación Multicriterio – Método de Jerarquía Analítica (AHP por sus siglas en ingles) 24

2.10. Covariograma y Correlograma. ........................................................................................... 26

2.11. Análisis confirmatorio de datos espaciales. ......................................................................... 26

2.11.1. Modelo de Regresión Espacial .............................................................................................. 27

2.12. Regresión geográficamente ponderada (GWR por sus siglas en ingles) .......................... 30

Capítulo III ................................................................................................................................................ 31

Fuentes de Información ............................................................................................................................ 31

3.1. Softwares Utilizados ....................................................................................................................... 31

Capítulo IV ................................................................................................................................................. 33

Metodología ................................................................................................................................................ 33

4.1. Área de Estudio ......................................................................................................................... 33

4.2. Estructuración Base de Datos y especialización de los datos. ................................................ 34

VI

4.3. Análisis Exploratorio de Datos Espaciales .............................................................................. 44

4.3.1. Análisis estadístico descriptivo ............................................................................................. 44

4.3.2. Matriz de pesos espaciales .................................................................................................... 45

4.3.3. Análisis Global y Local ......................................................................................................... 46

4.4. Análisis Confirmatorio .............................................................................................................. 46

4.4.1. Construcción Modelo Autorregresivo Espacial .................................................................. 47

4.4.2. Selección Modelo Autorregresivo Espacial ......................................................................... 47

4.4.3. Validación del Modelo Autorregresivo Espacial ................................................................ 48

4.5. Interpretación del Modelo ........................................................................................................ 48

4.6. Cálculo de Impactos .................................................................................................................. 48

Capítulo V .................................................................................................................................................. 49

Resultados y Análisis ................................................................................................................................. 49

5.1. Análisis Exploratorio de Datos Espaciales .............................................................................. 49

5.1.1. Selección de Matriz de Pesos Espaciales ............................................................................. 54

5.1.2. Análisis Exploratorio Global ................................................................................................ 58

5.1.3. Análisis Exploratorio Local .................................................................................................. 62

5.1.4. Análisis Bivariado .................................................................................................................. 66

5.2. Análisis Confirmatorio de los Datos ........................................................................................ 68

5.2.1. Modelo Regresivo Clásico ..................................................................................................... 68

5.2.2. Modelo Regresivo Espacial ................................................................................................... 77

5.3. Impactos ..................................................................................................................................... 86

5.4. Regresión Geográficamente Ponderada .................................................................................. 89

5.5. Discusión y Contextualización del Modelo .............................................................................. 99

Capítulo VI ............................................................................................................................................... 102

Conclusiones y Recomendaciones .......................................................................................................... 102

A. Anexo: Correlogramas bivariados ................................................................................................. 104

Bibliografía .............................................................................................................................................. 108

VII

Lista de Figuras

Autocorrelación espacial. ............................................................................................................................ 19

Matriz de contigüidad de torre de orden 1 (B1), orden 2 (B2) .................................................................... 20

Matriz de contigüidad de alfil de orden 1 (B1), orden 2 (B2) ..................................................................... 21

Matriz de contigüidad de Reina de orden 1 (B1), orden 2 (B2). ................................................................. 21

Tratamiento de la autocorrelación espacial - primera tipología de modelos ............................................... 28

Ubicación Espacial de la región de estudio. ................................................................................................ 34

Distribución espacial del NivRiesgo en las localidades de Bogotá: 2007 - 2011 ...................................... 50

Distribución espacial del NivRiesgo en las localidades de Bogotá: 2014 - 2016 ...................................... 51

Histograma, Grafico Q-Q y Boxplot del NivRiesgo 2007 .......................................................................... 52




Gráficos, criterios seleccionados por año .................................................................................................... 56

Correlogramas de la variable respuesta. ...................................................................................................... 57

Análisis de autocorrelación espacial de la variable respuesta. .................................................................... 58

Mapa Clúster espacial LISA ........................................................................................................................ 62

Mapa Significancia LISA ............................................................................................................................ 63

Mapa Cluster Local (Getis) ......................................................................................................................... 64

Mapa Significancia Local (Getis) ................................................................................................................ 65

Mapa Análisis de autocorrelación en los Residuos. .................................................................................... 77

Distribución espacial del R-Cuadrado en Bogotá D.C., GWR - 2007. ....................................................... 91

Distribución espacial del coeficiente locales y P-Valores de las variables PPH y PRECP, modelo GWR -

2007. ............................................................................................................................................................ 91

Distribución espacial del R-Cuadrado en Bogotá D.C., GWR – 2011 ........................................................ 92

Distribución espacial del coeficiente locales y P-Valores de las variables PO_DET y PO_NDGN, modelo

GWR – 2011. ............................................................................................................................................... 93

Distribución espacial del coeficiente locales y P-Valores de la variable PRECP, modelo GWR – 2011. .. 94


Distribución espacial del coeficiente locales y P-Valores de las variables AL_PH y PO_NDAL, modelo

GWR – 2014. ............................................................................................................................................... 95

Distribución espacial del coeficiente locales y P-Valores de las variables PO_NDGN y PO_NDRB,

modelo GWR – 2014. .................................................................................................................................. 96

Distribución espacial del coeficiente locales P-Valores de las variables PPH y TEMP, modelo GWR –

2014. ............................................................................................................................................................ 96

Distribución espacial del coeficiente locales y P-Valores de la variable PRECP, modelo GWR – 2014. .. 97


Distribución espacial del coeficiente locales P-Valores de las variables PO_DET y PO_NDGN, modelo

GWR – 2016. ............................................................................................................................................... 98

Distribución espacial del coeficiente locales P-Valores de las variables PPH y TEMP, modelo GWR –

2016. ............................................................................................................................................................ 99

Moran Bivariado 2007............................................................................................................................... 104

Moran Bivariado 2011............................................................................................................................... 105

Moran Bivariado 2014............................................................................................................................... 106

Moran Bivariado 2016............................................................................................................................... 107

VIII

Lista de Tablas

Contrastes Globales análisis autocorrelación espacial ................................................................................ 23

Escala de 9 puntos para comparaciones apareadas. ..................................................................................... 25

Índices aleatorios de consistencia. ............................................................................................................... 26

Selección de la Variable respuesta. ............................................................................................................. 35

Matriz reciproca de comparaciones apareadas de eventos de inundación .................................................. 36

Multiplicación matricial entre la matriz A y el eigenvector W. .................................................................. 36

Datos para hallar NivRiesgo 2007-2011 ..................................................................................................... 37

Datos para hallar NivRiesgo 2014-2016 ..................................................................................................... 38

Variables explicativas seleccionadas para el estudio. ................................................................................. 39

Resumen de medidas estadísticas de la variable de estudio para cada año ................................................. 54

Criterios de Selección de matriz W 2007-2011 ........................................................................................... 55

Criterios de Selección de matriz W 2014-2016 ........................................................................................... 56

Contrastes globales de variabilidad respuestas y explicativo año 2007 ...................................................... 59




Moran Bivariado 2007 – 2011 ..................................................................................................................... 66

Moran Bivariado 2014 – 2016 ..................................................................................................................... 67

Estimación modelo de regresión Clásico (Año 2007) ................................................................................. 69

Supuestos modelo regresión clásico (Año 2007) ........................................................................................ 70

Supuestos VIF de Multicolinealidad (Año 2007) ........................................................................................ 71










Test Global de Moran para los residuos de las regresiones. ........................................................................ 78

Diagnóstico inicial de dependencia espacial: Multiplicadores de Lagrange. .............................................. 79

Comparación Modelos Espaciales. Criterio Akaike (AIC) ......................................................................... 79

Comparación Modelos Espaciales. Criterio Bayesiano (BIC) .................................................................... 80

Estimación modelo de regresión espacial para el año 2007 (GNS) ............................................................ 81


Estimación modelo de regresión espacial para el año 2014 (SDM) ............................................................ 84


Impactos - 2007 ........................................................................................................................................... 87

Impactos - 2011 ........................................................................................................................................... 88

Impactos - 2014 ........................................................................................................................................... 88

Impactos - 2016 ........................................................................................................................................... 89

Estimación regresión geográficamente ponderada (GWR) - 2007 .............................................................. 90



IX


11

Capítulo I

Presentación

El objetivo de este capítulo es servir de introducción a esta tesis. Durante su desarrollo se expondrá

el contexto, planteamiento del problema, alcance, objetivos, justificación y la estructura de la

presente investigación. Inicialmente se formulará una problemática que será la base del presente

trabajo investigativo, se presentarán las razones del por qué se desarrollará esta investigación y se

justificará el planteamiento de este. En lo referente a los objetivos, se especificarán aquellos de

carácter general, y que se pretende alcanzar a lo largo de la tesis; finalmente, se presentaran los

antecedentes cuyo objetivo es situar al lector en un pasado que vinculara la problemática con las

soluciones planteadas hasta el momento.

1.1. Introducción

Un desastre natural hace referencia a las enormes pérdidas materiales, naturales y de vidas humanas

ocasionadas por eventos o fenómenos naturales; tal es su magnitud, que afectan gravemente las

estructuras básicas y el funcionamiento normal de una sociedad, comunidad o territorio causados

por la naturaleza o los procesos naturales de la tierra (Espinosa Bordón, 2008), estos generan

efectos de gran impacto como lo son las reacciones sociales, enfermedades transmisibles,

desplazamientos de la población, exposición a la intemperie, entre otros (OMS & OPS, 2000), de

acuerdo con la United Nations Office for Disaster Risk Reduction - UNISDR, los desastres no son

naturales, sino que son el resultado de las omisiones y la falta de prevención y planificación ante

los fenómenos de la naturaleza. Los efectos de un desastre pueden amplificarse debido a una mala

planificación de los asentamientos humanos, falta de medidas de seguridad, planes de emergencia

y sistemas de alerta temprana (Bradley et al., 2015).

En la actualidad hay herramientas que permiten amortiguar los posibles efectos que tienen los

desastres naturales en nuestra sociedad, además los avances tecnológicos e investigativos de esta

índole, el continuo monitoreo de esto nos ayuda a visualizar la magnitud de los desastres alrededor

del mundo como por ejemplo el Global Active Archive of Large Flood Events, de la universidad

de Colorado (Flood observatory, 1990) donde se puede observar un histórico de grandes desastres

de esta índole alrededor del mundo y los efectos que estos han tenido. Se sabe por estadísticas

internacionales como la base de datos EM-DAT, que a nivel mundial las inundaciones se

encuentran en el primer lugar entre los 10 mayores desastres en un periodo estudiado de 22 años

(1990-2012) por el número de personas afectadas y las pérdidas económicas tan elevadas. Para

Colombia, hasta el año 2012 ocupó el décimo y octavo lugar a nivel mundial por el número de

muertos y daños respectivamente generados por desastres hidrometeorológicos (Guha-sapir,

Hoyois, & Below, 2011).

Por consiguiente, evaluar el riesgo que posee la población frente a las inundaciones y sus efectos

es fundamental para realizar programas y planes que busquen soluciones a las poblaciones con

mayor afectación de este tipo. Así mismo, al identificar las consecuencias con respecto a los

12

factores de riesgo posibilita la intervención en el territorio y mejora la toma de decisiones. Para el

caso de estudio Bogotá D.C, se propone analizar por medio de análisis de área el riesgo que ha

tenido la población en este tipo de desastre natural. Se desarrollará un modelo de autorregresión

espacial que modele la variabilidad de los datos y que identifique los principales factores que

determinan esta problemática en las diferentes localidades del territorio objeto de estudio.

Se realizará un estudio retrospectivo del riesgo por inundación en 19 de las 20 localidades de

Bogotá, en el intervalo de tiempo de 2007 – 2016; identificando la dependencia espacial entre los

datos. Los modelos de regresión espacial se estimarán usando una serie de variables predictoras

(que deben llegar a explicar el fenómeno) de índole Social, Ambiental y Económicos con el fin de

esperar que los resultados ilustren las variables y sus relaciones espaciales con las demás;

observando el grado de incidencia positiva o negativa en este riesgo y cómo estas pueden ayudar a

identificar las necesidades de la población afectada con el fin de desarrollar acciones y planes

beneficiosos para la comunidad teniendo en cuenta estos factores.

1.2. Planteamiento del problema

En Bogotá, el crecimiento urbano ha aumentado desde 1938 con una población de 325.650

habitantes hasta el 2014 de 7.776.845 habitantes esto quiere decir que ha aumentado en más del

100% en los últimos 76 años, Bogotá cuenta con un área total de 1.605 km^2 de los cuales 307

km^2 corresponden al área urbana, constituida por 20 localidades y 2.361.293 predios; En los

últimos estudios el 33% del área total de la ciudad presenta amenaza por inundación o remoción

en masa, de los cuales 1.394.760 habitantes de Bogotá viven en zonas inundables y 297.979 en

amenaza alta por inundación, esto conlleva a que hayan 28.299 predios en estas zonas, que son el

14% (Pava, 2015). Para esto es indispensable el desarrollo de nuevas metodologías que permitan

identificar los determinantes que llevan a que el riesgo por inundación aumente en la capital, resulta

necesario en lo que concierne posibilitar a las entidades que vigilan estas problemáticas y riesgos

naturales a información sobre los factores inmersos en el riesgo por inundación en el distrito capital

colombiano en un periodo del 2007 al 2016 (nueve años) con el fin de adoptar estrategias y/o planes

de gobierno que deriven acciones favorables para mitigar el riesgo además de preverlo en cuanto

el crecimiento constante que posee esta.

Un ejemplo clave de estos sucesos han sido las múltiples inundaciones que se han observado dentro

de la ciudad, se sabe que en la localidad de Bosa se presentan varias amenazas tecnológicas de

origen sísmico e inundaciones, en cuanto a las áreas de amenaza por inundación están relacionadas

con el humedal Tibanica, del cual el 5% de la localidad presenta amenaza alta y el 40% amenaza

media, estas amenazas son causadas principalmente por el rio Bogotá y Tunjuelo (Valenzuela &

Silva, 2005), también se resalta el gran problema alrededor del río Tunjuelito que ha generado

históricamente problemas por desbordamiento desde el año 1959, generando grandes impactos

sobre la población en localidades como Tunjuelito, Usme, Ciudad Bolívar entre otras y en múltiples

barrios ubicados alrededor de este (Arturo & Villalba, 2007).

Debido a la constante amenaza que se ha generado en algunos sectores de la ciudad, se plantea usar

la técnica de la estadística espacial análisis de datos de área, que es empleada para el análisis

regresivo en datos agregados (Cressie, 1994), y ampliamente desarrollado en distintos estudios de

diferentes índoles como la modelación de riesgos y los análisis espaciales de estos dado que este

13

método permite resumir e identificar los determinantes de algunos riesgos naturales distribuidos

directamente a través del espacio (Flooding, 2013), siendo así más fácil su manipulación y por lo

tanto la obtención de conclusiones prosiguiendo con una buena toma de decisiones (Anselin, 1998).

También por la naturaleza y el tipo de datos a manejar en esta investigación, hace que la técnica a

usar sea ideal pues los resultados permitirán la formulación y el mejoramiento de los planes y las

políticas existentes hasta el momento.

1.3. Justificación

En Colombia los desastres naturales y sus impactos ocurren cada vez con mayor frecuencia, se sabe

que entre el 2006 y el 2014 el 26% de la población total colombiana ha sido afectada por alguno

de dichos desastres, del cual la cuarta parte de esta: 12.298.849, han resultado damnificados y que

en resumidas de esta cifra solo el 19% de la población calculada aproximadamente en 9.390.554,

son el total de personas afectadas por inundaciones (DNP, 2015), esto gracias a una mala

planeación del territorio en donde se ubican viviendas en zonas con alto porcentaje a ser afectadas

por algún tipo de desastre natural, este riesgo amenaza continuamente las vidas, la sociedad, la

economía y varios aspectos que hacen que la calidad de vida disminuya notablemente.

En cuanto a los incidentes ocurridos en Bogotá se registraron desde el 2002 hasta el 2014 10.501

eventos de los cuales el 50.4% corresponde a inundaciones (SIRE-IDIGER, 2014), se ha estudiado

y varias de las causas de dichos eventos son: las lluvias fuertes y de gran duración, que a su vez

genera que los volúmenes de agua que fluyen por los ríos, quebradas y humedales aumenten sin

tener la capacidad suficiente para poder recolectarla y transportarla, la mala disposición en los

cauces de residuos sólidos y escombros hace que las corrientes y salidas de estos líquidos no sea

eficiente generando una acumulación en zonas no aptas para la circulación y acumulación de este,

La destrucción y el deterioro de los Jarillones que se construyen a la largo de los ríos como una

solución a corto plazo y las lluvias en áreas con pendientes considerables que con llevan a otro

riesgo mayor que no trataremos (SIRE-IDIGER, 2014).

Esto nos ha evidenciado que los riesgos por desastres naturales como las inundaciones afectan a

muchas personas a lo largo de los años dependiendo el lugar y sus características físicas; es por eso

que se deben proponer soluciones inteligentes e innovadoras que puedan tener un efecto notable a

lo largo del tiempo y en la sociedad, esto se puede lograr en conjunto con el gobierno, la comunidad,

las empresas y organizaciones además de los avances tecnológicos que a nivel mundial son de

gran ayuda para mejorar la calidad de vida y prevenir desastres como estos.

Por lo anterior y dándonos cuenta de la magnitud de estos desastres el presente trabajo pretende

encontrar una medida que represente el riesgo y sus cambios a través del tiempo, para identificar

las zonas de mayor riesgo, con el fin de prevenir desastres naturales por inundación en zonas

afectadas continuamente, mediante la implementación de estadística espacial, sistemas de

información geográfica y una adecuada gestión del riesgo que mediante los datos y variables

relevantes a esta problemática como la precipitación, calidad de vida, nivel del agua entre otros

(CENAPRED, 2001), nos lleve a lograr cumplir con los objetivos.

14

1.4. Objetivos

1.4.1. Objetivo general

Modelar el riesgo de inundación en Bogotá D.C. en un periodo del 2007 hasta el 2016.

1.4.2. Objetivos específicos

➢ Identificar las posibles variables exógenas y su relación frente a la problemática de estudio,

para así realizar un análisis de comportamiento espacial de estas.

➢ Analizar y modelar los datos para observar y determinar la auto correlación espacial

existente.

➢ Realizar las pruebas y análisis estadísticos comparativos de los modelos econométricos

espaciales posibles para el caso de estudio.

➢ Determinar los factores que contribuyen a la ocurrencia de estos eventos para poder ejercer

un mayor control a esta problemática.

➢ Ilustrar el comportamiento de este fenómeno a través del tiempo en la zona de estudio.

➢ Reconocer las zonas ubicadas en Bogotá que estén en un índice alto de riesgo por

inundación.

1.5. Antecedentes

El crecimiento de la población y de los bienes localizados en áreas expuestas a fenómenos

hidrometeorológicos son factores determinantes en el aumento del riesgo (Banco Mundial, 2012),

en la actualidad la susceptibilidad a inundaciones, deslizamientos y otros fenómenos han crecido

constantemente debido a la intervención humana sobre el territorio y al consecuente deterioro

ambiental. Los múltiples intentos y esfuerzos enfocados a fortalecer los procesos de planificación

ambiental y sociales han creado una cadena de sucesos que aumentan el riesgo ya que conllevan a

afectaciones ambientales tales como la desecación de humedales y ciénagas, la pérdida de bosques

y coberturas vegetales (Cabrera et al., 2011), afectando de manera importante las fuentes de agua

y la estabilidad del terreno, lo que lo hace susceptible a deslizamientos e, inundaciones en zonas

en las que antes no se observaban dichos problemas.

Si bien el riesgo es la suma de múltiples factores que dependiendo el estudio y su enfoque generan

variabilidad en ello, para el caso de estudio por riesgo de inundación se sabe que los factores más

relevantes, que posteriormente están explicados, son vulnerabilidad, costo de los bienes expuestos

y Peligro (Reyes Olvera & Gutiérrez González, 2016), que asociado a estos hay múltiples variables

que pueden explicar el fenómeno a modelar; el conocimiento de la variación y distribución a través

del espacio de este riesgo ha aumentado significativamente el entendimiento del desarrollo y

factores de la misma, aunque haya múltiples estudios de estos casos.

Para la mitigación de esta problemática se han propuesto también múltiples soluciones,

actualmente en Colombia y en Bogotá se encuentran grandes sistemas de alarmas como lo es el

15

Sistema Nacional de Información para la Gestión del Riesgo de Desastres - NGRD (“Sist. Nac.

Inf. para la Gestión del Riesgo Desastr.,” n.d.), el Sistema de Alerta Temprana para el Valle de

Aburrá - SIATA y el Sistema de Información para la Gestión del Riesgo y cambio climático - SIRE

(IDIGER, n.d.) de Bogotá que ofrecen páginas web con acceso a información de gran ayuda para

estar monitoreando indicios de posibles desastres naturales por inundación en tiempo real, además

de la página del Instituto de Hidrología, Meteorología y Estudios Ambientales - IDEAM, aunque

se resalta que actualmente ninguno de estos sistemas ofrece información de libre acceso de los

datos sobre las alertas anticipadas, el número de eventos predichos, el tiempo de respuesta de la

comunidad ante una emergencia o la confiabilidad de los pronósticos y de los datos que se emiten.

16

Capítulo II

Marco Teórico

En este capítulo se describirán los conceptos a desarrollar y emplear en el presente trabajo; los

temas relacionados a la problemática, los métodos estadísticos, estadísticos espaciales y métodos

adicionales que contribuirán a logar los objetivos planteados, estos seguirán una estructura y orden

respecto a su aplicación en esta, con el fin de que el lector comprenda la base teórica que se

empleara en este proyecto.

2.1. Inundación

Se sabe que las inundaciones son una amenaza constante y constituyen un fenómeno que se

desencadena de forma rápida y repentina a nivel global, representa una amenaza frecuente y de

mayor gravedad a nivel mundial siendo así la causante de miles de muertes y millones de dólares

en pérdidas económicas por daños (Chandrasekar & Cifelli, 2012), adicional un área se considera

más vulnerable cuando esta experimenta mayores pérdidas (Thieken & Merz, 2006), en la

actualidad se han desarrollado grandes avances y diversas investigaciones para evaluar estos

eventos y la forma de evaluar el riesgo que este conlleva, siendo el estudio de las inundaciones

complejo, ya que son muchas las variables que se ven afectadas por estos eventos como el daño

económico directo a los bienes inmuebles que no solamente depende de la profundidad del agua

sino también la destinación económica de estos, agregándoles características del inmueble,

variables socioeconómicas, calidad de la respuesta de emergencia, entre otras (Smith, 1994).

Existen diferentes formas de examinar las inundaciones, una de ellas es siendo analizadas como un

desastre natural en el que se deben identificar los peligros y la vulnerabilidad para poder superarlos

(Hunt, 2002), mientras que el UNISDR lo maneja como una falta de planificación de los

asentamientos urbanos lo que conlleva a unas condiciones de vulnerabilidad y exposición haciendo

importante mencionar que los efectos de estas en la sociedad no pueden ser representados con cifras

(monetario) por su complejidad. Por otra parte, hay estudios y discusiones sobre el análisis de

frecuencias de inundaciones utilizando diferentes métodos para incorporar datos históricos por

medio de estudios de los históricos de inundaciones (Bayliss & Reed, 2001), además de la

incorporación de información meteorológica que fortalecería la estimación del riesgo, siendo la

lluvia un indicador fiable de inundaciones (Collier, 2007).

Sin embargo, cuando se presenta un daño de cualquier magnitud, hay una interacción entre

amenaza o peligro (A) y la vulnerabilidad (V) lo que nos conduce a la configuración del riesgo

(Armadas & Herrera, 2015), de igual forma no habría ningún riesgo si no existe una de las dos

interacciones, es decir si no hay amenaza no habría vulnerabilidad y viceversa por eso es

indispensable que los dos factores interaccionen entre sí; aunque varios estudios para el cálculo de

riesgo por algún fenómeno natural (Ordaz & Yamín, 2004) incluyen un tercer factor siendo este el

costo (C) o valor de los bienes expuestos, con esto se puede concluir que el riesgo es un producto

de 3 factores:

17

Riesgo = A x V x C (1)

Cabe aclarar que estadísticamente es difícil modelar la representación del riesgo y su cambio a

través del tiempo debido a la gran cantidad de variables que deberían intervenir en los modelos,

para eso es posible introducir números índices, siendo estos una medida estadística que permite

comparar una magnitud simple o compleja en dos situaciones diferentes respecto al tiempo o al

espacio tomando una de ellas como referente (Fernández, 2009), por eso han llegado a ser

importantes siendo estos posibles indicadores de los diferentes cambios que rodean la sociedad.

• Vulnerabilidad

La vulnerabilidad no es general, esta debe entenderse en función de cada tipo de amenaza, de igual

forma esta se podría definir como “la susceptibilidad o la predisposición intrínseca de un elemento

de ser afectado gravemente” (Armadas & Herrera, 2015), que para su posible análisis se consideran

2 variables que se pueden ajustar a este término; por un lado, los servicios con los que cuenta la

comunidad (Energía, Acueducto, Alcantarillado y Recolección de basura, adicionalmente se podría

considerar el servicio de gas natural) y , por el otro, los principales fuentes hídricas (ríos y lagunas),

ya que entre todo, los hogares son totalmente vulnerables a una situación como esta, cuando estas

no tienen los servicios públicos básicos obligatorios para poder subsistir y en el caso de estudio los

grandes riesgos vendrían de la mano con los afluentes hídricos localizados en estas zonas.

• Costos

Cuando se habla de la variable costo, hace referencia a los costos de los bienes expuestos ya que

este mide la cuantía de lo que es susceptible de afectarse durante la ocurrencia de un fenómeno

perturbador (CENAPRED, 2001), entonces se consideran los bienes con los que cuenta la

población en la mayoría de los casos ( lavadora, nevera, equipo de sonido, televisor, computador,

motocicleta y carro) y el número de habitantes por localidad, esto se toma ya que se cuenta con el

supuesto de que “a mayor población, mayor riqueza”, esto quiere decir que las zonas donde haya

una mayor densidad poblacional se podría suponer que habrá un mayor número de bienes básicos

en los hogares.

• Peligro

Se define como la probabilidad de ocurrencia excesiva en situaciones potencialmente dañinas en

un área determinada y dentro de un periodo de tiempo específico (Thieken & Merz, 2006), se

identificó que para el análisis de este componente se utilizara todo lo relacionado al entorno de las

inundaciones, para esto con el fin de calcular un valor para el peligro tomando a la lluvia

(precipitación) como el influenciador fundamental del evento, adicional a este la temperatura

registrada.

18

2.2. Econometría Espacial

En el estudio de cualquier fenómeno la ubicación geográfica de los agentes constituye un aspecto

importante ya que estos pueden tener repercusiones sobre sus vecinos directos o incluso sobre

otros, siendo estos no tan remotos; actualmente su especialización juega un papel importante dentro

de las especificaciones de los modelos econométricos, ya que podría existir algún efecto espacial

que deba incluirse al modelo para una validez más allegada a la realidad (Bohórquez & Ceballos,

2008). Ante esta realidad y gracias a los avances tecnológicos se ve la necesidad de contar con

herramientas para el procesamiento, descripción y análisis de la información ya que los métodos

tradicionales de la estadística descriptiva no tienen en cuenta la localización geográfica de los

datos.

La econometría espacial se puede definir como la parte de la econometría que se dedica al estudio

de los fenómenos económicos espaciales, que aunque todas las actividades económicas se

desarrollan en un espacio determinado, los fenómenos económicos espaciales pueden definirse

como aquellos en los que la variable espacio, juega un rol tan importante que su exclusión podría

dar lugar a modelos econométricos con errores de especificaciones severos (Baronio, Vianco, &

Rabanal, 2012), adicional se conoce como una colección de técnicas que se ocupan de las

peculiaridades causadas espacialmente en el análisis estadístico de los modelos científicos

regionales (Anselin, 2001), esto nos asegura que los fenómenos económicos como sociales puedan

llegar a ser modelados obteniendo resultados muy cercanos a la realidad, por medio de modelos

que cumplan con los supuestos, adicional a la variable geográfica que juega un papel importante

para llegar a resultados aceptables en esta labor.

2.3. Autocorrelación Espacial

La autocorrelación espacial puede interpretarse como un índice descriptivo, que mide aspectos de

la distribución espacial de los objetos – fenómenos, pero al mismo tiempo se puede ver como un

proceso causal que mide el grado de influencia que ejerce algo sobre sus vecinos (Goodchild,

1987), en donde esta refleja el grado en que objetos o actividades en una unidad geográfica son

similares a otros en unidades geográficas próximas. Lo que implica en la existencia de una relación

funcional entre la ocurrencia de un evento en una región determinada con la ocurrencia de eventos

del mismo fenómeno en otra región contigua.

Dicha autocorrelación espacial puede ser positiva, lo que nos indica una concentración de los

valores similares en las diferentes regiones de estudio (Valores altos rodeados de altos y en sentido

contrario) a manera de ejemplo acoplado a nuestro ámbito, se podría decir que al valor de las

propiedades inmuebles en la ciudad, siendo este dependiente de diferentes factores como la

ubicación, la disponibilidad de servicios, el comercio entre otros, de esta forma un inmueble

tenderá a tener un valor más o menos similar al inmueble colindante (siempre que tengan

características similares o no muchas que los diferencie) mientras que los valores de los inmuebles

en la parte rural por medio al valor de las tierras en donde David Ricardo construyó el concepto de

renta se ajustaría a este.

Mientras que sí la autocorrelación espacial llegara a ser negativa nos indicaría que hay una

concentración de valores diferentes o disimilares en el espacio (valores altos rodeados de bajos y

19

viceversa) siendo como ejemplo claro la representación de un tablero de ajedrez; Chasco Yrigoyen

afirma que la dependencia espacial está determinada por una noción de espacio relativo o de

localización relativa, que realza el efecto de la distancia (Yrigoyen, 2003).

Figura 1: Autocorrelación espacial.

Autocorrelación Positiva

Autocorrelación Negativa Fuente: Elaboración propia

2.4. Heterogeneidad Espacial

Se define como la ausencia de estabilidad en el espacio implicando que los fenómenos espaciales

y sus variables asociadas varían con la localización geográfica no siendo homogéneos para toda la

matriz de datos (Yrigoyen, 2003), siendo las unidades espaciales en observación distantes a ser

homogéneas además de la falta de uniformidad de los efectos del espacio, en donde, este problema

podría en gran parte ser resuelto mediante procedimientos de la econometría estándar

2.5. Análisis exploratorio de Datos Espaciales (AEDE)

Se puede definir como el conjunto de técnicas o herramientas estadístico-gráficas que describen y

visualizan las distribuciones espaciales de uno o más fenómenos, en donde, se identifican

localizaciones atípicas o “atípicas espaciales”, descubren esquemas de asociación espacial

(autocorrelación o dependencia espacial), que a su vez, pueden ser de carácter global o local,

agrupamientos (clusters) o puntos calientes (hot spots) que en definitiva sugieren estructuras en el

espacio geográfico (heterogeneidad espacial) (Anselin, 1996), por lo tanto el AEDE posee un

carácter tanto descriptivo (estadístico) más que confirmatorio (econométrico) (Yrigoyen, 2003).

Este tipo de análisis se puede aplicar de una manera univariante, sobre uno o varios indicadores

geográficos, o multivariante, como una etapa propia del proceso econométrico espacial, previo al

análisis confirmatorio (el cual comprende la estimación y contrastes) como a todo ejercicio de

predicción espacial, utilizándose para identificar relaciones sistemáticas entre variables, o dentro

de una misma variable, cuando no existe un conocimiento claro sobre su distribución en el espacio

geográfico.

20

2.6. Matriz de Contigüidad (Pesos espaciales w)

Esta matriz se denomina como W en donde cada una de las filas (i) como las columnas (j)

representan una región en el espacio de objeto de estudio, representando así la relación que tiene

cada una de las regiones con las demás regiones (posee el mismo número de filas como de

columnas), esta matriz se puede construir de formas finitas, aunque se resalta que la forma más

sencilla y utilizada es la binaria, en la que el 1 representaría la presencia de contigüidad espacial

entre esas dos regiones, mientras que 0 significaría la ausencia de esta lo que conlleva a que esa

matriz inicialmente presentara simetría(Bohórquez & Ceballos, 2008).

𝑤𝑖𝑗 = (

0 𝑤12 … 𝑤1𝑁

𝑤21 0 … 𝑤2𝑁

… … … …𝑤𝑁1 𝑤𝑁2 … 0

) (2)

Para la construcción de esta matriz W se utilizan diferentes criterios de contigüidad y contigüidad

de órdenes superiores (estos con el fin de observar las posibles relaciones que puede tener esa

región al ir variando el orden del tipo de contigüidades), con el fin de definir la vecindad teniendo

en cuenta no solo los polígonos que están en contacto directo.

2.7. Criterios de Contigüidad

Para definir los distintos criterios de contigüidad se basa en las relaciones de los vecinos, en donde

el criterio de vecindad de A sobre B–unidades más cercanas se define a partir de distancias

euclidianas, las demás B+1, B+2, …, B+n se consideran no vecinas de A. Actualmente se conocen

múltiples algoritmos o criterios de contigüidad que varían en sus análisis de relaciones espaciales

dependiendo del fenómeno de estudio. Los criterios más comunes son:

• Contigüidad Efecto Torre

El criterio de contigüidad torre es el que se define 𝑤𝑖𝑗 = 1 para unidades que compartan un lado

común con la región de interés moviéndose en 4 direcciones únicamente (izquierda, derecha, arriba

o abajo).

Figura 2: Matriz de contigüidad de torre de orden 1 (B1), orden 2 (B2)

B2

B1

B2 B1 A B1 B2

B1

B2

Fuente: Elaboración propia

21

• Contigüidad Efecto Alfil

El criterio de contigüidad alfil es el que se define 𝑤𝑖𝑗 = 1 para unidades que comparten un vértice

común con la región de interés, moviéndose en diagonal dependiendo de los vértices.

Figura 3: Matriz de contigüidad de alfil de orden 1 (B1), orden 2 (B2)

B2 B2

B1 B1

A

B1 B1

B2 B2


• Contigüidad Efecto Reina

El criterio de contigüidad reina es el que cual se define 𝑤𝑖𝑗 = 1 para unidades que comparten un

lado en común o un vértice con la región de interés, moviéndose en cualquier dirección del vértice

al cual se hace la estimación.

Figura 4: Matriz de contigüidad de Reina de orden 1 (B1), orden 2 (B2).

B2 B2 B2 B2 B2

B2 B1 B1 B1 B2

B2 B1 A B1 B2

B2 B1 B1 B1 B2

B2 B2 B2 B2 B2


2.8. Análisis de autocorrelación espacial

En las clasificaciones técnicas de AEDE propuesta por Anselin (Anselin, 1998) se expone un

contraste doble en el análisis del fenómeno de dependencia espacial, lo que se denominaría como

contraste global (Smooth) y contraste local (Rough).

2.8.1. Contraste Global

El contraste global tiene como objetivo el análisis de la presencia de tendencias generales en la

distribución de una variable sobre el espacio geográfico de estudio, siendo este un examen conjunto

de todas las unidades que componen la muestra; existen varios contrastes que ayudan a verificar el

supuesto, además estos tienen las siguientes hipótesis:

22

𝐻0 =Ausencia de autocorrelación espacial.

𝐻𝛼 = Presencia de autocorrelación espacial.

Los supuestos más utilizados para esto son:

• Contraste de I de Moran

Inicialmente fue formulado como función de una variable (Y), considerada en los puntos del

espacio (i, j), en desviaciones a la media, y los elementos de la matriz binaria de interacciones

espaciales [𝛿𝑖,𝑗]. La expresión I de Moran está dada por:

𝐼 =𝑁

𝑆0

∑ 𝑤𝑖𝑗(𝑦𝑖−�̅�𝑁𝑖,𝑗=1 )(𝑦𝑗−�̅�)

∑ (𝑦𝑖−�̅�)2𝑁𝑖=1

(3)

Donde:

𝑤𝑖𝑗 es un elemento de la matriz de pesos espaciales correspondiente al par (i, j).

𝑆0 = ∑ ∑ 𝑤𝑖𝑗, es decir la suma de los pesos espaciales

�̅� es el valor medio o esperado de la variable

𝑁 es el número de observaciones o tamaño muestral

Se calcula un estadístico de prueba que tiene una distribución normal con el fin de aceptar o

rechazar la hipótesis nula:

𝑍(𝐼) =𝐼−𝐸(𝐼)

𝜎(𝐼) (4)

El estadístico I varía entre -1 y 1, cuanto más cercano a 1 sea el indicador, mayor será el nivel de

autocorrelación espacial. Pero si el estadístico se enfrente a una muestra suficientemente grande,

el contraste de I de Moran estandarizado, Z (I) seguiría una distribución asintótica N (0,1), esto

sería utilizando una matriz de asociación espacial estandarizada por filas, donde 𝑆0 = 𝑁 reduciendo

el estadístico de I al cociente del producto espacial cruzado de los valores de la variable partido

por la varianza (Yrigoyen, 2003).

• Test G (d) de Getis y Ord

El cálculo de este estadístico es para toda la muestra, en donde dos pares de regiones (i, j), serán

vecinas siempre que se encuentren dentro de una distancia d determinada, la expresión estaría dada

por:

23

𝐺(𝑑) =∑ ∑ 𝑤𝑖𝑗(𝑑)𝑦𝑖𝑦𝑗

𝑁𝐽=1

𝑁𝑖=1

∑ ∑ 𝑦𝑖𝑦𝑗𝑁𝑗=1

𝑁𝑖=1

𝑖 ≠ 𝑗 (5)

Donde 𝑤𝑖𝑗(𝑑) adopta el valor de 1 en los pares de regiones (i, j) situadas dentro de la distancia d y

cero. Su significancia estadística también se podría corroborar estandarizando el contraste, siendo

este cuando la muestra es suficientemente grande el estadístico seguiría una distribución N (0,1)

(Yrigoyen, 2003).

𝑍(𝐺) =𝐼−𝐸(𝐺)

𝜎(𝐺) (6)

Tabla 1: Contrastes Globales análisis autocorrelación espacial

Test Hipótesis nula

(Z no significativo)

Hipótesis alterna

(Z > 0)

Z es significativo

(Z < 0)

I de Moran No autocorrelación

espacial

Autocorrelación

espacial positiva

Autocorrelación

espacial Negativa

G(d) de

Getis y Ord

No autocorrelación

espacial

Autocorrelación

espacial Positiva

(Valores de Y altos)

Autocorrelación

espacial Positiva

(Valores de Y bajos)

2.8.2. Contraste Local

El contraste local es definido por una concentración, en un lugar del espacio global analizado, de

valores especialmente altos o bajos (“puntos calientes”, “picos”) de una variable en comparación

con el valor medio de la misma; observaremos 2 contrastes que ayudan a verificar los supuestos

los cuales son:

• Contraste Local de Moran

En este estadístico se mantiene la relación innata entre el estadístico global, que por sí podrían

arrojar valores muy similares al obtenido globalmente, aunque se sugiera que para una mejor

interpretación se puede estandarizar la matriz de pesos.

𝐿𝑖 =𝑦𝑖

∑ 𝑦𝑖𝑁𝑖=1

𝑁

∑ 𝑤𝑖𝑗𝑦𝑗𝑁𝑗 ∈ 𝐽𝑖 (7)

En donde:

𝑦𝑖 representa el valor de la región 𝑖para la variable normalizada

𝐽𝑖 conjunto de regiones vecinas a 𝑖 𝑁 es el número de observaciones o tamaño muestral

24

Pero si el estadístico se enfrenta a una muestra suficientemente grande, el contraste de I de Moran

estandarizado, Z (I) seguiría una distribución asintótica N (0,1) (Yrigoyen, 2003).

• Indicados local de Asociación espacial (LISA)

LISA es utilizado para detectar aglomeraciones (clúster) mediante la medición de la

autocorrelación espacial donde se localiza cada observación, los mapas LISA ilustran los valores

significativos y representan gráficamente los valores atípicos espaciales (Anselin, Syabri, & Kho,

2006), el estadístico local más utilizado es el I de Moran.

• Estadístico local de Geary

𝐺 (𝑑) =∑ 𝑤𝑖𝑗 𝑑(𝑦𝑗)𝑁

𝑗=1

∑ 𝑦𝑗 𝑁𝑗=1

𝑖 ≠ 𝑗 (8)

Siendo i y j vecinos siempre y cuando estés se encuentren en la distancia d, además sabemos qué y

es la variable de interés que en este caso no está normalizada, además como los contrastes anteriores

si el estadístico se enfrenta a una muestra suficientemente grande se utilizaría una expresión

estandarizada que se distribuiría asintóticamente N (0,1) (Baronio et al., 2012).

2.9. Evaluación Multicriterio – Método de Jerarquía Analítica (AHP por sus siglas

en inglés)

La evaluación multicriterio (EMC) se basa en la ponderación y compensación de variables, ya sean

determinantes o factores de aptitud (Rivera, Mendoza, Martínez, & Servin, 2010); la aplicación de

este exige, la indicación de pesos o ponderaciones, basados en la teoría de decisiones para explicar

y predecir el comportamiento de los agentes que toman la decisión. Para la aplicación de esta

evaluación, se basó bajo el método de jerarquía analítica (AHP) desarrollada por Thomas Saaty en

1980 (Saaty, 2008) y tradicionalmente se clasifica como una técnica multiatributos para la toma de

decisiones, donde analiza los factores que intervienen en el proceso de decisiones sin requerir que

estos se encuentren en una escala común.

Los niveles de importancia o ponderación de los criterios se estiman por medio de comparaciones

apareadas entre estos, esta se lleva a cabo usando una escala, como se observa en la Ecuación 9.

𝑆 = {1

9,

1

7,

1

5,

1

3, 1,3,5,7,9} (9)

En el caso de n atributos la comparación apareada del elemento 𝑖 con el elemento 𝑗 es colocado en

la posición de 𝑎𝑖𝑗 de una matriz que se denominara A de comparaciones que es por sus dimensiones

de tipo cuadrada; los valores recíprocos de estas comparaciones son colocados en la posición 𝑎𝑖𝑗

de A, con la finalidad de preservar la consistencia.

25

Aij = (

a11 a12 … a1𝑗

a21 0 … a2𝑗

… … … …a𝑖1 a𝑖2 … a𝑖𝑗

) (10)

Para la comparación de los criterios se debe comparar una importancia relativa de un elemento con

respecto a un segundo por medio de una escala que construyo Saaty de 9 puntos como se observa

en la tabla 2, lo valores intermedios entre los intervalos de importancia, son valores intermedios de

decisión.

Tabla 2: Escala de 9 puntos para comparaciones apareadas.

Importancia Significado

1 Igual Importancia

3 Ligeramente más importante

5 Notablemente más importante

7 Demostrablemente más importante

9 Absolutamente más importante

Para la asignación de valores a cada uno de los criterios de la matriz, por columnas comparando

los criterios de las filas con los de la primera columna y así sucesivamente, se puede observar que

en la posición 𝑎11 el criterio de este es igual de importante así mismo, por eso la diagonal principal

de esta matriz siempre va a ser 1 para todos los criterios; una vez ingresados los valores

correspondientes en la matriz, el problema se reduce al cálculo de eigenvalores y eigenvectores,

los que representan las prioridades y el índice de consistencia del proceso respectivamente .

𝐴 ∗ 𝑤 = 𝜆 ∗ 𝑤 (11)

Donde

A matriz recíproca de comparaciones apareadas.

𝜆 máximo eigenvalor de A

𝑤 eigenvector correspondiente a 𝜆

Para la verificación de la correcta comparación entre criterios el AHP permite identificar y tomar

en cuenta las inconsistencias de las decisiones tomadas, incorporando el análisis de índice de

consistencia (IC) y una relación de consistencia (RC), para medir la calidad de los juicios por un

decisor (Garcia, Salvador, Díaz, & de la riva, 2006); se considera que un RC<0.1 es aceptable, en

caso de que sea mayor, se deben volver a analizar la comparación de estos.

𝐼𝐶 =𝜆𝑚𝑎𝑥−𝑛

𝑛−1 (12)

26

𝑅𝐶 =𝐼𝐶

𝑅𝐼 (13)

Como se observa el índice RC está en función de IC y de RI, donde este último representa el valor

de un índice aleatorio en función del orden de la matriz, que es el estimado del promedio del IC de

500 matrices recíprocas positivas generadas de manera aleatoria (Saaty, 2008). El RC es una

medida de la relación del error cometido en la comparación y el error aleatorio, siendo este menor

al 10%.

Tabla 3: Índices aleatorios de consistencia.

N 3 4 5 6 7 8 9 10

IA 0.5 0.90 1.12 1.24 1.32 1.41 1.45 1.49

2.10. Covariograma y Correlograma.

La función de covarianza muestral entre parejas de observaciones que se encuentran a una distancia

h, se calcula empleando la fórmula clásica de la covarianza muestral siendo esta:

𝐶(ℎ) = 𝐶𝑂𝑉 (𝑧(𝑥 + ℎ), 𝑍(𝑥)) =∑ (𝑍(𝑥+ℎ)𝑍(𝑥))𝑛

𝑖=1

𝑛− 𝑚2 (14)

En donde

m = Valor promedio en todo punto de la región de estudio

n = Número de parejas de puntos que se encuentran a una distancia h.

Asumiendo que el fenómeno es estacionario y estimando la varianza de la variable regionalizada a

través de la varianza muestral, se tiene que el correlograma muestral está dado por:

𝑟(ℎ) =𝐶𝑂𝑉 (𝑍(𝑥+ℎ),𝑍(𝑥))

𝑆ℎ+ℎ𝑆𝑥=

𝐶 (ℎ)

𝑆𝑥2 =

𝐶 (ℎ)

𝐶(0) (15)

Bajo el supuesto de estacionariedad de dependencia espacial en las funciones de covariograma o

correlograma, estas pueden ser usadas en la determinación de la relación espacial entre los datos

(Giraldo, 2011).

2.11. Análisis confirmatorio de datos espaciales.

Hace referencia al correcto tratamiento de las especificaciones y los contrastes de los efectos

espaciales en un modelo de datos geográficos. Para ello, se ocupa primero de las diferentes

especificaciones posibles para la inclusión del fenómeno espacial en un modelo, para después poder

27

aplicar los diferentes contrastes diseñados para detectar la existencia de autocorrelación espacial

(Baronio et al., 2012).

2.11.1. Modelo de Regresión Espacial

Los modelos de dependencia espacial son modelos de regresión lineal que consideran

explícitamente la existencia del efecto espacial de autocorrelación espacial, la inclusión de este

efecto en un modelo de regresión requiere la utilización de una matriz de pesos espaciales (definida

como w), capaz de recoger las influencias mutuas presentes entre las unidades espaciales de la

muestra. A continuación, se muestran distintas formas de tratamiento de este fenómeno

(dependencia o autocorrelación espacial) presente en la variable endógena de modelos de regresión

lineal (Yrigoyen, 2003).

• Modelo Básico de regresión Lineal (MBRL)

El MBRL se implementa cuando existe la posibilidad de que no se produzca la dependencia

espacial en una variable o de que esta sea recogida correcta y totalmente por un grupo de regresoras.

Se expresa de la siguiente manera:

𝑦 = 𝑋𝛽 + 𝜇 (16)

𝜇 ≈ 𝑁(0, 𝜎2𝐼)

Donde

𝑋 es una matriz [K, N] de K variables exógenas y N observaciones

𝛽 vector [K,1] de parámetros de las variables exógenas

• Modelo del Error Espacial Autorregresivo (SEM por sus siglas en inglés)

Este modelo del error espacial, se usa cuando los modelos de tipo MBRL resultan ineficaces para

explicar un fenómeno con autocorrelación espacial. Siendo el efecto de dependencia espacial en la

variable endógena explicado, no solo por las variables independientes presentes en el modelo, sino

por otras que se encuentran ausentes (dependencia espacial residual).

𝑦 = 𝑋𝛽 + (𝐼 − 𝜆𝑊)−1𝜇 (17)

𝜇 ≈ 𝑁(0, 𝜎2𝐼)

Donde

𝜆 parámetro autorregresivo asociado al retardo espacial

𝜇 vector de perturbaciones aleatorio

28

• Modelo de Retardo Espacial (SAR por sus siglas en inglés)

Este modelo incorpora la influencia de las variables omitidas a través de una variable dependiente

espacialmente retardada, es decir, a través de los valores que, para cada punto i, adopta la

variable endógena en un grupo de localizaciones vecinas.

𝑦 = 𝜌𝑊𝑦 + 𝑋𝛽 + 𝜇 (18)

𝜇 ≈ 𝑁(0, 𝜎2𝐼)

Figura 5: Tratamiento de la autocorrelación espacial - primera tipología de modelos

Fuente: Chasco Yrigoyen – a partir de Baller et al. (2000)

29

Todos estos modelos pueden expresarse de forma general en el llamado modelo mixto regresivo

de regresión espacial, con perturbaciones aleatorias autorregresivas y heteroscedasticas, siendo este

un modelo general anidado de regresión espacial (GNS por sus siglas en inglés).

𝑦 = 𝜌𝑊1𝑦 + 𝑋𝛽1 + 𝑊2𝑅𝛽2 + 휀 (19)

휀 = 𝜆𝑊2휀 + 𝜇 𝜇 ≈ 𝑁(0, Ω); Ω𝑖 = h𝑖(𝑍𝛼); h𝑖 > 0

Donde:

𝑦 es el vector de la variable explicada

𝑊1𝑦 es el retardo espacial de la variable de estudio

𝑋 es una matriz de variables independientes no rezagadas espacialmente

𝑅 es una matriz de variables explicativas no necesariamente con los mismos elementos

de X rezagadas espacialmente

Los parámetros 𝜆 y 𝜌 miden el grado de la dependencia espacial

Ω matriz de covarianza generalizada con los elementos en la diagonal dados por Ω𝑖

h𝑖 perturbación heteroscedastica

Ya a partir de esta especificación se pueden definir modelos adicionales tales como:

• Modelo mixto autorregresivo regresivo espacial con error espacial autorregresivo

(SARAR por sus siglas en inglés)

𝑦 = 𝜌𝑊1𝑦 + 𝑋𝛽1 + 휀 (20)

휀 = (𝐼 − 𝜆𝑊2)−1𝜇

𝜇 ≈ 𝑁(0, Ω)

• Modelo mixto regresivo – regresivo espacial autorregresivo regresivo espacial con

error espacial autorregresivo (SDM por sus siglas en inglés)

𝑦 = 𝜌𝑊1𝑦 + 𝑋𝛽1 + 𝑊2𝑅𝛽2 + 𝜇 (21)

• Modelo mixto regresivo cruzado– regresivo espacial (SLX por sus siglas en inglés)

𝑦 = 𝑋𝛽1 + 𝑊2𝑅𝛽2 + 𝜇 (22)

• Modelo mixto regresivo cruzado– regresivo espacial con error espacial

autorregresivo (SDEM por sus siglas en inglés)

𝑦 = 𝑋𝛽1 + 𝑊2𝑅𝛽2 + (𝐼 − 𝜆𝑊2)−1𝜇 (23)

30

2.12. Regresión geográficamente ponderada (GWR por sus siglas en inglés)

La regresión geográficamente ponderada (GWR por sus siglas en inglés) tiene como finalidad

estimar un vector de parámetros diferente para cada observación, realizando la estimación debido

a la inestabilidad de los parámetros y la ausencia de estacionariedad espacial (Bohórquez

Castañeda, 2010), tomando de partida el siguiente modelo:

𝑦𝑖 = 𝑋𝑖𝛽(𝑣𝑖, 𝑣𝑖) + 𝜇 (24)

Para 𝑖 = 1,2, … . , 𝑛, con 𝑣𝑖 y 𝑣𝑖 como coordenadas geográficas. Mientras la estimación de 𝛽 queda

para este caso (ecuación 25), para 𝑊(𝑣𝑖, 𝑣𝑖) = 𝐷𝑖𝑎𝑔(∝𝑖 𝑗), donde ∝𝑖 𝑗 es la ponderación definida

en términos de la distancia de la observación espacial i a la observación espacial j con 𝑗 =1,2, … . , 𝑛.

�̂�(𝑣𝑖, 𝑣𝑖) = [𝑋′𝑊((𝑣𝑖, 𝑣𝑖)𝑋]−1𝑋′𝑊(𝑣𝑖, 𝑣𝑖)𝑦 (25)

31

Capítulo III

Fuentes de Información

Las fuentes de información para este trabajo se intentaron tomar en su mayoría de libre acceso,

como lo es la encuesta nacional de calidad de vida realizada por el Departamento Administrativo

Nacional de Estadística - DANE el cual proporciona anualmente datos como los servicios públicos

domiciliarios, bienes muebles de uso básico y su cobertura por hogares y viviendas, además se

complementó esta información con los indicadores y datos del Observatorio Ambiental de Bogotá

- OAB.

Se utilizó la base de datos del Instituto Distrital de Gestión del Riesgo y Cambio Climático –

IDIGER ya que manejan un histórico de datos sobre inundaciones en Bogotá según el tipo de

inundación que se clasifican por localidad y barrios, adjunto a esta información también se manejó

un histórico de los hechos validados por la prensa local y nacional. Adicional a la información de

libre acceso de esta entidad, también se consultó los datos de las estaciones que maneja el IDIGER,

incluyendo la clasificación del riesgo a trabajar; información que fue suministrada por la entidad

con el fin de poder ayudar a realizar un análisis de estos mismos desde otro ámbito en donde cuya

información si tiene restricción. El portal de Infraestructura de Datos Espaciales para el Distrito

Capital - IDECA proporcionó las bases de datos geográficas, las cuales fueron útiles a la hora de

espacializar todas las variables, incluyendo la distribución de los afluentes hídricos entorno a la

zona de estudio y el posible cálculo de su influencia por localidad, incluyendo los datos de la

población en relación al número de personas que habitan estas.

Finalmente se observó la Red de Monitoreo de Calidad del Aire de Bogotá - RMCAB, la cual

mediante sus 11 estaciones miden la calidad del aire, precipitación, temperatura y condiciones

ambientales diversas, nos ayudaron a estimar por localidad algunas variables importantes para este

trabajo, además de datos de precipitaciones mensuales obtenidas de la red de estaciones

hidrológicas de la Corporación Autónoma Regional de Cundinamarca - CAR.

3.1. Softwares Utilizados

El procedimiento y análisis de los datos se realizó en diferentes tipos de softwares que ayudan a

cumplir con los objetivos planteados, siendo estos de índole geográficos y estadísticos.

➢ R v3.5.0: Es un software libre donde se manejan paquetes estadísticos para el análisis de

datos y generación de gráficas (“Presentación de la herramienta R | Oficina Software

Libre,” n.d.), en este programa se realizó la mayoría del proceso de este proyecto, desde el

análisis estadístico descriptivo, el exploratorio, el estructural entre otros, hasta la

generación del modelo econométrico espacial y la validación del mismo. De la misma

manera se obtuvieron la mayoría de los gráficos; las ventajas de este programa es su fácil

instalación, su interfaz y la instalación de los paquetes que maneja, de igual manera al ser

de libre acceso se pueden programar funciones adicionales u obtener funciones ya

32

programadas por otros usuarios que se enfrentan a problemáticas similares.(R (V 3.5.0)

[Software], n.d.)

➢ GeoDa v1.12: Este software fue desarrollado en la Universidad de Chicago, siendo este

una herramienta que introduce el análisis de datos espaciales enfocado a la rama de la

estadística llamada econometría espacial. Este es de libre acceso, principalmente se utilizó

para la generación de los gráficos que representan la autocorrelación espacial, y algunos

estadísticos de este como el I de Moran entre otros. Sus ventajas consisten en que, además

de ser gratuito, su interfaz es amigable con el usuario proporcionando un fácil acceso a la

herramienta; el análisis y el modelamiento de los datos se pueden realizar con múltiples

herramientas enfocadas a los datos espaciales de dominio fijo y discreto (datos de área).

(Geoda (V 1.12) [Software], n.d.).

➢ QGis v2.18: Este es un software enfocado a la creación, edición, análisis, visualización de

la información espacial. Es de libre acceso, que para este estudio se usó para la visualización

de la información espacial inicial, poder espacializar las variables geográficamente para su

posterior análisis estadístico espacial, además de poder obtener mapas temáticos que

ayudan a que los lectores a interpretar de forma sencilla la información desde el inicio hasta

el final de esta. Las ventajas de este es que al ser de libre acceso se encuentran diferentes

herramientas y funciones que ayudan a obtener una mejor edición y visualización de la

información espacial. (QGIS (V 2.18) [Software], n.d.).

33

Capítulo IV

Metodología

El objetivo principal de este documento es poder modelar el riesgo de inundación en el periodo del

2007 hasta el 2016, con el fin de visualizar espacialmente el fenómeno en la capital del país, y así

proponer soluciones que ayuden a mitigar el riesgo que esto genera para la población. Por medio

de variables sociales, económicas y ambientales que pueden intentar explicar el riesgo de

inundación a través del espacio y el tiempo; para cumplir este objetivo se debe identificar y modelar

la dependencia espacial entre los diferentes factores y la variable respuesta.

Para el tratamiento y análisis de los datos del presente estudio se manejó una metodología que

posteriormente se explicara paso a paso, siendo este guiado por el análisis de datos de área para

datos de riesgo generados por fenómenos naturales, en este caso el de inundación.

4.1. Área de Estudio

La zona de estudio se tuvo con base a la concentración poblacional que posee la ciudad de Bogotá

D.C, su expansión urbanística a través de los años y las cuencas que pertenecen a esta zona que

desembocan al río Bogotá, haciendo que el agua fluya desde los cerros orientales por quebradas,

ríos y humedales hasta desembocar en este, atravesando la ciudad de oriente a occidente,

aumentando la probabilidad de riesgo por factores que puedan provocar desbordamiento de alguno

de estos afluentes que afectarían progresivamente a está; generando daños en el equipamiento del

espacio público, pérdida de la habitabilidad, daño en la infraestructura, suspensión de servicios

públicos y posibles mortalidades. En el análisis de los últimos 16 años reportados por el SIRE se

obtuvieron 16035 eventos múltiples de inundación afectando a la población económica, social y

ambientalmente (IDIGER, 2018).

Bogotá siendo la capital del país cuenta con una superficie total de 1775 𝑘𝑚2 que constituye el

7,3% de la superficie del departamento de Cundinamarca, yace a una altura media de 2.625

m.s.n.m, presenta una población actual de 8’181.047 aproximadamente con una densidad

poblacional de 5.184,44 habitantes por 𝑘𝑚2 según lo indica la Alcaldía mayor de Bogotá. Está

dividida en 20 localidades: Usaquén, Chapinero, Santa Fe, San Cristóbal, Usme, Tunjuelito, Bosa,

Kennedy, Fontibón, Engativá, Suba, Barrios Unidos, Teusaquillo, Los Mártires, Antonio Nariño,

Puente Aranda, Candelaria, Rafael Uribe, Ciudad Bolívar y Sumapaz. (Figura 6)

Para los años a trabajar según el DANE existían aproximadamente 7’035.156 habitantes para el

año 2007, que para el año final de estudio 2016 existían aproximadamente 7’993.000 habitantes,

obteniendo un rango por localidad desde 22.115 Hab. en la localidad de Candelaria hasta los

981.613 Hab. La localidad de Suba para el año 2007, que para el año 2016 el rango iría desde

25.126 Hab. hasta 1’115.261 respectivamente. Se observa que el rango de habitantes es

proporcional al área que poseen las localidades, ya que varía considerablemente entre aquellas con

mayor área a menor, siendo estas últimas en el centro de Bogotá, mientras que en el norte y en el

sur en su mayoría presentan un mayor número de habitantes, algunas zonas del sur y el oeste de la

34

ciudad presentan áreas escasamente pobladas debido a la agricultura rural puntual y la falta de

servicios públicos domiciliarios.

Figura 6: Ubicación Espacial de la región de estudio.

Fuente: Elaboración Propia

4.2. Estructuración Base de Datos y especialización de los datos.

Para desarrollar el proyecto se recolectó información de distintas fuentes, se estructuró una base de

datos con las variables que con base a la investigación previa puedan explicar el fenómeno. Una

vez identificado el riesgo de inundación, se procedió a conformar la Base de Datos Espacial en

formato Shapefile con las localidades y las variables que configuran el riesgo el cual está

establecido así; Riesgo = A x V x C.

35

Solo se estudian 19 localidades de las 20 que posee la ciudad (Usaquén, Chapinero, Santafé, San

Cristóbal, Usme, Tunjuelito, Bosa, Kennedy, Fontibón, Engativá, Suba, Barrios Unidos,

Teusaquillo, Los Mártires, Antonio Nariño, Puente Aranda, Candelaria, Rafael Uribe y Ciudad

Bolívar, no se consideró la localidad de Sumapaz ya que no fue posible encontrar una cantidad de

datos aceptables de esta zona por tanto no tendría un buen grado de fiabilidad para los años de

estudio), y se verificó el área de cada una de ellas tanto urbano como rural.

La base de datos del IDIGER de eventos de inundación y amenaza fue usada para obtener la

información de los niveles de riesgo por inundación en las localidades de Bogotá. Esta base de

datos registra el tipo de evento, la duración de este, las coordenadas de representación, la

descripción de la amenaza, el número de afectados entre otros datos en un periodo comprendido de

9 años (2007-2016).

Tabla 4: Selección de la Variable respuesta.

Tipo Variable Descripción Descriptiva Código Identificador de la localidad

Nombre Nombre de la Localidad

Área Superficie en Metros cuadrados por localidad

Variable

Respuesta

No_Even Número de eventos registrados por año en cada localidad

NivRiesgo Variable obtenida por medio del método AHP, de asignación de pesos

a criterios

Aunque el nivel de riesgo por inundación en Bogotá estaba segregado por el tipo de evento, las

coordenadas de este, el año, el número de afectados, y nivel de amenaza; se prosiguió a la

asignación de pesos espaciales con base al tipo de evento por medio del método AHP (Márquez,

2011) con el fin de que, con la cantidad de eventos registrados de ese tipo más el peso asignado a

esa variable, se pueda generar un nivel de riesgo por inundación por localidad; con el fin de que

represente los patrones espaciales de la distribución, después se estandarizó por el número de

hogares registrados por localidad, y así obtener una variable estandarizada por la población,

representada en hogares.

Para poder aplicar AHP se tiene 5 tipos de causales de los eventos: inundación por

desbordamiento [RepCau] que es producida por un exceso de agua en un cuerpo de agua

(quebradas, canales, ríos, humedales) que invade cubriendo áreas urbanizadas o no, que en

condiciones normales están secas; encharcamiento (Enc<30] siendo este cuando el sistema de

alcantarillado que recolecta, transporta y dispone las aguas lluvias, no es capaz de drenar las aguas

en las zonas urbanizadas y genera anegamiento por exceso de agua que en condiciones normales

están secas, inundaciones laminares mayores de 30 centímetros [Inu>30], que se generan cuando

hay precipitaciones repentinas y de mayor intensidad asociadas a problemas de drenajes y otros; y

daños en redes de servicios públicos (acueducto [DRSPAcu] y alcantarillado [DRSPAlc]) que

es producida cuando algún sistema de estos falla en su función natural provocando el escape o

recolecta de agua a grandes escalas.

36

Tabla 5: Matriz reciproca de comparaciones apareadas

de eventos de inundación

Inu > 30 Enc < 30 DRSPAlc DRSPAcu RepCau

Inu > 30 1.00 5.00 2.00 5.00 0.20

Enc < 30 0.02 1.00 0.33 3.00 0.14

DRSPAlc 0.50 3.00 1.00 4.00 0.20

DRSPAcu 0.20 0.33 0.25 1.00 0.13

RepCau 5.00 7.00 5.00 8.00 1.00


En la aplicación del AHP primero se debe conocer el tipo de criterio a evaluar, estos son los

mencionados anteriormente que posibilitarán la generación de la matriz A de comparaciones

apareadas, como se observa en la tabla 5, y cuyos pesos se obtendrán mediante el cálculo del

autovector principal de la matriz, que se puede calcular de forma general o usando métodos de

aproximación numérica; siendo W el vector de pesos asignados a cada criterio, este se obtuvo

normalizando cada columna a suma uno, sumando filas y volviendo a normalizar a uno, siendo esta

normalización la aplicación de la ecuación 26. Esto es, en otras palabras, sumar la primera columna

y dividir cada elemento de esta por la referida suma, analógicamente con el resto de las columnas.

𝑣𝑖𝑗 =𝑎𝑖𝑗

∑ 𝑎𝑖𝑗 (26)

Una vez obtenidos los pesos para cada uno de los criterios el siguiente paso consiste en calcular el

eigenvalor principal de la matriz A, el cual proporcionará una medida cuantitativa de los juicios de

valor asignados a los elementos de la matriz de comparación por pares. Esto se consigue por medio

de la ecuación 12; para estimar el 𝜆𝑚𝑎𝑥 se procede primero a multiplicar la matriz A por en

eigenvector W, obteniendo así otro vector denominado V que en la ecuación 11 se denominó como

la multiplicación vectorial entre 𝜆 ∗ 𝑤 obteniéndolo en la tabla 6. Finalmente se divide cada

componente de V por los de W generando un vector que al calcular la media de los componentes

se obtendría el valor del eigenvalor 𝜆𝑚𝑎𝑥, que asociándolo a la ecuación 12 del IC, nos daría como

resultado IC = 0.053. Y que para observar la inconsistencia de las decisiones tomadas mediante el

análisis del IC en relación de consistencia RC con el fin de medir la calidad de los juicios por medio

de la ecuación 13, como resultado tenemos un RC de 0.09 siendo esta medida la relación del error

cometido en la comparación y el error aleatorio siendo este aceptable dentro de la hipótesis

comprendida en el evaluador (RC<10%).

Tabla 6: Multiplicación matricial entre la matriz A y el eigenvector W.

1.00 5.00 2.00 5.00 0.20 0.20919831 1.12577646

0.02 1.00 0.33 3.00 0.14 0.06625521 0.31501466

0.50 3.00 1.00 4.00 0.20 0.13699875 = 0.71129417

0.20 0.33 0.25 1.00 0.13 0.04037397 0.20694511

5.00 7.00 5.00 8.00 1.00 0.54717376 3.06493729


37

Seguido de esto y de calcular el número de eventos por cada tipo de causa por localidad, se

estandarizaron estos eventos por el número de hogares registrados por localidad; como se observa

en la ecuación 27 en donde la variable exógena es el resultado de la interacción entre el número de

eventos registrados por localidad por el método AHP (donde el peso indica el grado de importancia

del tipo de evento) por 10.000 sobre el número de hogares. Finalmente, la variable NivRiesgo es

el riesgo por inundación por cada 10.000 hogares, cuyos resultados se pueden observar en las tablas

7 y 8.

𝑁𝑖𝑣𝑅𝑖𝑒𝑠𝑔𝑜 = 𝑁𝑜.𝐸𝑣𝑒𝑛𝑡𝑜𝑠 (𝐴𝐻𝑃)∗10000

𝐻𝑜𝑔𝑎𝑟𝑒𝑠 (27)

Tabla 7: Datos para hallar NivRiesgo 2007-2011

Año 2007 2011

Localidad Inu Enc DRAL DERAC Rca NivRiesgo Inu Enc DRAL DERAC Rca NivRiesgo

Usaquén 2 16 26 54 0 1.4858 38 125 31 75 0 3.4508

Chapinero 1 9 8 44 0 2.5760 32 35 20 52 0 4.8864

Santa Fe 2 2 10 35 0 3.3860 111 23 16 43 0 11.2843

San Cristóbal 2 11 8 24 0 0.8690 26 50 28 51 0 2.5326

Usme 0 5 7 15 0 0.7308 13 44 22 58 2 3.1832

Tunjuelito 0 1 4 16 1 0.9149 9 12 6 21 0 1.6890

Bosa 1 19 20 19 1 0.9139 139 77 50 55 0 4.1367

Kennedy 1 20 29 62 0 0.8886 203 96 71 106 0 3.1955

Fontibón 1 29 10 33 0 1.6636 25 47 11 25 0 2.0824

Engativá 9 29 15 62 0 0.9943 63 98 21 80 1 1.9239

Suba 1 25 30 68 0 0.9014 63 171 49 89 1 2.2942

Barrios Unidos 0 13 6 21 0 1.2217 6 19 4 23 0 1.3438

Teusaquillo 0 8 2 29 0 1.6809 8 25 5 42 0 2.9174

Los Mártires 0 1 4 23 0 2.1781 62 13 6 47 0 8.4248

Antonio Nariño 0 1 1 7 0 0.6173 11 6 2 24 0 2.4956

Puente Aranda 0 7 8 19 0 1.0065 3 18 15 35 0 1.7783

Candelaria 1 0 0 5 0 1.6051 67 6 5 10 0 19.9193

Rafael Uribe 0 11 7 27 1 0.9452 4 25 17 58 0 1.8080

Ciudad Bolívar 4 13 30 36 1 1.2090 23 59 36 79 1 2.4111


38

Tabla 8: Datos para hallar NivRiesgo 2014-2016

Año 2014 2016

Localidad Inu Enc DRAL DERAC Rca NivRiesgo Inu Enc DRAL DERAC Rca NivRiesgo

Usaquén ## 9 391 262 0 9.7972 47 25 154 256 2 5.6648

Chapinero 60 0 208 299 0 19.2448 9 4 50 181 4 7.9542

Santa Fe 20 1 138 130 0 16.3145 16 7 64 107 0 10.3487

San Cristóbal 36 0 164 193 3 6.2471 22 7 67 168 1 3.9505

Usme 8 0 106 128 0 5.3508 6 6 65 93 3 3.6146

Tunjuelito 28 2 76 55 1 5.5039 7 1 35 34 0 2.4721

Bosa 27 1 214 239 0 5.9848 5 4 96 125 0 2.7043

Kennedy 46 1 281 330 0 4.2650 23 10 129 225 0 2.3704

Fontibón 25 1 172 138 0 6.2552 13 7 57 99 0 3.0962

Engativá 67 8 377 290 0 5.2407 19 12 97 187 0 2.1024

Suba 71 2 400 391 0 5.1308 29 8 175 272 1 2.7216

Barrios Unidos 28 0 129 193 0 8.7328 4 1 36 78 0 2.8058

Teusaquillo 0 24 123 226 0 13.1334 16 2 32 115 0 5.4899

Los Mártires 19 0 50 98 0 10.6124 7 6 19 69 0 6.0651

Antonio Nariño 11 1 45 64 0 6.7801 6 1 13 89 0 5.7716

Puente Aranda 16 0 170 200 0 9.3345 8 9 44 153 0 4.8903

Candelaria 9 0 38 33 0 17.4842 1 1 10 35 0 9.7061

Rafael Uribe 24 1 149 179 0 5.9252 8 5 62 118 0 3.0613

Ciudad Bolívar 45 1 169 246 2 5.4437 35 7 168 173 0 4.2553


La selección de las variables explicativas fue guiada por el marco teórico y los factores del riesgo

por inundación. Estas variables son descritas en la Tabla 2 y en los siguientes párrafos. Se

seleccionaron los años 2007, 2011, 2014 y 2016, debido a que son representativos durante el

periodo de análisis y principalmente, por la disponibilidad de los datos obtenidos en las diferentes

fuentes de información, que, si bien registran varios factores, la mayoría se realizan con una

periodicidad anual, que para cuestión de la investigación se tuvo que realizar con periodicidad de

3-4 años aproximadamente por el tipo de riesgo que se está manejando.

Estas variables fueron derivadas de varias fuentes, todas ellas de libre acceso y de entidades del

estado, la Encuesta Nacional de Calidad de Vida - ENCV y los archivos del IDIGER fueron las

que mayor información sobre estas proveyeron, de igual forma en las fuentes de información se

detalla más sobre esto.

39

Tabla 9: Variables explicativas seleccionadas para el estudio.

Tipo Variable Descripción Fuente Servicios Públicos

Domiciliario

PO_NDEE Porcentaje de hogares que no disponen

de energía eléctrica.

ENCV, DANE

PO_NDGN Porcentaje de hogares que no disponen

de Gas Natural domiciliario.

ENCV, DANE

PO_NDA Porcentaje de hogares que no disponen

de acueducto.

ENCV, DANE, OAB

PO_NDAL Porcentaje de hogares que no disponen

de alcantarillado

ENCV, DANE, OAB

PO_NDRB Porcentaje de hogares que no disponen

de la recolección de Basura

ENCV, DANE

Fuentes Hídricas

PAH_PL Porcentaje de afluentes hídricos (de tipo

sencillo y doble) por localidad.

IDECA, IDIGER

Bienes PODL Porcentaje de hogares que disponen de

Lavadora.

ENCV, DANE

PODN Porcentaje de hogares que disponen de

Nevera

ENCV, DANE

PODES Porcentaje de hogares que disponen de

Equipo de Sonido

ENCV, DANE

PODT Porcentaje de hogares que disponen de

Televisor

ENCV, DANE

PODC Porcentaje de hogares que disponen de

Computador (uso en el hogar)

ENCV, DANE

PODSI Porcentaje de hogares que disponen de

Servicio de Internet

ENCV, DANE

PO_DET Porcentaje de hogares que disponen de

electrodomésticos.

Método AHP

PODM Porcentaje de hogares que disponen de

Motocicleta

ENCV, DANE

PODCP Porcentaje de hogares que disponen de

Carro Particular

ENCV, DANE

Habitantes PPH Número de personas que constituyen el

hogar por localidad

ENCV, DANE

AL_PH Área en metros cuadrados por localidad

que le corresponde a cada hogar.

ENCV, DANE,

IDECA

Datos ambientales

TEMP Temperatura media anual por año

RMCAB, CAR

PREP Precipitación media anual por año

RMCAB, CAR,

IDEAM

IDEAM (Instituto de hidrología, meteorología y estudios ambientales); RMCAB (Red de monitoreo y calidad de aire de Bogotá);

CAR (Corporación autónoma regional de Cundinamarca); IDIGER (Instituto Distrital de Gestión del Riesgo y Cambio Climático);

ENCV (Encuesta nacional de calidad de Vida); IDECA (Infraestructura de Datos Espaciales para el Distrito Capital); OAB

(observatorio ambiental de Bogotá); DANE (Departamento Administrativo Nacional de Estadística)

40

Descripción de las Variables

➢ Nivel de Riesgo (NivRiesgo): Esta variable es la representación del riesgo de inundación

por cada 10.000 hogares, está estandarizada, re-expresando los datos de tipo y número de

eventos de inundación. Es la variable endógena o la variable respuesta del presente estudio,

con el fin de aplicar las relaciones espaciales y econométricas con las variables explicativas

mencionadas en el marco teórico del presente estudio, esta variable sigue el supuesto de

que a mayor número de eventos de inundación a menor número de hogares mayor

posibilidad de riesgo, que se podría relacionar directamente a las localidades con menor

área.

➢ Energía Eléctrica (PO_NDEE): Valor porcentual (%) de los hogares que no disponen del

servicio de energía eléctrica en sus hogares. Es una variable exógena, de tipo

socioeconómico, relacionada a los servicios públicos domiciliarios que se clasifica como

posible factor influyente de la vulnerabilidad (Paola Andrea, 2014), esta varía en relación

al crecimiento poblacional por localidad siendo este de forma informal o formal. Al no

tener el acceso a este servicio básico obligatorio la posibilidad de tener un tipo de afectación

es mayor, lo que genera que la población sea más vulnerable a cualquier fenómeno.

➢ Gas natural (PO_NDGN): Valor porcentual (%) de hogares que no disponen del servicio

de gas natural de la red pública domiciliaria. Es una variable exógena de tipo

socioeconómico, relacionada a los servicios públicos domiciliarios que se clasifica como

posible factor influyente de la vulnerabilidad (Paola Andrea, 2014), esta varía en relación

al del crecimiento poblacional por localidad. Se considera que al no tener el acceso a este

servicio puede llegar a aumentar la vulnerabilidad de la población en condiciones de bajos

recursos o ubicadas en zonas donde es imposible instalar este por sus condiciones naturales

o de acceso. Este tipo de servicio aún no se considera básico obligatorio, pues hay servicios

que lo pueden suplementar, pero que para este estudio y por sus análisis temporales en las

fuentes de información se tiene en cuenta.

➢ Acueducto (PO_NDA): Valor porcentual (%) de hogares que no disponen del servicio de

acueducto. Es una variable exógena de tipo socioeconómico, relacionada a los servicios

públicos domiciliarios que se clasifica como posible factor influyente de la vulnerabilidad

(Paola Andrea, 2014), esta varía en relación al crecimiento poblacional por localidad, se

considera obligatoria bajo la ley 142 (Congreso de Colombia, 1994), y es fundamental para

la supervivencia y las actividades básicas, se tiene en cuenta el número de usuarios

registrados legalmente para poder obtener este valor porcentual de los habitantes que no se

benefician de este servicio.

➢ Alcantarillado (PO_NDAL): Valor porcentual (%) de hogares que no disponen del

servicio de alcantarillado. Es una variable exógena de tipo socioeconómico, relacionada a

los servicios públicos domiciliarios que se clasifica como posible factor influyente de la

vulnerabilidad (Paola Andrea, 2014), esta varía en relación al crecimiento poblacional por

localidad, se considera obligatoria bajo la ley 142 (Congreso de Colombia, 1994), y está

relacionada a diferentes problemas ambientales y sociales, además de la influencia en

cuanto a la informalidad habitacional.

41

➢ Recolección de Basura (PO_NDRB): Valor porcentual (%) de hogares que no disponen

del servicio de recolección de basuras. Es una variable exógena de tipo socioeconómico,

relacionada a los servicios públicos domiciliarios que se clasifica como posible factor

influyente de la vulnerabilidad (Paola Andrea, 2014), esta varía en relación al crecimiento

poblacional por localidad, se considera obligatoria bajo la ley 142 (Congreso de Colombia,

1994), y está relacionada a diferentes problemas ambientales y sociales.

➢ Afluentes Hídricos (PAH_PL): Valor porcentual (%) que mide el área de ocupación de

los afluentes hídricos en cada localidad. Es decir, es la ponderación del área de los drenajes

sencillos y dobles medidos a través de cada localidad y relacionado con el área de estas. Es

una variable exógena de tipo ambiental, que es considerada uno de los factores generadores

del riesgo a tratar en el presente trabajo (González Velandia, 2014), se asocia con el

crecimiento poblacional desordenado alrededor de zonas no permitidas en una buena

planeación del territorio, como lo serían las rondas hídricas o afluentes hídricos, se ha

considerado dentro del factor vulnerabilidad.

➢ Lavadora (PODL): En este indicador se relaciona el porcentaje (%) de hogares que

disponen del bien mueble denominado Lavadora, es la representación en porcentaje de los

hogares en relación a este bien, está relacionado al supuesto de que, a mayor población,

mayor riqueza, esto sería proporcional a las pérdidas que generaría la ocurrencia de un

fenómeno natural. Es una variable exógena de tipo económico, clasificada posteriormente

en el factor de costo frente a la representación del riesgo.

➢ Nevera (PODN): En este indicador se relaciona el porcentaje (%) de hogares que disponen

del bien mueble denominado nevera, es la representación en porcentaje de los hogares en

relación a este bien, está relacionado al supuesto de que, a mayor población, mayor riqueza,

esto sería proporcional a las pérdidas que generaría la ocurrencia de un fenómeno natural.

Es una variable exógena de tipo económico, clasificada posteriormente en el factor de costo

frente a la representación del riesgo.

➢ Equipo de Sonido (PODES): En este indicador se relaciona el porcentaje (%) de hogares

que disponen del bien mueble denominado equipo de sonido, es la representación en

porcentaje de los hogares en relación a este bien, está relacionado al supuesto de que, a

mayor población, mayor riqueza, esto sería proporcional a las pérdidas que generaría la

ocurrencia de un fenómeno natural. Es una variable exógena de tipo económico, clasificada

posteriormente en el factor de costo frente a la representación del riesgo.

➢ Televisor (PODT): En este indicador se relaciona el porcentaje (%) de hogares que

disponen del bien mueble denominado televisor, es la representación en porcentaje de los

hogares en relación a este bien, está relacionado al supuesto de que, a mayor población,

mayor riqueza, esto sería proporcional a las pérdidas que generaría la ocurrencia de un

fenómeno natural. Es una variable exógena de tipo económico, clasificada posteriormente

en el factor de costo frente a la representación del riesgo.

➢ Computador (PODC): En este indicador se relaciona el porcentaje (%) de hogares que

disponen del bien mueble denominado computador, es la representación en porcentaje de

los hogares en relación a este bien, se discriminan solamente los computadores de uso en

42

el hogar esto quiere decir que son aquellos que no se pueden llevar de forma portátil; está

relacionado al supuesto de que, a mayor población, mayor riqueza, esto sería proporcional

a las pérdidas que generaría la ocurrencia de un fenómeno natural. Es una variable exógena

de tipo económico, clasificada posteriormente en el factor de costo frente a la

representación del riesgo.

➢ Servicio de Internet (PODSI): En este indicador se relaciona el porcentaje (%) de hogares

que disponen del servicio de internet, es la representación de los hogares en relación a este

servicio, se discrimina solamente el servicio de internet del hogar sin tener en cuenta la

posibilidad que se tiene actualmente de incluir un paquete de datos a los dispositivos

móviles o Tablet; está relacionado al supuesto de que, a mayor población, mayor riqueza,




➢ Electrodomésticos (PO_DET): En este indicador se relaciona el porcentaje (%) de hogares

que disponen de electrodomésticos tales como: nevera, lavadora, equipo de sonido

televisor, computador y el servicio de internet, esto se analizó por medio del método AHP,

ya que al realizar en un posterior AEDE, y análisis estadísticos de las variables, se concluyó

que las variables antes mencionadas como PODN, PODL, PODES, PODT, PODC y PODSI

tenían un alto grado de correlación entre ellas, lo que hacía que en la modelación clásica y

autorregresiva espacial los modelos sufrieran un alto grado de multicolinealidad en estas

variables y por consiguiente se buscó una medida que relacionara estas sin perder el

significado de cada variable.

➢ Motocicleta (PODM): En este indicador se relaciona el porcentaje (%) de hogares que

disponen del bien mueble denominado motocicleta, es la representación de los hogares en

relación a este bien; está relacionado al supuesto de que, a mayor población, mayor riqueza,




➢ Carro Particular (PODCP): En este indicador se relaciona el porcentaje (%) de hogares

que disponen del bien mueble denominado carro particular, es la representación de los

hogares en relación a este bien; se discrimina cualquier otro tipo de vehículo que no sea de

uso familiar, excluyendo los carros de carga, de servicio público y demás; está relacionado

al supuesto de que, a mayor población, mayor riqueza, esto sería proporcional a las pérdidas

que generaría la ocurrencia de un fenómeno natural. Es una variable exógena de tipo

económico, clasificada posteriormente en el factor de costo frente a la representación del

riesgo.

➢ Personas (PPH): Este valor alude al número de personas que estarían conformando un

hogar por localidad, como los hogares no contienen la misma cantidad de personas, por tal

motivo esta variable es una estimación de las personas que lo componen; es una variable

exógena de tipo social. Clasificada posteriormente en el factor de costo frente a la

representación del riesgo.

43

➢ Área Hogares (AL_PH): Mide la proporción en metros cuadrados (Mts2) del área que se

dispondría por cada hogar dentro de la localidad; es una variable de tipo social, por

consiguiente, la relación sería entre menor área disponible por hogares mayor cantidad de

ellas por localidad, y mayor número de afectados frente a un fenómeno natural; finalmente

se clasifica en el factor de costo frente a la representación del riesgo.

➢ Temperatura (TEMP): Valor dado en grados centígrados (°C) obtenido a partir del

promedio de temperaturas medias registradas en los 12 meses del año para cada localidad

de Bogotá. Es una variable exógena de tipo ambiental, cuyos valores no fluctúan demasiado

en el área de estudio. Está incluida en el factor Peligro en cuanto a la representación de la

fórmula del riesgo.

➢ Precipitación promedia (PRECP): Valor dado en milímetros (mm) obtenido a partir del

promedio de precipitaciones medias registradas en los 12 meses del año para cada localidad

de Bogotá. Es una variable exógena de tipo ambiental, cuyos valores fluctúan en las

diferentes localidades, Además se considera un factor determinante en las inundaciones

(siendo estas de tipo fluvial que son consideradas un proceso natural por el cual el flujo

desborda los límites del cauce (Klement, Lorangb, & Stanford, 2009)) cuando son

persistentes, de larga duración o de corta duración pero intensas (Rojas, Mardones, Luis, &

Aguayo, 2014). Está incluida en el factor Peligro en cuanto a la representación de la fórmula

del riesgo.

Si bien las variables previamente analizadas y mencionadas fueron seleccionadas teniendo como

base el marco conceptual y previos estudios realizados sobre esta problemática, también fueron

seleccionadas con el fin de poder plantear acciones que puedan mitigar o prever los efectos que

estas generan. Las variables de tipo ambiental no se pueden controlar pero sí se pueden monitorear

constantemente además de posibles aplicaciones de sistemas de alertas tempranas que ayuden a

advertir antes de que el evento suceda; mientras, las variables de tipo socioeconómicas, objetivo

de múltiples políticas públicas, son sin duda los factores de mayor relevancia para el estado, pues

muchas de estas son de índole básicas y obligatorias para toda la población, que en la incurrencia

de estas generan que la vulnerabilidad de la población aumente y posiblemente se consideren de

mayor afectación. Las variables de tipo social son las que ayudan a visualizar la dimensión en que

los fenómenos afectan las localidades, con el fin de poder reorganizar y/o generar políticas públicas

que mitiguen las consecuencias de estos. Las variables de tipo económico son aquellas que nos

ayudan a cuantificar las pérdidas que el fenómeno genera en la población y la repercusión de esto.

que conlleva a los múltiples subsidios y ayudas que el estado imparte para estos.

Finalmente se espacializaron todas las variables exógenas mediante la ayuda del software de

edición de datos geográficos en donde se utilizó un archivo de tipo Shapefile del IDECA en donde

solo se tenía la espacialización de las localidades sin información adicional al nombre y el código

asignado por el estado; seguido de esto se prosiguió a cargar todas las variables explicadas

anteriormente, diferenciándolas por año para posteriormente realizar los análisis estadísticos

pertinentes para este proyecto.

44

4.3. Análisis Exploratorio de Datos Espaciales

El análisis exploratorio de datos espaciales (AEDE) incluye la inspección y visualización de datos

en un espacio geográfico. El AEDE utiliza un conjunto de técnicas o herramientas estadístico-

gráficas que describen y visualizan la distribución espacial del fenómeno y las posibles relaciones

entre sí mismo. Por consiguiente, este es el primer paso estadístico que se aplicará a los datos con

el fin de poder tener una primera visual de la dispersión de estos, la relación que poseen, las áreas

geográficas y sus particulares características. Adicional se pueden crear nuevas hipótesis o

supuestos sobre los datos generando nuevas investigaciones posteriores a esta que harán que el

resultado sea más apegado a la realidad.

En esta sección, se encontrarán ya plasmadas aplicaciones estadísticas de tipo espacial asociadas

al riesgo de inundación, sus variables y la ubicación de estas en el área de estudio, integrando ya

lo investigativo al campo de la aplicación (la realidad), ya que los métodos utilizados y las

estructuras de dependencia espacial se parecen más a la econometría en el dominio del espacio y

el tiempo. La comprensión de la estacionariedad y la isotropía propias de la estadística espacial se

trasladan a los estudios de datos de área.

Este ítem se realizó en diferentes etapas que comprenden todo lo descrito anteriormente, donde se

comprenda la relación espacial que hay implícitas en el estudio.

4.3.1. Análisis estadístico descriptivo

El primer paso para explorar los datos consiste en plasmar la información obtenida por medio de

un mapa que ayude a identificar posibles patrones en el comportamiento de la variable respuesta.

Para el caso de la variable respuesta NivRiesgo, se realizó un mapa de intervalos iguales para esta

variable en cada año de estudio. Este mapa permite determinar las locaciones espaciales en donde

el nivel de riesgo es mayor y esbozar relaciones iniciales entre los valores de la variable endógena

y las variables exógenas; lo más importante para esta etapa es la identificación de la autocorrelación

espacial tanto global como local para el área de estudio y si las variables relacionadas a esta siguen

su tendencia.

Adicional a la parte gráfica, se prosiguió a obtener las estadísticas descriptivas básicas para la

variable respuesta, incluyendo gráficos para la interpretación de estos como lo son los histogramas,

Boxplot y graficó de normalidad. Las variables de tendencia central y los gráficos estadísticos

permitieron dar una aproximación a las atipicidades en los datos al igual que sus distribuciones;

siendo posible establecer que localidades representan niveles más altos de riesgo, cuales se

encuentran por debajo de la media y cuales están en el rango normal aceptable en Bogotá. Los

estadísticos de dispersión facilitaron la interpretación de que tan compactos son los datos y cómo

se podrían agrupar estos.

Finalmente se realizaron análisis bivariados y multivariados para poder observar las relaciones

entre la variable respuesta y las variables explicativas, para así evitar la redundancia de la

información, identificar la dependencia e interdependencia y la contribución de los factores en la

variable a explicar, los factores con similitudes a otros y entre sí. Con estas estadísticas fue posible

ver las relaciones de linealidad entre el NivRiesgo y las variables independientes.

45

4.3.2. Matriz de pesos espaciales

La característica multidireccional de los datos espaciales se puede plasmar mediante matrices de

pesos espaciales o de contigüidad, donde se involucran los posibles pares de observaciones, para

así poder decidir la influencia que hay entre ellas y el entorno, en diferentes niveles de relación. Es

importante conocer la matriz y sus relaciones previo a la estimación de los modelos

autorregresivos, ya que hace parte intrínseca del modelo mismo, siendo un factor importante para

la correcta especificación de este pues explica la importancia relativa entre los individuos.

Actualmente está matriz se escoge conforme el comportamiento que se observa en el fenómeno a

estudiar, dando la libertad al investigador, para implementar los múltiples algoritmos de relación

espacial existentes que mejor se adapten a este o poder aplicar uno que describa las relaciones

espaciales. La elección de la matriz de contigüidad es de gran importancia, pues de ella dependerán

las relaciones espaciales de los datos. Para la aplicación y generación de esta existen múltiples

criterios, las de tipo binarias que asignan un valor de uno a las unidades contiguas y cero a las

demás, las de tipo estandarizada se construyen a partir de las relaciones binarias en donde cada

componente de la matriz se pondera por la suma de la fila a la que pertenece.

Con el fin de encontrar la matriz que mejor se relacione al fenómeno, se realiza una regresión entre

la variable de estudio y los vectores propios asociados a cada matriz de contigüidad considerando

el amplio conjunto de matrices de pesos espaciales y seleccionando la que presente menor criterio

de Akaike (AIC) (Dray, Legendre, & Peres-Neto, 2006), el objetivo de esto es estimar la pérdida

de información cuando la distribución de probabilidad de f , siendo f un grupo de datos con cierta

distribución, asociada con el modelo verdadero, es aproximada mediante la distribución de

probabilidad de g, asociada con el modelo a ser evaluado (Caballero D., 2011). Se resaltar que el

criterio AIC no pretende identificar el modelo verdadero, si no el modelo que mejor se ajuste entre

los modelos candidatos, proporcionando una aproximación más cercana a la realidad o al verdadero

modelo.

Los criterios utilizados para hallar las matrices de pesos espaciales fueron inicialmente los clásicos

siendo contigüidad Torre y Reina, explicando sus relaciones y criterios de vecindad en el marco

teórico del mismo; mientras las matrices de pesos espaciales basados en otros algoritmos poco

usados fueron: la Triangulación Delaunay que consiste en la relación de los polígonos por medio

de triángulos, formando estos con los puntos más próximos, sin que estos crucen sus

aristas(Fernández Asunción, 2008). El criterio Gabriel define la distancia de los polígonos siendo

esta menor o igual a la mínima distancia entre dos vértices de dos polígonos adyacentes. Los

Vecinos Relativos siendo este la pertenencia de una arista al grafo de vecinos relativos si sus

extremos son vecinos relativos entre sí. La Esfera de Influencia instala un conjunto de puntos

finitos y un radio entre un polígono y su vecino más cercano; de esta forma se genera una

circunferencia centrado en los polígonos y bajo este criterio las unidades se consideran vecinas si

las circunferencias de cada una de estas se intersecan en al menos dos puntos; y K – Vecinos más

cercanos que considera relaciones de distancias no simétricas bajo matrices de pesos

estandarizadas. Una vez generadas las matrices con los criterios previamente mencionados y los

clásicos, se determinó cual relacionaba mejor la relación espacial de las coordenadas euclidianas

de los polígonos a estudiar, posteriormente se basó en el menor valor de AIC para el periodo de

estudio.

46

Este proceso se ejecutó en el software R por medio de las librerías Adespatial y spdep, arrojando

los valores de AIC con su nivel de significancia permitiendo así la visualización de los criterios; se

calculó el estadístico de I de Moran y su correspondiente estandarización, generando los gráficos

de contigüidad por criterio, con el fin de observar las relaciones establecidas entre unidades de

análisis que representen la autocorrelación de los polígonos vecinos, comparando resultados.

4.3.3. Análisis Global y Local

Cuando se define una matriz de pesos adecuada entre las unidades de estudio, es posible comprobar

la existencia de autocorrelación espacial en la variable de estudio, así como determinar el tipo de

relación; se manejan dos tipos de contrastes, el Global y Local, siendo la Global la relación sobre

la estacionariedad de una variable sobre la totalidad de la muestra, mientras la local solamente

verifica la estacionariedad intrarregional.

En cuanto a los supuestos globales para detectar autocorrelación espacial se empleó el contraste

Global de I de Moran que es una media de correlación entre cada región y sus vecinas (Moreno &

Vayá, 2002); si su estadístico de prueba no es significativo sin importar su estandarización estará

asociado a que habrá una aleatoriedad espacial, por otro lado si el estadístico de prueba arroja

valores significativos y su estandarización mayor a cero significa la concentración de datos

similares en regiones vecinas, por el contrario, si su estandarización da valores menores a cero,

significaría la disparidad en las regiones vecinas (Agudelo, Franco, & Franco, 2015). Otro criterio

fue el test de Getis y Ord, estos test arrojan estadísticos junto un P-valor que permite determinar el

grado de autocorrelación global de NivRiesgo a través de las localidades de Bogotá. Adicional los

gráficos de dispersión de Moran, asociado a cada variable, sirvieron para analizar la presencia de

autocorrelación o aleatoriedad espacial en la región de estudio.

Por otro lado, los criterios locales permiten detectar concentraciones, en un lugar del espacio global

analizado, de valores especialmente altos o bajos (“puntos calientes”, “picos”) de una variable en

comparación con el valor medio de la misma. Los supuestos locales utilizados fueron el I de Moran

Local y el G de Geary. Estos estadísticos locales permiten identificar visualmente los clusters o hot

spots regionales y los valores atípicos de la variable en el espacio que presenta el I de Moran. Para

así observar en la variable independiente que localidades estaban rodeadas de valores similares y

cuáles de valores diferentes de NivRiesgo.

4.4. Análisis Confirmatorio

Mediante el AEDE se determina la existencia de autocorrelación espacial del NivRiesgo a nivel

localidad, sin embargo, éste no permite decidir sobre la estructura de esta dependencia espacial;

por consiguiente, se debe realizar un tratamiento de estos efectos espaciales en el proceso de

modelización espacial, para así generar la construcción de un modelo autorregresivo espacial y

generar posibles modelos que se puedan ajustar al fenómeno de estudio y explicar este lo más

cercano a la realidad.

47

4.4.1. Construcción Modelo Autorregresivo Espacial

Para la construcción de los modelos autorregresivos, se debe evaluar en primera instancia los

modelos más básicos hasta los más complejos para encontrar el que mejor se ajuste a la explicación

del fenómeno. A partir de la estimación por mínimos cuadrados ordinarios (MCO) del riesgo

explicado por las variables exógenas se realizó un modelo clásico de regresión que representara el

comportamiento de NivRiesgo en función de los factores ambientales, sociales y económicos. Se

genero la estimación de diversos modelos de regresión lineal para obtener un modelo que cumpliera

con las especificaciones y supuestos claves para la formulación de este. Para esto se aplican

diferentes tipos de test estadísticos que comprueban esto, como la prueba de heterocedasticidad,

prueba de multicolinealidad, prueba de autocorrelación en los residuos, prueba de significancia

global entre otros, con el fin de determinar qué tan preciso es el modelo y si este representa las

relaciones entre la variable respuesta y sus explicativas.

Para tener una previsualización de las variables que puedan explicar el modelo es importante

realizar las pruebas de autocorrelación espacial en los residuos pues esto ayudará a ver los posibles

resultados, si el resultado arroja una asociación espacial, es posible la búsqueda de una estructura

de modelo espacial que capte el efecto retardo espacial de la variable dependiente (Modelo de

rezago espacial); si esto no sucede, deben buscar alternativas no paramétricas y semiparamétricas

que permitan identificar y modelar la dependencia espacial de las variables.

4.4.2. Selección Modelo Autorregresivo Espacial

Para obtener el mejor modelo que se pueda ajustar al fenómeno, se propone, en primera instancia

la aplicación del test Multiplicadores de LaGrange (LM) para cada uno de los posibles modelos

espaciales; determinando cual puede ser el mejor modelo que personifique la dependencia espacial

y la relación de las variables. Este test muestra diferentes modelos espaciales (rezago espacial o

error espacial) asociados a un parámetro y un P-valor de significancia; Para escoger el modelo cuyo

P-valor sea el más significativo, pues se podría apreciar los casos de autocorrelación espacial, sea

esta residual, sustancial o ambas. Se aclara que para este cálculo se debió haber escogido la matriz

de pesos espaciales que tuviera la mejor especificación y así mismo el modelo clásico de regresión.

Finalmente, se obtiene un modelo econométrico espacial para cada año de estudio, que consolida

el comportamiento del Nivel de Riesgo por Inundación. Si bien, los LM determinan en gran medida

cuál modelo es el más apropiado, es necesario apoyarse en los resultados del análisis global y local

del AEDE. Interpretando, que, si el NivRiesgo se relaciona puntualmente entre localidades, podría

tratarse de un modelo espacial SMA, pero si el comportamiento de la variable respuesta es

significativo a través del territorio, se podría hablar de un modelo SAR. Estos análisis junto a las

pruebas de autocorrelación espacial permiten la consolidación de un modelo que mejor se ajuste al

fenómeno, con el fin de evitar deducciones erróneas y posibles errores posteriores con el modelo

espacial seleccionado.

48

4.4.3. Validación del Modelo Autorregresivo Espacial

Una vez establecidos los modelos autorregresivos espaciales, estos se someten a los supuestos de

multicolinealidad, significancia y heteroscedasticidad; analizando de la misma manera los residuos

en busca de no autocorrelación y normalidad. Si después, estos modelos aún son consistentes, se

determinarían como los modelos más óptimos que modelan la variable repuesta (NivRiesgo) por

inundación a través del espacio junto con las variables explicativas para las localidades de Bogotá.

Esto se debe realizar para cada año de estudio, con el fin de analizarlo en diferentes tiempos y

establecer relaciones temporales entre el fenómeno.

Las variables resultantes de todo este proceso son de gran importancia, siempre y cuando existe

una buena significancia, ya que están directamente relacionadas a la variable respuesta, en donde

la disminución o incremento de esta estimulan la perturbación negativa o positiva sobre la variable

respuesta, esto quiere decir que estas pueden variar el Nivel de Riesgo por Inundación alcanzando

a tener perturbaciones en sí mismas o trasmitidas por o hacia las localidades vecinas.

4.5. Interpretación del Modelo

Cuando ya se posee los modelos que cumplen con los supuestos y demás planteamientos, ya es

posible modelar el Nivel de Riesgo por Inundación en Bogotá por localidad, para cada año en

función de los factores de Vulnerabilidad, Amenaza y Costo que incluyen variables sociales,

económicas y ambientales, perdurando a través de la aplicación de pruebas y estadísticos con el fin

de obtener la modelación autorregresiva espacial; describiendo amenamente estas, y su relación

con la variable respuesta, encontrando por qué estas llegaron a repercutir en el comportamiento de

la variable endógena a través de la zona de estudio y en qué proporción genera cambios relativos

que repercuten en el Nivel de Riesgo por Inundación en cada localidad.

4.6. Cálculo de Impactos

Después de obtener los modelos y analizarlos, la mejor forma de realizar una correcta

interpretación de los cambios en los valores resultantes en los modelos frente al riesgo de

inundación es por medio del cálculo de impactos, donde se enseñan los cambios relativos en la

variable respuesta en función de las variables explicativas a través del espacio, suponiendo que el

aumento de alguna variable independiente del modelo afectará la variable respuesta positiva o

negativamente, incluyendo no solo el análisis de esta sino también de las localidades vecinas.

El cálculo de los impactos se realiza para verificar e identificar cómo las variables de este afectan

en diferentes proporciones (pequeñas o grandes) alterando el riesgo de inundación y su distribución

en las localidades del distrito capital.

49

Capítulo V

Resultados y Análisis

El objetivo de este capítulo es presentar, interpretar y exponer lo que se obtendrá de acuerdo a la

metodología planteada y los conceptos propuestos del marco teórico; donde el lector tendrá la

posibilidad de observar paso a paso el resultado de la investigación, además de comparar lo que se

planteó y lo que se obtendrá.

Se explicará inicialmente cada resultado que se genere; para el análisis exploratorio de datos

espaciales (AEDE) se observará la estadística básica de la variable respuesta y su comportamiento

en la zona de estudio; se aplicará y seleccionará el mejor criterio de correlación espacial entre las

unidades espaciales de la zona de estudio. Se realizará el análisis exploratorio global donde se

observará el comportamiento de las variables explicativos y respuestas de manera univariada,

después se analizará el análisis exploratorio local de la variable respuesta con el fin de que el lector

observe el comportamiento de esta variable localmente con las unidades espaciales vecinas. De la

misma forma en que se realizó el comportamiento univariado, se observará la relación entre la

variable respuesta y las explicativas (análisis bivariado).

Para realizar la modelación del fenómeno de estudio se aplicará el análisis confirmatorio de datos

espaciales, donde se modelará en primera instancia un modelo regresivo clásico con el fin de

observar las relaciones de las variables sin su espacialización, además de evaluar los supuestos

básicos para los modelos propuestos; como este no presenta una asociación espacial se proseguirá

a la modelación autorregresiva espacial, donde interactuará las variables de los modelos clásicos

con los resultados obtenidos en el análisis bivariado, aplicando diferentes modelos con el fin de

encontrar el que mejor se adapte a el riesgo por inundación.

Finalmente, se analizarán los modelos autorregresivos espaciales escogidos, y los impactos de estos

en la zona de estudio de manera global, esto quiere decir que este modelo está bajo el supuesto de

estacionariedad en la zona de estudio, el mismo comportamiento para todas las unidades espaciales.

Como el problema planteado puede que se comporte de la misma manera en toda la zona de estudio,

no se descarta la posibilidad de que el comportamiento de las variables no sea global si no local,

variando de una unidad espacial a otra, por consiguiente se proseguirá a realizar la regresión

geográficamente ponderada donde se considera la no estacionariedad en el modelo, se plantearan

modelos diferentes para cada año de estudio y se analizarán estos, observando las variables

significativas de este estudio y su comportamiento local en la zona de estudio. Esto con el fin de

discutir los resultados obtenidos en toda esta sección contextualizando los modelos autorregresivos

espaciales y las regresiones geográficamente ponderadas que se adoptaron mejor al fenómeno en

el transcurso del tiempo.

5.1. Análisis Exploratorio de Datos Espaciales

Debido a que el fenómeno de estudio presenta la existencia de datos espaciales en localizaciones

irregulares, se procedió a realizar el análisis exploratorio para entender la información de una

50

manera básica, mediante métodos estadísticos descriptivos y análisis exploratorios multivariados,

así encontrar relaciones entre variables respuesta y explicativas.

Para analizar la distribución geográfica de la variable estudiada se realizan los mapas de intervalos

cuantiles que agrupan los valores de datos a cada clase dependiendo del valor de los cuantiles para

este grupo de valores. En las figuras 7 y 8 se encuentran los mapas con intervalos definidos por

cuantiles para la variable endógena de los años de estudio, las localidades con color claro

representan los valores mínimos de la variable y en color verde más oscuro los valores más altos.

Figura 7: Distribución espacial del NivRiesgo en las localidades

de Bogotá: 2007 - 2011

Fuente: Elaboración Propia, Software R

Para el año 2007 los valores más altos registrados por localidad son respectivamente en

Teusaquillo, Los Mártires, Chapinero y Santafé variando en un intervalo de [2.83 a3.38], mientras

que las localidades de Antonio Nariño, San Cristóbal, Usme y Kennedy presentan los valores más

bajos dentro de un intervalo de [0.61 – 1.17]. En el mapa del 2011 se puede observar que las

localidades comprendidas en el intervalo que representa el mayor riesgo [4.43 – 19.91] son:

Candelaria, Los Mártires, Chapinero y Santafé, que, a diferencia del 2007 para este año la localidad

de Usme, Bosa y Kennedy presenta un aumento en el riesgo, mientras que las localidades de

Tunjuelito, Rafael Uribe, Barrios Unidos y Puente Aranda disminuyeron el índice de riesgo que

estas tenían. En la comparación de estos años (2007-2011) se puede observar una variación del

riesgo negativamente siendo este el aumento del riesgo en las localidades de Antonio Nariño, San

Cristóbal, Usme, Bosa, Kennedy, Fontibón, Engativá y Candelaria, mientras una variación positiva

siendo este la disminución del riesgo se presentó en la localidad de Tunjuelito, Rafael Uribe,

Barrios Unidos, Puente Aranda y Ciudad Bolívar.

51

Figura 8: Distribución espacial del NivRiesgo en las localidades

de Bogotá: 2014 - 2016


De igual manera para el año 2014 se observan que las localidades de Candelaria, Los Mártires,

Chapinero y Santafé presentan un mayor riesgo en un intervalo de [11.62-19.24], mientras que las

localidades con menor riesgo en este año se identificaron que son Usme, Kennedy, Engativá y

Suba. En el 2016 vuelven y se presenta en las localidades de Candelaria, Los Mártires, Chapinero

y Santafé un riesgo mayor comprendido en el intervalo de [5.88-10.34], adicional a este se observa

que las localidades de Antonio Nariño, Los Mártires, Usme, Ciudad Bolívar y Suba presentaron

una variación del fenómeno negativamente, esto quiere decir el aumento de este.

Finalmente, las localidades más afectadas en el periodo de estudio son Los Mártires, Chapinero y

Santafé ya que son las que mayor riesgo por cada 10.000 hogares presentan; seguido de Usaquén,

Usme, Ciudad bolívar, Bosa y Kennedy que, aunque en todo el estudio no presentan una constancia

en el riesgo, si muestran valores significativos para este. En el caso de las localidades como

Tunjuelito y Rafael Uribe mantuvieron un riesgo por inundación relativamente bajo en el estudio

donde las variaciones que se observaron, no aumentaron considerablemente.

Para examinar si la variable respuesta sigue una distribución normal, se utilizan diferentes gráficos

de análisis como histograma, diagrama de distribución empírica y diagrama de caja para cada año

de estudio, además se adjuntan un resumen de las medidas de tendencia central de la variable

endógena, que describe el comportamiento del conjunto de los datos.

52

Figura 9: Histograma, Grafico Q-Q y Boxplot del NivRiesgo 2007


El NivRiesgo en el año 2007 presenta una asimetría, ya que los valores tienden a reunirse a la

izquierda de la media (Figura 9). En cuanto a los datos estadísticos básicos se observa que tiene un

mínimo de 0.6173, una mediana de 1.0065 y una media de 1.3573, el valor de la curtosis nos indica

que hay una mayor concentración de datos entorno a la media, el coeficiente de variación para este

año es de 52%. Esto quiere decir que los datos no están tan dispersos. En el gráfico Q-Q se observa

que los puntos intentan ajustar a una función exponencial. El Boxplot expone que la variable

respuesta tiene algunos valores atípicos que se identificaron, además, la concentración de los datos

se ubica por encima de la mediana concluyendo que no es simétrica respecto a esta medida.



En el histograma del año 2011 se puede observar que también hay una asimetría hacia el lado

izquierdo de la media, aunque ya se observa en esta medida que se encuentra un valor alto plasmado

en ella (Figura 10). En cuanto a los datos estadísticos básicos se observa que tiene un mínimo de

1.3440, una mediana de2.5330 y una media de 4.3030, el valor de la curtosis para este año también

nos indica que hay una mayor concentración de datos entorno a la media. En el gráfico Q-Q se

53

observa que los puntos no tienen ninguna similitud a una recta, pero se tiene el indicio de que

podría seguir una exponencial. El Boxplot expone que la variable respuesta en este año es donde

más se presentan datos atípicos, la concentración de los datos se ubica por encima de la mediana

concluyendo que no es simétrica respecto a esta, y que la mayoría las localidades presentan un

mayor riesgo por inundación.



En el año 2014 se puede observar en el histograma que como en los dos años anteriores se sigue

presentando una asimetría hacia el lado izquierdo de la media (Figura 11). En cuanto a los datos

estadísticos básicos se observa que tiene un mínimo de 4.2650, una mediana de 6.2550 y una media

de 8.7780; el valor de la curtosis para este año nos indica que hay una menor concentración de

datos entorno a la media. En el gráfico Q-Q se observa que los datos no se ajustan uniformemente

ni se aproximan a una normal. El Boxplot expone que la variable respuesta tiene datos atípicos y

esta no se encuentra simétrica en torno a la mediana, aun así, como en los anteriores años la mayoría

de las localidades presentarían un mayor riesgo pues hay una mayor agrupación de datos sobre

este.



54

Finalmente, para el año 2016 se observa en el histograma que no hay simetría con respecto a la

media y la mediana; en cuanto a los datos estadísticos básicos se observa que tiene un mínimo de

2.1020, una mediana de 3.9500 y una media de 04.6870; el valor de la curtosis para este año

también nos indica que hay una menor concentración de los datos entorno a la media. En el gráfico

Q-Q se observa que los datos se podrían los valores ajustarse a uno normal, aunque no se tenga

certeza de esto. El Boxplot expone que la variable respuesta tiene datos atípicos, pero en este caso

se observa que los datos son simétricos entorno a la mediana queriendo decir que hay una

concentración similar de localidades con riesgo alto como bajo.

Tabla 10: Resumen de medidas estadísticas de la variable de estudio para cada año

Medida Estadística 2007 2011 2014 2016

Mínimo 0.6173 1.3440 4.2650 2.1020

Máximo 3.3860 19.9190 19.2450 10.3490

Media 1.3573 4.3030 8.7780 4.6870

Mediana 1.0065 2.5330 6.2550 3.9500

Desviación estándar 0.7077 4.5209 4.5844 2.4492

Desviación media 0.3191 1.0742 1.6671 2.1919

Asimetría 1.4089 2.3278 1.0610 0.9874

Curtosis 1.2738 4.8688 -0.2957 -0.1650

Coef. Var. Promedio 52.1394 105.0624 52.2264 52.2604

Coef. Var. Mediana 31.7048 42.4160 26.6509 55.4836


5.1.1. Selección de Matriz de Pesos Espaciales

La matriz W de pesos espaciales introduce la dependencia entre las unidades y especifica los

modelos espaciales, siendo este un atributo definitivo para la econometría de índole espacial; para

obtener la mejor matriz que se adapte al fenómeno de estudio, se analizan distintos criterios de

contigüidad que permiten determinar qué regiones tienen una influencia particular sobre las otras

en consideración expresada en nociones topológicas (Anselin, 1998). Las matrices de pesos

espaciales (w) comparadas inicialmente son por medio de criterios que se basan en contigüidad.

Los criterios Reina y Torre, se basan en geometrías; mientras que el criterio de Triangulación

Delaunay, Esfera de Influencia, Gabriel, Vecinos Relativos y Kn-vecinos más cercanos con n=1,

n=2 y n=4 se basan en distancia. Estas son seleccionadas por medio de la que tenga un menor valor

del coeficiente del criterio de información de Akaike (AIC), siempre y cuando haya evidencia de

que exista autocorrelación espacial y no aleatoriedad, en donde la hipótesis nula que se manejaría

sería un P-valor mayor a 0.

En las tablas 11 y 12 se encuentran los resultados obtenidos para cada criterio del I de Moran y el

resultado del AIC, esto con el fin de analizar la presencia de autocorrelación espacial en los criterios

de contigüidad espacial observando las matrices que también posean el menor AIC.

55

Para el año 2007 se selecciona la matriz de contigüidad con criterio Esfera de influencia que posee

un AIC de -32.26255, se observa que la variable endógena para este año tiene una estructura de

dependencia espacial ya que el estadístico de I de Moran es significativo y su P-valor es menor al

5%, lo que concluiría la ausencia de aleatoriedad espacial. En el año 2011 el menor valor del

coeficiente AIC lo posee el criterio de Kn-vecinos cercanos con Kn=1, la cual también presenta un

I de Moran significativo y su P-valor es menor al 5% por consiguiente representa que hay una

autocorrelación espacial. En comparación de estos dos años la mayoría de los criterios presentan

una significancia espacial representando una estructura de dependencia espacial, que por medio del

AIC ayudó a seleccionar el modelo que mejor se puede ajustar entre los presentes.

Tabla 11: Criterios de Selección de matriz W 2007-2011

Año 2007 2011

Criterio I AIC P-Value Z(I) I AIC P-Value Z(I)

Reina 1 0.27880 -21.39042 0.00540 2.54940 0.44060 27.04215 0.00000 4.57660

Reina 2 -0.17864 -30.96391 0.89100 -1.23180 -0.08255 46.25698 0.62710 -0.32414

Reina 3 -0.22777 -22.19183 0.92980 -1.47390 -0.24719 50.24488 0.97650 -1.98700

Torre 1 0.32624 -25.59996 0.00260 2.79480 0.44397 26.77713 0.00000 4.42390

Torre 2 -0.16697 -26.22880 0.87000 -1.12660 -0.06558 47.72394 0.54860 -0.12221

Torre 3 -0.27849 -27.67299 0.96980 -1.87780 -0.25053 32.77030 0.97690 -1.99310

T Delaunay 0.17208 -25.77020 0.02146 2.02440 0.18670 40.84246 0.00444 2.61630

Gabriel 0.26311 -30.61870 0.02354 1.98560 0.31260 48.28290 0.00270 2.78260

Esfera 0.25274 -32.26255 0.02388 1.97940 0.24342 46.56960 0.01008 2.32340

V. Relativos 0.38018 -23.60847 0.00963 2.34050 0.37045 41.89231 0.00275 2.77570

Kn1 0.02959 -29.08310 0.37550 0.31719 0.62618 13.29168 0.00107 3.06990

Kn2 0.25664 -26.73178 0.03257 1.84420 0.32646 44.89737 0.00328 2.71880

Kn4 0.23187 -26.39639 0.00466 2.59990 0.21398 28.19812 0.00178 2.91500


El menor AIC en el año 2014 lo posee el criterio Kn-Vecinos cercanos con Kn=4, siendo un valor

de 19.85068, se observa que la variable endógena para este año el estadístico I de Moran es

significativo y su P-valor es menor al 5% siendo esto la presencia de autocorrelación espacial.

Finalmente, para el año 2016 el criterio que se escogido es el criterio Reina siendo este de primer

orden, con un AIC de -3.94524 siendo este el menor AIC, además también este criterio presenta

significancia en el estadístico de I de Moran, con un P-valor menor al 5% siendo este un valor de

1% aproximadamente.

En la figura 13 se puede observar las relaciones de los polígonos en base a los criterios escogidos

anteriormente para cada año de estudio, para el año 2007 el criterio de Esfera de Influencia,

obteniendo en este 3,79 links en promedio (relaciones entre los polígonos), mientras que para el

año 2011 el criterio de K-Vecinos más cercanos de orden 1 nos muestra un promedio de 1 vecinos

; en el año 2014 con el de K-Vecinos más cercanos de orden 4 nos muestra un promedio de 4

vecinos para este tipo de relación, finalmente en el año 2016 para el criterio Reina de primer orden

nos muestra un promedio de 4.42 vecinos, así se puede concluir que el criterio que más vecinos

56

tiene en cuanto a su relación es el del año 2016 con un 23% de probabilidad de que no se encuentre

relaciones de contigüidad.

Tabla 12: Criterios de Selección de matriz W 2014-2016

Año 2014 2016

Criterio I AIC P-Value Z(I) I AIC P-Value Z(I)

Reina 1 0.48258 30.20841 0.00006 3.84610 0.54154 -3.94524 0.00001 4.28930

Reina 2 -0.03606 48.53600 0.42730 0.18329 -0.09610 1.53690 0.64910 -0.38296

Reina 3 -0.38232 51.95832 0.99560 -2.62040 -0.30169 31.05069 0.97640 -1.98390

Torre 1 0.55093 21.96027 0.00002 4.16120 0.59348 -2.78953 0.00000 4.47580

Torre 2 -0.05605 56.71255 0.50190 -0.00467 -0.09186 13.07447 0.63540 -0.34610

Torre 3 -0.38935 41.80171 0.99580 -2.63320 -0.31575 11.25306 0.98040 -2.06310

T Delaunay 0.44259 40.01469 0.00002 4.14830 0.41802 11.85773 0.00004 3.96410

Gabriel 0.57662 33.49146 0.00011 3.68950 0.49361 7.31179 0.00064 3.22150

Esfera 0.52418 38.38742 0.00024 3.48850 0.44956 5.86399 0.00113 3.05500

V. Relativos 0.53226 28.94972 0.00155 2.95730 0.53385 10.72700 0.00144 2.98050

Kn1 0.39432 34.70496 0.05806 1.57120 0.48951 18.93050 0.02785 1.91340

Kn2 0.44247 38.69348 0.00289 2.76050 0.41128 7.93930 0.00465 2.60060

Kn4 0.42679 19.85068 0.00002 4.10250 0.43498 11.95112 0.00001 4.19250


Figura 13: Gráficos, criterios seleccionados por año


57

Con el fin de encontrar estructuras de autocorrelación espacial en la variable con la matriz de

contigüidad seleccionada, se analizan los correlogramas para cada año (Figura 14) para así

identificar la asociación espacial que tiene la variable rezagada de estudio NivRiesgo consigo

misma, mostrando la correlación entre parejas de observaciones espaciales cuando se aumenta la

distancia o el rezago entre ellas.

Figura 14: Correlogramas de la variable respuesta.


En estos gráficos se encuentra que para el año 2007 los rezagos de primer orden son significativos,

pero en el resto de órdenes no se presenta evidencia estadística para afirmar la falta de significancia;

para el año 2011 también se observa que los rezagos de primer orden son significativos, mientras

que para el año 2014 se encuentra que los rezagos de orden 1 y de orden 3 son significativos.

Finalmente, para el año 2016 como en los dos primeros años de estudio se encuentra que los rezagos

son significativos a este nivel. Adicional a esto se analizan los correlogramas observando el tipo

de relación espacial que se pueda encontrar en los diferentes órdenes (Figura 15), inicialmente se

debería analizar solo el orden en que se encuentra significancia en sus rezagos, esto quiere decir

que para todos los años que presentan significancia de esta en el primer orden se denotaría que se

presenta una autocorrelación espacial positiva, esto quiere decir que los valores altos o bajos de la

58

variable de estudio tienden a estar agrupadas en el espacio, en cuanto a los demás órdenes de los

años después del primer orden se encontraría una autocorrelación espacial negativa, incluyendo

para el año 2014, que el 3 orden en los rezagos dio significativo, para este caso presentaría una

autocorrelación espacial negativa.

Figura 15: Análisis de autocorrelación espacial de la variable respuesta.


5.1.2. Análisis Exploratorio Global

Una vez seleccionada la matriz de pesos espaciales para cada año se procede a analizar la

dependencia espacial de cada variable tanto explicativas como respuesta en la región, por medio

de los contrastes Globales de I de Moran, G de Getis y Ord y C de Geary con el fin de establecer

la presencia de un efecto irradiado de las variables identificando las relaciones espaciales que se

puedan presentar de forma global. Los test fueron evaluados con una probabilidad asociada a un

intervalo de confianza del 95%, permitiendo además determinar si la variable respuesta se ha

relacionado con las regiones vecinas, presentando su mismo comportamiento.

59

En la tabla 13 se encuentran los valores obtenidos para cada test del año 2007 realizado con la

matriz de pesos espaciales del criterio gráfico de Esfera de Influencia. Se evidencia que la variable

Endógena y la mayoría de las variables explicativas presentan evidencia de autocorrelación

espacial positiva siendo esta la predominancia de concentración de valores similares en regiones

“vecinas”, las cuales poseen un P-valor menor al 0.05, evidenciándolas en la presente tabla con

color rojo, cuando se aplica el I de Moran, las variables como PO_NDEE, PO_NDRB, PODM

presentan evidencia de una posible ausencia de asociación espacial. Sin embargo, en el test de G

de Getis y Ord se evidencian variables no significativas que para el test de Moran lo son, siendo

las variables de PO_NDEE, PO_NDRB, PODM, PPH, AL_PH y TEMP las cuales evidenciarían

una presencia de aleatoriedad espacial, para las demás variables se rechaza la hipótesis nula y se

concluye que existe una asociación espacial.

Tabla 13: Contrastes globales de variabilidad respuestas y explicativo año 2007

Test I de Moran C de Geary G de Getis y Ord

Variable I P - Valor Z(I) C P - Valor Z(I) G P - Valor Z(I)

NivRiesgo 0.2527 0.0239 1.9794 0.6148 0.0178 2.1014 0.0579 0.2633 0.6333

PO_NDEE -0.0968 0.6090 -0.2768 1.0267 0.5566 0.1424 0.0510 0.5772 -0.1948

PO_NDGN 0.5439 0.0002 3.5718 0.4500 0.0008 -3.1389 0.0698 0.0070 2.4598

PO_NDA 0.3419 0.0080 2.4074 0.5980 0.0116 -2.2692 0.0735 0.0441 1.7047

PO_NDAL 0.1683 0.0239 1.9787 1.0010 0.5019 0.0046 0.1048 0.0170 2.1194

PO_NDRB -0.1565 0.7692 -0.7363 1.1906 0.8371 0.9826 0.0418 0.7200 -0.5829

PAH_PL 0.3035 0.0123 2.2480 0.7235 0.0630 -1.5299 0.0722 0.0132 2.2210

PO_DET 0.4403 0.0020 2.8715 0.5279 0.0030 -2.7492 0.0569 0.0764 1.4299

PODM -0.0446 0.4718 0.0706 1.0067 0.5146 0.0366 0.0536 0.8279 -0.9458

PODCP 0.3999 0.0034 2.7073 0.5608 0.0060 -2.5103 0.0715 0.0088 2.3728

PPH 0.5292 0.0002 3.5068 0.4713 0.0013 -3.0038 0.0556 0.4597 0.1013

AL_PH 0.2396 0.0088 2.3859 0.4628 0.0037 -2.6823 0.0696 0.1382 1.0884

TEMP 0.4442 0.0022 2.8462 0.5280 0.0027 -2.7842 0.0561 0.2177 0.7801

PRECP 0.4727 0.0005 3.2773 0.4969 0.0026 -2.7986 0.0590 0.0756 1.4352


Para el año 2011 (Tabla 14) cuyo criterio de contigüidad es K-Vecinos más cercanos con Kn=1,

las variables como PO_NDEE, PO_NDA, PO_NDRB, PAH_PL, PODM y PRECP son las que

indican una ausencia de asociación espacial, el resto de las variables presentes en el estudio

presentan autocorrelación espacial positiva en el espacio según el I de Moran, para el estadístico

de G de Getis y Ord se evidencia que la mayoría de las variables no presentan autocorrelación

espacial, que solo las variables como NivRiesgo, PO_NDGN, PO_NDAL y PODCP presentan una

asociación espacial.

60




NivRiesgo 0.6262 0.0011 3.0699 0.9575 0.4535 -0.1167 0.1229 0.0000 3.9453

PO_NDEE -0.1227 0.6052 -0.2668 0.7967 0.2761 -0.5944 0.0070 0.8531 -1.0500

PO_NDGN 0.6586 0.0068 2.4697 0.5409 0.0678 -1.4925 0.1086 0.0009 3.1096

PO_NDA -0.0320 0.4658 0.0859 0.6650 0.1496 -1.0381 0.0323 0.7528 -0.6834

PO_NDAL 0.1418 0.0319 1.8537 0.8139 0.3278 -0.4460 0.2577 0.0242 1.9736

PO_NDRB -0.1401 0.6452 -0.3723 1.0750 0.5824 -0.2081 0.0073 0.6801 -0.4680

PAH_PL 0.0858 0.3039 0.5133 0.9031 0.3815 -0.3016 0.0597 0.3786 0.3091

PO_DET 0.6432 0.0092 2.3583 0.2444 0.0059 -2.5185 0.0558 0.4564 0.1095

PODM 0.0035 0.4128 0.2204 0.8650 0.3403 -0.4116 0.0493 0.9494 -1.6388

PODCP 0.5833 0.0138 2.2043 0.2619 0.0081 -2.4050 0.0725 0.0801 1.4045

PPH 0.4028 0.0559 1.5900 0.5331 0.0651 -1.5134 0.0561 0.3817 0.3011

AL_PH 0.3314 0.0356 1.8043 0.5807 0.1278 -1.1367 0.0787 0.1545 1.0175

TEMP 0.6082 0.0106 2.3059 0.3889 0.0240 -1.9780 0.0559 0.3714 0.3282

PRECP 0.1851 0.2067 0.8181 0.6144 0.1010 1.2759 0.0572 0.2612 0.6397


En el año 2014 (Tabla 15) cuyo criterio de contigüidad es K-Vecinos más cercanos con Kn=4, las

variables como PO_NDRB, PODM, TEMP Y PRECP son las únicas variables que no presentan

un esquema de autocorrelación espacial con el I de Moran, con P-valor menor al 0.05, pero se

observa que, el resto de las variables para este test presentan una autocorrelación espacial positiva

y un estadístico significativo, que corresponden a una concentración de valores similares en las

localidades. Sin embargo, para el test de G de Getis y Ord solamente las variables como NivRiesgo,

PO_NDGN, PO_DET y POCDCP aún siguen presentando la asociación espacial como se observó

en el test de Moran y el test de Geary; que para el resto de las variables se observa una aleatoriedad

espacial, siendo este año, comparado con los anteriores el que menor variables significativas

presenta en el estudio.

Finalmente, en la tabla 16 relacionada al año 2016 se observa que las variables PO_NDEE, PODM,

AL_PH, TEMP y PRECP no son significativas para el estadístico de Moran y de Geary, las demás

variables presentan una asociación espacial significativa y positiva. Para el test de Getis y Ord se

observa que la mayoría de las variables ahora no presentan asociación espacial, como lo son

PO_NDEE, PODM, PPH, AL_PH, TEMP y PRECP; por otra parte, se observa que, en todos los

años, la variable respuesta sigue una distribución de asociación espacial, concluyendo que los

valores de esta, en una localidad, especifica no depende solo de sí misma sino también de las

ocurrencias en regiones vecinas.

61




NivRiesgo 0.4268 0.0000 4.1025 0.5168 0.0006 -3.2582 0.0666 0.0030 2.7523

PO_NDEE 0.1012 0.0455 1.6904 0.7380 0.1069 -1.2430 0.0859 0.1727 0.9435

PO_NDGN 0.4253 0.0000 4.0677 0.6153 0.0042 -2.6340 0.1045 0.0001 3.7502

PO_NDA 0.2702 0.0027 2.7878 0.6543 0.0109 -2.2934 0.0546 0.6206 -0.3070

PO_NDAL 0.0751 0.0306 1.8725 0.5820 0.0446 -1.6995 0.0575 0.4744 0.0643

PO_NDRB -0.0249 0.3699 0.3321 0.6700 0.0596 -1.5583 0.0155 0.7863 -0.7937

PAH_PL 0.3290 0.0005 3.2877 0.6199 0.0057 -2.5288 0.0636 0.1363 1.0972

PO_DET 0.3644 0.0003 3.4638 0.5049 0.0001 -3.6670 0.0576 0.0750 1.4395

PODM -0.0648 0.5334 -0.0837 1.2064 0.8871 1.2113 0.0567 0.3114 0.4920

PODCP 0.3410 0.0004 3.3340 0.5176 0.0004 -3.3612 0.0704 0.0103 2.3162

PPH 0.3184 0.0009 3.1245 0.5119 0.0003 -3.4663 0.0533 0.9595 -1.7445

AL_PH 0.1074 0.0344 1.8200 0.5938 0.0304 -1.8744 0.0510 0.6588 -0.4093

TEMP -0.1296 0.7277 -0.6059 1.0746 0.7153 0.5690 0.0552 0.7873 -0.7971

PRECP 0.0626 0.1627 0.9836 0.8682 0.1717 -0.9476 0.0550 0.6567 -0.4036





NivRiesgo 0.5415 0.0000 4.2893 0.4838 0.0003 -3.4330 0.0657 0.0010 3.0901

PO_NDEE 0.0002 0.3283 0.4447 0.9282 0.3275 -0.4468 0.0747 0.1682 0.9613

PO_NDGN 0.5651 0.0000 4.4175 0.3370 0.0000 -4.4402 0.1072 0.0001 3.7332

PO_NDA 0.2976 0.0044 2.6162 0.7326 0.0410 -1.7392 0.0932 0.0048 2.5913

PO_NDAL 0.1581 0.0125 2.2411 0.8310 0.1712 -0.9495 0.0888 0.0179 2.1001

PO_NDRB 0.2263 0.0058 2.5231 0.7176 0.0477 -1.6674 0.1645 0.0079 2.4151

PAH_PL 0.1979 0.0347 1.8156 0.7159 0.0292 -1.8935 0.0655 0.0725 1.4572

PO_DET 0.5705 0.0000 4.3376 0.4261 0.0000 -3.9290 0.0574 0.0381 1.7731

PODM -0.1377 0.7347 -0.6271 1.0547 0.6365 0.3491 0.0555 0.5120 -0.0302

PODCP 0.5508 0.0000 4.2813 0.4422 0.0001 -3.7593 0.0756 0.0002 3.4863

PPH 0.4187 0.0005 3.3156 0.5123 0.0005 -3.3134 0.0559 0.3880 0.2847

AL_PH -0.0535 0.4922 0.0195 1.0316 0.5724 0.1826 0.0621 0.2744 0.5996

TEMP 0.0207 0.2999 0.5246 0.9413 0.3429 -0.4047 0.0558 0.1400 1.0803

PRECP 0.0091 0.3249 0.4541 0.9237 0.3027 -0.5167 0.0539 0.7834 -0.7838


62

5.1.3. Análisis Exploratorio Local

Se procede a determinar la existencia de estructuras de dependencia espacial local de la variable

endógena mediante mapas LISA para los periodos de estudio, en este se puede identificar las

regiones con valores significativos a partir de estadísticos de autocorrelación espacial local con el

test I de Moran, con el fin de determinar la ubicación de las conglomeraciones espaciales

destacando los hot spots (puntos calientes) y atípicos en la zona.

Figura 16: Mapa Clúster espacial LISA

2007 2011

2014 2016


63

En la figura 16 se muestran los Clusters espaciales LISA para cada uno de los años de estudio, en

el año 2007 se muestra valores altos rodeados de altos para la localidad de Candelaria y Chapinero.

Para el año 2011 se puede observar que se encuentran valores de altos rodeados de altos al igual

que en el 2007, representando los puntos calientes en las localidades de Candelaria, Los Mártires

y Santafé, adicional a esto se encuentra la atipicidad de que hay valores bajos rodeados de altos

para la localidad de San Cristóbal, mientras que para el año 2014 se visualiza una localidad que

representa valores de altos rodeados de altos, asignado a la Candelaria, adicional a esta se encuentra

que la localidad de Santafé presenta una atipicidad de valores altos rodeados de bajos; finalmente

en el año 2016 solo se encuentran hots spots para la localidad de Santafé y Candelaria.

Figura 17: Mapa Significancia LISA

2007 2011

2014 2016


64

Los mapas de significancia se utilizan para señalar la forma en que las variables están distribuidas

en la región de estudio y sus posibles aglomeraciones, mostrando probabilidades de las relaciones

de contigüidad que se puedan generar de manera aleatoria. En el mapa de significancia LISA del

año 2007 se encuentra que con un P-valor del 0.01% es significativa la localidad de Santafé, y que

al 1% es significativa la localidad de Chapinero; en el año 2011 se observa que las localidades de

Santafé, Candelaria y Los Mártires presentan una significancia del 0.01% y la localidad de San

Cristóbal presenta significancia al 5%. Para el año 2014 se encuentra que la localidad de Santafé

es significativa al 5% y la localidad de Candelaria al 1%; finalmente, en el año 2016 se observa un

P-valor al 5% en la localidad de Candelaria seguido de la localidad de Santafé que presenta una

significancia del 0.01%.

También se analizaron los mapas de autocorrelación espacial local de G de Getis y Ord siendo su

hipótesis nula la ausencia de asociación espacial alrededor de la región i, estos solo muestran la

presencia de clúster espaciales. En la figura 18 se observan los clusters espaciales obtenidos.

Figura 18: Mapa Cluster Local (Getis)

2007 2011

2014 2016


65

Para el año 2007 se puede observar que se encuentra un hot spot referenciado a la localidad de

Chapinero y Candelaria en donde hay valores altos rodeados de altos; para el año 2011 solo se

encuentran puntos calientes (hot spot) que se ubican en las localidades de Los Mártires, Candelaria,

Santafé y San Cristóbal. En el año 2014 y a diferencia de los anteriores resultados se observa que

la localidad de Engativá, Candelaria y San Cristóbal presentan valores significantes de altos

rodeados de altos; finalmente, para el año 2016 se observa una significancia de valores altos

rodeados de altos para la localidad de Santafé y Los Mártires.

En el mapa de significancia de Getis y Ord (figura 19), en el año 2007 se puede observar que la

localidad de Chapinero se presenta una significancia del 1%, y la localidad de Candelaria un 5%;

para el año 2011 siendo este el que presenta mayores localidades significativas, manifestándose

una significancia del 5% para la localidad de Candelaria, un 1% para las localidades de Los

Mártires y San Cristóbal, y para la localidad de Santafé 0.01%. En el año 2014 se observa que las

localidades de Engativá, Candelaria y San Cristóbal presentan P-valor del 5%. Finalmente, en el

2016 se encuentra la localidad de Santafé con una significancia del 0.1% y Los Mártires del 5%.

Figura 19: Mapa Significancia Local (Getis)

2007 2011

2014 2016


66

5.1.4. Análisis Bivariado

El propósito de esta sección es encontrar las variables independientes que presenten estructuras de

autocorrelación espacial con la variable endógena, con el fin de desarrollar modelos que describan

el comportamiento del riesgo por inundación presente en las localidades de estudio. Este análisis

bivariado se realiza a partir de la función I de Moran Bivariado, el cual permite determinar que

tanto se ve afectado el comportamiento de la variable dependiente con respecto a los valores de las

variables explicativas. En este análisis se puede realizar por medio del Software GeoDa e

igualmente en R. Para el estudio se realizó con Geoda y se verificó este en R. Se aclara que para el

año 2007 el criterio que mejor se ajustó a este fue Esfera de influencia y no se encuentra relacionado

a las matrices de contigüidad que maneja GeoDa.

En la tabla 17 se visualizan los resultados del análisis para los años 2007 y 2011; en el año 2007 se

pueden visualizar que las variables como PO_NDEE, PO_NDGN, PO_NDAL, PO_NDRB,

PAH_PL, PODCP_PPH, TEMP y PRECP poseen un P-valor que confirma la asociación espacial

con la variable endógena, en donde algunas de estas manifiestan presencia de autocorrelación

espacial positiva; mientras que para el año 2011 las variables que poseen un P-valor que sean

menores o cercanos al 5% se consideran que poseen un esquema de autocorrelación espacial con

respecto a la variable dependiente, siendo estas PO_NDGN, PAH_PL, PODM y PRECP como se

puede observar en la presente tabla, siendo estas variables señaladas con color rojo.

Tabla 17: Moran Bivariado 2007 – 2011

Año 2007 2011

Variable I P - Valor Z(I) I P - Valor Z(I)

PO_NDEE 0.1878 0.067 0.3051 -0.1076 0.376 -0.4996

PO_NDGN 0.4819 0.004 0.6141 0.5039 0.021 2.2823

PO_NDA 0.0768 0.237 0.0766 0.0307 0.334 0.1369

PO_NDAL -0.2806 0.009 -0.6346 -0.0869 0.391 -0.3846

PO_NDRB -0.2042 0.051 -0.5748 -0.0618 0.506 -0.2764

PAH_PL -0.1685 0.081 -0.5458 -0.3366 0.035 -1.4978

PO_DET 0.1425 0.123 0.2303 -0.1681 0.265 -0.7476

PODM -0.0854 0.249 -0.4824 -0.2971 0.07 -1.3685

PODCP 0.2146 0.035 0.3433 -0.1162 0.339 -0.5138

PPH -0.4532 0.006 -0.7557 -0.211 0.139 -0.9631

AL_PH 0.0214 0.33 -0.2335 -0.1064 0.381 -0.4326

TEMP 0.2875 0.017 0.4326 -0.1318 0.356 -0.5204

PRECP 0.389 0.01 0.5346 0.2134 0.185 0.9530

Fuente: Elaboración Propia, Software GeoDa y R.

67

En la tabla 18 se observan los resultados para los otros dos años (2014-2016). Se considera

igualmente que un P-valor menor al 5% o cercanos a este poseen un esquema de autocorrelación

espacial con respecto a la variable dependiente, siendo estas para el año 2014 PO_NDGN,

PO_NDA, PAH_PL, PODM, PPH y PRECP; que para el año 2016 las variables que cumplen con

esta condición son PO_NDEE, PO_NDGN, PO_NDA, PAH_PL, PODM, PPH, AL_PH y TEMP.

Tabla 18: Moran Bivariado 2014 – 2016

Año 2014 2016

Variable I P - Valor Z(I) I P - Valor Z(I)

PO_NDEE 0.0835 0.207 0.7569 0.2247 0.021 2.0260

PO_NDGN 0.4549 0.001 4.5082 0.4528 0.002 3.8169

PO_NDA 0.146 0.072 1.4734 0.3397 0.008 3.2661

PO_NDAL -0.0592 0.246 -0.6967 -0.135 0.116 -1.1681

PO_NDRB -0.0276 0.384 -0.3676 -0.0634 0.302 -0.5488

PAH_PL -0.2612 0.002 -2.7594 -0.254 0.015 -2.2726

PO_DET 0.0436 0.258 0.6802 -0.0205 0.429 -0.1330

PODM -0.1966 0.03 -2.1043 -0.1476 0.074 -1.4251

PODCP 0.0844 0.141 1.1318 0.0163 0.389 0.2050

PPH -0.2869 0.005 -2.9057 -0.3552 0.002 -3.0413

AL_PH 0.0727 0.205 0.6987 0.149 0.079 1.4355

TEMP 0.02 0.412 0.2329 -0.149 0.103 -1.2980

PRECP 0.2009 0.037 2.1070 -0.064 0.32 -0.4751

Fuente: Elaboración Propia, Software GeoDa y R.

Por último, se analizaron los correlogramas bivariados de la variable dependiente con las variables

independientes que presentan autocorrelación espacial según los resultados obtenidos en el I de

Moran Bivariado, éstos se encuentran en los anexos de la sección A, con el fin de encontrar rezagos

de órdenes superiores que sean significativos. En esta sección solo se evalúa el tipo de significancia

si es negativa o positiva, ya que no se tiene certeza si los órdenes superiores son o no significativos;

aunque, para los primeros ordenes de estas variables se encontró significancia como se observó

anteriormente. Para el año 2007, se observó los órdenes superiores los cuales para la PO_NDEE

presenta para el 1 y el 4 orden una posible significancia positiva, PO_NDGN se encontró que para

el 2 y 4 orden una posible significancia negativa, PO_NDAL se encontró para el orden 2 y 3 una

posible significancia positiva al igual que para el PO_NDRB y PAH_PL; para el PODCP se

encontró solo para el primer orden una significancia positiva, para el PPH se encontró que para el

orden 2 y 4 una posible significancia positivas, para la TEMP se encontró para el primer orden una

significancia positiva y finalmente para la variable PRECP se encontró que para órdenes 3 y 4 una

posible significancia positiva. Para el año 2011 la variable PO_NDGN se encontró para los 2

primeros ordenes una posible significancia positiva al igual que en la PRECP, y en la variable

PAH_PL se encontró para los 2 primeros ordenes una posible significancia negativa, al igual que

en el PODM.

68

Para el año 2014 en las variables significativas se observó que, para PO_NDGN el 4 orden una

posible significancia negativo, para el PO_NDA se encontró en el 3 orden una posible significancia

negativo, para PAH_PL de 2 orden una posible significancia positivo, en la variable PODM en los

órdenes 2 y 3 una posible significancia positiva, en la variable PPH para el orden 2 y 4 una posible

significancia positiva y en la variable precipitación en el orden 2 y 4 una posible significancia

siendo el de orden dos positiva. Finalmente, para el año 2016 en las variables significativas se

observó el siguiente comportamiento para los órdenes superiores, PO_NDEE en sus órdenes 1 y 2

una posible significancia positiva al igual que en la variable PO_NDGN, en la variable PO_NDA

se encontró que en el orden 2 y 3una posible significancia negativa, el resto de ordenes positiva,

en la variable PAH_PL se observó que en sus órdenes 2,3 y 4 una posible significancia siendo estas

positivas, para la variable PODM todos sus órdenes son posiblemente significativos, pero para el

orden 3 y 4 una posible significancia positiva, en PPH se observa para el orden 2 y 3 una posible

significancia negativa, en AL_PH se encontró una posible significancia en sus órdenes siendo para

el orden 1 y 3 positiva y para la variable TEMP se encontró una posible significancia en sus órdenes

siendo para el orden 3 el único que es positivo.

5.2. Análisis Confirmatorio de los Datos

Después de haber realizado el análisis exploratorio de los datos espaciales (AEDE) de la variable

respuesta (NivRiesgo) se comprobó que esta enseña un esquema significativo de dependencia

espacial en cada uno de los años analizados. Sin embargo, este no permite en primer lugar

identificar las razones que expliquen el fenómeno, y en segundo, determinar la estructura de esta

dependencia (Moreno & Vayá, 2002). Inicialmente, se trabajó bajo el supuesto de que el riesgo es

el producto de 3 factores generales (Ecuación 1), por eso al ver el análisis de los datos, se observa

que, para cada año se encuentran variables que representan estos factores; para el factor de

vulnerabilidad se encuentra PO_NDGN, PO_NDA, PO_NDRB y PAH_PL; para el factor de costos

se encuentran variables como PO_DET,PODM, PODCP, PPH, AL_PH y finalmente para el factor

de tipo peligro se encuentra PRECP y TEMP. Estas demostraron estar relacionadas en el espacio

con la variable independiente y por ello se consideran para el modelamiento espacial, pues

informan de problemas de dependencia espacial en una ecuación.

Se debe realizar en primera instancia una modelación regresiva clásica para tener una primicia de

las posibles variables que son significativas en la explicación de la variable endógena, este tipo de

modelamiento no implica relaciones espaciales, pues se debe verificar primero la relación que hay

en ellas para poder, enseguida, realizar el modelamiento de una regresión espacial, en donde ya se

incorporan las variables significativas del resultado de la modelación clásica y las variables de

asociación espacial que no fueron incluidas en este, que por medio del análisis bivariado se obtuvo

indicio de una relación espacial que puede llegar a ser significativa; y así obtener un modelo más

completo, que se ajuste en forma y espacialmente al fenómeno a explicar (NivRiesgo).

5.2.1. Modelo Regresivo Clásico

En primer lugar, se aborda el modelo clásico de regresión lineal sin efectos espaciales, estimados

por mínimos cuadrados ordinarios (MCO), siendo este el punto de partida previo para abordar los

69

modelos espaciales. El propósito de este análisis es encontrar relación entre una variable

dependiente y un conjunto de variables independientes, que si se estiman por MCO es capaz de

modelar los valores de predicción y los observados con un buen ajuste bajo criterios de hipótesis

básicos (Yrigoyen, 2003). Las variables exógenas que se ajusten y den buen resultado después del

análisis de la regresión clásica y a sus supuestos pueden convertirse en variables candidatas para

un modelo espacial, adicionales a las identificadas en el AEDE (Bohórquez & Ceballos, 2008).

Para cada año las variables independientes identificadas fueron incluidas en una regresión clásicas

estimada por MCO. Se aplicó el método de stepwise hacia adelante o introducción progresiva,

siendo este un modelo en el que se comienza sin ninguna variable regresoras y en cada etapa se

introduce la más significativa hasta encontrar el mejor ajuste de estas; y el método hacia atrás o

eliminación progresiva, es donde el modelo de regresión parte con todas las variables regresoras y

en cada etapa se elimina la variable menos influyente según el contraste individual hasta encontrar

el mejor ajuste de estas; este proceso se usó para todos los años con un nivel de significancia de P-

valor < 0.05, y con el criterio de Akaike (AIC) como un test parcial para determinar que variables

explicativas deben permanecer en el modelo final. Posterior al método stepwise se incluyeron las

variables que guardan correlación espacial con el NivRiesgo y se probó que tan significativo era

su aporte al modelo de regresión clásico.

Para el año 2007 la regresión stepwise se realizó en ambos métodos (hacia adelante y hacia atrás)

teniendo como criterio el P-valor y el AIC que mostraron las mismas variables significativas para

el estudio; las variables del mejor modelo de regresión encontrado se observan en la tabla 19, en

donde según éste, el NivRiesgo puede explicarse un 69% por: el porcentaje de hogares que no

disponen del servicio de energía eléctrica (PO_NDEE), porcentaje de hogares que disponen de

electrodomésticos (PO_DET), el porcentaje de hogares que disponen de motocicletas (PODM), el

número de personas por hogar (PPH) y la temperatura media anual del año en gestión (TEMP), si

bien como se observa no todas las variables son significativas a un P-valor < 0.05, pero todas

aportan al modelo que podría explicar la variable NivRiesgo, siendo su combinación la que

presenta el R – Cuadrado más alto de todas las posibles combinaciones.

Tabla 19: Estimación modelo de regresión Clásico (Año 2007)

Variables Estimado P-Valor

Intercepto 79.2879 0.0010

PO_NDEE -12.4963 0.0786

PO_DET -0.3418 0.0018

PODM -0.5791 0.0719

PPH -8.7150 0.0008

TEMP -1.2858 0.0946

R - Cuadrado 0.693

R - Cuadrado ajustado 0.575

AIC 101.78


70

Aunque el AEDE identifico variables como PO_NDA, PO_NDGN, PO_NDAL entre otras que

previamente se mencionaron, como variables relacionadas espacialmente con el NivRiesgo, éstas

no fueron significativas en la elección por stepwise. Sin embargo, algunas de estas fueron

incorporadas en el presente modelo y las que no se incorporarán en los modelos espaciales, donde

se determinara si son o no significativas para el mismo, la ecuación 28 representa el modelo

regresivo lineal clásico para el año 2007, en donde los 𝛽𝑘 aluden a los valores estimados para cada

variable de la tabla 19.

𝑁𝑖𝑣𝑅𝑖𝑒𝑠𝑔𝑜2007 = 𝛽0 + 𝛽1𝑃𝑂_𝑁𝐷𝐸𝐸 + 𝛽2𝑃𝑂_𝐷𝐸𝑇 + 𝛽3 𝑃𝑂𝐷𝑀 + 𝛽4𝑃𝑃𝐻 + 𝛽5𝑇𝐸𝑀𝑃 (28)

Se efectuaron pruebas diagnósticas formales para el modelo clásico del 2007, en la tabla 20 se

observan los supuestos del modelo regresivo con su respectiva prueba y resultados de las mismas.

El supuesto de heteroscedasticidad, propone que la varianza no es la misma para las variables del

modelo, se verificó esto a través del test Breush-Pagan cuya hipótesis nula 𝐻0 sostiene que la

varianza no depende de los regresores auxiliares, es decir, la existencia de homocedasticidad.

Debido a que el P-valor para este test es mayor al nivel de significancia (p < 0.05) no hay evidencia

suficiente para rechazar la hipótesis nula, por ende, el modelo es homoscedastico. De la misma

manera no se rechaza la hipótesis nula del test Shapiro-Wilk realizada a los residuos, está nos indica

que los datos siguen una distribución normal; para tener mayor certeza en los residuos se aplicó el

test Jarque-Bera de normalidad confirmándonos que estos siguen una distribución normal. Para el

test Reset y Rainbow los cuales aluden a una buena especificación del modelo y la linealidad del

mismo respectivamente, se encuentra que el modelo no está bien especificado por su nivel de

significancia lo cual hace que se rechace la hipótesis, pero en cuanto a su linealidad no presenta

problema alguno (Kramer & Sonnberger, 2014).

Tabla 20: Supuestos modelo regresión clásico (Año 2007)

Supuesto Test Contraste P-Valor

Heteroscedasticidad Breush-Pagan 10.3090 0.0670

Normalidad Shapiro Wilk 0.9897 0.9981

Jarque-Bera 0.1602 0.9230

Especificación Reset 11.0020 0.0024

Linealidad Rainbow 2.7803 0.2165

Autocorrelación I-Moran 1.1901 0.117


Para verificar el supuesto de multicolinealidad, la cual describe la dependencia lineal entre las

variables predictoras; puede ser determinada mediante el cálculo del Factor de Inflación de

Varianza (VIF) (Vega & Guzmán, 2011), siendo este un indicador de multicolinealidad específica

de cada variables predictora del modelo, siendo como regla general, si el 𝑉𝐼𝐹 ≥ 10 entonces existe

multicolinealidad, si el 𝑉𝐼𝐹 ≥ 4 se justifica una investigación adicional. En la tabla 20 se observan

los VIF para cada variable, ninguno de las variables superó el umbral que justifica investigación

71

adicional (4), ni tampoco el supuesto de multicolinealidad. El NivRiesgo para este año es explicado

por los factores de vulnerabilidad, costo y amenaza.

Tabla 21: Supuestos VIF de Multicolinealidad (Año 2007)

Variable VIF

PO_NDEE 1.1763

PO_DET 2.5899

PODM 1.0693

PPH 1.7643

TEMP 2.5373


Para el año 2011, es el que menor cantidad de variables exógenas incorporadas al modelo regresivo

lineal, la regresión stepwise se realizó en ambos sentidos (hacia adelante y hacia atrás) teniendo

como criterio el AIC que mostró más variables significativas que el criterio de P-valor; las variables

del mejor modelo de regresión encontrado se observan en la tabla 22, en donde según éste, el

NivRiesgo puede explicarse un 83% por: el porcentaje de hogares que no disponen del servicio de

gas natural (PO_NDGN), el porcentaje de hogares que dispone de electrodomésticos (PO_DET) y

de la precipitación media anual para el año de estudio, si bien como se observa todas las variables

son significativas a un P < 0.05, pero aún faltan incluir algunas variables que posiblemente aportan

al modelo, siendo su combinación la que presenta el R – Cuadrado más alto de todas las posibles

combinaciones.




PO_NDGN 0.286 0.000

PO_DET -0.155 0.001

PRECP -1.061 0.075

R - Cuadrado 0.831


AIC 86.416


Aunque el AEDE identifico variables como PAH_PL y PODM, entre otras que previamente se

mencionaron, como variables relacionadas espacialmente con el NivRiesgo, éstas no fueron

significativas en la elección por stepwise. Sin embargo, algunas de estas fueron incorporadas en el

presente modelo y las que no se incorporarán en los modelos espaciales, donde se determinara si

son o no significativas para el mismo, la ecuación 29 representa el modelo regresivo lineal clásico

para el año 2011, en donde los 𝛽𝑘 aluden a los valores estimados para cada variable de la tabla 22.

72

𝑁𝑖𝑣𝑅𝑖𝑒𝑠𝑔𝑜2011 = 𝛽0 + 𝛽1𝑃𝑂_𝑁𝐷𝐺𝑁 + 𝛽2𝑃𝑂_𝐷𝐸𝑇 + 𝛽3 𝑃𝑅𝐸𝐶𝑃 (29)

Para los supuestos de heteroscedasticidad, normalidad en los residuos, especificación y linealidad

que se rechazan la hipótesis nula al 95% de confianza (Véase Tabla 23) indicando que el modelo

es homoscedastico, existe normalidad en los residuos, aunque se obtiene que el modelo no está

bien especificado y adicional no existe relación de linealidad, siendo estas variables óptimas para

explicar el comportamiento de la variable endógena.








Autocorrelación I-Moran -0.35707 0.6395


A las variables de este modelo, también se les aplicó el estadístico VIF para realizar el análisis de

multicolinealidad en el modelo, como se observa en la tabla 24, en donde se obtuvo que ninguna

de las variables presenta multicolinealidad; el NivRiesgo para este año al igual que en el pasado

también es explicado por los factores de vulnerabilidad, costo y amenaza.


Variable VIF

PO_NDGN 1.7210

PO_DET 1.0606

PRECP 1.7037


Para el año 2014, la regresión stepwise se realizó en ambos sentidos (hacia adelante y hacia atrás)

teniendo como criterio el AIC que mostró más variables significativas que el criterio de P-valor.

El porcentaje de hogares que no disponen del servicio de gas natural (PO_NDGN), el porcentaje

de hogares que no disponen de recolección de basura (PO_NDRB), el número de personas por

hogar (PPH), el área de localidad por hogar (AL_PH) y la temperatura promedio anual para el año

de estudio (TEMP) fueron las mejores candidatas para integrar el modelo regresivo clásico para

73

este año (Tabla 25), por tanto el NivRiesgo puede explicarse un 92%, siendo el porcentaje más alto

en los años de estudio; si bien como se observa no todas las variables son significativas a un P <

0.05, pero la combinación que presentan muestran un R – Cuadrado aceptable de todas las posibles

combinaciones.




PO_NDGN 0.1524 0.0002

PO_NDRB 2.4707 0.0506

PPH -5.0037 0.0005

AL_PH 0.0013 0.0852

TEMP 0.6756 0.1853

R - Cuadrado 0.923


AIC 76.061


Aunque el AEDE identifico variables como PO_NDA, PAH_PL, PODM y la PRECP que

previamente se mencionaron, como variables relacionadas espacialmente con el NivRiesgo, éstas

no fueron significativas en la elección por stepwise. Sin embargo, algunas de estas fueron

incorporadas en el presente modelo y las que no se incorporarán en los modelos espaciales, donde

se determinara si son o no significativas para el mismo, la ecuación 30 representa el modelo

regresivo lineal clásico para el año 2014, en donde los 𝛽𝑘 aluden a los valores estimados para cada

variable de la tabla 25.

𝑁𝑖𝑣𝑅𝑖𝑒𝑠𝑔𝑜2014 = 𝛽0 + 𝛽1𝑃𝑂𝑁𝐷𝐺𝑁 + 𝛽2𝑃𝑂𝑁𝐷𝑅𝐵 + 𝛽3 𝑃𝑃𝐻 + 𝛽4𝐴𝐿𝑃𝐻 + 𝛽5𝑇𝐸𝑀𝑃 (30)

Para los supuestos de heteroscedasticidad, normalidad en los residuos, especificación y linealidad

se debe observar si se rechazan la hipótesis nula al 95% de confianza (Véase Tabla 26) al analizarlas

se indica que el modelo es homoscedastico, existe normalidad en los residuos y existe relación de

linealidad, pero al igual que en los años anteriores se encuentra que el modelo no está bien

especificado por lo tanto se deben implementar otras variables que ayuden a la especificación de

la variable endógena.

74










A las variables de este modelo, también se les aplicó el estadístico VIF para realizar el análisis de

multicolinealidad en el modelo, como se observa en la tabla 27, en donde se obtuvo que ninguna

variable excede valores de 4 que justifican una investigación adicional, por lo tanto, tampoco

exceden el umbral de 10, descartando una multicolinealidad grave. El NivRiesgo para este año es

explicado por los factores de vulnerabilidad, costo y amenaza.


Variable VIF

PO_NDGN 1.905

PO_NDRB 1.913

PPH 2.727

AL_PH 1.135

TEMP 1.337


El año 2016 La regresión stepwise se realizó en ambos sentidos (hacia adelante y hacia atrás)

teniendo como criterio el AIC y el P-valor pues ambos mostraron la misma cantidad de variables

significativas. El porcentaje de hogares que no disponen de la recolección de basura (PO_NDRB),

el porcentaje de hogares que no disponen de gas natural (PO_NDGN), el número de personas por

hogar (PPH), el área de localidad por hogar (AL_PH) y la temperatura media anual (TEMP) fueron

las mejores y únicas candidatas para integrar el modelo regresivo clásico para este año. En la tabla

28 se pueden observar estas; por tanto, el NivRiesgo puede explicarse en un 83%. Si bien como se

observa no todas las variables son significativas a un P < 0.05, pero la combinación que presentan

muestra un R – Cuadrado aceptable de todas las posibles combinaciones.

75



Intercepto -4.0467 0.49343

PO_NDGN 0.0833 0.00196

PO_NDA 5.7194 0.03137

PPH -1.6957 0.01941

AL_PH 0.0012 0.06992

TEMP 0.7844 0.06718

R - Cuadrado 0.8306


AIC 67.195


En este año se observa que las variables relevantes en el AEDE no están en su totalidad implícitas

en la regresión clásica, ya que el PO_NDEE, PAH_PL, PODM entre otros no se tienen en cuenta;

la ecuación 31 representa el modelo regresivo lineal clásico para el año 2016, en donde los 𝛽𝑘

aluden a los valores estimados para cada variable de la tabla 28.

𝑁𝑖𝑣𝑅𝑖𝑒𝑠𝑔𝑜2016 = 𝛽0 + 𝛽1𝑃𝑂_𝑁𝐷𝐺𝑁 + 𝛽2𝑃𝑂_𝐷𝑁𝐴 + 𝛽3𝑃𝑃𝐻 + 𝛽4 𝐴𝐿_𝑃𝐻 + 𝛽5𝑇𝐸𝑀𝑃 (31)

Para los supuestos de heteroscedasticidad, normalidad en los residuos y linealidad se rechazan la

hipótesis nula al 95% de confianza (Véase Tabla 29) indicando que el modelo es homoscedastico,

existe normalidad en los residuos, el modelo está bien especificado y existe relación de linealidad,

siendo estas variables óptimas para explicar el comportamiento de la variable endógena.










76

A las variables de este modelo, al igual que en los anteriores, se les aplicó el estadístico VIF para

realizar el análisis de multicolinealidad en el modelo, como se observa en la tabla 30, se obtuvo

que ninguna variable excede valores de 4 que justifican una investigación adicional, por lo tanto,

tampoco exceden el umbral de 10, descartando una multicolinealidad grave. El NivRiesgo para

este año al igual que en los anteriores es explicado por los factores de vulnerabilidad, costo y

amenaza.


Variable VIF

PO_NDGN 1.659

PO_NDA 1.107

PPH 1.791

AL_PH 1.137

TEMP 1.166


Ahora que se conocen las variables que explican el NivRiesgo por inundación para cada año, se

necesita calcular los contrastes de autocorrelación espacial para determinar si los modelos

presentados anteriormente explican correctamente la variable respuesta, dependiendo de factores

propios de las localidades o por si lo contrario, existe algún tipo de interdependencia espacial entre

las localidades y el modelo clásico estimado por MCO no es el ideal para representar el fenómeno.

Finalmente se realiza un análisis de autocorrelación espacial en los residuos de los modelos

establecidos cuyos resultados se observan en la figura 20. En donde se parte de la formulación de

la hipótesis nula donde los residuos no están correlacionados espacialmente siempre y cuando el

valor de este sea igual a 0; por consiguiente se puede observar que gráficamente para el año 2007

la asociación de algunas localidades pero que en realidad esto no asegura una asociación espacial

global en la zona de estudio, basándose en el criterio de Esfera de influencia, para el año 2011 se

observa algo similar al año 2007, se observan localidades que poseen correlación espacial aunque

no predominan en la zona de estudio, por consiguiente, gráficamente no se podría decidir si hay o

no asociación espacial, siendo el criterio de K-Vecinos más cercanos con Kn=1; en el año 2014 el

criterio seleccionado es K-Vecinos más cercanos con Kn=4, se puede observar que ya hay más

localidades relacionadas con las vecinas esto gráficamente podría aportarnos que posiblemente se

encuentre asociación espacial o autocorrelación en los residuos del modelo clásica para este año,

finalmente para el año 2016 se observan zonas que están rodeadas de zonas con el mismo valor,

por consiguiente, observando esto y relacionándolo con el criterio para este año, siendo el criterio

reina de primer orden posiblemente se encuentre asociación espacial en los residuos; para la certeza

de este análisis grafico se debe realizar el análisis por medio del tes de Moran para los residuos.

77

Figura 20: Mapa Análisis de autocorrelación en los Residuos.


5.2.2. Modelo Regresivo Espacial

El modelo clásico estimado por MCO no es otra cosa que la simplificación de modelos espaciales

en ausencia de dependencia espacial en donde existe una matriz general de varianza parametrizada

para el término del error (Anselin, 1998); el principal problema en la utilización de estos modelos

tradicionales es la ausencia de la presencia de autocorrelación espacial en los residuos, haciendo

que estos modelos puedan mostrar problemas de especificación. Una consecuencia relevante es el

riesgo de estimar coeficientes ineficientes en los que las pruebas de significancia estadística serían

objetables debido a la inflación de los errores estándar.

78

En el AEDE se determinó que el NivRiesgo se encontraba autocorrelacionados en el espacio, por

lo que pensar que un modelo de regresión clásico podría funcionar es infundado; si bien existe

autocorrelación espacial, aún es incierto si ésta deba incorporarse en el modelo como rezago en

términos de error o en rezagos espaciales de las variables explicativas. Para identificar la estructura

de dependencia espacial del NivRiesgo, en primera instancia se debe realizar la prueba de I de

Moran a los residuos de la regresión por MCO. La detección de correlación espacial en los residuos

implicaría una relación no lineal entre la variable exógena y sus variables endógena, la omisión de

uno o más regresores espacialmente correlacionados o que una estructura de error autorregresivo

es la más apropiada (Florax & Folmer, 1992). Aunque el test de Moran funciona bien como prueba

general, el diagnóstico por multiplicadores de Lagrange es más específico, ya que provee una base

que ayuda a la elección de un modelo regresivo espacial apropiado (Anselin, 1988). En segunda

instancia, se realiza el diagnóstico Multiplicador de Lagrange (LM) con el fin de identificar si la

variable se encuentra rezagada espacialmente, existe autocorrelación espacial en el error o se

encuentran ambos fenómenos. Tanto la prueba de Moran como el LM, se basan en los residuales

del modelo por MCO con o sin efecto espacial (Yrigoyen, 2003).

En la tabla 31 se muestra el estadístico de I de Moran aplicado a los residuales de los modelos

regresivos clásicos seleccionados anteriormente. Para este se utilizaron las matrices de pesos

espaciales previamente seleccionadas y que mejor se ajustaran a las relaciones de contigüidad. En

los años 2007 y 2011 se observa que presentan una ausencia de autocorrelación espacial en los

residuos, esto basado en el P-valor (P-valor > 0.05), pero para los años 2014 y 2016 se observa que

hay autocorrelación espacial en los residuos, dicho esto, para estos años se debe analizar con mayor

precaución pues el test I de Moran podría indicar problemas de variables que fueron omitidas,

corrigiéndose a través de la inclusión del rezago espacial en el modelo. Para los demás, aunque no

se observe autocorrelación espacial en los residuos, se conoce a priori que el NivRiesgo está

autocorrelacionados en el espacio y por ende un modelo espacial debe ser calculado para éstos.

Tabla 31: Test Global de Moran para los residuos de las regresiones.

Año Matriz W P-Valor Z(I)

2007 Esfera de Influencia 0.1170 1.1901

2011 K - Vecinos 1 0.6395 -0.3571

2014 K - Vecinos 4 0.0104 2.3103

2016 Reina 1 0.0014 2.9955


El diagnóstico del ML para los modelos clásicos de cada año se presenta en la tabla 32, en donde

se asocia el valor del diagnóstico por medio de un P-valor. Para todos los años de estudio se observa

que ningún de estos modelos, modelo lineal de error espacial (LMerr), modelo lineal de rezago

espacial (LMlag), los modelos robustos de estos (RLMerr y RLMlag), ni el efecto de dependencia

espacial de forma autorregresiva en la variable endógena con un esquema de medias móviles en

las perturbaciones aleatorias (SARMA) podría explicar el fenómeno de estudio. En vista de que

los diagnósticos aplicados son versiones clásicas y robustas, es necesario calcular todos los posibles

modelos espaciales (SAR, SEM, SDM, SARAR, SDEM, GNS, SLX) y determinar cuál, de estos,

basados en el AIC, es el que mejor personifica la dependencia espacial y explica el NivRiesgo por

inundación para cada año.

79

Tabla 32: Diagnóstico inicial de dependencia espacial: Multiplicadores de Lagrange.

Modelo Lmerr Lmlag RLMerr RLMlag SARMA

Año P-Valor

2007 0.6826 0.8028 0.7261 0.8937 0.9116

2011 0.4226 0.7734 0.2750 0.4268 0.5287

2014 0.3097 0.9945 0.2448 0.5712 0.5085

2016 0.1640 0.1225 0.7221 0.4485 0.2849


Al tener las variables explicativas resultantes del modelo clásico y aquellas identificadas en el

análisis bivariado del AEDE, se determinó la composición de los modelos básicos para construir

modelos espaciales; se calculó cada uno de los siete modelos espaciales al modelo básico para cada

año, depurando las variables que no aportaban información a los mismos y afectaban

negativamente el criterio de información Akaike (AIC), (tabla 33).

Tabla 33: Comparación Modelos Espaciales. Criterio Akaike (AIC por sus siglas en inglés)

Modelo SAR SEM SDM SARAR SDEM GNS SLX

Año AIC

2007 34.7481 29.2555 27.0813 30.3020 38.4608 20.1001 34.8919

2011 88.3481 87.5455 82.6221 75.6169 85.6199 55.4083 83.1857

2014 83.4059 80.0927 71.2980 81.0560 91.2500 87.0723 80.3309

2016 67.9460 69.9250 57.3972 66.0780 56.1723 36.7856 64.0025


En la presente tabla se compararon los modelos que incorporan la dependencia espacial por medio

del AIC. Para el año 2007 se observa que el modelo más adecuado, seleccionado por este criterio,

es el Modelo anidado general (GNS) al igual que para el año 2011 y el 2016, siendo para este

modelo la interacción espacial de todas las posibles combinaciones entre variable endógena,

exógenas y el error se encuentra autocorrelacionados en el espacio; para el año 2014 se identificó

que el mejor modelo era el modelo mixto regresivo– regresivo espacial (SDM), es decir, las

variables exógenas y endógena se encuentran espacialmente rezagadas. El uso de este criterio

(AIC) radica en que se desempeña mejor con muestras de cualquier tamaño y provee una medida

simple y efectiva para la selección del modelo más apropiado a el modelo verdadero (Lee & Ghosh,

2014), es por ello que además se podría considerar que este podría no ser consistente en el número

adecuado de factores comunes (Caballero D., 2011), esto no quiere decir que se descarte la idea de

que este se adapta mejor.

Adicional a este se comparó por medio del criterio de información bayesiano (BIC) donde este

analiza el comportamiento de la probabilidad a posteriori del j-ésimo modelo cuando n tiende a

infinito, seleccionando aquel modelo que represente la menor cantidad (Posada & Rosero, 2007).

Siendo la diferencia entre el criterio AIC y BIC, que este considera el número n de observaciones

en el término de penalización. En la tabla 34 se observan los resultados aplicando el criterio BIC,

en donde, como resultado se seleccionan los mismos modelos que arrojó el criterio AIC por año;

80

comprobándonos de un criterio a otro cual es el mejor modelo que se pueda ajustar a la explicación

del fenómeno para el año de estudio.

Tabla 34: Comparación Modelos Espaciales. Criterio Bayesiano (BIC por sus siglas en inglés)

Modelo SAR SEM SDM SARAR SDEM GNS SLX

Año BIC

2007 42.3036 36.8110 36.5257 38.8020 52.6274 35.2111 38.6697

2011 94.0147 83.0188 91.1221 85.9170 75.8055 66.7416 87.9079

2014 90.9614 85.7593 84.5201 89.5560 99.7500 97.4611 85.9976

2016 74.0057 75.5916 71.5638 73.6335 64.6723 50.9522 64.0481


En los años de estudio se logró deducir que la variable dependiente presenta autocorrelación

espacial, resultado que se ratificó en las conclusiones arrojadas en el AEDE. En los años 2007 y

2011 se observó que no poseen autocorrelación espacial residual, mientras que el año 2014 y 2016

presentó una posible autocorrelación espacial residual, no obstante, el test I de Moran para los

residuos concluyó que no existía autocorrelación espacial en los mismos. El diagnóstico de

Multiplicadores de LaGrange (LM) no arrojó los mismos resultados que el criterio de AIC para los

modelos, este primero no permitió determinar por este diagnóstico los posibles modelos que se

adaptaban al fenómeno de estudio. Como se observa en el marco teórico en cuanto a la taxonomía

de modelos de regresión propuestos por Anselin y por Florax y Folmer, se especificaron modelos

para el NivRiesgo por inundación en cada año, teniendo como base el análisis exploratorio, el

modelo clásico y el modelo autorregresivo espacial seleccionados.

El modelo general anidado (GNS) se identificó como el más adecuado para el año 2007, en donde,

variables del factor vulnerabilidad como el porcentaje de hogares que no disponen de energía

eléctrica (PO_NDEE), el porcentaje de hogares que no disponen de recolección de basura

(PO_NDRB) y el porcentaje de afluentes hídricos por localidad (PAH_PL); para el factor de costo

se tienen las variables como el porcentaje de hogares que disponen de motocicletas (PODM), el

número de personas por hogar (PPH) y en el factor de amenaza se tiene la precipitación media

anual (PRECP); encontrando adicionalmente de las variables explicativas la interacción entre sus

rezagos y el error asociado espacialmente; en la ecuación 32 se presenta el modelo general anidado

(GNS) del año 2007, en donde 𝛽0 alude al intercepto, 𝜌 y λ los coeficientes de autocorrelación

espacial, , 𝑊 la matriz de pesos espaciales del criterio esfera de influencia, 𝑋𝛽 el vector de variables

explicativas con sus respectivos estimados y 𝑊𝑋𝜃 alude al retardo espacial de las variables

explicativas, se aclara que aunque la ecuación menciona el rezago espacial de la variable respuesta

esta no fue significativa para el estudio; los valores estimados de los componentes se encuentran

en la tabla 35.

𝑌 = 𝛽0 + 𝜌𝑊𝑌 + 𝑋𝛽 + 𝑊𝑅𝜃 + 𝜇 (32)

𝜇 = 𝜆𝑊𝜇 + 𝜖

Según los datos obtenidos se puede concluir que, por medio del 𝜌 alrededor del 69% de las

variaciones del fenómeno son extendidas a las localidades, incluyendo las perturbaciones aleatorias

que surgen en una localidad influyendo a sus vecinas, ambas de forma positiva, esto quiere decir

81

que el aumento de esta repercute a la variable respuesta disminuyéndola. El porcentaje de hogares

que no disponen de energía eléctrica y los hogares que disponen de motocicletas influencian en el

crecimiento del riesgo en la localidad, mientras que el aumento de porcentaje de hogares que no

disponen de recolección de basura, el porcentaje de afluentes hídricos, el número de personas por

hogar y la precipitación disminuyen para la localidad el riesgo de inundación. El efecto de las

siguientes variables en las localidades adyacentes repercutiría de la siguiente manera, el aumento

del porcentaje de hogares que no disponen de energía eléctrica, el porcentaje de hogares que no

disponen de alcantarillado y la temperatura media anual aumentarían el NivRiesgo, y el aumento

del porcentaje de hogares que no disponen de recolección de basura, el porcentaje de afluentes

hídricos por localidad y la precipitación media anual reduce el NivRiesgo. Según los test de

confirmación de los supuestos básicos de un modelo como lo son: test de Breush-Pagan que analiza

la heteroscedasticidad de este, la prueba de Shapiro-Wilk observa la distribución normal de los

datos y el test de I de Moran de autocorrelación espacial en base a un P-valor con significancia al

95%, nos indican para este modelo que, el modelo es homoscedastico, los residuos siguen una

distribución normal y se encontró que los residuos no poseen autocorrelación espacial. El Pseudo

R-Cuadrado presenta un valor del 97%, indicando que hay una muy buena bondad del ajuste; el R-

Cuadrado de Nagelkerle ratifica la buena bondad de este con un 93%. El modelo incluye todos los

factores que para el estudio pueden modelar el Riesgo por Inundación, por tanto, se podría decir

que este se ajusta bien, además de que la variabilidad del modelo es explicada en una proporción

considerable.

Tabla 35: Estimación modelo de regresión espacial para el año 2007 (GNS)


Rho -0.69652 0.00001

lambda -1.19810 < 2.22e-16

Intercepto -6.96763 5.85E-05

PO_NDEE 6.50682 2.29E-13

PO_NDRB -1.13044 9.12E-09

PAH_PL -0.67060 4.75E-14

PODM 0.26587 1.85E-08

PPH -1.10675 3.33E-12

PRECP -0.17495 0.000769

WPO_NDEE 33.95989 9.10E-15

WPO_NDAL 2.965543 4.84E-09

WPO_NDRB -3.982529 1.74E-06

WPAH_PL -2.133478 6.66E-16

WTEMP 1.814826 < 2.2e-16

WPRECP -2.36132 1.24E-11

Pseudo R – Cuadrado 0.974

R – Cuadrado (NK) 0.934

Breush Pagan 0.2659

Shapiro – Wilk 0.767

I de Moran (Residuos) 0.997


82

Al igual que en el año 2007 el modelo más adecuado para el 2011 es el modelo general anidado

(GNS), en donde, variables del factor vulnerabilidad como el porcentaje de hogares que no

disponen de gas natural (PO_NDGN), el porcentaje de hogares que no disponen de alcantarillado

(PO_NDAL) y el porcentaje de afluentes hídricos por localidad (PAH_PL); para el factor de costo

se tienen las variables como el porcentaje de hogares que disponen de electrodomésticos

(PO_DET), el número de personas por hogar (PPH) y en el factor de amenaza se tiene la

precipitación media anual (PRECP) y la temperatura media anual (TEMP) explican la variable

respuesta en diferentes proporciones, también se observa la interacción entre los rezagos de las

variables explicativas y el error aleatorio asociado a este, como se identificó que la única variable

que afecta a las localidades vecinas es la precipitación, al igual que el anterior año, el rezago de la

variable respuesta no es significativa, concluyendo que el Riesgo por inundación no influencia el

de las localidades vecinas. En la ecuación 33 se presenta el modelo general anidado (GNS), en

donde 𝛽0 alude al intercepto, 𝜌 y λ los coeficientes de autocorrelación espacial, 𝑊 la matriz de

pesos espaciales del criterio K-Vecinos más cercanos con Kn=1, 𝑋𝛽 el vector de variables

explicativas con sus respectivos estimados y 𝑊𝑅𝜃 alude al retardo espacial de las variables

explicativas; los valores estimados de los componentes se encuentran en la tabla 36.

𝑌 = 𝛽0 + 𝜌𝑊𝑌 + 𝑋𝛽 + 𝑊𝑅𝜃 + 𝜇 (33)


Según los datos obtenidos se puede concluir que, por medio de 𝜌 alrededor del 54% de las

variaciones del fenómeno son extendidas a las localidades, incluyendo las perturbaciones aleatorias

que surgen en una localidad son contagiadas a sus vecinas, pero de forma positiva, esto quiere decir

a medida en que la variable respuesta aumenta hace que está misma variable disminuya en las

localidades contiguas, al igual que el aumento del error aleatorio en una región específica, también

hace que disminuya en las regiones colindantes. El porcentaje de hogares que no disponen de gas

natural y el número de personas por hogar influencian en el crecimiento del riesgo en la localidad,

mientras que el aumento de porcentaje de electrodomésticos por hogar, la precipitación, el

porcentaje de afluentes hídricos, el porcentaje de hogares que no disponen de alcantarillado y la

temperatura disminuyen para la localidad el riesgo de inundación. El efecto de la variable

precipitación en las localidades adyacentes repercutiría negativamente, aumentando el fenómeno

de estudio. El modelo es homoscedastico, los residuos siguen una distribución normal y no están

correlacionados en el espacio según el P-valor de los estadísticos (Tabla 36). El Pseudo R-

Cuadrado presenta un valor del 99%, indicando que hay una muy buena bondad del ajuste; el R-




considerable.

83



Rho -0.54125 < 2.22e-16

lambda -0.98046 < 2.22e-16

Intercepto -16.70318 3.97E-11

PO_NDGN 0.43286 < 2.22e-16

PO_NDAL -8.01560 < 2.22e-16

PAH_PL -0.69870 3.20E-08

PO_DET -0.38772 < 2.22e-16

PPH 13.15648 < 2.22e-16

PRECP -1.99678 < 2.22e-16

TEMP -0.7330516 < 2.22e-16

WPRECP 5.15723 < 2.22e-16

Pseudo R - Cuadrado 0.999

R - Cuadrado (NK) 0.984

Breush Pagan 0.2373

Shapiro - Wilk 0.249



Para el 2014 el modelo más adecuado es el modelo mixto regresivo – regresivo espacial (SDM) en

donde, variables del factor vulnerabilidad como el porcentaje de hogares que no disponen de gas

natural (PO_NDGN) y el porcentaje de hogares que no disponen de recolección de basura

(PO_NDRB); para el factor de costo se tiene la variable área de localidad por hogares (AL_PH) y

en el factor de amenaza se tiene la precipitación media anual (PRECP) interaccionan espacialmente

para tratar de explicar la variable respuesta, se observa la interacción entre las variables explicativas

y sus rezagos; en la ecuación 34 se presenta el modelo mixto regresivo – regresivo espacial (SDM),

en donde 𝜌 representa el coeficiente de autocorrelación espacial, 𝑊 la matriz de pesos espaciales

del criterio K-Vecinos más cercanos con Kn=4, 𝑋𝛽 el vector de variables explicativas con sus

respectivos estimados, 𝑊2𝑅𝛽2 alude al retardo espacial de las variables explicativas y 𝑊1𝑌 alude

al retardo espacial en la variable respuesta; los valores estimados de los componentes se encuentran

en la tabla 37.

𝑌 = 𝜌𝑊1𝑌 + 𝑋𝛽1 + 𝑊2𝑅𝛽2 + 𝜇 (34)

𝜇 ≈ 𝑁(0, Ω)

Según los datos obtenidos se puede concluir que, por medio del 𝜌 alrededor del 80% de las

variaciones del fenómeno son extendidas a las localidades, siendo esta positivamente, esto quiere

decir que sí aumenta en una localidad en específico, en las vecinas disminuye; el porcentaje de

hogares que no disponen de gas natural, el porcentaje de hogares que no disponen de recolección

de basura influencian en el aumento del riesgo por inundación en la localidad, mientras que el

aumento del área por hogar en las localidades y la precipitación disminuyen para la localidad el

riesgo. El efecto que tienen las variables como el porcentaje de hogares que no disponen de gas

84

natural domiciliario, el porcentaje de hogares que no disponen de recolección de basura, el

porcentaje de hogares que no disponen de acueducto, el porcentaje de afluentes hídricos por

localidad en las localidades adyacentes repercutiría negativamente, aumentando el riesgo del

fenómeno, mientras que pasaría todo lo contrario, en las localidades adyacentes cuando se presenta

un aumento del porcentaje de hogares que disponen de motocicletas, el área de la localidad por

hogar y la precipitación. El modelo es homoscedastico, los residuos siguen una distribución normal

y no están correlacionados en el espacio según el P-valor de los estadísticos (Tabla 37). El Pseudo

R-Cuadrado presenta un valor del 97%, indicando que hay una muy buena bondad del ajuste; el R-




considerable.

Tabla 37: Estimación modelo de regresión espacial para el año 2014 (SDM)


Rho -0.80329 0.04073

Intercepto 5.50E+01 < 2.2e-16

PO_NDGN 3.02E-01 < 2.2e-16

PO_NDRB 7.49E+00 4.72E-12

AL_PH -2.64E-03 0.002749

PRECP -3.97E+00 5.77E-15

WPO_NDGN 7.71E-01 < 2.2e-16

WPO_NDRB 1.74E+01 0.000149

WPO_NDA 6.35E+01 6.73E-10

WPAH_PL 5.52E+00 1.98E-09

WPODM -1.19E+00 2.31E-07

WAL_PH -2.39E-02 1.79E-09

WPRECP -1.41E+01 < 2.2e-16



Breush Pagan 0.469




Finalmente, para el año 2016 el modelo que mejor se adapta en la explicación del riesgo de

inundación en las localidades, es el modelo general anidado (GNS), en donde se encuentran las

variables explicativas interactuando con sus rezagos, el rezago espacial de la variable respuesta y

el error aleatorio; como primera instancia se observa que el factor de vulnerabilidad está asociado

a las variables del porcentaje de hogares que no disponen de acueducto, el porcentaje de hogares

que no disponen de energía eléctrica y el porcentaje de afluentes hídricos localizados; para el factor

costo se encuentra la variable número de personas por localidad y finalmente en el factor de peligro

85

se encuentran las variables de temperatura media anual y la precipitación media anual; en la

ecuación 35 se puede observar la estructura del GNS, cuyos componentes se explicaron para los

años 2007 y 2011, a diferencia de esos años este año está bajo el criterio de contigüidad Reina de

primer orden; para este año también se observó que el rezago espacial en la variable respuesta no

fue significativo para el modelo.

𝑌 = 𝛽0 + 𝜌𝑊𝑌 + 𝑋𝛽 + 𝑊𝑅𝜃 + 𝜇 (35)


Con los datos resultantes de esta modelación se concluye que, por medio del 𝜌 alrededor del 79%

de las variaciones del fenómeno son extendidas a las localidades de forma negativa, esto quiere

decir que si el fenómeno aumenta en la localidad de estudiada las vecinas aumentarían con esta, lo

contrario a lo que se observa con las perturbaciones aleatorias, en donde se observa que afecta

positivamente. El porcentaje de hogares que disponen de acueducto, el porcentaje de afluentes

hídricos por localidad son las únicas variables que disminuyen el Riesgo por inundación; a

diferencia del porcentaje de hogares que no disponen de energía eléctrica, el número de personas

por hogar, la temperatura y la precipitación que aumentan el riesgo por inundación. Para los rezagos

espaciales de estas variables se observa que, el porcentaje de ocupantes que no disponen de gas

natural, el porcentaje de hogares que no disponen de energía eléctrica y el número de personas por

hogar aumentan el riesgo estudiado en las localidades vecinas, lo contrario cuando el porcentaje de

hogares que no disponen de acueducto y el porcentaje de afluentes hídricos por localidad al

aumentar generan que el riesgo disminuya en las localidades vecinas. También se aplicaron los test

de confirmación de los supuestos básicos de un modelo como lo son: test de Breush-Pagan que

analiza la heteroscedasticidad de este, la prueba de Shapiro-Wilk observa la distribución normal de

los datos y el test de I de Moran de autocorrelación espacial en base a un P-valor con significancia

al 95%, que nos confirman que el modelo es homoscedastico, los residuos siguen una distribución

normal y estos no están correlacionados espacialmente. El Pseudo R-Cuadrado presenta un valor

del 99%, indicando que hay una muy buena bondad del ajuste; el R-Cuadrado de Nagelkerle ratifica

la buena bondad de este con un 98%. El modelo incluye todos los factores que para el estudio

pueden modelar el Riesgo por Inundación, por tanto, se podría decir que este se ajusta bien, además

de que la variabilidad del modelo es explicada en una proporción considerable.



Rho 0.79711 6.66E-16

lambda -1.7119 < 2.22e-16

Intercepto -24.10965 < 2.22e-16

PO_NDA -13.50219 < 2.22e-16

PO_NDEE 5.012775 1.91E-12

PAH_PL -0.867555 < 2.22e-16

PPH 2.354336 < 2.22e-16

86

TEMP 0.938487 1.41E-09

PRECP 0.746906 < 2.22e-16

WPO_NDGN 0.179112 < 2.22e-16

WPO_NDA -50.286713 < 2.22e-16

WPO_NDEE 47.570314 < 2.22e-16

WPAH_PL -6.877874 < 2.22e-16

WPPH 4.919863 5.33E-15



Breush Pagan 0.4266




Conociendo los modelos de dependencia espacial para los años analizados, ya es posible inferir los

posibles resultados con respecto a estos, las variables y los coeficientes que ellos poseen. Otra

alternativa más eficiente que solo interpretar los coeficientes de los modelos establecidos es el

análisis de impactos, ya que este análisis permitirá obtener medidas escalares para cuantificar el

conjunto de impactos no lineales sobre todas las regiones, como resultado de los cambios de alguna

variable en una región (Azorín & Sánchez de la Vega, 2008).

5.3. Impactos

Los modelos de regresiones espaciales exponen en muchas ocasiones la complicada estructura de

dependencia entre observaciones de ciertos polígonos (localidades, municipios, países), debido a

esto, las estimaciones de los parámetros contienen una gran cantidad de información sobre las

relaciones entre las observaciones y sus regiones asociadas (LeSage & Pace, 2009), esto conlleva

a que un cambio en una sola observación (localidad) asociada con una variable explicativa dada

afectará a la región en sí (Impacto Directo) y posiblemente afectará a todas las demás regiones de

manera indirecta (Impacto Indirecto), adicional a estos se puede ver la suma de las afectaciones

tanto directas como indirectas (Impacto Total).

Como se identificó en la sección anterior, los modelos autorregresivos espaciales identificados por

año contienen en sus modelaciones el retardo espacial de la variable endógena, posibilitando el

cálculo de tres tipos de impactos basados en los coeficientes de las variables explicativas por cada

modelo; se aclara que si los modelos no poseen un retardo espacial aun así se podrían calcular estos

de diferentes formas, incluyendo el análisis gráfico, el cual indica el cambio de la variable respuesta

de una región de estudio por otro y observando los cambios que esto genera por medio de diferentes

supuestos que se deben analizar dependiendo del tema de estudio; pero para el estudio se puede

simplificar este proceso por medio de la función Impacts del software R, siempre y cuando los

modelos poseen el retardo espacial de la variable endógena (𝜌).

87

Para el año 2007 en términos de los impactos, hipotéticamente se plantea un aumento del 10% del

riesgo por inundación, observando que las variables explicativas se comportarían de la siguiente

manera; para el porcentaje de hogares que no disponen de energía eléctrica se destaca que es el de

mayor impacto tanto directo como indirecto, esto quiere decir que siguiendo la hipótesis el impacto

que generaría en la localidad en si es de un 75%, para el impacto indirecto se observa que como es

un valor distinto a cero (-3.71) se podría decir que los cambios en el porcentaje de hogares que no

disponen de energía eléctrica de todas las localidades respecto a una localidad i reduce el nivel de

riesgo por inundación de esta localidad, finalmente el total de impacto que genera esta variable es

de un 38% en el distrito capital; para el porcentaje de hogares que no disponen de recolección de

basura se observa que reduciría el riesgo de inundación en un 6% en las localidades, una reducción

del 13% en sí misma y un aumento del 6% en las localidades vecinas.

En el porcentaje de afluentes hídricos por localidad se observa que, reduciría el riesgo de

inundación en un 3% en las localidades, el 7% en sí misma y el aumento del 3% en las localidades

vecinas; para el porcentaje de hogares que disponen de motocicleta se observa que aumenta el

riesgo de inundación en un 1% en la zona de estudio, un 3% en la misma localidad y una

disminución del 1% aproximadamente en las localidades vecinas; por el número de personas por

hogar se concluyó que disminuye el riesgo por inundación en un 6% en las localidades, el 12% en

sí misma y aumenta el riesgo en un 6% en las localidades vecinas. Finalmente, la variable

precipitación disminuye el riesgo en un 1% en todo el distrito capital, el cual un 2% disminuye en

la localidad misma y aumenta un 1% en las localidades vecinas.

Tabla 39: Impactos - 2007

Variables Directo Indirecto Total

PO_NDEE 7.5549079 -3.71952 3.835388

PO_NDRB -1.31253 0.6462001 -0.66633

PAH_PL -0.778612 0.3833352 -0.395277

PODM 0.3086972 -0.151981 0.1567158

PPH -1.285024 0.6326577 -0.652366

PRECP -0.203125 0.1000047 -0.10312


Para el año 2011 se analiza de la misma forma que el año anterior, como se observa en la tabla 40,

la mayoría de las variables afectan positivamente, reduciendo el riesgo por inundación en las

localidades del distrito capital, se manejara la misma hipótesis que el año 2007 planteando un

aumento del 10% del riesgo por inundación, para eso se obtendría que el riesgo por inundación en

Bogotá disminuiría en un 74% aproximadamente si el porcentaje de hogares que no disponen de

alcantarillado, el porcentaje de afluentes hídricos, el porcentaje de hogares que disponen de

electrodomésticos, la precipitación y la temperatura aumentaran; y se produciría un aumento del

riesgo por inundación del 88% si aumenta el porcentaje de hogares que no disponen de gas natural

y el número de personas que conforman un hogar.

88



PO_NDGN 0.565007 -0.284157 0.2808505

PO_NDAL -10.46268 5.2619513 -5.200728

PAH_PL -0.912005 0.4586709 -0.453334

PO_DET -0.506091 0.2545264 -0.251565

PPH 17.173018 -8.636754 8.536264

PRECP -2.606376 1.3108136 -1.295562

TEMP -0.956845 0.4812219 -0.475623


El nivel de riesgo por inundación en el distrito capital para el año 2014 se aumenta en un 43%

aproximadamente si el porcentaje de hogares que no dispone de gas natural y el porcentaje de

hogares que no dispone de recolección de basura aumentan, mientras que se amino este riesgo en

un 22% si el área de la localidad por hogares y la precipitación aumentan. La influencia que posee

este riesgo para las localidades vecinas indica que si el porcentaje de hogares que no disponen de

gas natural, el porcentaje de hogares que no disponen de recolección de basura y la precipitación

aumenta en una localidad reducirá el riesgo de inundación. Por otro lado, características propias de

una localidad como el área destinada por hogar en esta y el aumento de la precipitación afectan

directamente a la misma, indicando que el aumento de estas reduciría el riesgo por inundación.



PO_NDGN 0.3250214 -0.157523 0.1674989

PO_NDRB 8.0626109 -3.907568 4.1550432

AL_PH -0.002842 0.0013773 -0.001465

PRECP -4.276456 -2.072597 -2.203859


Finalmente, se observa que, las variables como el porcentaje de hogares que no disponen de

acueducto y el porcentaje de afluentes hídricos por localidad sugieren en la disminución del riesgo

de inundación para todo Bogotá en el año 2016, siendo el impacto del cambio en el porcentaje de

hogares que no disponen de acueducto el que mayor influencia tiene en las localidades vecinas.

Mientras que se observa para este año que las variables que aumentan el riesgo de inundación para

toda Bogotá el aumento del porcentaje de hogares que no disponen de energía eléctrica, el número

de personas por hogar, la temperatura y la precipitación, en estas variables se observa que para la

localidad en sí y las vecinas el aumento de estas igualmente generaría el aumento del riesgo.

89



PO_NDA -18.08545 -48.46521 -66.55067

PO_NDEE 6.714343 17.993028 24.707371

PAH_PL -1.162043 -3.114032 -4.276075

PPH 3.1535064 8.450734 11.604241

TEMP 1.2570528 3.368637 4.62569

PRECP 1.0004408 2.680971 3.6814117


Como se puede observar en el presente numeral el impacto en el riesgo por inundación en las

localidades de Bogotá puede afectar la estructura mutua entre estas junto con las variables

explicativas, en tanto el cambio en esta estructura mutua puede afectar el impacto del riesgo por

inundación en el distrito capital.

5.4. Regresión Geográficamente Ponderada

La regresión geográficamente ponderada (GWR) hace posible explorar si la asociación entre el

fenómeno de estudio y las posibles variables explicativas es constante en toda la ciudad o si es

posible identificar variaciones por zonas, ya que esta permite la estimación de parámetros locales

y no sólo globales (Sánchez Peña, 2006), esto se tiene bajo el supuesto de estacionariedad espacial,

donde los parámetros derivados de los modelos autorregresivos espaciales cuya especificación y

aplicación es global; pero, bajo la inexistencia de estacionariedad espacial los parámetros podrían

no representar la verdadera situación de estudio, omitiendo la consideración de la variable local

sobre el espacio (Foody, 2003); por eso la identificación de la variación local a través del espacio,

es adecuado realizar un análisis propiamente local (GWR) en lugar del uso de modelos

autorregresivos espaciales (análisis global).

Este tipo de regresión es una técnica basada en un conjunto de estimaciones de parámetros locales

que esta produce para cada relación que se pueden mapear con el fin de producir una superficie de

parámetros en toda la región de estudio, proporcionando información más exacta del fenómeno y

su relación con las unidades adyacentes a esta (Charlton, Fotheringham, & Brunsdon, 2005), estos

autores proponen básicamente 3 razones por las cuales se debe sospechar que las relaciones varían

en el espacio; la primera razón es la consideración de la no estacionariedad , ya que hay variaciones

espaciales en las relaciones observadas, la segunda la estructuración espacial de la información, ya

que influye considerablemente en la estimación de las relaciones entre las variables del estudio, la

documentación cuantitativa de la variación del fenómeno en las unidades espaciales; la tercera es

la posibilidad de que la relación pueda tener comportamiento localizado y no global en donde se

refiere a la mala especificación del modelo a partir del cual se miden las relaciones que

posiblemente poseen especificaciones erróneas a las percibidas en la realidad, omitiendo variables

relevantes en el modelo o están representadas de formas incorrectas. Este método en definitiva

consiste en ajustar tantas regresiones como observaciones (unidades espaciales) se consideren en

el análisis, en base al concepto de “distance decay” donde se da más peso a las observaciones

90

próximas y menos a las más alejadas, por medio de la función kernel, simulando el efecto con la

distancia (Gutierrez Puebla, García Palomares, & Daniel Cardozo, 2012).

Una de las ventajas de usar este método es la posibilidad de estimar coeficientes de determinación

locales para cada unidad espacial a partir de los valores de un conjunto de observaciones vecinas,

permitiendo conocer la forma en que se combinan localmente las variables de la regresión para

obtener un mejor ajuste en una localización (Fotheringham, Charlton, & Brunsdon, 1998), además

se observa como los coeficientes de cada uno de los predictores (elasticidades) varían de una unidad

espacial a otra – representando la inestabilidad espacial. El uso de esta técnica para el presente

estudio permitirá entender desde otra perspectiva (global a local) la influencia de los determinantes

del riesgo de inundación para cada año y como esta afecta las diferentes unidades espaciales

(localidades) en Bogotá. Como ya se describió anteriormente en el AEDE se identificó la

autocorrelación espacial de la variable respuesta y las variables explicativas, con su posterior

análisis de correlación entre las mismas. De la misma manera como se realizó la modelación

clásica y autorregresiva espacial se busca explicar en gran medida el Riesgo por inundación

(NivRiesgo) en función de las variables explicativas agrupadas en diferentes factores que

configuran el riesgo, estos modelos y en su mayoría se trabajaron a un nivel de significancia del

0.10 con el fin de obtener la mayor cantidad de factores que pudieran explicar el fenómeno.

Para el año 2007 el modelo incorporo variables relacionadas a los factores de costo y peligro,

siendo estos el número de personas por hogar (PPH) y la precipitación media anual (PRECP),

siendo todas a una significancia del 5%; el R-Cuadrado del modelo es de 60%, que, aunque no es

una buena predicción, es aceptable para el estudio.

Tabla 43: Estimación regresión geográficamente ponderada (GWR) - 2007

Variables Min Max Media

Intercepto 2.7532 3.0284 2.8388

PPH -0.6927 -0.6580 -0.6808

PRECP 0.1857 0.2461 0.2290

R-Cuadrado 0.6052

R-Cuadrado Ajustado 0.4748


La distribución del R-Cuadrado local en la zona de estudio, se encuentra en un intervalo de (0.53-

0.62), figura 21, en donde las localidades como Barrios Unidos, Usaquén, Chapinero, Santafé y

Suba presentan los valores más altos del R-Cuadrado, lo contrario pasa con las localidades de

Tunjuelito, Rafael Uribe y Bosa siendo las que se ubican en el rango más bajo, mientras que en las

otras localidades oscilan en los intervalos de 0.56 a 0.59 aproximadamente.

91

Figura 21: Distribución espacial del R-Cuadrado en Bogotá D.C., GWR - 2007.


A continuación, se pueden observar el análisis de las variables explicativas significativas

resultantes de la regresión geográficamente ponderada, en donde se observan los coeficientes

obtenidos junto a los valores t (t-student) significativos o no estadísticamente para cada una de las

localidades. En la figura 22 se observa los mapas obtenidos de la variable PPH, en esta variable se

observa que las localidades de Teusaquillo, Puente Aranda, Los Mártires, Kennedy y Fontibón son

las únicas que presentan un valor significativo con valores negativos bajos, indicando que en estas

localidades es de importancia el número de personas por hogar para mitigar el riesgo por

inundación en estas zonas; mientras en los mapas obtenidos de la variable PRECP, en esta se

observa que las localidades de Tunjuelito y Bosa son las únicas que no dan significativas, para las

localidades del norte de la ciudad (Candelaria, Barrios Unidos, Teusaquillo, Usaquén, Chapinero,

Santafé, San Cristóbal, Engativá y Suba) presentan valores positivos altos indicando que entre

mayor precipitación halla mayor riesgo por inundación.

Figura 22: Distribución espacial del coeficiente locales y P-valores de las variables PPH y

PRECP, modelo GWR - 2007.


92

Para el año 2011 el modelo incorporo variables relacionadas a los factores de vulnerabilidad, costo

y peligro, siendo estos el porcentaje de hogares que no disponen de gas natural (PO_NDGN),

porcentaje de hogares que disponen de electrodomésticos (PO_DET) y la precipitación media anual

(PRECP), siendo todas a una significancia del 5%; el R-Cuadrado del modelo es de 84%, se

considera una buena predicción para el estudio.



Intercepto 15.2287 17.0489 16.0593

PO_NDGN 0.2722 0.3114 0.2950

PO_DET -0.1636 -0.1468 -0.1586

PRECP -1.4171 -0.9154 -1.2744

R-Cuadrado 0.8427




0.89), figura 23, en donde las localidades del sur (Tunjuelito, Rafael Uribe, San Cristóbal, Usme y

Ciudad Bolívar) de Bogotá presentan los valores más altos del R-Cuadrado, lo contrario pasa con

las localidades del norte en especial Suba que es la que presenta el menor valor siendo de 0.82, las

otras localidades que se encuentran en la mitad de Bogotá están presentes en el intervalo de 0.84 a

0.86 aproximadamente.

Figura 23: Distribución espacial del R-Cuadrado en Bogotá D.C., GWR – 2011

. Fuente: Elaboración Propia, Software R

93




localidades. En la figura 24 se pueden observar las variables de PO_DET y PO_NDGN, para el

porcentaje de hogares que disponen de electrodomésticos se muestra que todas las localidades son

estadísticamente significativas presentando una relación con la variable respuesta negativa para

toda la zona, en las localidades del sur oriente (Tunjuelito, Ciudad Bolívar y Bosa) es posible que

a menor porcentaje presentado se presente mayor riesgo por inundación en términos de costos. De

la misma manera se observa en el porcentaje de hogares que no disponen de gas natural afectando

en la totalidad el sur (Tunjuelito, Rafael Uribe, San Cristóbal, Usme y Ciudad Bolívar) aunque para

esta variable se presenta una relación con el riesgo por inundación positiva, lo cual a mayor

porcentaje presentad, es probable que se presente mayor riego en términos de vulnerabilidad.

Figura 24: Distribución espacial del coeficiente locales y P-valores de las variables PO_DET y

PO_NDGN, modelo GWR – 2011.


En la figura 25 se pueden observar la variable de precipitación media anual (PRECP) no son

significativas las localidades del norte de Bogotá, mientras se observa que las localidades del centro

y sur (Tunjuelito, Rafael Uribe, Candelaria, Santafé, San Cristóbal, Usme, Ciudad Bolívar y Bosa)

son estadísticamente significativas presentan una relación negativa con el Riesgo de Inundación en

donde es posible que a menor precipitación se presente mayor riesgo por inundación en términos

de peligro.

94

Figura 25: Distribución espacial del coeficiente locales y P-valores de la variable PRECP,

modelo GWR – 2011.


El año 2014 es el que mayor número de variables incidentes en el Riesgo por inundación; el modelo

incorporo variables relacionadas a los factores de vulnerabilidad, costo y peligro, siendo estos el

porcentaje de hogares que no disponen de gas natural (PO_NDGN), porcentaje de hogares no

disponen de alcantarillado (PO_NDAL), porcentaje de hogares no disponen de recolección de

basura (PO_NDRB), el número de personas por hogar (PPH), el área de la localidad por hogar

(AL_PH), la temperatura media anual y la precipitación media anual (PRECP), siendo todas a una

significancia del 5%; el R-Cuadrado del modelo es de 96%, se considera una muy buena predicción

para el estudio.



Intercepto 10.5932 12.9793 11.8002

PO_NDGN 0.1519 0.1570 0.1536

PO_NDAL -4.6077 -3.7359 -4.1606

PO_NDRB 6.3068 7.3598 6.8833

PPH -5.3675 -4.4541 -4.8895

AL_PH 0.0025 0.0036 0.0029

TEMP 0.8690 0.9086 0.8854

PRECP -1.2145 -0.9153 -1.0456

R-Cuadrado 0.96




0.98), figura 26, en donde las localidades del sur ( San Cristóbal, Usme y Ciudad Bolívar) presentan

los valores más altos del R-Cuadrado, lo contrario pasa con las localidades del norte (Fontibón,

Engativá y Suba) presentando el menor valor, siendo de 0.96, las otras localidades que se

encuentran en la mitad de Bogotá están presentes en el intervalo de 0.965 a 0.975

aproximadamente.

95






localidades. En la figura 27 se pueden observar las variables de AL_PH y PO_NDAL, en ambas

variables se muestran que las localidades son estadísticamente significativas, pero para el AL_PH

se presentan una relación con la variable respuesta positiva en toda la zona, en las localidades del

occidente (Bosa y Fontibón) es posible que a un aumento de esta se presente mayor riesgo por

inundación en estas zonas; lo contrario pasaría con PO_NDAL, en donde las localidades del norte

en especial Usaquén es la que presenta una mayor relación negativa con el fenómeno, es decir que

a menor porcentaje de ocupantes que no disponen de alcantarillado se presentaría un mayor riesgo

por inundación.

Figura 27: Distribución espacial del coeficiente locales y P-valores de las variables AL_PH y

PO_NDAL, modelo GWR – 2014.


96

Para el caso de las variables porcentaje de hogares que no disponen de gas natural (PO_NDGN) y

el porcentaje de hogares que no disponen de recolección de basura (PO_NDRB) se observa que

todas las localidades son estadísticamente significativas, y ambas presentan una relación con la

variable respuesta positiva en toda la zona; esto se observa en la figura 28, en donde para el

PO_NDGN las localidades del sur occidente (Usme, Ciudad Bolívar y Bosa) presentarían un mayor

riesgo de inundación si hay un aumento de esta variables, mientras para el caso de PO_NDRB las

localidades del centro (Tunjuelito, Rafael Uribe, San Cristóbal) presentarían un mayor riesgo donde

el porcentaje de esta variable llegara aumentar. Ambas representarían el factor vulnerabilidad.

Figura 28: Distribución espacial del coeficiente locales y P-valores de las variables PO_NDGN y

PO_NDRB, modelo GWR – 2014.


En las variables de número de personas por hogar (PPH) y temperatura media anual (TEMP) se

representa una significancia estadística en toda la zona de estudio (figura 29), para el PPH se

presenta una relación negativa en toda la zona, donde las localidades del noroccidente (Bosa,

Kennedy, Fontibón, Engativá y Suba) , es decir que a menor porcentaje de esta se presentaría un

mayor riesgo por inundación; lo contrario pasaría con la TEMP, siendo Tunjuelito, Usme, Ciudad

Bolívar y Bosa las localidades que representan una relación positiva marcada, lo cual se plantea la

suposición de que si esta presentara un aumento el nivel de riesgo por inundación en esta zona

aumentaría.

Figura 29: Distribución espacial del coeficiente locales P-valores de las variables PPH y TEMP,



97

Finalmente, para la variable precipitación media anual (PRECP), solo las localidades del norte son

estadísticamente significativas (figura30), esta variable presenta una relación negativa en toda la

zona significativa, en donde las localidades como Bosa, Kennedy, Fontibón, Engativá y Suba son

las que en una probabilidad de aumento de esta variable en esta zona disminuiría el riesgo por

inundación.

Figura 30: Distribución espacial del coeficiente locales y P-valores de la variable PRECP,



Para el año 2016 el modelo incorporo variables relacionadas a los factores de vulnerabilidad, costo

y peligro, siendo estos el porcentaje de hogares que no disponen de gas natural (PO_NDGN),

porcentaje de hogares que disponen de electrodomésticos (PO_DET), el número de personas por

hogar (PPH) y la temperatura media anual (TEMP), siendo todas a una significancia del 5%; el R-

Cuadrado del modelo es de 80%, se considera una buena predicción para el estudio.



Intercepto -4.2003 2.3824 -1.7648

PO_NDGN 0.0851 0.0898 0.0861

PO_DET -0.0916 -0.0549 -0.0724

PPH -2.8724 -2.2743 -2.4250

TEMP 0.8319 1.5126 1.2499

R-Cuadrado 0.8081




0.86), figura 31, en donde las localidades del sur (Tunjuelito, Rafael Uribe, San Cristóbal, Usme y

Ciudad Bolívar) de Bogotá presentan los valores más altos del R-Cuadrado, lo contrario pasa con

las localidades del norte (Usaquén y Suba) que son las que presentan el menor valor siendo de 0.78,

98

las otras localidades que se encuentran en la mitad de Bogotá están presentes en el intervalo de

0.80 a 0.84 aproximadamente.


. Fuente: Elaboración Propia, Software R

Al analizar las variables que fueron significativas para el estudio de este año resultantes de la

regresión geográficamente ponderada, observando los coeficientes obtenidos junto a los valores t

(t-student) significativos o no estadísticamente para cada una de las localidades. En la figura 32 se

pueden observar las variables de PO_DET y PO_NDGN, en ambas variables se muestran que todas

las localidades son estadísticamente significativas, pero para el PO_DET se presentan una relación

con la variable respuesta negativa en toda la zona, en las localidades del norte (Suba y Usaquén)

es posible que a menor porcentaje de hogares que disponen de electrodomésticos se presentaría

mayor riesgo; lo contrario pasaría con el PO_NDGN , donde presenta una relación con la variable

respuesta positiva, que para las localidades de Usme y Ciudad Bolívar un aumento porcentual de

esta generaría un aumento en el riesgo por inundación.

Figura 32: Distribución espacial del coeficiente locales P-valores de las variables PO_DET y

PO_NDGN, modelo GWR – 2016.


99

Figura 33: Distribución espacial del coeficiente locales P-valores de las variables PPH y TEMP,



La variable número de personas por localidad (PPH) muestra para este año una significancia en

todas las unidades de estudio, presentando una relación negativa con la variable a explicar, se

observa que la mayoría de las localidades presentan una mayor interacción con el fenómeno, en

donde es posible que a menor número de personas por hogar se presente un mayor riesgo, esto solo

excluiría a las localidades de Antonio Nariño, Tunjuelito, Rafael Uribe, Santafé y San Cristóbal.

Para la variable (TEMP), las localidades del norte (Usaquén, Suba, Engativá y barrios Unidos) no

presentan significancia estadística, para Tunjuelito, Rafael Uribe y San Cristóbal se observa que,

si aumentara la temperatura en estas el riesgo aumentaría considerablemente.

5.5. Discusión y Contextualización del Modelo

Según los resultados los factores que inicialmente se propusieron en la configuración del riesgo

por inundación como lo son: vulnerabilidad, costo y amenaza se vieron reflejados no en su

totalidad, pero sí gran parte en los años estudiados, afirmando que realmente el riesgo no solo es la

implicación de factores naturales, si no también sociales, económicos y políticos que van implícitos

en las variables que lograron adaptarse a todo el proceso estadístico aplicado en este proyecto,

además estos resultados van relacionados al nivel de riesgo por cada 10.000 hogares, esto quiere

decir que si hay mayor número de eventos en una zona en que hay menor cantidad de hogares

generaría un mayor riesgo por inundación.

A través de los años estudiados (2007-2011-2014-2016) se pusieron a prueba las mismas variables

sociales, ambientales y económicas, pero no todas participaron activamente en la determinación

del Riesgo que genera el fenómeno de inundación para los años correspondientes, aunque los

servicios públicos son importante en su mayoría no todos se reflejaron en los años, inicialmente se

pensó en que la mayoría de localidades tenían un cubrimiento de estos, por consiguiente se debió

observar el porcentaje que no disponen de este, pues esto como se explicó genera que los hogares

en esas zonas sean más vulnerables a cualquier fenómeno o suceso; en los costos, inicialmente se

100

plantearon muchas variables que van implícitas, pero se observó que la mayoría tenían una alta

correlación por eso se prosiguió a usar el método AHP para poder generar una estandarización

óptima, sin perder la importancia que implicaba el que un hogar tuviera televisor a que tuviera

lavadora u otro electrodoméstico que actualmente son esenciales para las labores diarias de

sostenimiento; se resalta que el análisis del riesgo en sí implica muchas variables que pueden como

no ser cuantificadas, además de la complejidad que tiene esto, ya que el riesgo no se puede medir

igualmente para todas las zonas, porque limitaría el conocimiento de las condiciones particulares

de los lugares a estudiar (Martínez, 2015).

El impacto que posee la variable de precipitación (PRECP) es evidente en todos los años y en

varios estudios (Sedano Cruz, Carvajal Escobar, & Ávila Díaz, 2016), en donde se menciona a esta

como el principal influyente, que no solo incrementa el riesgo sino que también impacta

ecosistemas y sectores socioeconómicos, aunque en los primeros 3 años de estudios esta variable

tuvo relación inversa al riesgo, esto quiere decir que realmente para estos años sucedió algo más

que la precipitación la que generó el riesgo, que mientras para el último año se evidencio que esta

si es un influyente del fenómeno. En cuanto a los servicios públicos y respecto a las estadísticas

del DANE, para el servicio público de energía eléctrica por hogares la cobertura oscila entre el

98% al 100% total de cobertura, el servicio de gas natural domiciliario oscila entre un 46% al 100

de cobertura, ya para este servicio se encuentra que en muchas localidades este servicio aún no

presenta un porcentaje aceptable de cobertura; para el servicio de acueducto ya se encuentra que

en las localidades se presenta una gran cobertura siendo en su mayoría del 99.5% al 100%, en

cuanto a la cobertura que posee el alcantarillado en la ciudad va desde un 97% al 100% aunque en

la mayoría de localidades la cobertura es buena, finalmente en el servicio de recolección de basura

oscila entre un 98% al 100%, se aclara que todos estos datos solo se pueden medir siempre y cuando

los barrios que hallan en cada localidad estén legalizados o que el servicio prestado sea legal, ya

que no se puede medir los hogares que usan de estos servicios sin pagar del (fraudulentamente) o

que se conectan de otros hogares que si pagan de este; en cuanto al análisis de estas variables a

través del tiempo, no se encuentra un servicio que influencie todos los años, pero si se encuentran

las combinaciones de estos, pues se analizó previamente que estos no estuvieran correlacionados o

esto afectaría la modelación del fenómeno creando falsas especulaciones.

Los afluentes hídricos han sido generalmente la consideración más importante en algunas zonas,

para la planificación de estos en contra de problemas específicos como el control de inundaciones

(Gobierno de Argentina Programa de Desarrollo Regional de la OEA, 2000) por eso para el estudio

también se considera esta variable pues este representa un papel importante para los hogares que

se encuentran cerca de él o las localidades que poseen una gran proporción de estos en ella pues,

como se planteó en el marco teórico de este, podría aumentar el factor vulnerabilidad para el

estudio; en cuanto a los modelos se observó que esta variable se referencia en todos los años, pues

es de gran importancia, aunque en los resultados esta variable actúa de manera inversa al riesgo,

afirmándonos que él aunque es una variable importante, hoy al pasar de los años se han tomado

acciones que mitigan el desbordamiento de estos, por lo tanto esta variable nos arrojaría que el

control gubernamental sobre este ha tenido repercusiones positivas para la sociedad.

Para las variables dentro del factor costo se encontraron que para todos los años se encuentra

relacionado alguna variable de estas, pues no todas son afectadas de la misma forma, por ejemplo

en todos los años se encontró relacionado el número de personas por hogar, este se relacionó al

supuesto de que a mayor personas por hogar mayores elementos que poseen un costo se

encontrarían ligados a ellos, como por ejemplo la ropa, objetos de valor que son de uso diario;

101

elementos como estos que son difícilmente de cuantificar o de hacer una medición de estos, en un

sector de estudio como el de Bogotá, adicional a esta variable se encuentra la combinación con el

porcentaje de hogares que disponen de electrodomésticos como también el porcentaje de hogares

que disponen de algún vehículo siendo este carro particular o motocicleta. Finalmente, como se

mencionó anteriormente la precipitación juega un papel fundamental, pero para el estudio también

se consideró la temperatura, la cual juega un papel fundamental al igual que la precipitación pues

esta presenta una relación lineal con la precipitación, ya que se ha demostrado que el aumento de

las lluvias está relacionado a la disminución de la temperatura (Puertas & Carvajal, 2011), estas

dos variables pueden presentar cambios drásticos generados por fenómenos externos como el

cambio climático y fenómenos como el del Niño y el de la Niña. En los modelos y para el estudio

estas son las variables del factor de amenaza, y están presentes en todos los modelos que a

diferencia de la precipitación la temperatura si genero un aumento del riesgo en la localidad y en

las vecinas.

Con respecto a lo anterior, se afirma que el estudio y conocimiento de los aspectos del riesgo por

inundación es la relación no solo de factores naturales si no la configuración de factores de tipo

social, económicos y ambientales que sus combinaciones expresan este fenómeno en Bogotá,

enriqueciendo y ayudando a posibles investigaciones posteriores a esta, cuyo fin podría ser la

implementación de programas que junto a los actuales pueden mitigar más el riesgo por inundación

presente en las localidades, igualmente no se descarta el uso de SAT que actualmente y en

investigaciones han demostrado ayudar a la comunidad en problemas como estos, también la

importancia de la aplicación espacial en el proceso de identificación de los múltiples factores de

riesgo y la distribución en el territorio.

102

Capítulo VI

Conclusiones y Recomendaciones

La relación de las nuevas herramientas informáticas como lo son los sistemas de información

geográfica y la estadística ayudan a generar análisis a diferentes tópicos (multidisciplinarios), que

para este estudio fueron aplicados a la modelación del riesgo de inundación en Bogotá D.C. en un

periodo del 2007 hasta el 2016.

Los estudios sobre los distintos riesgos por factores naturales son en otras palabras, estudios de

interaccionan entre grandes cantidades de factores tanto cualitativos como cuantitativos, por tal

razón y para intentar explicar estas medidas, una de las mejores alternativas frente a esta

problemática es el estudio espacial por medio de tecnologías geográficas.

Se destaca que esta investigación es posiblemente la primera aproximación desarrollada para

modelar el riesgo de inundación en la ciudad de Bogotá D.C que tiene en cuenta la interacción de

variables sociales, económicos y ambientales configuradas en factores de vulnerabilidad, costos y

peligros.

Estos estudios se generan por el afán del hombre en reducir el riesgo de inundación, y así poder

convivir en espacios geográficos con la menor cantidad de riesgos, o en las mejores condiciones

naturales posibles. Para esto es fundamental que el estudio esté acompañado no solo de variables

básicas, sino también de factores externos que lo determinen, con el fin de generar soluciones a los

problemas de inundación a partir de una metodología estadística bien definida, con calidad de

datos.

Al estudiar el comportamiento del riesgo por inundación, se evidencio que en el periodo inicial las

localidades de Teusaquillo, Los Mártires, Chapinero y Santafé son las que representan un mayor

riesgo de inundación por cada 10.000 hogares, esto en otras palabras es el registro de un mayor

número de eventos de inundación que generaron el aumento del riesgo para estas, y que para el año

final de estudio se encontraron estas y adicional la localidad de Candelaria.

Esto nos indicaría que, aunque se han realizado planes o alternativas que mitigan el riesgo en las

localidades, estos no se ven reflejados como si se puede visualizar en otras, posiblemente el

gobierno y el distrito se enfoque en la amenaza inmediata que genera el desbordamiento del río

Bogotá.

Para las alternativas de disminución del riesgo en estas localidades se propuso la ampliación de

cobertura de los servicios públicos domiciliarios como lo es el de gas natural, la recolección de

basura, acueducto y energía eléctrica, un mayor control en la precipitación, la temperatura y

adicionalmente control en la ubicación de los hogares.

En futuros trabajos se podría generar la relación entre la topografía del área de estudio, las

características geológicas y geomorfológicas de este, el nivel freático y posiblemente un análisis

más detallado de la precipitación y la temperatura en condiciones extremas, siendo para la

precipitación el mayor aumento que esta llegara a presentar en el tiempo de estudio, mientras que

inversamente para la temperatura, siendo el menor valor que este pudiera llegar a tener en el tiempo

de estudio; esto bajo el supuesto de que a mayor precipitación y menor temperatura se podrían

103

generar el aumento de fenómenos meteorológicos que aumentarían la probabilidad del riesgo bajo

la configuración planteada.

Se recomendaría a las entidades gubernamentales, en especial al instituto distrital de gestión del

riesgo y cambio climático, compensar en las variables previamente analizadas no solo con el fin de

reducir el riesgo por inundación, sino también el posible riesgo de otros factores ambientales que

influyan en Bogotá. Se recomienda un mejor control por las entidades en torno a estos temas y

estas variables, con el fin de tener una mayor exactitud informática, que, conllevaría a mejores

resultados, enriqueciendo la actividad investigativa en estudios similares.

Finalmente, se podría plantear para el mayor control de factores de peligro (temperatura y

precipitación), además de los afluentes hídricos (factor vulnerabilidad) la implementación de un

sistema de alerta temprana, que, por medio de la implementación del internet de las cosas ayudara

a que la población esté más informada y preparada en distintos factores que conllevan a la

configuración del riesgo, siendo para este estudio el riesgo que generan las inundaciones en los

hogares de Bogotá; adicionalmente para el factor de costo se sabe que presenta la integración de

diferentes variables, posiblemente se podría realizar una encuesta a escalas más detalladas

(municipal – barrio) con el fin tener un mayor control de estas.

104

A. Anexo: Correlogramas bivariados

Figura 34: Moran Bivariado 2007


105



106



107



108

Bibliografía

Agudelo, G., Franco, L., & Franco, L. (2015). Aplicación de la econometría espacial para el análisis de la

miseria en los municipios del departamento de Antioquia *. Semestre Económico, 18(37), 103–128.

Anselin, L. (1988). Lagrange multiplier test diagnostics for spatial dependence and spatial heterogeneity.

Geographical Analysis, 20(1), 1–17. https://doi.org/10.1111/j.1538-4632.1988.tb00159.x

Anselin, L. (1996). Interactive techniques and exploratory spatial data analysis, 253–266.

Anselin, L. (1998). Exploratory spatial data analysis in a geocomputational environment.

GeoComputation, 77–94.

Anselin, L. (2001). Spatial econometrics. A Companion to Theoretical Econometrics, 310–330.

https://doi.org/10.1002/9780470996249

Anselin, Syabri, & Kho. (2006). Local indicators of spatial association-LISA. Geographical Analysis,

27(2), 93–115. Retrieved from file:///Z:/MyDocs/Journal/PDF/GIS/Anselin1995.pdf

Armadas, F., & Herrera, G. (2015). Amenazas de origen natural, (May 2016).

https://doi.org/10.13140/RG.2.1.4616.8723

Arturo, M., & Villalba, R. (2007). Control de Inundaciones del Rio Tunjuelito. Revista de Topografia

AZIMUT, 1, 1–5.

Azorín, J. D., & Sánchez de la Vega, M. del M. (2008). Efectos del capital humano sobre la productividad

del trabajo bajo condiciones de dependencia espacial: el caso de las provincias españolas. Smart

Regions for a Smarter Growth Strategy, 39(5), 561–563.

Banco Mundial. (2012). Análisis de la Gestión del Riesgo de Desastres en Colombia: Un Aporte Para La

Construcción de Políticas Públicas. Sistema Nacional de Información Para La Gestión Del Riesgo de

Desastres, 438. https://doi.org/333.3109861/A56

Baronio, A., Vianco, A., & Rabanal, C. (2012). Una Introducción a la Econometría Espacial: Dependencia

y Heterogeneidad. Catedra de Econometría, 33.

Bayliss, A. C., & Reed, D. W. (2001). The Use of Historical Data in Flood Frequency Estimation. Center

for Ecology and Hydrology, (Wallingford, England), 92.

Bohorquez Castañeda, M. P. (2010). Estadistica Espacial. Universidad Nacional de Colombia

Departamento de Estadística.

Bohórquez, I. A., & Ceballos, E. V. (2008). Algunos conceptos de la econometría espacial y el análisis

exploratorio de datos espaciales. Ecos de Economia, (27), 9–34.

Bradley, D., Russell, D., Ferguson, I., Isaacs, J., Macleod, A., & White, R. (2015). The Internet of Things

- The future or the end of mechatronics. Mechatronics, 27, 57–74.

https://doi.org/10.1016/j.mechatronics.2015.02.005

Caballero D., F. F. (2011). Selección de modelos mediante criterios de información en análisis factorial.

Aspectos teóricos y computacionales. Tesis doctoral.

Cabrera, E., Vargas, D. M., Galindo, G., García, M. C., Ordóñez, M. F., Vergara, L. K., … Giraldo, P.

(2011). Memoria técnica de la cuantificación de la deforestación histórica nacional - Escalas gruesa

y fina. Director.

109

CENAPRED. (2001). Diagnóstico de peligros e identificación de riesgos de desastres en México. Centro

Nacional de Prevención de Desastres. Retrieved from http://www.cenapred.unam.mx

Chandrasekar, V., & Cifelli, R. (2012). Concepts and principles of rainfall estimation from radar: Multi

sensor environment and data fusion. Indian Journal of Radio and Space Physics, 41(4), 389–402.

Charlton, M., Fotheringham, S., & Brunsdon, C. (2005). Geographically Weighted Regression. ESRC

National Centre for Research Methods, 73(7), 4385–4390. https://doi.org/10.1111/1467-9884.00145

Collier, C. G. (2007). Flash flood forecasting: What are the limits of predictability? Quarterly Journal of

the Royal …, 133(October), 937–948. https://doi.org/10.1002/qj

Congreso de Colombia. (1994). Ley 142 de 1994. Retrieved from

http://www.sic.gov.co/sites/default/files/normatividad/Ley_142_1994.pdf

Cressie, N. A. C. (1994). Statistics for Spatial Data. Biometrics (Vol. 50).

https://doi.org/10.2307/2533238

DNP. (2015). 3.181 muertos y 12,3 millones de afectados: las cifras de desastres naturales entre 2006 y

2014. Retrieved from https://www.dnp.gov.co/Paginas/3-181-muertos,-21-594-emergencias-y-12,3-

millones-de-afectados-las-cifras-de-los-desastres-naturales-entre-2006-y-2014-.aspx

Dray, S., Legendre, P., & Peres-Neto, P. R. (2006). Spatial modelling: a comprehensive framework for

principal coordinate analysis of neighbour matrices (PCNM). Ecological Modelling, 196(3–4), 483–

493. https://doi.org/10.1016/j.ecolmodel.2006.02.015

Espinosa Bordón, O. (2008). Los desastres naturales y la sociedad. Revista Médica Electronica, (10), 30.

Retrieved from http://www.revmatanzas.sld.cu/revista medica/ano 2008/vol4 2008/tema10.htm

Fernández Asunción, O. (2008). Triangulación de Delaunay. Blog, 1–6. Retrieved from

http://www.dma.fi.upm.es/recursos/aplicaciones/geometria_computacional_y_grafos/web/triangulaci

ones/delaunay.html

Fernández, S. de la F. (2009). Estadística descriptiva: números índices. In Departamento de Economía

Aplicada (Vol. 4349463559, p. 23). Retrieved from

http://www.fuenterrebollo.com/Economicas2013/indices-teoria.pdf

Flood observatory. (1990). Global active archive of large flood events. Women Health, 16(2), 41–58.

https://doi.org/10.1080/10888705.2011.551630

Flooding, U. (2013). Precision flood models and spatial analysis of flood risk in Great Britain.

Florax, R., & Folmer, H. (1992). Specification and estimation of spatial linear regression models.

Regional Science and Urban Economics, 22(3), 405–432. https://doi.org/10.1016/0166-

0462(92)90037-2

Foody, G. M. (2003). Geographical weighting as a further refinement to regression modelling: An

example focused on the NDVI-rainfall relationship. Remote Sensing of Environment, 88(3), 283–

293. https://doi.org/10.1016/j.rse.2003.08.004

Fotheringham, A. S., Charlton, M. E., & Brunsdon, C. (1998). Geographically weighted regression: a

natural evolution of the expansion method for spatial data analysis. Environment and Planning A,

30(11), 1905–1927. https://doi.org/10.1068/a301905

Garcia, J., Salvador, A., Díaz, J., & de la riva, J. (2006). Aplicación del proceso de jerarquía analítica en la

selección de tecnología agrícola. Agronomía Costarricense, 1, 107–114.

110

Geoda (V 1.12) [Software]. (n.d.). The center for spatial data science. Retrieved November 3, 2018, from

https://spatial.uchicago.edu/content/about

Giraldo, R. (2011). Estadística Espacial - Notas de Clase. Universidad Nacional de Colombia, 136.

Gobierno de Argentina Programa de Desarrollo Regional de la OEA. (2000). Calidad Ambiental y

Desarrollo de Cuencas Hidrográficas: un Modelo para Planificación y Análisis Integrados. Calidad

Ambiental y Desarrollo de Cuencas Hidrográficas: Un Modelo Para Planificación y Análisis

Integrados, 105. Retrieved from http://www.oas.org/dsd/publications/unit/oea69s/oea69s.pdf

González Velandia, J. C. (2014). La gestión del riesgo de desastres en las inundaciones de Colombia: una

mirada crítica. Universidad Católica De Colombia Facultad De Ingeniería Programa De Ingeniería

Civil Especialización En Recursos Hídricos, XXXIII(2), 81–87. https://doi.org/10.1007/s13398-014-

0173-7.2

Goodchild, M. F. (1987). Spatial Autocorrelation. CATMOG - Concepts and Tecniques in Modem

Geography, (Geo Books, Norwich), 30.

Guha-sapir, D., Hoyois, P., & Below, R. (2011). Annual Disaster Statistical Review 2010: The numbers

and trends. Review Literature And Arts Of The Americas. https://doi.org/10.1093/rof/rfs003

Gutierrez Puebla, J., García Palomares, J. C., & Daniel Cardozo, O. (2012). Regresión Geográficamente

Ponderada (GWR) y estimación de la demanda de las estaciones del Metro de Madrid. XV Congreso

Nacional de Tecnologías de La Información Geográfica, 1–13. Retrieved from http://www.age-

geografia.es/tig/2012_Madrid/ponencia2/GutierrezPuebla_final_par.pdf

Hunt, J. (2002). Floods in a changing climate : A review. Philosophical Transactions : Mathematical ,

Physical and Engineering Sciences, 360(1796), 1531–1543.

IDIGER. (n.d.). SAB - SIRE. Retrieved January 10, 2018, from http://www.sire.gov.co/web/sab

IDIGER. (2018). Riesgo por Inundación. Retrieved August 24, 2018, from

http://www.idiger.gov.co/rinundacion

Klement, T., Lorangb, M. S., & Stanford, Ja. A. (2009). River flood plains are model ecosystems to test

general hydrogeomorphic and ecological concepts. Limnetica, 30(2), 76–86.

https://doi.org/10.1002/rra

Kramer, W., & Sonnberger, H. (2014). The linear regression model under test. American Statistical

Association Fovnded, 84(406), 618–619.

Lee, H., & Ghosh, & S. K. (2014). Performance of information criteria for spatial models. Statistical

Computation and Simulation, (December 2014), 37–41. https://doi.org/10.1080/00949650701611143

LeSage, J., & Pace, R. K. (2009). Introduction to Spatial Econometrics. https://doi.org/10.4000/rei.3887

Márquez, H. (2011). Métodos matemáticos de evalucación de factores de riesgo para el patrimonio

Arqueologico: Una aplicación GIS del método de jerarquias analíticas de T.L Saaty. Intellectual

Property, 8(12), 2–3.

Martínez, M. T. (2015). La Complejidad de los Riesgos de Desastre y su Investigacion Interdisciplinaria.,

16. Retrieved from http://www.pirna.com.ar/files/pirna/SICSYRD_PON_MARTINEZ_Martha.pdf

Moreno, R., & Vayá, E. (2002). Econometría espacial; nuevas técnicas para el análisis regional: una

aplicación a las regiones europeas. Investigaciones Regionales, (1), 83–106.

OMS, & OPS. (2000). Los desastres naturales y proteccion de la salud. Organizacion Panamericana De

111

La Salud, 11(575), 1–144. Retrieved from

http://apps.who.int/iris/bitstream/10665/167773/1/9275315752.pdf

Ordaz, M. G., & Yamín, L. E. (2004). Eventos Máximos Considerados (EMC) y Estimación de Pérdidas

Probables para el Cálculo del Índice de Déficit por Desastre (IDD) en Doce Países de las Américas.

Banco Interamericano de Desarrollo, 27.

Paola Andrea, P. H. (2014). De los servicios públicos domiciliarios como derecho fundamental. Un

derecho de la población vulnerable: estudio comparado – Colombia frente a España. Universidad

Católica de Colombia. Retrieved from

http://repository.ucatolica.edu.co/bitstream/10983/1926/1/Servicios_Publicos_Domiciliarios_un_der

echo_de_la_Poblacion_Vulnerable.pdf

Pava, J. (2015). La Gestión de Riesgos y el Cambio Climático en los POT de Bogotá. Foro Internacional-

Reducir El Riesgo, Nuestra Mejor Opción, 19.

Posada, S., & Rosero, R. (2007). Comparación de modelos matemáticos: una aplicación en la evaluación

de alimentos para animales. Rev. Col. Cienc. Pec., 20, 141–148.

Presentación de la herramienta R | Oficina Software Libre. (n.d.). Retrieved October 1, 2018, from

https://osluz.unizar.es/proyectos/r

Puertas, O., & Carvajal, Y. (2011). Incidencia de el niño-oscilación del sur en la precipitación y la

temperatura del aire en colombia, utilizando el Climate Explorer. Revista Científica Ingeniería y

Desarrollo, 23(23), 104–118. Retrieved from

http://rcientificas.uninorte.edu.co/index.php/ingenieria/article/viewArticle/2097

QGIS (V 2.18) [Software]. (n.d.). Bienvenido al proyecto QGIS! Retrieved November 3, 2018, from

https://www.qgis.org/es/site/

R (V 3.5.0) [Software]. (n.d.). R: The R Project for Statistical Computing. Retrieved November 3, 2018,

from https://www.r-project.org/

Reyes Olvera, A. L., & Gutiérrez González, E. (2016). Modelación del riesgo de inundaciones en el estado

de Tabasco en el periodo 1961-2007. Tecnología y Ciencias Del Agua, 11(2), 99–114. Retrieved

from

https://scholar.google.es/citations?view_op=view_citation&continue=/scholar%3Fhl%3Des%26as_s

dt%3D0,5%26scilib%3D1&citilm=1&citation_for_view=3LnqAmkAAAAJ:u-

x6o8ySG0sC&hl=es&oi=p

Rivera, N. A., Mendoza, G. G., Martínez, J. F., & Servin, C. C. (2010). Evaluación multicriterio y aptitud

agroclimática del cultivo de caña de azúcar en la región de Huasteca (México). Corpoica Ciencia y

Tecnología Agropecuaria, 11(2), 144. https://doi.org/10.21930/rcta.vol11_num2_art:207

Rojas, O., Mardones, M., Luis, J., & Aguayo, M. (2014). Una revisión de inundaciones fluviales en Chile ,

período 1574-2012 : causas , recurrencia y efectos geográ fi cos 1, 192, 177–192.

https://doi.org/10.4067/S0718-34022014000100012

Saaty, T. L. (2008). Decision making with the analytic hierarchy process. International Journal of

Services Sciences, 1(1), 83. https://doi.org/10.1504/IJSSCI.2008.017590

Sánchez Peña, L. L. (2006). Métodos para el análisis espacial. Una aplicación al estudio de la geografía de

la pobreza. I Congreso de La Asociación Latinoamericana de Población, 17. Retrieved from

http://www.alapop.org/Congreso06/DOCSFINAIS_PDF/ALAP_2006_mt10s10_1_04.pdf

Sedano Cruz, K., Carvajal Escobar, Y., & Ávila Díaz, Á. (2016). Análisis de aspectos que incrementan el

112

riesgo de inundaciones en Colombia, (November), 219–238.

https://doi.org/10.17151/luaz.2013.37.13

SIRE-IDIGER. (2014). Riesgo por Inundación - Idiger. Retrieved from

http://www.idiger.gov.co/rinundacion

Sistema Nacional de Información para la Gestión del Riesgo de Desastres. (n.d.). Retrieved January 10,

2018, from http://gestiondelriesgo.gov.co/snigrd/

Smith, D. (1994). Flood damage estimation - A review of urban stage damage curves and loss functions.

Wates S.A., 20, 231–238.

Thieken, A., & Merz, B. (2006). Methods for flood risk assessment: concepts and challenges.

International Workshop on Flash Floods in Urban Areas, (May 2016). Retrieved from

http://www.researchgate.net/profile/Heiko_Apel/publication/228677524_Methods_for_flood_risk_as

sessment_Concepts_and_challenges/links/02e7e51c1a4f7c8817000000.pdf

Valenzuela, E., & Silva, A. (2005). Evaluación De Riesgos De Origen Natural Y Plan De Contingencia.

Vega, J. C., & Guzmán, J. (2011). Regresión PLS y PCA como solución al problema de multicolinealidad

en regresión múltiple. Revista de Matemática: Teoría y Aplicaciones, 18(1), 9–20.

https://doi.org/10.1016/j.semreu.2010.04.004

Yrigoyen, C. C. (2003). Econometría Espacial Aplicada a la Predicción - Extrapolación de Datos

Microterritoriales (Consejería). Madrid (España): Comunidad de Madrid. Consejería de Economía e

Innovación Tecnológica.

MODELACIÓN DEL RIESGO DE INUNDACIÓN EN...

Documents

Transcript of MODELACIÓN DEL RIESGO DE INUNDACIÓN EN...