2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión...

Post on 22-Jan-2016

225 views 0 download

Transcript of 2 3 4 Datos no estocásticos Linealidad No auto-correlación Media cero de los errores Dispersión...

Análisis GeoEspacial de Factores que Influyen en Atropellos de Escolares en Santiago-Chile, utilizando ArcGIS

Christian Grob Hernández, MSc.Carola Blázquez Lavín, PhD.

2

Introducción

• Organización Mundial de la Salud (WHO)– Global Burden of Desease• 5° causa de muerte al 2030

• CONASET– Promedio anual de 47.683 siniestros (2000-2009)

– 17,5% (8.353) atropellos– 24,6% corresponde al grupo de 5 a 18 años

3

Objetivo

Analizar espacial y estadísticamente los factores que influyen en los atropellos de escolares en el

Gran Santiago durante el periodo 2007-2012.

4

Metodología

Análisis de los Datos

Regresión Lineal Múltiple

Regresión Geográficamente

Ponderada

Estadística Descriptiva

5

Análisis de Regresión

• Regresión Lineal Múltiple– Amplio uso: Fotheringham et al. (1996), Brown et al.

(2012), entre muchos

– Limitantes: • Supuestos de Gauss-Markov• Análisis macro

Datos no estocásticos

Linealidad

No auto-correlación

Media cero de los errores

Dispersión de los errores

Homocedasticidad

6

Regresión Geográficamente Ponderada

• Geographically Weighted Regression (GWR)– Su mayor ventaja• Variación de los coeficientes según ubicación• Análisis local en un contexto macro

– Mejor comprensión del comportamiento espacial

– Trabaja con unidades espaciales

𝑌 (𝑢 )=𝛽0 (𝑢)+𝛽1 (𝑢) 𝑋 1 (𝑢)+…… …+𝛽𝑛 (𝑢) 𝑋𝑛 (𝑢)+𝜀

Unidad de área

7

Variable Dependiente

La variable dependiente es un promedio de densidad de escolares atropellados para cada

unidad espacial

8

Variables Independientes

• 28 Variables Tipificadas– 4 Categorías

• Kernel y Distancia

Kernel DistanciasRelativo a Colegios

Colegios ColegiosMatricula

Usos de Suelo Área VerdeComercioHabitacionalIndustrialOficinasSaludTransporteEstacionamientosDiversidad de Uso de Suelo

Kernel DistanciasCondiciones

Poblacionales por edad y grupo

socio económico

Población de 0 a 18 añosPoblación TotalABC1C2C3DE

Medios de Transporte y Relacionados

Paraderos ParaderosSemáforos Semáforoscruces peatonales Vías más CongestionadasEstaciones de Metro Estaciones de Metro

Avenidas y Carreteras

9

Análisis Estadístico

Análisis de los Datos

Estadística Descriptiva

10

Temporal

• Anual– 26,8% de reducción 2007 (635) y el año 2012 (465)

• Mensual• Semanal• Horario– 16:00 a 19:00 -> 29,72%– 13:00 a 21:00 -> 62,92% – 07:00 a 09:00 -> 12,70% – 75,61% -> 10 horas

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 230

50

100

150

200

250

300

350

Horas

Núm

ero

de A

trop

ello

s

2007 2008 2009 2010 2011 20120

100

200

300

400

500

600

700

Núm

ero

de a

trop

ello

s

Enero

FebreroMarzo Abril

MayoJunio

Julio

Agosto

Septiembre

Octubre

Noviembre

Diciembre

0

50

100

150

200

250

300

350

mes

Núm

ero

de a

trop

ello

s

lunes martes miércoles jueves viernes sábado domingo0

100

200

300

400

500

600

DÍA

NÚM

ERO

DE

ATRO

PELL

OS

11

Nivel de Lesión

• Tipo de Lesión– KSI: 33,7% -> 1051– Leves: 66,3% -> 2066

• Género– 56,37% (1757) varones – 43,63% (1360) mujeres

• Edad– Segmento 15 a 18 años

1,8 veces el de 5 a 8 años.

FEMENINO MASCULINO0

200400600800

10001200140016001800

69,78% 63,57%

30,22%

36,43%

género

Núm

ero

de A

trop

ello

s y

sus

porc

enta

-je

s re

lativ

os

5 6 7 8 9 10 11 12 13 14 15 16 17 180

50

100

150

200

250

Suma de Leves

Suma de KSI

Edades

Núm

ero

de A

trop

ello

s

12

Otros

• Responsabilidad– Peatón 63%

• Espacial– El 33,1% de los incidentes • Puente Alto -> 156• Maipú -> 153• Santiago -> 36 • La Florida -> 105

CONDUCTOR PEATON0

50

100

150

200

250

300

350

400

200720082009201020112012

Núm

ero

de A

TRO

PELL

OS

PUENTE

ALTO

SANTIA

GO

NUNOA

PUDAHUEL

LA PINTA

NA

LA CIST

ERNA

LAS C

ONDES

LA GRANJA

SAN BER

NARDO

EL BOSQ

UE

SAN JO

AQUIN

SAN RAMON

LA REIN

A

VITACURA

LO ES

PEJO

HUECHURABA

LO BARNEC

HEA0

50

100

150

200

250

300

350

Comunas

Núm

ero

de A

trop

ello

s

Análisis GeoEspacial

13

14

Radio de Búsqueda de Kernel

• Suavización de los datos– Mayor cobertura– Diminución de datos atípicos y saltos

• 1000 y 3500 metros– Sugerencia software– Máxima mínima distancia

AtropellosAtropellos

15

Eliminación de datos

• Supuestos Gauss-Markov– Linealidad, heterocedasticidad, estacionariedad

• Coeficiente de Correlación de Pearson– 80% de correlación“Todo está relacionado con todo lo demás, pero las cosas

cercanas están más relacionadas que las distantes”Tobler (1970)

VariablesOriginales

Tras Eliminación por Linealidad

Tras Eliminación por Correlación de Pearson

Dep1000 28 8 6

Dep3500 28 14 10

Orig1000 28 13 10

Orig3500 28 15 13

16

Regresión Lineal Múltiple

• Proceso Iterativo– Variable Inflation Factor (VIF)

• Comprobación Transformación– Eliminación de Modelos– Punto de corte 0,05

AIC R2 Ajustado Jarque Bera Koenker

Orig3500 654 0,82 0,603 0,000026Dep3500 47 0,86 0,0045 0Dep1000 223 0,63 0,408 0,149Orig1000 1080 0,48 0,000001 0,0202

Modelo Dep3500

Modelo Orig1000

17

• Resultados de ambos modelos– Dep1000: R2 -> 62,7%– Orig3500: R2 -> 82,3%

• Orig3500– Heterocedasticidad y estacionariedad espacial– GWR

Selección Final Previo a GWR

AIC R2 Jarque Bera KoenkerOrig3500 654 0,82 0,603 0,000026Dep1000 223 0,63 0,408 0,149

Dep1000

Variable Influencia Coeficiente

INTERCEPTO -------- -0,183601

kMATRICULA 25,7% 0,362608

kPOB. TOTAL 18,8% 0,264288

kGRUPO D 12,9% 0,181203

kPARADERO 24,1% 0,339112

dMETRO** 18,0% 0,253951

dCOLEGIO** 0,5% 0,007545

Orig 3500Variable Influencia Coeficiente

INTERCEPTO -0,059619

kMATRICULA 21,40% 0,29815

kPOBL. 0-18 17,60% 0,245147

kGRUPO ABC1 9,36% -0,130457

kPARADERO 24,11% 0,335873

dMETRO 14,04% -0,195558

dAVDA y CARRETERA 13,49% 0,187902

18

GWR

• Dep1000– Cumple los indicadores

• Orig3500– R2 Locales: 77,8% a 93,8%

Orig3500

GWR RLM

AIC 138,056 654

R2 0,91096 0,82

Dep1000

GWR RLMAIC 434,892 223R2 0,68711 0,63

19

Resultados

Orig3500 GWR Dep1000 RLM

Relativo a ColegioskMATRICULA (+) kMATRICULA (+)

- dCOLEGIO (+)*

Condiciones Poblacionales por edad y grupo socio económico

kPOBL. 0-18 (+) kPOB. TOTAL (+)

kGRUPO ABC1 (-) kGRUPO D (+)

Medios de Transporte y Relacionados

kPARADERO (+) kPARADERO (+)

dMETRO (+) dMETRO (+)

dAVDA y CARRETERA (-) -

Discusión y Conclusiones

21

Estadística Descriptiva

• La educación es vital:– Varones– Independencia móvil– Horarios en torno y posterior a sus actividades– Al final de la semana– Durante el año escolar – Comunas más populares y de alto tráfico.

22

Estadística Espacial

• Modelo Lineal– Pre-selección– Limitantes

• Radios de Kernel– Importancia Variación

• RLM-Espacial– Tobler (1970)– Estacionariedad Espacial

23

Estadística Espacial

• GWR– Diferencia 1000 versus 3500• Mejor Distribuidas (RLM)

– Estabilidad General, desajuste local

• Clusterizadas (GWR)– Tendencia General

– Caso Avenidas

3500

1000

24

Comentarios Finales

• Importancia ambos análisis– Espacial– Datos descriptivos • No agrupables

• Complementariedad– Caso Avenidas• Cantidad de Avenidas• Jordan (1998), Atención del Peatón

25

Trabajos Futuros

• Filtros y segmentación• Sub-sectores• Temporal• Metodología– Kernel– No lineal

• Comparación con otras ciudades

26

Bibliografía• Brown, S., Versace, V. L., Laurenson L., Ierodiaconou, D., Fawcett, J. & Salzman, S. (2012),

Assessment of Spatiotemporal Varying Relationships Between Rainfall, Land Cover and Surface Water Area Using Geographically Weighted Regression, Environ Model Assess, Springer Science & Business Media.

• Calzadilla, J., Guerra, W. & Torres, V. (2002), El uso y abuso de transformaciones matemáticas. Aplicaciones en modelos de análisis de varianza, Revista Cubana de Ciencia Agrícola, Cuba.

• Comisión Nacional de Seguridad de Tránsito, CONASET (2010), Diagnóstico de la Seguridad de Tránsito en Chile (Período 2000 2009)‐ , Área de Estudios y Estadística, CONASET, Ministerio de Transportes y Telecomunicaciones, Santiago, Chile.

• Clifton, K. & Kreamer-Fults, K. (2007) An examination of the environmental attributes associated with pedestrian-vehicular crashes near public schools, Accident Analysis and Prevention.

• Fotheringham, A. S.; Brunsdon, C. & Charlton, M. E. (1996), Geographically Weighted Regression: A Method for Exploring Spatial Nonstationarity, Geographical Analysis, Vol. 28, pp. 281-298. Fotheringham, A S.; Charlton, M. (2009); Geographically Weighted Regression White Paper; National Centre for Geocomputation, National University of Ireland Maynooth, Maynooth, Co Kildare, Ireland

• Graham D., Glaister, S., Anderson, R. (2005) The effects of área deprivation on the incidence of child and adult pedestrian casualties in England, Accident Analysis and Prevention,, Department of Civil and Environmental Engineering, Centre for Transport Studies, Imperial College London, London, UK

27

Bibliografía• Jordan, G. (1998) Child Pedestrian–Car Crashes Near Schools Are a Small Percentage

of Total Child Pedestrian Crashes in Philadelphia, Transportation Research Record, Paper No. 98 Vol. 1058

• Jarque, C. M.; Bera, A. K. (1987). A test for normality of observations and regression residuals. International Statistical Review, Vol. 55 (2), pp. 163-172.

• Koenker, R. (1981), A Note On Studentizing A Test For Heteroscedasticity, Journal of Econometrics, Vol. 17, pp.107-l 12. North-Holland Publishing Company.

• LaScala, E. A., Gerber, D. & Gruenewald, P. J. (2000) Demographic and environmental correlates of pedestrian injury collisions: a spatial analysis, Accident Analysis and Prevention Vol. 32, pp. 651-658, Prevention Research Center, Berkeley, CA, USA

• LaScala, E. A.; Gruenewald, P. J. & Johnson, F. W. (2004); An ecological study of the locations of schools and child pedestrian injury collisions, Accident Analysis and Prevention Vol. 36, pp. 569-576.

• Tobler, W.R. (1970), A computer movie simulating urban growth in the Detroit region , Economic Geography, Vol. 46 (2), pp. 234-240.

• World Health Organization (2004) The Global Burden of Disease, Geneva, Switzerland.

Análisis GeoEspacial de Factores que Influyen en Atropellos de Escolares en Santiago-Chile, utilizando ArcGIS

Christian Grob Hernández, MSc.Carola Blázquez Lavín, PhD.