RClimTool Manual V01 FINAL

17
www.aclimatesectoragropecuariocolombiano.org RClimTool MANUAL DEL USUARIO Lizeth Llanos Herrera, estudiante de Estadística Esta herramienta ha sido diseñada para el apoyo, automatización de procesos y análisis de series climáticas dentro del convenio CIAT-MADR. No se pretende competir, ni suplantar otras herramientas disponibles y desarrolladas por otras entidades. Por el contrario, buscamos un trabajo colaborativo y de retroalimentación constante entre metodologías.

description

climatologia

Transcript of RClimTool Manual V01 FINAL

  • www.aclimatesectoragropecuariocolombiano.org

    RClimTool MANUAL DEL USUARIO Lizeth Llanos Herrera, estudiante de Estadstica

    Esta herramienta ha sido diseada para el apoyo, automatizacin

    de procesos y anlisis de series climticas dentro del convenio

    CIAT-MADR. No se pretende competir, ni suplantar otras

    herramientas disponibles y desarrolladas por otras entidades. Por

    el contrario, buscamos un trabajo colaborativo y de

    retroalimentacin constante entre metodologas.

  • www.aclimatesectoragropecuariocolombiano.org

    RClimtool ha sido diseada con el objetivo de facilitar a los usuarios el

    anlisis estadstico, control de calidad, llenado de datos faltantes,

    anlisis de homogeneidad y clculo de indicadores para las series

    climatolgicas diarias de temperatura mxima, temperatura mnima y

    precipitacin.

    INSTALACIN Y EJECUCIN DE R

    Debido a que la herramienta fue creada bajo el lenguaje de R, es indispensable tener ste programa

    instalado, especficamente la versin R 2.15.0, que puede ser descargada desde el siguiente link:

    http://cran.r-project.org/bin/windows/base/old/2.15.0/

    Una vez lo hemos instalado, al abrirlo aparecer la siguiente ventana:

  • www.aclimatesectoragropecuariocolombiano.org

    INSTALACIN Y EJECUCIN DE RClimTool

    Para ejecutar la interfaz de la aplicacin debemos cargar el cdigo fuente tal como se muestra en la

    siguiente figura:

    Una vez se ha cargado el cdigo exitosamente aparecer la siguiente interfaz grfica:

  • www.aclimatesectoragropecuariocolombiano.org

    En la figura 1 se observa la ventana principal de la herramienta, la cual se encuentra dividida en

    diferentes mdulos, cada uno ubicado en los paneles de la parte izquierda de la interfaz. El contenido de

    estos mdulos ser desarrollado ms adelante.

    QU HACE RClimTool?

    RClimTool ofrece diferentes opciones de anlisis, diseadas con el objetivo de brindar una aplicacin

    que rena todo lo necesario para llevar a cabo un estudio completo de las series climatolgicas.

    Para ilustrar las funciones de cada uno de los mdulos, a continuacin se muestra el anlisis de las series

    climatolgicas diaria para las variables temperatura mxima, temperatura mnima y precipitacin de 10

    estaciones meteorolgicas.

    1. Lectura de datos:

    En el mdulo de lectura de datos encontraremos diferentes botones que nos permitirn leer y

    cargar las bases de datos que contienen la informacin de las variables de inters. Importante: No

    utilizar tildes ni la letra para nombrar carpetas y archivos que se utilizarn con la herramienta,

    ya que esto genera conflicto al momento de usar la aplicacin.

    El botn cambiar directorio (1) ofrece la opcin de seleccionar el directorio donde se encuentran los

    archivos que se van a cargar, tambin ser la ubicacin para guardar todas las salidas de la

    aplicacin.

    Figura 1. Ventana para lectura de datos

    1

    2

  • www.aclimatesectoragropecuariocolombiano.org

    En la parte (2) de la figura 1 se encuentran los botones que permite cargar la informacin cada una

    de las variables. Por ejemplo, al dar clic en el botn Temp. Mxima aparecer una ventana

    emergente en la cual se debe ubicar el archivo que contiene las temperaturas mximas diarias de las

    diferentes estaciones. Este procedimiento se realiza para las dems variables a analizar.

    Figura 2. Ejemplo de seleccin de archivo

    En esta ventana se selecciona la ubicacin y el archivo que deseamos cargar. Seleccionamos el

    archivo y damos clic en ok como se ve en la figura 2. Recuerde cerrar la ventana emergente cada vez

    que se cargue una variable diferente.

    Nota: El formato de los datos de entrada se especifica en Anexos.

    2. Anlisis grfico descriptivo:

    Una vez tenemos los datos cargados para todas las variables a analizar, procedemos a realizar el

    anlisis descriptivo para cada una de ellas, para ello debemos especificar el perodo de anlisis, til

    si se desea analizar solo una seccin de la serie, por ejemplo Marzo-1990 hasta Enero-1991, si por el

    contrario se desea analizar la serie completa entonces estos campos deben estar vacos.

    Ventana emergente

    i

    a

    g

    n

    o

    s

    t

    i

    c

    s

    R

    e

    p

    o

    r

    t

    (

    )

  • www.aclimatesectoragropecuariocolombiano.org

    Figura 3. Ejemplo anlisis descriptivo

    Despus de seleccionar la variable a analizar tal como se muestra en la figura 3, procedemos a dar

    clic en el boto Descriptivas, los resultados se pueden visualizar en la consola de R (ver figura 4).

    Figura 4. Anlisis descriptivo

    Consola en R

    Opcin de

    anlisis por

    perodo

  • www.aclimatesectoragropecuariocolombiano.org

    Para el anlisis grfico se tiene la opcin de generar diferentes tipos de Grficos automticos, los

    cuales se generan para todas las variables. Si se desea trabajar con informacin climatolgica

    mensual (promedio mensual para temperatura y total mensual para precipitacin) se debe

    seleccionar Mensual en la opcin Tipo de anlisis, luego al dar clic en alguno de los botones

    (Grficos Plot, Grficos Boxplot o Grficos de dispersin) aparecer un mensaje con la ubicacin de

    los grficos generados (ver figura 5).

    Figura 5. Anlisis grfico automtico

    Otra opcin es realizar los grficos de forma personalizada, al dar clic en los botones del mdulo

    Grficos Personalizados aparecer una ventana donde se encuentran los campos necesarios que se

    deben especificar; para los argumentos x e y, se escogen las variables mediante un lista desplegable.

    Los dems argumentos, como el ttulo, etiquetas de los ejes, color, entre otros sirven para

    personalizar el grfico (para consultar la ayuda sobre los argumentos del grfico dar clic en el botn

    Help).

    Una vez seleccionadas las variables y modificados los argumentos damos clic en ok y en una nueva

    ventana se desplegar el grfico (ver figura 6).

    Opcin para

    grficos mensuales

  • www.aclimatesectoragropecuariocolombiano.org

    Figura 6. Anlisis grfico personalizado

    3. Control de calidad:

    Un aspecto importante a tener en cuenta en el anlisis de las series climatolgicas, es el control de

    calidad, que consiste en generar algunos criterios y/o filtros para ayudar a identificar datos no

    razonables y/o errneos.

    Figura 7. Control de calidad

  • www.aclimatesectoragropecuariocolombiano.org

    En la figura 7 se encuentra el mdulo Control de calidad, aqu se encuentran algunos campos

    editables que deben ser llenados a criterio del usuario, como el No. de desviaciones estndar, un

    criterio til para identificar datos atpicos en la serie (por defecto son 3). El Rango de la variable se

    debe especificar de acuerdo con los valores lgicos esperados que puede tomar la variable.

    Al dar clic en el botn Validar aparecer un ventana que indica el estado de cada estacin respecto

    al rango establecido para la variable. Los criterios ejecutados en la consola son (ver figura 8):

    % Datos atpicos: Se definen como el porcentaje de datos que no se encuentran dentro del

    siguiente intervalo [ ], donde y es el promedio muestral y la desviacin estndar

    muestral de la variable a validar respectivamente. Nota: Este criterio no es recomendable para la

    variable precipitacin ya que su distribucin suele ser asimtrica.

    % Datos fuera del rango: Indica el porcentaje de datos que se encuentran por fuera de los

    lmites definidos para el rango de la variable. Los datos identificados para este criterio sern

    automticamente reemplazados por NAs.

    % Datos tmax

  • www.aclimatesectoragropecuariocolombiano.org

    Carpetas con archivos de los

    datos no razonables y/o

    errneos para c/estacin

    Si se desean reemplazar los

    datos identificados en el Control

    de Calidad por NAs se deben

    hacer sobre estos archivos.

    por stos filtros, el cual se debe llevar a cabo manualmente sobre los archivos generados en la

    carpeta Datos faltantes, donde se encuentran los archivos despus haber realizado el Control de

    calidad a todas las variables (ver figura 9).

    Figura 9. Identificacin y reemplazo de datos no razonables por NAs

    Figura 10. Creacin del informe preliminar

    Al dar clic en el botn generar pre-informe, automticamente se crear un archivo Word con un

    informe que incluye un anlisis descriptivo preliminar y los criterios generados en el mdulo del

    Control de calidad, complementado con los grficos que realiza la aplicacin. El pre-informe

    quedar guardado en el directorio que aparece en la ventana emergente, como se muestra en la

    figura 10.

  • www.aclimatesectoragropecuariocolombiano.org

    4. Datos faltantes:

    El llenado de datos faltantes es realizado mediante el paquete RMAWGEN de R, el cual a partir de la

    estimacin de modelos VAR realiza el llenado de los datos. Es importante resaltar que esta

    metodologa es til cuando se tienen porcentajes de datos NA bajos e informacin de varias

    estaciones que se encuentren relacionadas y que no presenten mucha variabilidad.

    Para este mdulo es indispensable que se tengan datos de varias estaciones en el MISMO PERODO

    para las variables temperatura mxima, temperatura mnima y precipitacin, ya que interactan

    entre s para completar los datos faltantes.

    Figura 11. Llenado de datos faltantes

  • www.aclimatesectoragropecuariocolombiano.org

    En la figura 11 se muestran los campos necesarios que se deben especificar para el llenado de datos

    faltantes, al dar clic en el botn completar datos, se iniciar el proceso que puede tardar varios

    minutos.

    Una vez finalice el proceso, aparecer de nuevo una ventana indicando que el proceso ha finalizado.

    En la carpeta Datos faltantes se crearn las bases de datos para cada una de las variables y los

    grficos de la serie original versus la serie generada (ver figura 12).

    Figura 12. Ubicacin archivos Datos faltantes

    5. Anlisis de Homogeneidad de la serie:

    En este mdulo se implementaron varias pruebas estadsticas con el fin de analizar la homogeneidad

    de la serie:

    Pruebas de normalidad: estas pruebas comprueban si los datos de la variable en estudio

    proceden de una distribucin normal, si se cumple este supuesto se deben utilizar pruebas

    paramtricas; sino se cumple debemos acudir a las pruebas no paramtricas.

    Estacionalidad (tendencia): Se propone la prueba del Rango de Correlacin de Spearman* y

    el Test de Mann-Kendall. Para estimaciones futuras es necesario que se cumpla este

    supuesto

    Estabilidad en varianza: Test F* aplicado en subconjuntos de informacin.

    Estabilidad en Media: Incluye el Test T* y el Test U Mann-Whiney como alternativa no

    paramtrica al Test T, usando las medianas como estadstico ms robusto que la media.

    Nota: Las pruebas con * requieren del cumplimiento del supuesto de normalidad.

    En la figura 13 se observan algunos de los resultados obtenidos para este mdulo, en el ejemplo se

    utiliz la variable tmax y un nivel de significancia del 5%. En la consola se muestran las tablas

    Carpetas con

    salidas grficas

    Archivos con datos

    generados (Sin datos

    faltantes)

  • www.aclimatesectoragropecuariocolombiano.org

    obtenidas para cada prueba, las cuales incluyen para cada estacin el valor-p y la decisin de

    acuerdo al nivel de significancia escogido.

    Figura 13. Anlisis de homogeneidad de las series

    Para este mdulo se encuentra opcin de generar un informe que resume todas las pruebas

    estadsticas incluidas en el anlisis de la homogeneidad, para realizarlo damos clic en el botn

    Generar Informe.

    6. Calculo de indicadores:

    Para el clculo de indicadores se tienen los siguientes sub-mdulos:

    Indicadores anuales: Se calcula el nmero de das para cada ao que cumplen con la

    condicin indicada (Mayor que o Menor que), el valor del criterio que define la condicin se

    deja libre al usuario.

    Indicadores mensuales: Para este sub-mdulo se calculan los mximos o mnimos

    mensuales para la variable escogida.

    Para llevar a cabo estos clculos, primero seleccionamos el perodo y la variable a analizar, luego se

    escoge el valor para el indicador de inters, y procedemos a dar clic sobre el checkbox del mismo. En

    la carpeta Indicadores se generarn archivos de Excel con los indicadores calculados (ver figura 14).

  • www.aclimatesectoragropecuariocolombiano.org

    Figura 14. Clculo de indicadores anuales y mensuales

    7. Condicin ENSO (El Nio/Oscilacin Sur):

    RClimTool cuenta con informacin sobre la condicin ENSO desde el ao 1950 hasta el 2013 que se

    puede consultar (ver figura 15). Despus de seleccionar el perodo de inters se procede a dar clic

    en la consulta que se desee realizar y aparecern los resultados en la consola de R (ver figura 16).

    Figura 15. Consulta Condicin ENSO

    1

    2

  • www.aclimatesectoragropecuariocolombiano.org

    Figura 16. Ejemplo consulta Condicin ENSO

    PROBLEMAS CONOCIDOS:

    Un problema identificado para esta versin se encuentra en el mdulo de datos faltantes, el rango de las

    fechas de las variables debe estar desde el 1 de enero del ao inicial de anlisis hasta el 31 de diciembre

    del ao final, para poder llevar a cabo el llenado de datos.

    REPORTE DE PROBLEMAS

    Por favor reporte cualquier problema a Lizeth Llanos [email protected] y David Arango

    [email protected] junto con los mensajes de error y los datos que se usaron para el anlisis. Tambin

    apreciamos las sugerencias que contribuyan a mejorar la herramienta.

  • www.aclimatesectoragropecuariocolombiano.org

    ANEXO A: FORMATO DE ENTRADA DE LOS DATOS

    Los archivos que vayan a ser utilizados deben estar en formato CSV (delimitado por comas). Se deben

    emplear bases diferentes para cada una de las variables, con las estaciones que se deseen analizar. Estas

    bases deben cumplir con los siguientes aspectos:

    1. Columnas en las siguientes secuencias: day, month, year seguido de los nombres de las estaciones. NOTA: unidades de Precipitacin= milmetros y unidades de Temperatura= grados Celsius

    2. Para los casos en el que se presenten datos faltantes, se deben codificar como NA; los registros de

    datos deben estar en orden cronolgico. No se permite fechas faltantes.

    Ejemplo de formato de datos de entrada para RClimTool:

    Figura 17: Formato de entrada variable precipitacin

    Nombres

    Estaciones

  • www.aclimatesectoragropecuariocolombiano.org

    Figura 18: Formato de entrada variable temperatura mxima

    Figura 19: Formato de entrada variable temperatura mnima