Validacion Datos Estacion Meteo

12
1 PROCEDIMIENTOS DE VALIDACIÓN DE DATOS DE ESTACIONES METEOROLÓGICAS AUTOMÁTICAS. APLICACIÓN A LA RED DE INFORMACIÓN AGROCLIMÁTICA DE ANDALUCÍA Javier Estévez 1 Pedro Gavilán 2 1 Universidad de Córdoba. Departamento de 2 Instituto de Investigación y Formación Agraria y Pesquera (IFAPA). Área de Producción Ecológica y Recursos Naturales. Centro “Alameda de Obispo”. Apdo. 3092. 14080 Córdoba (España) [email protected] ; [email protected] Resumen La información meteorológica debe ser validada como un paso previo a cualquier aplicación. Esta validación asegura que la información está siendo generada adecuadamente, identifica los registros erróneos y permite detectar problemas para resolverlos mediante las oportunas labores de mantenimiento, reparación y calibración de los sensores. En este trabajo se describen las bases de los procedimientos de validación, de acuerdo con la norma AENOR 500540, y los resultados de su aplicación a la Red de Información Agroclimática de Andalucía. Los resultados obtenidos ponen de manifiesto la existencia de registros meteorológicos potencialmente erróneos. Su análisis temporal ha permitido tomar decisiones como la sustitución de sensores o la depuración de registros antes de ser empleados en aplicaciones agronómicas. 1. INTRODUCCIÓN La información meteorológica es una de las herramientas más importantes para la toma de decisiones en la agricultura (Weiss y Robb, 1986). Entre sus aplicaciones podemos citar el cálculo de las necesidades de agua de los cultivos y la programación de riegos, el diseño de los sistemas de riego y drenaje, la lucha integrada contra plagas y enfermedades de los cultivos, el desarrollo de modelos de cultivos y la lucha contra heladas (Meyer y Hubbard, 1992). Durante las dos últimas décadas se ha producido una gran expansión de las redes de estaciones meteorológicas automáticas en todo el mundo. Este desarrollo se ha visto materializado en España con la implantación de la Red SIAR (Sistema de Información Agroclimática para el Regadío) (Pérez de los Cobos y col., 2003). Esta rápida evolución ha sido consecuencia de la necesidad de disponer de datos meteorológicos específicos en tiempo real o casi real (Miller y Barth, 2003), así como de la evolución de los sistemas automáticos de adquisición de datos. Sin embargo, los servicios meteorológicos nacionales no disponen de redes que permitan realizar tales funciones, suministrando, en muchos casos, únicamente registros de temperatura del aire y precipitación (Gázquez y col., 2003). Además, estos datos no se encuentran fácilmente disponibles con la frecuencia deseada (Meyer y Hubbard, 1992), a pesar de lo expresado en el 12º Congreso de la Organización Meteorológica Mundial en 1995, en el que se planteó la 40ª Resolución, que gira en torno a la información de carácter climático y meteorológico (WMO CG XII, Resolution 40), y que señala la importancia de permitir el intercambio de información climática entre los diferentes organismos meteorológicos nacionales y el suministro de información climática a terceras partes, incluyendo el sector privado (Cuadrat y col., 2002).

Transcript of Validacion Datos Estacion Meteo

1

PROCEDIMIENTOS DE VALIDACIÓN DE DATOS DE ESTACIONES METEOROLÓGICAS AUTOMÁTICAS.

APLICACIÓN A LA RED DE INFORMACIÓN AGROCLIMÁTICA DE ANDALUCÍA

Javier Estévez1

Pedro Gavilán2 1Universidad de Córdoba. Departamento de

2Instituto de Investigación y Formación Agraria y Pesquera (IFAPA). Área de Producción Ecológica y Recursos Naturales. Centro “Alameda de Obispo”. Apdo. 3092.

14080 Córdoba (España)

[email protected]; [email protected]

Resumen La información meteorológica debe ser validada como un paso previo a cualquier

aplicación. Esta validación asegura que la información está siendo generada

adecuadamente, identifica los registros erróneos y permite detectar problemas para

resolverlos mediante las oportunas labores de mantenimiento, reparación y calibración

de los sensores. En este trabajo se describen las bases de los procedimientos de

validación, de acuerdo con la norma AENOR 500540, y los resultados de su aplicación

a la Red de Información Agroclimática de Andalucía. Los resultados obtenidos ponen

de manifiesto la existencia de registros meteorológicos potencialmente erróneos. Su

análisis temporal ha permitido tomar decisiones como la sustitución de sensores o la

depuración de registros antes de ser empleados en aplicaciones agronómicas.

1. INTRODUCCIÓN La información meteorológica es una de las herramientas más importantes para la toma de decisiones en la agricultura (Weiss y Robb, 1986). Entre sus aplicaciones podemos citar el cálculo de las necesidades de agua de los cultivos y la programación de riegos, el diseño de los sistemas de riego y drenaje, la lucha integrada contra plagas y enfermedades de los cultivos, el desarrollo de modelos de cultivos y la lucha contra heladas (Meyer y Hubbard, 1992). Durante las dos últimas décadas se ha producido una gran expansión de las redes de estaciones meteorológicas automáticas en todo el mundo. Este desarrollo se ha visto materializado en España con la implantación de la Red SIAR (Sistema de Información Agroclimática para el Regadío) (Pérez de los Cobos y col., 2003). Esta rápida evolución ha sido consecuencia de la necesidad de disponer de datos meteorológicos específicos en tiempo real o casi real (Miller y Barth, 2003), así como de la evolución de los sistemas automáticos de adquisición de datos. Sin embargo, los servicios meteorológicos nacionales no disponen de redes que permitan realizar tales funciones, suministrando, en muchos casos, únicamente registros de temperatura del aire y precipitación (Gázquez y col., 2003). Además, estos datos no se encuentran fácilmente disponibles con la frecuencia deseada (Meyer y Hubbard, 1992), a pesar de lo expresado en el 12º Congreso de la Organización Meteorológica Mundial en 1995, en el que se planteó la 40ª Resolución, que gira en torno a la información de carácter climático y meteorológico (WMO CG XII, Resolution 40), y que señala la importancia de permitir el intercambio de información climática entre los diferentes organismos meteorológicos nacionales y el suministro de información climática a terceras partes, incluyendo el sector privado (Cuadrat y col., 2002).

2

La información meteorológica es recogida en potentes bases de datos. Sin embargo, las metodologías aplicadas en su control de calidad son variadas y los procesos para asegurar la calidad de los registros son con frecuencia dudosos (Meek y Hatfield, 1993), siendo en algunos casos inexistentes. En líneas generales, se puede afirmar que existen tres grandes razones por las cuales es necesario aplicar un sistema de control de calidad: 1. Asegura que la información está siendo generada adecuadamente; 2. Identifica, y en su caso corrige, los registros erróneos que conducirían a una inadecuada toma de decisiones; 3. Permite detectar problemas para resolverlos mediante las oportunas labores de mantenimiento, reparación y calibración de los sensores (Doraiswamy y col., 2000). Para asegurar la calidad de la información obtenida se pueden aplicar diferentes métodos. Desde aquellos que implican el mantenimiento periódico de las estaciones y la verificación en campo de la información proporcionada por los sensores, hasta los basados en la validación de los datos registrados utilizando procedimientos estadísticos, pasando por la calibración periódica de los sensores. Entre los procedimientos de validación basados en la aplicación de reglas de decisión para realizar el análisis de la calidad de los datos podemos citar el propuesto O’Brien y Keefer (1985), posteriormente utilizado por Meek y Hatfield (1993). En este proceso los registros de dudosa calidad son detectados y corregidos o marcados como sospechosos. En otros procedimientos el resultado final es un dato que lleva adjunto una marca de seguridad o confianza -“bueno”, “sospechoso”, “alarmante” ó “fallido”- (Fiebrich y Crawford, 2001; Horel y col., 2002). Otros autores utilizan marcas de dos tipos, “informativas” y “graves”, para indicar la calidad y posibilidad de utilización del registro. Este sistema se utiliza en los procesos de control de calidad de la Red CIMIS del estado de California (Snyder y Pruitt, 1992). En algunos casos se aplican algoritmos que permiten corregir los registros o rellenar los datos perdidos, pero en cualquier caso tanto el dato original como el corregido se almacenan en la base de datos (Robinson, 1990; Reek y col., 1992). Finalmente, los registros meteorológicos marcados deben ser juzgados por personal debidamente cualificado (Kunkel y col., 1998; Ovita y Wilkins, 2002). En este trabajo se describen las bases de los procedimientos de validación y su aplicación a la Red de Información Agroclimática de Andalucía, perteneciente a la Red SIAR.

2. TESTS DE VALIDACIÓN La norma UNE 500540 (2004) define siete niveles de validación que deben aplicarse sucesivamente, con excepción de la inspección visual (Nivel 6) que puede hacerse una vez realizada la validación correspondiente a los Niveles 0 y 1. Estos últimos niveles son de obligada aplicación, mientras que el resto son opcionales. Únicamente se califican de forma automática como no válidos aquellos datos que no superen el nivel 0 o el test de límites rígidos (Nivel 1). Los datos que no pasan con éxito cualquiera de los otros tests se consideran sospechosos y se deberá discernir si el dato es válido o no por inspección visual.

2.1 NIVEL 0. VALIDACIÓN DE LA ESTRUCTURA DEL REGISTRO DE DATOS Se comprueba que tanto la estructura del registro como el número de datos son los que se espera que lleguen. Si alguno de los datos no puede ser extraído correctamente, se considerará dicho dato como no válido. Si existe error en la fecha y/u hora, todos los datos del registro asociados a esa fecha y hora se considerarán no válidos.

3

2.2 NIVEL 1. VALIDACIÓN DE LOS DATOS SEGÚN LÍMITES En este nivel de validación se comprueba el rango de los valores meteorológicos introducidos en la base de datos. Por rango entendemos el límite superior y el inferior entre los que debe estar el valor de un dato para ser considerado como válido (Feng y col. (2004); Meek y Hatfield, 1994; Reek y col., 1992; Shafer y col., 2000; Schroeder y col., 2005). Se definen dos tipos de límites: límites físicos e instrumentales y límites flexibles (efemérides meteorológicas).

2.2.1 Límites rígidos: físicos e instrumentales Se aplicarán los límites que resulten más restrictivos de los físicos e instrumentales. Cualquier dato fuera de los límites establecidos será un dato no valido. En la Tabla 1 se indican los límites físicos aplicables según la norma UNE 500540 (2004).

Tabla 1. Límites físicos de diferentes variables meteorológicas (UNE 500540, 2004)

Variable Unidad Rango Temperatura del aire ºC -35/55

Humedad relativa del aire % 0/100 Velocidad del viento m s-1 0/75 Dirección del viento Grados 0/360

Presión hPa 700/1080 Radiación solar global W m-2 -1/1400

Precipitación en 10 minutos Mm 0/50

2.2.2 Límites flexibles: efemérides meteorológicas Estos límites se basarán en los valores extremos que las distintas variables puedan tomar en la zona donde está ubicada la estación (UNE 500510, 2005). Lo ideal es contar con un conjunto de efemérides meteorológicas para cada mes, que sean representativas del entorno de donde provienen los datos que se validan. Si el dato no superase este test de límites flexibles será calificado como sospechoso y se deberá hacer una inspección visual para considerarlo válido o no. Estos tests incorporarán un módulo de verificación de efemérides en el que cada valor se comparará con el valor extremo registrado históricamente en la misma estación. Si el registro que se está validando supera el valor extremo prefijado, el sistema generará una alerta que deberá ser validada por el administrador para incorporarla como nueva efeméride.

2.3 NIVEL 2. VALIDACIÓN DE LA COHERENCIA TEMPORAL DEL DATO Los procedimientos basados en la coherencia temporal comprueban si la diferencia entre medidas meteorológicas sucesivas excede un valor determinado, en cuyo caso habría que sospechar de ambas medidas (Feng y col., 2004; Graybeal y col., 2004; Meek y Hatfield, 1994). Es decir, se chequea el exceso de variabilidad de dos registros consecutivos. Si esta diferencia supera el valor preestablecido dentro del sistema de validación, se genera una alerta para los dos datos. En este nivel se comparará el cambio entre dos o más observaciones consecutivas separadas media hora unas de otras. Este tipo de valoración sólo afecta a los datos semihorarios. Si la diferencia excede un valor prefijado, distinto para cada variable, se considerará que el dato o datos no ha superado el test.

2.4 NIVEL 3. VALIDACIÓN DE LA COHERENCIA INTERNA DE LOS DATOS. RELACIONES ENTRE VARIABLES Los procedimientos denominados de coherencia interna están basados en la verificación de la coherencia física o climatológica de cada variables observada o también de la consistencia entre variables (Grüter et al., 2001). Valores medidos al mismo tiempo y en el mismo lugar no pueden ser incoherentes entre ellos. En este caso, puesto que no se puede discernir cuál de las variables involucradas es la responsable, se considerará que

4

ambas observaciones no han superado este test. También entran en esta categoría los tests que comprueban la coherencia interna del propio sistema. Por ejemplo, un valor promediado debe ser siempre menor que el valor instantáneo máximo, o la precipitación durante media hora siempre deberá ser menor que la precipitación acumulada durante 24 horas (Vejen et al., 2002). También son habituales las comprobaciones del tipo Tmax(i)>Tmed(i)>Tmin ó Tmax(i)>Tmin(i-1) siendo i un día cualquiera. Existen también comprobaciones para rangos diarios de temperatura excesivos (Feng et al., 2004; Reek et al., 1992).

2.5 Nivel 4. VALIDACIÓN DE LA COHERENCIA TEMPORAL DE LA SERIE Este nivel de validación se aplicará sobre series temporales de datos del periodo que se vaya a analizar (p.e. cada 24 horas). Se calculará la media y la desviación típica de cada variable. Si la desviación típica fuese menor que un mínimo aceptable, todos los datos de ese periodo se considerarán sospechosos (Shafer y col., 2000).

2.6 NIVEL 5. VALIDACIÓN DELA COHERENCIA ESPACIAL. CONTRASTE DE LOS DATOS DE CADA ESTACIÓN CON DATOS DE OTRAS ESTACIONES En este nivel de validación se tiene en cuenta que los valores de una misma variable medidos al mismo tiempo en estaciones correlacionadas no pueden diferir demasiado unos de otros (Eischeid et al., 1995; Gandin, 1988; Hubbard, 2001; Wade, 1987). El llevar a la práctica este test puede resultar más o menos complicado dependiendo de la densidad de estaciones y de lo compleja que sea la orografía de la zona. Para llevar a cabo este test se aplicarán, por ejemplo, técnicas de interpolación. Es suficiente con aplicar algún método sencillo que permitan detectar los errores más groseros. Los errores más sutiles se pueden descubrir por inspección visual. Para validar la coherencia espacial se suele estimar un valor para cada observación. Esto se hace a partir de datos de la misma variable (que no hayan sido etiquetados como no válidos en niveles previos), registrados en otras estaciones correlacionadas con la variable que se está analizando. A continuación, se calculará alguna expresión que de cuenta de la diferencia entre el valor medido y el valor estimado. Si esta diferencia excediese un cierto umbral (p.e. dos veces la desviación típica de los datos empleados en la estimación), se considerará que el dato analizado no ha superado este test.

2.7 NIVEL 6. INSPECCIÓN VISUAL Para llevar a cabo una inspección visual sobre los datos que se pretende analizar, resulta muy útil representar la evolución temporal de las distintas variables en varios niveles de agregación, especialmente cuando se trate de determinar si un dato sospechoso es válido o no válido. Igualmente, resulta muy útil cartografiar valores máximos, mínimos, acumulados, etc. de las distintas variables así como de parámetros derivados. Para identificar problemas sutiles, en el caso de la temperatura, la velocidad y dirección del viento y la presión, se recomienda un análisis de valores promedio a una hora específica del día (p.e. 0, 6,12 y 18). En el caso de la humedad relativa, la media de los máximos y la media de los mínimos. Finalmente, para la precipitación y la irradiación, los valores acumulados. Se pueden aplicar otros análisis estadísticos, como por ejemplo el método de doble masa, aunque muchos de ellos dependen de la longitud de las series para que den buenos resultados.

5

3. APLICACIÓN A LA RED DE INFORMACIÓN AGROCLIMÁTICA DE ANDALUCÍA

3.1 RADIACIÓN SOLAR Los resultados del test de rango rígido para datos diarios se muestran en la Tabla 2, en la que se indican los porcentajes máximo y mínimo de los registros meteorológicos que no han superado el test aplicado a cada una de las estaciones, así como la media y la desviación típica de estos porcentajes correspondientes a toda la red. La única estación en la que se han detectado valores diarios fuera de rango ha sido la de Puebla de Cazalla (Sevilla), con un valor medido de 219 MJ m-2 d-1. Únicamente este dato no superó el test, lo que en términos porcentuales representa aproximadamente el 0.05% de los datos. El resto de las 89 estaciones superaron satisfactoriamente el test, obteniéndose un valor medio para toda la red del 0.001% de registros erróneos. Sólo en la estación de Tíjola (Almería) se detectaron errores a escala semihoraria, donde catorce valores semihorarios se situaron fuera de rango, lo que equivale al 0.016% del total de los registros históricos de radiación solar de la estación. Estos catorce registros, para el conjunto de toda la red, supusieron un porcentaje muy bajo (0.0002%) (Estévez, 2008).

Tabla 2. Porcentaje de datos que no han superado los tests de rangos rígido y flexible, coherencia

temporal y persistencia aplicados a los registros de radiación solar media diaria (Rs) y semihoraria

(Rssh) (Estévez, 2008). Entre paréntesis se dan el número de registros erróneos

Test de rango rígido Max (%) Min (%) Medio (%) Desv. Tip. (%) Validación

Rs 0.049 (1) 0 0.001 (2) 0.005 1 Rssh 0.016 (14) 0 0.000 (14) 0.002 1

Test de rango flexible Rs 11.80 0 0.34 (673) 1.32 1F

Rssh 7.04 0.05 0.80 (61588) 1.10 1F Coherencia temporal

Rssh 0.24 0.02 0.10 (7697) 2 Persistencia

Rs 0.82 0.00 0.01 (770) 0.04 2 Rssh 0.00 0.00 0.00 0.09 2

El test de rango flexible aplicado en base diaria detectó un 0.34% de registros potencialmente erróneos, con un valor máximo de 11.80% en la estación de las Cabezas de San Juan (Sevilla) (Figura 1). En 30 estaciones no se detectó ningún valor fuera de rango. El mayor número de registros fuera de rango correspondió al año 2005, debido fundamentalmente a la descalibración de los piranómetros. A partir de esta fecha se empezaron a calibrar algunos piranómetros (Estévez y col., 2005) y se realizaron las primeras sustituciones por sensores nuevos o calibrados. Hasta esta fecha, en general, el número de registros fuera de rango fue aumentando, produciéndose, generalmente, sobreestimaciones en las medidas de radiación solar. El 0.80% de los registros semihorarios no superaron el test con un valor máximo del 7.04%. En todas las estaciones hubo registros semihorarios fuera de rango, con un mínimo del 0.05%. El año con mayor número de registros semihorarios fuera de rango fue igualmente el 2005.

6

Figura 1. Resultado de la aplicación del test de rango flexible para los registros diarios de radiación

solar en Las Cabezas de San Juan (Sevilla) y Córdoba (Estévez, 2008)

La aplicación de este test permitió tomar la decisión de sustituir el piranómetro de la estación de Las Cabezas de San Juan al detectarse que el número de registros fuera de rango aumentaba alarmantemente con el tiempo. En la Figura 1 se puede observar como el piranómetro mide sistemáticamente por encima de la radiación solar teórica en condiciones de cielo despejado a partir del año 2004, síntoma inequívoco de que el sensor estaba descalibrado. A finales de 2002 comenzaron ya a registrarse valores fuera de rango, señalados con un círculo rojo en la figura. En el mes de Junio de 2006 se sustituyó un piranómetro y las medidas realizadas a partir de esta fecha se situaron dentro del rango. Como comparación, en la misma figura se muestra el resultado gráfico de la aplicación del test a la estación de Córdoba, donde el piranómetro dio muestras de funcionar correctamente. La aplicación del test de coherencia temporal permitió detectar un 0.10% de registros potencialmente erróneos, con un valor máximo del 0.24%. Por otro lado, un 0.01% de los registros diarios no superaron el test de persistencia, mientras que todos los datos semihorarios superaron satisfactoriamente el test de persistencia.

3.2 TEMPERATURA DEL AIRE Todos los registros de temperatura (diaria y semihoraria) superaron satisfactoriamente el test de rango rígido (Tabla 3). La aplicación del test de coherencia temporal a los registros semihorarios permitió detectar un porcentaje medio de registros potencialmente erróneos del 0.11%, con un valor máximo del 0.77% en la estación de Úbeda (Jaén). En todas las estaciones se registraron datos anómalos tras la aplicación de este test. Finalmente, ningún registro potencialmente erróneo fue detectado tras la aplicación del test de persistencia (Estévez, 2008). La aplicación de los tests de coherencia interna a los registros de temperatura máxima detectó un porcentaje medio de registros anómalos del 0.012%, mientras que todos los registros de 69 estaciones pasaron este test. El porcentaje medio de registros de temperatura mínima que no superaron este test fue del 0.005%, con un valor máximo del 0.175%. En este caso, todos los registros de 85 estaciones superaron satisfactoriamente este test. El test de ceros detectó un promedio del 0.024% de registros potencialmente erróneos, con un total de 83 estaciones en las que todos los registros superaron el test. Todos los registros de temperatura media superaron satisfactoriamente todos los tests de coherencia interna. Finalmente, el test de salto térmico diario fue el que detectó el mayor porcentaje de datos potencialmente erróneos, con un valor medio del 0.59% y un máximo del 6.19% en la estación de Úbeda (Jaén).

7

Tabla 3. Porcentaje de datos que no han superado los tests de rango rígido, coherencia temporal y

persistencia y coherencia interna aplicados a los registros de temperatura del aire máxima (Tmax),

mínima (Tmin) y media (Tmed) diarias y semihoraria (Tsh) (Estévez, 2008)

Test de rango rígido Max (%) Min (%) Medio (%) Desv. Tip. (%) Validación

Tmax, Tmin, Tmed 0.00 0.00 0.00 0.00 1 Tsh 0.00 0.00 0.00 0.00 1

Coherencia temporal Tsh 0.77 0.01 0.11 ((8465) 0.14 2

Persistencia Tsh 0 0 0 0 2

Coherencia interna Tmax 0.091 0 0.012 (24) 0.023 3 Tmin 0.175 0 0.005 (10) 0.022 3 Tmed 0 0 0 0 3

Test de ceros Tmin 0.788 0 0.024 (47) 0.112 3 Test de salto térmico 6.190 0 0.585 (1158) 1.135 3

3.3 HUMEDAD RELATIVA DEL AIRE Se puede observar en la Tabla 4, tal y como cabría esperar en una región semiárida, que sólo algunos registros de humedad relativa máxima han tomado valores por encima del 100%. El porcentaje medio de registros que no pasaron el test de rango rígido fue del 0.07%, con un valor máximo del 1.63% en la estación de Lepe (Huelva). En 69 estaciones no se registraron valores fuera de rango. (Estévez, 2008) El mayor porcentaje de datos que no superaron los tests de coherencia interna fueron los de humedad relativa máxima (HRmax), con un valor medio del 0.044%. Hubo 43 estaciones cuyos registros de HRmax superaron el test satisfactoriamente en su totalidad. Para la humedad relativa mínima (HRmin) el porcentaje medio de registros potencialmente erróneos fue del 0.007%, con un total de 83 estaciones sin registros potencialmente erróneos. Para la humedad relativa media (HRmed) los porcentajes fueron inferiores, pues en solo dos estaciones hubo registros potencialmente erróneos. El porcentaje de registros anómalos más elevado para el test de persistencia se dio en las medidas de HRmax, con un promedio del 0.252% y un valor máximo en la estación de Isla Mayor (Sevilla) del 16.019%. También se ha detectado una tendencia creciente en el porcentaje de datos potencialmente erróneos, produciéndose el máximo durante el año 2006. Sin embargo, para esta misma variable no se detectó ningún registro sospechoso en 35 de las estaciones analizadas. Para los registros de HRmin y HRmed los porcentajes de alertas de la aplicación del test de persistencia fueron muy parecidos. Para ambas variables se detectaron datos anómalos en tan sólo 4 estaciones. Finalmente, para los registros semihorarios el test de persistencia detectó un porcentaje medio del 0.09%, con un máximo en la estación de La Puebla de Guzmán (Huelva) del 1.53%, mientras que hubo 32 estaciones en las que todos los registros superaron satisfactoriamente el test. Por último, el test de coherencia temporal fue el que detectó los porcentajes más bajos de alertas, con un promedio del 0.002% y un máximo del 0.021% para la estación de La Higuera de Arjona (Jaén). Este test no detectó ningún registro anómalo en 55 de las estaciones analizadas y prácticamente la totalidad de los registros detectados estuvieron asociados a episodios de lluvia (Estévez, 2008).

8

Tabla 4. Porcentaje de datos que no han superado los tests de rango rígido, coherencia temporal,

persistencia, coherencia interna y coherencia temporal de la serie aplicados a los registros de

humedad relativa del aire máxima (HRmax), mínima (HRmin) y media (HRmed) diarias y semihoraria

(HRsh) (Estévez, 2008)

Test de rango rígido Max (%) Min (%) Medio (%) Desv. Tip. (%) Validación

HRmed, HRmin, HRsh 0.00 0.00 0.00 0.00 1 HRmax 1.63 0.00 0.07 (139) 0.20 1

Coherencia temporal HRsh 0.021 0 0.002 (159) 0.004 2

Persistencia HRmax 16.019 0 0.252 (499) 1.717 2 HRmin 0.147 0 0.006 (12) 0.029 2 HRmed 0.234 0 0.008 (16) 0.034 2

Coherencia interna HRmax 0.649 0 0.044 (87) 0.080 3 HRmin 0.240 0 0.007 (14) 0.030 3 HRmed 0.239 0 0.004 (8) 0.029 3

Coherencia temporal de la serie HRsh 1.535 0 0.094 (7233) 0.194 4

3.4 VELOCIDAD Y DIRECCIÓN DEL VIENTO La aplicación del test de rango rígido no detectó ningún registro de velocidad y dirección de viento diario o semihorario fuera de los umbrales establecidos (Tabla 5). En general, los registros de velocidad de viento diaria superaron el test de coherencia temporal satisfactoriamente, puesto que en una única estación se registraron valores anómalos (0.09% de los registros). Los porcentajes de datos sospechosos detectados para dirección de viento fueron más elevados, con un promedio del 2.64% a escala diaria y del 1.30% a escala semihoraria (Estévez, 2008). Los datos de la velocidad máxima diaria que no superaron los tests de coherencia interna fueron el 0.32% de los registros, con un valor máximo del 2.70% en la estación de Almuñecar (Granada), existiendo un total de 11 estaciones cuyos registros superaron todos los tests. Para la velocidad del viento media diaria, el valor máximo de registros potencialmente erróneos se dio en la estación de Padul (Granada) (el 0.65% de los datos no superaron los tests), con un porcentaje medio del 0.01%. Estos registros, al igual que los correspondientes a la dirección de viento diaria, fueron producidos por inconsistencias entre velocidad y dirección de viento. Análogamente, la aplicación de estos tests a escala semihoraria detectó un porcentaje máximo del 0.93% en la misma estación, con un promedio para ambas variables del 0.06%. Estos registros inconsistentes a ambas escalas se produjeron mayoritariamente en el año 2002, lo cual indica un mal funcionamiento de la Anemoveleta en este periodo.

9

Tabla 5. Porcentaje de datos que no han superado los tests de rango rígido, coherencia temporal,

persistencia y coherencia interna aplicados a los registros de velocidad del viento media (VVmed),

máxima (VVmax) y semihoraria (VVsh) diarias y dirección del viento media diaria (DVmed) y semihoraria

(DVsh) (Estévez, 2008)

Test de rango rígido Max (%) Min (%) Medio (%) Desv. Tip. (%) Validación

VVmed, VVmax, VVsh 0.00 0.00 0.00 0.00 1 DVmed, DVsh 0.00 0.00 0.00 0.00 1

Coherencia temporal VVmed 0.09 0.00 0.00 0.00 2 VVsh 0.00 0.00 0.00 0.00 2

DVmed 7.46 0.237 2.64 (5229) 1.40 2 DVsh 2.92 0.362 1.30 (100064) 1.59 2

Coherencia interna VVmax 2.70 0.00 0.32 (634) 0.42 3 VVmed 0.65 0.00 0.01 (20) 0.07 3 VVsh 0.93 0.00 0.06 (4618) 0.15 3

DVmed 0.65 0.00 0.01 (20) 0.05 3 DVsh 0.93 0.00 0.06 (4618) 0.15 3

3.5 PRECIPITACIÓN El test de rango rígido solamente detectó valores erróneos en la estación de Tíjola (Almería), tanto para registros horarios como semihorarios (Estévez, 2008). Ambas medidas se produjeron en las mismas fechas, lo que parece indicar que pudieran ser debidas a operaciones de mantenimiento, probablemente provocadas por los técnicos al comprobar la correcta generación de pulsos en los pluviómetros en sus visitas periódicas a las estaciones.

Figura 2. Valores semihorarios de Radiación solar (Rssh), Radiación solar en cielo despejado (Rso) y Precipitación (Psh) para el 26 de abril de 2002 en la estación de Tíjola (Almería) (Estévez, 2008)

El test de coherencia interna no detectó ningún registro inferior a la precisión del pluviómetro (0.2 mm) (Tabla 6). Finalmente, el test de coherencia interna para valores semihorarios basado en los valores de la transmitancia atmosférica detecto registros de precipitación potencialmente erróneos en 36 estaciones con un máximo del 0.37% en la estación de Córdoba, donde el pluviómetro se vio afectado por el riego de las parcelas adyacentes (Estévez, 2008). El volumen de falsos positivos detectados en la estación de Tíjola (Almería) fue de 3249.4 mm y coincide con el periodo en que los registros no superaron el test de rango fijo. El día 26 de abril de 2002 los valores semihorarios de radiación solar (Rssh) describieron una curva típica de ausencia de nubes, acercándose a la envolvente de radiación solar teórica en cielo despejado (Rso), sin embargo, se

10

registraron medidas de precipitación (Psh) a partir de las 7 de la mañana (Figura 2). Estos medidas corresponden a valores potencialmente erróneos.

Tabla 6. Porcentaje de datos que no han superado los tests de rango rígido y coherencia interna

aplicados a los registros de precipitación semihoraria (Psh) y acumulada diaria (P) (Estévez, 2008)

Test de rango rígido Max (%) Min (%) Medio (%) Desv. Tip. (%) Validación

P 0.105 0.00 0.001 (3) 0.011 1 Psh 0.003 0.00 0.000 (1) 0.000 1

Coherencia interna (Precisión del pluviómetro) P 0.00 0.00 0.00 0.00 3

Psh 0.00 0.00 0.00 0.00 3

Coherencia interna (Transmitancia atmosférica) Psh 0.37 (352.2 mm) 0.00 3

4. CONCLUSIONES Los resultados obtenidos de la aplicación de los diferentes tests de validación de acuerdo con la norma AENOR UNE 500540 ponen de manifiesto la existencia de registros meteorológicos erróneos y potencialmente erróneos en las dos bases de datos validadas (diaria y semihoraria). El análisis temporal de los registros detectados por los tests y el uso de gráficos de control generados de forma dinámica han permitido tomar decisiones tan importantes como la sustitución de sensores o la depuración de registros fuera de rango antes de ser empleados en aplicaciones agronómicas (cálculo de la evapotranspiración de referencia).

Agradecimientos Este trabajo ha sido financiado por el Instituto Nacional de Investigación y Tecnología Agraria y Alimentaria (INIA) con cargo al Proyecto RTA04-063 (Control de calidad de la Información generada en las Redes de Estaciones Agroclimáticas).

Bibliografía

Cuadrat, J.M., Vicente, S.M., Saz, M.A., 2002. Fuentes de información en climatología:

Incertidumbres de las series de datos climáticos en España. VII Reunión Nacional de

Climatología. Albarracín, 27-29 Junio de 2002.

Doraiswamy, P.C., Pasteris, P.A., Jones, K.C., Motha, R.P., Nejedlik, P., 2000.

Techniques for methods of collection, database management and distribution of

agrometeorological data. Agricultural and Forest Meteorology. 103:83-97.

Eischeid, J.K., Baker, T.K., Díaz H.F., 1995. The quality control of long-term

climatological data using objective data analysis. J. Appl. Meteor., 34, 2787- 2795.

Estévez, J., 2008. Diseño de un sistema integrado para el control de calidad de datos de

estaciones meteorológicas automáticas. Tesis Doctoral. Departamento de Agronomía.

Universidad de Córdoba.

Estévez, J., Gavilán, P., De Haro, J., 2005. Calibración de piranómetros en la Red de

Información Agroclimática de Andalucía. XXIII Congreso Nacional de Riegos. Elche,

del 14 al 16 de Junio. Asociación Española de Riegos y Drenajes.

Feng, S., Hu, Q., Qian, Q., 2004. Quality control of daily meteorological data in

China, 1951-2000: a new dataset. Int. J.Climatol., 24, 853-870.

Fiebrich, C.A., Crawford, K.C., 2001. The impact of unique meteorological phenomena

detected by the Oklahoma Mesonet and ARS Micronet on automated quality control.

Bulletin of the American Meteorological Society. 82(10):2173-2187.

11

Gandin, L.S., 1988. Complex quality control of meteorological data. Mon. Wea. Rev.,

116, 1137-1156.

Gázquez, A., Perpinyà, M., Peña, J., 2003. The XAC –Agroclimatology Network of

Catalonia (La Xarxa Agrometeorològica de Catalunya). 3rd

International Conference

on experiences with automatic weather stations. Torremolinos (Málaga). 19th

, 20th

and

21st February 2003.

Graybeal, D. Y., DeGaetano, A. T., Eggleston, K.L., 2004a. Improved quality assurance

for historical hourly temperature and humidity: development and application to

environmental analysis. J. Appl. Meteor., 43, 1722-1735.

Grüter, E., Häberli, C., Küng, U., Mumenthaler, P., Mettler, J., Bassi, M., Konzelmann,

T., Dösseger, R., 2001. The next generation of quality control tools for meteorological

data at Meteoswiss DACH-MT 2001.

Horel, J., Splitt, M., Dunn, L., Pechmann, J., White, B., Ciliberti, C., Lazarus, S.,

Slemmer, J., Zaff, D., Burks, J., 2002. Mesowest: Cooperative Mesonets in the Western

United States. Bulletin of the American Meteorological Society. 83: 211-225.

Hubbard, K.G., 2001. Multiple station quality control procedures. Automated weather

stations for applications in agriculture and water resources management. World

Meteorological Organization Tech. Doc. AGM-3 WMO/TD No. 1074, 133-136.

Kunkel, K.E., Andsager, K., Conner, G., Decker, W.L., Hillaker Jr., H.J., Knox, P.N.,

Nurnberger, F.V., Rogers, J.C., Scheeringa, K., Wendland, W.M., Zandlo, J., Angel,

J.R., 1998. An expanded digital daily database for climatic resources applications in

the Midwestern United States. Bulletin of the American Meteorological Society.

79(7):1357-1366.

Meek, D.W., Hatfield, J.L., 1993. Data quality checking for single station

meteorological databases. Agricultural and Forest Meteorology. 36:85-109

Meyer, S.J., Hubbard, K.G., 1992. Nonfederal automated weather stations and networks

in the United States and Canada: a preliminary survey. Bulletin of the American

Meteorological Society. 73(4):449-457.

Miller, P.A., Barth, M.F., 2003. Ingest, integration, quality control, and distribution of

observations from State Transportation Departments using MADIS. International

Conference on Interactive Information and Processing Systems for Meteorology,

Oceanography and Hydrology (IIPS). February 9-13, 2003, Long Beach, California.

O’Brien, K.J., Keefer, T.N., 1985. Real-time data verification. In: Computer

Applications in Water Resources. Proc. ASCE Spec. Conf., Buffalo, N.Y., ASCE, New

York, N.Y., pp. 764-770.

Oviatt, H.S., Wilkins, D.E., 2002. USDA-ARS meteorological monitoring in

Northeastern Oregon. Reprinted from 2002 Columbia Basin Agricultural Research

Annual Report. Spec. Rpt. 1040, pp. 16-29, 2002.

Pérez de los Cobos, P., Carazo, J.I., Padilla, F., 2003: Agroclimatic Information

System for Irrigation Areas. 3rd International Conference on experiences with

automatic weather stations. 19, 20 y 21 Febrero 2003. Torremolinos (Málaga).

Reek, T., Doty, S.R., Owen, T.W., 1992. A deterministic approach to the validation of

historical daily temperature and precipitation data from the Cooperative Network.

Bulletin of the American Meteorological Society. 73(6):753-762.

12

Robinson, D.A., 1990. The United States Cooperative Climate Observing Systems :

reflections and recommendations. Bulletin of the American Meteorological Society.

71(6):826-831.

Schroeder, J.L., Burgett, W.S., Haynie, K.B., Sonmez, I., 2005: The West Texas

Mesonet: a technical overview. J. Atmos. Oceanic Technol., 22, 211-222.

Shafer, M.A., Fiebrich, C.A., Arndt, D. S., Fredrickson, S. E., Hughes, T. W., 2000.

Quality assurance procedures in the Oklahoma Mesonet. J. Atmos. Oceanic Technol.,

17, 474-494.

Snyder, R.L., Pruitt, W.O., 1992. Evapotranspiration data management in California.

Irrigation and Drainage, Saving a Threatened Resource –In Search of Solutions, T.E.

Engman, Ed., American Society of Civil Engineers, 128-133.

UNE 500510, 2005. Redes de Estaciones Meteorológicas Automáticas. Aspectos

generales y nomenclatura. AENOR.

UNE 500540, 2004. Redes de Estaciones Meteorológicas Automáticas. Directrices para

la validación de registros meteorológicos procedentes de redes de estaciones

automáticas. Validación en tiempo real. AENOR.

Vejen, F., Jacobsson, C., Fredriksson, U., Moe, M., Andresen, L., Hellsten, E.,

Rissanen, P., Palsdottir, T., Arason, T., 2002. Quality control of meteorological

observations. Report 8/2002 KLIMA. Norwegian Meteorological Institute, Oslo.

Wade, C. G., 1987. A quality control program for surface mesometeorological data. J.

Atmos. Oceanic Technol., 4, 435-453.

Weiss, A., Robb, J.G-, 1986. Results and interpretations from a survey on agriculturally

related weather information. Bulletin of the American Meteorological Society.

67(1):10-15.