PRINCÍPIOS DA ESTATÍSTICA APLICADA A ......ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA...

9
ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA E ANÁLISES DE SERIES TEMPORAIS Éder Leandro Bayer Maier (a) , Tainã Costa Peres (b) (a) Instituto de Ciencias Humanas e da Informação, FURG, [email protected] (b) Programa de Pós Graduação em Geografia, FURG, [email protected] Eixo: A Climatologia no contexto dos estudos da paisagem e socioambientais Resumo O artigo explora técnicas estatísticas de análise de series temporais usando como exemplo ciclos temporais padronizados da precipitação entre os anos de 2000 e 2100, a fim de mostrar, de forma didática, a técnica de análise e as possíveis interpretações. A serie foi construida a partir de uma função seno dos valores entre π e π, com intervalo de 0,101 e 0,0262 para simular a variabilidade interanual e decenal, uma variação entre 30 mm e 160 mm para a variabilidade sazonal e uma variação aleatória. As técnicas de análise foram média, variância, wavelet e análise de dependecia por regressão linear, que são utilizadas para caracterização das medidas da tendência central, da variabilidade, dos ciclos temporais e a mensuração da dependência da precipitação com os fatores que controlam a variabilidade temporal. Palavras chave: estatística descritiva, inferêncial, serie temporal. 1. Introdução A falta de análises estatísticas aplicadas em ciências humanas, em especial na geografia, pode ser um dos limitantes da qualidade das pesquisas publicadas no Brasil. Nesse contexto, a climatologia, no âmbito da ciência geográfica, tem uma carência de profissionais que desenvolvam análises estatísticas eficientes e usuais para maior divulgação do conhecimento científico. A estatística (descritiva e inferencial) pode ser usada para diminuir as análises subjetivas e descritivas, sendo uma ferramenta que visa gerar resultados agrupados ou inferenciais que podem ser apresentados de forma simples e de fácil compreensão. A estatística descritiva é comumente integrada aos quadros de sequência lógica de formação dos geógrafos no Brasil e possui técnicas de análises eficientes para interpretação de series temporais. A mesnuração das medidas de tendência central ou de dispersão (média e variância) das amostras geram

Transcript of PRINCÍPIOS DA ESTATÍSTICA APLICADA A ......ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA...

Page 1: PRINCÍPIOS DA ESTATÍSTICA APLICADA A ......ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA E ANÁLISES DE SERIES TEMPORAIS Éder Leandro Bayer

ISBN: 978-85-7282-778-2 Página 1

PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA

E ANÁLISES DE SERIES TEMPORAIS

Éder Leandro Bayer Maier (a), Tainã Costa Peres (b)

(a) Instituto de Ciencias Humanas e da Informação, FURG, [email protected] (b) Programa de Pós Graduação em Geografia, FURG, [email protected]

Eixo: A Climatologia no contexto dos estudos da paisagem e socioambientais

Resumo

O artigo explora técnicas estatísticas de análise de series temporais usando como exemplo

ciclos temporais padronizados da precipitação entre os anos de 2000 e 2100, a fim de mostrar, de

forma didática, a técnica de análise e as possíveis interpretações. A serie foi construida a partir de

uma função seno dos valores entre – π e π, com intervalo de 0,101 e 0,0262 para simular a

variabilidade interanual e decenal, uma variação entre 30 mm e 160 mm para a variabilidade sazonal

e uma variação aleatória. As técnicas de análise foram média, variância, wavelet e análise de

dependecia por regressão linear, que são utilizadas para caracterização das medidas da tendência central, da variabilidade, dos ciclos temporais e a mensuração da dependência da precipitação com

os fatores que controlam a variabilidade temporal.

Palavras chave: estatística descritiva, inferêncial, serie temporal.

1. Introdução

A falta de análises estatísticas aplicadas em ciências humanas, em especial na geografia, pode

ser um dos limitantes da qualidade das pesquisas publicadas no Brasil. Nesse contexto, a climatologia,

no âmbito da ciência geográfica, tem uma carência de profissionais que desenvolvam análises

estatísticas eficientes e usuais para maior divulgação do conhecimento científico. A estatística

(descritiva e inferencial) pode ser usada para diminuir as análises subjetivas e descritivas, sendo uma

ferramenta que visa gerar resultados agrupados ou inferenciais que podem ser apresentados de forma

simples e de fácil compreensão.

A estatística descritiva é comumente integrada aos quadros de sequência lógica de formação dos

geógrafos no Brasil e possui técnicas de análises eficientes para interpretação de series temporais. A

mesnuração das medidas de tendência central ou de dispersão (média e variância) das amostras geram

Page 2: PRINCÍPIOS DA ESTATÍSTICA APLICADA A ......ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA E ANÁLISES DE SERIES TEMPORAIS Éder Leandro Bayer

ISBN: 978-85-7282-778-2 Página 2

dados que possibilitam extrair informações das observações, evitando as cansativas e exaustivas análises

visuais (e descritivas) das series temporais. Já a estatística inferencial pode ser uma ferramenta mais

avançada para obter parâmetros quantitativos de dependência entre as series temporais ou identificar

ciclos temporais que controlam os modos de variabilidade climática registrados em estações

meteorológicas (ASSIS et al., 1996).

Nesse artigo são apresentados uma serie temporal fictícia e análises estatísticas que

exemplificam as técnicas de análise e interpretação. A serie fictícia é de precipitação e possui um

intervalo temporal entre o ano 2000 e 2100 e as análises estatísticas utilizadas são: média, variância,

análise de dependência por regressão linear e wavelet. A seguir será mostrado a técnica de construção

da serie temporal e as análises estatísticas, vindo explorar uma descrição simples e compreensível da

metodologia e possíveis análises dos resultados da estatística descritiva e inferencial.

2. Materiais e Métodos

Dados foram obtidos a partir de series fictícias que representam os totais mensais da

precipitação no período entre 2000 e 2100 com uma variabilidade sazonal entre 30 mm e 160 mm, um

ciclo interanual com intervalo de frequência de 5 anos, um ciclo decenal com intervalo de frequência

de 10 anos e uma variação aleatória. Sendo que os ciclos, interanual e decenal, variam entre -50 mm e

50 mm e a variação aleatória entre 0 mm e 30 mm.

Os ciclos, interanual e decenal, foram gerados a partir de uma função seno e entre – π e π, com

intervalos 0.101 e 0,0262, respectivamente. Sendo obtidas 2 cristas e 2 cavados em um intervalo de 120

meses, caracterizando uma variação interanual, 1 crista e 1 cavado em 120 meses, determinando a

variabilidade decenal. Por final, os resultados da função seno foram multiplicados por 50 a fim de gerar

uma variação com magnitude coerente com o volume de precipitação representados pelos limiares da

variabilidade sazonal.

O somatório das series fictícias gerou uma serie temporal entre 2000 e 2100 que representa a

variabilidade sazonal, interanual, decenal e a variação aleatória de uma serie temporal da precipitação,

com variação fictícia entre -64 mm e 275 mm, a qual representa a anomalia da precipitação. A média

Page 3: PRINCÍPIOS DA ESTATÍSTICA APLICADA A ......ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA E ANÁLISES DE SERIES TEMPORAIS Éder Leandro Bayer

ISBN: 978-85-7282-778-2 Página 3

aritmética (𝑋 ) é calculada pelo somatório das amostras e divisão pelo número de ocorrência das

mesmas, conforme a Equação 1:

𝑋 =1

𝑛∑ 𝑥𝑖

𝑛𝑖=1 Eq. 1

sendo, 𝑋 é a média, x são as amostras n o número de ocorrência (TOLEDO e OVALLE, 1992).

A média mensal é calculada a partir da identificação de todos os meses (de janeiro até dezembro)

contidos na serie e efetuado o cálculo da média para cada mês do ano (TOLEDO e OVALLE, 1992).

Sendo usual mostrar as médias mensais em um gráfico de barra, onde a magnitude da precipitação é

representada no eixo vertical e a variação dos meses no eixo horizontal.

A variância (𝑠2) é calculada pelo somatório das diferenças entre as amostras e a média da serie,

dividido pelo número de ocorrências de amostras, conforme Equação 2. Essa é uma medida de

dispersão da serie e pode evidenciar parâmetros da variabilidade climática registrados ao longo do tempo

(TOLEDO e OVALLE, 1992).

𝑠2 = ∑ (𝑥−�̅�)𝑛

𝑖=1

𝑛−1 Eq. 2

onde 𝑋 é a média, x é amostra e n é um número de ocorrência.

A análise de dependência por regressão linear compõem a estatística inferêncial, e ela possibilita

comparar duas series temporais a partir de parâmetros visuais e estatísticos. Essa técnica é amplamente

utilizada para analisar a dependência temporal entre dados observados e índices climáticos que

representam modos de variabilidade como, por exemplo, El Niño-Oscilação Sul (ENOS), Oscilação

Ártica (AO) e etc. Sendo assim, são comparadas uma serie independente e outra dependente, mostradas

nos diagramas de dispersão no eixo horizontal e vertical, respectivamente. Além dos diagramas de

dispersão outros parâmetros são empregados nessa análise, como: a equação de regressão linear

(equação de primeiro grau), o somatório do erro (SSE) e a porcentagem da representação da reta de

regressão linear (R2) que podem ser utilizados como parâmetros quantitativos da dependência entre as

duas series.

O wavelet é utilizado para identificar os ciclos temporais em uma serie, sendo que os

aplicativos implementados em programas estatísticos geram o espectrograma como resultado, em que

Page 4: PRINCÍPIOS DA ESTATÍSTICA APLICADA A ......ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA E ANÁLISES DE SERIES TEMPORAIS Éder Leandro Bayer

ISBN: 978-85-7282-778-2 Página 4

no eixo horizontal do gráfico é mostrado o período de observação (ex. 2000 até 2100), no eixo vertical a

frequência dos ciclos temporais contidos na serie e a magnitude da potência espectral é mostrada pela

variação de cores no gráfico (STOLLNITZ et al., 1995).

3. Resultados e Discussões

A serie temporal ficticia (Figura 1) mostra a variação anômala da precipitação entre os anos de

2000 e 2100 (eixo horizontal) e a magnitude das anomalias (eixo vertical), onde é possível observar a

sobreposição dos ciclos temporais simulando a variabilidade sazonal, interanual, decenal e aleatória.

Cabe ressaltar que as anomalias negativas registram períodos de seca ou, em outras palavras,

precipitações abaixo da média mensal. Observa-se também que as anomalias negativas não possuem

magnitudes inferiores a -160 mm, isso acontece porque no mês em que não ocorreu chuvas (registro de

0 mm) a anomalia será a diferença entre esse registro e a média mensal, como por exemplo, 0 - 160

mm, obtendo uma anomalia de -160 mm.

As anomalias positivas representam os períodos de chuvas excessivas (ou acima da

média mensal). No entanto, as anomalias positivas não possuem um limite superior, porque dependem

da disponibilidade de água e mecanismos de convergência para acumular altos índices pluviométricos,

que podem exceder 3 vezes (ou mais) a média mensal.

Para exemplificar, um período com anomalias positivas de grandes magnitudes podem estar

associados a sobreposição de ciclos como, o sazonal (estação chuvosa), o interanual (chuvas acima da

média) e o decenal (chuvas acima da média), favorecendo a intensificação e a maior frequência dos

mecanismos de transporte e convergência da umidade que formam as chuvas.

Ressalta-se que os ciclos temporais em series observadas não são tão evidentes quanto na serie

fictícia (Figura 1), isso ocorre porque os fatores remotos que controlam a precipitação podem ser

ocultados por ciclos com ocorrência em outras escalas temporais. Ou, ainda, os fatores remotos não

possuem controle da precipitação ao longo de todo o período, sendo possível que a influência seja

sazonal (inverno ou verão). Além disso, pode ocorrer a sobreposição dos ciclos, em que as fases

positivas e negativas de duas frequências se sobrepõe, ampliando ou subtraindo os impactos na

precipitação.

Page 5: PRINCÍPIOS DA ESTATÍSTICA APLICADA A ......ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA E ANÁLISES DE SERIES TEMPORAIS Éder Leandro Bayer

ISBN: 978-85-7282-778-2 Página 5

Figura 1 – Variabilidade sazonal, decenal, interanual e aleatória da precipitação simuldada para o período

entre 2000 e 2100.

Figura 2 – Simulação da variabilidade sazonal da precipitação.

Nesse contexto, é importante compreender o principal modo de variabilidade, que é o

sazonal, visto que em um período de 12 meses é registrado um período de chuva e outro com seca. Cabe

ressaltar que no Brasil grande parte das precipitações apresentam um ciclo sazonal bem marcado, como

é possível observar no exemplo da Figura 2.

Geralmente os maiores totais mensais ocorrem no verão dos respectivos hemisférios, visto que

nessa estação sazonal ocorre o transporte, convergência e evaporação da água sobre o continente sul-

americano, favorecendo a formação das precipitações. Em contrapartida, no inverno a continentalidade

favorece a diminuição da temperatura que gera estabilidade atmosférica e diminuição do transporte de

umidade para o interior continental.

Page 6: PRINCÍPIOS DA ESTATÍSTICA APLICADA A ......ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA E ANÁLISES DE SERIES TEMPORAIS Éder Leandro Bayer

ISBN: 978-85-7282-778-2 Página 6

No registro da precipitação existem além do ciclo sazonal as variações aleatórias e a

variabilidade climática que ocorre predominantemente nas escalas interanual, decenal e aleatória. Em

outras paralavras, uma variação intercecenal pode ser representada por 2 ou 3 períodos de chuvas acima

da média ou secas em uma década, já a variabilidade decenal apresenta períodos de chuvas acima da

média ou secas que diferenciam as décadas que compoem a serie temporal.

As variações interdecenais geralmente estão associados a fatores remotos que controlam a

precipitação como, por exemplo, o fenômeno ENOS, visto que a ocorência dos eventos El Niño e La

Niña possui uma frequência entre 3 e 7 anos. Esse fenomeno é o principal fator remoto que causa

variabilidade na precipitação (GRIMM, 2009).

Figura 3 – Espectrograma da potência espectral (em cores) das frequências (eixo vertical) dos ciclos

temporais entre os anos de 2000 e 2100 (eixo horizontal).

A Oscilação Decadal do Pacífico (ODP) ocorre em um intervalo de frequência maior,

classificando períodos (de decadas) de acordo com as fases quentes e frias da ODP. Sendo que, seu

principal impacto é na intensificação ou desintensificação dos efeitos do fenômeno ENOS (KAYANO

e ANDREOLI, 2009).

A mensuração das frequências dos ciclos temporais e de suas ocorrências são informações

fundamentais para a caracterização da variabilidade temporal registrada em estações meteorológicas,

reconstrução paleoclimática ou estimativas futuras. Nesse constexto, existem pacotes de análise

espectral, ou de wavelet, que podem ser operacionalizados em softawares de código aberto ou fechado.

Na Figura 3 é mostrado o espectrograma de análise da serie temporal fictícia da precipitação

entre 2000 e 2100. A periodicidade de recorrência dos ciclos temporais estão representados no eixo

Ciclo decenal Ciclo interanual

Ciclo sazonal

Page 7: PRINCÍPIOS DA ESTATÍSTICA APLICADA A ......ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA E ANÁLISES DE SERIES TEMPORAIS Éder Leandro Bayer

ISBN: 978-85-7282-778-2 Página 7

vertical (Y), onde os principais ciclos apresentam as maiores potências espectrais (em cores), no período

da serie fictícia (200-2100 – no eixo horizontal).

As maiores frequências possuem recorrência de 10 anos (variabilidade decenal) e são

represntadas pelos núcleos amarelos que aparecem na parte superior da Figura 3. Já as menores

frequências são representas pelos núcleos azuis claros, na parte central e inferior da Figura 3,

representado a variabilidade interanual e sazonal, ocorrendo em uma frequência de 5 e 1 ano,

respectivamente. Cabe resaltar que essa escala temporal não favorece a visualização do ciclo sazonal,

visto que existem 100 pequenos núcleos com cor azul claro na porção inferior da Figura 3, entretanto, a

edição da escala de análise das frequências pode comprometer a visualização de outros ciclos, por isso,

optou-se em mostrar as escalas interanuais e decenais porque o ciclo sazonal é mais fácil de ser

observado e compreendido.

A mensuração de paramentos de dependência entre a serie de precipitação e índices climáticos

podem auxiliar na compreensão dos fatores que comtrolam a precipitação. Como exemplo, é mostrado

a análise de dependência por regressão linear, que é composto por duas series temporais (variável

independente e dependente) mostrados na Figura 4A, o diagrama de dispersão (Figura 4B) e parâmetros

estatísticos (Erro médio quadrático - SSE, R-square - R2) e índice de correlação (r).

Os resultados gráficos possibilitam uma análise visual da variabilidade sincronizada (Figura 4A)

e da relação entre as variáveis (Figura 4B), mas são os parametros estatísticos que mensuram o grau de

dependência como, a magnitude do erro (SSE = 3403100), a porcentagem de representação da reta de

regreção (R2= 0.30 – indica que 30% da variação é representada pela reta) e um índice de correlaçã de r

= 0,55. Em outras palavras, as variáveis, independente e dependente, possuem uma variação temporal

sincronizada (com correlação positiva), e a reta de regressão pode estimar a variabilidade temporal de

30% do período com dados (2000-2100).

Além disso, esta análise permite comparar amostras de diferentes parametros atmosféricos

como, por exemplo, verificar o grau de dependência entre a precipitação e a temperatura, ou a relação

entre o vento e a pressão atmosférica. Ou utilizar observações da mesma variável atmosférica, realizada

em diferentes estações meteorlogicas, a fim de completar os períodos que não possuem dados

observações.

Page 8: PRINCÍPIOS DA ESTATÍSTICA APLICADA A ......ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA E ANÁLISES DE SERIES TEMPORAIS Éder Leandro Bayer

ISBN: 978-85-7282-778-2 Página 8

Figura 4 – Variabilidade temporal da variável dependente e independente (A) e o diagrama de dispersão

(B). A Variável independente é o ciclo interanual e a dependente a serie ficticia da precipitação.

4. Considerações finais

As análises estatísticas, descritiva e inferencial, das series temporais são ferramentas simples e

úteis para agrupar e representar de forma organizada e sistemática a diversidade dos registros das

estações meteorológicas. Sendo que, a estatística descritiva gera resultados que mostram as medidas de

tendência central e de dispersão como, por exemplo, a média e a variância. Já a estatística inferencial

auxilia na caracterização dos ciclos temporais e dos fatores que controlam a variabilidade da

precipitação. Possibilitando uma análises quantitativa dos dados climáticos, que favorece a diminuição

das análises subjetivas.

B)

A)

Page 9: PRINCÍPIOS DA ESTATÍSTICA APLICADA A ......ISBN: 978-85-7282-778-2 Página 1 PRINCÍPIOS DA ESTATÍSTICA APLICADA A CLIMATOLOGIA E ANÁLISES DE SERIES TEMPORAIS Éder Leandro Bayer

ISBN: 978-85-7282-778-2 Página 9

Agradecimentos

O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível

Superior - Brasil (CAPES) - Código de Financiamento 001.

Referências Bibliográficas

ASSIS, F, N; ARRUDA, H, V; PEREIRA, A, R. Aplicações de Estatística à Climatologia:

teoria e prática. Pelotas: Editora Universitária – UFPEL, 1996, 161p.

GRIMM, A.M. Variabilidade interanual do clima no Brasil. In: CAVALCANTI, I. F.,

FERREIRA, A.N.J.; JUSTI DA SILVA, M.G; SILVA DIAS, M.A.F. (Org.). Tempo e Clima

no Brasil. São Paulo: Oficina de Textos, 2009, p. 353–374.

KAYANO, M, T; ANDREOLI, V, R. Clima da Região Nordeste do Brasil. In: CAVALCANTI,

I, F, A. FERREIRA, N, J. SILVA, M, G, A, J. DIAS, M, A, F, S (Org). Tempo e Clima no

Brasil. Editora Oficina de Textos, São Paulo, 2009, p. 213 – 233.

STOLLNITZ, E. J.; DEROSE, T. D.; SALESIN, D. H. Wavelets for computer graphics: A

primer, part 1. IEEE Computer Graphics and Applications, v. 15, n. 3, p. 76-84, 1995a.

TOLEDO, G, L. OVALLE, I, I. Estatística Básica. São Paulo: Atlas, 1992. 459 p.