Post on 28-Oct-2020
Preparado por: Fernando Simões Casimiro
Perito Principal 2 (PP2) Julho de 2014
Manual sobre a concepção e
execução de operações estatísticas
2
Índice 1 Apresentação ...................................................................................................................................... 3
2 Introdução .......................................................................................................................................... 4
3 Por onde começar? Um programa de acção e um plano de apuramentos ....................................... 4
4 O que é um Programa de Acção? ....................................................................................................... 5
4.1 Que estrutura para o Programa de Acção? ................................................................................ 5
4.1.1 Introdução/Apresentação/Enquadramento ....................................................................... 6
4.1.2 Identificação e definição das unidades estatísticas a observar e respectivas variáveis
primárias e derivadas ......................................................................................................................... 6
4.1.3 Tipo de observação (directa e exaustiva, directa com amostragem, administrativa) ....... 9
4.1.4 Desenho de questionários ................................................................................................ 11
4.1.5 Operações experimentais ................................................................................................. 13
4.1.6 Legislação específica ......................................................................................................... 13
4.1.7 Organização de ficheiros .................................................................................................. 14
4.1.8 Organização dos trabalhos de campo .............................................................................. 15
4.1.9 Sistema de registo e tratamento de dados ...................................................................... 16
4.1.10 Controlo e avaliação da qualidade ................................................................................... 19
4.1.11 Publicidade ....................................................................................................................... 22
4.1.12 Cartografia ........................................................................................................................ 22
4.1.13 Princípios da orçamentação da actividade estatística ..................................................... 27
4.1.14 Relatório final ................................................................................................................... 28
4.1.15 Cronograma ...................................................................................................................... 29
5 Programa de Difusão (os resultados) ............................................................................................... 32
5.1 O que é um Programa de Difusão? ........................................................................................... 32
5.2 Organização do Programa de Difusão ...................................................................................... 35
6 A utilização de ficheiros administrativos para a produção de estatísticas oficiais .......................... 36
6.1 Fases de preparação do procedimento administrativo, para utilização estatística ................. 37
6.2 A experiência demográfica na utilização de registos administrativos e as regras inerentes ao
registo civil ............................................................................................................................................ 38
6.3 Os 12 cuidados a ter na utilização dos registos administrativos para fins estatísticos ............ 40
3
1 Apresentação
O presente manual destina-se a apoiar a formação de técnicos superiores, técnicos e técnicos médios
do Sistema Nacional de Estatística de Angola na componente de concepção e execução de inquéritos e
recenseamentos estatísticos.
A sequência das fases de preparação de uma operação estatística nem sempre são percebidas em toda
a sua dimensão e complexidade e muitas pessoas ainda têm como referência a ideia que uma
operação estatística se prepara começando por fazer um questionário a “imaginar perguntas que
façam sentido para observar a população estatística de referência”.
Assim, tomou-se como referência um modelo de preparação e execução de um recenseamento da
população, assumindo que quando se percebe o enquadramento da preparação e execução de um
recenseamento, é possível ajustar o respectivo quadro de referência para planear e executar qualquer
outra operação estatística menos complexa.
As recomendações mundiais das Nações Unidas, editadas em 2008, reconhecem esta complexidade no
seu parágrafo 1.77 ao descreverem “o recenseamento da população e habitação (ou o próprio
recenseamento da população) é talvez a operação estatística mais extensa, complicada e cara que um
país pode realizar, porque é composta por uma série complexa e inter-relacionada de actividades”.
Na sua parte final também se procura fazer o enquadramento da utilização dos ficheiros
administrativos para produzir estatísticas oficiais. É um assunto de importância crescente, tanto pelo
facto de que existe ainda um significativo conjunto de actividades administrativas que podem ser
muito bem utilizadas para produzir estatísticas, como por ser um tema estatístico bastante actual nos
aspectos relacionados com a redução da carga estatística sobre os cidadãos e as empresas.
Luanda, Julho de 2014
4
2 Introdução A concepção e execução de uma operação estatística seguem um modelo muito semelhante
ao de qualquer outro projecto que se pretenda realizar: é necessário definir o que se pretende
atingir e depois estruturar um conjunto coerente e sequencial de actividades orientadas para
atingir o objectivo estabelecido.
Vamos utilizar o exemplo de um prédio construído de acordo com as normas de segurança,
enquadramento paisagístico e esteticamente bonito e adequado ao fim a que se destina, por
exemplo alojar várias famílias em apartamentos individuais. Para um prédio destes, à
semelhança de qualquer outro que obedeça às normas estabelecidas, é necessário fazer um
projecto de arquitectura, calcular os elementos necessários para a sua resistência ao peso que
vai suportar, a forma como se vão organizar as famílias que lá vão viver, definir os tipos de
materiais que se vai utilizar, definir uma sequência de actividades, etc. Ou seja, no caso de um
prédio, toda a gente sabe que tem de ter, pelo menos, alicerces, paredes e telhado … e não se
pode começar pelo telhado porque nem sequer existem paredes para o suportar!
Assim, vamos ver como se concebem e executam as operações estatísticas, tomando como
referência as mais complexas que são os recenseamentos, mas cujos princípios essenciais
também se aplicam às mais simples e até às correntes, designadamente na utilização dos
dados administrativos para produzir estatísticas oficiais.
3 Por onde começar? Um programa de acção e um plano de
apuramentos Quem quer construir um prédio e dispõe de um terreno específico para isso, encomenda um
projecto a um arquitecto com um “caderno de encargos” (tipo e dimensões do prédio, quanto
está disposto a gastar, etc).
Ora quem (os utilizadores, a começar pelo governo) quer determinados resultados estatísticos
que não existem e que ainda não são produzidos de forma corrente, necessita de saber as
condições técnicas, organizativas e financeiras para os produzir e então … encomenda um
projecto ao INE ou a outra entidade do SEN. Aqui o INE assume-se, simultaneamente, como o
arquitecto, o engenheiro e a empresa de construção que vai conceber e executar o projecto
até à sua conclusão … que são os resultados estatísticos definitivos, devidamente difundidos e
respeitando os princípios técnicos do Sistema Estatístico Nacional (SEN).
Assim, os instrumentos fundamentais para desencadear o processo de uma operação
estatística, que responda às necessidades efectivas e específicas dos seus utilizadores, são os
seguintes:
Um programa de acção onde se definem todos os procedimentos
metodológicos e organizativos fundamentais;
Um Programa
de Acção
+
Um Plano de
Apuramentos,
devidamente
integrado num
Programa de
Difusão
5
Um plano de apuramentos, integrado num programa de difusão, onde se
identificam e descrevem todos os resultados a apurar nas diversas fases do
tratamento de dados.
4 O que é um Programa de Acção? O Programa de Acção é o documento base que orienta toda a preparação e execução de uma
operação estatística.
Ao definir os procedimentos técnicos essenciais e as várias fases do trabalho a desenvolver,
este programa constitui-se como o documento de referência que suporta, organiza e
calendariza todas as fases do trabalho a desenvolver, tanto para os responsáveis da execução
como para os utilizadores.
Por outro lado, a actividade estatística tem uma visibilidade crescente e é muito importante
que o Sistema Estatístico Nacional (SEN), através do Conselho Nacional de Estatística (CNEST),
dê resposta às questões decorrentes dessa visibilidade, nomeadamente pronunciando-se
sobre as questões técnicas mais sensíveis e também sobre a oportunidade e importância de
cada operação estatística. O Programa de Acção será também um elemento importante de
explicação escrita dos procedimentos que são utilizados, o qual deve ser apreciado pelo
CNEST, sempre que tal for considerado oportuno e adequado. De salientar que no CNEST estão
representados os principais utilizadores estatísticos, para além de todos os produtores de
estatísticas oficiais.
Um outro aspecto importante é o facto de se construir uma estrutura de informação técnica
que oriente a construção dos questionários. Frequentemente, a preparação de uma operação
estatística começa pelo desenho dos questionários, sem que esteja previamente definida uma
estrutura conceptual de referência que suporte o desenho e conteúdo desses mesmos
questionários. Basta verificar o exemplo das recomendações internacionais as quais se
concentram sobretudo na estrutura organizativa e conceptual das unidades estatísticas e
variáveis primárias e derivadas. Os questionários derivam destas estruturas conceptuais, as
quais devem ser devidamente adaptadas para cada operação estatística antes de serem
concebidos os questionários.
Em paralelo com o Programa de Acção deve também ser preparado o Programa de Difusão, o
qual tipifica e calendariza todos os produtos de difusão, com especial destaque para o plano
de apuramentos.
4.1 Que estrutura para o Programa de Acção? Um Programa de Acção deve conter uma estrutura de temas que oriente toda a preparação
e execução da operação estatística. Apresenta-se, seguidamente, um modelo de estrutura e de
Documento
estratégico e
orientador da
preparação e
execução, destinado:
- Ao CNEST
- Ao executante
- Aos
utilizadores dos
resultados
6
organização de conteúdos que procura responder aos principais temas que este programa
deve abordar, bem como os elementos mais determinantes que esta abordagem deve conter.
4.1.1 Introdução/Apresentação/Enquadramento
Neste subcapítulo devem ser abordados assuntos que permitam perceber as razões que
justificam a realização da operação estatística em causa.
Uma das primeiras justificações, passa por descrever como foi identificada a necessidade de
produzir a informação estatística em causa, a qual pode fundamentar-se em necessidades do
seguinte teor e que podem ser determinantes individual ou conjuntamente:
Necessidade de informação identificada pelo governo;
Cumprimento de recomendações internacionais, nomeadamente as
regionais;
Cumprimento do plano de actividades do Sistema Estatístico Nacional, cuja
justificação já foi assumida quando da sua introdução no plano de actividades.
Um outro aspecto determinante será a referência à necessidade de legislação específica.
Trata-se de um processo normalmente longo e que exige procedimentos específicos de
preparação e cuja aprovação final e publicação deve ser feita o mais rapidamente possível,
logo que é tomada a decisão de realizar a operação estatística. Deste modo, a sua referência,
logo na abertura, permite dar um destaque especial a este assunto.
Sempre que uma operação estatística tem antecedentes históricos, também se pode fazer
uma abordagem a este tema, tomando como referência os seguintes conteúdos: sequência
histórica com identificação da data e caracterização das operações idênticas, nomeadamente
com um breve resumo dos aspectos mais relevantes de cada uma delas.
4.1.2 Identificação e definição das unidades estatísticas a observar e respectivas
variáveis primárias e derivadas
O principal objectivo de qualquer operação estatística é produzir informação que responda às
condições técnicas do SEN, definidas na Lei Nº 3/11 de 14 de Janeiro (Lei do SEN), a saber:
autonomia técnica, fiabilidade, imparcialidade, pertinência, autoridade estatística, segredo
estatístico, coordenação estatística e acessibilidade estatística.
Todos estes princípios devem estar presentes e claros para todos os intervenientes no
momento em que se começa a preparar uma operação estatística, uma vez que em todos eles
existe uma componente determinante que condiciona a parte técnica propriamente dita.
Antes de passarmos à organização do conteúdo técnico, justifica-se também voltar à Lei do
SEN, para verificarmos qual a definição de um elemento determinante para qualquer operação
estatística e que é o conceito de “unidade estatística” que se encontra definido no nº 6 do
artigo 2º da referida Lei:
Justificação
da operação
estatística:
- Porquê?
- Para quê?
7
Como pode ser observado na definição anterior, a unidade estatística é a “pedra angular” de
qualquer operação estatística uma vez que constitui o elemento de referência para observação
e reúne um conjunto de características que se chamam “variáveis”. Ou seja, unidade
estatística e variável/características são dois elementos que não existem um sem o outro na
actividade estatística.
De notar que as palavras “pessoa” e “população” que existem no conceito de unidade
estatística têm um sentido muito mais vasto do que o de pessoa humana (singular) ou
empresa (colectiva) ou “população humana”. Neste conceito de unidade estatística, um prédio
ou um veículo automóvel também estão incluídos na palavra “pessoa”, quando se pretende
observar a “população” constituída pelo “parque edificado” ou pelo “parque automóvel” de
um país ou de uma determinada área específica. A data de construção de um prédio é uma
variável da unidade estatística “prédio”, enquanto a data de registo ou a cilindrada de um
automóvel são variáveis da unidade estatística “automóvel”.
Assim, a variável é um elemento caracterizador da unidade estatística.
Um outro elemento importante, antes de “construir” o quadro técnico de referência é a
distinção entre variável de observação/primária e variável derivada.
A variável de observação/primária é a variável que é observada directamente em cada
unidade estatística através de um questionário ou de qualquer outro método de recolha de
dados. Exemplo: o sexo ou o estado civil nas pessoas, bem como a actividade económica ou o
volume de negócios numa empresa.
A variável derivada é aquela cujos dados se apuram através da combinação de mais do que
uma variável primária. Exemplos: a taxa de analfabetismo que combina as variáveis primárias
“saber ler e escrever” e a ” idade” ou o valor acrescentado bruto de uma empresa que é obtido
através da combinação do” valor da produção” e o “valor dos consumos intermédios”.
Um outro aspecto muito importante são as classificações que são utilizadas para tipificar e
classificar tanto as variáveis primárias como as derivadas. Assim, temos dois tipos de
classificações:
Classificações de suporte à codificação, descritivas de conteúdos e códigos para
“converter” as respostas alfabéticas de determinadas variáveis primárias em códigos
numéricos ou alfanuméricos; são exemplos a Classificação de Actividades Económicas
(CAE) e a Classificação Nacional de Profissões (CNP);
Unidade
estatística:
- Elemento de
observação
- Elemento de
caracterização
Há muitas e
variadas
“populações
estatísticas”
Varáveis primárias e
derivadas, enquanto
elementos
caracterizadores da
unidade estatística
8
Classificações “organizativas” das modalidades de uma ou mais variáveis primárias ou
derivadas; são exemplos os casos das classificações dos níveis de ensino, da dimensão
dos aglomerados populacionais, da situação na profissão, etc.
Temos classificações que são utilizadas em variadas operações estatísticas, como é o caso da
CAE e da CNP e que não necessitam de ser especificadas, para além da indicação do respectivo
nome e versão que vai ser utilizada para classificar a respectiva variável.
Contudo, há outras classificações específicas de um número restrito de operações estatísticas
que tanto podem decorrer de recomendações internacionais como de convenções nacionais e
que necessitam de ser devidamente tipificadas e descritas neste capítulo de caracterização
técnica do conteúdo técnico a observar na operação estatística. A maior parte destas
classificações são constituídas como variáveis derivadas, apesar de serem tipificadas muitas
vezes como classificações. Por exemplo nos recenseamentos da população utiliza-se a
classificação “dimensão do aglomerado populacional/lugar” que não é mais do que uma
variável derivada que combina o número de residentes nos lugares segundo um conjunto de
escalões de dimensão populacional.
Temos as classificações standardizadas e de utilização internacional para todas as operações
estatísticas que as utilizam. No caso das variáveis primárias temos os exemplos mais habituais
que são a Classificação da Actividade Económica (CAE) para classificar a variável primária
“actividade económica” de empresas e pessoas activas, bem como a Classificação Nacional de
Profissões (CNP) para classificar a variável primária “profissão” das pessoas activas. A
identificação da versão destas classificações, que vai ser utilizada, deve estar indicada junto da
definição e tipificação de cada variável que a utiliza.
Muitas operações estatísticas são realizadas com objectivos nacionais e internacionais,
designadamente para dar cumprimento a recomendações de organizações internacionais
relevantes, como é o caso da ONU. Assim, é importante pôr em evidência a adequabilidade
conceptual entre as recomendações e a prática nacional, indicando se existem ou não
diferenças.
Então, o presente subcapítulo deve listar e definir todas as unidades estatísticas e variáveis
primárias e derivadas, bem como as respectivas classificações gerais e específicas que são
utilizadas, na base de uma sequência de conteúdo do seguinte tipo:
Unidade estatística/Variável Comparabilidade
internacional
Exemplo
Unidade estatística X Pessoa humana
o Variável primária X1 o Sexo
o Variável primária X2 o Data de nascimento
o Variável primária X3 o Estado civil
o Variável primária X4 o Nível de instrução
o ….
o Variável primária Xn
o Variável derivada Xd1 o Taxa de analfabetismo
o Variável derivada Xd2 o Relação de
Classificações:
- Para converter
descritivos
alfabéticos em
códigos
- Para organizar
modalidades de
variáveis
primárias ou
derivadas
9
Unidade estatística/Variável Comparabilidade
internacional
Exemplo
masculinidade
o Variável derivada Xd3 o Dimensão do aglomerado populacional
o Variável derivada Xd4 o Sector de actividade económica
o …
o Variável derivada Xdn
Unidade estatística Nn
o ……..
O conteúdo deste subcapítulo constitui o principal referencial de análise do conteúdo a incluir
nos questionários, bem como na estruturação dos apuramentos e indicadores a disponibilizar
no âmbito do programa de difusão.
4.1.3 Tipo de observação (directa e exaustiva, directa com amostragem, administrativa)
A produção de estatísticas oficiais pressupõe sempre que se recolham dados junto das várias
unidades estatísticas na base de um plano de acção que estabelece também a forma como se
determinam a escolha e o método de observação de cada unidade estatística que constitui o
respectivo universo.
Quando nos referimos à actividade estatística temos sempre por referência o termo
“universo”, porque o objectivo essencial de todas as operações estatísticas é medir e
caracterizar o universo de referência da respectiva operação, como podemos verificar nos
seguintes exemplos:
O universo de um censo da população e habitação, são todas as pessoas residentes
ou apenas presentes no país, bem como todas as construções destinadas à
habitação de pessoas (humanas);
O universo de um recenseamento às empresas de um país são todas as empresas
que existem no respectivo país;
O universo de um inquérito às famílias, são todas as famílias residentes no país;
O universo dos nascimentos num determinado ano, são todos os nascimentos
ocorridos no país nesse mesmo ano;
O universo das matrículas anuais no sistema de ensino são todas as escolas
incluídas nesse mesmo sistema (onde é suposto estarem todos os alunos
matriculados num determinado ano lectivo).
Assim, o universo estatístico de uma determinada operação estatística é independente da
forma como se decide observá-lo, mas condiciona fortemente os métodos de observação a
utilizar. Não se pode fazer um recenseamento da população todos os anos através do
UNIVERSOS
ESTATÍSTICOS
10
método da recolha de dados por entrevista directa, porque seria muito caro e complexo de
implementar. Mas já se pode fazer um recenseamento da população todos os anos se for
possível utilizar ficheiros administrativos que sejam fiáveis quanto à actualidade do seu
conteúdo e cobertura do respectivo universo. Há vários países do mundo que fazem um
recenseamento da população todos os anos.
Se o registo automóvel estiver actualizado, apesar da sua dimensão, nada impede que se faça
um recenseamento todos os anos com as características que estão definidas no respectivo
registo.
Se todos os nascimentos forem devidamente registados no registo civil, nada impede que se
faça um recenseamento todos os anos sem qualquer complicação estatística desde que sejam
recolhidos os respectivos dados junto das conservatórias do registo civil.
Contudo, como nem todos os registos funcionam adequadamente ou nem sequer recolhem
muitas vezes os dados estatísticos necessários à actividade estatística, opta-se por realizar
inquéritos por amostragem.
Mas o objectivo maior da amostragem é exactamente o de medir e caracterizar o universo
estatístico de referência através da observação de uma parte reduzida desse mesmo universo.
Para isso, essa parte do universo deve ser escolhida segundo critérios científicos que garantam
a representatividade do respectivo universo.
Então, que tipos de observação estatística podemos considerar?
Directa e exaustiva: neste tipo de observação todas as unidades estatísticas são
observadas/inquiridas directamente, seja por entrevista directa ou por
autopreenchimento dos questionários; são exemplos os recenseamentos, desde os
mais complexos e de larga visibilidade pública, como é o caso da população; ou os
que passam despercebidos do público e são realizados anualmente, como é o caso
das matrículas e do aproveitamento escolar no sistema de ensino, as doenças de
declaração obrigatória no sistema de saúde, o registo e abate de embarcações de
pesca, ou as dormidas no sistema hoteleiro.
Directa com amostragem: neste tipo de observação utiliza-se uma amostra de
unidades estatísticas que são representativas do universo em causa e cujos dados
são recolhidos directamente, seja por entrevista directa ou por
autopreenchimento; este procedimento amostral pressupõe que existe uma base
de selecção da respectiva amostra, que pode ser de natureza areolar (com base
numa selecção de áreas do território e posterior selecção de unidades estatísticas)
ou com base em ficheiros administrativos previamente organizados para a
extracção de amostras; os exemplos mais correntes são o Inquérito ao Emprego,
cuja amostra é de tipo areolar e o Inquérito Harmonizado à Empresa cuja amostra é
retirada do Sistema Geral de Entidades (SGE) no qual estão os dados actualizados
de todas as empresas existentes no país, num determinado momento.
Administrativa: neste tipo de observação, utilizam-se apenas os dados
administrativos para produzir informação estatística; a recolha dos dados
Todas as unidades
estatísticas existentes no
universo são observadas
directamente
Amostras areolares –
Inquérito ao Emprego
Amostras extraídas
de ficheiros
administrativos - SGE
11
administrativos pode ser feita através da utilização directa dos dados existentes
nos ficheiros, sempre que estes estão disponíveis em suporte electrónico, ou por
via da recolha de dados específicos existentes em registos em suporte de papel;
são exemplos os dados das importações que o INE recebe das Alfândegas em
suporte digital e os dados sobre nascimentos, óbitos e casamentos registados nas
Conservatórias do Registo Civil que o INE recolhe através de instrumentos
específicos em papel porque ainda não tem acesso aos respectivos ficheiros
electrónicos.
Quando se concebe uma operação estatística é fundamental ter em atenção o tipo de observação
estatística que vai ser feita e descrevê-la tão objectivamente quanto possível. Existem
condicionamentos importantes que derivam do tipo de observação e dos ficheiros que são utilizados,
como a actualidade, o acesso a suportes adequados do respectivo ficheiro e até mesmo o
relacionamento institucional para aceder aos ficheiros necessários à operação estatística.
4.1.4 Desenho de questionários
Os questionários estatísticos são instrumentos que se destinam a recolher dados de uma forma clara e
facilitadora do relacionamento com o respondente. Daí que a estruturação e redacção das perguntas
devem ser orientadas para facilitar a compreensão por parte das pessoas, seja por via da entrevista
directa, seja por via do autopreenchimento.
Assim, os questionários estatísticos são compostos por um conjunto de perguntas, ordenados segundo
uma sequência que deve induzir um processo de resposta consistente e facilitador da resposta. Para
conseguir estes objectivos, há 3 regras fundamentais a ter em conta:
Compreensão, no sentido de que devem ser utilizados termos que sejam acessíveis e
delimitem claramente o objectivo da pergunta; perguntar a uma pessoa que trabalha
numa empresa qual é a sua actividade económica, é mais impreciso e complicado do
que perguntar-lhe qual é a actividade económica da empresa onde trabalha; por vezes
pode até ser necessário adicionar uma pergunta do tipo “O que faz a empresa onde
trabalha?”; já para as pessoas que trabalham individualmente, pode ser mais simples
porque as tarefas que executam podem ser mais facilmente referenciáveis a uma
actividade económica maioritária;
Capacidade de resposta por parte do respondente, no sentido de que os dados a
recolher devem ser de acesso fácil para o respondente; não se deve perguntar a uma
criança de uma determinada família quais são as despesas que a família realiza
durante uma semana … porque obviamente não são as crianças que tratam desses
assuntos; não se deve perguntar a um operário de uma empresa qual é o volume de
negócios da empresa onde trabalha;
Relação entrevistador-entrevistado; a sequência das perguntas de um questionário
deve deixar para o fim as perguntas mais exigentes, em termos de resposta, no sentido
de ganhar primeiro a confiança do respondente; começar a recolha de dados de uma
Experiências específicas da
área administrativa:
Importações;
acontecimentos
demográficos registados
(universo diferente do real,
devido a falhas no registo)
Perguntas precisas
e perceptíveis pelo
respondente
Perguntas
adequadas aos
conhecimentos do
respondente
Perguntas
organizadas para
ganhar a confiança
do respondente
12
família com uma pergunta sobre o seu rendimento, não é a melhor opção para
estruturar o conteúdo do respectivo questionário; assim, deve começar-se por
questões de outra natureza, como a explicação dos objectivos do inquérito e
perguntas menos invasivas da privacidade individual como a idade, sexo, profissão,
etc.
Os questionários estatísticos são compostos por perguntas que podem ser classificadas segundo 3
tipos:
Pergunta fechada, na qual todas as hipóteses de resposta estão pré-codificadas; estas
perguntas são muito eficazes na recolha de dados porque não têm necessidade de
codificação ou da interpretação da escrita, como se pode ver no exemplo seguinte:
Pergunta aberta, na qual se pode escrever a resposta de forma individualizada; estas
perguntas são as mais trabalhosas em termos estatísticos porque necessitam de
interpretação da escrita e codificação do respectivo conteúdo, como se pode ver no
exemplo seguinte:
Pergunta semi-aberta (ou semi-fechada); neste tipo de perguntas procura-se
aproveitar as vantagens de ambos os anteriores tipos de perguntas, no sentido de
garantir a pré-codificação para situações muito frequentes e economizar espaço do
questionário para situações menos frequentes, como pode ver no exemplo seguinte:
13
4.1.5 Operações experimentais
As operações experimentais são elementos absolutamente fundamentais à preparação de qualquer
operação estatística. A actividade estatística está tão sujeita a procedimentos de experimentação
como qualquer outra porque o risco de erros nesta actividade é muito elevado.
Uma operação estatística é composta por várias componentes: questionários, método de recolha,
sistema de formação, modelo organizativo do trabalho no terreno, registo e tratamento dos dados.
Todas as componentes da operação estatística devem ser objecto de experimentação de modo a
garantir o funcionamento integrado das várias componentes.
Existe uma operação experimental específica para o conjunto da operação, mas deve haver a
preocupação de fazer uma experimentação sempre tão integrada quanto possível.
Assim, as operações experimentais são tipificadas de acordo com o seguinte:
- Testes, orientados sobretudo para experimentar determinadas componentes da operação,
com especial destaque para os questionários, estrutura do terreno, etc. Normalmente, o
primeiro teste a realizar é dos questionários e respectivas instruções, tendo em conta que se
trata de um instrumento que condiciona todos os procedimentos técnicos seguintes, desde a
formação das pessoas até ao sistema de tratamento de dados e difusão de resultados.
Antes de passarem para as operações experimentais no terreno, tanto os questionários como
as instruções podem ser testadas “em laboratório” constituído por pessoas da respectiva
instituição com níveis de instrução diferentes. Esta primeira fase de testes internos, embora
não permita evitar os testes de campo, pode trazer importantes sugestões de melhoria antes
de passar aos testes de terreno que são muito mais difíceis e custosos.
Deve-se aproveitar os testes também para ir testando outras componentes críticas da
operação como a organização do trabalho de campo, os modelos de formação e os modelos e
valores de pagamento das pessoas que trabalham no campo. Estes aspectos também serão
devidamente testados no inquérito-piloto mas, por vezes, as conclusões do inquérito-piloto já
podem aparecer tardiamente, nomeadamente para fazer alterações orçamentais.
- Inquérito-piloto: o inquérito-piloto é sempre a última operação experimental e deve ser
realizado em condições tão semelhantes quanto possível às da operação final. Algumas
recomendações internacionais apontam para que seja realizado um ano antes da data prevista
para a operação definitiva, como é o caso dos recenseamentos da população e habitação.
O inquérito-piloto é um ensaio geral da operação e, como tal, deve ser organizado para
experimentar o funcionamento de toda a estrutura prevista, na perspectiva de que deve
abranger todos os procedimentos que vão desde os trabalhos de campo até ao tratamento e
difusão dos resultados.
4.1.6 Legislação específica
Algumas operações estatísticas têm necessidade de legislação específica porque a sua
execução necessita de procedimentos que, por vezes, não fazem parte dos procedimentos
habituais nas operações estatísticas.
Aumentar os
conhecimentos
e ganhar
confiança!
Ensaio geral,
onde se
experimentam
todas as
componentes da
operação
Experimentação
… passo a passo!
Mas com
regularidade pré-
determinada!
14
Alguns destes procedimentos podem estar relacionados, por exemplo, com o envolvimento
“obrigatório” de estruturas regionais e locais para as quais o INE não tem autoridade para “dar
ordens”.
Noutros casos é necessário organizar procedimentos administrativos, nomeadamente
relacionados com a organização financeira em termos administrativos mais “fluentes” do que
os procedimentos habituais. Em operações mais complexas e com forte intervenção de
pessoas contratadas a nível regional e local, é necessário garantir procedimentos de
pagamento “a tempo e horas”.
Assim, para garantir que os procedimentos necessários sejam assumidos por todas as
entidades visadas, sem conflitos de responsabilidades, prepara-se legislação específica que
organiza e determina o envolvimento das estruturas em causa, nomeadamente reorganizando
os procedimentos administrativos.
Um outro efeito colateral da legislação específica, é o facto de dar maior importância e
visibilidade à operação em causa, em relação às restantes.
4.1.7 Organização de ficheiros
Há operações estatísticas do tipo recenseamento cuja abordagem no terreno tem
condicionantes completamente diferentes.
Num recenseamento da população, todas as áreas povoadas do território têm de ser cobertas
e não existe outra alternativa para o fazer, na ausência de ficheiros administrativos de
qualidade.
Num recenseamento de empresas torna-se muito difícil e até impraticável andar a cobrir
todo o território à procura das empresas que possam existir em cada pequena área do
território.
Assim, determinadas operações estatísticas necessitam de utilizar ficheiros administrativos
para organizarem e dimensionarem os trabalhos de campo, ou para extrair amostras para
realizar inquéritos por amostragem no universo de referência.
Normalmente o problema mais importante não se coloca no acesso aos referidos ficheiros,
mas sim na qualidade e actualidade do seu conteúdo.
Há uma característica sempre presente e praticamente inevitável nos ficheiros administrativos
e que é a seguinte: os ficheiros administrativos são construídos para “legalizar” a existência de
uma determinada entidade (empresa, pessoa, edifício, alojamento, viatura, etc); por isso a
principal preocupação desses ficheiros é garantir a existência legal dessa entidade, sempre que
algum procedimento administrativo (inspecção, identificação, abertura de uma conta bancária,
voto eleitoral, etc) necessita dessa informação. Assim, há sempre muito mais preocupação no
registo dessas entidades do que no seu abate, sempre que deixam de existir. Esta situação
resulta fundamentalmente da inexistência de procedimentos eficazes de controlo das
entidades que estão efectivamente activas, porque existe desinteresse dessas entidades em
reportarem a situação real à estrutura administrativa e a estrutura administrativa raramente
Clarificação de
responsabilida
des, de
direitos e
obrigações
Ficheiros
desactualizados
devido a registos
indevidos,
desactualizados
ou de cobertura
limitada
15
tem condições para garantir um controlo permanente sobre o stock dos registos. Em resumo,
normalmente é muito mais fácil entrar num ficheiro administrativo, do que sair dele!
Obviamente que temos estado a abordar o sector estruturado da economia (entidades
registadas e com existência legal)! Quando se pretende abordar o sector informal da economia
(“empresas” familiares não registadas, prestadores individuais de serviços, etc), os
procedimentos implicam, quase sempre, a realização de inquéritos com base em amostras
areolares.
Um ficheiro cheio de entidades inexistentes constitui um esforço adicional muito considerável
nos trabalhos de campo e pode criar enviesamentos muito significativos na extracção de
amostras.
Deste modo, qualquer operação estatística que tenha necessidade de utilizar ficheiros
administrativos tem de reservar um tempo e um conjunto adequado de procedimentos para
verificar a qualidade do referido ficheiro. Por exemplo nas empresas, pode utilizar-se o
controlo fiscal e os pagamentos à segurança social, no sentido de verificar se uma determinada
empresa está ou não a pagar impostos ou contribuições para a segurança social e há quantos
anos. Este trabalho de verificação centralizada pode garantir uma diversificação de
procedimentos no terreno, como evitar andar indefinidamente à procura de uma empresa ou
estabelecimento que já não existe, por vezes há dezenas de anos.
4.1.8 Organização dos trabalhos de campo
A organização dos trabalhos de campo assume sempre uma importância muito grande, na
medida em que é um factor determinante da qualidade da operação estatística, tanto nos
aspectos qualitativos relacionados com a cobertura e a fiabilidade da informação recolhida,
como da percepção dos utilizadores que são também respondentes. Muitas vezes, a lógica de
raciocínio das pessoas num recenseamento é: eu não fui recenseado, logo o trabalho está
mal feito! É necessário desmistificar isto mas, antes de tudo, é necessário garantir que o
trabalho de campo não tem falhas graves.
Esta organização tem sempre a ver com estruturas organizativas do país e pessoas, pelo que os
procedimentos habituais implicam definir categorias de responsabilidade e responsabilidades
específicas.
As categorias de responsabilidade (Coordenador Nacional, Coordenador Provincial, Municipal
ou Comunal) devem ter sempre associadas as respectivas funções tendo como referência o
seguinte:
Quem responde pela responsabilidade organizativa e envio de informação de controlo
em cada nível?
Quem responde pelo controlo dos custos e dos pagamentos a cada interveniente?
Quem responde pela formação dos intervenientes em cada nível da organização?
Sector estruturado
versus sector
informal da
economia
Momento
adequado e
tempo suficiente,
para analisar e
melhorar os
ficheiros
administrativos
necessários a uma
operação
estatística
Quem faz:
O quê?
Quando?
Como?
No terreno!
16
Quem responde pela organização da recolha de dados e envio do material recolhido
para o respectivo centro de tratamento de dados, em cada nível da estrutura
organizativa?
Quem recolhe os dados em cada nível?
Quem faz os pagamentos e com que instrumentos de controlo?
Numa operação estatística complexa e de grande dimensão quantitativa e geográfica, é
fundamental conseguir ter uma organização descentralizada, mas muito bem hierarquizada e
coordenada a nível central.
4.1.9 Sistema de registo e tratamento de dados
O registo e o tratamento dos dados são das tarefas mais críticas de uma operação estatística.
Se a recolha de dados no terreno é a fase dos trabalhos que tem mais visibilidade pública, o
registo e tratamento dos dados são as que “apanham” com todas as falhas no trabalho que
vem do terreno e onde será necessário encontrar soluções para que toda a informação fique
coerente.
Enquanto o tratamento de dados tem de ser feito em todas as operações estatísticas, o registo
de dados centralizado ou descentralizado apenas se aplica nas situações em que são utilizados
questionários em papel. Quando a recolha de dados é feita por via electrónica (ficheiros
administrativos, recolha presencial ou telefónica com computadores portáteis, internet), não
há necessidade de registo e até mesmo o tratamento é bastante mais simples, porque muitas
regras de validação podem ser inseridas no acto da recolha de dados.
Hoje em dia, sempre que há questionários em papel, para fazer o registo dos dados já existem
sistemas de leitura óptica bastante eficientes e que constituem uma alternativa consistente ao
registo manual, pelas seguintes razões:
Em vez de “dois olhos + dois braços + uma cabeça pensante” multiplicados pelo
número de pessoas que fazem o registo, temos apenas um “olho”,
independentemente do número de máquinas e uma única “cabeça pensante” que
aplica as mesmas regras nas mesmas situações de reconhecimento;
Em vez de uma larga quantidade de pessoas que necessitam de ser organizadas e
motivadas para garantir padrões adequados de produtividade e qualidade, temos um
número bastante reduzido de pessoas a trabalhar com máquinas (que não necessitam
de ser motivadas); estas máquinas podem trabalhar 24 horas por dia e manter os
padrões de produtividade e qualidade;
Tudo isto se deve hoje aos equipamentos de leitura óptica bastante eficientes e
produtivos, e a um conjunto de “softwares” a que se dá o nome de “motores de
reconhecimento” que podem ser programados para diferentes níveis de confiança da
informação que reconhecem.
Transformar os
dados
provenientes de:
Questionários em
papel
Ou
De outros suportes
Em dados
electrónicos e
consistentes
Registo manual ou
electrónico?
Muitas centenas de
olhos, braços e
"cabeças pensantes”
no registo manual
Apenas um olho e
uma cabeça
pensante no registo
electrónico/leitura
óptica
17
Obviamente que, apesar do elevado nível tecnológico disponível, ainda existem situações que
escapam e devem ser resolvidas pelos humanos, devido à sua complexidade. Contudo, trata-se
sempre de um residual de situações que constitui uma ínfima parte do trabalho. Tudo o que é
“maçudo”, “repetitivo” e automatizável, fica para a máquina e constitui a maior parte do
trabalho.
Tanto o registo como o tratamento de dados são efectuados “sob a vigilância” de um conjunto
de regras de validação. As regras de validação não são mais do que normas (algoritmos) que
definem o que se deve fazer numa situação em que é digitado um dado que não está previsto
ou que é incoerente com outro referente normalmente à mesma unidade estatística; ou
mesmo quando uma determinada pergunta que devia ter resposta não a tem. Estas regras
também controlam o tipo de preenchimento de cada campo, no sentido de determinar se o
que lá foi inscrito corresponde ou não ao que lá deve estar:
o Se um campo é definido como alfabético, só lá podem estar letras;
o Se é definido como numérico, só lá podem estar números;
o Se é definido como alfanumérico, pode ter números e letras.
Assim, temos regras de validação dos seguintes tipos:
Regras de domínio, aquelas que validam o conjunto de valores possíveis de
uma variável; os valores possíveis de uma variável são os que identificam a
resposta a cada modalidade; se, por exemplo, na variável sexo a modalidade
masculino está pré-codificada com 1 e a modalidade feminino está com 3,
não pode aparecer uma modalidade com 2;
Regras de coerência, aquelas que validam a consistência dos conjuntos de
valores de duas ou mais variáveis; por exemplo, uma criança com 5 anos de
idade, não pode ser casada na variável estado civil;
Regras de estrutura, aquelas que validam a dimensão e o tipo de dados
(formato) de uma variável; a dimensão e o tipo de formatos são
características pré-determinadas para cada campo que vai ser preenchido;
por exemplo, se o campo do ano de nascimento apenas pode ter 4 dígitos e
aparecerem 5, existe um erro de estrutura, porque a dimensão é superior à
possível; se um campo tem formato numérico, significa que não podem
aparecer letras.
Há também uma terminologia estatística corrente bastante importante quanto à classificação
de cada tipo de regras: fatais e de aviso. Estas regras são sobretudo importantes nas fases do
trabalho que antecedem as correcções automáticas (correcções realizadas sem a intervenção
de qualquer operador).
As regras fatais, tal como o nome indica, nunca poderão ser ultrapassadas sem que os dados
em causa sejam alterados para ficarem aceitáveis.
As regras de aviso são apenas alertas que podem ser programados para um único alerta ou
uma sequência de alertas (aparecer mais do que uma vez, por exemplo).
Os “polícias
electrónicos”
da consistência
estatística
18
Apesar do grande desenvolvimento dos sistemas de regras de validação automática, ainda
existem situações que podem ser mais facilmente corrigidas através do recurso a validação
manual (através do operador), porque a alternativa automática pode exigir regras bastante
complexas. Por exemplo o sexo em branco com indicação do nome, é mais fácil de corrigir
manualmente do que através de regras automáticas.
O sistema de regras de validação, sobretudo no que se refere às regras de coerência, dispõe
actualmente de modelos de decisão de natureza determinística (correcção pré-determinada) e
probabilística (correcção que depende de uma matriz que é alimentada por valores dos
registos semelhantes e que são utilizados para corrigir respostas ou preencher respostas que
estão em branco). Estes sistemas aumentam muito a capacidade de correcção e imputação de
dados e não introduzem alterações muito significativas no conteúdo da informação estatística
que está a ser objecto de tratamento.
O sistema de correcções automáticas mais conhecido a nível internacional é o de correcções
determinísticas e “hot deck”, concebido por dois estaticistas canadianos (Fellegi e Holt) em
1976. Este sistema estabelece um conjunto básico de regras que avaliam o conteúdo das
respostas em função da coerência de cada variável com variáveis relacionadas.
Imputações determinísticas - Este tipo de método envolve o recurso a informação de outras
variáveis de forma a determinar a resposta à variável em falta ou incoerente. É baseada na
metodologia “if – then” com base em regras pré-estabelecidas. Por exemplo, se a idade já está
dada como certa e é inferior a 16 anos, o indivíduo não pode ter um curso superior no nível de
ensino.
Imputação por Hot-deck – Este é um método de imputação dinâmica, cuja atribuição de
valores é realizada de acordo com as respostas encontradas para a última unidade estatística
com características semelhantes e relevantes para a imputação em causa. Estas características
semelhantes são o que designamos por variáveis de restrição, ou seja, as condições que devem
ser iguais para que o valor constante nessa outra unidade estatística seja utilizado.
Assim, no caso que vimos anteriormente da criança com 5 anos que é também casada, o
sistema pode verificar outras variáveis como o nível de instrução, a actividade económica, etc
e se verificar que há apenas uma variável incoerente num conjunto alargado de outras
variáveis, faz a correcção com menor impacto. Se a criança supostamente de 5 anos tiver
indicação de nível de ensino elevado, profissão, ramo de actividade económica e até uma
relação de parentesco de cônjuge, muito provavelmente o erro está apenas na idade.
Um outro aspecto muito importante no tratamento de dados, imediatamente após a
conclusão do processo das validações e antes de chegar aos apuramentos, sob a forma de
quadros ou de indicadores, é a especialização dos registos. Cada unidade estatística, para
além das respostas com base nas variáveis primárias, pode beneficiar muito dos
procedimentos de tratamento se passar a ter um conjunto de informação que a classifica com
a respectiva categoria de uma variável derivada. Por exemplo a variável derivada “população
segundo o sexo e a dimensão dos aglomerados populacionais” apura-se muito mais facilmente
se, para além do sexo, existir uma classificação de cada registo individual com a classificação
Correcções
automáticas,
através dos
modelos
determinístico e
“hot deck”
A criança
casada que
pode não ser
criança
Especializar os
registos … para
tornar mais
fáceis e seguros
os apuramentos
19
do aglomerado populacional onde reside. Caso contrário é necessário estar a construir um
algoritmo muito mais complexo, de cada vez que se pretende fazer um apuramento deste tipo.
Nas operações estatísticas cuja recolha e tratamento de dados se baseia em procedimentos de
amostragem, é necessário fazer a extrapolação dos dados da amostra para o universo. Este
processo de extrapolação deverá ser feito com um conjunto de ponderadores que permitem
garantir que um determinado dado da amostra seja multiplicado por um factor que representa
o seu “peso” no respectivo universo. Por exemplo se uma determinada amostra representa
10% do universo, a extrapolação significa que os respectivos valores devem ser multiplicados
por 10, para corresponderem aos valores do universo.
4.1.10 Controlo e avaliação da qualidade
O controlo e a avaliação da qualidade são procedimentos fundamentais nas operações
estatísticas, pelas seguintes razões: qualquer operação está sujeita a erros e os utilizadores são
cada vez mais exigentes quanto à “demonstração” da qualidade dos dados que o SEN
disponibiliza.
Existem dois conjuntos de procedimentos para controlar e avaliar a qualidade dos dados
estatísticos:
Controlos dos procedimentos de recolha, tratamento e análise dos dados;
Inquéritos autónomos de cobertura/qualidade
4.1.10.1 Controlos dos procedimentos de recolha, tratamento e análise dos dados
Nos controlos dos procedimentos, o objectivo essencial consiste organização de um conjunto
de instrumentos que permitam controlar a execução da recolha de dados tanto em relação à
quantidade como à qualidade.
Por exemplo a verificação da cobertura em cada área pode fazer-se através da quantidade de
unidades estatísticas estimadas e efectivamente observadas ao longo do processo; já na
verificação do conteúdo, deve analisar-se uma amostra do trabalho de cada entrevistador,
para verificar se os questionários estão correctamente preenchidos.
No controlo do tratamento dos dados, deve haver um controlo de “entradas e saídas” no
sentido de que a quantidade de unidades estatísticas registadas em cada nível geográfico seja
consistente com os valores que existem nos procedimentos de controlo do trabalho de campo,
para evitar perdas indevidas de unidades estatísticas. Nas regras de validação, hoje é
relativamente fácil introduzir contadores que permitem saber quantas vezes é que cada regra
“actuou” o que permite perceber o impacto das alterações decorrentes de cada regra.
Já quanto à análise dos dados, há procedimentos relativamente standardizados para algumas
áreas estatísticas, os quais permitem detectar as incongruências mais relevantes, para além
das análises comparativas do chamado “sobe e desce”. Assim, os métodos de análise imediata
podem ser do seguinte tipo:
Da amostra
para o
universo!
- Controlo de
“entradas e saídas”
- Contadores nas
regras de validação
Controlos de
cobertura e
conteúdo no terreno,
por amostra
20
Comparação dos dados mais recentes com os equivalentes imediatamente anteriores
ou com as séries temporais equivalentes no sentido de determinar se a variação
ocorrida é razoavelmente explicável; se um determinado valor sobe ou desce
desmesuradamente sem explicação consistente, é melhor investigar o que se passou
para trás; suponhamos que de um ano para o outro os dados estatísticos referentes às
exportações cresceram 50%, sem que algo relevante o justifique; estes dados devem
ser exaustivamente investigados antes de serem difundidos. Claro que este
procedimento apela sempre aos limites para accionar estas análises adicionais;
contudo estes limites devem fazer parte dos procedimentos de análise regular e não
são possíveis de determinar de igual forma para a generalidade das operações
estatísticas, dadas as especificidades de cada uma.
Um outro aspecto importante, tanto para a análise dos dados das operações
estatísticas não correntes como até para algumas correntes, é a recolha da percepção
que alguns utilizadores têm dos resultados; por vezes os valores sobem e descem mais
por falhas de resposta do que por alterações efectivas na realidade que está a ser
medida. Há, frequentemente, indicadores associados que não suportam os resultados
estatísticos obtidos e que podem ser utilizados para os descredibilizar. Por exemplo,
as associações profissionais da pesca confirmam as quebras ou os aumentos de
pescado? As quebras de pescado correspondem a falhas no abastecimento? As
empresas de construção e o consumo de aço e cimento são coerentes com a
actividade da construção medida pelas respectivas estatísticas? Os actos médicos
praticados nos hospitais reflectem a actividade efectiva das unidades de saúde em
causa? Os números de alunos matriculados no sistema de ensino, nos vários níveis da
desagregação geográfica, são coerentes com os rácios professores/alunos e com as
taxas de escolaridade, tanto brutas como líquidas?
Nalgumas áreas estatísticas, como é o caso da demografia, há mesmo indicadores de
referência que reflectem a qualidade dos dados de uma forma bastante consistente; a
relação de masculinidade nos nascimentos não pode afastar-se significativamente do
valor que toma como referência o facto de nascerem 105 meninos por cada 100
meninas, sob pena dos dados não serem considerados fiáveis; os índices de Wipple,
de irregularidade e combinado das Nações Unidas, bem como a equação da
concordância têm valores esperados que avaliam a qualidade dos dados
demográficos, sobretudo nas componentes da população por idade e sexo e sobre a
população total. Estes índices estão amplamente estudados e são “ferramentas”
muito eficazes sobretudo na verificação das variáveis idade e sexo.
Este conjunto de procedimentos permite seguramente identificar os principais problemas
decorrentes da análise dos dados e garantir uma consistência acrescida da sua qualidade.
4.1.10.2 Inquéritos autónomos de cobertura/qualidade
Os inquéritos autónomos de cobertura/qualidade, são operações estatísticas que visam avaliar
a qualidade com base numa segunda observação, relativamente desfasada no tempo e na
organização, mas mantendo a mesma referência temporal da operação original.
“Sobe e desce”
A consistência dos
dados
“confrontada”
com indicadores
externos
Utilização de índices
de consistência,
específicos da área
estatística
21
Assim, trata-se de duas operações estatísticas em que o objectivo da segunda é exactamente
avaliar a qualidade dos dados da primeira.
São inquéritos executados no terreno com base numa amostra de unidades estatísticas que foi
extraída com base no trabalho original e na qual vai ser realizada uma nova observação, por
pessoas diferentes e que não conhecem os dados iniciais, para além da identificação das
unidades estatísticas. Esta identificação visa garantir que as comparações dos dados
(matching) são feitas com a melhor precisão possível.
Estes inquéritos permitem a análise da cobertura e do conteúdo das unidades estatísticas
observadas, tomando como referência as duas observações efectuadas em cada unidade.
As diferenças verificadas tanto na cobertura como no conteúdo são assumidas sempre como
erros da operação inicial. Este pressuposto parte do princípio que os dados recolhidos no
âmbito do inquérito de cobertura/qualidade/pós censitário são sempre de melhor qualidade
do que os da operação que está a ser avaliada.
No quadro a seguir podemos verificar como são organizados os dados para avaliar a cobertura
e o conteúdo:
Operação estatística inicial
Inquérito de qualidade
Resultado
Avaliação da cobertura
Unidade estatística A Existe Existe Sem erro de cobertura
Unidade estatística B Não existe Existe Com erro de cobertura “por
defeito”
Unidade estatística C Existe Não existe Com erro de cobertura “por
excesso”
Avaliação do conteúdo
Profissão da unidade estatística A (Indivíduo)
Pedreiro Pedreiro Sem erro de conteúdo
Profissão da unidade estatística B (Indivíduo)
Pedreiro Padeiro Com erro de conteúdo
Enquanto a cobertura procura averiguar sobretudo se a unidade estatística em causa foi ou
não observada na operação original, o conteúdo visa sobretudo verificar se as variáveis de
cada unidade estatística foram ou não observadas de forma igual, em ambas as operações
estatísticas.
De relevar que estes inquéritos autónomos, para medir a qualidade dos dados de uma
operação estatística, podem ser utilizados em qualquer operação estatística com recolhas de
dados no terreno. O facto de se chamarem pós-censitários em muitas situações não significa
que possam ser feitos apenas em operações censitárias.
A QUALIDADE:
- Da cobertura
- Do conteúdo
22
4.1.11 Publicidade
A publicidade é uma forma de levar ao conhecimento das pessoas a existência de um
determinado produto ou serviço. Devido à sua frequência, as pessoas estão mais habituadas
ao modelo de publicidade comercial cujo objectivo é levá-las a consumir o produto ou serviço
decorrente dessa publicidade.
Na actividade estatística, a publicidade tem em vista, sobretudo, objectivos de natureza
informativa e didáctica e deve ser trabalhada nessa perspectiva.
Uma boa campanha publicitária tem efeitos muito positivos, directos e indirectos, sobretudo
no decorrer dos trabalhos de campo, dado que, ao levar uma operação estatística ao
conhecimento do público, permite atingir os seguintes objectivos gerais:
Anula o factor surpresa que, normalmente, é prejudicial nestas operações
Permite criar nas pessoas a predisposição para a resposta
Pode proporcionar uma explicação antecipada sobre a operação que se vai realizar
Atribui, à operação, interesse nacional
Dá maior importância ao nome da instituição que a executa
Assim, a escolha dos meios publicitários a utilizar está relacionada com os públicos-alvo que
tanto podem ser empresas como a população em geral, ou apenas alguns estratos da
população, como por exemplo a população escolar. Quando se trata de estratos específicos da
população, os meios a utilizar são mais orientados para os locais onde esses estratos se
encontram. Por exemplo, se o objectivo é atingir a população escolar, talvez seja melhor ir às
escolas do que estar a privilegiar meios de cobertura nacional ampla e de elevados custos
como é o caso da televisão.
Um outro aspecto muito importante, é que a preparação de uma campanha publicitária já
exige conhecimentos muito específicos. Assim, é melhor entregar o trabalho a quem sabe, que
são as agências publicitárias, sobretudo para publicidade à escala nacional.
4.1.12 Cartografia
A cartografia e a estatística são actividades com cada vez maiores afinidades, tanto nos
procedimentos de produção, como de difusão estatística. A difusão estatística é cada vez mais
geoinformação e cada vez menos números desagregados com base numa classificação
administrativa simples, como é o caso das desagregações geográficas descritivas (Província de
….Município de … etc).
Por isso, a produção e difusão de informação estatística deve apoiar-se numa estrutura
cartográfica desenhada e estruturada especificamente para apoiar a actividade estatística. Esta
importância é tal que, nalguns países, a actividade estatística e cartográfica estão sedeadas na
mesma instituição. Quando isso não acontece, o relacionamento institucional entre as
Estatística e
Cartografia:
uma união
quase
perfeita!
23
diferentes instituições é muito estreito, sobretudo para a realização de algumas operações
estatísticas mais complexas, como é o caso do recenseamento da população.
Assim, a função da cartografia na actividade estatística é um elemento determinante em duas
subactividades: trabalhos de campo e difusão estatística.
4.1.12.1 A cartografia no apoio aos trabalhos de campo
A função da cartografia nos trabalhos de campo pode sintetizar-se nos seguintes objectivos:
Evitar a existência de áreas não cobertas;
Evitar a dupla cobertura de áreas de trabalho;
Georreferenciar as unidades estatísticas.
Os dois primeiros objectivos são dos “primórdios” da ligação entre a cartografia e actividade
estatística; foram sobretudo desenvolvidos por via da actividade estatística censitária
relacionada com a população e a habitação e ainda hoje têm uma função crucial na garantia da
qualidade da actividade censitária. Tanto a subcobertura como a sobrecobertura de áreas do
território são problemas bastante complexos tanto de garantir como de verificar, embora
aparentemente um (sobrecobertura) pareça mais fácil de resolver do que o outro.
O terceiro objectivo passou a ter uma importância ainda maior com os desenvolvimentos
tecnológicos ocorridos mais recentemente; este “ganho” de importância decorre do
desenvolvimento dos Sistemas de Informação Geográfica (SIGs) e da cartografia digital, que se
transformaram numa ferramenta extremamente potente para o tratamento e difusão
estatística.
Como se pode verificar na imagem a seguir, cada edifício contem um número de identificação,
devidamente enquadrado na imagem e no sistema e no sistema de codificação de cada edifício
existente no terreno. Incluindo a identificação administrativa e estatística
(Distrito/Município/Freguesia/Secção Estatística/Subsecção Estatística/Edifício).
24
Exemplificando: a identificação nacional do edifício 012 da subsecção, delimitada na parte de
baixo da figura, assume automaticamente o seguinte código até edifício: 11062303002012.
Os alojamentos, as famílias e os indivíduos são integrados neste sistema de codificação de
acordo com as seguintes regras:
o Os alojamentos são numerados, sequencialmente e dentro de cada edifício, de 01-99;
o As famílias são numeradas, sequencialmente e dentro de cada alojamento, de 01-99;
o Os indivíduos são numerados, sequencialmente e dentro de cada família, de 01-99;
Deste modo este sistema permite georreferenciar todos os indivíduos de uma forma integrada
e de acordo com a sua localização até ao pormenor mais fino da habitação.
Este sistema de georreferenciação pode ser aplicado a toda a actividade estatística, desde a
recolha de dados até aos estudos de pormenor, uma vez que todas as unidades estatísticas
(empresas, estabelecimentos, veículos, etc), localizadas no terreno em função de um
determinado endereço, podem ser observadas com base neste mesmo modelo de
georreferenciação.
Normalmente, existe cartografia oficial que delimita as áreas administrativas, mas o principal
problema da actividade estatística é que essas delimitações estão bem identificadas na
Da cartografia
analógica ao
SIG: um salto
enorme para a
produção e difusão
estatística!
25
cartografia mas, quando se chega ao terreno, ou estão desactualizadas, porque já ocorreram
alterações na ocupação do solo ou são muito difíceis de localizar. Com cartas de média e
pequena escala (escalas com denominador superior a 10.000) ou de baixo nível de resolução
na cartografia digital, os problemas de delimitação são bastante imperceptíveis, pelo que as
delimitações são mais fáceis sobre a cartografia, mas muito mais difíceis de aplicar no terreno,
sobretudo quando se trata de resolver delimitações de pormenor que não sejam suportadas
por acidentes de terreno bem visíveis.
Por outro lado, muita da actividade estatística, como é o caso da censitária, necessita de
delimitar áreas a um nível geográfico inferior ao administrativo, como é o caso das secções
estatísticas; nestes casos, é imprescindível o suporte cartográfico de grande escala e a
utilização de acidentes de terreno, facilmente identificáveis localmente. Nem sempre é
possível fazê-lo com o rigor adequado. Por isso os problemas de sub e de sobre-cobertura.
Assim, as principais funções da cartografia, no apoio dos trabalhos no terreno, podem
sintetizar-se nos seguintes pontos:
-Garantia de qualidade da cobertura;
-Delimitação das áreas de actuação de cada entrevistador;
-Orientação dos entrevistadores no processo de observação das unidades
estatísticas;
-Referenciação dos limites administrativos;
-Demarcação das áreas de observação dentro de cada unidade administrativa de
base;
-Referenciação de cada unidade estatística a um determinado ponto da localização
geográfica;
-Extracção de áreas para reobservação, com vista a efectuar controlos areolares de
qualidade.
Claro que uma boa cartografia não evita todos os problemas de sub e sobrecobertura, mas
ajuda a preveni-los. Alguns dos problemas descritos anteriormente podem decorrer também
de um trabalho local mal executado, mas isso tem mais a ver com a competência dos
intervenientes locais do que com a cartografia.
4.1.12.2 A cartografia como suporte da difusão estatística
A informação estatística difundida sob a forma georreferenciada representa um ganho
significativo sobre os antigos modelos de quadros alfanuméricos, porque associa a informação
a uma geografia específica. Por outro lado permite processos de selecção e tratamento de
dados com representação gráfica muito mais atraente e de fácil leitura para os utilizadores.
26
Ou, uma outra forma de organizar a informação estatística de acordo com uma escala:
Das estatísticas
clássicas
(números)
À geoinformação
(números
georreferenciado
s)
27
Ou ainda, com uma escala, um gráfico de distribuição das unidades administrativas e a evolução entre
dois momentos temporais:
A visão de conjunto da evolução desta mesma área entre os dois momentos é muito mais
completa e sugestiva por via do cartograma do que através de uma quadro numérico onde
nem sequer é possível localizar as “vizinhanças” das respectivas áreas.
4.1.13 Princípios da orçamentação da actividade estatística
O orçamento de uma operação estatística é sempre um elemento crítico, devido ao facto da
maioria das operações estatísticas serem de duração plurianual e dependerem de fundos
públicos que devem ser adequadamente enquadrados pelo Orçamento Geral do Estado em
cada ano. Assim, para operações estatísticas mais complexas, como é o caso do censo da
população, é necessário ter um quadro de referência relativamente seguro e experimentado
para determinar valores consistentes com o trabalho que cada actividade implica.
Os custos de uma actividade estatística podem estruturar-se de acordo com o seguinte:
Custos directos de pessoal: são custos que decorrem da contratação de pessoal, tanto
do quadro como contratado especificamente para a operação específica; de notar que
estes custos normalmente implicam também custos adicionais para o empregador,
como é o caso da segurança social, os quais devem ser incluídos neste processo de
orçamentação; estes custos devem excluir os custos de pessoal que é pago através de Tipos de custos
28
aquisições de serviços, como é o caso de entrevistadores recrutados especificamente
para recolher dados;
Outros custos directos: são todos os custos que decorrem da preparação e execução
da operação estatística e que estão para além dos referentes ao pessoal contratado;
são os custos das deslocações, dos subsídios de deslocação e viagens relacionados com
a actividade específica, da aquisição de todas as espécies de serviços, desde serviços
especializados de publicidade e assistência técnica como a contratação de pessoas
para fazerem a recolha dos dados, a aquisição de consumíveis como esferográficas,
papel e toner, etc; de salientar que estes custos devem ser sempre apenas os
imputáveis à actividade estatística específica;
Custos indirectos: são os custos de natureza institucional, como rendas, energia, etc,
que não são específicos da actividade estatística, mas que também contribuem para a
respectiva actividade de forma indirecta; o cálculo destes custos não é da
responsabilidade do gestor do projecto;
Custos de investimento: os bens de investimento, como viaturas, computadores, etc e
que são bens duradouros, normalmente são utilizados por várias operações
estatísticas, pelo que o seu custo deveria ser repartido por todas as actividades em
que são utilizados; contudo, em determinadas operações estes bens de investimento
são de tal modo essenciais que acabam por ser orçamentados como custo da operação
estatística em que são adquiridos, pelo menos enquanto custo de aquisição.
Assim, a preparação do orçamento de uma operação estatística, que é sempre da
responsabilidade do respectivo gestor, deverá ter em conta os seguintes procedimentos:
Analisar os custos de uma operação idêntica anterior, que possam servir de referência
quanto ao tipo e dimensão dos custos efectivos;
Determinar, com precisão, quais os custos determinantes e críticos da operação,
sobretudo em termos de pessoal, investimentos e aquisições de serviços
especializados (mão de obra necessária para os trabalhos no terreno e no tratamento
de dados, aquisições de equipamento e de serviços especializados da área informática,
publicidade, impressão e distribuição de material no terreno, etc);
A “experimentação” dos custos nas operações experimentais, de modo a assegurar
que reflectem bem o custo real de cada actividade;
Nos custos com pessoal, referentes sobretudo a aquisições de serviços relacionados
com a recolha dos dados, deve ser dada uma atenção especial ao efeito motivador da
remuneração, no sentido de garantir que há empenho através de um pagamento
adequado do trabalho pessoal que esta recolha de dados implica.
4.1.14 Relatório final
As operações estatísticas, sobretudo as não correntes, devem constituir um referencial de
experiência para os vindouros, sobretudo no sentido de passar conhecimentos e experiência,
29
não só sobre o que aconteceu com a operação em causa, como também projectar alguns
aspectos que podem ser mais importantes para ter em consideração.
A elaboração de um relatório final, não só deve constituir uma obrigação de natureza interna,
como deve ser elaborado com um claro objectivo de se constituir como um elemento de
transmissão de conhecimentos e experiência.
Assim, o conteúdo do relatório final, devera ter um capítulo específico de apreciação sobre
cada uma das actividades mais importantes, com especial destaque para as seguintes:
Operações experimentais;
Organização e execução dos trabalhos no terreno
Registo e tratamento dos dados
Difusão da informação estatística
Orçamento
Cumprimento do cronograma
Principais lições aprendidas (este tema pode ser repartido como subcapítulo
em cada capítulo anterior, no sentido das lições aprendidas estarem
referenciadas a cada um dos temas a abordar)
Este relatório tem sobretudo objectivos de avaliação para uso interno (INE) e eventualmente o
CNEST, quando as operações estatísticas são de grande visibilidade. De qualquer forma, o
CNEST também é um espaço devidamente reservado para que estes relatórios possam ser
analisados em todas as suas vertentes, sem qualquer tipo de constrangimentos.
4.1.15 Cronograma
O cronograma é o elemento de controlo temporal da execução de cada actividade de uma
operação estatística. É através do cronograma que se organiza e controla todo o
desenvolvimento e implementação de uma operação estatística, desde a fase da concepção
até ao seu encerramento que deve culminar com o relatório final.
Para que o cronograma desempenhe cabalmente a sua função organizativa e de controlo, é
necessário que a estrutura de actividades também seja devidamente desagregada. A
desagregação das actividades deve permitir definir, com precisão, os respectivos resultados e
ter em conta as respectivas precedências (não se pode testar os questionários, enquanto não
estiver definido o seu conteúdo; não se pode começar a fazer a programação informática do
registo e tratamento dos dados, enquanto os questionários não assumirem a forma definitiva).
Por outro lado, convém sublinhar que um cronograma geral de uma operação estatística não
substitui cronogramas específicos para determinadas actividades onde a necessidade de
controlos mais finos se impõe. Podemos programar o momento para ter concluída a
programação informática da operação mas, para além disso, tem de haver um cronograma
específico para determinar o executante e os prazos para a realização de cada programa e de
cada conjunto de programas.
- Descrição de
procedimentos
- Avaliação de
procedimentos
- Passagem de
testemunho
Cronograma
geral
Cronogramas
específicos
30
Um outro aspecto também relevante, relaciona-se com o facto de uma actividade poder ser
desenvolvida em contínuo temporal ou não. Algumas actividades têm precedências que
implicam desenvolvimentos descontínuos, pelo facto de necessitarem dos avanços noutras
áreas, para continuarem o desenvolvimento. Por exemplo a preparação do relatório final deve
ser objecto da recolha descontínua de elementos para apoiar a sua elaboração no final da
operação.
Um outro aspecto também muito importante na actividade de planeamento e inserção do
mesmo no cartograma, relaciona-se com o ponto de referência para planeamento das
actividades. Assim, há actividades num projecto que são por natureza “inadiáveis”, porque
decorrem de obrigações institucionais cuja violação pode ter sérias consequências políticas.
Na constituição dos Estados Unidos da América está previsto que em todos os anos
terminados em zero deve ser realizado um recenseamento da população. O não cumprimento
desta regra constitucional seria bastante problemático.
Contudo, existem outras razões que, não sendo tão mandatórias, têm um forte cunho
institucional, como por exemplo o cumprimento do plano de actividades do SEN.
Assim, no planeamento de uma operação estatística deve tomar-se sempre como referência os
chamados “momentos inadiáveis”, no sentido de que tudo tem de ser planeado e executado
de modo a garantir que os resultados das respectivas actividades foram atingidos de modo a
garantir a sequência das restantes actividades. Por exemplo, num recenseamento da
população, todos os questionários têm de estar impressos e devidamente distribuídos pelo
território no momento censitário. Daí que todos os procedimentos das actividades
directamente relacionadas devem ser “planeadas para trás, de modo a garantir o resultado no
momento certo, como se pode verificar no modelo seguinte de cronograma:
“Momentos
inadiáveis”,
enquanto
marcos
temporais de
referência
31
Esta página é apenas a primeira de um cronograma censitário que é mais extenso. Serve para mostrar a estrutura de actividades e a sua sequência
temporal.
CRONOGRAMA DAS PRINCIPAIS ACTIVIDADES CENSITÁRIAS
ANTES DA DATA DO RECENSEAMENTO DEPOIS DA DATA DO RECENSEAMENTO
2 1/2 anos 2 anos 1 1/2 anos 1 ano 1/2 ano
Ja
ne
iro
Fe
ve
reir
o
Ma
rço
Ab
ril
Ma
io
Ju
nh
o
Ju
lho
Ag
osto
Se
tem
bro
Ou
tub
ro
No
ve
mb
ro
De
ze
mb
ro
Ja
ne
iro
Fe
ve
reir
o
Ma
rço
Ab
ril
Ma
io
Ju
nh
o
Ju
lho
Ag
osto
Se
tem
bro
Ou
tub
ro
No
ve
mb
ro
De
ze
mb
ro
1- Programa e Plano de Apuramentos
1.1-Estudo Preparatório 1.1
1.2-Análise interna 1.2
1.3-Análise externa (Grupo de Trabalho) 1 1.3
1.4- Estimativa Orçamental por grandes actividades 1.4
1.5-Aprovação 1.5
2- Cartografia 2.1-Definição do modelo cartográfico a utilizar 2.1
2.2-Recolha de cartas 2.3-Trabalhos de campo 2.4-Desenho e reprodução dos suportes cartográficos
3-Questionários e instrumentos auxiliares 3.1-Estudo de conteúdo 3.1
3.2-Desenho para testes 3.2
3.3-Desenho definitivo 3.3
3.4-Impressão definitiva
4-Operações experimentais 4.1-Estudo do programa 4.1
4.2-Estudo metodológico 4.2
4.3-Teste dos questionários 4.3.1-Execução 4.3.1
4.3.2-Apuramento de resultados 4.3.2
4.3.3-Relatório 4.3.3
4.4-Inquérito piloto 4.4.1-Execução 4.4.1
4.4.2-Apuramento de resultados 4.4.2
4.4.3-Relatório 4.4.3
5-Legislação 5.1-Estudo de áreas a cobrir 5.1
5.2-Elaboração do projecto de legislação 5.2
5.3-Análise interna e externa 5.3
5.4-Aprovação e publicação
6-Cadeia informática 6.1-Estudo de meios informáticos 6.1
6.2-Concepção do sistema 6.2
6.3-Análise funcional 6.3
6.4-Análise orgânica 6.4
6.5-Registo e validação 6.5.1-Concepção 6.5.1
6.5.2-Análise/programação
6.5.3-Testes
6.5.4-Verificação e correcção
6.6-Correcções automáticas
-Actividade contínua -Actividade descontínua
CRONOGRAMA DE
ACTIVIDADES
CRONOGRAMA DAS PRINCIPAIS ACTIVIDADES CENSITÁRIAS
ANTES DA DATA DO RECENSEAMENTO DEPOIS DA DATA DO RECENSEAMENTO
1/2 ano 1/2 ano 1 ano 1 1/2 anos 2 anos
Ja
ne
iro
Fe
ve
reir
o
Ma
rço
Ab
ril
Ma
io
Ju
nh
o
Ju
lho
Ag
osto
Se
tem
bro
Ou
tub
ro
No
ve
mb
ro
De
ze
mb
ro
Ja
ne
iro
Fe
ve
reir
o
Ma
rço
Ab
ril
Ma
io
Ju
nh
o
Ju
lho
Ag
osto
Se
tem
bro
Ou
tub
ro
No
ve
mb
ro
De
ze
mb
ro
Ja
ne
iro
Fe
ve
reir
o
Ma
rço
Ab
ril
Ma
io
Ju
nh
o
2.2
2.3
2.4
3.4
4.4.3
5.4
6.5.2
6.5.3
6.5.4
6.6
32
5 Programa de Difusão (os resultados) A difusão é uma das funções mais nobres do Sistema Estatístico Nacional, uma vez que é o
culminar natural e obrigatório de qualquer operação estatística. Sem difusão, não há
estatísticas oficiais, tal como está determinado na lei do SEN, já referida anteriormente.
A Lei 3/11 de 14 de Janeiro e a difusão estatística!
……
Assim, a difusão de resultados estatísticos torna-se uma obrigação e uma condição para que uma
determinada informação estatística possa ser considerada como estatísticas oficiais.
Devido a esta e outras razões, que derivam da necessidade de organizar a produção dos suportes
adequados de difusão, qualquer operação estatística necessita de ter um programa de difusão.
5.1 O que é um Programa de Difusão? Um programa de difusão é um documento estruturado o qual deve conter uma indicação precisa
sobre quais os produtos estatísticos e as respectivas datas, que cada operação estatística
disponibiliza. No fundo, o programa de difusão incorpora a verdadeira “razão de ser” de uma
operação estatística: difundir informação estatística oficial para todos os utilizadores que
necessitem dela.
Embora o Programa de Difusão e os respectivos produtos (Plano de apuramentos e restantes
produtos a disponibilizar) apreçam nesta parte final, não significa que não devam ser desenvolvidos
no final de todo o processo de preparação. Trata-se apenas de uma questão organizativa do
conteúdo deste manual. Em rigor absoluto, o plano de apuramentos (conjunto de quadros de
Estatísticas
oficiais? ….
Só se forem
públicas!
33
dados e indicadores) até deverão constituir um dos primeiros trabalhos de preparação, logo que
estejam definidas as unidades estatísticas a observar e respectivas variáveis).
Os produtos estatísticos mais típicos são os seguintes:
Quadros de dados: são normalmente matrizes de dupla entrada, constituídas por um
título, cabeçalho e coluna indicadora, de acordo com o seguinte:
Quadro … -População segundo o número de lugares e sexo, por escalão da dimensão do lugar
Área geográfica e administrativa
Número de lugares População segundo o sexo
Total Masculino Feminino Total do país Total Todos os lugares 5.000.000 ou mais habitantes 1.000.000-4.999.999 habitantes 500.000-999.999 habitantes 100.000-499.999 habitantes 50.000-99.999 habitantes 20.000-49.999 habitantes 10.000-19.999 habitantes 5.000-9.999 habitantes 2.000-4.999 habitantes 1.000-1.999 habitantes 500-999 habitantes 200-499 habitantes Menos de 200 habitantes População fora dos lugares … Divisão administrativa a seguir …..
O título deve sempre começar pelo universo de referência, segundo (o cabeçalho) por
(coluna indicadora).
Estes quadros têm de ser desenhados com bastante antecedência para serem descritas
as fórmulas de cálculo de cada cruzamento linha/coluna e serem devidamente
programados pela informática.
Para muitas operações estatísticas existem planos de apuramentos definidos nas
recomendações internacionais, como é o caso do recenseamento da população; a
principal função destes quadros de apuramentos das recomendações internacionais é
garantir que os vários países respondem às necessidades internacionais de dados com
matrizes iguais e devidamente normalizadas.
Indicadores: os indicadores são valores que resultam, normalmente, da combinação de
duas ou mais variáveis e que pretendem responder a necessidades específicas de um
grande número de utilizadores, através de um número simples e de fácil interpretação;
os indicadores facilitam muito a utilização de séries temporais porque comparam
Organização da
informação
estatística para
difusão
34
facilmente a evolução ao longo do tempo. Muitos indicadores são constituídos por um
conjunto de “dimensões” que permitem replicar o quadro estatístico que lhe serve de
base, se forem utilizadas na totalidade.
Com base no quadro anterior podemos ter um indicador que permite aceder à maioria
da informação daquele quadro sob a forma de indicador, em vez de estar a verificar
toda aquela informação:
População segundo a dimensão do lugar e sexo (define-se as dimensões dos
lugares que se pretende e o sexo) … e o sistema informático fornece
rapidamente os respectivos dados.
Exemplo com a “Idade da mulher no nascimento do primeiro filho, por escalão
etário e nível de escolaridade”
A vantagem dos indicadores, em relação aos quadros, advém do facto do utilizador
poder organizar os seus dados através de um modelo de auto-tabulação (extrai apenas
os dados que lhe interessa e organiza-os da forma que melhor lhe convém).
35
Cartogramas: são produtos que combinam a informação numérica com a informação
geográfica e que lhe acrescentam uma significativa “mais valia”, porque permitem
associar, simultaneamente, séries de dados sobre uma mesma geografia e a
comparação com as unidades geográficas vizinhas.
2001-2011
5.2 Organização do Programa de Difusão A difusão dos resultados estatísticos deve ser organizada em termos de tempo e conteúdo.
Como os resultados estatísticos são produzidos numa sequência de fases de tratamento dos dados,
para muitas delas existe alguma pressão dos utilizadores para disponibilizarem resultados o mais
rapidamente possível. Por vezes, como é o caso dos recenseamentos da população, existe uma
expectativa muito grande para conhecer alguns resultados, como é o caso dos dados sobre
população residente segundo o sexo e a respectiva desagregação geográfica.
Assim, para garantir a resposta às necessidades mais urgentes dos utilizadores, a difusão de
resultados pode ser organizada numa sequência que decorre das fases de tratamento dos dados. É
também fundamental que a escolha dos resultados a divulgar em cada fase seja feita tendo em
conta duas preocupações fundamentais: consistência dos valores a todos os níveis em que são
difundidos e a garantia de que nas fases seguintes os valores difundidos não apresentam desvios
significativos em relação aos valores anteriores.
36
Os resultados a difundir podem então ser organizados nas seguintes três fases:
Preliminares: são resultados que procuram disponibilizar informação com base em
contagens simples das unidades estatísticas e com um número muito limitado de variáveis;
por exemplo, a população segundo o sexo e a desagregação geográfico-administrativa; os
totalizadores de edifícios e alojamentos por área administrativa; os totalizadores de
empresas e estabelecimentos por unidade administrativa; etc;
Provisórios: são resultados que podem ser apurados nos níveis intermédios de tratamento
dos dados, quando já é possível ter um conjunto de variáveis suficientemente coerente e
consistente; normalmente são resultados obtidos numa fase em que já houve o tratamento
com base nas regras de coerência dos primeiros níveis das validações e que já não serão
sujeitos a correcções significativas; grandes grupos etários na população (menos de 15; 15-
64; 65 ou mais); níveis de instrução agregados (primário, secundário, superior); número de
empresas por grandes grupos da CAE; número de empresas segundo a natureza jurídica;
etc.
Definitivos: são os resultados finais que passam a constituir a informação de referência da
operação estatística; estes resultados devem ser apenas apurados definitivamente quando
todo o processo das regras de validação está concluído; a sua difusão só deverá ocorrer
após a análise de consistência técnica estar concluída.
Os produtos estatísticos definidos anteriormente (Quadros, Indicadores e Cartogramas) podem ser
utilizados em todas as fases de difusão dos resultados, uma vez que os dados apurados podem ser
disponibilizados sob todas estas formas em cada uma daquelas fases.
Obviamente que os resultados definitivos constituem sempre a maior quantidade de informação a
disponibilizar, porque é suposto que os dados sobre cada unidade estatística já devem ter sido
objecto de todos os tratamentos de coerência. Assim, a estruturação dos resultados em
preliminares, provisórios e definitivos deve ser organizada em crescendo de quantidade e
qualidade da informação estatística disponibilizada em cada fase.
6 A utilização de ficheiros administrativos para a produção de
estatísticas oficiais A utilização de ficheiros administrativos na produção de dados estatísticos é uma tendência
crescente dos sistemas estatísticos e tem sido fortemente impulsionada por três factores
determinantes:
A redução de custos;
A existência de ficheiros informatizados que facilitam o acesso aos respectivos
dados;
A preocupação com a sobrecarga estatística sobre os cidadãos e as empresas. Há
uma resistência crescente na resposta directa a questionários estatísticos e é
necessário encontrar formas alternativas de recolher informação.
Sequência na
difusão da
informação:
cada vez
mais e de
melhor
qualidade!
37
Contudo, ainda subsistem muitas situações em que os ficheiros não estão informatizados, mas a
sua utilização para fins estatísticos impõe-se devido à própria natureza do acto administrativo. É o
caso dos registos civil, automóvel, predial, comercial, etc.
Assim, podemos tipificar a utilização dos registos para fins estatísticos de acordo com o seguinte:
- Exploração estatística de ficheiros informatizados na origem administrativa
Esta situação é ainda reduzida, embora seja aquela para a qual se deverá avançar. Existem já experiências bem conseguidas nas áreas das estatísticas do comércio externo e do ensino superior;
- Recolha de dados estatísticos junto de processos administrativos, através de questionário ou quadros específicos
É uma situação em que o processo administrativo não está informatizado e/ou estruturado para aproveitamento estatístico directo, pelo que a única solução, que é forçosamente de recurso, passa por recolher alguns dados através de questionário específico (processos que se encontram apenas em suporte de papel), ou de produzir apuramentos para fins estatísticos, quando os ficheiros originais estão informatizados. Estão neste caso a grande maioria das estatísticas que são produzidas através da recolha administrativa. São os casos do registo civil, educação, saúde e justiça, cuja recolha é feita através de questionários ou quadros específicos (em papel ou em suporte digital), nos quais se procura colher os dados estatísticos que são necessários à respectiva área.
6.1 Fases de preparação do procedimento administrativo, para utilização
estatística
A utilização dos ficheiros administrativos para a produção directa de estatísticas oficiais
não é um processo imediato, na maior parte das situações, e exige uma preparação
adequada de procedimentos que garantam a qualidade dos resultados obtidos.
Por outro lado, existe uma “sensação de poder relativo” por parte dos vários detentores de
ficheiros administrativos, pelo facto destes ficheiros terem sido criados para satisfazer um
determinado conjunto de necessidades. Esta situação torna a intervenção estatística um
pouco suspeita de se intrometer, descobrindo até eventuais debilidades nesses ficheiros,
podendo ser interpretado como uma diminuição desse poder.
Contudo, o efeito de harmonização de ficheiros acaba por ser um estímulo ao aumento da
sua qualidade, até porque o confronto das eventuais divergências com outras fontes ajuda
a implementar medidas de correcção que, de outra forma, dificilmente seriam
implementadas.
Alternativas na
utilização dos
registos
administrativos
38
Seguidamente enunciam-se alguns procedimentos fundamentais e necessários a esta
adaptação:
Determinação objectiva das necessidades estatísticas em causa, o que pressupõe um plano de resultados a disponibilizar e uma descrição técnica exaustiva, associada aos respectivos conceitos, variáveis e modalidades das variáveis;
Avaliação das potencialidades do registo administrativo existente, quanto à satisfação da componente estatística;
Identificação das eventuais incompatibilidades de natureza conceptual e de conteúdo entre o registo administrativo e as necessidades estatísticas;
Determinação de alternativas de execução:
Utilização do momento administrativo para preenchimento de um instrumento pu-ramente estatístico;
Recolha de dados estatísticos através da consulta aos processos administrativos;
Inserção das necessidades estatísticas no procedimento administrativo enquanto um todo;
Informatização dos procedimentos administrativos (e estatísticos), se não estiver feita;
Evolução para um modelo único que, no acto da recolha de dados, não faça qualquer distinção entre as componentes administrativa e estatística;
Evolução para o registo electrónico local e transmissão também por via electrónica (In-ternet ou suporte magnético).
Estes procedimentos têm subjacente a colaboração estreita e interessada entre os vários
serviços administrativos e a função estatística, o que não isenta a necessidade de uma clara
orientação política nesse sentido. Caso contrário, os problemas serão tantos que
tornarão muito forte a tendência para a desistência!
6.2 A experiência demográfica na utilização de registos administrativos e as
regras inerentes ao registo civil
De acordo ainda com as recomendações das Nações Unidas, um sistema de registo civil é
entendido como “ o contínuo, permanente, obrigatório e universal registo da ocorrência
e características dos acontecimentos pertencentes à população, determinados por
decreto ou regulamento, de acordo com as exigências legais do respectivo país”.
Dos
administrativos
à informação
estatística oficial
39
Nesta definição estão subjacentes os princípios da obrigatoriedade legal e do respeito
pelas normas de cada país, mas o registo de todos os acontecimentos vitais é o objectivo
que define o essencial deste sistema.
Os princípios fundamentais que devem ser seguidos por este sistema de registo, pelo
menos em termos estatísticos, são os seguintes:
Cobertura universal Este princípio pressupõe que todos os acontecimentos vitais ocorridos num determinado
território sejam “contabilizados” e caracterizados pelo sistema;
Continuidade Este princípio implica que a observação dos acontecimentos seja feita de modo a
garantir informação que possa reflectir as flutuações de curto prazo nos acontecimentos,
designadamente as mensais e sazonais;
Confidencialidade Este princípio visa garantir que o acesso a dados de natureza individual apenas seja per-mitido a pessoas e autoridades devidamente autorizadas para o efeito. Ou seja, os ele-mentos individualizáveis que o cidadão fornece à Administração apenas deverão ser usados para os fins pré-definidos, de modo a garantir que o cidadão possa fornecer os dados individuais correctos sem qualquer receio de que eles possam prejudicar o seu di-reito à privacidade.
Difusão regular A informação estatística sobre os acontecimentos vitais, aliás como a grande maioria da
informação estatística, interessa à sociedade enquanto tal e não apenas aos poderes
públicos, pelo que deve ser disponibilizada regularmente para que todas as pessoas e
entidades interessadas a possam consultar e analisar. Associada também a este
princípio, está a ideia de que esta regularidade da difusão deve ter em conta a
oportunidade, ou seja a informação deve ser disponibilizada em prazos que permitam a
sua completa utilização enquanto caracterizadora dos acontecimentos e capaz de induzir
medidas oportunas de política.
O exemplo do registo civil como fonte de estatísticas administrativas é apenas um exemplo que está
devidamente regulamentado a nível internacional. Contudo estas regras são claramente generalizáveis a
todos os registos administrativos passíveis de serem utilizados para fins estatísticos.
É sensato e normal que os registos administrativos dos cidadãos sejam utilizados para substituir
procedimentos muito mais caros e duplicadores de custos e esforço, como é o caso da produção estatística
alternativa por outras vias. Mesmo nas situações em que é necessário usar procedimentos estatísticos
específicos para colher a informação administrativa e trabalhá-la para a transformar em estatística, como é
o caso da recolha estatística específica dos dados do registo civil, provoca custos e trabalho adicionais de
tal maneira elevados que justificam muito bem a integração dos procedimentos estatísticos nos respectivos
procedimentos administrativos, de modo a potenciar a utilização conjunta.
As regras “de
ouro” das
estatísticas
oficiais que
utilizam
registos
administrativos
40
6.3 Os 12 cuidados a ter na utilização dos registos administrativos para fins
estatísticos Embora os ficheiros administrativos sejam uma fonte de importância crescente na produção das
estatísticas oficiais, há um conjunto de cuidados a ter na sua utilização, sobretudo tendo em conta que
estes registos podem conter problemas que podem condicionar significativamente a utilização dos
respectivos dados.
O Instituto de Estatística do Canadá, no seu manual de métodos e práticas em inquéritos, aponta para um
conjunto de 12 cuidados a ter na sua utilização e a comparação das alternativas na utilização de dados
administrativos contra a realização de inquéritos estatísticos.
A utilização de dados administrativos depende dos conceitos que lhes estão subjacentes, definições, e
cobertura (e na medida em que estes factores permanecem constantes), a qualidade, a base na qual os
dados são recolhidos e tratados e a oportunidade da sua disponibilização. Estes factores podem variar
significativamente, dependendo da fonte administrativa e do tipo de informação. Antes de decidir a
utilização de dados administrativos, eles devem ser devidamente avaliados, tendo em contas as seguintes
considerações:
i. Oportunidade
Dependendo da fonte de informação, um inquérito ou outra actividade estatística que utiliza dados
administrativos deve ser capaz de produzir resultados num período de tempo mais curto do que um
inquérito por amostra. Reciprocamente, um programa administrativo deve ser mais lento a produzir dados
do que um inquérito por amostragem (particularmente se a fonte administrativa constitui um
recenseamento ou se os dados em causa têm de ser recolhidos junto de várias entidades governamentais).
O tratamento de dados administrativos, depois de recebidos, deve ser particularmente lento se forem
utilizados e combinados muitos ficheiros.
ii. Custo
Muitas das etapas de um inquérito são eliminadas (particularmente, a recolha de dados), o que reduz
significativamente os custos.
iii. Sobrecarga estatística
Se forem utilizados dados administrativos em substituição de um questionário, não existe sobrecarga de
resposta.
iv. Cobertura
A população-alvo é definida através de procedimentos administrativos, o que pode não coincidir com os
procedimentos estatísticos.
v. Conteúdo
Uma vez que o conteúdo é definido através de procedimentos administrativos, pode acontecer que nem
todas as variáveis de interesse estatístico estejam cobertas pelos dados administrativos.
vi. Conceitos e definições
41
O programa administrativo, concebido com outros objectivos, pode usar conceitos e definições diferentes
das que são requeridas por um inquérito estatístico. De facto, os conceitos utilizados pela fonte
administrativa podem não ser os mais adequados para os objectivos do inquérito estatístico em causa.
vii. Erros de amostragem
Se os dados administrativos cobrirem toda a população-alvo (isto é, um censo), então não há erros de
amostragem. Se os dados administrativos substituem os dados para uma amostra da população, então os
erros de amostragem também existem nesta amostra.
viii. Erros não amostrais
O controlo dos erros não amostrais é muitas vezes mais difícil do que para um inquérito por amostragem.
Os dados administrativos podem conter mais erros ou omissões do que os dados de um inquérito
(tornando a edição e a imputação cruciais). Também quando as pessoas ou as empresas têm a percepção
que podem beneficiar ou ser prejudicadas com base nos dados que fornecem à fonte administrativa em
causa, podem existir enviesamentos nos dados fornecidos. Nalguns casos, os dados administrativos podem
conter menos erros do que os dados de inquéritos, como por exemplo, quando a impossibilidade de se
recordar da resposta adequada pode impedir o respondente de responder com precisão às respectivas
perguntas ou quando o respondente tenta “arredondar” a sua resposta a uma pergunta de um inquérito
(por exemplo sobre o rendimento).
ix. Controlo de qualidade
A qualidade da recolha, do registo e da codificação dos dados estão sob controlo do programa
administrativo e pode ser menos rigorosa do que os padrões de qualidade utilizados pelo INE. Portanto, é
necessário implementar uma avaliação contínua ou periódica da qualidade dos dados, em cada uma das
fases de recolha e tratamento.
x. Fiabilidade da fonte administrativa
A fonte administrativa dos dados pode não ser fiável quanto à capacidade de fornecer dados sempre que
for necessário. Também é possível que a cobertura, conteúdo e conceitos possam mudar ao longo do
tempo. Portanto é fundamental colaborar com os responsáveis do sistema administrativo e manter
contacto para estar actualizado quanto às mudanças de conceitos, definições, cobertura, frequência e
oportunidade que podem afectar a sua utilização para fins estatísticos e impulsionar mudanças que possam
aumentar, em vez de diminuir, a sua utilização para fins estatísticos.
xi. Formato dos dados
Os dados administrativos podem não estar num formato conveniente para utilização estatística. Por
exemplo, os dados podem estar apenas numa forma agregada, enquanto o INE deve preferir registos
individuais para cada unidade. Os dados podem provir de mais do que uma fonte, introduzindo assim o
problema da ligação (matching) e standardização dos dados com base em diferentes formatos. Além disso,
os ficheiros também podem não estar devidamente documentados com os descritivos do seu conteúdo.
xii. Questões de privacidade
O uso de dados administrativos pode colocar preocupações acerca da privacidade da informação do
domínio público, particularmente se os registos administrativos forem ligados com outras fontes de dados.
Portanto, devem considerar-se as questões relacionadas com a privacidade e o controlo do segredo
estatístico, especialmente quando se faz a interligação de ficheiros.
Fiche
iros ad
min
istrativos versu
s in
qu
érito
s estatísticos
42
Torna-se assim evidente que a utilização de dados administrativos para fins
estatísticos oficiais deve ser antecedida de uma avaliação técnica exaustiva e
consistente no sentido de garantir que os utilizadores não incorram em erros de
informação.