post-image

Tentando entender a polêmica sobre o desmatamento da Amazônia


Introdução

Faz muito tempo que eu não escrevo um post. Nesses últimos meses, nas minhas horas livres, me dediquei a refazer o meu site Polling Data. Um dos meus objetivos principais era que o site me permitisse publicar posts, com análises estatísticas, de maneira eficiente (falo mais sobre isso em outro post). Esse é o meu primeiro post na nova versão do meu site.

Quando estava terminando o site, apareceu na mídia toda a polêmica quanto às declarações do presidente Bolsonaro e do ministro do meio-ambiente Ricardo Salles sobre os dados de desmatamento da Amazônia. A primeira notícia que li a respeito está nesse link. Essa máteria diz que Bolsonaro quer embargar1 os dados sobre desmatamento. Além disso cita o ministro Ricardo Salles, que disse “os dados do Inpe são bons, mas não são precisos”. O ministro se refere aos dados públicos sobre o desmatamento, divulgados pelo Instituto Nacional de Pesquisas Espaciais (INPE). Na notícia não há qualquer tipo de referência ou justificativa de porque os dados não são considerados precisos pelo ministro.

Ao ler essa notícia, minha primeira reação foi pensar: “Mas quais evidências existem para questionar os dados do INPE?”. Entendo que uma afirmação dessas tem que ser acompanhada pela evidência (empírica) ou justificativa que fez o ministro chegar a tal conclusão. Essa afirmação sem evidência me fez pensar em um conceito conhecido como “o efeito Dunning-Kruger”. Esse efeito essencialmente diz que pessoas que têm pouco conhecimento sobre um assunto têm muita certeza sobre o tema. Com o tempo, quando a pessoa aprende mais sobre o assunto, ela percebe que não têm mais tanta certeza. E finalmente, depois que ela aprende muito sobre o assunto, ela começa a ter alguma certeza, mas nunca no mesmo nível de quando ela não tinha conhecimento. No gráfico abaixo o conceito pode ser mais facilmente entendido.

Efeito de Dunning-Kruger

Efeito de Dunning-Kruger

Lendo apenas essa notícia, parecia para mim que o único interesse do presidente e do ministro era impedir a publicação dos dados, que mostravam que em Julho/2019 houve um aumento de 278% no desmatamento se comparado à Julho/2018, e de 88% se comparado ao mês anterior (link). Um aumento do desmatamento no Brasil traz consenquências para o país, tanto ambientais quanto econômicas, diretas e indiretas, como por exemplo a potêncial extinção do Fundo Amazônia, o qual recebeu R$3,1 bilhões nos últimos 10 anos.

Os sistemas do INPE

Discutiremos aqui apenas os dois sistemas do INPE utilizados no contexto de desmatamento, pois precisamos entender esses sistemas para avaliar melhor o motivo de toda a discussão:

  • DETER - Sistema de Detecção de Desmatamento em Tempo Real
  • PRODES - Programa de Cálculo do Desflorestamento da Amazônia


Distinguir essas duas fontes de dados é importante para entender o problema. Resumidamente, de acordo com o próprio INPE, o DETER deveria ser utilizado para fiscalização mensalmente, não para compilar estatísticas oficiais. Já o PRODES deveria ser utilizado para estatísticas oficiais, porém não consegue apresentar resultados mensalmente para divulgação. A origem da discussão sobre o desmatamento ocorreu porque estimativas mensais preliminares (do DETER) foram divulgadas como se fossem estatísticas oficiais sobre o desmatamento.

Os parágrafos abaixo são bem técnicos, e foram retirados quase integralmente de relatórios do INPE sobre os dois sistemas, disponíveis para download no site. Coloquei-os no texto principal porque acredito que sejam muito relevantes pra entender melhor como o desmatamento da Amazônia é medido. Porém é possível continuar a leitura pulando para a próxima seção se o leitor não tiver interesse em entender os detalhes dos sistemas de monitoramento do INPE.

O sistema do INPE, central a toda a discussão sobre o desmatamento, é o DETER. No site do INPE ele é defindo como segue: “O DETER é um levantamento rápido de alertas de evidências de alteração da cobertura florestal na Amazônia, feito pelo INPE. O DETER foi desenvolvido como um sistema de alerta para dar suporte à fiscalização e controle de desmatamento e da degradação florestal realizadas pelo Instituto Brasileiro do Meio Ambiente e dos Recursos Naturais Renováveis (IBAMA) e demais órgãos ligados a esta temática”. O objetivo do DETER é divulgar previsões de forma mais acelerada, mensalmente, para que o IBAMA, entre outros, posso fiscalizar as áreas de desmatamento ilegal. Usando o DETER, o INPE divulga mensalmente um mapa de alertas para áreas maiores que 25 hectares. Os alertas indicam tanto áreas totalmente desmatadas (corte raso) como áreas em processo de desmatamento por degradação florestal progressiva.

O sistema DETER identifica e mapeia áreas desflorestadas em formações florestais na Amazônia. Esse sistema utiliza imagens dos sensores MODIS, a bordo do satélite TERRA da NASA, e imagens do WFI, a bordo do satélite brasileiro CBERS-2B do INPE. Esses sensores cobrem a Amazônia com alta freqüência temporal, de dois e cinco dias, respectivamente, mas com resolução espacial limitada de 250 metros e 260 metros (WFI). Com essa resolução espacial, as imagens permitem a detecção de desmatamentos cujas áreas são superiores a 0,25 km2 (ou 25 hectares). A alta freqüência de observação compensa a limitação da resolução espacial, reduzindo problemas impostos pela freqüente cobertura de nuvens na região Amazônica. A maior freqüência nas observações permite levantamentos e emissão de alertas de desmatamento quinzenais e mensais (“Tempo Real”). Em imagens de satélite, é preciso distinguir entre o tempo de ocorrência e o tempo de detecção. Uma floresta pode ser desmatada passo a passo, mas sua detecção como corte raso ou área degradada ocorre apenas quando as condições de observação pelo satélite são favoráveis. No DETER, todo desmatamento identificado numa imagem e que não tenha sido detectado anteriormente pelo PRODES (definido abaixo) é considerado desmatamento novo, independente do tempo cronológico.

No início de 2008, o INPE realizou uma avaliação detalhada do sistema DETER. Foram feitas validações com dados de campo e análises dos resultados do DETER utilizando como referência dados do PRODES, de melhor resolução, para avaliar a detecção do desmatamento por corte raso. Foram também utilizados como referência dados obtidos por fotointerpretação de imagens TM/Landsat do desmatamento por degradação florestal progressiva. O estudo concluiu que a confiabilidade das indicações de áreas desmatadas pelo DETER é de 94%. Nessa avaliação, apenas 6% das áreas de Alerta do DETER não corresponderam a desmatamento. O DETER identificou mais de 70% das áreas total de corte raso do PRODES maiores que 300 ha, e detectou 8% da área dos polígonos do PRODES entre 25 e 50 ha. O relatório completo desta análise encontra-se disponível na página do DETER.

Existem outros sistemas utilizados pelo INPE. O modelo oficial para estimar taxas de desmatamento é o PRODES.No site do INPE ele é defindo como segue: “O projeto PRODES realiza o monitoramento por satélites do desmatamento por corte raso na Amazônia Legal e produz, desde 1988, as taxas anuais de desmatamento na região, que são usadas pelo governo brasileiro para o estabelecimento de políticas públicas. As taxas anuais são estimadas a partir dos incrementos de desmatamento identificados em cada imagem de satélite que cobre a Amazônia Legal. A primeira apresentação dos dados é realizada para dezembro de cada ano, na forma de estimativa. Os dados consolidados são apresentados no primeiro semestre do ano seguinte”. O objetivo do PRODES é divulgar estatísticas oficiais sobre o desmatamento ilegal, porém a frequência de publicação dos resultados é anual. O sistema PRODES mede as taxas anuais de corte raso para os períodos de agosto do ano anterior a julho do ano corrente, considerando desmatamentos com áreas superiores a 6,25 hectares. Por ser mais detalhado e depender das condições climáticas da estação seca para aquisição de imagens livres de nuvens, o PRODES é feito apenas uma vez por ano.

O PRODES utiliza imagens dos sensores TM (satélite LANDSAT da NASA), CCD (satélites CBERS do INPE) e DMC (satélite da DMC International Imaging) que cobrem a Amazônia com baixa freqüência temporal (16, 26 dias e quase diário) e têm resolução espacial de 30, 20 e 32 metros, respectivamente. Com esses sensores é possível mapear desmatamentos cujas áreas sejam superiores a 6,25 hectares. O PRODES mede as taxas anuais de desmatamento por corte raso desde 1988. Os novos desmatamentos detectados para o ano em questão são denominados Incrementos. Designa-se extensão desflorestada a área desflorestada acumulada a partir dos mapeamentos dos anos anteriores.

Para auxiliar a fiscalização e o controle do uso ilegal da floresta, o DETER usa um conceito de desmatamento mais abrangente do que o do PRODES. O PRODES apenas identifica e contabiliza as áreas que evidenciam ser de corte raso, ou seja, o estágio final do processo de desmatamento. No DETER, toda alteração da cobertura florestal verificada no período de análise é apontada como área de alerta e passível de fiscalização, sem discriminar o estágio do processo de desmatamento. Assim, o DETER procura identificar os estágios intermediários do processo de desmatamento. A cada 15 dias, quando as condições de observação são favoráveis, o DETER produz um mapa digital com todas as ocorrências de desmatamento observadas na quinzena anterior. Dessa forma, permite aos órgãos responsáveis pela fiscalização (IBAMA, SEMAs, Promotoria Pública, etc.) planejar suas ações de campo e operações de combate ao desmatamento ilegal.

O outro lado

Em tempos de fake news e opiniões extremadas, sempre tenho em mente que se não houvessem dois pontos de vista minimamente justificáveis, dificilmente existiria alguma discussão. No geral, o mundo é cinza, não preto e branco2. Porém hoje, quase toda noticia é preta ou branca3, então minha estratégia é tentar ler algo preto, e algo branco, e tirar minhas próprias conclusões a respeito do assunto.

O vídeo abaixo é uma apresentação do ministro Ricardo Salles. O vídeo é muito interessante, principalmente porque aponta alguns erros cometidos pelo modelo do INPE para prever o nível de desmatamento da Amazônia. Não me preocupei em tentar entender a cronologia dos fatos4, porém nesse vídeo as opinões parecem ser um pouco mais sensatas e ponderadas, mostrando o racional por trás da crítica ao modelo do INPE. Recomendo que assistam pelo menos a primeira parte da apresentação.

Vários pontos devem ser destacados no vídeo, mas antes quero apenas citar uma frase famosa do estatístico George Box: “Todos os modelos estão errados, porém alguns são úteis”. Citei essa frase apenas para contextualizar a discussão abaixo. Todo modelo (no caso, os sistemas do INPE) é uma aproximação da realidade, mas está errado. Falar que um modelo está errado não quer dizer nada, não adiciona nada novo a nenhuma discussão. Porém dizer que um modelo parece ser melhor que outro, mais útil, ou faz menos suposições, ou que pode ser melhorado, é algo positivo. Esses adjetivos sim podem ser úteis, indicando qual caminho devemos seguir pra melhorar nossa compreensão do tema sendo estudado. Críticas construtivas são importantes para a Ciência.

Voltando ao vídeo, são apontados 3 tipos de erros que podem ser cometidos pelo DETER:

  1. Desmatamentos que não são detectados no período correto, e acabam sendo acumulados em um único mês.
  2. Desmatamentos em períodos diferentes que se sobrepoem, ou seja, algumas áreas desmatadas são contadas 2 vezes.
  3. Áreas desmatadas que voltam a ter vegetação (mata secundária5) não são excluídas das estatísticas.


A incidência desses erros não é calculada, porem são mostrados exemplos bem claros dos erros (1) e (2). O erro (3) é citado algumas vezes, mas não há nenhuma explicação ou evidência de que ele de fato ocorre nas estimativas do DETER, então irei simplesmente desconsiderá-lo, até porque mata secundária não é a mata original, então é uma questão subjetiva se essas áreas deveriam ser consideradas ou não. O erro (3) deve ocorrer porque o sistema combina imagens de diferentes satélites e de diferentes momentos do tempo, porém não vou entrar em detalhes sobre esse erro aqui. Note que o erro em (1) não altera a quantidade de desmatamento total que ocorreu, apenas quando ele ocorreu. Já os erros (2) e (3) poderiam potencialmente afetar a estimativa da quantidade total de desmatamento. Como somente um exemplo do erro (2) foi mostrado, acredito que ele não ocorra frequentemente, e quando ocorre me parece ser fácil de corrigir o problema. Assim, nessa discussão, vou priorizar o erro descrito em (1), que foi a mesma estratégia utilizada pelo governo.

As áreas de desmatamento escolhidas como exemplo na apresentação foram as 500 maiores. De acordo com o vídeo, nessas 500 áreas escolhidas, 54% da área total dos desmatamentos ocorreram antes do período informado. Como esse erro ocorre por uma questão de resolução do sitema, no qual pequenas áreas de desmatamento não conseguem ser detectadas, o critério de seleção de áreas maiores não parece ser um problema, e a estimativa acima pode representar o erro desse tipo esperado para todas as áreas no mês em questão (mas sempre cabe um estudo empírico para avaliar essa suposição).

Mas é importante ressaltar que essa estimativa de 54% sofre exatamente da mesma variabilidade que a taxa de aumento de desmatamento de 88% (relativa ao mês anterior). Ou seja, o mesmo problema apontado pelo governo, de que as taxas podem variar muito por causa que o DETER não foi feito para calcular estimativas mensais, vale também para a análise feita pelo próprio governo para criticar o DETER.

Vou explicar melhor esse ponto. O problema em utilizar o DETER para obter estimativas mensais é que pequenos desmatamentos não são detectados. Apenas quando se tornam grandes o suficiente (pelo menos 25 ha, mas a identificação é bem melhor em áreas maiores que 300ha) passam a ser detectados, e quando são detectados são alocados no mês em que a detecção efetivamente ocorreu, apesar de sabermos que começaram a ocorrer antes (usualmente). O ponto é, imagine uma situação hipotética onde ocorra a mesma quantidade de desmatamentos em 2 meses consecutivos, porém no mês 1 ocorram vários desmatamentos pequenos (que não são detectados), e no mês 2 esses desmatamentos se tornem grandes o sufuciente para serem detectados. A estimativa baseada nos dados do DETER irá detectar muito mais desmatamentos no mês 2 do que no mês 1. Isso fará com que a taxa estimada de crescimento do desmatamento comparando o mês 2 com o mês 1 seja grande, mesmo quando a taxa real se manteve constante.

Ou seja, o sistema DETER para detectar taxas de crescimento do desmatamento terá muito ruído, e muitas vezes pode parecer que o desmatamento está acelerado (ou desacelerado) quando na verdade está na mesma intensidade do mês anterior. Esse ruído será muito influenciado pela quantidade de novos focos de desmatamento que aparecerem, e a velocidade com que evoluem. Quanto maior for o período de análise, menor deverá ser o ruído, em média. Ou seja, se compararmos os últimos 6 meses, com os 6 meses anteriores, essa taxa de crescimento deve ser muito mais robusta do que a taxa de variação mensal. Essa talvez seja uma estratégia mais interessante para estimar taxas de crescimento do desmatamento atualizadas, enquanto a estimativa oficial do PRODES ainda não é divulgada.

Note que estou falando sobre as taxas mensais de variação do desmatamento, e não sobre a quantidade total de desmatamento num período. Um exemplo mais abstrato pode explicitar esse ponto. Imagine que a taxa de crescimento é constante, de 10% ao mês. Após 6 meses, o aumento relativo do desmatamento terá sido de 77%, e pode ser calculada utilizando essa fórmula: \((1+0.1)^6 = 1,77\). Mas considere agora que os dados do DETER, por causa de tudo que foi discutido aqui, apresentem taxas de 0% de crescimento nos primeiros 5 meses, e de 77% apenas no último mês. Após 6 meses, o aumento relativo do desmatamento também terá sido de 77%, porém parecerá que foi mais acentuado no últimos mês, quando de fato foi constante nos últimos 6 meses.

Note que os erros do tipo (1) discutidos aqui são esperados dado a forma de construção do sistema DETER. Não foi o governo que descobriu esses erros. Eles já eram conhecidos desde a criação do sistema, e descritos no relatório de 2008 no site do INPE. Ou seja, há pelo menos 10 anos esses erros já são documentados. Independentemente disso, o governo mostrou exemplos práticos do problema, que de uma forma ou de outra pelo menos demonstram algum grau de conhecimento, e de busca de evidências. O que, por sua vez, mostra como eu também fui afetado pelo “efeito Dunning-Kruger”, ao acreditar que o governo não estava baseando suas críticas em evidências empíricas.

Checando os dados

Toda a discussão da seção anterior se baseia nos dados apresentados pelo governo como referência. Como são utilizados dados públicos, entendo que checar alguns dos exemplos de erros apresentados seria uma etapa importante ao tentar entender toda a discussão. Mesmo os “dois lados” concordando que esses erros acontencem, confirmar as evidências apresentadas sempre é uma boa ideia.

No site do INPE, os dados estão disponíveis nesse link. Quase todos os arquivos disponíveis são shapefiles, ou seja, arquivos de geo-referenciamento. Na única sessão onde dados e estimativas parecem estar disponíveis, existem apenas dados até 2018. Não tive acesso à apresentação do governo mostrada no vídeo, pra saber mais detalhes sobre os dados utilizados, porém com a informação mostrada na apresentação deveria ser possível reproduzir alguns exemplos, mas não consegui localizar os arquivos/áreas de desmatamento necessários.

O site do INPE é bastante abrangente, tem muita informação disponível, inclusive um dashboard interativo que permite visualizar os dados de desmatamento. Porém, como crítica construtiva, deveria ser fácil encontrar o dicionário dos dados, explicando exatamente quais dados estão disponíveis e em qual formato, algo que não encontrei no site.

Conclusão

Meu objetivo com esse post não é defender ou criticar o governo ou instituições. Saber se estamos ouvindo apenas o que o governo quer que ouçamos, porém com um outro objetivo em mente. O futuro dirá o que de fato ocorreu, e se tudo não passava de um esquema para manipular a geração e/ou divulgação de dados públicos, algo que, obviamente, sou contra. Porém não podemos sempre descartar tudo que é dito porque um dos interlocutores tem um histórico de opiniões extremas, não necessariamente embasadas em fatos. E se nesse caso estiver correto? É como num casamento, se toda nova discussão for envolver todas as discussões anteriores, com certeza a nova discussão não levará a lugar algum. E discussões destrutivas são totalmente infrutíferas, inúteis. Não servem a um país que tem que aprender com seus erros, e seguir adiante.

Independentemente da motivação do governo, as críticas ao sistema DETER do INPE estão corretas, no sentido de haver muito ruído na estimativa das taxas “mensais” de crescimento do desmatamento. E de fato, ruído não é notícia útil. Notícia útil deveria ser sobre o sinal! Vale a pena ressaltar que a mesma metodologia vem sendo usada pelo INPE a decadas, então mesmo que ela tenha problemas com taxas mensais, as estimativas são consistentes ao longo do tempo, que no caso do desmatamento da Amazônia é o que mais importa - ou seja, conseguimos saber se o desmatamento tem aumentado ou diminuído. Entendo que o que gerou todo o questionamento na mídia sobre o assunto foi a forma como as críticas foram feitas, e a reação do ex-diretor do INPE Ricardo Galvão. A questão levantada no vídeo de que alguém de dentro do INPE divulgou as taxas sem avisar ao governo é irrelevante. Os dados são públicos e qualquer um pode obter esses dados, inclusive o próprio governo. Acredito que é obrigação do governo conhecer todas as estatísticas importantes para o país, mesmo que apenas preliminares. Conhecer, não manipular.

Fazer críticas baseadas em evidências é algo positivo, e qualquer um pode fazê-las, principalmente o governo, especialmente se o objetivo for melhorar estatísticas públicas. Só pra enfatizar: Melhorar, não censurar. Em situações assim sempre lembro da estória da Alice Stewart (Ted Talk), que em 1956 investigou o câncer infantil e descobriu que mulheres grávidas expostas ao raio-x tinham uma incidência maior de crianças que morriam de câncer. Suas descobertas contra-diziam o censo comum dos médicos da época, que viam o raio-x como uma nova tecnologia revolucionária que só poderia melhorar a saúde das pessoas, não piorá-la. Antes de divulgar seus resultados, para ter certeza que estava correta, contratou um estatístico (George Kneale) para desprovar tudo que ela havia provado. Nesse Ted Talk citado anteriormente, a apresentadora diz sobre o relacionamento dos dois:

“Ele (George Kneale) buscou ativamente desconfirmar suas hipóteses (da Alice Stewart). Formas diferentes de olhar os seus modelos, suas estatísticas, de analisar seus dados com o objetivo de provar que ela estava errada. Ele via a sua função como a de criar conflito em torno das teorias da Alice. Porque era somente se ele não conseguisse provar que ela estava errada que a Alice teria confiança suficiente para provar que estava correta.”

Essa é a atitude que precisamos ter com relação a dados públicos, que buscam medir diversos aspectos importantes do nosso país. Quanto melhor forem os dados, mais fácil será compreender nossa realidade, e consequentemente será melhor para o país.


  1. Significado de Embargar: Colocar empecilho ou embargo a; dificultar ou impedir: embargar a realização de uma obra; embargaram aos alunos a realização do vestibular.

  2. Claro que em alguns casos existe, de fato, o lado certo e o lado errado, como no caso dos terra-planistas. Porém quando se trata de algum assunto que você conhece pouco, a suposição básica deveria ser manter a mente aberta e evitar sofrer pessoalmente as consequências do efeito Dunning-Kruger.

  3. Ou seja, além de fake-news, também é necessário tomar cuidado com a mídia, pois facilmente somos enganados pelo nossos próprios viéses de seleção ao considerar somente notícias que corroboram nossas posições e descartar aquelas que contradizem nossas opiniões.

  4. Até porque uma das intenções desse post é mostrar como a ordem em que tomamos conhecimentos dos fatos pode alterar a nossa percepção dos fatos.

  5. Floresta secundária é uma floresta ou mata que se tem recultivado após uma grande perturbação, como fogo, corte de madeira ou devido ao vento, por um período longo o suficiente para que os efeitos da perturbação já não sejam evidentes.

Voltar ao blog

Especialistas em pesquisas de opinião pública e amostragem.

Prestamos consultoria em estatística. Entre em contato com a gente...

Consultoria