Um exemplo de viés de confirmação?
By Neale Ahmed El-Dash on Aug 19, 2019
Introdução
Viés de confirmação é um tipo de viés cognitivo no qual uma pessoa dá maior valor às informações que confirmam suas opiniões. Esse viés impacta não somente nas informações que coletamos, mas também na maneira pela qual interpretamos e relembramos fatos. Pessoas que têm opiniões favoráveis ou desfavoráveis a uma determinada posição, tendem a buscar informações que apoiam o seu ponto de vista. Também irão interpretar novos fatos de uma maneira que apoie suas opiniões anteriores. O que você acredita torna-se realidade.
Por exemplo, se uma pessoa acredita que um jogador de futebol canhoto chuta a bola mais forte que um destro, toda vez que encontrar um canhoto que chuta a bola forte, esse fato reforçará sua opinião. Vai sempre lembrar dos chutes do Roberto Carlos ou do Rivellino. Não vai lembrar de jogadores destros que também chutavam forte, como Cristiano Ronaldo ou Marcelinho Carioca, ou de canhotos que não tinham um chute tão potente.
A nossa visão do mundo tende a refletir as nossas crenças. Existem muitas situações onde não existe evidência para corroborar a opinião de uma pessoa, porém com uma visão seletiva do mundo, ela se sente justificada. Até atos extremos, como por exemplo machismo e racismo, envolvem estereótipos que muitas vezes são sustentados por algum tipo de viés de confirmação1. Na matématica existe um conceito chamado de contra-prova. Basta apenas um único exemplo de que algo está errado para desprovar uma hipótese. Mas o viés de confirmação pode funcionar ao contrário. Basta um único exemplo favorável para validar a opinião de alguém.
Entretando não é somente em casos onde a pessoa está errada que esse viés se faz presente. Em casos onde a opinião prévia de uma pessoa está correta, o viés de confirmação também pode ser problemático. Por exemplo, pode até ser que os canhotos chutem mais forte, em média. Porém ao aumentar a importância de evidências favoráveis e desacreditar evidências contrárias, ficaria a impressão de que os canhotos têm uma vantagem muito maior do que de fato têm.
O viés de confirmação afeta não somente vocês, os leitores, mas também nós, os escritores. Os efeitos desse viés são visíveis na mídia, na política e na ciência. O uso da estratégia de enfatizar apenas aspectos que corroboram a sua opinião, e de desacreditar/descartar fatos contrários é muito comum. É natural, especialmente quando acreditamos que nossas convicções são racionais, lógicas e imparciais. Também é uma estratégia do escritor para passar uma mensagem mais simples de ser entendida. Se esse viés ocorre mesmo quando tentamos ser imparciais, imagine quando o objetivo é manipular a opinião pública, ou vencer uma discussão. Pensando dessa forma, é possível argumentar que notícias refletindo muito viés de confirmação do autor não deixam de ser um tipo de Fake News.
Um exemplo de viés de confirmação?
Conversando com um amigo sobre a polêmica do desmatamento da Amazônia e sobre o post que escrevi para tentar explicar a questão, chegamos a conclusão que fatores políticos provavelmente estão motivando o debate, talvez até mais do que as críticas ao sistema de mensuramento do desmatamento. É dificíl entender a dimensão que se deu a essa discussão sem acreditar que existe algum jogo político por trás das atitudes dos principais personagens. Esse amigo me enviou um link para essa notícia bastante interessante do El País. É uma reportagem bem escrita, que discute bastante a questão política por trás do desmatamento.
Meu objetivo nesse post não é avaliar as diversas afirmações feitas pelo autor sobre os políticos e suas motivações. O motivo que me levou a citar essa reportagem é porque, do meu ponto de vista, fornece um exemplo interessante de viés de confirmação. É apenas um detalhe no texto, porém exemplifica como é fácil favorecer informações que confirmam suas opiniões e desacreditar evidências contrárias. Primeiro vou destacar o parágrafo abaixo pra contextualizar a opinião do autor, o qual tem certeza de que o desmatamento aumentou muito durante o governo de Bolsonaro:
“O Inpe estava na mira de Bolsonaro desde a eleição. O Governo sempre soube que a implementação das promessas de campanha do presidente — destruir a fiscalização ambiental, acabar com as áreas protegidas e anular as demarcações de terra indígena — teria reflexos evidentes nas taxas de desmatamento. Desde novembro, quando Salles foi escolhido ministro, há um esforço latente para matar o mensageiro. Não por acaso, a primeira declaração pública de Salles ao ser nomeado foi para desacreditar o sistema Deter, que detecta as derrubadas em tempo real. Desde o começo do ano Salles fala em contratar um outro sistema de monitoramento.”
Mas é esse o parágrafo que chamou minha atenção no texto, e que é importante para a discussão:
“O desmatamento ficou fora do radar de Bolsonaro no primeiro quadrimestre: entre janeiro e abril, a forte cobertura de nuvens impediu que o Deter visse a maior parte do desmatamento. A taxa no começo do Governo Bolsonaro, contrariando todas as previsões, foi de 20% a 30% menor do que no ano passado. Em maio, porém, o céu limpou e, previsivelmente, o número de alertas começou a explodir: 34% em maio, 88% em junho e impressionantes 212% em julho, em comparação com os mesmos meses do ano passado. O agregado do Deter no ano, até agora, é 40% maior do que o de 2018, com 6.300 quilômetros quadrados.”
Antes de discutir o texto citado acima, vou apenas re-capitular alguns pontos do meu post sobre o desmatamento da Amazônia. O sistema DETER é utilizado pelo Instituto Nacional de Pesquisas Espaciais (INPE) para detecção de desmatamento em tempo real, devido a sua rapidez em detectar o desmatamento. Não é utilizado pelo INPE para calcular estimativas de desmatamento mensal, pois suas estimativas são imprecisas e voláteis. Essa volatilidade é causada por dois fatores principais: 1- núvens cobrindo a imagem do satélite, impedido a visualização do desmatamento e 2- resolução muito baixa das imagens não permitindo detectar áreas menores de desmatamento. Por esses motivos, as taxas de variação do desmatamento terão muito ruído. Muitas vezes pode parecer que o desmatamento está acelerado (ou desacelerado) quando na verdade está na mesma intensidade do mês anterior.
Considere, como mencionado no parágrafo destacado, que a taxa de crescimento do desmatamento no período de 7 meses foi de 40%. Olhando retrospectivamente, as taxas mensais de variação nesse período têm pouca importância, pois o efeito acumulado tem que ser de 40%. Além disso, sabemos que as taxas mensais não são confiáveis. Se as taxas do primeiro quadrimestre foram menores do que 40%, terão que ser maiores que 40% no trimestre seguinte. Se foram decrescentes no primeiro quadrimestre, terão que ser muito grandes no trimestre seguinte, para compensar o que não foi detectado e alcançar o valor acumulado de 40%. É uma questão de matemática2.
Na figura 1, mostro os resultados de uma pequena simulação da situação. Considerei trajetórias com valores similares aos observados nos 6 primeiros meses (redução entre 20% e 30% no primeiro quadrimestre, e aumento entre 1% e 50% no 5º mês e entre 50% e 100% no 6º mês), incluindo toda a gama de possíveis trajetórias das taxas mensais restritas a um aumento de 40% no período acumulado de 7 meses. Fica evidente que muita coisa poderia acontecer com a taxa de desmatamento no 7º mês, porém ela provavelmente seria bem alta (sendo em média 208% e variando entre 30% e 325%). Em 98% das simulações, a taxa do 7º mês indicou um aumento de desmatamento de mais de 150%. Em 54% das simulações, o aumento foi maior do que 200%.
Simulação
O objetivo dessa simulação é apenas avaliar quais seriam os possíveis valores de taxas mensais para o 7º mês. Se colocarmos os valores observados para cada mês, não seria necessário fazer uma simulação. Aproveitando que o autor da reportagem não mostrou as taxas do primeiro quadrimestre, apenas deu um intervalo de redução das taxas entre 20% a 30%, utilizei uma distribuição uniforme nesse intervalo na simulação (entre 0.7 e 0.8). Note que pensando em taxas, uma redução de 20% é equivalente a multiplicar o valor anterior por 0.8, e uma redução de 30% é equivalente a multiplicar por 0.7.
Também quis permitir variação das taxas do 5º e 6º mês, pois sabemos que as estimativas mensais têm muita volatilidade. Assim, ao invês de apenas utilizar os valores observados, utilizei intervalos próximos aos valores divulgados. Para o 5º mês utilizei uma uniforme entre 1 e 1.5, e para o 6º mês utilizei uma uniforme entre 1.5 e 2.
Para calcular os valores do 7º mês de forma que a variação total no perído fosse de +40%, basta utilizar a seguinte fórmula \(mes7 = \frac{1.4}{mes1*...*mes6}\).
Claramente todas as suposições nessa simulação são subjetivas. Não me procuopei em fazer nenhum tipo de análise de sensibilidade dos parâmetros pois queria apenas mostrar, de forma simples, que era esperado que a taxa de variação do 7º mês fosse grande. Vale ressaltar que uma simulação mais realista levaria em conta algum tipo de estimativa das variâncias das taxas mensais, e provavelmente utilizaria outra distribuição de probabilidade que incorporasse essa informação.
require(tidyverse)
n <- 200
p <- 1.4
df <- tibble(
mes = paste0('mes',1:6),
lim.inf = c(0.7,0.7,0.7,0.7,1,1.5),
lim.sup = c(0.8,0.8,0.8,0.8,1.5,2),
sim = map2(lim.inf,lim.sup,~runif(n, min = .x, max = .y))
) %>% unnest() %>% select(mes,sim)
df <- df %>% group_by(mes) %>% mutate(id=row_number())
df <- df %>% spread(mes,sim)
df <- df %>% mutate(
mes7 = p / (mes1 * mes2 * mes3 * mes4 * mes5 * mes6)
)
#range(df$mes7)
#mean(df$mes7)
df.graph <- df %>% gather(mes,val,-id)
gg <- ggplot(data=df.graph) + geom_line(aes(x=mes,y=val,group=id,colour=id),alpha=0.3)
gg <- gg + geom_text(x=2.5,y=1.6,label="Primeiro quadrimestre",colour="red")
gg <- gg + geom_text(x=2.5,y=1.4,label="Taxas decrescentess (entre 20% e 30%)",colour="black")
gg <- gg + geom_errorbarh(aes(xmin=1,xmax=4,y=1.5),colour="red",size=1,height=0.1)
gg <- gg + geom_text(x=5.5,y=2.6,label="Meses 5 e 6",colour="red")
gg <- gg + geom_text(x=5.5,y=2.4,label="Taxas crescentes",colour="black")
gg <- gg + geom_errorbarh(aes(xmin=5,xmax=6,y=2.5),colour="red",size=1,height=0.1)
gg <- gg + geom_text(y=2.3,x=7.4,label="Mês 7",colour="red",angle=270)
gg <- gg + geom_text(y=2.3,x=7.15,label="Taxas possíveis",colour="black",angle=270)
gg <- gg + geom_errorbar(aes(ymin=1.3,ymax=3.3,x=7.25),colour="red",size=1,width=0.1)
gg <- gg + theme(legend.position = "none") + xlab("") + ylab("Taxas mensais (relativas ao mês anterior)")
gg <- gg + ylim(0.5,3.5)
gg
No paragráfo destacado do artigo do El País, no trecho em vermelho, o autor deixa claro que as taxas mensais estimadas decresceram por causa das nuvens. Ele menciona as taxas, porém seus valores nem são mostrados, possivelmente por serem consideradas erradas pelo autor. No trecho seguinte, em verde, deixa claro que agora as estimativas são mais confiáveis por causa do céu limpo, mas utiliza adjetivos como impressionante, e apresenta cada uma das 3 taxas mensais que mostram crescimento. Em nenhum momento ele menciona que são dois lados da mesma moeda, e que se as taxas do primeiro quadrimestre foram decrescentes, as taxas do último trimestre teriam que ser muito mais altas.
No meu ponto de vista, o viés de confirmação ocorre porque o autor claramente desvaloriza as evidências aparentemente contrárias, mas enfatiza bastante as favoráveis. Para ser imparcial, o autor deveria ter apenas citado o trecho em azul, que não exagera a evidência existente. Vale ressaltar que o autor tem razão; houve um grande aumento na taxa de desmatamento, porém ele dá a impressão que ela é maior do que de fato foi.
A ocorrência de viés de confirmação é subjetiva. Eu e a minha assistente nesse post3 discutimos bastante se ouve ou não viés. Para a minha assistente, quando o autor utilizou o termo previsivelmente poderia dar a entender, implicitamente, que o aumento ocorreu justamente pelos motivos que eu destaco no gráfico 1. Do meu ponto de vista, esse termo foi utilizado porque para o autor era tão óbvio que houve acréscimo na taxa de desmatamento que quase não eram necessários dados para confirmar. Mas independentemente disso, considero que o autor poderia ter tratado as evidências contrárias e as favoráveis de maneira mais equilibrada, como por exemplo mostrando todas as taxas mensais ou citando somente o taxa acumulada.
O meu amigo citado acima, também não enxerga o parágrafo como viés de confirmação. Nas suas palavras:
“Penso não ser o caso de viés de confirmação, mas de posicionamento político mesmo. Acho que a polarização está tão grande que todos as nuances de cuidado e ponderação acabam por ser evitados por medo de oferecer munição aos ‘inimigos’… o viés de confirmação tira um pouco da fervura política do debate porque evidencia mais um mecanismo psicológico pouco controlado pelos indivíduos.”
Conclusão
O víés de confirmação no exemplo apresentado aqui não é óbvio, e no contexto do artigo também não é fundamental para o autor defender seu ponto de vista. Exatamente por isso é um exemplo interessante, pois mostra como o víés de confirmação pode ser sutil. Como discutimos no post, ele também é subjetivo, e é essencialmente inevitável. Parece racional e lógico. A melhor forma de tentar minimizar seu impacto é usando estatístitica. O uso da estatística não garante que a análise seja objetiva4, porém pelo menos ela será coerente e reproduzível.
Como argumento em qualquer discussão, a estatística pode (e deve) ser utilizada pelos diferentes pontos de vista para justificar suas hipóteses. Porém talvez a melhor forma de tentar ser imparcial, tentando evitar o viés de confirmação, seja distinguir os fatos (ou os dados) da sua opinião. Eles não são a mesma coisa. Por exemplo, ao invês de dizer “os dados mostram que…”, você pode dizer “a minha interpretação dos dados é…”. Citando o ex-senador americano Daniel Patrick Moynihan:
“Todo mundo tem direito a sua própria opinião, mas não ao seus próprios fatos!”
Explicando de forma um pouco mais detalhada: imagine que um homem machista acredita que “as mulheres são preguiçosas”. Esse é o estereótipo pelo qual ele enxerga todas as mulheres. Na realidade, homens e mulheres podem ser preguiçosos. Mas esse homem machista vai apenas lembrar de situações onde mulheres foram preguiçosas, e esquecer situações onde homens foram preguiçosos. Por causa do seu viés de confirmação, esse homem acreditará que o seu preconceito foi validado.↩︎
No post estou considerando taxas de variação de meses consecutivos, ou seja, de um mês relativo ao mês anterior, pois simplifica a visualização do problema. Considerando taxas de variação relativas ao mesmo mês do ano anterior, o problema ficaria mais complicado e volátil, porém a mesma lógica vale.↩︎
Também conhecida como minha mãe…rsrsrs↩︎
Para quem tem interesse, existe uma área da estatística, chamada de estatística bayesiana, que explicitamente inclui a subjetividade no método científico.↩︎