post-image

Porque a estatistica é importante para a sua vida?


Nesse post discutiremos porque a Estatística pode ser muito importante para sua vida pessoal. Além de mostrarmos como ela pode ser utilizada para entender o mundo ao nosso redor, mostraremos um exemplo muito pessoal sobre como utilizá-la para tomar decisões importantes na sua vida.

Introdução

Estamos num momento da nossa história onde as opiniões têm sido cada vez mais extremas. O contexto atual do nosso país ajuda a aumentar a polarização das opiniões: acabamos de passar por uma das maiores crises econômicas da nossa história, estamos no meio de um dos maiores escandâlos de corrupção da história da humanidade, uma presidenta eleita sofreu impeachment recentemente, nosso país é um dos paises com a maior concentração de renda do mundo, somos bombardeados com notícias falsas incessantemente, jornalistas demonstram uma nível de parcialidade absurda em suas opiniões, entre outros. Honestamente, eu poderia escrever páginas e páginas discutindo somente os eventos sem precedentes que ocorreram na história recente do país. Porém, eu quero olhar para o futuro. E é sobre o nosso futuro que quero falar nesse post, e como a estatística pode ser A ferramenta mais importante para permitir que cada cidadão tenha uma opinião informada sobre os temas relevantes para o seu futuro, e também para o futuro do país.

Para entendermos qual é o futuro que queremos para o nosso país, nós precisamos discutir entre si, argumentar. Quanto mais discutirmos, mais claro ficará que o mundo não é preto e branco, e que no geral não devemos ter uma opinião tão extrema sobre os temas discutidos. A esquerda e a direita precisam discutir. Os pobres e os ricos precisam discutir. Trabalhadores e intelectuais tem que discutir. Discutir não quer dizer brigar. Discutir quer dizer que duas pessoas com opiniões diferentes possam entender os argumentos dos seus opositores, e como esses argumentos moldaram sua opinião. Você pode discordar da opinião do seu opositor, mas não saia de uma discussão sem entender claramente os argumentos utilizados.

Recentemente li esta notícia sobre o que é um argumento, como devemos argumentar, e porque o brasileiro tem dificuldade em fazê-lo. O texto todo é extremamente interessante, recomendo que todos o leiam. Neste post vou destacar a definição de argumento utilizada no texto:

Um argumento é uma ‘viagem lógica’ que vai das premissas à conclusão…um bom argumento é aquele em que há boas razões para que as premissas sejam verdadeiras, e, para além disso, as premissas apresentam boas razões para suportar ou apoiar a conclusão….Desse modo, há duas maneiras em que um argumento pode falhar, ou ser um mau argumento: Se as premissas forem falsas ou se as premissas não apoiam a conclusão.

É importante destacar que quando o autor diz boas razões, entendo que do ponto de vista estatístico está implícito que é necessário associar probabilidades as premissas quando elas envolvem algum tipo de incerteza, quando se referem a um cenário imaginário ou potencial.

Muitas decisões pessoais e coletivas são feitas considerando situações que envolvem, pelo menos parcialmente, incerteza. Para decidir como agir nesses casos, onde as premissas possuem incerteza associada a elas, é fundamental saber quantificar essa incerteza utilizando probabilidades, permitindo que você leitor possa tomar uma decisão, ou formar uma opinião, que tenha o melhor retorno esperado para você. Nesse post discutiremos como a Estatística é importante para entender o nosso mundo, e como pode ser utilizada para formar nossas opiniões e tomar decisões pessoais. Nesse post não farei distinção entre estratégia de argumentação e linha de raciocínio, apesar do primeiro ser feito usualmente de forma pública e a segunda de forma introspectiva.

Dois tipos de probabilidade

Por incrível que pareça para a maioria das pessoas, existem dois tipos diferentes de probabilidade na estatística, as quais recebem os nomes de probabilidade freqüentista e probabilidade pessoal. Ambos os tipos de probabilidades respeitam as mesmas regras matemáticas que garantem que todas as operações fundamentais associando eventos a probabilidades sejam respeitadas e possíveis. A diferença principal nesses dois tipos refere-se a como essas probabilidades são derivadas conceitualmente.

A probabilidade freqüentista é baseada na freqüencia relativa a longo prazo. Se um experimento puder ser repetido indefinidamente, a probabilidade de um evento \(A\) é dada pela proporção de vezes que o evento \(A\) ocorreu. Esse tipo de probabilidade tem uma justificativa experimental, e se quero saber a probabilidade de algo basta repetir o experimento indefinidamente. Por exemplo, se quero saber a chance de uma moeda ser jogada e cair com a cara para cima, basta jogar essa moeda muitas vezes e calcular quantas vezes ela caiu com a cara virada para cima. Quanto mais vezes eu jogar a moeda, mais a freqüencia relativa se aproxima da probabilidade real de \(A\). Qualquer pessoa que jogar essa mesma moeda um número de vezes suficientemente grande obterá a mesma probabilidade.

A probabilidade pessoal, por outro lado, tem uma justificativa totalmente diferente. Nesse caso, as probabilidades representam a opinião de uma pessoa sobre o quanto ela acredita que uma proposição é real, ou quanto acredita que é a chance de um evento ocorrer, dado todas as informações que ela possue. Pessoas diferentes, com conhecimento de informações diferentes, podem dar probabilidades diferentes para a chance de ocorrência do mesmo evento. Por exemplo, vamos supor que o evento de interesse é que o custo de uma consulta com o médico Dr.X esteja entre R\$300 e R\$500. Uma pessoa que nunca foi nesse médico pode achar que a probabilidade desse evento é de 60%. Outra pessoa que foi há um ano atrás nesse médico pode acreditar que a probabilidade seja 80%. Finalmente, alguém que se consultou com esse médico na semana passada pode acreditar que a probabilidade seja de 99%.

Se essas probabilidades podem variar tanto, além de sofrerem com os viéses pessoais de cada um, como por exemplo com o viés de confirmação, qual é a utilidade delas? Em primeiro lugar, elas permitem que você atualize a sua probabilidade pessoal ao obter novas informações. Por exemplo, se a pessoa que não havia ido no médico no exemplo acima o fizer e pagar R\$400 na consulta, ao revisar a sua probabilidade pessoal ela provavelmente associará uma probabilidade bem mais alta ao evento discutido.

Porém de forma mais geral, as probabilidades só têm significado para quem está pensando sobre elas. Ninguém consegue conhecer todas as informações relevantes a um problema e ninguém consegue replicar experimentos infinitamente. Além disso, muitas vezes é impossível replicar experimentos. Então pode-se argumentar que qualquer pessoa que esteja utilizando uma probabilidade para decidir está utilizando uma probabilidade pessoal, subjetiva, pois é de fato impossível saber qual é a probabilidade real de um evento sem fazer suposições. Por exemplo, comumemnte se diz que ambos os lado de uma moeda têm a mesma chance de cair virados para cima. Porém, dado que as gravuras em cada lado da moeda são diferentes, que podem haver erros de fabricação na moeda, como bolhas ou heterogeneidade no metal, você, leitor, acredita que a probabilidade seja, exatamente, de 50% de cada lado? Talvez seja próxima de 50%, porém é quase impossível que de fato ambos os lados tenham a mesma chance.

O objetivo dessa seção não é deixar você confuso sobre diferentes tipos de probabilidades, ou discutir sobre a existência ou não de probabilidades frequentistas sem suposições. O ponto dessa seção é enfatizar que você leitor, ao fazer algum exercício mental que dependa das probabilidades de algum evento, tem todo o direito de imaginar quais podem ser as probabilidades do evento, mesmo que não hajam evidências disponíveis para utilizar. Quando você encontrar evidências (novas para você), pode atualizar essa probabilidade em luz dessas novas evidências, e refazer o exercício mental. O ponto é que a probabilidades pessoais têm uma importância enorme quando o objetivo é tomar nossas próprias decisões, ou pensar sobre quais são nossas opiniões sobre determinados temas.

A estatística no contexto de discussões honestas

Nesta seção quero mostrar que a estatística (e a probabilidade) permite que você racionalize sua opinião, algo importante para pensar sobre quais argumentos são importantes para você, leitor, chegar a sua própria conclusão sobre um tema, mesmo quando o assunto analisado não possue dados disponíveis publicamente.

Existem muitas estratégias de argumentação que podem ser utilizadas. A estratégia que discutirei aqui é a de pensar sobre os extremos de um assunto: existem lados opostos do tema? Se sim, quais são os extremos possíveis? Pensar nos dois extremos é fundamental para ter uma compreensão mais completa do assunto e enteder a gama de todas as possíveis conseqüências. Mesmo que você já tenha uma opinião formada, pensar nos dois extremos, tanto o favorável quanto o desfavorável à sua opinião, força você a pensar sobre a argumentação do ponto de vista oposto ao seu, algo também importante durante uma discussão, e que garante que você tenha uma opinião mais informada sobre o tema. Em uma discussão honesta, devemos tentar entender o ponto de vista do oponente em sua forma mais forte e persuasiva, antes de avaliar se as premissas justificam sua conclusão.

Por exemplo, numa discussão sobre alimentos transgênicos, pode-se argumentar que por um lado o uso de alimentos genéticamente modificados podem criar variedades de alimentos mais resistentes ao clima e as pragas, algo que poderia levar a eliminação da fome mundial e a redução do uso de agrotóxicos, talvez até criar alimentos mais nutritivos. Por outro lado, esses alimentos modificados podem ter consequências negativas para a saúde de quem os consome, como alergias e mutações, além de poder causar um declínio na biodiversidade do planeta. Nesse caso, os extremos imagináveis poderiam ser, por um lado, o fim da fome mundial com alimentos nutritivos acessíveis para todos; por outro lado, a extinção de todos os alimentos não-transgênicos do planeta resultando na extinção da espécie humana, pois a população mundial se tornaria intolerante ao alimento transgênico.

Esses cenários de fato parecem extremos, porém eu já ouvi ambos os argumentos sendo utilizados por defensores e opositores dos alimentos transgênicos. Eu chamo esse estratégia de discussão como o argumento do “pior caso imaginável”. Quase sempre, quem usa esse tipo de argumento já tem opinião formada sobre o caso, e mencionará apenas o pior extremo imaginável na visão dele, tratando-o como se fosse uma consequência lógica bem mais provável do que realmente é. Essa é uma estratégia para impor a opinião do interlocutor nas outras pessoas. Quem utiliza esse tipo de argumentação não busca ter uma discussão honesta.

O problema fundamental com esse tipo de lógica é que existe uma diferença muito grande entre os extremos imagináveis e os possíveis. Um caso possível tem probablidade maior que zero, é algo que pode ocorrer, enquanto um caso imaginável pode ter probabilidade zero, ou seja, pode ser impossível de ocorrer. Os extremos descritos no exemplo acima são os extremos imagináveis, porém para tentar avaliar se são possíveis é necessário pensar mais profundamente sobre a questão.

Se você quer ter uma discussão honesta com alguém, e você quer utilizar os casos extremos na sua argumentação, sua obrigação é tentar avaliar a probabilidade de ocorrência dos extremos, algo que é claramente difícil de fazer, principalmente em temas complexos como no exemplo dos alimentos transgênicos. Geralmente, para tentar avaliar a probabilidade desses extremos, você terá que separar o problema em diversos problemas menores, pensar cada um separadamente, e depois juntar todas as partes para chegar a uma probabilidade final. Provavelmente muitas suposições terão que ser feitas nesse processo, porém se o caminho lógico foi encontrado, discutir suposições e probabilidades pessoais torna a discussão ainda mais rica, e tangível.

Como exemplo de como um problema maior pode ser quebrado em vários problemas menores, é interessante citar a equação de Drake, que tenta quantificar a quantidade de civilizações extra-terrestres capazes de rádio-comunicação na nossa galáxia. De acordo com a Wikipedia, a equação foi escrita em 1961 por Frank Drake, não com o objetivo de quantificar o número de civilizações, porém como uma forma de estimular a discussão científica no primeiro congresso para busca de vida inteligente extraterreste (search for extraterrestrial intelligence - SETI). A equação de Drake é definida como:

\[ N=R_{*} \cdot f_{\mathrm{p}} \cdot n_{\mathrm{e}} \cdot f_{\mathrm{l}} \cdot f_{\mathrm{i}} \cdot f_{\mathrm{c}} \cdot L,\]

onde:

  • N: número de civilizaçãoes em nossa galáxia com as quais comunicação pode ser possível
  • \(R_{∗}\): a taxa média de formação de estrelas na nossa galáxia
  • \(f_{p}\): a fração de estrelas que possuem planetas
  • \(n_{e}\): o número médio de planetas que podem sustentar vida por estrela que tem planetas
  • \(f_{l}\): a fração de planetas que podem sustentar vida que de fato desenvolvem vida em algum momento do tempo
  • \(f_{i}\): a fração dos planetas com vida que acabam desenvolvendo vida inteligente (civilizações)
  • \(f_{c}\): a fração das civilizações que desenvolvem tecnologias que emitem para o espaço sinais detectáveis de sua existência
  • L: o tempo durante o qual essas civilizações emitem para o espaço sinais detectáveis

As críticas relacionadas a equação de Drake geralmente não citam a equação em si, porém os valores estimados dos parâmetros considerados pela equação.

.[3][4] The equation summarizes the main concepts which scientists must contemplate when considering the question of other radio-communicative life.[3] It is more properly thought of as an approximation rather than as a serious attempt to determine a precise number. Criticism related to the Drake equation focuses not on the equation itself, but on the fact that the estimated values for several of its factors are highly conjectural, the combined effect being that the uncertainty associated with any derived value is so large that the equation cannot be used to draw firm conclusions.

Não utilize argumentos de casos extremos se você não tem tempo ou interesse de pensar mais detalhedamente sobre o problema. Essa exercício mental é sua lição de caso, é o mínimo que você deve fazer antes de usar cenários extremos como argumento em qualquer discussão. Ele ajuda você a pensar melhor sobre o problema, com mais detalhe, e você ganha, de brinde, outros argumentos para utilizar numa discussão.

Dá trabalho pensar sobre os extremos, se são possíveis ou não. Mas essa é a sua lição de casa. SE você não tem tanto interesse pelo tema, ou não tem tempo para pensar sobre algo, pesquisar, tudo bem. Porém não utilize o argumento do pior caso imaginável!!!. Se você tem tempo, utilize suas probabilidades pessoais para chegar a alguma quantificação do caso. Por mais que seja subjetivo, pelo menos você pensou profundamente sobre tema, e as suas probabilidades pessoais podem ser revistas/atualizadas. Não precisamos de mais opiniões extremas e superficiais!

A estatística no contexto de decisões pessoais

Do meu ponto de vista, uma das ferramentas mais importantes da estatística para auxiliar a tomada de decisões e a quantificação do mundo ao nosso redor é a probabilidade condicional. No dicionário de Estatística de Oxford (Upton and Cook 2006), a probabilidade condicional é definida como sendo a "".

(Everitt 2006)

Probabilidade fornecidas pelos outros podem estar erradas. Se for algo importante, calcule a sua própria opinião e utilize-a para tomar sua prórpia decisão.

Conclusão

Em segundo lugar, vale ressaltar que a sua opinião é a conclusão nesse contexto. Ou seja, dentro de uma linha de argumentação, a sua opinião não pode ser utilizada como premissa, como argumento, porque aí você está utilizando uma lógica incoerente, cíclica. Para quem utiliza o Excel, é similar ao erro de referência cíclica, quando uma fórmula faz referência a outra célula que por sua vez faz referência a fórmula inicial…. porque a sua opinião não pode ser usada como um argumento:

“Claro que todos têm o direito de manter sua opinião, mas opinião não é argumento. A democracia também é feita de opiniões - ninguém precisa argumentar para votar no candidato que preferir, basta manifestar sua opinião nas urnas. Mas quando o candidato quer nos convencer, ou quando queremos convencer os outros sobre nossa posição política, nossa crenças não bastam.”

In 1903, in his book Mankind in the Making, the writer H. G. Wells noted that: “The great body of physical science … [is] only accessible and only thinkable to those who have had a sound training in mathematical analysis, and the time may not be very remote when it will be understood that for complete initiation as an efficient citizen … it is necessary to be able to compute, to think in averages and maxima and minima, as it is now to be able to read and write.”1 The above is a fairly tortuous passage that was shortened and simplified in 1951 by Samuel Wilks when he remarked, during his presidential address to the American Statistical Association, that:

“Um dia o pensamento estatístico será tão importante para o pleno exercício da cidadania quanto ler e escrever.”

“Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write.”

It is certainly a snappier quote. However, unlike Wells’s original, it does require the reader to understand the phrase “statistical thinking”.

Referências

Everitt, B. S. 2006. The Cambridge Dictionary of Statistics. Third Edition. Cambridge University Press.

Upton, G., and I. Cook. 2006. Oxford Dictionary of Statistics. Second Edition. Oxford University Press.

Voltar ao blog

Especialistas em pesquisas de opinião pública e amostragem.

Prestamos consultoria em estatística. Entre em contato com a gente...

Consultoria