terça-feira, 25 de junho de 2013

De Rerum Natura, atualíssimo !!!!

Terça-feira, 25 de Junho de 2013

Mentiras, mentiras do caraças e estatística



Parte inicial do prefácio do Prof. Dinis Pestana ao livro "Como mentir com Estatística", de Darren Huff, que acaba de ser publicado como n.º 201 da colecção "Ciência Aberta" da Gradiva, agora dirigida por Carlos Fiolhais:
«Dantes não havia Estatística, tinham
que se contentar com mentiras
STEPHEN LEACOCK
«Eh pá, tortura esses dados, que eles
confessam
R. COASE
Pode um livro sobre Estatística tornar-se um bestseller? Sem dúvida, Como Mentir com Estatística tornou-se quase de imediato um êxito de vendas (sendo, porventura, a exceção que confirma a regra...). Muitos factores explicam esse fenómeno: um título apelativo, ilustrações humorísticas muito bem escolhidas (e estrategicamente mais abundantes nos primeiros capítulos), exemplos quase sempre referindo questões amplamente divulgadas nos meios de comunicação social, um perfume a escândalo — uma disciplina considerada científica é afinal constantemente usada para enganar o público —, pouco volume, e escrita quase terra-a-terra, de uma simplicidade e clareza notáveis. E, por outro lado, as instituições científicas de Estatística elogiaram a obra, que assim se torna respeitável e séria, mesmo quando faz sorrir (frequentemente!).
Mais de meio século volvido sobre a data de publicação continua a ser um livro cheio de ensinamentos úteis, numa roupagem divertida. Não admira por isso que a prestigiada revista Statistical Science tenha dedicado um fascículo do volume de 2005 a comemorar o cinquentenário da primeira edição, com uma colecção de artigos cuja leitura será menos amena do que a de Como Mentir com Estatística, mas que vale a pena ler, pois claramente demonstram que usar Estatística continua a ser, frequentemente, abusar da Estatística.
Uma parte substancial do livro denuncia que uma boa dose de divulgação de factos e conclusões, envolvendo-se em roupagem respeitável de ciência (e, em particular, usando a Estatística para conferir uma aparência de rigor), usa maus dados. O primeiro capítulo — que continua actual, e é porventura o mais útil, por ir ao cerne de numerosas fraudes feitas com uma aparente respeitabilidade estatística — discute pormenorizadamente as implicações de erros de amostragem, designadamente os que se devem a amostras não representativas — comentando também que mesmo operações de amostragem planeadas com rigor facilmente se afastam do padrão de excelência que pretendem, indo as respectivas causas de simples intervenção do acaso à má prática de agentes amostrais ou à tendência de os entrevistados fornecerem respostas «correctas» em vez de verdadeiras.
Por outro lado, muitas vezes as informações destinam-se a proteger interesses de quem as dá, em vez de pretenderem agradar a quem as ouve. Há muitos anos (andava eu nos meus 18 anos, estando longe de pensar em Estatística) li no Diário de Notícias a deliciosa história de uma «senhora» de Viena que aceitou uma bem intencionada boleia, mas, quando o carro se dirigia ao local onde recompensaria o motorista por tão gentil comportamento, ocorreu um acidente, que obrigou a senhora a internamento hospitalar durante alguns dias. E não é que a ingrata levou o solícito condutor a tribunal, exigindo desmedida indemnização por perdas no exercício da actividade, estimada a valores de artigo de muito luxo! E ganhou, ficando a rir-se, mas não por muito tempo, porque as autoridades fiscais austríacas depressa lhe enviaram uma intimação para pagar impostos, com multas e coimas devidas à não declaração do início de actividade e consequente pagamento dos correspondentes impostos, baseando-se na estimativa que ela tinha apresentado ao tribunal. Esta historieta ilustra bem que, numa questão aparentemente trivial,  interessado muda de interesses conforme as circunstâncias e se, nuns casos exagera os seu proventos, noutros (e especialmente nos contactos com o fisco), há a enorme tentação de os depreciar.
Amostragem inadequada é húmus para o crescimento de ciência da treta. Se eu disser que pedi a dois colaboradores para entrevistarem 200 cidadãos interrogando-os sobre como iriam votar no referendo sobre liberalização da lei sobre interrupção voluntária da gravidez que na altura ia ocorrer, e que um deles reportou que 99,5% eram favoráveis à alteração legislativa, ao passo que o outro que apenas 11% tinham declarado ser favoráveis a essa alteração, a Estatística parecerá muito pouco fiável; mas, se juntar que os primeiros foram entrevistados num jantar de homenagem à Dr.ª Odete Santos (uma deputada que se envolveu fortemente na campanha a favor da liberalização da lei) e que a segunda «amostra» foi recolhida à saída de missas no Mosteiro dos Jerónimos, facilmente se perceberá que não é a Estatística que é pouco fiável, mas antes que as pessoas que tomaram a decisão de recolher essas amostras enviesadas, em sentidos opostos, usaram mal a Estatística.
Há muitos anos dei-me ao trabalho de coleccionar pequenas notícias na revista do «Expresso», sobre «progressos» na Ciência, numa secção intitulada «Antes do Tempo», se não me falha a memória. A maior parte dessas notícias seguia o tipo matricial:
Uma equipa da universidade de... pediu a 46 voluntários que usassem a mesma roupa durante 24 horas, e que, ao tirá-la, a colocassem num saco de plástico hermeticamente fechado. O saco era depois dado a cheirar a cada um dos outros 45 indivíduos, pedindo-se que cada um deles classificasse o cheiro de 0 (abominável) a 10 (agradável, inebriante, despertando todos os desejos, mesmo os mais secretos e inconfessáveis), concluindo-se que...
Este tipo de estudos (ciência da treta, como muito bem são cada vez mais frequentemente qualificados) enferma de vários males, designadamente o facto de o uso de voluntários muito provavelmente recrutar indivíduos que têm um comportamento ou opções diversas dos da população em geral (por exemplo, em muitas situações são «exibicionistas» os que se oferecem), e o facto de a dimensão da amostra não ter sido cientificamente determinada4 para os fins em vista (e, infeliz mente, nem sempre há fins em vista a orientar um planeamento experimental, há antes muita ciência da treta que resulta de «andar à pesca» do que possa parecer interessante). Este tipo de colecções de dados quase nunca podem ser consideradas representativas e, por isso, não servem para estabelecer progressos no conhecimento. E, por outro lado, a graduação usando aquela escala ordinal é muito subjectiva, não tendo cada número o mesmo sentido para todos os respondentes.
O uso de amostras de voluntários (amostras de conveniência —que muitas vezes são muito inconvenientes para a seriedade do estudo que se está a realizar) é comum, mas tirar dessas colecções de dados (repugna-me chamar-lhes amostras) conclusões para uma população é ilegítimo.
Só por mera sorte essas conclusões serão acertadas. Alguns anos atrás, um dos telejornais nacionais noticiou a introdução de uma cirurgia em Portugal destinada a aumentar, por recolocação, o «micropénis», causa de infertilidade indesejada em muitos casais. A equipa médica que tinha introduzido essa técnica cirúrgica afirmava que 18% dos portugueses (de sexo masculino, suponho, embora isso não estivesse especificado) têm micropénis — uma estimativa cuja validade parece fortemente contestável, pois não temos conhecimento de nenhum estudo sério sobre o assunto na população portuguesa, e aquela percentagem é tanto mais estranha quanto a estimativa internacionalmente aceite é 0,6%. Provavelmente este erro era muito vantajoso para justificar pedidos de subsídios, mas era tão grosseiro — percentagem 30 vezes maior do que a estimada internacionalmente! — que não duvidamos que nenhuma agência de financiamento se compadeceu dos mais de meio milhão de diminuídos que se afirmava existirem em Portugal. A estimativa baseou-se decerto numa amostra de indivíduos observados em consultas de infertilidade, e não numa amostra aleatória de portugueses adultos, o que leva a que a indução dessa amostra, que não é representativa, para a população em geral careça de qualquer significado. E, os leitores que acharam descabido o meu parêntesis acima «(de sexo masculino, suponho, embora isso não estivesse especificado)» reparem que, se a amostra fosse contituída por infantes, poderia obter-se aquele número.
É por estas e por outras que, numa investigação científica séria, se começa por estabelecer, face ao enunciado dos propósitos, um protocolo pormenorizado do modo como os dados vão ser recolhidos.
O tamanho do pénis é uma fonte abundante de estudos tolos. Uma das histórias mais saborosas sobre essa questão tem que ver com um estudo de antropologia biológica que provava que os bosquímanes do sul de Angola tinham sido mais bem apetrechados pela natureza do que os bosquímanes sul africanos. Mas a diferença estimada era tão elevada que ocasionou dúvidas e, quando a chefe da equipa exibiu a anotação dos dados que tinha recolhido, um conhecedor da geografia humana de Angola disse estupefacto: «A colega recolheu uma amostra maior do que a população!»
Quando se foi aclarar o assunto, percebeu-se que:
• a «amostra» recolhida era de conveniência, e ainda por cima «comprada», no sentido em que tinham andado veículos do exército português equipados com autofalantes a berrar pelo deserto de Moçâmedes que os membros da população que fossem à cidade seriam recompensados com uma galinha;

• para que a senhora não entrasse em contacto visual com uma parte tão resguardada da anatomia masculina, foi decidido que dois pobres magalas estariam de plantão com um lençol entre a observadora e o que ela ia medir. O modus faciendi foi: a senhora antropóloga com uma mão segurava essa parte da anatomia, com a outra o instrumento de medição, e usando o tacto em vez vista lá ia medindo (os erros de aproximação assim cometidos eram irrelevantes face ao erro sistemático que adiante se descobre, nesta história tão escondida);

• alguns bosquímanes tiveram a excelente ideia de ir esconder a galinha e voltar para receber uma segunda galinha, terceira galinha, etc. Com certeza esse exemplo foi seguido por todos os que se aperceberam que podiam assim alegremente enriquecer o seu património. Mas, quando voltavam, já sabiam ao que vinham, e para muitos deles estas medições ulteriores não eram em repouso. Julgo que me entendem: não era só o património galináceo que aumentava.
(…)”

Dinis Pestana
Universidade de Lisboa, Departamento de Estatística e Investigação Operacional
CEAUL — Centro de Estatística e Aplicações da Universidade de Lisboa1