resumidamente a metodologia da PM é estimar uma densidade de ocupação maior que a do metrô em horário de pico (6 pessoas por metro quadrado) e calcular o total. A metodologia dos organizadores era detectar o número de celulares com internet ligada, estimar a proporção de pessoas com internet ligada e depois dividir o primeiro número pelo segundo, contando por tabela todos os que passavam pela região (até em outras ruas) como manifestantes. A metodologia do DataFolha é colocar vários pesquisadores em pontos separados ao longo da avenida inteira e arredores em diferentes horários, contando em tempo real a taxa de ocupação e depois estimando o total com base nessa aferição. Qualquer um que não esteja cego pela preferência política reconhece a superioridade dessa metodologia perante as outras.
Será que já foram feitos testes dessas metodologias em situações que tivessem um número de pessoas objetivamente conhecido, mas não por aqueles fazendo a estimativa?
Fui pesquisar e achei algo próximo disso, mas com contagem via software.
Esse estudo usou bases de dados com imagens de multidões de tamanho conhecido (contadas por força bruta) e depois calculou as estimativas usando mais de 60 variações desses métodos. A conclusão foi que métodos baseados em contagem de amostras locais são significativamente melhores que métodos baseados em abordagem da multidão como um todo, mesmo esse segundo grupo incluindo variações sofisticadas que levam em conta as diferenças de densidade de ocupação, a geometria do espaço ocupado, a disposição das cores e sombras na imagem etc.
É claro que as discrepâncias não foram tão enormes como acontece com os casos da vida real, pois os parâmetros de decisão humana foram minimizados, as multidões do estudo eram pequenas (de dezenas ou centenas de pessoas), e além disso, como eu disse acima, os métodos por abordagem de multidão completa foram bem mais sofisticados que o da PM (que usa o chamado método de Jacobs, o primeiro a ser inventado na década de 1960). Isso tudo tornou a disputa mais "equilibrada".
Outra coisa que achei bem interessante foi
essa matéria aqui. Ela conta como a aplicação de métodos de contagem sofisticados levou a uma divergência drástica com os números apresentados pelos organizadores da
Million Man March, levando a estimativa de 1,5 a 2 milhões para apenas 400 mil. Chegaram a cortar a verba do departamento depois disso, mas um novo estudo de 2004 confirmou os 400 mil. Vários outros casos de contagem sistemática de multidões levaram a grandes diminuições em relação aos números apresentados por organizadores de eventos. O próprio DataFolha fez uma recontagem das manifestações pelas Diretas Já, que levou o número de 1 milhão para 400 mil (o que seria bastante estranho supondo um conluio com o PT).
Por tudo que vi de exemplos, métodos sofisticados de contagem tendem a divergir drasticamente das estimativas de organizadores, com a diminuição geralmente ficando na faixa de 50% a 70%.