Candidaturas fantasmas nas eleições brasileiras

Caracterizamos o perfil das candidaturas fantasmas (ou laranjas) e ajudamos a identificá-las com antescedência nas eleições estaduais e federais de 2018.

Urna eleitoral.

Introdução

A política brasileira, assim como em outras partes do mundo, é dominada por homens. Dentre os 513 deputados federais eleitos em 2014, 51 são mulheres (8,5%), sendo que estas compõe aproximadamente metade da população brasileira. Foi visando reduzir essa discrepância histórica que a Lei nº 9.504/97, em particular seu artigo 10º, parágrafo 3º, foi alterado pela Lei nº 12.034/09 e estabeleceu que “Do número de vagas resultante das regras previstas neste artigo, cada partido ou coligação preencherá o mínimo de 30% (trinta por cento) e o máximo de 70% (setenta por cento) para candidaturas de cada sexo.”.

Uma forma encontrada por partidos e coligações de fraudar o cumprimento dessa demanda, desvirtuando seu espírito (seja por vontade política ou por falta de quadros), foi a inscrição de candidaturas fantasmas, isto é, que servem apenas para cumprir “no papel” as exigências legais mas que não são divulgadas, não aparecem em propagandas, não recebem apoio e nem investimento do partido e nem do próprio candidato ou candidata. Muitas vezes, esses candidatos ou candidatas não recebem nenhum voto, nem o deles mesmos. Neste estudo, em colaboração com a revista AzMina e a rede #MeRepresenta, nós buscamos verificar quais as características das candidaturas fantasmas e se elas poderiam ser identificadas antes do dia das eleições, utilizando para ambos os dados do Tribunal Superior Eleitoral (TSE). Vale lembrar que a existência de candidaturas fantasmas já é conhecida e que reportagens jornalísticas sobre o tema (por exemplo, esta e esta) já foram feitas.

Fantasmas existem?

Primeiro, verificamos se a existência de candidatas fantasmas é sustentada pelos dados comparando o perfil das candidaturas antes e depois de 2009, quando a Lei nº 12.034/09 entra em vigor. O gráfico abaixo mostra a evolução do número de candidatos a vereador no país todo a cada eleição (2004, 2008, 2012, 2016). O número total de candidatos em cada eleição é segmentado em candidaturas femininas (tons de violeta) e masculinas (tons de verde), e cada sexo é ainda particionado de acordo com o número de votos recebidos naquela eleição, indo de zero votos (mais escuro), passando por de 1 a 5 votos (tons médios), até mais de 5 votos (tons claros). O ano da Lei nº 12.034/09 é marcado pela linha vertical tracejada. Exemplo: no ano de 2016, tivemos cerca de 450 mil candidaturas, sendo 15 mil candidatas com zero votos, 18 mil candidatas com 1 a 5 votos, e 110 mil candidatas com mais de cinco votos, num total de 143 mil candidaturas femininas. O restante (307 mil) foram candidaturas masculinas, sendo que a grande maioria obteve mais de 5 votos. O gráfico seguinte mostra a mesma relação, mas para eleições de deputados estaduais e federais no país.

Podemos notar, especialmente no caso das eleições municipais, que a fração feminina do total de candidaturas cresce após 2009. Entretanto, dentre as candidatas, a fatia tomada por aquelas com menos de 5 votos (e com zero votos) aumenta significativamente, enquanto que, nas candidaturas masculinas, esse aumento é bem menor. Essa diferença entre a evolução do número de votos em candidaturas masculinas e femininas ao atravessar o ano de 2009 indica a existência de candidatas fantasmas. Por outro lado, o leve aumento, de 2012 a 2016, de candidatas a vereadora que obtiveram mais de cinco votos aponta que, apesar das burlas dos partidos, a lei pode resultar em um lento aumento ao longo dos anos do número de candidatas reais. Por fim, uma hipótese para explicar a menor diferença observada no caso das eleições para deputados seria o menor número absoluto de candidaturas femininas exigidas nesse caso.

É possível que candidaturas fantasmas acabem recebendo um número de votos maior que zero, causados por enganos ao votar ou por fantasmas que resolveram "passar ao mundo dos vivos", mencionando sua candidatura a pessoas próximas. Para estabelecer um limite de votos até o qual as candidaturas seriam consideradas fantasmas, modelamos a distribuição de candidaturas por número de votos obtidos - até 400 votos - , \(f(n)\), como a soma de duas funções exponenciais, uma representando a contribuição vinda das candidaturas reais e outra das candidaturas fantasmas: $$ f(n) = A_r e^{-\alpha_r n} + A_f e^{-\alpha_f n} $$ Para eleições antes de 2009, consideramos apenas uma exponencial (i.e. \(A_f=0\)), assumindo que não existem fantasmas nessa época. O gráfico abaixo, com eixo vertical em escala logarítmica, mostra como o modelo (linhas contínuas) se ajusta aos dados (pontos com barras de erro, representando flutuações aleatórias que esperaríamos numa realização de nova eleição nas mesmas condições) para eleições de 2006 e para a combinação das eleições de 2010 e 2014. Podemos notar que a existência de candidaturas fantasmas resulta num pico acentuado em zero votos:

Além do pico causado por candidaturas fantasmas, a comparação do modelo para antes e depois de 2009 indica um aumento da fração de candidaturas com poucos votos (menos que 400). Hipotetizamos que esse aumento reflete a entrada de candidaturas novas e sem estrutura, que ainda não são conhecidas e acabam recebendo um número pequeno de votos.

De posse do modelo descrito acima, podemos calcular a fração do total de candidaturas que seriam fantasmas para cada número de votos recebidos, \(F(n)\): $$ F(n) = \frac{A_f e^{-\alpha_f n}}{A_f e^{-\alpha_f n}+A_r e^{-\alpha_r n}} $$ Essa fração é apresentada no gráfico abaixo:

A linha vertical tracejada enfatiza que, de acordo com o modelo adotado, mais da metade das candidaturas após 2009 com cinco votos ou menos seriam fantasmas. Por esse motivo, daqui em diante vamos considerar tais candidaturas como "fantasmas" para fins de construção de modelos. Entretanto, é importante ressaltar que quase metade dessas candidaturas seriam, na verdade, reais. Como também apresentamos abaixo o perfil das candidaturas consideradas fantasmas, destacamos que esse perfil pouco se altera entre as candidaturas com zero votos e com cinco votos ou menos, mostrando que mesmo que a nossa seleção de fantasmas seja contaminada por candidaturas reais, o perfil levantado é representativo.

Finalmente, apresentamos os gráficos que melhor evidenciam a existência de candidatas fantasmas a partir de 2009. Primeiro, mostramos as frações masculinas e femininas do total de candidaturas (para qualquer cargo legislativo) em cada ano e em cada faixa de número de votos:

Enquanto a fração de candidaturas femininas com mais de cinco votos (ou seja, consideradas reais) apresenta um pequeno aumento ao atravessar o ano de 2009 (de 21% para 27%), a fração de candidatas com cinco votos ou menos (consideradas fantasmas) passa de sub-representada (39%) para quase que a totalidade das candidaturas com poucos votos (81%). O mesmo processo pode ser visto se analisarmos apenas as candidaturas às câmaras legislativas federal e estaduais, como mostra um gráfico abaixo:

Perfil das candidaturas fantasmas

Como vimos nos dois últimos gráficos, 81% das candidaturas consideradas como fantasmas são femininas. Abaixo, apresentamos outras características dessas candidaturas. Nesse estudo, separamos todas as candidaturas de 2004 a 2016 (aos cargos de vereador e deputados estaduais e federais) em 8 grupos, com os seguintes números de integrantes:

SexoÉpocaQuantidade de votos# de integrantes
MasculinoAntes de 20095 ou menos9.420
MasculinoAntes de 2009Mais de 5522.173
MasculinoDepois de 20095 ou menos16.481
MasculinoDepois de 2009Mais de 5590.863
FemininoAntes de 20095 ou menos6.061
FemininoAntes de 2009Mais de 5139.078
FemininoDepois de 20095 ou menos70.160
FemininoDepois de 2009Mais de 5213.981

Grau de instrução

Analisando a distribuição de candidaturas masculinas por grau de instrução, notamos um aumento geral da escolaridade (de antes a depois de 2009), que provavelmente acompanha a evolução demográfica da população brasileira como um todo. Também é possível perceber que candidaturas com poucos votos (5 votos ou menos) possuem, em média, uma escolaridade menor:

Em comparação, as candidaturas femininas apresentam tendências similares, mas com um nível geral de escolaridade maior que as candidaturas masculinas. Entretanto, é curioso notar uma exceção: após o ano de 2009 e dentre as candidaturas com cinco votos ou menos (consideradas fantasmas), a fração com ensino superior caiu, na contramão dos demais grupos. Com esse quadro, levantamos a hipótese das candidaturas fantasmas serem constituídas primariamente por pessoas sem ensino superior, mas com ensino médio completo.

Podemos comparar o grau de instrução das candidaturas com o da população brasileira em geral, de acordo com a Pesquisa Nacional por Amostra de domicílios (PNAD), cujos dados para 2015 são compilados no gráfico abaixo:

Essa comparação indica que a maioria das candidaturas - inclusive as fantasmas - apresentam um nível de escolaridade significativamente maior que a média nacional, sendo que o grupo que mais se aproxima dessa média é a de candidaturas masculinas com poucos votos, e a fração com ensino superior dentre os potenciais fantasmas (candidaturas femininas com poucos votos) é igual à média nacional.

Cor

Infelizmente, a base de dados do TSE só passou a incluir dados sobre a cor da pele em 2014, de maneira que não é possível comparar essa distribuição antes e depois de 2009. O gráfico abaixo mostra a composição das candidaturas masculinas e femininas até cinco votos e com mais de cinco votos para o conjunto das eleições disponíveis (de 2014 e de 2016):

Podemos notar duas características importantes nessas distribuições: primeiro, que a fração de candidaturas brancas é maior dentre aquelas femininas do que dentre as masculinas. Segundo, que as candidaturas brancas tendem a receber mais votos que as pardas. Como esperamos que o perfil das candidaturas fantasmas seja traçado pelas femininas com poucos votos, concluímos que cerca de 54% dos fantasmas são de mulheres negras. Em comparação com dados da PNAD - que aponta que 45%, 45% e 9% dos brasileiros se declaram brancos, pardos e pretos, respectivamente - vemos que as candidaturas fantasmas parecem ser representativas da população brasileira em termos de cor, ao contrário das candidaturas com mais de cinco votos, que apresentam uma fração branca maior.

Ocupação

As ocupações dos candidatos e candidatas são enquadradas em 258 categorias, de maneira que não seria viável comparar diretamente a fração correspondente a cada uma delas nos vários grupos, como fizemos acima. Para viabilizar a análise, precisamos primeiro selecionar um grupo menor de ocupações relevantes.

Com esse espírito, buscamos estimar quais as ocupações mais comuns dentre as candidaturas fantasmas. Primeiro, vamos representar o número de candidaturas femininas com ocupação \(p\) numa dada época \(t\) (\(t=A\) de "antes" ou \(t=D\) de "depois" de 2009) e com uma quantidade de votos \(v\) (até cinco: \(v=-\); ou mais de cinco, \(v=+\)) como \(N_p(t,v)\). Então, assumimos que o número de candidaturas femininas depois de 2009 e com cinco votos ou menos, por ocupação, é: $$ N_p(D,-) = F_p + R_p(D,-), $$ onde \(F_p\) são as candidaturas fantasmas e \(R_p(D,-)\) são candidaturas reais depois de 2009 e com cinco votos ou menos, ambas por cada ocupação \(p\). Além disso, também assumimos que todos os demais grupos de candidaturas femininas analisados possuem apenas candidaturas reais, isto é: \(N_p(A,-)=R_p(A,-)\), \(N_p(A,+)=R_p(A,+)\) e \(N_p(D,+)=R_p(D,+)\). Por fim, assumimos que a distribuição de ocupações das candidaturas reais não muda durante o período analisado, de forma que podemos escrever: $$ R_p(D,-) = \alpha R_p(A,-) ~\,~ \mathrm{e} \\ R_p(D,+) = \alpha R_p(A,+), $$ onde \(\alpha\) é uma constante. Essa constante pode ser estimada a partir da segunda equação acima, para cada ocupação \(p\), sendo que o valor final (e comum a todas as profissões) que adotamos é a mediana dos valores obtidos, apresentada como uma linha vermelha tracejada no histograma abaixo. O fato da razão \(\alpha = R_p(D,+)/R_p(A,+)\) estar concentrada em torno de um valor, como mostra o histograma, valida nossa hipótese de que a distribuição se mantém aproximadamente igual.

Finalmente, podemos estimar o número de fantasmas por ocupação como: $$ F_p = N_p(D,-) - \alpha N_p(A,-). $$ As 10 ocupações que resultam mais frequentes dentre os fantasmas são: dona de casa (24%), outros (21%), agricultor (7%), estudante/estagiário (5%), servidor público municipal (4%), comerciante (4%), aposentado (4%), professor do ensino fundamental (3%), empresário (2%) e auxiliar de escritório (2%). Utilizando apenas essas categorias e agrupando o restante em "outros mesmo", temos as seguintes distribuições:

Vemos que os grupos que estimamos dominar entre os fantasmas - donas de casa e a categoria escolhida pela candidatura "outros" - de fato ganham bastante espaço, ao longo dos anos, dentre as candidaturas com poucos votos. Já nos grupos com mais de cinco votos, a fração coberta por essas ocupações permanece mais estável.

Idade

Nos gráficos abaixo, comparamos a distribuição de idade dos candidatos e candidatas nos grupos com cinco votos ou menos (em roxo) e com mais de cinco votos (em verde). As faixas mais claras indicam as distribuições antes de 2009, enquanto que as faixas escuras indicam as distribuições depois de 2009. A altura da faixa, que pode ser lida na escala vertical, mostra a fração dos candidatos com aquela idade; a largura da faixa indica a incerteza sobre a distribuições, devido a flutuações estatísticas. Também colocamos, como referência, uma linha cinza tracejada que representa a distribuição da população brasileira segundo o censo de 2010.

As distribuições das candidaturas masculinas são todas bastante similares entre si, apresentando um pico de candidaturas próximo dos 40 ou 45 anos. As distribuições diferem bastante da distribuição da população brasileira em geral, que é significativamente mais jovem e que apresenta uma diversidade de idades (i.e. largura da distribuição) maior. É possível notar um leve aumento, com o tempo, da idade média das candidaturas, o que poderia ser causado, por exemplo, por um aumento da expectativa de vida da população ou pela permanência das mesmas pessoas como candidatas de eleição em eleição. Como essa distribuição é similar a de filiados a partidos políticos, a segunda possibilidade nos parece mais provável.

As candidaturas femininas apresentam características similares às masculinas. A principal diferença é que a distribuição das candidaturas com poucos votos tornou-se mais larga e seu pico foi deslocado para idades mais baixas após 2009, na contramão da hipótese de aumento de expectativa de vida, por exemplo. Dessa maneira, concluímos que a distribuição de idades das candidaturas fantasmas é mais próxima da distribuição da população brasileira, enquanto que as candidaturas reais em geral apresentam uma idade mais concentrada ao redor de 45 anos. A idade média das candidaturas fantasmas é de 40 anos, enquanto que a das candidaturas femininas com mais de cinco votos é de 44.

Bens declarados

Nesta seção nós comparamos a distribuição do valor total (não deflacionado) dos bens dos candidatos, declarados à justiça eleitoral no momento da candidatura. Iniciamos a análise com o quadro das candidaturas masculinas:

Vemos que a distribuição ao longo dos anos pouco se modifica, em especial a fração de candidaturas que não declararam nenhum bem. Podemos notar um leve aumento do patrimônio total com o tempo (comparando as distribuições de antes e depois de 2009). Esse aumento pode ser causado pela inflação ou por acúmulo de patrimônio real (para diferenciar os dois casos, precisaríamos deflacionar os valores).

Ainda em relação às candidaturas masculinas, se compararmos as com até cinco votos com as com mais de cinco votos, vemos na última não só uma quantidade maior de candidaturas que declaram algum bem, mas também um maior valor declarado: para as candidaturas depois de 2009 e dentre aquelas que declararam algum bem, a fração com mais de R$100 mil passa de 32% para 43%, enquanto que a fração com até R$10 mil cai de 18% para 12%.

As candidaturas femininas com mais de cinco votos apresentam um comportamento similar às candidaturas masculinas, mantendo a fração sem bens a declarar estável e aumentando o valor dos bens ao longo dos anos. Além disso, quando comparamos a distribuição de valores totais dentre as candidaturas que declararam bens, vemos as mesmas tendências de maior patrimônio depois de 2009 e entre as candidaturas com mais votos. Por outro lado, a fração de candidaturas com poucos votos que não declararam bens passa de 55% antes de 2009 para 68% depois de 2009, o que provavelmente indica que os fantasmas tendem a não se dar ao trabalho de declarar bens.

Fantasmas por estado

Para analisar como as candidaturas fantasmas se distribuem pelos estados brasileiros, calculamos, para cada estado \(u\), a fração das candidaturas \(f_{u,s,t}\) de um determinado sexo \(s\) que obtiveram cinco votos ou menos, para \(t\) antes de 2009 e para depois de 2009: $$ f_{u,s,t} \equiv \frac{N_{u,s,t}(\leq 5)}{N_{u,s,t}(\leq 5)+N_{u,s,t}(> 5)}. $$ Na equação acima, \( N_{u,s,t}(\leq 5) \) representa o número de candidaturas na unidade federativa \(u\), de sexo \(s\) e na época \(t\) (que pode ser \(t<2009\) ou \(t>2009\)) que obtiveram 5 votos ou menos. Como existe uma certa fração de candidaturas com poucos votos mesmo antes da Lei nº 12.034/09 (que assumimos não serem fantasmas), estimamos a fração de fantasmas de sexo \(s\) numa certa unidade federativa \(u\) como: $$ F_{u,s} \equiv f_{u,s,>2009} - f_{u,s,<2009}. $$ Essa fração resultante \(F_{u,s}\), que esperamos representar a fração de fantasmas dentre as candidaturas no estado \(u\) de um determinado sexo \(s\), é apresentada na figura abaixo:

O gráfico mostra, por exemplo, que aproximadamente 35% das candidaturas femininas na Paraíba são classificadas como fantasmas, o que acontece com apenas 2% das candidaturas masculinas. A existência de candidaturas masculinas fantasmas pode indicar duas coisas diferentes: que houve, ao longo dos anos, um ligeiro acréscimo de 2% no número dessas candidaturas que alcançaram apenas cinco votos, mesmo não sendo fantasmas (talvez por falta de estrutura ou organização da candidatura); ou que existiriam também candidaturas masculinas fantasmas (mas em quantidade muito menor), dado que a Lei nº 12.034/09 também exige um mínimo de candidaturas masculinas. De qualquer forma, a enorme diferença entre candidaturas fantasmas femininas e masculinas evidencia que a primeira é um fenômeno real.

Fantasmas por partido

Aplicamos o mesmo método de análise da seção anterior aos partidos (isto é, trocamos o índice \(u\) representando a unidade federativa por \(p\), representando o partido). Os partidos extintos antes de 2009 foram excluídos da análise, e as siglas apresentadas abaixo são as utilizadas nas eleições de 2016. É importante ressaltar que os partidos com sigla em vermelho na figura abaixo só passaram a existir após 2009, de forma que não é possível calcular \(f_{p,s,<2009}\) para eles. Para contornar esse problema, utilizamos, nesse caso, a média de \(f_{p,s,<2009}\) dos demais partidos. Isso quer dizer que o valor de \(F_{p,s}\) para esses partidos possui incertezas maiores, o que poderia alterar o ordenamento no gráfico. Entretanto, uma comparação com a posição no ranking de fração de candidaturas femininas com cinco ou menos votos indica que essa variação é pequena para a maioria dos casos.

Vemos que a maioria dos partidos apresenta uma fração de candidaturas femininas fantasmas entre 15% e 25% (lembramos que estamos analisando candidaturas a vereador e a deputados em conjunto; a fração de fantasmas dentre deputados é bastante menor do que dentre vereadores). Partidos que se encontram bastante abaixo desses valores são o PSTU, o PCO e o NOVO. No caso do PCO, notamos uma fração negativa de candidaturas classificadas como fantasmas masculinas; isso acontece pois o número dessas candidaturas com cinco ou menos votos caiu com o passar dos anos, podendo indicar uma mudança de estrutura ou organização do partido. No caso do NOVO, nenhuma candidatura obteve cinco votos ou menos em 2016 (único ano em que o partido concorreu até hoje), possivelmente denotando maior organização ou estrutura. Como o valor de \(f_{NOVO,s,<2009}\) foi estimado a partir das médias dos demais partidos, o resultado final foi negativo.

A conexão com o além: interpretando os fantasmas

Na sociedade brasileira em geral (e não apenas na política), espaços e cargos de destaque, prestígio, poder e de alta remuneração são ocupados, via de regra, por pessoas mais velhas, do sexo masculino, brancas, e oriundas de famílias de classe média ou alta. Nesse contexto, vimos que os fantasmas apresentam características associadas a poder e privilégios reduzidos se comparados com as candidaturas que obtém mais de cinco votos: elas são na maioria femininas e, em média, mais negras, mais jovens e com menor escolaridade. Essas características, embora não sejam exatamente iguais, são similares às de candidaturas reais com poucos votos.

Porém, a comparação com as características da população brasileira em geral (quando isso é possível) mostra que não são as candidaturas fantasmas que são selecionadas dentre as categorias menos favorecidas, e sim as candidaturas com mais de cinco votos que compõem uma amostra enviesada (mais favorecida) da população brasileira. Esse quadro se intensifica com o aumento do número de votos recebidos, chegando a uma câmara federal composta por 70% de brancos, 10% de mulheres, 80% com ensino superior e grande presença de advogados, médicos e empresários.

Por fim, podemos notar que a escolaridade estimada das candidaturas fantasmas ainda é superior à da população como um todo. Além disso, o patrimônio declarado (quando declarado) também não é muito discrepante das candidaturas com mais de cinco votos. Assumindo que as pessoas tendem a socializar dentro de sua classe social, nós hipotetizamos que as candidatas fantasmas são, em grande parte, pessoas conhecidas dos candidatos ou candidatas reais. A alta presença de donas de casa, estudantes e aposentados entre os fantasmas pode indicar uma interação entre fantasmas e detentores de poder (entre eles, candidaturas reais) dentro de um círculo familiar. Em outras palavras, a conclusão é simples: parte considerável dos fantasmas provavelmente são familiares, conhecidos e empregados de políticos que atendem a um pedido de favor por parte dos últimos (um possível exemplo é o da mais jovem candidata de 2018).

Prevendo aparições

Apenas com base nos dados do TSE apresentados acima (das eleições entre 2004 e 2016), criamos um modelo matemático para prever quais candidaturas em 2018 teriam 5 votos ou menos. Esse modelo, construído com a ajuda do método de machine learning "XGBoost", foi usado para auxiliar repórteres a identificar candidaturas fantasmas antes das eleições. Aplicamos o modelo aos dados divulgados pelo TSE no dia 16/08/2018, quase dois meses antes das eleições. Se a busca por fantasmas fosse feita completamente às cegas, apenas 1 em cada 20 candidaturas pesquisadas seriam fantasmas. Com a seleção prévia feita pelo nosso modelo, aumentamos as chances de sucesso em 5 vezes: 1 em cada 4 candidaturas selecionadas pelo nosso modelo acabaram de fato obtendo 5 votos ou menos. As reportagens resultantes foram publicadas na revista AzMina e no jornal The Intercept Brasil.