Laranjômetro

Identificamos candidatas com risco de serem laranjas nas eleições de 2020.

Mulheres com rosto substituído por laranjas

Descrição

Desde 2009, a legislação eleitoral exige que, do total das candidaturas apresentadas por uma coligação em uma eleição proporcional, um mínimo de 30% deve ser reservada a cada sexo. Na grande maioria dos casos, isso se traduz numa cota mínima de 30% de candidaturas femininas, dado que a ampla maioria das candidaturas apresentadas pelas coligações tende a ser de homens. Para poder apresentar o máximo possível de candidaturas masculinas, as coligações sem um número suficiente de candidatas mulheres fazem uso das ​candidaturas laranjas: são mulheres que apenas se inscrevem (ou são inscritas) como candidatas (cumprindo formalmente a cota) mas não fazem campanha e acabam, muitas vezes, obtendo zero votos.

O projeto Laranjômetro foi realizado no Gabinete Compartilhado do Movimento Acredito no Congresso Nacional. Ele consistiu na identificação, antes da realização das eleições municipais de 2020: de candidatas com risco de serem laranjas; de coligações com risco de estarem utilizando laranjas para cumprir a cota de gênero; e de coligações que não atingiram o mínimo de candidatas mulheres exigido em lei. Para fazer essa identificação, utilizamos dados do TSE, além de indicadores sócio-econômicos dos municípios brasileiros.

Resultados

Nós criamos um modelo de machine learning denominado Random Forest para classificar candidaturas femininas em "prováveis laranjas" e "prováveis regulares". Nesse processo, identificamos diversas características que, em conjunto, são mais frequentes entre laranjas (embora existam candidatas regulares com essas características e candidatas laranjas com características diversas). Ao testar o modelo em dados de 2016, obtivemos uma precisão de 63% ao selecionar cerca de 2.500 candidatas como possíveis laranjas e uma precisão de 90% ao selecionar cerca de 200 coligações com risco de estarem utilizando laranjas. Estimamos para 2020 a existência de no mínimo 5 mil candidaturas laranjas em todo Brasil, embora nosso modelo apenas identifique uma pequena parcela dessas candidaturas. Também identificamos aproximadamente 700 coligações que não possuíam o mínimo de candidatas mulheres aptas exigido em lei.

Nós também verificamos que o modelo apresenta um víes de algoritmo: ao selecionar possíveis candidatas laranjas, ele seleciona com maior frequência candidatas mais jovens, menos escolarizadas, do nordeste e de classe social mais baixa (inclusive em comparação com o próprio perfil das candidatas laranjas). Além disso, ele também seleciona candidatas negras com mais frequência do que a incidência destas entre as laranjas, mesmo que essa característica (de raça) não seja utilizada pelo modelo. Esse viés (na realidade, um preconceito) se traduz numa probabilidade três vezes maior do modelo apontar, erroneamente, uma candidata real como sendo laranja quando essa candidata é negra (em comparação com quando essa candidata real é branca). Para mitigar esse problema, aplicamos uma reamostragem com pesos às candidaturas selecionadas pelo modelo e selecionamos uma subamostra com características médias mais próximas das laranjas reais.

Maiores detalhes sobre esse estudo podem ser encontrados nesta nota técnica. Ele serviu de base para uma série de reportagens jornalísticas, sendo a do Estado de S. Paulo a principal. Os responsáveis pela reportagem receberam de nós uma lista de 50 possíveis candidatas laranjas. Dessas, tentaram entrar em contato com 20 e receberam retorno de 3. Todas as três confirmaram ser laranjas. O estudo também serviu de subsídio para a fiscalização realizada pelo Ministério Público Federal em 2020 e foi destaque do Jornal da Cultura (veja abaixo).