Projetos

Os principais projetos realizados em ciência de dados sociais e políticos são apresentados nesta seção

Fediverso e descentralização da Web

A partir de evidências diversas, avaliamos a capacidade do Fediverso, uma federação de plataformas de conteúdo em código aberto, de fazer frente às redes sociais e plataformas centralizadas como Instagram e Youtube.

Censo da Web

A partir de dados globais de acesso a mais de 250 mil domínios, verificamos quais as características predominantes da Web atual. Para quê tem servido a Web?

CORDATA

Criamos uma plataforma online para cadastro e divulgação de casos de uso de dados abertos. Nela, qualquer pessoa pode catalogar trabalhos acadêmicos, matérias jornalísticas, aplicativos e plataformas que tenham feito uso de dados abertos.

Análise de sentimentos bayesiana

Desenvolvemos um novo método de estatística bayesiana para medir a associação entre variáveis categóricas, e a aplicamos a análise de sentimentos em redes sociais.

Violentômetro

Criamos e avaliamos um modelo de IA para identificação de discursos violentos. Ele foi aplicado a tweets direcionados a candidatas nas eleições de 2022.

O uso da Web por candidaturas nas eleições

Analisamos quais plataformas Web são mais utilizadas pelas candidaturas nas eleições brasileiras de 2020 e 2022, a partir de dados do TSE.

Caminho da Escola

Analisamos a execução orçamentária do programa federal de transporte escolar Caminho da Escola, de 2010 a 2022, dando especial atenção aos anos de 2020 em diante.

Orçamento secreto

Raspamos e organizamos dados da execução orçamentária das emendas de relator de 2020 e 2021, também conhecidas como RP9.

Desmontando florestas

Verificamos a relação entre a taxa de desmatamento da amazônia e uma série de variáveis, entre elas o preço de commodities e o investimento público em preservação, no período de 2011 a 2021.

Cláusula de barreira

Como parte de uma nota técnica sobre normas eleitorais, fiz uma projeção de quais partidos correm risco de não alcançar a cláusula de desempenho em 2022.

Os impactos do distritão

Verificamos qual teria sido o resultado das eleições de 2018 para deputados federais caso o sistema eleitoral tivesse sido o sistema majoritário, conhecido como "distritão".

A gestão do MEC em 2020

Contribuí para o 3° Boletim de acompanhamento do MEC da COMEX da Câmara dos Deputados com análises de vacância e rotatividade nos cargos, presença de militares e escolaridade dos comissionados, entre outras.

Laranjômetro

Utilizamos machine learning para identificar candidatas em 2020 que apresentavam risco de serem laranjas, isto é, de estarem inscritas como candidatas apenas para cumprir a cota de gênero.

Militares no governo

Verificamos o número de militares ocupando cargos de confiança no governo, de 2013 a 2021. Os resultados são apresentados mês a mês, por ministério.

A renovação no congresso

Uma retrospectiva do ano de 2019: após analisar o alinhamento geral do congresso com o governo, estudamos o comportamento de grupos de renovação em termos de alinhamento, posicionamento em votações e nível de atividade parlamentar.

A gestão do MEC em 2019

Realizamos uma análise geral da gestão do Ministério da Educação (MEC) no ano de 2019 e dos avanços nas metas do PNE, que foi descrita no relatório da Comissão Externa da câmara dos deputados destinada a acompanhar o desenvolvimento dos trabalhos do MEC.

Alinhamento entre congresso e governo

Com base nas votações de deputados federais e senadores em plenário, criamos um painel interativo de monitoramento ao vivo de alinhamento dos parlamentares ao governo. A porcentagem de votos seguindo a orientação dada é apresentada por parlamentar, partido e unidade federativa.

Painel de atividade parlamentar na câmara

Utilizando os dados abertos da câmara dos deputados , criamos um painel que acompanha ao vivo algumas atividades parlamentares como relatorias assumidas, relatorias entregues, apresentação de proposições, pedidos de audiência pública e requerimentos de informação.

Painel de atividade parlamentar no senado

Utilizando os dados abertos do senado federal, criamos um painel que acompanha ao vivo algumas atividades parlamentares como relatorias assumidas, relatorias entregues, apresentação de proposições, pedidos de audiência pública e requerimentos de informação.

Temas quentes no congresso

Levantamos todas as proposições apresentadas na câmara dos deputados (Projetos de lei, Propostas de emenda à constituição, entre outros) e as apresentamos neste painel, onde os temas mais em voga em diferentes anos, partidos e unidades federativas podem ser comparados.

100 dias do congresso

Analisamos os 100 primeiros dias do congresso nacional e os comparamos com o comportamento histórico em termos de alinhamento com o governo, fidelidade partidária, distribuição de cargos, uso da cota parlamentar e temas das proposições.

DOUTOR

Criamos um código que monitora o Diário Oficial da União (DOU), filtra as matérias e as publica no Slack. Também criamos um modelo de NLP que identifica as matérias mais relevantes dentre as publicadas diariamente.

Vidas desiguais

Utilizando dados do SUS, nós desenvolvemos uma metodologia própria e identificamos quais causas de morte contribuem mais para a assustadora diferença de 24 anos entre as expectativas de vida nos diferentes distritos da cidade de São Paulo.

Candidatas fantasmas

Com dados do Tribunal Superior Eleitoral (TSE), nós traçamos um perfil das candidatas fantasmas (que só são candidatas para cumprir a legislação e não concorrem de verdade) e identificamos com antescedência, utilizando machine learning, potenciais casos nas eleições de 2018.