Os principais projetos realizados em ciência de dados sociais e políticos são apresentados nesta seção
A partir de evidências diversas, avaliamos a capacidade do Fediverso, uma federação de plataformas de conteúdo em código aberto, de fazer frente às redes sociais e plataformas centralizadas como Instagram e Youtube.
A partir de dados globais de acesso a mais de 250 mil domínios, verificamos quais as características predominantes da Web atual. Para quê tem servido a Web?
Criamos uma plataforma online para cadastro e divulgação de casos de uso de dados abertos. Nela, qualquer pessoa pode catalogar trabalhos acadêmicos, matérias jornalísticas, aplicativos e plataformas que tenham feito uso de dados abertos.
Desenvolvemos um novo método de estatística bayesiana para medir a associação entre variáveis categóricas, e a aplicamos a análise de sentimentos em redes sociais.
Criamos e avaliamos um modelo de IA para identificação de discursos violentos. Ele foi aplicado a tweets direcionados a candidatas nas eleições de 2022.
Analisamos quais plataformas Web são mais utilizadas pelas candidaturas nas eleições brasileiras de 2020 e 2022, a partir de dados do TSE.
Analisamos a execução orçamentária do programa federal de transporte escolar Caminho da Escola, de 2010 a 2022, dando especial atenção aos anos de 2020 em diante.
Raspamos e organizamos dados da execução orçamentária das emendas de relator de 2020 e 2021, também conhecidas como RP9.
Verificamos a relação entre a taxa de desmatamento da amazônia e uma série de variáveis, entre elas o preço de commodities e o investimento público em preservação, no período de 2011 a 2021.
Como parte de uma nota técnica sobre normas eleitorais, fiz uma projeção de quais partidos correm risco de não alcançar a cláusula de desempenho em 2022.
Verificamos qual teria sido o resultado das eleições de 2018 para deputados federais caso o sistema eleitoral tivesse sido o sistema majoritário, conhecido como "distritão".
Contribuí para o 3° Boletim de acompanhamento do MEC da COMEX da Câmara dos Deputados com análises de vacância e rotatividade nos cargos, presença de militares e escolaridade dos comissionados, entre outras.
Utilizamos machine learning para identificar candidatas em 2020 que apresentavam risco de serem laranjas, isto é, de estarem inscritas como candidatas apenas para cumprir a cota de gênero.
Verificamos o número de militares ocupando cargos de confiança no governo, de 2013 a 2021. Os resultados são apresentados mês a mês, por ministério.
Uma retrospectiva do ano de 2019: após analisar o alinhamento geral do congresso com o governo, estudamos o comportamento de grupos de renovação em termos de alinhamento, posicionamento em votações e nível de atividade parlamentar.
Realizamos uma análise geral da gestão do Ministério da Educação (MEC) no ano de 2019 e dos avanços nas metas do PNE, que foi descrita no relatório da Comissão Externa da câmara dos deputados destinada a acompanhar o desenvolvimento dos trabalhos do MEC.
Com base nas votações de deputados federais e senadores em plenário, criamos um painel interativo de monitoramento ao vivo de alinhamento dos parlamentares ao governo. A porcentagem de votos seguindo a orientação dada é apresentada por parlamentar, partido e unidade federativa.
Utilizando os dados abertos da câmara dos deputados , criamos um painel que acompanha ao vivo algumas atividades parlamentares como relatorias assumidas, relatorias entregues, apresentação de proposições, pedidos de audiência pública e requerimentos de informação.
Utilizando os dados abertos do senado federal, criamos um painel que acompanha ao vivo algumas atividades parlamentares como relatorias assumidas, relatorias entregues, apresentação de proposições, pedidos de audiência pública e requerimentos de informação.
Levantamos todas as proposições apresentadas na câmara dos deputados (Projetos de lei, Propostas de emenda à constituição, entre outros) e as apresentamos neste painel, onde os temas mais em voga em diferentes anos, partidos e unidades federativas podem ser comparados.
Analisamos os 100 primeiros dias do congresso nacional e os comparamos com o comportamento histórico em termos de alinhamento com o governo, fidelidade partidária, distribuição de cargos, uso da cota parlamentar e temas das proposições.
Criamos um código que monitora o Diário Oficial da União (DOU), filtra as matérias e as publica no Slack. Também criamos um modelo de NLP que identifica as matérias mais relevantes dentre as publicadas diariamente.
Utilizando dados do SUS, nós desenvolvemos uma metodologia própria e identificamos quais causas de morte contribuem mais para a assustadora diferença de 24 anos entre as expectativas de vida nos diferentes distritos da cidade de São Paulo.
Com dados do Tribunal Superior Eleitoral (TSE), nós traçamos um perfil das candidatas fantasmas (que só são candidatas para cumprir a legislação e não concorrem de verdade) e identificamos com antescedência, utilizando machine learning, potenciais casos nas eleições de 2018.