Já pensou em usar processamento de linguagem natural para identificar tendências regionais, partidárias ou do perfil de candidatos, correlacionados a políticas públicas? A(o)s candidata(o)s a prefeita(o) são obrigados a apresentar ao TSE o seu Plano de Governo. O TSE, por sua vez, só possibilita consultá-los um por um.
Foi aí que a @anapaula Gomes e eu tivemos a ideia de baixar os mais de 17 mil documentos usando a API DivulgaCandContas e disponibilizar tudo para download de uma forma que fosse fácil para pesquisadores utilizarem esses dados e fazerem as suas análises.
Um desafio interessante será produzir análises e visualizações esta semana, antes do primeiro turno das eleições.
Saberia me dizer se existe uma API ara extração dos resultados das eleições?
Eu encontrei um site com algumas informações, mas não é um domínio de fácil acesso e servidor muito lento.
Se não existe, gostaria de propor pra comunidade a criação da mesma.
Sim, o Brasil.io tem os resultados das votações, mas o @turicas ainda não conseguiu subir os dados de 2020. Não sei se o motivo é a lentidão da fonte oficial ou se é só porque está ocupado com outras coisas mesmo.
Falando nisso, ainda estou aqui com os mais de 7 GB de PDFs dos planos de governo que são o assunto deste tópico, procurando um local apropriado para fazer o upload. Se o @turicas concordar, posso subir isso lá no Brasil.io. Será útil para fazer o OCR das propostas que faltaram neste dataset, ou mesmo para conferir o documento original, avaliar a presença de imagens ou outros tipos de análise que não sejam do texto em si.
Pessoal, para quem quiser baixar os 7 GB contendo todos os mais de 17 mil planos de governo, já subi o arquivo em um servidor. Basta seguir o link que está no repositório do Github e baixar!
Atualizei ontem a documentação da API DivulgaCandContas do TSE para incluir as consultas de eleições e de ano eleitoral. Além disso, a documentação da API foi atualizada para o padrão OpenAPI versão 3.0.1. O link para essa documentação está na postagem inicial deste tópico.
Agradecimentos ao Alex dos Santos Xavier por encontrar e sugerir a inclusão desses outros métodos. Provavelmente ainda há muitos outros a incluir.
Para quem estiver procurando por um projeto interessante, eis aqui uma ideia: atualizar os dados de planos de governo de candidatas e candidatos às prefeituras brasileiras para as eleições de 2024.
Hoje em dia, com a disponibilidade de IA generativa e LLMs de diversos tipos, é possível fazer algo bem mais significativo.
Infelizmente, eu mesmo estou sem tempo para fazer isso antes das eleições, senão eu faria.