Dados de planos de governo de candidatos às prefeituras dos municípios em 2020

Já pensou em usar processamento de linguagem natural para identificar tendências regionais, partidárias ou do perfil de candidatos, correlacionados a políticas públicas? A(o)s candidata(o)s a prefeita(o) são obrigados a apresentar ao TSE o seu Plano de Governo. O TSE, por sua vez, só possibilita consultá-los um por um.

Foi aí que a @anapaula Gomes e eu tivemos a ideia de baixar os mais de 17 mil documentos usando a API DivulgaCandContas e disponibilizar tudo para download de uma forma que fosse fácil para pesquisadores utilizarem esses dados e fazerem as suas análises.

Um desafio interessante será produzir análises e visualizações esta semana, antes do primeiro turno das eleições.

Seguem os dados:

2 Curtidas

Saberia me dizer se existe uma API ara extração dos resultados das eleições?
Eu encontrei um site com algumas informações, mas não é um domínio de fácil acesso e servidor muito lento.

Se não existe, gostaria de propor pra comunidade a criação da mesma.

Sim, o Brasil.io tem os resultados das votações, mas o @turicas ainda não conseguiu subir os dados de 2020. Não sei se o motivo é a lentidão da fonte oficial ou se é só porque está ocupado com outras coisas mesmo.

É uma situação semelhante aos dados de empresas divulgados pela RFB, que nos servidores oficiais é muito lento, mas que o Brasil.io oferece uma cópia para download.

Falando nisso, ainda estou aqui com os mais de 7 GB de PDFs dos planos de governo que são o assunto deste tópico, procurando um local apropriado para fazer o upload. Se o @turicas concordar, posso subir isso lá no Brasil.io. Será útil para fazer o OCR das propostas que faltaram neste dataset, ou mesmo para conferir o documento original, avaliar a presença de imagens ou outros tipos de análise que não sejam do texto em si.