Projetos com dados abertos em git público

Projetos interessantes com a tag “dados abertos” localizados em git público (Github, GitLab e afins). Essa lista não é exaustiva, então sugestões e pedidos de inclusão de projetos são muito bem vindos!

  1. Repositório do serviço de Dados Abertos da Câmara

  2. Aplicação Vue para consumo dos dados abertos do congresso nacional brasileiro.

  3. API GraphQL com os dados da câmara de deputados do Brasil

  4. Leitor de dados públicos da Receita Federal do Brasil em COBOL

  5. Consolidação e filtragem dos arquivos disponibilizados pela Procuradoria Geral da Fazenda Nacional através da Lei de Acesso à Informação

  6. Pacote para automatização de coletas no portal E-Sic, você pode obter os dados sobre as perguntas, respostas e até mesmo baixar os arquivos anexados.

  7. Levantamento de portais estaduais e municipais de transparência e dados abertos, bem como os portais institucionais, obtido a partir de diversas fontes públicas de dados.

  8. Mapeamento de iniciativas (e catálogos) de dados abertos governamentais no Brasil

  9. Dados sobre Instituições Religiosas registradas no Brasil

  10. Código de Roteamento Postal

  11. Ilumina a Prestação de Contas do Tribunal Superior Eleitoral

  12. Financiamento de campanha da Odebrecht

  13. O robô que monitora o acesso aos portais de transparência pública governamentais

  14. Veículo Colaborativo sobre Transparência e Open Data no Brasil.

  15. Artificial Intelligence for social control of public administration

  16. Pacote que trata e organiza os dados do Cadastro Nacional da Pessoa Jurídica (CNPJ)

  17. Projeto de auditoria da Alesp

  18. Extração de dados com Requests para listar empresas do CNEP - Cadastro Nacional de Empresas Punidas

  19. Extração de dados com Selenium + BeautifulSoup para listar pagamentos da Prefeitura do Rio de Janeiro

  20. Extração de dados com Requests para listar pagamentos da FUNDATEC

  21. Extração de dados com Requests para listar Compras e Licitações da Cidade de São Paulo

  22. Extração de dados com Requests para listar pagamentos da SPTRANS

  23. Extração de dados com Requests para listar brasileiros do Bolsa Família

  24. Extração de dados com Requests para listar pagamentos da CETSP

  25. Utilitário em Python para ler os dados públicos do CNPJ disponibilizados pela Receita Federal e carregá-los em arquivos csv ou sqlite para fácil consumo. Também permite consultas com visualização interativa ou exportação para formatos diversos.

  26. DouFinder: Script para pesquisa/alerta de termos no Diário Oficial da União (DOU).

  27. Brazilian government gazettes, accessible to everyone.

  28. Scripts para acesso de APIs de interesse público

  29. Wrapper para a API da Câmara dos Deputados do Brasil || A wrapper for Brazil’s House of Representatives API

  30. Ferramenta do Estadão que monitora o governismo na Câmara dos Deputados

  31. Coletores de dados sobre remunerações do sistema de justiça brasileiro

  32. Sistema para escalonamento e orquestração de execuções, visando a automatização de processos do DadosJusBR

  33. Dados Abertos de Feira

  34. Sistema de auditoria da OPS

  35. Só minha cidade que gasta dinheiro federal assim?

  36. ipeadatapy is a data and metadata extraction package made in Python using Ipeadata database official API.

  37. App para acompanhar os gastos dos deputados federais cearenses

  38. Cliente para consumir os dados abertos disponibilizados pela Câmara dos Deputados.

  39. React Native app that displays information about health facilities in Brazil based on various filters.

  40. facilitar os estudos dos dados disponíveis pela API dados abertos da câmara dos deputados federais.

  41. O @elasnocongresso é um robô criado pela @revistaazmina para acompanhar a tramitação de proposições que tratam dos direitos das mulheres no Congresso Nacional

  42. Dados sobre o Coronavírus no Brasil

  43. Code to clean the RAIS data set (Brazilian matched employer-employee data, 1985-2018)

  44. Análises e tutoriais das bases de dados abertos da Secretaria Municipal de Educação em formato aberto

  45. Projetos com dados abertos no GithubTutorial para acessar a API do Sistema de Orçamento e Finanças _SOF da cidade de São Paulo

  46. Tratamento e análise de dados abertos do Governo Federal do Brasil

  47. Brazilian states 2-letter codes (ISO 3166-2:BR), official abbreviations throughout the country’s history

  48. Brazilian city names and official codes, IBGE, LexML and others

Observação: esta lista começou com projetos no Github, mas a boa sugestão do @ppkrauss chamou atenção para o fato que essa não é a única plataforma “git” existentes. Sugestões de outros lugares são também muito bem vindas.

6 Curtidas

Muito interessante.

Adicionei as tags no github do meu Pacote do CNPJ também.

Pacote que trata e organiza os dados do Cadastro Nacional da Pessoa Jurídica (CNPJ)

1 Curtida

Boa George!

Atualizei a lista com o teu projeto!

Bom dia , @Bruno !!

Gostaria de mencionar dois repositórios que são bastante relacionados a dados abertos.

3 Curtidas

Percebi que alguns projetos utilizam a tag dados-abertos (com hífen) e outros usam dadosabertos (sem hífem). Procurando por ambas as tags é possível encontrar mais resultados.

3 Curtidas

Tem o Dados Abertos de Feira, uma iniciativa para libertar os dados e dar mais transparência a cidade de Feira de Santana (BA).

3 Curtidas

@anapaula e @danielfireman, obrigado pelas indicações! Já adicionei as sugestões na lista!

@herrmann, é verdade. Alguns também “opendata” , “open-data” e “transparencia”. Vou procurar e ir acrescentando os projetos aqui aos poucos.

Acrescentei as tags a alguns meus também:

2 Curtidas

@fecampa, obrigado pelas indicações! Já coloquei na lista!

1 Curtida

Mais dois links e pitacos:

  • Atualmente as pesistent URLs (PURLs)
    http://Datasets.OK.org.br/state-codes dos códigos de regiões e estados do Brasil
    e http://Datasets.OK.org.br/city-codes das cidades do Brasil
    estão sendo gentilmente redirecionados da Open Knowledge Brasil para o Github…

  • … Mas poderia ser para o GitLab ou qualquer outro fornecedor the “git hosting”. A essência são o mecanismo git e a marca OK-BR (seu domínio ), não a marca Github, hoje de propriedade da Microsoft.
    A noção de soberania não vale apenas para nações, vale para uma simples comunidade, a dona da sua cultura e seus produtos abertos. Não precisamos fazer propaganda de terceiros, muito menos ficar reféns deles — e usar nosso PURL ao invés de URL de terceiros, nos liberta!
    … Acho que esse exemplo já explica porque se justificaria mudar o título desta discussão para “Projetos com dados abertos em git público”, o que acham?

  • Muitos dos datasets brasileiros que mantemos podem ser melhor contextualizados e compatibilizados com os sumarizadores globais, do datahub.io/core (atualmente também usando Github)… Alguns elementos de padronização, como a expressão de metadados em padrão Frictionlessdata/data-packages, são consensualmente bons, outros, como o uso do site datahub.io sem integração (falta de padronização para fazer um simples SQL-Join) são consensualmente ruins, como já concluímos no passado com o pessoal mantenedor do Brasil.io.

  • Manter confiáveis e atualizados os datasets como estes do exemplo, para uso mais sério ou profissional, requer gente cuidando e assumindo certa responsabilidade. Para que isso funcione no longo prazo o ideal é trabalhar em parceria com iniciativas como Wikidata e/ou OpenStreetMap (OSM), que de fato já são parceiros e se integram.
    Tecnicamente é um desafio, quem quiser discutir/ajudar estamos buscando uma solução baseada em PostgreSQL e PostgREST para automatizar todo o processo.

Peter

2 Curtidas

Excelentes sugestões de datasets e ponderações, Peter. Concordo com tudo!

@Bruno, o que acha de mudar o título?

1 Curtida

São excelentes sugestões! Mudei o título e adicionei os dois links sugeridos.