Projetos interessantes com a tag “dados abertos” localizados em git público (Github, GitLab e afins). Essa lista não é exaustiva, então sugestões e pedidos de inclusão de projetos são muito bem vindos!
Pra facilitar a navegação na lista, estou gradativamente organizando os projetos por temas. Em razão disso, a numeração original ficou prejudicada. Aceito sugestões.
Observação 1: esta lista começou com projetos no Github, mas a boa sugestão do @ppkrauss chamou atenção para o fato que essa não é a única plataforma “git” existentes. Sugestões de outros lugares são também muito bem vindas.
Observação: 2: as categorias listadas acima não têm a pretensão de serem perfeitas. A ideia central é organizar os assuntos numa temática relativamente conexa para facilitar a busca.
Percebi que alguns projetos utilizam a tag dados-abertos (com hífen) e outros usam dadosabertos (sem hífem). Procurando por ambas as tags é possível encontrar mais resultados.
… Mas poderia ser para o GitLab ou qualquer outro fornecedor the “git hosting”. A essência são o mecanismo git e a marca OK-BR (seu domínio ), não a marca Github, hoje de propriedade da Microsoft. A noção de soberania não vale apenas para nações, vale para uma simples comunidade, a dona da sua cultura e seus produtos abertos. Não precisamos fazer propaganda de terceiros, muito menos ficar reféns deles — e usar nosso PURL ao invés de URL de terceiros, nos liberta! … Acho que esse exemplo já explica porque se justificaria mudar o título desta discussão para “Projetos com dados abertos em git público”, o que acham?
Muitos dos datasets brasileiros que mantemos podem ser melhor contextualizados e compatibilizados com os sumarizadores globais, do datahub.io/core (atualmente também usando Github)… Alguns elementos de padronização, como a expressão de metadados em padrão Frictionlessdata/data-packages, são consensualmente bons, outros, como o uso do site datahub.io sem integração (falta de padronização para fazer um simples SQL-Join) são consensualmente ruins, como já concluímos no passado com o pessoal mantenedor do Brasil.io.
Manter confiáveis e atualizados os datasets como estes do exemplo, para uso mais sério ou profissional, requer gente cuidando e assumindo certa responsabilidade. Para que isso funcione no longo prazo o ideal é trabalhar em parceria com iniciativas como Wikidata e/ou OpenStreetMap (OSM), que de fato já são parceiros e se integram. Tecnicamente é um desafio, quem quiser discutir/ajudar estamos buscando uma solução baseada em PostgreSQL e PostgREST para automatizar todo o processo.
estou conversando com algumas pessoas sobre a possiblidade de criar um portal para indexar todos esse projetos, com algumas opções de filtro e uma pequena apresentação de cada um deles. Vocês acham que isso faz sentindo? Já me recomendaram conversar com o pessoal do Brasil.io em relação a isso.
Pessoal, para saber a viabilidade da solução que estamos pensando, criamos um formulário para coletar a experiência de algumas pessoas em relação ao desenvolvimento de projetos que utilizem dados públicos.
Se vocês poderem responder ao questionário, vão ajudar muito nessa etapa de prototipação.