… Mas poderia ser para o GitLab ou qualquer outro fornecedor the “git hosting”. A essência são o mecanismo git e a marca OK-BR (seu domínio ), não a marca Github, hoje de propriedade da Microsoft. A noção de soberania não vale apenas para nações, vale para uma simples comunidade, a dona da sua cultura e seus produtos abertos. Não precisamos fazer propaganda de terceiros, muito menos ficar reféns deles — e usar nosso PURL ao invés de URL de terceiros, nos liberta! … Acho que esse exemplo já explica porque se justificaria mudar o título desta discussão para “Projetos com dados abertos em git público”, o que acham?
Muitos dos datasets brasileiros que mantemos podem ser melhor contextualizados e compatibilizados com os sumarizadores globais, do datahub.io/core (atualmente também usando Github)… Alguns elementos de padronização, como a expressão de metadados em padrão Frictionlessdata/data-packages, são consensualmente bons, outros, como o uso do site datahub.io sem integração (falta de padronização para fazer um simples SQL-Join) são consensualmente ruins, como já concluímos no passado com o pessoal mantenedor do Brasil.io.
Manter confiáveis e atualizados os datasets como estes do exemplo, para uso mais sério ou profissional, requer gente cuidando e assumindo certa responsabilidade. Para que isso funcione no longo prazo o ideal é trabalhar em parceria com iniciativas como Wikidata e/ou OpenStreetMap (OSM), que de fato já são parceiros e se integram. Tecnicamente é um desafio, quem quiser discutir/ajudar estamos buscando uma solução baseada em PostgreSQL e PostgREST para automatizar todo o processo.
estou conversando com algumas pessoas sobre a possiblidade de criar um portal para indexar todos esse projetos, com algumas opções de filtro e uma pequena apresentação de cada um deles. Vocês acham que isso faz sentindo? Já me recomendaram conversar com o pessoal do Brasil.io em relação a isso.
Pessoal, para saber a viabilidade da solução que estamos pensando, criamos um formulário para coletar a experiência de algumas pessoas em relação ao desenvolvimento de projetos que utilizem dados públicos.
Se vocês poderem responder ao questionário, vão ajudar muito nessa etapa de prototipação.
Tomei a liberdade de editar para atualizar a lista e incluir o Ro-DOU, o robô que lê e notifica periodicamente por e-mail os resultados de termos de pesquisa no Diário Oficial da União, para ser usado com o Apache Airflow, feito pelo @nitai (e com uma pequena participação minha). A ferramenta também foi apresentada em palestra-relâmpago no Coda.br 2021 e na Semana de Inovação 2021 da Enap.