Os 10 princípios dos Dados Governamentais Abertos

Até hoje eu só tinha ouvido falar das 3 leis e dos 8 princípios de dados abertos, que podem ser conhecidos aqui. Porém o @fredericopranto comentou em outro tópico aqui no fórum e compartilhou este link que apresenta os 10 princípios dos dados abertos. Vi que é na verdade uma atualização dos 8 princípios feita em 2010, mas que deve ter sido mantida mal divulgada, pelo menos pra mim.

Achei que valia a pena e traduzi aqui os 10 princípios dos dados governamentais abertos:

1. Completos:

Os conjuntos de dados divulgados pelo governo devem ser o mais completo possível, refletindo a totalidade do que é guardado sobre um tema específico. Todas as informações brutas de um conjunto de dados devem ser liberadas para o público, exceto na medida necessária para cumprir a Lei de Acesso à Informação. Os metadados que definem e explicam os dados brutos também devem ser incluídos, juntamente com fórmulas de cálculo e explicações sobre como os dados derivados foram calculados. Isso permitirá que os usuários compreendam o escopo das informações disponibilizadas e examinem cada item de dados com o maior nível possível de detalhes.

2. Primários

Os conjuntos de dados liberados pelo governo devem ser dados de origem primária. Isso inclui as informações originais coletadas pelo governo, detalhes sobre como os dados foram coletados e os registros de proveniência originais que atestam a coleta dos dados. A divulgação pública permitirá que os usuários verifiquem se as informações foram coletadas corretamente e registradas com precisão.

3. Atuais

Conjuntos de dados divulgados pelo governo devem estar disponíveis ao público em tempo hábil. Sempre que possível, as informações coletadas pelo governo devem ser divulgadas tão rapidamente quanto coletadas e armazenadas. Prioridade deve ser dada aos dados cuja utilidade é sensível ao tempo. Atualizações de dados em tempo real maximizam a utilidade que o público pode obter dessas informações.

4. Facilidade de Acesso Físico e Eletrônico

Os conjuntos de dados liberados pelo governo devem ser o mais acessíveis possível, com o conceito de acessibilidade definido como a facilidade com que as informações podem ser obtidas, seja por meios físicos ou eletrônicos. As barreiras ao acesso físico incluem requisitos para visitar um escritório específico pessoalmente ou requisitos para cumprir procedimentos específicos (como preencher formulários ou enviar solicitações da LAI). As barreiras ao acesso eletrônico e automatizado incluem disponibilizar dados apenas por meio de formulários ou sistemas enviados que exigem tecnologias dependentes de navegador (por exemplo, Flash, Javascript, cookies ou applets Java). Por outro lado, fornecer uma interface para que os usuários baixem todas as informações armazenadas em um banco de dados de uma só vez (conhecido como acesso em lote ou em massa) e formas para fazer consultas específicas por meio de uma API tornam os dados muito mais facilmente acessível. (Um aspecto disso é a “buscabilidade”, que é a capacidade de localizar e baixar conteúdo facilmente).

5. Processáveis por máquina

As máquinas podem lidar com alguns tipos de entrada muito melhor do que com outros. Por exemplo, notas manuscritas em papel são muito difíceis de serem processadas pelas máquinas. A digitalização de texto por meio do reconhecimento ótico de caracteres (OCR) resulta em muitos erros de correspondência e formatação. As informações compartilhadas no formato PDF amplamente usado, por exemplo, são muito difíceis de serem analisadas pelas máquinas. Assim, as informações devem ser armazenadas em formatos de arquivo amplamente utilizados que são facilmente processados pelas máquinas. (Quando alguma questão dificulta o processamento pela máquina, os dados também deverão estar disponíveis em formatos alternativos amigáveis para a máquina.) Esses arquivos devem ser acompanhados de documentação relacionada ao formato e como usá-lo em relação aos dados disponibilizados.

6. Não discriminatório

“Não discriminação” refere-se a quem pode acessar os dados e como devem fazê-lo. As barreiras ao uso de dados podem incluir obrigação de registro ou vinculação. Outra barreira é o uso do “jardim murado” (tradução livre de walled garden), que é quando apenas alguns aplicativos têm permissão para acessar os dados. No seu acesso mais amplo e não discriminatório aos dados, significa que qualquer pessoa pode acessar aqueles dados a qualquer momento sem ter que se identificar ou fornecer qualquer justificativa para fazê-lo.

7. Formatos de proprieadade comum ou abertos

Formatos de propriedade comum ou abertos se referem a quem é o dono do formato no qual os dados estão armazenados. Por exemplo, se apenas uma empresa desenvolve o software que pode ler o arquivo no qual os dados estão armazenados, o acesso a essas informações depende do uso daquele software de processamento daquela empresa. Às vezes, esse programa não está disponível para o público a qualquer custo, ou está disponível, mas por uma taxa. Por exemplo, o Microsoft Excel é um programa de planilha bastante utilizado que custa dinheiro para sua utilização. Formatos alternativos disponíveis livremente geralmente existem e com os quais os dados armazenados podem ser acessados sem a necessidade de uma licença de software. A remoção desse custo torna os dados disponíveis para um grupo mais amplo de usuários em potencial.

8. Licenças livres

A obrigação de “Termos de Serviço”, requisitos de atribuição, restrições à disseminação e assim por diante, atuam como barreiras ao uso público de dados. A abertura máxima inclui rotular claramente a informação pública como um trabalho do governo e disponível sem restrições de uso como parte do domínio público.

9. Permanência

A capacidade de encontrar informações ao longo do tempo é chamada de permanência. As informações liberadas pelo governo on-line devem ser fixadas: elas devem estar disponíveis on-line em arquivos perpétuos. Muitas vezes, as informações são atualizadas, alteradas ou removidas sem qualquer indicação de que uma alteração foi feita. Ou, ela é disponibilizada como um fluxo de dados, mas não é arquivada em nenhum lugar. Para melhor utilização pelo público, as informações disponibilizadas on-line devem permanecer on-line, com rastreamento de versão apropriado e arquivamento ao longo do tempo.

10. Custos de utilização

Uma das principais barreiras ao acesso a informações amplamente disponíveis à sociedade é o custo imposto ao acesso público - mesmo quando o custo é mínimo. Os governos utilizam uma série de argumentos para cobrar do público o acesso aos seus próprios documentos: custos da criação da informação; custo de financiamento (custo para produzir a informação dividido pelo número esperado de pagadores); custo para recuperar as informações; custo por página ou por solicitação; custo de processamento; custo de duplicação etc.

A maioria das informações do governo é coletada para fins governamentais e a existência de taxas de uso tem pouco ou nenhum efeito sobre se o governo coleta as informações a priori. A imposição de taxas de acesso distorce o real grupo de quem está disposto (ou apto) a acessar informações. Também pode impedir usos transformadores dos dados que, por sua vez, poderiam gerar crescimento na economia e nas receitas com impostos.

4 curtidas

É interessante observar que o PL 2.224/2021, que prevê a cobrança pelo acesso a dados abertos, viola diretamente o princípio n.º 10, dos custos de utilização.

Este é justamente um dos princípios que entraram depois e por isso é menos divulgado. Até hoje o próprio portal dados.gov.br ainda divulga apenas os 8 princípios originais.

Nesse contexto, torna-se ainda mais importante divulgar os 2 princípios que foram adicionados nessa atualização.