Os 10 princípios dos Dados Governamentais Abertos

Até hoje eu só tinha ouvido falar das 3 leis e dos 8 princípios de dados abertos, que podem ser conhecidos aqui. Porém o @fredericopranto comentou em outro tópico aqui no fórum e compartilhou este link que apresenta os 10 princípios dos dados abertos. Vi que é na verdade uma atualização dos 8 princípios feita em 2010, mas que deve ter sido mantida mal divulgada, pelo menos pra mim.

Achei que valia a pena e traduzi aqui os 10 princípios dos dados governamentais abertos:

1. Completos:

Os conjuntos de dados divulgados pelo governo devem ser o mais completo poss√≠vel, refletindo a totalidade do que √© guardado sobre um tema espec√≠fico. Todas as informa√ß√Ķes brutas de um conjunto de dados devem ser liberadas para o p√ļblico, exceto na medida necess√°ria para cumprir a Lei de Acesso √† Informa√ß√£o. Os metadados que definem e explicam os dados brutos tamb√©m devem ser inclu√≠dos, juntamente com f√≥rmulas de c√°lculo e explica√ß√Ķes sobre como os dados derivados foram calculados. Isso permitir√° que os usu√°rios compreendam o escopo das informa√ß√Ķes disponibilizadas e examinem cada item de dados com o maior n√≠vel poss√≠vel de detalhes.

2. Prim√°rios

Os conjuntos de dados liberados pelo governo devem ser dados de origem prim√°ria. Isso inclui as informa√ß√Ķes originais coletadas pelo governo, detalhes sobre como os dados foram coletados e os registros de proveni√™ncia originais que atestam a coleta dos dados. A divulga√ß√£o p√ļblica permitir√° que os usu√°rios verifiquem se as informa√ß√Ķes foram coletadas corretamente e registradas com precis√£o.

3. Atuais

Conjuntos de dados divulgados pelo governo devem estar dispon√≠veis ao p√ļblico em tempo h√°bil. Sempre que poss√≠vel, as informa√ß√Ķes coletadas pelo governo devem ser divulgadas t√£o rapidamente quanto coletadas e armazenadas. Prioridade deve ser dada aos dados cuja utilidade √© sens√≠vel ao tempo. Atualiza√ß√Ķes de dados em tempo real maximizam a utilidade que o p√ļblico pode obter dessas informa√ß√Ķes.

4. Facilidade de Acesso F√≠sico e Eletr√īnico

Os conjuntos de dados liberados pelo governo devem ser o mais acess√≠veis poss√≠vel, com o conceito de acessibilidade definido como a facilidade com que as informa√ß√Ķes podem ser obtidas, seja por meios f√≠sicos ou eletr√īnicos. As barreiras ao acesso f√≠sico incluem requisitos para visitar um escrit√≥rio espec√≠fico pessoalmente ou requisitos para cumprir procedimentos espec√≠ficos (como preencher formul√°rios ou enviar solicita√ß√Ķes da LAI). As barreiras ao acesso eletr√īnico e automatizado incluem disponibilizar dados apenas por meio de formul√°rios ou sistemas enviados que exigem tecnologias dependentes de navegador (por exemplo, Flash, Javascript, cookies ou applets Java). Por outro lado, fornecer uma interface para que os usu√°rios baixem todas as informa√ß√Ķes armazenadas em um banco de dados de uma s√≥ vez (conhecido como acesso em lote ou em massa) e formas para fazer consultas espec√≠ficas por meio de uma API tornam os dados muito mais facilmente acess√≠vel. (Um aspecto disso √© a ‚Äúbuscabilidade‚ÄĚ, que √© a capacidade de localizar e baixar conte√ļdo facilmente).

5. Process√°veis por m√°quina

As m√°quinas podem lidar com alguns tipos de entrada muito melhor do que com outros. Por exemplo, notas manuscritas em papel s√£o muito dif√≠ceis de serem processadas pelas m√°quinas. A digitaliza√ß√£o de texto por meio do reconhecimento √≥tico de caracteres (OCR) resulta em muitos erros de correspond√™ncia e formata√ß√£o. As informa√ß√Ķes compartilhadas no formato PDF amplamente usado, por exemplo, s√£o muito dif√≠ceis de serem analisadas pelas m√°quinas. Assim, as informa√ß√Ķes devem ser armazenadas em formatos de arquivo amplamente utilizados que s√£o facilmente processados pelas m√°quinas. (Quando alguma quest√£o dificulta o processamento pela m√°quina, os dados tamb√©m dever√£o estar dispon√≠veis em formatos alternativos amig√°veis para a m√°quina.) Esses arquivos devem ser acompanhados de documenta√ß√£o relacionada ao formato e como us√°-lo em rela√ß√£o aos dados disponibilizados.

6. Não discriminatório

‚ÄúN√£o discrimina√ß√£o‚ÄĚ refere-se a quem pode acessar os dados e como devem faz√™-lo. As barreiras ao uso de dados podem incluir obriga√ß√£o de registro ou vincula√ß√£o. Outra barreira √© o uso do ‚Äújardim murado‚ÄĚ (tradu√ß√£o livre de walled garden), que √© quando apenas alguns aplicativos t√™m permiss√£o para acessar os dados. No seu acesso mais amplo e n√£o discriminat√≥rio aos dados, significa que qualquer pessoa pode acessar aqueles dados a qualquer momento sem ter que se identificar ou fornecer qualquer justificativa para faz√™-lo.

7. Formatos de proprieadade comum ou abertos

Formatos de propriedade comum ou abertos se referem a quem √© o dono do formato no qual os dados est√£o armazenados. Por exemplo, se apenas uma empresa desenvolve o software que pode ler o arquivo no qual os dados est√£o armazenados, o acesso a essas informa√ß√Ķes depende do uso daquele software de processamento daquela empresa. √Äs vezes, esse programa n√£o est√° dispon√≠vel para o p√ļblico a qualquer custo, ou est√° dispon√≠vel, mas por uma taxa. Por exemplo, o Microsoft Excel √© um programa de planilha bastante utilizado que custa dinheiro para sua utiliza√ß√£o. Formatos alternativos dispon√≠veis livremente geralmente existem e com os quais os dados armazenados podem ser acessados sem a necessidade de uma licen√ßa de software. A remo√ß√£o desse custo torna os dados dispon√≠veis para um grupo mais amplo de usu√°rios em potencial.

8. Licenças livres

A obriga√ß√£o de ‚ÄúTermos de Servi√ßo‚ÄĚ, requisitos de atribui√ß√£o, restri√ß√Ķes √† dissemina√ß√£o e assim por diante, atuam como barreiras ao uso p√ļblico de dados. A abertura m√°xima inclui rotular claramente a informa√ß√£o p√ļblica como um trabalho do governo e dispon√≠vel sem restri√ß√Ķes de uso como parte do dom√≠nio p√ļblico.

9. Permanência

A capacidade de encontrar informa√ß√Ķes ao longo do tempo √© chamada de perman√™ncia. As informa√ß√Ķes liberadas pelo governo on-line devem ser fixadas: elas devem estar dispon√≠veis on-line em arquivos perp√©tuos. Muitas vezes, as informa√ß√Ķes s√£o atualizadas, alteradas ou removidas sem qualquer indica√ß√£o de que uma altera√ß√£o foi feita. Ou, ela √© disponibilizada como um fluxo de dados, mas n√£o √© arquivada em nenhum lugar. Para melhor utiliza√ß√£o pelo p√ļblico, as informa√ß√Ķes disponibilizadas on-line devem permanecer on-line, com rastreamento de vers√£o apropriado e arquivamento ao longo do tempo.

10. Custos de utilização

Uma das principais barreiras ao acesso a informa√ß√Ķes amplamente dispon√≠veis √† sociedade √© o custo imposto ao acesso p√ļblico - mesmo quando o custo √© m√≠nimo. Os governos utilizam uma s√©rie de argumentos para cobrar do p√ļblico o acesso aos seus pr√≥prios documentos: custos da cria√ß√£o da informa√ß√£o; custo de financiamento (custo para produzir a informa√ß√£o dividido pelo n√ļmero esperado de pagadores); custo para recuperar as informa√ß√Ķes; custo por p√°gina ou por solicita√ß√£o; custo de processamento; custo de duplica√ß√£o etc.

A maioria das informa√ß√Ķes do governo √© coletada para fins governamentais e a exist√™ncia de taxas de uso tem pouco ou nenhum efeito sobre se o governo coleta as informa√ß√Ķes a priori. A imposi√ß√£o de taxas de acesso distorce o real grupo de quem est√° disposto (ou apto) a acessar informa√ß√Ķes. Tamb√©m pode impedir usos transformadores dos dados que, por sua vez, poderiam gerar crescimento na economia e nas receitas com impostos.

4 Curtidas