As 5 estrelas dos dados abertos

belisario · Agosto 1, 2019, 10:33pm

Oi pessoal,

Muito bacana a reflexão. Ultimamente, estava pensando sobre esta classificação, ao preparar uns materiais de aula. De fato, como a discussão aqui mostra, existem diferentes esquemas interpretativos para se definir “dados abertos” e, partindo de premissas diferentes, chegaremos a conclusões distintas.

Sobre a questão inicial, eu gosto de pensar em graus diferentes de abertura e a classificação das 5 estrelas me parece especialmente interessante por apontar para isto, ao invés de uma abordagem interpretativa binária/categórica - que considero mais suscetível a se distanciar da prática.

Salvo engano, o modelo surgiu em 2010 como um acréscimo do Berners-Lee ao seu texto sobre "Linked Data : w3.org/DesignIssues/LinkedData.html

Adotando a definição inicial do artigo, mesmo um PDF publicado com licença aberta já seria considerado como “dado aberto”. A questão então passa a ser: o que é uma licença aberta?

Se levarmos em consideração a definição atual da Open Knowledge (versão 2.1 criada em 2015 e citada no post inicial), então caíriamos em uma aparente contradição, pois esta licença exige como pré-requisito os atributos da 2a e 3a estrela do modelo de 2010 do Tim Berners-Lee, como apontou o Augusto.

No entanto, adotando definições diferentes podemos chegar a outras conclusões. Por exemplo, a licença Creative Commons BY - que é citada no artigo do Tim - é uma licença aberta que não exige estes pré-requisitos.

Em geral, ao falar sobre o modelo dos ‘dados abertos 5 estrelas’ segundo o modelo original do Berners-Lee, eu costumo explicar a taxonomia segundo os critérios adotados por ele, mas mais recentemente decidi utilizar a imagem que foi gerada a partir do post do Nitai, ao invés da original em inglês, justamente por ele introduzir um elemento novo, a definição da LAI, que já incopora a importância dos formatos abertos e da legibilidade por máquinas.

Enfim, a meu ver, não existe propriamente uma contradição. Vejo apenas diferentes esquemas interpretativos, frutos de processos históricos distintos, talvez até mostrando um amadurecimento das demandas e discussões em torno do tema.

Isso me parece ter a ver também com a reflexão sobre a quarta estrela que estava fazendo ao preparar os materiais de aula. Me parece que um lado existe a definição original da classificação das 5 estrelas segundo a qual ela se define pelo uso do padrão RDF, tendo por consequência a possibilidade de se identificar os dados por uma URI.

Por outro lado, uma corrente interpretativa do modelo que enfatiza mais a URI do que o formato RDF, vide o texto do Nitai, por exemplo. Neste sentido, entendendo que a URI se refere aos dados e não a um arquivo, penso que um serviço de provimento de dados em JSON via API poderia ser enquadrado como “4 estrelas”, segundo uma interpretação contemporânea do modelo proposto pelo Berners-Lee.

Por fim, gostaria de compartilhar aqui um tutorial/Quizz sobre o tema que preparei um tempo atrás, mas ainda não foi publicado: Quizz: As cinco estrelas dos Dados Abertos | H5P

Ainda preciso finalizar e fazer algumas coisas, mas adoraria os feedbacks de vocês! : )