Livro leva a discussão sobre dados abertos aos editores científicos

O livro “Tópicos sobre dados abertos para editores científicos” foi lançado na última sexta-feira (6/3/2020), durante o evento Open Data Day, no Rio de Janeiro. É uma publicação da Associação Brasileira de Editores Científicos – ABEC Brasil organizada por Milton Shintaku, Luana Farias Sales e Michelli Costa.

São abordados no livro os tópicos de ciência aberta, gestão de dados de pesquisa, os repositórios e um panorama sobre os aspectos legais dessa prática. O objetivo é apoiar os periódicos científicos brasileiros na adoção dessas práticas.

O livro está disponível abertamente no site da ABEC Brasil, sob uma licença Creative Commons 4.0 Atribuição. É também um dos resultados do 4º Plano de Ação do Brasil na Parceria para Governo Aberto.

2 curtidas

Muitos dos autores em revistas científicas são funcionários públicos federais, como por exemplo professores em universidades federais. Estariam eles obrigados a licenciar suas bases de dados nos termos do Decreto 9.903/2019? Levanto essa discussão em:

Isso depende de uma série de fatores. As bases de dados usadas para a pesquisa podem estar protegidos pelas hipóteses de sigilo previstas na LAI, podem conter dados pessoais, etc. Depois de afastadas todas essas hipóteses, tem que se avaliar se o detentor de direitos autorais patrimoniais é a União. Já vi jurisprudência no sentido do que é feito por funcionário público no exercício de sua função pertence ao ente público. Então, aparentemente, nesses casos, não havendo outros impedimentos à divulgação dos dados, creio que se aplicaria o licenciamento automático pelo decreto, sim.

Então, segundo o que argumentei lá no outro tópico citado por você, não poderia, por exemplo, impedir o uso comercial dos dados ou proibir trabalhos derivados.

De qualquer forma, essa livre disponibilização das bases de dados estaria de acordo com o que defende o movimento do Open Access / Ciência Aberta e contribuiria para a reprodutibilidade da pesquisa e estimularia o desenvolvimento de novos trabalhos baseados nos resultados alcançados.

Ótima iniciativa, mais um livro aberto e incentivando o Open Access dos conteúdos científicos e os dados abertos!


Meu interesse é técnico, e posso avaliar o livro dentro dos assuntos técnicos apenas… Bom, confesso que fiquei meio decepcionado de não encontrar coisas que considero importantes ao menos para serem citadas nesse tipo de lirvo…

Procurei por três temas que acredito que sejam fundamentais nos dias de hoje para se garantir “dados abertos” no conteúdo científico:

  1. Recomendação de uso de formato adequado à publicação científica, sua estrutura e seus metadados. O padrão existe e é 5 estrelas… É até parecido, mas não é o HTML (muito menos doc do MS-Word). O padrão tem expressividade maior, se chama JATS.
    Pelo mundo são mais de 6 milhões de artigos científicos 100% abertos em JATS, provenientes de revistas internacionais sérias (defendem minimamente a reputação científica do seu ISSN e DOI) e controlados por revisão por pares (nem sempre) transparente.
    No Brasil, por empenho da FAPESP e CNPq, são centenas de milhares de artigos JATS.

    1.1. Para o HTML ainda estão nascendo os padrões da Web Semântica, no futuro espera-se migrar o formato XML-JATS para um equivalente de “HTML marcado com semântica”. Isso requer, de um lado um bom “vocabulário semântico” (ontologia), de outro o padrão já consolidado de marcação (RDFa e suas variantes tais como Microdata). O vocabulário mais popular e promissor, onde temos inclusive a liberdade de discutir via Git, é o Schema.org. Vide https://schema.org/ScholarlyArticle

  2. Recomendações para a publicação de dados:

    2.1. Em bancos de dados públicos: o que estamos carecas de discutir aqui… Mas vai muito além de um CKAN científico. Áreas como Meteorologia, Astronomia, Genética, etc. não teriam avançado tanto nos últimos 20 anos sem consórcios para a padronização e manutenção de grandes bancos de dados unificados. O autor simplesmente cita no artigo o dataset ou query que utilizou, não precisa publicar ou anexar terabytes de dados.

    2.2. Em suas próprias tabelas e demais “materiais suplementares”. Por exemplo o artigo em JATS pode ceder o conteúdo da sua tabela alternativamente em CSV.
    Materiais suplementares, a rigor, são aqueles que precisam ser digitalmente preservados, mas não precisam circular junto com o artigo… São links ou URNs para planilhas, vídeos, etc. Aqui um clássico com esses materiais no final e seu JATS republicado no PMC.

Apesar da ABEC conhecer a relevância desses tópicos, não vi eles citados diretamente no livro. Quanto à marcação semântica não citaram o SchemaOrg, apenas o seu ancestral restrito a citações bibliográficas, o DCTerms originado pelo Dublin Core.


Resumo da dica técnica de “ciência como dado aberto”, que não vi no livro:

1 curtida