A plataforma Lattes de currículos acadêmicos tem uma longa história de controvérsias com o movimento dos dados abertos. Há muitos anos, pesquisadores desejam utilizar os dados da plataforma para fazer medições da produção científica e acadêmica no Brasil, identificar as redes de relacionamento, etc. (exemplo). O currículo Lattes sempre esteve disponível publicamente para qualquer pessoa consultar, mas individualmente, um por um, o que não atende a essas necessidades de estudos.
Desde muito antes de virar moda remover dados da transparência dando como desculpa a LGPD, ou melhor, desde muito antes de existir a LGPD, o CNPq sempre alegou razões de privacidade para não disponibilizar como dados abertos a parte das informações do Lattes que são públicas, por exemplo, as publicações de livros e artigos (as quais já são pública e voluntariamente disponibilizadas), confundindo-as com informações pessoais.
Em vez disso, o CNPq dá acesso às instituições acadêmicas para consultar o Lattes via API, mas somente os dados relacionados a pesquisadores e à produção da própria instituição. Em razão disso, algumas instituições de ensino e pesquisa (ex.: IFSP, IFB, UFLA, UFOB, UFSM, UFRN) já se adiantam e abrem a fatia dos dados do Lattes que lhes pertencem como dados abertos e os publicam no portal dados.gov.br.
A cobrança pela sociedade pela abertura dos dados do Lattes é uma demanda antiga, como se pode ver nesse artigo escrito em junho de 2013 no blog da Open Knowledge Brasil, que explica bem as razões pelas quais esses dados deveriam ser abertos:
https://ok.org.br/noticia/acesso-a-base-lattes-completa-o-cerco-esta-fechando-ao-cnpq/
Essa demanda também já foi apresentada mais de uma vez como proposta da sociedade civil ao governo no âmbito da Parceria para Governo Aberto, tendo sempre resposta negativa por parte do CNPq, no que se refere ao acesso automatizado como dados abertos.
Algumas instituições de ensino e pesquisa, têm, diante dessa situação, procurado fazer raspagem de dados. Algumas vezes, o código é compartilhado, como neste exemplo disponível no Github.
Entretanto, o CNPq tem despendido esforços em coibir a prática. Primeiro com o uso de ferramentas de CAPTCHA, visando barrar o acesso automatizado. Agora com a alteração dos termos de uso da Plataforma Lattes pela Portaria CNPq n.º 976, de 4 de agosto de 2022:
xiii. O usuário concorda que não usará robôs, sistemas de varredura e armazenamento de dados (como “spiders” ou “scrapers”), links escondidos ou qualquer outro recurso escuso, ferramenta, programa, algoritmo ou método coletor/extrator de dados automático para acessar, adquirir, copiar ou monitorar o serviço, sem permissão expressa por escrito do órgão.
Outra coisa estranha nos termos de uso definidos no anexo da portaria é a cláusula que trata sobre a data de atualização. Ficou literalmente assim, sem definir a data:
c) A presente versão do Termo de Uso e da Política de Privacidade foi atualizada pela última vez em: XX/XX/202X.
A Portaria CNPq n.º 976 está no Diário Oficial da União de hoje, na seção 1, página 5.