Pesquisa de datasets do Google

O Google anunciou que a sua pesquisa de conjuntos de dados (datasets) saiu da fase beta:

A pergunta que vem imediatamente é: como fazer com que os seus datasets sejam encontrados pelo Google?

Segundo a documentação, é necessário que o dataset venha acompanhado de uma página que o descreve, marcada com um dos dois padrões: RDFa ou Microdata, descrita conforme os vocabulários do schema.org e o padrão DCat, que é um vocabulário padronizado pelo W3C para descrever datasets.

Considerando a maioria dos portais de dados abertos no mundo usa o software livre CKAN para implementar os seus catálogos, a próxima pergunta é: o Google Dataset Search lê os portais com CKAN?

A resposta, infelizmente, é não sem modificações. A boa notícia, por outro lado, é que existe uma extensão do DCat para CKAN que implementa justamente as descrições da maneira que o Google lê. A expectativa agora é que a maioria dos portais de dados abertos comecem a instalar esse plugin.

1 curtida

Muito legal, Augusto. Esse é o tipo de extensão que poderia ser incorporada nativamente ao CKAN. Com isso os benefícios seriam automáticos. Não vejo ônus em torná-lo padrão.