Pesquisa de datasets do Google

O Google anunciou que a sua pesquisa de conjuntos de dados (datasets) saiu da fase beta:

A pergunta que vem imediatamente é: como fazer com que os seus datasets sejam encontrados pelo Google?

Segundo a documenta√ß√£o, √© necess√°rio que o dataset venha acompanhado de uma p√°gina que o descreve, marcada com um dos dois padr√Ķes: RDFa ou Microdata, descrita conforme os vocabul√°rios do schema.org e o padr√£o DCat, que √© um vocabul√°rio padronizado pelo W3C para descrever datasets.

Considerando a maioria dos portais de dados abertos no mundo usa o software livre CKAN para implementar os seus catálogos, a próxima pergunta é: o Google Dataset Search lê os portais com CKAN?

A resposta, infelizmente, √© n√£o sem modifica√ß√Ķes. A boa not√≠cia, por outro lado, √© que existe uma extens√£o do DCat para CKAN que implementa justamente as descri√ß√Ķes da maneira que o Google l√™. A expectativa agora √© que a maioria dos portais de dados abertos comecem a instalar esse plugin.

2 Curtidas

Muito legal, Augusto. Esse √© o tipo de extens√£o que poderia ser incorporada nativamente ao CKAN. Com isso os benef√≠cios seriam autom√°ticos. N√£o vejo √īnus em torn√°-lo padr√£o.