🇩🇪 Estratégia de Dados Abertos da Alemanha

O governo federal da Alemanha :de: publicou este mês a sua Estratégia de Dados Abertos, como parte e consequência da Estratégia de Dados que havia estabelecido em janeiro. O documento contém 62 medidas de ações a serem tomadas ao longo de três eixos:

  • infraestrutura de dados;
  • uso de dados; e
  • competências de dados.

O documento (PDF) está disponível apenas em alemão, mas há também um resumo em:

As pessoas costumam se divertir ao saber do fato de que os alemães estão sempre inventando palavras novas para tudo. Diz-se por aí que, somente em decorrência da pandemia, foram criadas 1.200 palavras em alemão, como Alltagsmaske (máscara do dia a dia :mask:). Nada mais natural que a área de dados abertos também tenha as suas palavras dedicadas. Uma que achei bacana foi

maschinenlesbar,

adjetivo que quer dizer legível por máquina. Isso mesmo, lá dos princípios dos dados abertos.

À medida em que eu for lendo, se encontrar alguma informação que mereça um destaque especial, irei comentando aqui.

Conheça também a Estratégia de Dados da União Europeia, que tem algumas projeções interessantes para 2025:

3 curtidas

Uma das ações que já foi iniciada é a coleta federada de metadados a partir de portais de dados abertos locais para o portal de dados abertos de nível nacional da Alemanha, o govdata.de. Para isso, foi definido o padrão de metadados DCAT-AP.de, uma especialização alemã do padrão DCAT-AP da União Europeia. O padrão, por sua vez, se baseia no vocabulário DCAT do W3C para catálogos de dados, cuja versão 2 alcançou o status de recomendação no ano passado.

Os metadados dos portais de dados abertos locais são validados usando uma ferramenta do Interoperability Test Bed, um serviço de apoio à interoperabilidade oferecido por meio do programa ISA² da Comissão Europeia. Mais informações sobre o serviço alemão de validação de metadados de portais de dados abertos podem ser encontradas aqui:

https://joinup.ec.europa.eu/collection/interoperability-test-bed-repository/solution/interoperability-test-bed/news/test-bed-support-govdatade

Ou no webinar promovido pela Comissão Europeia no último dia 10 de junho, onde essa e outras ferramentas foram apresentadas:

https://www.youtube.com/watch?v=_e-XFqYZBR0

O documento também preconiza o uso dos princípios FAIR para dados de pesquisa. Em diversas das medidas previstas na estratégia (ex.: os dados abertos de pesquisa sobre a Covid e dados abertos para IA aplicada à pesquisa em saúde, ambos do Robert Koch-Institut, etc.), onde se aplicam, os princípios FAIR são colocados como condição.

Mais algumas informações em português sobre o FAIR podem ser encontrados no relato que escrevi sobre o Open Data Day 2020 Rio de Janeiro, onde os princípios foram apresentados pela Patricia Henning, professora da Unirio.

Eu julho deste ano foi aprovada na Alemanha a Lei de Uso de Dados (Datennutzungsgesetz - DNG).

(2) Datenbereitsteller im Sinne dieses Gesetzes sind:

  1. öffentliche Stellen;
  2. Unternehmen der Daseinsvorsorge, die den Vorschriften über die Vergabe von öffentlichen Aufträgen und Konzessionen unterfallen oder öffentliche Personenverkehrsdienste betreiben;
  3. in Bezug auf Forschungsdaten, die öffentlich finanziert und bereits über ein institutionelles oder
    thematisches Repositorium öffentlich bereitgestellt wurden:
    a) Hochschulen, Forschungseinrichtungen und Forschungsfördereinrichtungen,
    b) Forschende, wenn die Forschungsdaten nicht bereits durch andere durch dieses Gesetz verpflichtete Datenbereitsteller bereitgestellt wurden;

dies gilt nicht, soweit berechtigte Geschäftsinteressen, Wissenstransfertätigkeiten oder bestehende Rechte Dritter an geistigem Eigentum entgegenstehen.

Ela se aplica a órgãos públicos, concessionárias de serviços públicos e outras entidades que operam recursos públicos, tais como instituições de ensino superior, de pesquisa e de fomento à pesquisa (“Hochschulen”, “Forschungseinrichtungen” e “Forschungsfördereinrichtungen”).

A lei estabelece várias obrigações relacionadas aos 10 princípios dos dados abertos, tais como o uso não discriminatório:

§ 5 Nichtdiskriminierung
(1) Die Bedingungen für die Datennutzung müssen nichtdiskriminierend sein.
(2) Werden Daten von einer öffentlichen Stelle als Ausgangsmaterial für die eigene Geschäftstätigkeit genutzt, die nicht unter den öffentlichen Auftrag der öffentlichen Stelle fällt, so gelten für die Bereitstellung der Daten für die Geschäftstätigkeit dieselben Entgelte und sonstigen Bedingungen wie für andere Nutzer.

não permitir acordos de exclusividade de uso de dados (a palavra longa “Ausschließlichkeitsvereinbarungen”), uso de formatos abertos e legíveis por máquina, bem como adotar padrões abertos para dados e metadados, “sempre que possível”:

§ 7 Verfügbare Formate, Metadaten
(1) Der Datenbereitsteller muss die Nutzung der Daten in allen angefragten und bei ihm vorhandenen Formaten
und Sprachen ermöglichen.
(2) Soweit möglich und sinnvoll, sind Daten elektronisch und in nach den anerkannten Regeln der Technik offenen, maschinenlesbaren, zugänglichen, auffindbaren und interoperablen Formaten zusammen mit den zugehörigen Metadaten bereitzustellen. Sowohl die Formate als auch die Metadaten entsprechen, soweit möglich, förmlichen offenen Standards.

A lei também obriga a que, sempre que possível e fizer sentido, os metadados sejam catalogados no portal de dados abertos nacional da Alemanha, o GovData.de:

(4) Die Metadaten zu maschinenlesbaren Daten sind, soweit möglich und sinnvoll, über das nationale Metadatenportal GovData zur Verfügung zu stellen.

Isso tende a evitar situações como a que ocorre no Brasil, em que a Receita Federal publica os dados sobre o CNPJ e sócios de empresas em uma página institucional própria e não no portal de dados abertos, onde chegou a publicar os dados, deixou sem atualizar por anos, e depois os apagou.

A lei também estabelece que, havendo capacidade técnica e financeira, o órgão público deve disponibilizar os dados por APIs (os chamados “dados dinâmicos”), além do download em massa.

Daí também vem a palavra alemã do dia sobre dados abertos: “Anwendungsprogrammierschnittstellen”. O que quer dizer esta longa palavra? Basta dividir.

  • Anwendung: aplicação
  • programmieren: programar
  • Schnittstelle: interface

significa API! :laughing:

A lei também prioriza os chamados “conjuntos de dados de alto valor” (“Hochwertige Datensätze”) para receberem APIs e downloads em massa.

1 curtida