😷 Dados sobre a pandemia do coronavírus

No combate à situação de emergência em saúde pública internacional decorrente da pandemia do novo coronavírus, para subsidiar qualquer ação é fundamental poder contar com dados atualizados e confiáveis. Seguem algumas fontes de informação em dados abertos.

Dados epidemiológicos

Trata-se de dados como número de casos confirmados, mortes, pacientes recuperados, incidência, prevalência, etc.

Brasil.io

A informação mais atualizada e completa que há sobre a COVID-19 é do Brasil.io, que tem dados atualizados diariamente sobre quase todos os municípios do Brasil. As fontes de dados são os boletins oficiais publicados pelas Secretarias de Estado de Saúde e o Portal da Transparência do Registro Civil. Esse é um trabalho colaborativo organizado pelo @turicas.

Dados

:game_die: É possível consultar pelo formulário, API, ou fazer download de arquivo CSV.

Estão disponíveis os dados sobre casos confirmados, mortes e incidência de Covid-19 informados pelas Secretarias. Além disso, também há dados sobre os óbitos relacionados à Covid-19 e a pneumonia e insuficiência respiratória, informados pelos cartórios. Com isso, é possível comparar os números de óbitos para tentar estimar a subnotificação devido à escassez de testes.

A raspagem dos dados de óbitos constantes no Portal da Transparência do Registro Civil também está disponível no seguinte repositório:

Visualizações

:world_map: Já foram criadas, a partir desses dados, diversas visualizações dos dados da Covid-19 no Brasil por município.

Na visualização criada no Brasil.io pelo próprio @turicas é possível ver as informações em mapa ou tabela.

No mapa, é possível selecionar 4 variáveis diferentes: total de casos confirmados, confirmados por 100.000 habitantes, total de óbitos e taxa de letalidade. Também é possível dar zoom em cada estado e, ao passar o mouse sobre o município, informações detalhadas são exibidas no canto inferior direito. Usei uma escala logarítmica (log2) para determinar as cores de cada município.

https://brasil.io/covid19/

Outras visualizações:

Veja também o tópico sobre visualização de dados da pandemia.

Código e colaboração no Github

:keyboard: Se você tem conhecimentos sobre dados ou programação, seja também um voluntário. Saiba como no repositório da iniciativa no Github:

Para conversar em tempo real sobre a iniciativa, é possível também cadastrar-se no :speech_balloon: chat: https://chat.brasil.io

Texto do blog sobre a atualização

:newspaper: No blog há mais detalhes sobre como foi construído esse conjunto de dados.

Contribuições financeiras

:pig2: O projeto tem custos a cobrir com o funcionamento dos servidores. Se você puder apoiar financeiramente esta iniciativa do Brasil.io, siga o link:

Ministério da Saúde

O Ministério da Saúde criou um site para disseminar informações sobre o novo coronavírus no Brasil e os casos de COVID-19.

http://plataforma.saude.gov.br/novocoronavirus/

No site, era possível baixar os dados atuais como CSV.

Para a série temporal, havia um arquivo Javascript que continha os dados históricos desde a entrada do vírus no Brasil:

http://plataforma.saude.gov.br/novocoronavirus/resources/scripts/database.js

O @belisario criou um script para facilitar baixar esses dados e convertê-los para CSV, o que facilita o tratamento dos dados a quem precisar da série temporal. Confira:

Entretanto, o Ministério da Saúde deixou de atualizar os dados e esse site em 19/3/2020, portanto, inutilizando esta fonte de dados para acompanhar a evolução da pandemia.

Em 26/3/2020, o painel sobre COVID-19 do Ministério da Saúde voltou. Porém, sem o download de dados. Em 11/5/2020, o painel foi atualizado novamente. Desta vez voltou o download de arquivo CSV com dados agregados a nível de município. O painel conta também com números da Síndrome Respiratória Aguda Grave – SRAG.

https://covid.saude.gov.br/

O nível de agregação geográfica inicialmente era por Estado, mas agora já estão disponíveis dados no nível de Município.

Além disso, foi também disponibilizado um novo portal de dados aberto do DataSUS, o OpenDataSUS, que tem um conjunto de dados sobre a Covid-19:

https://opendatasus.saude.gov.br/dataset/casos-nacionais

O conjunto de dados tem microdados sobre cada caso anonimizado, com muitas informações disponíveis. Por exemplo as datas dos testes realizados, se é profissional de saúde e, nesse caso, qual tipo de profissional, além de informação sobre a cidade e bairro de residência.

COVID-19 no mundo

Seguem algumas fontes de dados abertos sobre a pandemia de COVID-19 no mundo.

Listas de conjuntos de dados:

Visualizações:

Combinações de dados:

Recomendações:

Dados sobre hospitalização

A Fundação Oswaldo Cruz faz o monitoramento das hospitalizações por Síndrome Respiratória Aguda Grave – SRAG, por meio do sistema Info-Gripe.

Os dados de hospitalização por SRAG podem dar uma indicação a respeito dos casos subnotificados decorrentes da escassez de testes para Covid-19.

Dados sobre a resposta à crise

Os poderes executivos e os parlamentos da União, Estados e Municípios têm elaborado atos normativos em resposta à crise gerada pela pandemia. Por exemplo, medidas de restrição à circulação de pessoas, medidas de estímulo e auxílio econômico, etc.

Esses dados podem ser usados por pesquisadores para correlacionar as medidas de isolamento com o ritmo de avanço da pandemia nas diferentes localidades.

A ACAPS mantém um conjunto de dados das medidas restritivas (como o distanciamento social) que os governos ao redor do mundo têm adotado para combater a pandemia. Inclui dados referentes ao Brasil.

https://www.acaps.org/covid19-government-measures-dataset

Além disso, o Conselho Nacional de Secretários de Estado da Administração (CONSAD - consad.org.br.) disponibiliza uma um painel com as medidas de resposta ao COVID-19 (agradecimentos ao @endersonmaia).

Uma contribuição importante foi encontrada pelo @alexandrepereira:

  • Banco de dados sobre “intervenções não-farmacêuticas” no Brasil, organizado por um pessoal de Oxford, publicado na Nature e disponível pra download na Dryad. Tem entradas (campos booleanos) para “cordão sanitário”, medidas restritivas à circulação, medidas de isolamento social, uso compulsório de máscaras, redução da oferta de transporte coletivo e diminuição das medidas de isolamento, além das datas de início de cada uma das medidas. A base busca cobrir os 5.570 municípios do Brasil, mas destes, 3.951 responderam (70%, incluindo todas as capitais). Os dados foram coletados em 2020 através de entrevistas com os gestores públicos.
  • Banco de dados global sobre medidas de combate ao COVID-19 envolvendo TU Munique, NYU, Univ. de Nazabaryev e outros. Tem um site próprio e um artigo na Nature: Human Behavior. Estou com problemas pra baixar os dados, mas pelo que vi há info na escala municipal para o Brasil. Não consegui olhar a cobertura.

Avaliação de transparência da União e de Estados

A Open Knowledge Brasil realiza uma avaliação da transparência da União e dos Estados na divulgação de dados sobre o enfrentamento à pandemia de Covid-19. O Índice de Transparência pode ser conferido no site:

Monitoramento da resposta legislativa

Algumas iniciativas têm procurado monitorar as medidas legislativas. Algumas delas são serviços pagos, mas listaremos aqui apenas aquelas que oferecem acesso aberto e gratuito, de modo a potencializar o uso.

Extrações de atos relacionados à Covid-19 a partir de diários oficiais

Esta iniciativa pretende realizar a leitura ou a raspagem de diários oficiais dos Estados, localizando atos normativos relacionados à resposta da administração pública à Covid-19.

Por enquanto, esta iniciativa lê apenas o Diário Oficial do Estado do Ceará.

O @alexandrepereira encontrou um levantamento do site Leis Municipais:

Leis Municipais COVID-19: um repositórios de leis relacionadas ao COVID nos estados e municípios. As planilhas são disponibilizadas por UF e incluem a “epígrafe” das leis (nome, número, etc), localidade, ementa, e URL para o texto da lei. Essas planilhas poderiam ser objeto de um scrapping se alguém tiver interesse.

Dados sobre a movimentação de pessoas

Trata-se de dados sobre os deslocamentos das pessoas ao longo do tempo e os efeitos das políticas de isolamento adotadas por governos locais.

Google

Em abril de 2020, o Google divulgou dados anonimizados sobre os deslocamentos populacionais em diversos países do mundo, como uma forma de ajudar a medir se as pessoas estão praticando, de fato, o distanciamento social para frear o avanço da Covid-19.

Os dados, agora, são disponibilizados para download também em formato CSV.

Inicialmente, as informações estavam disponíveis apenas em PDF. O @vitorbaptista, então, havia raspado esses documentos, transformando-os em planilhas CSV para facilitar a reutilização, mas agora é possível usar os CSVs direto da fonte.

Modelos e simulações

Algumas iniciativas visam criar simulações de situações relacionadas à pandemia, levando em conta modelos epidemiológicos e outros.

Dados sobre vacinação

O DataSUS abriu os dados sobre os registros de vacinação. Estão disponíveis em:

https://opendatasus.saude.gov.br/dataset/covid-19-vacinacao

Caso tenha dificuldade em baixá-los, os dados também estão disponíveis no Brasil.io.

Visualizações de dados de vacinação

Algumas visualizações já foram construídas com os dados sobre vacinações.

4 curtidas

Seguem alguns recursos de dados internacionais sobre a COVID-19.

O Center for Systems Science and Engineering da Johns Hopkins University também disponibiliza os dados sobre COVID-19 no mundo:

A Tableau também divulgou alguns textos interessantes:

Criamos um dataset no Brasil.IO para colocar os dados diários por município: https://brasil.io/dataset/covid19

Mais detalhes em: https://twitter.com/turicas/status/1241068121202536448

1 curtida

Outra fonte internacional com dados sobre COVID-19, com série histórica diária, por país:

Eles usam como fonte de dados o European Centre for Disease Prevention and Control – ECDC.

Tem também esse texto comparando as diversas fontes internacionais de dados – Organização Mundial da Saúde, ECDC e Johns Hopkins University.

Encontrei esse projeto aqui:

1 curtida

Mantenho esse dataset no Kaggle: https://www.kaggle.com/unanimad/corona-virus-brazil

Tenho um script python para raspar os dados do IVIS: https://github.com/Unanimad/hummingbird_brazil_covid19/

1 curtida

Atualização dos dados do Brasil.io: agora estão disponíveis dados diários do COVID-19 sobre todos os municípios do Brasil de todos os estados, exceto AM e TO:

https://blog.brasil.io/2020/03/23/dados-coronavirus-por-municipio-mais-atualizados/

Este é um projeto colaborativo, participe!

1 curtida

A @fecampa publicou um texto no site da Open Knowledge Brasil sobre a transparência do governo sobre os dados da COVID-19, apontando os principais problemas que têm ocorrido na divulgação dos dados.

https://br.okfn.org/2020/03/19/pandemia-exige-mais-transparencia-e-mais-controle-social/

A Parceria para Governo Aberto está acompanhando, com uma lista colaborativa (crowdsourcing), as soluções de enfrentamento à crise do COVID-19 que usam governo aberto.

Está disponível uma visualização dos dados da COVID-19 no Brasil por município, feita pelo @endoedgar, usando os dados das secretarias de saúde coletados pelo Brasil.io.

É possível visualizar o mapa com a quantidade de casos em cada município. Ao clicar em uma cidade, aparece a série temporal com a evolução de casos confirmados e mortes para o local.

Screenshot_2020-03-25 Mapa COVID 19 no Brasil - Por Município - Fonte Brasil IO

O autor afirma que está limpando o código fonte usado para construir a visualização e que o mesmo será disponibilizado em breve em seu repositório no Github.

2 curtidas

Há uma outra iniciativa de raspagem de fontes de dados, de modo semelhante ao que o Brasil.io faz, mas para dados do mundo: o Corona Data Scraper.

Algo interessante que eles fazem é avaliar, em um ranking, o quão boas são as práticas de disseminação de dados abertos do órgão público. Não quanto à confiabilidade das informações, pois isso seria difícil ou impossível avaliar, mas quanto à aderência a padrões abertos e da usabilidade dos dados mesmo.

O código fonte também está disponível em repositório no Github. Há ainda uma visualização em mapa desses dados.

O painel sobre COVID-19 do Ministério da Saúde voltou. Os dados parecem ser agregados por Estado, e não por Município.

https://covid.saude.gov.br/

Contudo, não há mais download de dados como havia antes.

1 curtida

pelo que vi no twitter oficial do ministério da saúde era pra eles passarem o gerenciamento dos dados para estados e municípios https://twitter.com/minsaude/status/1243276470295891974

os dados fornecido pelo json https://brasil.io/api/dataset/covid19/caso/data?&format=json estão incompletos, os dados iniciam só no dia 22-03

Pessoal, temos duas iniciativas aqui no Rio Grande do Norte a respeito do novo coronavírus na região e no mundo. Segue os links:

Leonado Bezerra desenvolveu, até o momento, dois painéis, uma análise de dados georreferenciados dos casos de COVID-19 no RN e outro com uma análise exploratória de séries temporais dos dados da COVID-19 pelo mundo. Segue o link: https://leobezerra.github.io/covid19/

A outra iniciativa é do LAIS (Laboratório de Inovação Tecnológica em Saúde) desenvolveu um sistema para Monitoramento do Coronavírus do Estado do RN com dados dos pacientes, mapas e projeções. Segue o link: https://covid.lais.ufrn.br/

4 curtidas

Localizei esse outro repositório: A Google Sheet that scrapes and stores data from covid.saude.gov.br

1 curtida

Os ADMs dos arquivos do ministério da saúde fazem um péssimo trabalho, além de mudarem os padrões dos links do csv todo dia ainda erram os nomes dos identificadores das colunas, como exemplo do dia 05/04 ficou:

regiao;estadi;date;casosNovos;casosAcumulados;obitosNovos;obitosAcumulados

ESTADI…e não estado…a não gente…pq não usam um arquivo google sheet e atualizam na mesma planilha? senhor amado

Raspei os PDFs dos relatórios de mobilidade do Google. O CSV está disponível em https://github.com/vitorbaptista/google-covid19-mobility-reports. Esses dados são atualizados automaticamente.

5 curtidas

Olá, @vitorbaptista, bem vindo ao fórum e parabéns pelo trabalho! :clap::clap::clap:

Já acrescentei os links também na postagem original, para facilitar o acesso.

Criei um notebook que preenche as lacunas faltantes em relação a alguns dias que não foram publicados boletins, o critério que usei pra preencher essas lacunas foram copiar os valores do dia anterior para o dia faltante e se o dia em análise possuir valores menores que o dia anterior então o elemento é substituído.

OBS: Os casos importados foram desativados pois não possuem latitude e longitude, mas podem ser contados separadamente através de uma implementação rápida.

Link do projeto: https://github.com/leo-smi/dados-covid19-brasil-io-tratados