Dados sobre a pandemia do novo coronavírus

No combate √† situa√ß√£o de emerg√™ncia em sa√ļde p√ļblica internacional decorrente da pandemia do novo coronav√≠rus, para subsidiar qualquer a√ß√£o √© fundamental poder contar com dados atualizados e confi√°veis. Seguem algumas fontes de informa√ß√£o em dados abertos.

Dados epidemiológicos

Trata-se de dados como n√ļmero de casos confirmados, mortes, pacientes recuperados, incid√™ncia, preval√™ncia, etc.

Brasil.io

A informa√ß√£o mais atualizada e completa que h√° sobre a COVID-19 √© do Brasil.io, que tem dados atualizados diariamente sobre quase todos os munic√≠pios do Brasil. As fontes de dados s√£o os boletins oficiais publicados pelas Secretarias de Estado de Sa√ļde e o Portal da Transpar√™ncia do Registro Civil. Esse √© um trabalho colaborativo organizado pelo @turicas.

Dados

:game_die: √Č poss√≠vel consultar pelo formul√°rio, API, ou fazer download de arquivo CSV.

Est√£o dispon√≠veis os dados sobre casos confirmados, mortes e incid√™ncia de Covid-19 informados pelas Secretarias. Al√©m disso, tamb√©m h√° dados sobre os √≥bitos relacionados √† Covid-19 e a pneumonia e insufici√™ncia respirat√≥ria, informados pelos cart√≥rios. Com isso, √© poss√≠vel comparar os n√ļmeros de √≥bitos para tentar estimar a subnotifica√ß√£o devido √† escassez de testes.

A raspagem dos dados de óbitos constantes no Portal da Transparência do Registro Civil também está disponível no seguinte repositório:

Visualiza√ß√Ķes

:world_map: J√° foram criadas, a partir desses dados, diversas visualiza√ß√Ķes dos dados da Covid-19 no Brasil por munic√≠pio.

Na visualiza√ß√£o criada no Brasil.io pelo pr√≥prio @turicas √© poss√≠vel ver as informa√ß√Ķes em mapa ou tabela.

No mapa, √© poss√≠vel selecionar 4 vari√°veis diferentes: total de casos confirmados, confirmados por 100.000 habitantes, total de √≥bitos e taxa de letalidade. Tamb√©m √© poss√≠vel dar zoom em cada estado e, ao passar o mouse sobre o munic√≠pio, informa√ß√Ķes detalhadas s√£o exibidas no canto inferior direito. Usei uma escala logar√≠tmica (log2) para determinar as cores de cada munic√≠pio.

https://brasil.io/covid19/

Outras visualiza√ß√Ķes:

Código e colaboração no Github

:keyboard: Se você tem conhecimentos sobre dados ou programação, seja também um voluntário. Saiba como no repositório da iniciativa no Github:

Para conversar em tempo real sobre a iniciativa, é possível também cadastrar-se no :speech_balloon: chat: https://chat.brasil.io

Texto do blog sobre a atualização

:newspaper: No blog há mais detalhes sobre como foi construído esse conjunto de dados.

https://blog.brasil.io/2020/03/23/dados-coronavirus-por-municipio-mais-atualizados/

Contribui√ß√Ķes financeiras

:pig2: O projeto tem custos a cobrir com o funcionamento dos servidores. Se você puder apoiar financeiramente esta iniciativa do Brasil.io, siga o link:

Minist√©rio da Sa√ļde

O Minist√©rio da Sa√ļde criou um site para disseminar informa√ß√Ķes sobre o novo coronav√≠rus no Brasil e os casos de COVID-19.

http://plataforma.saude.gov.br/novocoronavirus/

No site, era possível baixar os dados atuais como CSV.

Para a série temporal, havia um arquivo Javascript que continha os dados históricos desde a entrada do vírus no Brasil:

http://plataforma.saude.gov.br/novocoronavirus/resources/scripts/database.js

O @belisario criou um script para facilitar baixar esses dados e convertê-los para CSV, o que facilita o tratamento dos dados a quem precisar da série temporal. Confira:

Entretanto, o Minist√©rio da Sa√ļde deixou de atualizar os dados e esse site em 19/3/2020, portanto, inutilizando esta fonte de dados para acompanhar a evolu√ß√£o da pandemia.

Em 26/3/2020, o painel sobre COVID-19 do Minist√©rio da Sa√ļde voltou. Por√©m, sem o download de dados. Em 11/5/2020, o painel foi atualizado novamente. Desta vez voltou o download de arquivo CSV com dados agregados a n√≠vel de munic√≠pio. O painel conta tamb√©m com n√ļmeros da S√≠ndrome Respirat√≥ria Aguda Grave ‚Äď SRAG.

https://covid.saude.gov.br/

O nível de agregação geográfica inicialmente era por Estado, mas agora já estão disponíveis dados no nível de Município.

Além disso, foi também disponibilizado um novo portal de dados aberto do DataSUS, o OpenDataSUS, que tem um conjunto de dados sobre a Covid-19:

https://opendatasus.saude.gov.br/dataset/casos-nacionais

O conjunto de dados tem microdados sobre cada caso anonimizado, com muitas informa√ß√Ķes dispon√≠veis. Por exemplo as datas dos testes realizados, se √© profissional de sa√ļde e, nesse caso, qual tipo de profissional, al√©m de informa√ß√£o sobre a cidade e bairro de resid√™ncia.

COVID-19 no mundo

Seguem algumas fontes de dados abertos sobre a pandemia de COVID-19 no mundo.

Listas de conjuntos de dados:

Visualiza√ß√Ķes:

Combina√ß√Ķes de dados:

Recomenda√ß√Ķes:

Dados sobre hospitalização

A Funda√ß√£o Oswaldo Cruz faz o monitoramento das hospitaliza√ß√Ķes por S√≠ndrome Respirat√≥ria Aguda Grave ‚Äď SRAG, por meio do sistema Info-Gripe.

Os dados de hospitalização por SRAG podem dar uma indicação a respeito dos casos subnotificados decorrentes da escassez de testes para Covid-19.

Dados sobre a resposta à crise

Os poderes executivos e os parlamentos da Uni√£o, Estados e Munic√≠pios t√™m elaborado atos normativos em resposta √† crise gerada pela pandemia. Por exemplo, medidas de restri√ß√£o √† circula√ß√£o de pessoas, medidas de est√≠mulo e aux√≠lio econ√īmico, etc.

Esses dados podem ser usados por pesquisadores para correlacionar as medidas de isolamento com o ritmo de avanço da pandemia nas diferentes localidades.

A ACAPS mantém um conjunto de dados das medidas restritivas (como o distanciamento social) que os governos ao redor do mundo têm adotado para combater a pandemia. Inclui dados referentes ao Brasil.

Além disso, o Conselho Nacional de Secretários de Estado da Administração (CONSAD - consad.org.br.) disponibiliza uma um painel com as medidas de resposta ao COVID-19 (agradecimentos ao @endersonmaia).

Avaliação de transparência da União e de Estados

A Open Knowledge Brasil realiza uma avalia√ß√£o da transpar√™ncia da Uni√£o e dos Estados na divulga√ß√£o de dados sobre o enfrentamento √† pandemia de Covid-19. O √ćndice de Transpar√™ncia pode ser conferido no site:

Monitoramento da resposta legislativa

Algumas iniciativas têm procurado monitorar as medidas legislativas. Algumas delas são serviços pagos, mas listaremos aqui apenas aquelas que oferecem acesso aberto e gratuito, de modo a potencializar o uso.

Extração de atos relacionados à Covid-19 a partir de diários oficiais

Esta iniciativa pretende realizar a leitura ou a raspagem de di√°rios oficiais dos Estados, localizando atos normativos relacionados √† resposta da administra√ß√£o p√ļblica √† Covid-19.

Por enquanto, esta iniciativa lê apenas o Diário Oficial do Estado do Ceará.

Dados sobre a movimentação de pessoas

Trata-se de dados sobre os deslocamentos das pessoas ao longo do tempo e os efeitos das políticas de isolamento adotadas por governos locais.

Google

Em abril de 2020, o Google divulgou dados anonimizados sobre os deslocamentos populacionais em diversos países do mundo, como uma forma de ajudar a medir se as pessoas estão praticando, de fato, o distanciamento social para frear o avanço da Covid-19.

Os dados, agora, são disponibilizados para download também em formato CSV.

Inicialmente, as informa√ß√Ķes estavam dispon√≠veis apenas em PDF. O @vitorbaptista, ent√£o, havia raspado esses documentos, transformando-os em planilhas CSV para facilitar a reutiliza√ß√£o, mas agora √© poss√≠vel usar os CSVs direto da fonte.

Modelos e simula√ß√Ķes

Algumas iniciativas visam criar simula√ß√Ķes de situa√ß√Ķes relacionadas √† pandemia, levando em conta modelos epidemiol√≥gicos e outros.

4 Curtidas

Seguem alguns recursos de dados internacionais sobre a COVID-19.

O Center for Systems Science and Engineering da Johns Hopkins University também disponibiliza os dados sobre COVID-19 no mundo:

A Tableau também divulgou alguns textos interessantes:

Criamos um dataset no Brasil.IO para colocar os dados diários por município: https://brasil.io/dataset/covid19

Mais detalhes em: https://twitter.com/turicas/status/1241068121202536448

1 Curtida

Outra fonte internacional com dados sobre COVID-19, com série histórica diária, por país:

Eles usam como fonte de dados o European Centre for Disease Prevention and Control ‚Äď ECDC.

Tem tamb√©m esse texto comparando as diversas fontes internacionais de dados ‚Äď Organiza√ß√£o Mundial da Sa√ļde, ECDC e Johns Hopkins University.

Encontrei esse projeto aqui:

1 Curtida

Mantenho esse dataset no Kaggle: https://www.kaggle.com/unanimad/corona-virus-brazil

Tenho um script python para raspar os dados do IVIS: https://github.com/Unanimad/hummingbird_brazil_covid19/

1 Curtida

Atualização dos dados do Brasil.io: agora estão disponíveis dados diários do COVID-19 sobre todos os municípios do Brasil de todos os estados, exceto AM e TO:

https://blog.brasil.io/2020/03/23/dados-coronavirus-por-municipio-mais-atualizados/

Este é um projeto colaborativo, participe!

1 Curtida

A @fecampa publicou um texto no site da Open Knowledge Brasil sobre a transparência do governo sobre os dados da COVID-19, apontando os principais problemas que têm ocorrido na divulgação dos dados.

https://br.okfn.org/2020/03/19/pandemia-exige-mais-transparencia-e-mais-controle-social/

A Parceria para Governo Aberto est√° acompanhando, com uma lista colaborativa (crowdsourcing), as solu√ß√Ķes de enfrentamento √† crise do COVID-19 que usam governo aberto.

Est√° dispon√≠vel uma visualiza√ß√£o dos dados da COVID-19 no Brasil por munic√≠pio, feita pelo @endoedgar, usando os dados das secretarias de sa√ļde coletados pelo Brasil.io.

√Č poss√≠vel visualizar o mapa com a quantidade de casos em cada munic√≠pio. Ao clicar em uma cidade, aparece a s√©rie temporal com a evolu√ß√£o de casos confirmados e mortes para o local.

Screenshot_2020-03-25 Mapa COVID 19 no Brasil - Por Município - Fonte Brasil IO

O autor afirma que está limpando o código fonte usado para construir a visualização e que o mesmo será disponibilizado em breve em seu repositório no Github.

2 Curtidas

H√° uma outra iniciativa de raspagem de fontes de dados, de modo semelhante ao que o Brasil.io faz, mas para dados do mundo: o Corona Data Scraper.

Algo interessante que eles fazem √© avaliar, em um ranking, o qu√£o boas s√£o as pr√°ticas de dissemina√ß√£o de dados abertos do √≥rg√£o p√ļblico. N√£o quanto √† confiabilidade das informa√ß√Ķes, pois isso seria dif√≠cil ou imposs√≠vel avaliar, mas quanto √† ader√™ncia a padr√Ķes abertos e da usabilidade dos dados mesmo.

O código fonte também está disponível em repositório no Github. Há ainda uma visualização em mapa desses dados.

O painel sobre COVID-19 do Minist√©rio da Sa√ļde voltou. Os dados parecem ser agregados por Estado, e n√£o por Munic√≠pio.

https://covid.saude.gov.br/

Contudo, n√£o h√° mais download de dados como havia antes.

1 Curtida

pelo que vi no twitter oficial do minist√©rio da sa√ļde era pra eles passarem o gerenciamento dos dados para estados e munic√≠pios https://twitter.com/minsaude/status/1243276470295891974

os dados fornecido pelo json https://brasil.io/api/dataset/covid19/caso/data?&format=json estão incompletos, os dados iniciam só no dia 22-03

Pessoal, temos duas iniciativas aqui no Rio Grande do Norte a respeito do novo coronavírus na região e no mundo. Segue os links:

Leonado Bezerra desenvolveu, até o momento, dois painéis, uma análise de dados georreferenciados dos casos de COVID-19 no RN e outro com uma análise exploratória de séries temporais dos dados da COVID-19 pelo mundo. Segue o link: https://leobezerra.github.io/covid19/

A outra iniciativa √© do LAIS (Laborat√≥rio de Inova√ß√£o Tecnol√≥gica em Sa√ļde) desenvolveu um sistema para Monitoramento do Coronav√≠rus do Estado do RN com dados dos pacientes, mapas e proje√ß√Ķes. Segue o link: https://covid.lais.ufrn.br/

4 Curtidas

Localizei esse outro repositório: A Google Sheet that scrapes and stores data from covid.saude.gov.br

1 Curtida

Os ADMs dos arquivos do minist√©rio da sa√ļde fazem um p√©ssimo trabalho, al√©m de mudarem os padr√Ķes dos links do csv todo dia ainda erram os nomes dos identificadores das colunas, como exemplo do dia 05/04 ficou:

regiao;estadi;date;casosNovos;casosAcumulados;obitosNovos;obitosAcumulados

ESTADI…e não estado…a não gente…pq não usam um arquivo google sheet e atualizam na mesma planilha? senhor amado

Raspei os PDFs dos relatórios de mobilidade do Google. O CSV está disponível em https://github.com/vitorbaptista/google-covid19-mobility-reports. Esses dados são atualizados automaticamente.

5 Curtidas

Olá, @vitorbaptista, bem vindo ao fórum e parabéns pelo trabalho! :clap::clap::clap:

Já acrescentei os links também na postagem original, para facilitar o acesso.

Criei um notebook que preenche as lacunas faltantes em relação a alguns dias que não foram publicados boletins, o critério que usei pra preencher essas lacunas foram copiar os valores do dia anterior para o dia faltante e se o dia em análise possuir valores menores que o dia anterior então o elemento é substituído.

OBS: Os casos importados foram desativados pois não possuem latitude e longitude, mas podem ser contados separadamente através de uma implementação rápida.

Link do projeto: https://github.com/leo-smi/dados-covid19-brasil-io-tratados