No combate à situação de emergência em saúde pública internacional decorrente da pandemia do novo coronavírus, para subsidiar qualquer ação é fundamental poder contar com dados atualizados e confiáveis. Seguem algumas fontes de informação em dados abertos.
Dados epidemiológicos
Trata-se de dados como número de casos confirmados, mortes, pacientes recuperados, incidência, prevalência, etc.
Brasil.io
A informação mais atualizada e completa que há sobre a COVID-19 é do Brasil.io, que tem dados atualizados diariamente sobre quase todos os municípios do Brasil. As fontes de dados são os boletins oficiais publicados pelas Secretarias de Estado de Saúde e o Portal da Transparência do Registro Civil. Esse é um trabalho colaborativo organizado pelo @turicas.
Dados
É possível consultar pelo formulário, API, ou fazer download de arquivo CSV.
Estão disponíveis os dados sobre casos confirmados, mortes e incidência de Covid-19 informados pelas Secretarias. Além disso, também há dados sobre os óbitos relacionados à Covid-19 e a pneumonia e insuficiência respiratória, informados pelos cartórios. Com isso, é possível comparar os números de óbitos para tentar estimar a subnotificação devido à escassez de testes.
A raspagem dos dados de óbitos constantes no Portal da Transparência do Registro Civil também está disponível no seguinte repositório:
Visualizações
Já foram criadas, a partir desses dados, diversas visualizações dos dados da Covid-19 no Brasil por município.
Na visualização criada no Brasil.io pelo próprio @turicas é possível ver as informações em mapa ou tabela.
No mapa, é possível selecionar 4 variáveis diferentes: total de casos confirmados, confirmados por 100.000 habitantes, total de óbitos e taxa de letalidade. Também é possível dar zoom em cada estado e, ao passar o mouse sobre o município, informações detalhadas são exibidas no canto inferior direito. Usei uma escala logarítmica (log2) para determinar as cores de cada município.
Outras visualizações:
- Portal Geocovid da UEFS
- Monitoramento dos números da Covid-19 no Brasil, por @wcota (código fonte)
- Ferramenta para carga em Kibana e ElasticSearch, por @dpereira
- COVID19-AutoReports, visualização atualizada diária e automaticamente no Github, por Ramon Gomes da Silva
- Mapa COVID 19 no Brasil, por @endoedgar (código fonte) (Atenção: não está sendo mais atualizado)
Veja também o tópico sobre visualização de dados da pandemia.
Código e colaboração no Github
Se você tem conhecimentos sobre dados ou programação, seja também um voluntário. Saiba como no repositório da iniciativa no Github:
Para conversar em tempo real sobre a iniciativa, é possível também cadastrar-se no chat: https://chat.brasil.io
Texto do blog sobre a atualização
No blog há mais detalhes sobre como foi construído esse conjunto de dados.
Contribuições financeiras
O projeto tem custos a cobrir com o funcionamento dos servidores. Se você puder apoiar financeiramente esta iniciativa do Brasil.io, siga o link:
Ministério da Saúde
O Ministério da Saúde criou um site para disseminar informações sobre o novo coronavírus no Brasil e os casos de COVID-19.
http://plataforma.saude.gov.br/novocoronavirus/
No site, era possível baixar os dados atuais como CSV.
Para a série temporal, havia um arquivo Javascript que continha os dados históricos desde a entrada do vírus no Brasil:
http://plataforma.saude.gov.br/novocoronavirus/resources/scripts/database.js
O @belisario criou um script para facilitar baixar esses dados e convertê-los para CSV, o que facilita o tratamento dos dados a quem precisar da série temporal. Confira:
Entretanto, o Ministério da Saúde deixou de atualizar os dados e esse site em 19/3/2020, portanto, inutilizando esta fonte de dados para acompanhar a evolução da pandemia.
Em 26/3/2020, o painel sobre COVID-19 do Ministério da Saúde voltou. Porém, sem o download de dados. Em 11/5/2020, o painel foi atualizado novamente. Desta vez voltou o download de arquivo CSV com dados agregados a nível de município. O painel conta também com números da Síndrome Respiratória Aguda Grave – SRAG.
O nível de agregação geográfica inicialmente era por Estado, mas agora já estão disponíveis dados no nível de Município.
Além disso, foi também disponibilizado um novo portal de dados aberto do DataSUS, o OpenDataSUS, que tem um conjunto de dados sobre a Covid-19:
https://opendatasus.saude.gov.br/dataset/casos-nacionais
O conjunto de dados tem microdados sobre cada caso anonimizado, com muitas informações disponíveis. Por exemplo as datas dos testes realizados, se é profissional de saúde e, nesse caso, qual tipo de profissional, além de informação sobre a cidade e bairro de residência.
COVID-19 no mundo
Seguem algumas fontes de dados abertos sobre a pandemia de COVID-19 no mundo.
- Center for Systems Science and Engineering da Johns Hopkins University
- esses mesmos dados empacotados como Data Packages, no Datahub.io
- script em R para fazer o download e usar esses dados, feito pelo @fbarbalho
- Our World in Data
- Corona Data Scraper – iniciativa de raspagem de dados, semelhante ao que faz o Brasil.io, mas para dados de todo o mundo (obs.: por enquanto não tem informações desagregadas nem por estado, nem por município do Brasil)
- Wiki Projeto do WikiData – contém dados estruturados sobre a pandemia no mundo. Estão sendo elaborados variados modelos de dados relacionados ao tema, como as medidas sanitárias adotadas, abertura e fechamento, uso de apps de rastreamento de contatos, capacidade de hospitais, etc. Dúvidas podem ser tiradas com o @lubianat, que participa do projeto.
Listas de conjuntos de dados:
- awesome-covid19-resources
- awesome-coronavirus#datasets
- lista de dados abertos sobre Covid-19 da Comissão Europeia
- resources for #TogetherVsVirus
Visualizações:
- Our World in Data
- Coronavirus Country Comparator (dados da JHU CSSE)
Combinações de dados:
- Dataset for country profile and mobility analysis in the assessment of COVID19 pandemic, uma compilação de séries temporais de dados oriundas de diversas fontes, sobre o mundo inteiro, incluindo dados epidemiológicos, sociodemográficos, mobilidade, atividade econômica, etc., sobre o período da pandemia no mundo. Elaborado pelo @mribeirodantas e colaboradores.
Recomendações:
- A Parceria para Governo Aberto apresenta algumas recomendações para a abertura de dados relacionados à Covid-19
Dados sobre hospitalização
A Fundação Oswaldo Cruz faz o monitoramento das hospitalizações por Síndrome Respiratória Aguda Grave – SRAG, por meio do sistema Info-Gripe.
Os dados de hospitalização por SRAG podem dar uma indicação a respeito dos casos subnotificados decorrentes da escassez de testes para Covid-19.
Dados sobre a resposta à crise
Os poderes executivos e os parlamentos da União, Estados e Municípios têm elaborado atos normativos em resposta à crise gerada pela pandemia. Por exemplo, medidas de restrição à circulação de pessoas, medidas de estímulo e auxílio econômico, etc.
Esses dados podem ser usados por pesquisadores para correlacionar as medidas de isolamento com o ritmo de avanço da pandemia nas diferentes localidades.
A ACAPS mantém um conjunto de dados das medidas restritivas (como o distanciamento social) que os governos ao redor do mundo têm adotado para combater a pandemia. Inclui dados referentes ao Brasil.
https://www.acaps.org/covid19-government-measures-dataset
Além disso, o Conselho Nacional de Secretários de Estado da Administração (CONSAD - consad.org.br.) disponibiliza uma um painel com as medidas de resposta ao COVID-19 (agradecimentos ao @endersonmaia).
Uma contribuição importante foi encontrada pelo @alexandrepereira:
- Banco de dados sobre “intervenções não-farmacêuticas” no Brasil, organizado por um pessoal de Oxford, publicado na Nature e disponível pra download na Dryad. Tem entradas (campos booleanos) para “cordão sanitário”, medidas restritivas à circulação, medidas de isolamento social, uso compulsório de máscaras, redução da oferta de transporte coletivo e diminuição das medidas de isolamento, além das datas de início de cada uma das medidas. A base busca cobrir os 5.570 municípios do Brasil, mas destes, 3.951 responderam (70%, incluindo todas as capitais). Os dados foram coletados em 2020 através de entrevistas com os gestores públicos.
- Banco de dados global sobre medidas de combate ao COVID-19 envolvendo TU Munique, NYU, Univ. de Nazabaryev e outros. Tem um site próprio e um artigo na Nature: Human Behavior. Estou com problemas pra baixar os dados, mas pelo que vi há info na escala municipal para o Brasil. Não consegui olhar a cobertura.
Avaliação de transparência da União e de Estados
A Open Knowledge Brasil realiza uma avaliação da transparência da União e dos Estados na divulgação de dados sobre o enfrentamento à pandemia de Covid-19. O Índice de Transparência pode ser conferido no site:
Monitoramento da resposta legislativa
Algumas iniciativas têm procurado monitorar as medidas legislativas. Algumas delas são serviços pagos, mas listaremos aqui apenas aquelas que oferecem acesso aberto e gratuito, de modo a potencializar o uso.
Extrações de atos relacionados à Covid-19 a partir de diários oficiais
Esta iniciativa pretende realizar a leitura ou a raspagem de diários oficiais dos Estados, localizando atos normativos relacionados à resposta da administração pública à Covid-19.
Por enquanto, esta iniciativa lê apenas o Diário Oficial do Estado do Ceará.
O @alexandrepereira encontrou um levantamento do site Leis Municipais:
Leis Municipais COVID-19: um repositórios de leis relacionadas ao COVID nos estados e municípios. As planilhas são disponibilizadas por UF e incluem a “epígrafe” das leis (nome, número, etc), localidade, ementa, e URL para o texto da lei. Essas planilhas poderiam ser objeto de um scrapping se alguém tiver interesse.
Dados sobre a movimentação de pessoas
Trata-se de dados sobre os deslocamentos das pessoas ao longo do tempo e os efeitos das políticas de isolamento adotadas por governos locais.
Em abril de 2020, o Google divulgou dados anonimizados sobre os deslocamentos populacionais em diversos países do mundo, como uma forma de ajudar a medir se as pessoas estão praticando, de fato, o distanciamento social para frear o avanço da Covid-19.
Os dados, agora, são disponibilizados para download também em formato CSV.
Inicialmente, as informações estavam disponíveis apenas em PDF. O @vitorbaptista, então, havia raspado esses documentos, transformando-os em planilhas CSV para facilitar a reutilização, mas agora é possível usar os CSVs direto da fonte.
Modelos e simulações
Algumas iniciativas visam criar simulações de situações relacionadas à pandemia, levando em conta modelos epidemiológicos e outros.
- Ação Covid-19 usa um modelo epidemiológico para prever o comportamento da curva. (este podcast afirma que o código fonte é livre, mas não consegui encontrar o link para ele)
- O Farol Covid estima, para cada unidade da federação, uma série de variáveis relevantes, como o ritmo de contágio, subnotificação, capacidade hospitalar e isolamento social. O código fonte está disponível no Github.
Dados sobre vacinação
O DataSUS abriu os dados sobre os registros de vacinação. Estão disponíveis em:
Caso tenha dificuldade em baixá-los, os dados também estão disponíveis no Brasil.io.
Visualizações de dados de vacinação
Algumas visualizações já foram construídas com os dados sobre vacinações.
- Portal Geocovid da UEFS
- Monitoramento dos números da Covid-19 no Brasil, por @wcota (código fonte)
- Vacina Covid-19: panorama atual – painel construído no PowerBI pelo @ffmenezes, juntamente com análise dos dados com Jupyter Notebook