Visualizando os dados da Pandemia

A sugestão deste tópico é listar e discutir recursos para a visualização de dados da pandemia de 2020.


… Dá para todos discutirmos na mesma língua

Eu pessoalmente gosto de especificar interface gráfica 2D na linguagem VEGA-lite, que permite expressões realmente “lite” e em JSON para especificar o gráfico que queremos, sem fircarmos reféns da infraestrutura ou reféns da “discussão nerd” sobre algoritmos.

Como os dados e o tema aqui são COVID, fica a sugestão de criar para o Brasil visualizações didáticas VEGA-lite. Bons exemplos em Exploring NZ COVID19 data

image

… Sem perder de vista a discussão criativa

Quando falamos de visualizar dados, por mais padronizados que sejam os dados e a preocupação com a legibilidade perante o público, há espaço para a criatividade e o bom gosto. Estilos, recursos de interatividade e meios para navegar por diferentes dados num mesmo gráfico ou dashboard.

image

Neste contexto, via de regra, é mais difícil restringir a linguagem a um padrão, ainda assim, o padrão VEGA foi concebido em camadas de restrição expressiva: VEGA-lite > VEGA > D3js. Novamente, é apenas uma sugestão pessoal, restringir a Babel de expressões criativas a um conjunto finito. O framework D3js, parente do jQuery, permite que as discussões mais “nerd” corram de forma menos alienígena.

O framework jQuery, mais antigo e amplamente utilizado, de qualquer modo, também parece ser benquisto entre membros aqui do fórum DadosAbertos. O brasil.io/covid19 por exemplo usa o ótimo plugin-jQuery DataTables.

Curadoria

Fica a sugestão também de dar um rumo para as discussões mais participativas: consolidar através da sugestão de boas práticas, bons plug-ins…, enfim melhores soluções para cada problema debatido.

Trata-se de oferecer para nós (comunidade) e o navegante, um resultado importante. Mesmo que não cheguemos ao ponto de votar, já temos recursos aqui recursos como o “like” e a convergência dos comentários, para realizar processos de curadoria.

2 curtidas

Nessa período de pandemia estamos presenciando uma enorme produção de visualização de dados para comunicação sobre a pandemia que acredito que não há precedentes, como explorado por esse artigo explorando o trabalho pioneiro do John Burn-Murdoch.

Tentarei listar algumas iniciativas que considero como destaques dentro das inúmeros que tive acesso:

Esses são apenas alguns destaques dentro dos muitos que eu poderia citar. Para finalizar, gostaria de compartilhar um artigo do Alberto Cairo relatando algumas considerações sobre a proliferação de small multiples sem a apresentação de escalas.

Um exemplo desse tipo de visualização pode ser encontrada nesse link.

4 curtidas

A discussão principal do tema aqui no fórum traz diversas sugestões, diretas ou indiretas, nacionais e internacionais, de visualização dos dados da Pandemia. A seguir uma tentativa de consolidar, para que outros possam dar continuidade. Vou tentar consolidar… um pouco por dia, é muita coisa (!).

Iniciativas nacionais

Titulo e link Classificação Dados Notas
covid.saude.gov.br dashboards/mapa+pizza por estado Sugerido aqui pelo @herrmann. Tecnologia: ?
Trajetória casos e mortes por estado
ou Compare Brazilian States Trajectories - Cases and Deaths
dashboards/curva; gráfico log por estado Sugerido aqui pelo @cleberjamaral. Tecnologia: Jupyter Notebook/Python; lib Pandas.

Iniciativas internacionais

Titulo e link Classificação Notas
covid19dashboards dashboards Sugerido aqui pelo @cleberjamaral, que comenta “(…) eu gosto muito da iniciativa, que tem reunido várias contribuições de análises com o intuito de apresentar diferentes perspectivas de estudo e exibição de dados (…)”.
3 curtidas

Estava planejando montar um gráfico estilo “achate a curva” que mostrasse o número de casos ativos por dia e o número de UTIs. Teria que fazer uma projeção de disponibilidade/necessidade que poderia ser uma configuração para parametrizar uma estimativa de % de UTIs que estariam “disponíveis” e outro parâmetro de % de casos ativos que necessitam de UTI. A evolução que mostrasse tendência de extrapolar a linha % de UTIs seriam casos que requerem maior atenção. Rascunho:


Incluir as mortes poderia representar consequências de extrapolar a linha de UTIs. Alguém sabe onde posso encontrar dados de UTIs do Brasil?

2 curtidas

Em covid19.healthdata.org há uma exibição correlata, mas eles não juntaram casos e rompimento da linha. Talvez também não possuam os dados de leitos disponíveis.

2 curtidas

Um outro gráfico que acho útil é este em covidactnow que avalia o risco de sair da quarentena por estado:

Quanto a discussão sobre linguages de programação, acredito que este tópico seria focado em data visualization, o que é agnóstico em termos de linguagem de programação.

Sobre o coviddashboards, eu gostei também que ele se baseia em uma ferramenta de blogs que suporta notebooks python. É bem fácil de fazer uma cópia desta ferramenta e montar seu próprio blog. Com isso feito é só criar novos notebooks com novas análises.

Sobre o gráfico achate a curva, foi concluída uma versão! Porém, além das incertezas sobre os dados da covid foram adicionadas mais um monte de premissas. Está em https://cleberjamaral.github.io/fastpages/jupyter/2020/05/11/brazil-flatten-the-curve.html
A medida que eu encontrar dados mais atuais sobre UTIs e taxa de ocupação posso atualizar este gráfico. Se encontrar dados por estado posso também criar os filtros.

2 curtidas