Dados do Datasus são frequentemente demandados e não são fáceis de encontrar. Nesse tópico explora-se algumas dicas importantes de onde esses dados podem ser conseguidos e como podem ser trabalhados. As dicas provêm principalmente do Paulo Henrique Barros e André Marques dos Santos.
Acesso aos dados
-
Link para acessar os datasets completos: Transferência de Arquivos – DATASUS
-
Acesso à pasta raiz do FTP: ftp://ftp.datasus.gov.br/dissemin/publicos/ (veja abaixo como acessar ftp, alguns arquivos não são documentados)
-
Os arquivos do link acima estão num formato próprio do DATASUS.
Documentações podem ser acessada pelos seguintes links:
-
Dicionário de dados hospitalar
ftp://ftp.datasus.gov.br/dissemin/publicos/SIHSUS/200801_/Auxiliar/TAB_SIH.zip -
Dicionário de dados ambulatorial
ftp://ftp.datasus.gov.br/dissemin/publicos/SIASUS/200801_/Auxiliar/TAB_SIA.zip -
Documentação do Sistema de Informações de Agravos de Notificação – SINAN
ftp://ftp.datasus.gov.br/dissemin/publicos/SINAN/DOCS/Docs_TAB_SINAN.zip
Alguns dados abertos também estão disponíveis no portal OpenDataSUS:
https://opendatasus.saude.gov.br
Como acessar links FTP
Os links para arquivos ou pastas do tipo FTP podem ser acessados:
- no Windows, por meio do Windows Explorer (passo a passo)
- em distribuições Linux que usam Gnome (ex.: Ubuntu), pelo gerenciador de arquivos (detalhes)
Obs.: geralmente não é possível acessar links FTP simplesmente os clicando. Isso porque os navegadores atuais têm retirado essa funcionalidade (Firefox) ou a desligado por padrão (Chrome).
Tratando os dados usando R
Os dados podem ser tratados usando o pacote read.dbc. Veja abaixo um exemplo de utilização em R:
library(read.dbc)
datasus<- read.dbc("DOINF02.DBC")
Agradecimentos à Daniela Petruzalek por criar este pacote em R.
Uma outra possibilidade é usar o pacote Microdatasus, desenvolvido pelo Rafael Saldanha.
Instalação:
install.packages("devtools")
devtools::install_github("rfsaldanha/microdatasus")
Exemplo de uso:
library(microdatasus)
dados <- datasus_fetch(year_start = 2013, year_end = 2014, uf = "RJ", information_system = "SIM-DO")
dados <- process_sim(dados)
Para mais informações, consulte o manual.
Tratando os dados usando Python
É possível acessar os dados do DataSUS usando Python por meio da biblioteca PySUS (inclusive ele usa uma parte da library read.dbc). Ela pode ser utilizada, inclusive, dentro de um ambiente Jupyter Notebook / Jupyter Lab para realizar análises e visualizações de dados.
Atenção: é necessário utilizar no mínimo a versão 3.9 do Python. Em versões mais antigas não irá funcionar.
from pysus.online_data.sinasc import download
from pysus.online_data import parquets_to_dataframe
dfse = parquets_to_dataframe(download('SE',2015))
dfse.head()
Mais informações e outros exemplos podem ser vistos no repositório no Github do PySUS:
Instruções de uso estão na documentação do PySUS. O repositório contém também diversos cadernos Jupyter que contêm exemplos de uso. Agradecimentos ao Flávio Codeço Coelho por criar este pacote em Python.
Convertendo os dados para CSV
Outra forma de trabalhar com os dados é convertê-los para CSV, para depois usar a sua ferramenta de preferência. Este conversor chamado dbc2csv pode ser usada para converter os arquivos .dbc
para o formato .csv
.