Dados da base do CNPJ disponibilizados pela Receita Federal do Brasil

Olá @rtom, tudo bem?

Tentei acessar esse link, mas tudo retorna com o mesmo erro.

Esse erro aparece pra você também?

oi @umdantas, até uns dias atrás estava funcionando, no dia 13/4 eu baixei todos os arquivos com a data de referência 5/4/2021. De qualquer forma, os arquivos estavam com muitos erros, estavam sem os nomes de sócios, ou o pior, com nomes de sócios incorretos. Acho melhor esperar a Receita atualizar e ver se corrigiram os problemas.

@rtom , faz sentido. Pra mim, eu clico em qualquer um dos links/arquivos, e aparece o print que mostrei. Vamos aguardar então.

Pessoal, foi publicada hoje uma nova carga de dados. Ainda não consegui baixar, está com aquela lentidão característica do primeiro dia de disponibilização, então não sei ainda se corrigiram os erros de antes.

Pessoal, tudo bem?
Visando essa ultima atualização na Receita, só pra avisar vocês, baixei quase todos os arquivos da Receita. Só teve um que estava fora:

Abs

Acabo de verificar que nesse caminho da Receita, todos os arquivos estão disponíveis:

http://200.152.38.155/CNPJ/

1 curtida

Olá Amigo! consegue disponibilizar o arquivo aberto para que possamos ajustar conforme a necessidade?

Pessoal, uma das formas que encontrei para condensar os dados foi através do Power Query.
Utilizando as tabelas de atributo, consegui um material bacana.

Também estava com erro no download do arquivo ESTABELECIMENTOS 09… utilizei a dica do nosso amigo @umdantas.

1 curtida

Boa tarde!

Verifiquei que nas últimas atualizações não vem mais o dado de % de participação societária. Alguém sabe onde consigo essa informação?

Muito obrigado

1 curtida

Boa noite pessoal! Já tentei de todas as formas entender a lógica de formação da base… Vocês renomearam os arquivos?

Obrigado desde já!

Olá @caqomkt. Sua dúvida é em relação a qual fonte de dados? A do Link direto da Receita ou dos projetos aqui disponibilizados?

Olá @umdantas, bom dia!

Não, os dados eu consegui baixar, todos os zips, exportar os csv, blz!

Ficam sem extensão legível, daí pra frente travei

Pensei em renomear arquivo por aquivo, mas não sei se daria certo.

Estou travado nessa parte, na consolidação dos arquivos em um BD.

Obrigado desde já!

Cara, uma coisa que aconteceu é que o nome do arquivo, onde informa o tipo, estava carregando uma parte do nome do arquivo. Por exemplo: ArquivoX.arquicsv.

Eu apenas editei o final para que o sistema entendesse que se trata de um arquivo .csv.
Ficaria: ArquivoX.csv

Aqui funcionou de boa.

Ah então blz! Vou tentar renomear! Muito obrigado pela dica!

Parabens a todos pelas várias iniciativas. Pelo que entendi, a receita publica apenas fotografias do estado da base na data de referência. Mas não publica o historico das mudanças. Alguem tem salvo o conjunto de todas as fotografias disponibilizadas ate hoje pela receita? Ou pelo menos algumas destas salvas para criar algum tipo de base de dados longitudinal (painel) de modificacoes?

1 curtida

Olá, lucasmotion.
Estou montando um conjunto de versões dessas bases do CNPJ.
Baixei várias que @turicas organizou e umas do georgevbsantiago em GitHub - georgevbsantiago/qsacnpj: Pacote que trata e organiza os dados do Cadastro Nacional da Pessoa Jurídica (CNPJ) e juntei com outras que eu peguei no site da Receita.
Tenho 15 edições e tô procurando quem tenha alguma do primeiro trimestre de 2020.

2 curtidas

Olá, @CarlosFranca !

Você vai disponibilizar esse trabalho em algum local?
Isso é muito interessante. Já tinha essa idéia, mas não tenho conhecimento suficiente em banco de dados pra montar uma estrutura funcional.
Abs!

1 curtida

Olá, @renatoos .
Estou na fase de analisar as diferenças entre as edições do cadastro. Ainda não sei o que vai dar isso. Por ora, tenho confirmado que o cadastro é cumulativo (como esperado) e visto que a versão mais atual traz muitas diferenças que são apenas correções de forma de grafia, como zeros a mais ou a menos. Quando tiver algo pra mostrar, vou ver como publicar.

2 curtidas

Aqui os comparto un script sh para descargar todos os zip
crie um arquivo download.sh

--------------------
#!/bin/bash
# Baixar arquivos em sequencia
#
 
# seq N M - cria uma sequencia de N ate M
# No caso abaixo, os arquivos baixados serao: 01, 02 .... 14, 15
# Para mudar a sequencia basta alterar os numeros
 
for i in $(seq 1 20)
do
    if [ "$i" -gt 9 ]
    then
    $(wget http://200.152.38.155/CNPJ/DADOS_ABERTOS_CNPJ_$i.zip)
    # printf "http://200.152.38.155/CNPJ/DADOS_ABERTOS_CNPJ_$i.zip \n"
    else
    $(wget http://200.152.38.155/CNPJ/DADOS_ABERTOS_CNPJ_0$i.zip)
    # printf "http://200.152.38.155/CNPJ/DADOS_ABERTOS_CNPJ_0$i.zip \n"
    fi
done
-------------

converta download.sh em executable
run:
$ ./download.sh
monitore os downloads:
$ watch 'ls -lh .

Parece que o link para esses dados andou mudando de novo, então tomei a liberdade de editar o post original do @fbarbalho para atualizá-lo.

Incluí também uma observação sobre o recente apagamento do dataset pela Receita Federal no Portal Brasileiro de Dados Abertos, deixando o labirinto que é o portal institucional como a única forma de se encontrarem os dados. Substituí o link do dados.gov.br para a versão arquivada pelo Internet Archive.