Dados da base do CNPJ disponibilizados pela Receita Federal do Brasil

Bom dia pessoal, parece que a Receita atualizou a base de CNPJs. Não parei para baixar os arquivos mas a data de atualização está como 09-09-21.

O link atualizado como o novo layout é esse aqui:

Sim com muitas novidades

1 curtida

Boa tarde, por favor alguém me tirar uma dúvida.
Preciso baixar as versões dos arquivos “Estabelecimento” porém me parece que a velocidade dos downloads está ridiculamente baixa. É normal ? Existe alguma outra forma de eu conseguir estas bases ?
Obrigado

1 curtida

Seja bem vindo, @alison_pezzott!

Sim, a lentidão dos downloads da Receita é um problema antigo e conhecido, inclusive já comentado aqui neste tópico. A forma recomendada de baixar os dados é uma das alternativas listadas sob o título “fontes tratadas” na postagem original (basta rolar a tela até o início).

Eu coloquei no meu projeto em python https://github.com/rictom/cnpj-sqlite um link para baixar a base no formato sqlite, de acordo com base da receita, referência agosto/2021.

1 curtida

Ótimo! Acrescentei o link também na postagem original.

Olá a todos. Excelente a ideia desta comunidade. Parabéns!
Vocês perceberam que o domínio do atributo ‘porte’ sumiu com as ME?
E alguém sabe me dizer se na tabela de Simples/Nacional vem somente os elegíveis para a opção?
Obrigada

Seja bem vinda, Cristina!

Eu não cheguei a baixar os dados para experimentar se realmente está presente nos dados, mas no layout que está disponível na página tem o campo “porte da empresa”, sim. Um dos valores possíveis é

2 - MICRO EMPRESA

veja:

Olá Hermann obrigada pelo retorno. Sim, antes da mudança de layout o domínio deste atributo constava ME e vinha preenchido tal qual está na consulta pelo site, porem recentemente não vem nenhum cnpj como ME.

Como foi apontado em Layout completamente novo · Issue #53 · fabioserpa/CNPJ-full · GitHub
esse campo parece que ainda está usando a tabela de códigos de 2020, onde 01=micro empresa

1 curtida

Bom dia pessoal!

Percebi que vários CNAEs secundários foram cortados. Alguém encontrou alguma solução pra isso?

Outra coisa, via SQLITE conseguiram fazer o split dos CNAEs?

Muito obrigado desde já!

Peguei sua idea para download dos dados, adicionei umas linhas para download dos dados em varios processos e monitorar os downloads, atualmente venho trabalhando em importar os dados para MySQL
https://github.com/diggleweb/cnpj-mysql

Olá, pessoal vocês sabem qual a relação entre empresa e estabelecimento nesse layout novo… Uma empresa pode ter 0 ou N estabelecimentos ?

Eu adaptei o meu script cnpj-sqlite para funcionar em mysql github/cnpj-mysql. Ele pega os arquivos zipados, descompacta e carrega os dados públicos de cnpj em um servidor Mysql. Como o site da Receita é muito lento, tenho baixado os arquivos usando um gerenciador de downloads.

Olá @caqomkt,
Criei um script em python para pegar a coluna cnae_fiscal_secundaria (que tem vários códigos de cnae separados por vírgula) em uma nova tabela no sqlite. O script funciona na tabela sqlite cnpj.db gerada pelo projeto em cnpj-sqlite.

1 curtida

Boa tarde. Uma empresa representa os 8 primeiros dígitos do cnpj. Para empresas que possuem filiais, realmente teremos 1 empresa para n estabelecimentos. Para os casos de MEI, EI, EPP ou empresas que não possuam filiais a relação será de 1 empresa para 1 estabelecimento. Espero ter respondido.

1 curtida

Olá
Por favor, sabem se existe um projeto de transparência/dados abertos que trabalhe com a nova versão de empresas e sócios do Brasil que a Receita criou, para divulgar CSVs limpos ou pacotes de extração dos dados?
Aqui a nova versão da Receita: Dados Públicos CNPJ

Existem grandes projetos que fazem isso, mas com a versão anterior da Receita, com dados de 2020

Oi @reichaves, os seguintes projetos no github trabalham com a base de cnpjs da Receita no formato de 2021:
GitHub - rictom/cnpj-sqlite: Script em python para carregar os arquivos de cnpj dos dados públicos da Receita Federal em formato sqlite (em python para Banco de dados Sqlite)
GitHub - rictom/cnpj-mysql: Script em python para carregar os arquivos de cnpj dos dados públicos da Receita Federal em MYSQL. (em python para Mysql)
GitHub - aphonsoar/Receita_Federal_do_Brasil_-_Dados_Publicos_CNPJ: Dados Públicos de CNPJ disponibilizados pela Receita Federal do Brasil (em python para Postgresql)
GitHub - faio/rfb-cnpj: Projeto que faz a leitura dos dados abertos disponibilizado pela Receita Federal do Brasil mensalmente e os converte para um banco de dados compatível com SQLAchemy (em python para Sqlite ou Postgresql)
GitHub - josuecamelo/dados_aberto_cnpj: Importação para Base de Dados PostgreSQL (em python para Sqlite)
GitHub - gibalmeida/dados_abertos_cnpj: Ferramenta para importação para um banco de dados (MySQL) os dados públicos dos CNPJ disponibilizados pela Receita Federal do Brasil por meio de arquivos CSV. (em Rust para Mysql)
GitHub - mtrentz/dados-cnpj: Baixa e organiza dados abertos de CNPJ em um banco de dados. (em Go para Mysql)

3 curtidas

Seja bem vindo, @reichaves!

Além das ferramentas que o @rtom indicou, li no grupo do Telegram que o Minha Receita, criado pelo @cuducos, também já trabalha com o novo formato. Os links estão todos na postagem inicial deste tópico.

Obs.: a fim de manter a boa organização das informações do fórum, decidi mover a sua mensagem para este tópico já existente sobre o assunto.

3 curtidas

Todos sabemos da lentidão pra baixar esses arquivos de ‘dados abertos’ relacionado a CNPJ. Pra resolver isso, vejo muita gente indicando API, outros indicando baixar de repositório de terceiros e etc. Mas sobre o maior problema que é a demora pra baixar pode ser resolvido de uma forma que não achei ainda ninguém falando.

Eu até fiz um ‘programinha’ pra isso simples e creio irá ajudar as pessoas que querem baixar de forma rapida os arquivos. Pois bem… Pq não ter um ‘programa’ que quebre os arquivos em várias partes e baixe? Imagina… 100 threads disparada pra cada arquivo? Isso irá quebrar o mesmo em 100 partes e podemos colocar todos pra baixarem junto e quebrados, será bem mais rápido né? Pois é… Eu baixei em menos de um dia todos os arquivos do link http://200.152.38.155/CNPJ/. Então essa é minha opnião pra quem programa fazer o teste. Valeu!

Obs: Digo isso pois tem pessoas que não querem usar API, outras não confiam em repositórios de terceiros e apenas o que elas querem é algo pra baixar de uma forma rápida a partir dos repositórios originais.