Dados da base do CNPJ disponibilizados pela Receita Federal do Brasil

Para encontrar dados sobre empresas inscritas no Cadastro Nacional de Pessoas Jurídicas – CNPJ, os seguintes recursos são úteis.

Fontes oficiais

As fontes primárias de dados são os dados abertos disponibilizados pela Receita Federal do Brasil – RFB, contendo os dados cadastrais do CNPJ e sócios de empresas.

https://dados.gov.br/dados/conjuntos-dados/cadastro-nacional-da-pessoa-juridica---cnpj

Apesar de ser a fonte oficial, os servidores oferecem downloads extremamente lentos, o tamanho dos arquivos é muito grande (cerca de 85Gb) e o layout dos arquivos é difícil de se usar (os campos são posicionais, em vez de usar um separador, como habitual no formato CSV).

Também é fonte oficial a página dos mesmos dados no portal dados.gov.br, entretanto, a RFB se recusa a atualizar para onde os links apontam, os quais estão quebrados há anos.

https://dados.gov.br/dataset/qsa (link do Internet Archive)

Mais recentemente, entretanto, a Receita Federal optou por excluir o dataset acima no Portal Brasileiro de Dados Abertos, deixando o link acima quebrado, sendo que agora o único meio para encontrar os dados é o seu portal institucional, em uma página difícil de se encontrar para quem não tem o link direto, como deixamos organizado aqui neste tópico.

Fontes tratadas

Algumas fontes secundárias de dados são úteis por terem sido tratadas em um formato mais fácil de usar e disponibilizadas em servidores que propiciam uma maior velocidade de download.

Pacote R “qsacnpj”

Usando a linguagem R, pode-se usar o pacote disponiblizado pelo @georgevbsantiago:

Mesmo que você não pretenda usar R, o repositório ainda contém links para download da mesma base nos formatos SQLite e CSV.

Brasil.io

A plataforma Brasil.io, fundada pelo @turicas, possibilita o acesso a esses dados de diversas formas:

Outras ferramentas

Ferramentas diversas para usar com esses dados. Por exemplo, conversões de formatos de dados, servir os dados do CNPJ em forma de API, visualizar os dados, etc.

API “Minha Receita”

O @cuducos criou uma API que você pode instalar no seu próprio computador e servir os dados do CNPJ

A API também está disponível como serviço no endereço minhareceita.org e também na BrasilAPI. Mais informações abaixo.

Conversão para CSV/SQLite

O Fábio Serpa e o @rtom criaram utilitários em Python para converter os dados baixados da RFB em formatos mais utilizáveis: SQLite e CSV.

Rede CNPJ

Ferramenta de visualização feita pelo @rtom que mostra os dados em forma de grafos, permitindo ver graficamente a relação entre as pessoas jurídicas e os seus sócios, facilitando identificar as redes que se formam entre grupos de empresas e grupos de sócios em comum.

Postagem original

Texto originalmente postado pelo @fbarbalho:

Para quem quiser encontrar dados de CNPJ, as comunidades já desenvolveram duas possibilidades bem interessantes. Vide abaixo:

Esta postagem foi editada por @herrmann. Após conversar com o Fernando Barbalho, decidimos deixar a postagem original mais organizada, com as informações que foram sendo complementadas ao longo do tempo nas respostas subsequentes.

8 curtidas

A Receita Federal do Brasil lançou uma nova versão da base de empresas/sócios. O @turicas já atualizou as bases no Brasil.io, tanto os arquivos originais quanto os convertidos. Parabéns e obrigado pelo trabalho, @turicas! :partying_face: :tada:

Mais informações: https://twitter.com/turicas/status/1197125153047662592

4 curtidas

@fbarbalho acho que vale linkar o https://github.com/turicas/socios-brasil/ e https://data.brasil.io/dataset/socios-brasil/ em vez do dataset de documentos. Explico: o dataset de documentos foi criado inicialmente para facilitar o trabalho interno do backend do Brasil.IO nas páginas especiais (que listam as informações sobre uma pessoa/empresa de todos os datasets disponíveis), porém esse dataset se revelou super difícil de manter por conta do problema complexo de conciliação e, com isso, só conseguirei atualizá-lo quando tiver resolvida essa questão. Além disso, nunca foi intenção disponibilizar os CPFs completos e, por isso, decidi não disponibilizá-lo para download.
Sobre a questão da conciliação, estou trabalhando nela há algum tempo e avancei bastante: https://github.com/turicas/brasil.io/issues/182 (tem vários outros testes num outro repositório que ainda não estão na issue); acho que depois de finalizado, esse trabalho será de bastante utilidade para quem lida com diversas bases de dados envolvendo entidades que possuem mais de um identificador (no caso de pessoas físcias: nome completo, CPF, título de eleitor etc.).

3 curtidas

É importante informar o link também da fonte original na RFB:

https://receita.economia.gov.br/orientacao/tributaria/cadastros/cadastro-nacional-de-pessoas-juridicas-cnpj/dados-publicos-cnpj

Com as ressalvas de que o servidor da Receita é lento, podendo demorar dias para baixar os arquivos, e que o layout dos arquivos é difícil de usar (não é CSV, e sim de campos com largura fixa). É mais fácil usar os pacotes da comunidade referenciados acima.

Esse mesmo dataset também está no portal dados.gov.br, mas há anos está com o link quebrado (e não adianta reclamar na ouvidoria, eles não consertam alegando apenas que os dados já estão no outro link, por mais que se argumente que também deveria estar no Portal Brasileiro de Dados Abertos):

1 curtida

Painel criado através dos dados abertos da receita federal.

4 curtidas

@Vasata, sensacional esse teu painel! Meus parabéns!

Obrigado Bruno, fique a vontade para usar e compartilhar se quiser.

1 curtida

O Marcelo Mathias postou no grupo do Telegram o link para uma API criada pelo Eduardo Cuducos (do Serenata) que serve os dados do CNPJ, juntamente com as informações do código CNAE de atividade da empresa.

Não tem um endereço para consultar a API, mas o código é livre para subir no seu próprio computador ou servidor e usar.

2 curtidas

Gostaria de apresentar o meu projeto no github https://github.com/rictom/rede-cnpj. É uma rotina para visualizar graficamente os vínculos entre cnpjs e sócios da base de dados públicos da Receita Federal, usando python, flask e javascript. É preciso gerar o banco de dados em sqlite pelo script em https://github.com/fabioserpa/CNPJ-full, ou baixar o arquivo sqlite que coloquei no google drive.
Um vídeo demonstrativo está no youtube http://www.youtube.com/watch?v=nxz9Drhqn_I.

5 curtidas

Muito interessante esse visualizador de redes de sócios de empresas, @rtom! Parabéns e obrigado por compartilhar! :partying_face:

@fbarbalho, nas mensagens subsequentes já surgiram muitas outras referências úteis e importantes. Para facilitar para quem chega aqui buscando informações, o que você acha de sumarizar tudo editando a sua primeira postagem? Se preferir eu posso mesmo posso editá-la.

1 curtida

@rtom me considero um admirador e evangelista dos abertos e achei seu projeto sensacional muito bem estruturado e totalmente didático! tenho estudado muito os dados abertos e criando um base unificada com dados relavantes com o objetivo de atribuir um grau de risco de conformidade legal…

1 curtida

Estou servindo a base de dados com possibilidade de retorno em JSON.
Caso observe interesse melhorarei o serviço de hospedagem

Base CNPJ

1 curtida

@rtom Parabéns pelo projeto. Muito didático e funcional. A possibilidade de imersão nos nós torna o processo exploratório incrivelmente simples. Senti apenas falta de uma “legenda” lateral, como as encontradas em mapas cartográficos, indicando o que é cada nó (elemento: pessoa, empresa, …). Outro recurso que seria também interessante é uma função de aumentar o espalhamento entre os nós, “reduzir a gravidade” do conjunto. Penso que algo assim facilitaria a leitura em casos da rede exibida ser muito densa.

Parabéns, ficou sensacional.

Editei a postagem original para deixar mais organizadas as informações para servir de referência fácil para quem encontrar este tópico pela primeira vez.

Sobre a Minha Receita, passo aqui para compartilhar uma novidade: coloquei uma API aberta no ar, ainda como protótipo para validar se vale a pena manter: minhareceita.org — basicamente envie um POST com o campo cnpj para essa URL e vais receber um JSON com a ficha completa do CNPJ.

A documentação está aqui e conto mais do contexto nesse fio :wink:

3 curtidas

Agradeço pelos comentários e sugestões. Essa de aumentar o espalhamento deu para implementar. Essas e outras alterações eu atualizei no github. Também atualizei o arquivo sqlite com a base da receita, usando o script do fabioserpa, referência 23/11/2020.

2 curtidas

A Receita Federal disponibilizou a base de dados públicos de cnpj em formato csv, referência 16/03/2021: Dados Públicos CNPJ
Os arquivos foram divididos em três grupos, sócios, empresas e filiais. O pdf de layout fala numa tabela de dados do simples, mas ainda não está lá. O novo formato facilita carregar os dados, pois o formato antigo, de tamanho fixo dos campos, misturava dados de empresas e de sócios.

2 curtidas

Não disponibilizaram essas tabelas do Simples Nacional, nem as tabelas de dominio (país, municipio, qualificação dos sócios, natureza jurídica e cnaes). E também detectei que no arquivo de sócios, em alguns casos o campo de nome está vindo em branco.

1 curtida

Muito Bacana Vasata!!

ate te mandei um e-mail amigo.

ficou show seu Power BI.

Consegue adicionar um relatorio para gerar os e-mails destas empresas segmentados dentro do BI que você gerou?

obrigado!