Dados relacionados à base do CNPJ liberado pela Receita Federal do Brasil

Para quem quiser encontrar dados de CNPJ, as comunidades j√° desenvolveram duas possibilidades bem interessantes. Vide abaixo:

  • https://brasil.io/dataset/documentos-brasil/documents
    Documentos coletados de dados p√ļblicos, a partir dos seguintes datasets: socios-brasil, gastos-diretos, gastos-deputados, eleicoes. Nota: os CPFs foram ofuscados por quest√Ķes de privacidade.

  • https://github.com/georgevbsantiago/qsacnpj
    O objetivo do pacote é tornar os dados do Cadastro Nacional da Pessoa Jurídica (CNPJ) mais acessível, num padrão legível por máquina, para que a Sociedade possa utilizá-los em diversas iniciativas, atividades, projetos etc. Isso se faz necessário porque a Receita Federal publicou a base num formato do tipo fixed width - arquivo de largura fixa, o que requer o prévio tratamento dos dados (com elevado grau de dificuldade técnica e esfoço computacional adicional) antes do seu consumo imediato em sofwares de análise de dados.

5 Curtidas

A Receita Federal do Brasil lançou uma nova versão da base de empresas/sócios. O @turicas já atualizou as bases no Brasil.io, tanto os arquivos originais quanto os convertidos. Parabéns e obrigado pelo trabalho, @turicas! :partying_face: :tada:

Mais informa√ß√Ķes: https://twitter.com/turicas/status/1197125153047662592

5 Curtidas

@fbarbalho acho que vale linkar o https://github.com/turicas/socios-brasil/ e https://data.brasil.io/dataset/socios-brasil/ em vez do dataset de documentos. Explico: o dataset de documentos foi criado inicialmente para facilitar o trabalho interno do backend do Brasil.IO nas p√°ginas especiais (que listam as informa√ß√Ķes sobre uma pessoa/empresa de todos os datasets dispon√≠veis), por√©m esse dataset se revelou super dif√≠cil de manter por conta do problema complexo de concilia√ß√£o e, com isso, s√≥ conseguirei atualiz√°-lo quando tiver resolvida essa quest√£o. Al√©m disso, nunca foi inten√ß√£o disponibilizar os CPFs completos e, por isso, decidi n√£o disponibiliz√°-lo para download.
Sobre a questão da conciliação, estou trabalhando nela há algum tempo e avancei bastante: https://github.com/turicas/brasil.io/issues/182 (tem vários outros testes num outro repositório que ainda não estão na issue); acho que depois de finalizado, esse trabalho será de bastante utilidade para quem lida com diversas bases de dados envolvendo entidades que possuem mais de um identificador (no caso de pessoas físcias: nome completo, CPF, título de eleitor etc.).

2 Curtidas

√Č importante informar o link tamb√©m da fonte original na RFB:

https://receita.economia.gov.br/orientacao/tributaria/cadastros/cadastro-nacional-de-pessoas-juridicas-cnpj/dados-publicos-cnpj

Com as ressalvas de que o servidor da Receita √© lento, podendo demorar dias para baixar os arquivos, e que o layout dos arquivos √© dif√≠cil de usar (n√£o √© CSV, e sim de campos com largura fixa). √Č mais f√°cil usar os pacotes da comunidade referenciados acima.

Esse mesmo dataset também está no portal dados.gov.br, mas há anos está com o link quebrado (e não adianta reclamar na ouvidoria, eles não consertam alegando apenas que os dados já estão no outro link, por mais que se argumente que também deveria estar no Portal Brasileiro de Dados Abertos):

1 Curtida

Painel criado através dos dados abertos da receita federal.

3 Curtidas

@Vasata, sensacional esse teu painel! Meus parabéns!

Obrigado Bruno, fique a vontade para usar e compartilhar se quiser.

1 Curtida

O Marcelo Mathias postou no grupo do Telegram o link para uma API criada pelo Eduardo Cuducos (do Serenata) que serve os dados do CNPJ, juntamente com as informa√ß√Ķes do c√≥digo CNAE de atividade da empresa.

Não tem um endereço para consultar a API, mas o código é livre para subir no seu próprio computador ou servidor e usar.

2 Curtidas

Gostaria de apresentar o meu projeto no github https://github.com/rictom/rede-cnpj. √Č uma rotina para visualizar graficamente os v√≠nculos entre cnpjs e s√≥cios da base de dados p√ļblicos da Receita Federal, usando python, flask e javascript. √Č preciso gerar o banco de dados em sqlite pelo script em https://github.com/fabioserpa/CNPJ-full, ou baixar o arquivo sqlite que coloquei no google drive.
Um vídeo demonstrativo está no youtube http://www.youtube.com/watch?v=nxz9Drhqn_I.

2 Curtidas

Muito interessante esse visualizador de redes de sócios de empresas, @rtom! Parabéns e obrigado por compartilhar! :partying_face:

@fbarbalho, nas mensagens subsequentes j√° surgiram muitas outras refer√™ncias √ļteis e importantes. Para facilitar para quem chega aqui buscando informa√ß√Ķes, o que voc√™ acha de sumarizar tudo editando a sua primeira postagem? Se preferir eu posso mesmo posso edit√°-la.

@rtom me considero um admirador e evangelista dos abertos e achei seu projeto sensacional muito bem estruturado e totalmente didático! tenho estudado muito os dados abertos e criando um base unificada com dados relavantes com o objetivo de atribuir um grau de risco de conformidade legal…

1 Curtida