Mais um dataset disponível para a comunidade. Dessa vez, consolidei a base de acórdãos do Tribunal de Contas de União (TCU). Além do corpus referente aos acórdãos, há metadados úteis para treinamento de modelos supervisionados.
O dataset está publicado no kaggle :
https://www.kaggle.com/ferraz/acordaos-tcu
Além disso, caso tenham interesse no código de coleta dos dados o repositório é o: