Estimando a Arrecadação da Dívida Ativa da União com Machine Learning
Uma análise baseada nos dados de arrecadação do período de 2015 a 2021
DOI:
https://doi.org/10.36428/revistadacgu.v14i26.529Palavras-chave:
Dívida Ativa, Arrecadação Fiscal, Orçamento, Machine Learning, Ciência de DadosResumo
Como entidade responsável pela cobrança da Dívida Ativa da União, a Procuradoria-Geral da Fazenda Nacional deve apresentar, ao final de cada exercício fiscal, os resultados alcançados e as previsões de arrecadação para o ano seguinte para a composição das Leis Orçamentárias vindouras. Atualmente essa estimativa é elaborada utilizando a técnica da suavização exponencial, que considera os ingressos passados para projetar a arrecadação futura. O presente trabalho procura avaliar a aplicação de algoritmos de aprendizado de máquina na elaboração dessas projeções, como meio de aprimoramento da gestão. Foram testados os algoritmos Regressão Linear, Árvore de Decisão, Floresta Randômica e Árvore de Decisão de Aumento de Gradiente. Os modelos foram alimentados com informações dos indicadores macroeconômicos IPCA, IGP-M, PIB, taxa de Câmbio e taxa SELIC, além de dados relativos a parcelamentos excepcionais e transações tributárias disponibilizados aos contribuintes pela Fazenda Nacional.
Downloads
Referências
AGÊNCIA SENADO. (2021). Projeto que reabre prazo para o Programa Especial de Regularização Tributária segue para a Câmara. Brasília, BR.
BANCO CENTRAL DO BRASIL. (2022a). Estatísticas do setor externo. Nota para a imprensa - 29/04/2022.
https://www.bcb.gov.br/estatisticas/estatisticassetorexterno
________. (2022b). Taxa Selic.
https://www.bcb.gov.br/controleinflacao/taxaselic
BECKER, Dan. (2017a). How Models Work: The first step if you’re new to machine learning. Kaggle.
https://www.kaggle.com/code/dansbecker/how-models-work
________. (2017b). Model Validation: Measure the performance of your model, so you can test and compare alternatives. Kaggle.
https://www.kaggle.com/code/dansbecker/model-validation
CALLEGARI-JACQUES, Sidia M. (2017). Bioestatística: princípios e aplicações. Porto Alegre, BR: Artmed.
FÁVERO, Luiz Paulo; BELFIORE, Patrícia. (2017). Manual de análise de dados. 1. ed. Rio de Janeiro, BR: Elsevier.
FUNDAÇÃO GETÚLIO VARGAS. (2022). IGP-M: Resultados 2022. FGV.
https://portal.fgv.br/noticias/igpm-resultados-2022
FURTADO, Paulo Augusto. (2022). Por que escolher Python?. In: Jornada Python: uma jornada imersiva na aplicabilidade de uma das mais poderosas linguagens de programação do mundo. Rio de Janeiro, BR: Brasport.
FREITAS, Gabriel Belmino. (2019). O uso de machine learning na modelagem da previsão de inflação: revisão bibliográfica. 42 f. Trabalho de Conclusão de Curso (Bacharelado em Ciências Econômicas) — Universidade de Brasília, Brasília, 2019.
https://bdm.unb.br/handle/10483/25328
GOOGLE. (2022). Conheça o Colab.
https://colab.research.google.com/?utm_source=scs-index#scrollTo=OwuxHmxllTwN
GRUS, Joel. (2016). Data Science do Zero. Traduzido por Welington Nascimento. Rio de Janeiro, BR: Alta Books.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. (2022a). IPCA - Índice Nacional de Preços ao Consumidor Amplo. Portal do Governo Brasileiro.
________. (2022b). Produto Interno Bruto - PIB. Portal do Governo Brasileiro.
https://www.ibge.gov.br/explica/pib.php
________. (2022c). CONCLA - Comissão Nacional de Classificação.
https://cnae.ibge.gov.br/?view=estrutura&tipo=cnae&versao_classe=7.0.0&versao_subclasse=9.1.0
KELLEHER, John D.; TIERNEY, Brendan. (2018). Data Science. The MIT Press essential knowledge series. Cambridge, US: The MIT Press.
KRUGMAN, Paul R; OBSTFELD, Maurice. (2005). Economia internacional: teoria e política. Tradutor técnico Eliezer Martins Diniz. São Paulo, BR: Pearson Addison Wesley.
MCKINNEY, Wes. (2010). Data structures for statistical computing in python, Proceedings of the 9th Python in Science Conference, Volume 445.
https://conference.scipy.org/proceedings/scipy2010/pdfs/mckinney.pdf
MINISTÉRIO DA ECONOMIA. (novembro, 2014). Cadastro Nacional de Atividades Econômicas – CNAE.
MOREIRA, J. M.; CARVALHO, A.; HORVÁTH, T. (2018). A general introduction to data analytics. Hoboken, US: Wiley.
OLIVEIRA, B. (2021). Algoritmos de aprendizado de máquina na predição e avaliação de evasão de clientes em ambiente de produção. 87 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás.
http://repositorio.bc.ufg.br/tede/handle/tede/11522
OZDEMIR, Sinan. (2016). Principles of data science. Birmingham, UK: Packt Publishing Ltd.
PARANHOS, R. et al. (2014). Desvendando os Mistérios do Coeficiente de Correlação de Pearson: o Retorno. Leviathan (São Paulo), (8), 66-95.
DOI: https://doi.org/10.11606/issn.2237-4485.lev.2014.132346
PEDREGOSA et al. (2011). Scikit-learn: Machine Learning in Python, Journal of Machine Learning Research 12, pp. 2825-2830.
https://jmlr.csail.mit.edu/papers/v12/pedregosa11a.html
PROCURADORIA-GERAL DA FAZENDA NACIONAL. (2021a). Nota SEI nº 29/2021/PGDAU-CDA-COAGED/PGDAU-CDA/PGDAU/PGFN-ME. Presta informações sobre a dívida ativa da União para compor o anexo de riscos fiscais. Ministério da Economia.
________. (2021b). Nota SEI nº 7/2022/PGDAU-CDA-COAGED/PGDAU-CDA/PGDAU/PGFN-ME. Boletim de Acompanhamento Gerencial - Edição Anual – 2021. Ministério da Economia.
________. (2021c). Nota Conjunta SEI nº 2/2021/PGDAU-CGR. Analisa os resultados alcançados pelas modalidades de transação da dívida ativa da União e da transação do contencioso de pequeno valor. Ministério da Economia.
SANTOS, Gustavo Carvalho. (2020). Algoritmos de Machine Learning para previsão da B3. 90 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal de Uberlândia, Uberlândia.
DOI https://doi.org/10.14393/ufu.di.2020.640
ZHANG, Z. et. al. (julho, 2021). GBDT-MO: Gradient-Boosted Decision Trees for Multiple Outputs in IEEE Transactions on Neural Networks and Learning Systems, vol. 32, no. 7, pp. 3156-3167.
Downloads
Publicado
Edição
Seção
Licença
Copyright (c) 2022 Revista da CGU

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
A Revista da CGU segue a uma Licença Creative Commons Atribuição 4.0 Internacional (CC BY), que permite o uso e compartilhamento dos trabalhos publicados, desde que se atribua crédito aos autores e fontes. Os conteúdos publicados até 2019 contam com permissão genérica para uso e compartilhamento com indicação obrigatória de autoria e fonte.
Ressaltamos alguns pontos essenciais e não exaustivos relacionados:
- A submissão da contribuição implica compromisso de não a submeter a outro periódico e autoriza, caso aprovado, a sua publicação.
- A submissão da contribuição implica também que os autores concordam com a publicação, sem que disso resulte remuneração, reembolso ou compensação de qualquer natureza.
- Os trabalhos publicados são de responsabilidade dos autores, não representando, necessariamente, a opinião da Revista da CGU.
- A responsabilidade por eventuais plágios, fraudes ou imprecisões são de responsabilidade dos autores.
- O responsável pela submissão declara, sob as penas da Lei, que a informação sobre a autoria do trabalho é absolutamente completa e verdadeira.
Destacam-se, ainda, os demais itens relacionados às Políticas Editoriais, em especial sobre a Missão e Escopo, Ética da Publicação, Processo de Avaliação pelos Pares e Política de Acesso Livre.