Semantic Classification of Requests to Information

Authors

DOI:

https://doi.org/10.36428/revistadacgu.v15i27.537

Keywords:

Right of Access to Information, Text Mining, Semantic Classification, Transparency

Abstract

Since the Freedom of Information Act implementation until 2020, there was a growing demand for requests to information, within the scope of the Office of the Comptroller General (CGU) and the entire federal executive branch. The search for a process automation model using Artificial Intelligence aims to achieve cost reduction for the public administration and improvement of the working conditions as well as supports the response efficiency to society. This work applied a method for classification improvement using semantically enriched information derived from domain expressions and carried out a comparative analysis of the classification results of requests to information using algorithms with different explainability and transparency levels. The best accuracy obtained by the Support Vector Machine algorithm model was 91,1% and
Weighted score-F1 of 91,7%, enriched by the gBoED text representation model. Also noteworthy are the results of the model generated by algorithms that offers greater. The results indicate great potential regarding the use of this model to classify requests to information not only at the CGU but also across the public sector.

Downloads

Download data is not yet available.

Author Biographies

  • Flávia Lemos Sampaio Xavier, Controladoria-Geral da União (CGU)

    Mestre em Ciência Política pelo Instituto Universitário de Pesquisas do Rio de Janeiro (Iuperj - 2015), especialista em Ciência de Dados, pelo Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (USP - 2021), com certificação profissional em Ciência de Dados pela Universidade de Harvard (Harvard, 2020) e bacharel em Ciência Política, pela Universidade de Brasília (UnB, 2008). Desde 2017, pesquisa os temas de transparência, democracia, promoção da participação social e atua na Controladoria-Geral da União (CGU) e no Observatório Social de Brasília (OSB).

  • Ricardo Brigato Scheicher, Instituto de Ciências Matemáticas e de Computação - Universidade de São Paulo (ICMC-USP)

    Doutorando em Ciências da Computação e Matemática Computacional na Universidade de São Paulo (ICMC-USP). Atualmente é Cientista de Dados especialista em linguística computacional na empresa Vitta Tecnologia em Saúde, ligada ao grupo Stone Seguros. Mestre em Ciências da Computação pela Universidade Federal de São Carlos (UFSCar). Atua há dez anos com pesquisa e desenvolvimento de aplicações em Inteligência Artificial, Aprendizado de Máquina, Mineração de dados e textos.

  • Roberta Akemi Sinoara, Instituto Federal de São Paulo (IFSP)

    Doutora em Ciências da Computação e Matemática Computacional pela Universidade de São Paulo (ICMC-USP), na área de Inteligência Artificial, com estágio na Università degli Studi di Roma - La Sapienza, Roma, Itália. Atualmente é docente em regime de dedicação exclusiva no Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP), Campus Boituva. Possui mais de quinze anos de experiência em pesquisas em Inteligência Artificial, com trabalhos em Ciência de Dados, Aprendizado de Máquina, e Mineração de Dados e Textos, atuando também em colaborações com grupos de pesquisa em diferentes áreas do conhecimento.

References

Constituição da República Federativa do Brasil de 1988. (1998). Brasília.

Decreto 7.724 (2012). Regulamenta a Lei nº 12.527, de 18 de novembro de 2011, que dispõe sobre o acesso a informações previsto no inciso XXXIII do caput do art. 5º, no inciso II do § 3º do art. 37 e no § 2º do art. 216 da Constituição.

García, S., Luengo, J., Herrera, F. (2015) Data Preprocessing in Data Mining. Intelligent Systems Reference Library, Vol. 72. Springer, Cham.

Gunning, D. (2017). Explainable artificial intelligence (XAI). Tech. rep., Defense Advanced Research Projects Agency (DARPA).

Lei n. 9.609, de 19 de fevereiro de 1998 (1998). Dispõe sobre a proteção da propriedade intelectual de programa de computador, sua comercialização no País, e dá outras providências.

Lei n. 12.527, de 18 de novembro de 2011. (2011). Lei de Acesso à Informação. Regula o acesso a informações previsto no inciso XXXIII do art. 5º, no inciso II do § 3º do art. 37 e no § 2º do art. 216 da Constituição Federal; altera a Lei n. 8.112, de 11 de dezembro de 1990; revoga a Lei n. 11.111, de 5 de maio de 2005, e dispositivos da Lei no 8.159, de 8 de janeiro de 1991; e dá outras providências.

Linardatos, P., Papastefanopoulos, V., & Kotsiantis, S. (2020). Explainable AI: A review of machine learning interpretability methods. Entropy, Vol. 23, No. 1, p. 18.

Marques, C. A. N., Matsuno, I. P., Sinoara, R. A., Rezende, S. O. & Rozenfeld,

H. (2015). An exploratory study to evaluate the practical application of pss methods and tools based on text mining. In: Proceedings of the 20th International Conference on Engineering Design.

Martins, A. C. M., Lopes, O. A., & Cademartori, S. U. (2017). O STF e a divulgação nominalmente individualizada da remuneração dos servidores púbicos: uma análise do Recurso Extraordinário 652.777-SP. Dissertação de Mestrado em Direito - Universidade de Brasília.

Rezende, S. O., J. B. Pugliesi, E. A. Melanda, & M. F. Paula (2003). Mineração de dados. In S. O. Rezende (Ed.), Sistemas Inteligentes – Fundamentos e Aplicações. pp. 307–335. Editora Manole.

Rossi, R. G. (2015). Classificação automática de textos por meio de aprendizado de máquina baseado em redes. Tese de Doutorado em Ciências da Computação e Matemática Computacional - Instituto de Ciências Matemáticas e de Computação, Fundação de Amparo à Pesquisa do Estado de São Paulo.

Scheicher, R. B., Sinorara, R. A., Koga, N. J., & Rezende, S. O. (2016). Uso de expressões do domínio na classificação automática de documentos. In: Anais do XIII Encontro Nacional de Inteligência Artificial e Computacional, Vol. 1.

Scheicher, R.; Sinoara, R., Felinto, J., & Rezende, S. (2019). Sentiment classification improvement using semantically enriched information. In: Proceedings of the ACM Symposium on Document Engineering 2019.

Sinoara, R. A. (2018). Aspectos semânticos na representação de textos para classificação automática. Tese de Doutorado - Instituto de Ciências Matemáticas e de Computação. Universidade de São Paulo (USP). São Carlos, Brasil.

Published

2023-07-07

Issue

Section

Ciência de Dados na Administração Pública: Desafios e Oportunidades (compl.)

How to Cite

Semantic Classification of Requests to Information. Revista da CGU, [S. l.], v. 15, n. 27, 2023. DOI: 10.36428/revistadacgu.v15i27.537. Disponível em: https://revista.cgu.gov.br/Revista_da_CGU/article/view/537.. Acesso em: 21 nov. 2024.

Similar Articles

1-10 of 48

You may also start an advanced similarity search for this article.