Classificação Semântica de Pedidos de Acesso à Informação

Autores

DOI:

https://doi.org/10.36428/revistadacgu.v15i27.537

Palavras-chave:

Direito de Acesso à Informação, Mineração de Textos, Classificação Semântica, Transparência

Resumo

Desde o início da implementação da Lei de Acesso à Informação no Brasil até 2020, existiu uma demanda crescente de pedidos de acesso à informação no âmbito da Controladoria-Geral da União (CGU) e de todo Poder Executivo federal. A busca por um modelo de automação de processos utilizando Inteligência Artificial visa levar à redução de custos para a administração pública e à melhoria das condições de trabalho, bem como auxilia na eficiência das respostas à sociedade. Neste trabalho, foi realizada a aplicação do método de classificação semanticamente enriquecida por expressões do domínio com uma análise comparativa dos resultados de classificação dos pedidos de acesso à informação usando como base algoritmos com diferentes níveis de explicabilidade e transparência para o processo. A melhor acurácia foi obtida pelo modelo do algoritmo Support Vector Machine, com valor de 91,1% e Medida-F1 Weighted de 91,7%, enriquecido pela representação de textos gBoED. Outros destaques também podem ser observados para algoritmos que oferecem maior explicabilidade. Os resultados apresentaram grande potencial quanto ao uso deste modelo para classificação dos pedidos de acesso à informação não apenas na CGU, mas em todo o setor público.

Downloads

Os dados de download ainda não estão disponíveis.

Biografia do Autor

  • Flávia Lemos Sampaio Xavier, Controladoria-Geral da União (CGU)

    Mestre em Ciência Política pelo Instituto Universitário de Pesquisas do Rio de Janeiro (Iuperj - 2015), especialista em Ciência de Dados, pelo Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (USP - 2021), com certificação profissional em Ciência de Dados pela Universidade de Harvard (Harvard, 2020) e bacharel em Ciência Política, pela Universidade de Brasília (UnB, 2008). Desde 2017, pesquisa os temas de transparência, democracia, promoção da participação social e atua na Controladoria-Geral da União (CGU) e no Observatório Social de Brasília (OSB).

  • Ricardo Brigato Scheicher, Instituto de Ciências Matemáticas e de Computação - Universidade de São Paulo (ICMC-USP)

    Doutorando em Ciências da Computação e Matemática Computacional na Universidade de São Paulo (ICMC-USP). Atualmente é Cientista de Dados especialista em linguística computacional na empresa Vitta Tecnologia em Saúde, ligada ao grupo Stone Seguros. Mestre em Ciências da Computação pela Universidade Federal de São Carlos (UFSCar). Atua há dez anos com pesquisa e desenvolvimento de aplicações em Inteligência Artificial, Aprendizado de Máquina, Mineração de dados e textos.

  • Roberta Akemi Sinoara, Instituto Federal de São Paulo (IFSP)

    Doutora em Ciências da Computação e Matemática Computacional pela Universidade de São Paulo (ICMC-USP), na área de Inteligência Artificial, com estágio na Università degli Studi di Roma - La Sapienza, Roma, Itália. Atualmente é docente em regime de dedicação exclusiva no Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP), Campus Boituva. Possui mais de quinze anos de experiência em pesquisas em Inteligência Artificial, com trabalhos em Ciência de Dados, Aprendizado de Máquina, e Mineração de Dados e Textos, atuando também em colaborações com grupos de pesquisa em diferentes áreas do conhecimento.

Referências

Constituição da República Federativa do Brasil de 1988. (1998). Brasília.

Decreto 7.724 (2012). Regulamenta a Lei nº 12.527, de 18 de novembro de 2011, que dispõe sobre o acesso a informações previsto no inciso XXXIII do caput do art. 5º, no inciso II do § 3º do art. 37 e no § 2º do art. 216 da Constituição.

García, S., Luengo, J., Herrera, F. (2015) Data Preprocessing in Data Mining. Intelligent Systems Reference Library, Vol. 72. Springer, Cham.

Gunning, D. (2017). Explainable artificial intelligence (XAI). Tech. rep., Defense Advanced Research Projects Agency (DARPA).

Lei n. 9.609, de 19 de fevereiro de 1998 (1998). Dispõe sobre a proteção da propriedade intelectual de programa de computador, sua comercialização no País, e dá outras providências.

Lei n. 12.527, de 18 de novembro de 2011. (2011). Lei de Acesso à Informação. Regula o acesso a informações previsto no inciso XXXIII do art. 5º, no inciso II do § 3º do art. 37 e no § 2º do art. 216 da Constituição Federal; altera a Lei n. 8.112, de 11 de dezembro de 1990; revoga a Lei n. 11.111, de 5 de maio de 2005, e dispositivos da Lei no 8.159, de 8 de janeiro de 1991; e dá outras providências.

Linardatos, P., Papastefanopoulos, V., & Kotsiantis, S. (2020). Explainable AI: A review of machine learning interpretability methods. Entropy, Vol. 23, No. 1, p. 18.

Marques, C. A. N., Matsuno, I. P., Sinoara, R. A., Rezende, S. O. & Rozenfeld,

H. (2015). An exploratory study to evaluate the practical application of pss methods and tools based on text mining. In: Proceedings of the 20th International Conference on Engineering Design.

Martins, A. C. M., Lopes, O. A., & Cademartori, S. U. (2017). O STF e a divulgação nominalmente individualizada da remuneração dos servidores púbicos: uma análise do Recurso Extraordinário 652.777-SP. Dissertação de Mestrado em Direito - Universidade de Brasília.

Rezende, S. O., J. B. Pugliesi, E. A. Melanda, & M. F. Paula (2003). Mineração de dados. In S. O. Rezende (Ed.), Sistemas Inteligentes – Fundamentos e Aplicações. pp. 307–335. Editora Manole.

Rossi, R. G. (2015). Classificação automática de textos por meio de aprendizado de máquina baseado em redes. Tese de Doutorado em Ciências da Computação e Matemática Computacional - Instituto de Ciências Matemáticas e de Computação, Fundação de Amparo à Pesquisa do Estado de São Paulo.

Scheicher, R. B., Sinorara, R. A., Koga, N. J., & Rezende, S. O. (2016). Uso de expressões do domínio na classificação automática de documentos. In: Anais do XIII Encontro Nacional de Inteligência Artificial e Computacional, Vol. 1.

Scheicher, R.; Sinoara, R., Felinto, J., & Rezende, S. (2019). Sentiment classification improvement using semantically enriched information. In: Proceedings of the ACM Symposium on Document Engineering 2019.

Sinoara, R. A. (2018). Aspectos semânticos na representação de textos para classificação automática. Tese de Doutorado - Instituto de Ciências Matemáticas e de Computação. Universidade de São Paulo (USP). São Carlos, Brasil.

Downloads

Publicado

07/07/2023

Edição

Seção

Ciência de Dados na Administração Pública: Desafios e Oportunidades (compl.)

Como Citar

Classificação Semântica de Pedidos de Acesso à Informação. Revista da CGU, [S. l.], v. 15, n. 27, 2023. DOI: 10.36428/revistadacgu.v15i27.537. Disponível em: https://revista.cgu.gov.br/Revista_da_CGU/article/view/537.. Acesso em: 21 nov. 2024.

Artigos Semelhantes

1-10 de 243

Você também pode iniciar uma pesquisa avançada por similaridade para este artigo.