Clasificación Semántica de Solicitudes de Acceso a la Información

Autores/as

DOI:

https://doi.org/10.36428/revistadacgu.v15i27.537

Palabras clave:

Derecho de Acceso a la Información, Minería de Textos, Clasificación Semántica, Transparencia

Resumen

Desde el principio de la aplicación de la Ley de Acceso a la Información hasta 2020 hubo una creciente demanda de solicitudes de acceso a la información en el ámbito de la Contraloría General de la Unión (CGU) y de todo el poder ejecutivo federal. La investigación de un proceso de clasificación de pedidos más automatizado, con el uso de Inteligencia Artificial, tiene como objetivo la reducción de costes para la administración pública, la mejora de las condiciones laborales de los servidores que realizan esta tarea y apoya la elaboración de respuestas más rápidas para la sociedad. En este trabajo se realizó la aplicación del método de clasificación semánticamente enriquecido por expresiones de dominio con un análisis comparativo de los
resultados de clasificación de las solicitudes de acceso a la información utilizando algoritmos con diferentes niveles de explicabilidad y transparencia para el proceso. La mejor acurácia obtenida fue por el modelo de algoritmo Support Vector Machine, con un valor del 91,1% y una Medida-F1 Weighted del 91,7%, enriquecido con la representación de textos gBoED. Otros aspectos destacados los resultados del modelo generado por algoritmos que ofrecem una mayor explicabilidad. Los resultados mostraron un gran potencial en cuanto al uso de este modelo para clasificar las solicitudes de acceso a la información no solo en la CGU sino en todo el sector público.

Descargas

Los datos de descarga aún no están disponibles.

Biografía del autor/a

  • Flávia Lemos Sampaio Xavier, Controladoria-Geral da União (CGU)

    Mestre em Ciência Política pelo Instituto Universitário de Pesquisas do Rio de Janeiro (Iuperj - 2015), especialista em Ciência de Dados, pelo Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo (USP - 2021), com certificação profissional em Ciência de Dados pela Universidade de Harvard (Harvard, 2020) e bacharel em Ciência Política, pela Universidade de Brasília (UnB, 2008). Desde 2017, pesquisa os temas de transparência, democracia, promoção da participação social e atua na Controladoria-Geral da União (CGU) e no Observatório Social de Brasília (OSB).

  • Ricardo Brigato Scheicher, Instituto de Ciências Matemáticas e de Computação - Universidade de São Paulo (ICMC-USP)

    Doutorando em Ciências da Computação e Matemática Computacional na Universidade de São Paulo (ICMC-USP). Atualmente é Cientista de Dados especialista em linguística computacional na empresa Vitta Tecnologia em Saúde, ligada ao grupo Stone Seguros. Mestre em Ciências da Computação pela Universidade Federal de São Carlos (UFSCar). Atua há dez anos com pesquisa e desenvolvimento de aplicações em Inteligência Artificial, Aprendizado de Máquina, Mineração de dados e textos.

  • Roberta Akemi Sinoara, Instituto Federal de São Paulo (IFSP)

    Doutora em Ciências da Computação e Matemática Computacional pela Universidade de São Paulo (ICMC-USP), na área de Inteligência Artificial, com estágio na Università degli Studi di Roma - La Sapienza, Roma, Itália. Atualmente é docente em regime de dedicação exclusiva no Instituto Federal de Educação, Ciência e Tecnologia de São Paulo (IFSP), Campus Boituva. Possui mais de quinze anos de experiência em pesquisas em Inteligência Artificial, com trabalhos em Ciência de Dados, Aprendizado de Máquina, e Mineração de Dados e Textos, atuando também em colaborações com grupos de pesquisa em diferentes áreas do conhecimento.

Referencias

Constituição da República Federativa do Brasil de 1988. (1998). Brasília.

Decreto 7.724 (2012). Regulamenta a Lei nº 12.527, de 18 de novembro de 2011, que dispõe sobre o acesso a informações previsto no inciso XXXIII do caput do art. 5º, no inciso II do § 3º do art. 37 e no § 2º do art. 216 da Constituição.

García, S., Luengo, J., Herrera, F. (2015) Data Preprocessing in Data Mining. Intelligent Systems Reference Library, Vol. 72. Springer, Cham.

Gunning, D. (2017). Explainable artificial intelligence (XAI). Tech. rep., Defense Advanced Research Projects Agency (DARPA).

Lei n. 9.609, de 19 de fevereiro de 1998 (1998). Dispõe sobre a proteção da propriedade intelectual de programa de computador, sua comercialização no País, e dá outras providências.

Lei n. 12.527, de 18 de novembro de 2011. (2011). Lei de Acesso à Informação. Regula o acesso a informações previsto no inciso XXXIII do art. 5º, no inciso II do § 3º do art. 37 e no § 2º do art. 216 da Constituição Federal; altera a Lei n. 8.112, de 11 de dezembro de 1990; revoga a Lei n. 11.111, de 5 de maio de 2005, e dispositivos da Lei no 8.159, de 8 de janeiro de 1991; e dá outras providências.

Linardatos, P., Papastefanopoulos, V., & Kotsiantis, S. (2020). Explainable AI: A review of machine learning interpretability methods. Entropy, Vol. 23, No. 1, p. 18.

Marques, C. A. N., Matsuno, I. P., Sinoara, R. A., Rezende, S. O. & Rozenfeld,

H. (2015). An exploratory study to evaluate the practical application of pss methods and tools based on text mining. In: Proceedings of the 20th International Conference on Engineering Design.

Martins, A. C. M., Lopes, O. A., & Cademartori, S. U. (2017). O STF e a divulgação nominalmente individualizada da remuneração dos servidores púbicos: uma análise do Recurso Extraordinário 652.777-SP. Dissertação de Mestrado em Direito - Universidade de Brasília.

Rezende, S. O., J. B. Pugliesi, E. A. Melanda, & M. F. Paula (2003). Mineração de dados. In S. O. Rezende (Ed.), Sistemas Inteligentes – Fundamentos e Aplicações. pp. 307–335. Editora Manole.

Rossi, R. G. (2015). Classificação automática de textos por meio de aprendizado de máquina baseado em redes. Tese de Doutorado em Ciências da Computação e Matemática Computacional - Instituto de Ciências Matemáticas e de Computação, Fundação de Amparo à Pesquisa do Estado de São Paulo.

Scheicher, R. B., Sinorara, R. A., Koga, N. J., & Rezende, S. O. (2016). Uso de expressões do domínio na classificação automática de documentos. In: Anais do XIII Encontro Nacional de Inteligência Artificial e Computacional, Vol. 1.

Scheicher, R.; Sinoara, R., Felinto, J., & Rezende, S. (2019). Sentiment classification improvement using semantically enriched information. In: Proceedings of the ACM Symposium on Document Engineering 2019.

Sinoara, R. A. (2018). Aspectos semânticos na representação de textos para classificação automática. Tese de Doutorado - Instituto de Ciências Matemáticas e de Computação. Universidade de São Paulo (USP). São Carlos, Brasil.

Publicado

2023-07-07

Número

Sección

Ciência de Dados na Administração Pública: Desafios e Oportunidades (compl.)

Cómo citar

Clasificación Semántica de Solicitudes de Acceso a la Información. Revista da CGU, [S. l.], v. 15, n. 27, 2023. DOI: 10.36428/revistadacgu.v15i27.537. Disponível em: https://revista.cgu.gov.br/Revista_da_CGU/article/view/537.. Acesso em: 21 nov. 2024.

Artículos similares

1-10 de 225

También puede Iniciar una búsqueda de similitud avanzada para este artículo.