Recuperación de especialistas en energías renovables a través de taxonomía facetada y técnicas de procesamiento del lenguaje natural

un experimento de minería de datos académicos aplicado por investigadores de las universidades del estado de Bahía

Autores/as

DOI:

https://doi.org/10.5433/1981-8920.2025v30n2p242

Palabras clave:

Buscas de información, Procesamiento del lenguaje natural, Minería de datos

Resumen

Objetivo: Este artículo propone una solución para recuperar información textual de una base de datos académica, utilizando técnicas de procesamiento del lenguaje natural para identificar expertos en energías renovables. La solución emplea una taxonomía facetada y una plataforma de mapeo de competencias.
Metodología: La investigación sigue un enfoque experimental, estructurado en los siguientes pasos: 1) Identificación del problema y definición del objetivo; 2) Búsqueda y revisión sistemática de artículos sobre energías renovables para formar el vocabulario de control; 3) Construcción de la taxonomía de energías renovables utilizando el método 101; 4) Implementación del motor de búsqueda; 5) Análisis de los datos de los investigadores expertos. Los datos se catalogaron en la plataforma simcc.uesc.br, incluyendo información como número de publicaciones, resúmenes de Lattes, índices de relevancia e instituciones de los investigadores.
Resultados: El desarrollo de un motor de búsqueda y una solución analítica permitió correlacionar a los investigadores con la taxonomía de energías renovables. La aplicación de la taxonomía facetada como filtro resultó en 550 solicitudes a la base de datos.
Conclusiones: El uso de la taxonomía facetada y el desarrollo del motor de búsqueda proporcionaron una recuperación de expertos en energías renovables, demostrando la efectividad del enfoque propuesto en la combinación automática de términos para mejorar la búsqueda y análisis de información académica.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Eduardo Manuel Freitas Jorge, Universidade Estadual da Bahia - UNEB

Doctor en Difusión del Conocimiento por la Universidade Federal da Bahia (UFBA). Profesor del Departamento de Ciencias Exactas y de la Tierra de la Universidade Estadual da Bahia (UNEB), Salvador, Brasil.

Gleidson Meireles Costa, Universidade Federal do Recôncavo da Bahia - UFRB

Licenciado en Ingeniería de Producción por la Universidade Federal do Recôncavo da Bahia (UFRB), Cruz das Almas, Brasil.

Victor Hugo Jesus Oliveira, Universidade Federal de Minas Gerais - UFMG

Licenciatura en Ingeniería de Sistemas de la Universidade Federal de Minas Gerais (UFMG), Belo Horizonte, Brasil.

Alex Álisson Bandeira Santos, Universidade SENAI CIMATEC

Doctor en Energía y Medio Ambiente por la Universidade Federal da Bahia (UFBA). Profesor de la Universidade SENAI CIMATEC, Salvador, Brasil.

Gesil Sampaio Amarante Segundo, Universidade Estadual de Santa Cruz - UNESC

Doctor en Física por la Universidade de São Paulo (USP). Profesor de la Universidade Estadual de Santa Cruz (UESC), Ilhéus, Brasil.

Citas

AGANETTE, Elisangela; ALVARENGA, Lídia; SOUZA, Renato Rocha. Elementos constitutivos do conceito de taxonomia. Informação & Sociedade: Est., João Pessoa, v. 20, n. 3, p. 77-93, set./dez. 2010. Disponível em: https://periodicos.ufpb.br/ojs/index.php/ies/article/view/3994. Acesso em: : 23 ago. 2024.

CAPES. Metodologia do Qualis – Referência Quadrienal 2017-2020. 2019. Disponível em: https://www.gov.br/capes/pt-br/acesso-a-informacao/acoes-e-programas/avaliacao/avaliacao-quadrienal/avaliacao-quadrienal-2017-2020/metodologia-do-qualis-referencia-quadrienio-2017-2020. Acesso em: 23 ago. 2024.

COELHO JÚNIOR, Abeil; LEMOS, Daniela Lucas da Silva. Tratamento da informação em acervos culturais: avaliação do uso de vocabulários controlados em coleções museológicas sob gestão do Instituto Brasileiro de Museus. RICI: Revista Ibero-Americana de Ciência da Informação, Brasília, v. 16, n. 1, p. 131-145, 2023. Disponível em: https://brapci.inf.br/v/219726. Acesso em: 23 ago. 2024.

EVERS, Aline; FINATTO, Maria José Bocorny. Linguística de corpus, léxico-estatística textual e processamento de linguagem natural: perspectiva para estudos de vocabulário em produções textuais. Revista GTLex, Uberlândia, v. 1, n. 2, p. 271-295, jan./jun. 2016. Disponível em: https://seer.ufu.br/index.php/GTLex/article/view/34711. Acesso em: 23 ago. 2024.

FERREIRA, Hildenise. A Taxonomia Enquanto Estrutura Classificatória: Uma Aplicação em Domínio de Conhecimento Interdisciplinar. Ponto de Acesso, Salvador, v. 4, n. 2, p. 131-156, set. 2010. Disponível em: https://periodicos.ufba.br/index.php/revistaici/article/view/4103. Acesso em: 19 de fevereiro 2024.

GIL, Antônio Carlos. Como elaborar projetos de pesquisa. 4. ed. São Paulo: Atlas, 2002.

GONZALES, Marco; LIMA, Vera L. S. Recuperação de informação e processamento da linguagem natural. In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAÇÃO. 23, 2003, Campinas. Anais [...]. Porto Alegre: SBC, 2003, p. 347-395. Disponível em: https://www.marilia.unesp.br/Home/Instituicao/Docentes/EdbertoFerneda/mri-06---gonzales-e-lima-2003.pdf. Acesso em: 26 ago. 2024.

GUIMARÃES, Nathália Ramos. Bahia é o estado que mais produziu energia eólica no primeiro trimestre de 2023. Brasil 61, 06 jun. 2023. Disponível em: https://brasil61.com/n/bahia-e-o-estado-que-mais-produziu-energia-eolica-no-primeiro-trimestre-de-2023-pind234048. Acesso em: 19 de fevereiro 2024.

JANNUZZI, Gilberto de Martino. Uma avaliação das atividades recentes de P&D em energia renovável no Brasil e reflexões para o futuro. Campinas, SP: Energy Discussion Paper nº 2.64-01/03, 2003. (Energy Discussion Paper). Disponível em: https://www.iei-brasil.org/pdf/reliei-2640103.pdf. Acesso em: 23 fev. 2024.

JORGE, Eduardo Manuel de Freitas; SANTOS, Franciele Portugal dos; CARNEIRO, Breno Pádua Brandão; MACHADO, Fernanda Almeida. Arquitetura da informação analítica para integração de dados da pesquisa e pós-graduação: um estudo de caso da Universidade do Estado da Bahia. Informação & Informação, Londrina, v. 25, n. 1, p. 115-140, jan./mar. 2020. Disponível em: https://ojs.uel.br/revistas/uel/index.php/informacao/article/view/36009. Acesso em: 23 ago. 2024.

LAUBHEIMER, Page. Taxonomy 101: definition, best practices, and how it complements other IA work. In: NNGroup, 03 jul. 2022. Disponível em: https://www.nngroup.com/articles/taxonomy-101/. Acesso em: 23 ago. 2024.

LMSYS. Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90% ChatGPT Quality. [S.l.] LMSYS, 2023. Disponível em: http://www.lmsys.com/vicuna13b. Acesso em: 23 de fevereiro 2024.

MACULAN, enildes Coura Moreira dos Santos; LIMA, Gercina Angela Borém de Oliveira. Taxonomia facetada navegacional: agregando valor às informações disponibilizadas em bibliotecas digitais de teses e dissertações. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília. Anais [...]. Brasília: Encontro Nacional de Pesquisa e Pós-Graduação em Ciência da Informação, 2011. Disponível em: https://cip.brapci.inf.br/download/174991. Acesso em: 23 ago. 2024.

META AI. Introducing LLaMA: a foundational, 65-billion-parameter large language model. Meta, 24 fev. 2023. Disponível em: https://ai.meta.com/blog/large-language-model-llama-meta-ai/. Acesso em: 23 fev. 2024.

MOOERS, Calvin S. Editor’s corner: “coding, information retrieval, and the rapid selector”. American Documentation, v. 1, n. 4, p. 225-229, oct. 1950. Disponível em: https://onlinelibrary.wiley.com/doi/10.1002/asi.5090010409. Acesso em: 25 mar. 2024.

OBSERVATÓRIO DA EPT. Dashboard da distribuição da produção de energias renováveis no Brasil. 25 ago. 2022. Disponível em: https://observatorioept.org.br/ept-em-numeros/painel-de-energias-renovaveis. Acesso em: 19 de fevereiro 2024.

SANTOS, M. S. dos; OLIVEIRA, V. H. de J.; JORGE, E. M. de F.; COSTA, G. de M. Solução para Mapeamento e Consulta das Competências dos Pesquisadores: uma arquitetura para extração, integração e consultas de informações acadêmicas. Cadernos de Prospecção. Salvador, v. 17, n. 2, p. 671–688, 2024. DOI: 10.9771/cp.v17i2.56670. Disponível em: https://periodicos.ufba.br/index.php/nit/article/view/56670. Acesso em: 25 jul. 2025.

SINERGIA BAHIA. Bahia é o líder em energia eólica no país. Sinergia-Ba, 28 jul. 2019. Disponível em: https://sinergiabahia.com.br/bahia-e-o-primeiro-em-energia-eolica-no-pais/. Acesso em: 19 fev. 2024.

STELAEXPERTA. Plataforma StelaExperta. [Plataforma online]. São Paulo: StelaTek, 2023. Disponível em: http://www.stelaexperta.com.br/. Acesso em: 19 fev. 2024.

TERRA, José Cláudio Cyrineu; SCHOUERI, Ricardo; VOGEL, Michely Jabala M.; FRANCO, Carlos. Taxonomia: elemento fundamental para a Gestão do Conhecimento. [S. l.]: Biblioteca TerraForum Consultores, p. 1-8, [20--?]. Disponível em: http://paginapessoal.utfpr.edu.br/mansano/arquivos/

taxonomia.pdf. Acesso em: 19 fev. 2024.

UNIVERSIDADE FEDERAL DE MINAS GERAIS. Somos UFMG. [Plataforma online]. Belo Horizonte: UFMG, [s.d.]. Disponível em: https://somos.ufmg.br/ Acesso em: 19 de fevereiro 2024.

Publicado

2025-08-15

Cómo citar

Jorge, E. M. F., Costa, G. M., Jesus Oliveira, V. H., Santos, A. Álisson B., & Amarante Segundo, G. S. (2025). Recuperación de especialistas en energías renovables a través de taxonomía facetada y técnicas de procesamiento del lenguaje natural: un experimento de minería de datos académicos aplicado por investigadores de las universidades del estado de Bahía. Informação & Informação, 30(2), 242–268. https://doi.org/10.5433/1981-8920.2025v30n2p242