Recovering renewable energy experts through faceted taxonomy and natural language processing techniques

an academic data mining experiment applied by researchers from Bahia state universities

Authors

DOI:

https://doi.org/10.5433/1981-8920.2025v30n2p242

Keywords:

Information searches, Natural language processing, Data mining

Abstract

Objective: This article proposes a solution for retrieving textual information from an academic database, using natural language processing techniques to identify renewable energy experts. The solution employs a faceted taxonomy and a competency mapping platform.
Methodology: The research follows an experimental approach, structured in the following steps: 1) Problem identification and objective definition; 2) Systematic search and review of articles on renewable energy to form the control vocabulary; 3) Construction of the renewable energy taxonomy using the 101 method; 4) Implementation of the search engine; 5) Analysis of the expert researchers' data. The data were cataloged on the simcc.uesc.br platform, including information such as number of publications, Lattes abstracts, relevance indices, and researchers' institutions.
Results: The development of a search engine and an analytical solution allowed correlating researchers with the renewable energy taxonomy. Applying the faceted taxonomy as a filter resulted in 550 database requests.
Conclusions: The use of faceted taxonomy and the development of the search engine provided a recovery of experts in renewable energy, demonstrating the effectiveness of the proposed approach in the automatic combination of terms to improve the search and analysis of academic information.

Downloads

Download data is not yet available.

Author Biographies

Eduardo Manuel Freitas Jorge, Universidade Estadual da Bahia - UNEB

PhD in Knowledge Dissemination from the Universidade Federal da Bahia (UFBA). Professor at the Department of Exact and Earth Sciences at the Universidade Estadual da Bahia (UNEB), Salvador, Brasil.

Gleidson Meireles Costa, Universidade Federal do Recôncavo da Bahia - UFRB

Graduando em Engenharia de Produção pela Universidade Federal do Recôncavo da Bahia (UFRB), Cruz das Almas, Brasil.

Victor Hugo Jesus Oliveira, Universidade Federal de Minas Gerais - UFMG

Undergraduate in Systems Engineering at the Universidade Federal de Minas Gerais (UFMG), Belo Horizonte, Brasil.

Alex Álisson Bandeira Santos, Universidade SENAI CIMATEC

PhD in Energy and Environment from the Universidade Federal da Bahia (UFBA). Professor at Universidade SENAI CIMATEC, Salvador, Brasil.

Gesil Sampaio Amarante Segundo, Universidade Estadual de Santa Cruz - UNESC

PhD in Physics from the Universidade de São Paulo (USP). Professor at the Universidade Estadual de Santa Cruz (UESC), Ilhéus, Brasil.

References

AGANETTE, Elisangela; ALVARENGA, Lídia; SOUZA, Renato Rocha. Elementos constitutivos do conceito de taxonomia. Informação & Sociedade: Est., João Pessoa, v. 20, n. 3, p. 77-93, set./dez. 2010. Disponível em: https://periodicos.ufpb.br/ojs/index.php/ies/article/view/3994. Acesso em: : 23 ago. 2024.

CAPES. Metodologia do Qualis – Referência Quadrienal 2017-2020. 2019. Disponível em: https://www.gov.br/capes/pt-br/acesso-a-informacao/acoes-e-programas/avaliacao/avaliacao-quadrienal/avaliacao-quadrienal-2017-2020/metodologia-do-qualis-referencia-quadrienio-2017-2020. Acesso em: 23 ago. 2024.

COELHO JÚNIOR, Abeil; LEMOS, Daniela Lucas da Silva. Tratamento da informação em acervos culturais: avaliação do uso de vocabulários controlados em coleções museológicas sob gestão do Instituto Brasileiro de Museus. RICI: Revista Ibero-Americana de Ciência da Informação, Brasília, v. 16, n. 1, p. 131-145, 2023. Disponível em: https://brapci.inf.br/v/219726. Acesso em: 23 ago. 2024.

EVERS, Aline; FINATTO, Maria José Bocorny. Linguística de corpus, léxico-estatística textual e processamento de linguagem natural: perspectiva para estudos de vocabulário em produções textuais. Revista GTLex, Uberlândia, v. 1, n. 2, p. 271-295, jan./jun. 2016. Disponível em: https://seer.ufu.br/index.php/GTLex/article/view/34711. Acesso em: 23 ago. 2024.

FERREIRA, Hildenise. A Taxonomia Enquanto Estrutura Classificatória: Uma Aplicação em Domínio de Conhecimento Interdisciplinar. Ponto de Acesso, Salvador, v. 4, n. 2, p. 131-156, set. 2010. Disponível em: https://periodicos.ufba.br/index.php/revistaici/article/view/4103. Acesso em: 19 de fevereiro 2024.

GIL, Antônio Carlos. Como elaborar projetos de pesquisa. 4. ed. São Paulo: Atlas, 2002.

GONZALES, Marco; LIMA, Vera L. S. Recuperação de informação e processamento da linguagem natural. In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAÇÃO. 23, 2003, Campinas. Anais [...]. Porto Alegre: SBC, 2003, p. 347-395. Disponível em: https://www.marilia.unesp.br/Home/Instituicao/Docentes/EdbertoFerneda/mri-06---gonzales-e-lima-2003.pdf. Acesso em: 26 ago. 2024.

GUIMARÃES, Nathália Ramos. Bahia é o estado que mais produziu energia eólica no primeiro trimestre de 2023. Brasil 61, 06 jun. 2023. Disponível em: https://brasil61.com/n/bahia-e-o-estado-que-mais-produziu-energia-eolica-no-primeiro-trimestre-de-2023-pind234048. Acesso em: 19 de fevereiro 2024.

JANNUZZI, Gilberto de Martino. Uma avaliação das atividades recentes de P&D em energia renovável no Brasil e reflexões para o futuro. Campinas, SP: Energy Discussion Paper nº 2.64-01/03, 2003. (Energy Discussion Paper). Disponível em: https://www.iei-brasil.org/pdf/reliei-2640103.pdf. Acesso em: 23 fev. 2024.

JORGE, Eduardo Manuel de Freitas; SANTOS, Franciele Portugal dos; CARNEIRO, Breno Pádua Brandão; MACHADO, Fernanda Almeida. Arquitetura da informação analítica para integração de dados da pesquisa e pós-graduação: um estudo de caso da Universidade do Estado da Bahia. Informação & Informação, Londrina, v. 25, n. 1, p. 115-140, jan./mar. 2020. Disponível em: https://ojs.uel.br/revistas/uel/index.php/informacao/article/view/36009. Acesso em: 23 ago. 2024.

LAUBHEIMER, Page. Taxonomy 101: definition, best practices, and how it complements other IA work. In: NNGroup, 03 jul. 2022. Disponível em: https://www.nngroup.com/articles/taxonomy-101/. Acesso em: 23 ago. 2024.

LMSYS. Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90% ChatGPT Quality. [S.l.] LMSYS, 2023. Disponível em: http://www.lmsys.com/vicuna13b. Acesso em: 23 de fevereiro 2024.

MACULAN, enildes Coura Moreira dos Santos; LIMA, Gercina Angela Borém de Oliveira. Taxonomia facetada navegacional: agregando valor às informações disponibilizadas em bibliotecas digitais de teses e dissertações. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília. Anais [...]. Brasília: Encontro Nacional de Pesquisa e Pós-Graduação em Ciência da Informação, 2011. Disponível em: https://cip.brapci.inf.br/download/174991. Acesso em: 23 ago. 2024.

META AI. Introducing LLaMA: a foundational, 65-billion-parameter large language model. Meta, 24 fev. 2023. Disponível em: https://ai.meta.com/blog/large-language-model-llama-meta-ai/. Acesso em: 23 fev. 2024.

MOOERS, Calvin S. Editor’s corner: “coding, information retrieval, and the rapid selector”. American Documentation, v. 1, n. 4, p. 225-229, oct. 1950. Disponível em: https://onlinelibrary.wiley.com/doi/10.1002/asi.5090010409. Acesso em: 25 mar. 2024.

OBSERVATÓRIO DA EPT. Dashboard da distribuição da produção de energias renováveis no Brasil. 25 ago. 2022. Disponível em: https://observatorioept.org.br/ept-em-numeros/painel-de-energias-renovaveis. Acesso em: 19 de fevereiro 2024.

SANTOS, M. S. dos; OLIVEIRA, V. H. de J.; JORGE, E. M. de F.; COSTA, G. de M. Solução para Mapeamento e Consulta das Competências dos Pesquisadores: uma arquitetura para extração, integração e consultas de informações acadêmicas. Cadernos de Prospecção. Salvador, v. 17, n. 2, p. 671–688, 2024. DOI: 10.9771/cp.v17i2.56670. Disponível em: https://periodicos.ufba.br/index.php/nit/article/view/56670. Acesso em: 25 jul. 2025.

SINERGIA BAHIA. Bahia é o líder em energia eólica no país. Sinergia-Ba, 28 jul. 2019. Disponível em: https://sinergiabahia.com.br/bahia-e-o-primeiro-em-energia-eolica-no-pais/. Acesso em: 19 fev. 2024.

STELAEXPERTA. Plataforma StelaExperta. [Plataforma online]. São Paulo: StelaTek, 2023. Disponível em: http://www.stelaexperta.com.br/. Acesso em: 19 fev. 2024.

TERRA, José Cláudio Cyrineu; SCHOUERI, Ricardo; VOGEL, Michely Jabala M.; FRANCO, Carlos. Taxonomia: elemento fundamental para a Gestão do Conhecimento. [S. l.]: Biblioteca TerraForum Consultores, p. 1-8, [20--?]. Disponível em: http://paginapessoal.utfpr.edu.br/mansano/arquivos/

taxonomia.pdf. Acesso em: 19 fev. 2024.

UNIVERSIDADE FEDERAL DE MINAS GERAIS. Somos UFMG. [Plataforma online]. Belo Horizonte: UFMG, [s.d.]. Disponível em: https://somos.ufmg.br/ Acesso em: 19 de fevereiro 2024.

Published

2025-08-15

How to Cite

Jorge, E. M. F., Costa, G. M., Jesus Oliveira, V. H., Santos, A. Álisson B., & Amarante Segundo, G. S. (2025). Recovering renewable energy experts through faceted taxonomy and natural language processing techniques: an academic data mining experiment applied by researchers from Bahia state universities. Informação & Informação, 30(2), 242–268. https://doi.org/10.5433/1981-8920.2025v30n2p242