Recuperando especialistas em energias renováveis por meio de taxonomia facetada e técnicas de processamento de linguagem natural

um experimento de mineração de dados acadêmicos aplicados por pesquisadores das universidades estaduais da Bahia

Autores

DOI:

https://doi.org/10.5433/1981-8920.2025v30n2p242

Palavras-chave:

Buscas de informação, Processamento da linguagem natural, Mineração de dados

Resumo

Objetivo: Este artigo propõe uma solução para a recuperação de informações textuais em um banco de dados acadêmico, utilizando técnicas de processamento de linguagem natural para identificar especialistas em energias renováveis. A solução emprega uma taxonomia facetada e uma plataforma de mapeamento de competências.
Metodologia: A pesquisa segue uma abordagem experimental, estruturada nas seguintes etapas: 1) Identificação do problema e definição dos objetivos; 2) Busca e revisão sistemática de artigos sobre energias renováveis para a formação do vocabulário de controle; 3) Construção da taxonomia de energias renováveis usando o método 101; 4) Implementação do mecanismo de busca; 5) Análise dos dados dos pesquisadores especialistas. Os dados foram catalogados na plataforma simcc.uesc.br, incluindo informações como número de publicações, resumos do Lattes, índices de relevância e instituições dos pesquisadores.
Resultados: O desenvolvimento de um motor de busca e de uma solução analítica permitiu correlacionar pesquisadores com a taxonomia de energias renováveis. A aplicação da taxonomia facetada como filtro resultou em 550 requisições na base de dados.
Conclusões: A utilização da taxonomia facetada e o desenvolvimento do motor de busca proporcionaram uma recuperação de especialistas em energias renováveis, demonstrando a eficácia da abordagem proposta na combinação automática de termos para melhorar a busca e análise de informações acadêmicas.

Downloads

Não há dados estatísticos.

Biografia do Autor

Eduardo Manuel Freitas Jorge, Universidade Estadual da Bahia - UNEB

Doutor em Difusão do Conhecimento pela Universidade Federal da Bahia (UFBA). Docente do Departamento de Ciências Exatas e da Terra da Universidade Estadual da Bahia (UNEB), Salvador, Brasil.

Gleidson Meireles Costa, Universidade Federal do Recôncavo da Bahia - UFRB,undefined

Graduando em Engenharia de Produção pela Universidade Federal do Recôncavo da Bahia (UFRB), Cruz das Almas, Brasil.

Victor Hugo Jesus Oliveira, Universidade Federal de Minas Gerais - UFMG,undefined

Graduando em Engenharia de Sistemas pela Universidade Federal de Minas Gerais (UFMG), Belo Horizonte, Brasil.

Alex Álisson Bandeira Santos, Universidade SENAI CIMATEC,undefined

Doutor em Energia e Ambiente pela Universidade Federal da Bahia (UFBA). Docente da Universidade SENAI CIMATEC, Salvador, Brasil.

Gesil Sampaio Amarante Segundo, Universidade Estadual de Santa Cruz - UESC,undefined

Doutor em Física pela Universidade de São Paulo (USP). Docente da Universidade Estadual de Santa Cruz (UESC), Ilhéus, Brasil.

Referências

AGANETTE, Elisangela; ALVARENGA, Lídia; SOUZA, Renato Rocha. Elementos constitutivos do conceito de taxonomia. Informação & Sociedade: Est., João Pessoa, v. 20, n. 3, p. 77-93, set./dez. 2010. Disponível em: https://periodicos.ufpb.br/ojs/index.php/ies/article/view/3994. Acesso em: : 23 ago. 2024.

CAPES. Metodologia do Qualis – Referência Quadrienal 2017-2020. 2019. Disponível em: https://www.gov.br/capes/pt-br/acesso-a-informacao/acoes-e-programas/avaliacao/avaliacao-quadrienal/avaliacao-quadrienal-2017-2020/metodologia-do-qualis-referencia-quadrienio-2017-2020. Acesso em: 23 ago. 2024.

COELHO JÚNIOR, Abeil; LEMOS, Daniela Lucas da Silva. Tratamento da informação em acervos culturais: avaliação do uso de vocabulários controlados em coleções museológicas sob gestão do Instituto Brasileiro de Museus. RICI: Revista Ibero-Americana de Ciência da Informação, Brasília, v. 16, n. 1, p. 131-145, 2023. Disponível em: https://brapci.inf.br/v/219726. Acesso em: 23 ago. 2024.

EVERS, Aline; FINATTO, Maria José Bocorny. Linguística de corpus, léxico-estatística textual e processamento de linguagem natural: perspectiva para estudos de vocabulário em produções textuais. Revista GTLex, Uberlândia, v. 1, n. 2, p. 271-295, jan./jun. 2016. Disponível em: https://seer.ufu.br/index.php/GTLex/article/view/34711. Acesso em: 23 ago. 2024.

FERREIRA, Hildenise. A Taxonomia Enquanto Estrutura Classificatória: Uma Aplicação em Domínio de Conhecimento Interdisciplinar. Ponto de Acesso, Salvador, v. 4, n. 2, p. 131-156, set. 2010. Disponível em: https://periodicos.ufba.br/index.php/revistaici/article/view/4103. Acesso em: 19 de fevereiro 2024.

GIL, Antônio Carlos. Como elaborar projetos de pesquisa. 4. ed. São Paulo: Atlas, 2002.

GONZALES, Marco; LIMA, Vera L. S. Recuperação de informação e processamento da linguagem natural. In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAÇÃO. 23, 2003, Campinas. Anais [...]. Porto Alegre: SBC, 2003, p. 347-395. Disponível em: https://www.marilia.unesp.br/Home/Instituicao/Docentes/EdbertoFerneda/mri-06---gonzales-e-lima-2003.pdf. Acesso em: 26 ago. 2024.

GUIMARÃES, Nathália Ramos. Bahia é o estado que mais produziu energia eólica no primeiro trimestre de 2023. Brasil 61, 06 jun. 2023. Disponível em: https://brasil61.com/n/bahia-e-o-estado-que-mais-produziu-energia-eolica-no-primeiro-trimestre-de-2023-pind234048. Acesso em: 19 de fevereiro 2024.

JANNUZZI, Gilberto de Martino. Uma avaliação das atividades recentes de P&D em energia renovável no Brasil e reflexões para o futuro. Campinas, SP: Energy Discussion Paper nº 2.64-01/03, 2003. (Energy Discussion Paper). Disponível em: https://www.iei-brasil.org/pdf/reliei-2640103.pdf. Acesso em: 23 fev. 2024.

JORGE, Eduardo Manuel de Freitas; SANTOS, Franciele Portugal dos; CARNEIRO, Breno Pádua Brandão; MACHADO, Fernanda Almeida. Arquitetura da informação analítica para integração de dados da pesquisa e pós-graduação: um estudo de caso da Universidade do Estado da Bahia. Informação & Informação, Londrina, v. 25, n. 1, p. 115-140, jan./mar. 2020. Disponível em: https://ojs.uel.br/revistas/uel/index.php/informacao/article/view/36009. Acesso em: 23 ago. 2024.

LAUBHEIMER, Page. Taxonomy 101: definition, best practices, and how it complements other IA work. In: NNGroup, 03 jul. 2022. Disponível em: https://www.nngroup.com/articles/taxonomy-101/. Acesso em: 23 ago. 2024.

LMSYS. Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90% ChatGPT Quality. [S.l.] LMSYS, 2023. Disponível em: http://www.lmsys.com/vicuna13b. Acesso em: 23 de fevereiro 2024.

MACULAN, enildes Coura Moreira dos Santos; LIMA, Gercina Angela Borém de Oliveira. Taxonomia facetada navegacional: agregando valor às informações disponibilizadas em bibliotecas digitais de teses e dissertações. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília. Anais [...]. Brasília: Encontro Nacional de Pesquisa e Pós-Graduação em Ciência da Informação, 2011. Disponível em: https://cip.brapci.inf.br/download/174991. Acesso em: 23 ago. 2024.

META AI. Introducing LLaMA: a foundational, 65-billion-parameter large language model. Meta, 24 fev. 2023. Disponível em: https://ai.meta.com/blog/large-language-model-llama-meta-ai/. Acesso em: 23 fev. 2024.

MOOERS, Calvin S. Editor’s corner: “coding, information retrieval, and the rapid selector”. American Documentation, v. 1, n. 4, p. 225-229, oct. 1950. Disponível em: https://onlinelibrary.wiley.com/doi/10.1002/asi.5090010409. Acesso em: 25 mar. 2024.

OBSERVATÓRIO DA EPT. Dashboard da distribuição da produção de energias renováveis no Brasil. 25 ago. 2022. Disponível em: https://observatorioept.org.br/ept-em-numeros/painel-de-energias-renovaveis. Acesso em: 19 de fevereiro 2024.

SANTOS, M. S. dos; OLIVEIRA, V. H. de J.; JORGE, E. M. de F.; COSTA, G. de M. Solução para Mapeamento e Consulta das Competências dos Pesquisadores: uma arquitetura para extração, integração e consultas de informações acadêmicas. Cadernos de Prospecção. Salvador, v. 17, n. 2, p. 671–688, 2024. DOI: 10.9771/cp.v17i2.56670. Disponível em: https://periodicos.ufba.br/index.php/nit/article/view/56670. Acesso em: 25 jul. 2025.

SINERGIA BAHIA. Bahia é o líder em energia eólica no país. Sinergia-Ba, 28 jul. 2019. Disponível em: https://sinergiabahia.com.br/bahia-e-o-primeiro-em-energia-eolica-no-pais/. Acesso em: 19 fev. 2024.

STELAEXPERTA. Plataforma StelaExperta. [Plataforma online]. São Paulo: StelaTek, 2023. Disponível em: http://www.stelaexperta.com.br/. Acesso em: 19 fev. 2024.

TERRA, José Cláudio Cyrineu; SCHOUERI, Ricardo; VOGEL, Michely Jabala M.; FRANCO, Carlos. Taxonomia: elemento fundamental para a Gestão do Conhecimento. [S. l.]: Biblioteca TerraForum Consultores, p. 1-8, [20--?]. Disponível em: http://paginapessoal.utfpr.edu.br/mansano/arquivos/

taxonomia.pdf. Acesso em: 19 fev. 2024.

UNIVERSIDADE FEDERAL DE MINAS GERAIS. Somos UFMG. [Plataforma online]. Belo Horizonte: UFMG, [s.d.]. Disponível em: https://somos.ufmg.br/ Acesso em: 19 de fevereiro 2024.

Downloads

Publicado

2025-08-15

Como Citar

Jorge, E. M. F., Costa, G. M., Jesus Oliveira, V. H., Santos, A. Álisson B., & Amarante Segundo, G. S. (2025). Recuperando especialistas em energias renováveis por meio de taxonomia facetada e técnicas de processamento de linguagem natural: um experimento de mineração de dados acadêmicos aplicados por pesquisadores das universidades estaduais da Bahia. Informação & Informação, 30(2), 242–268. https://doi.org/10.5433/1981-8920.2025v30n2p242