Recuperando especialistas em energias renováveis por meio de taxonomia facetada e técnicas de processamento de linguagem natural
um experimento de mineração de dados acadêmicos aplicados por pesquisadores das universidades estaduais da Bahia
DOI:
https://doi.org/10.5433/1981-8920.2025v30n2p242Palavras-chave:
Buscas de informação, Processamento da linguagem natural, Mineração de dadosResumo
Objetivo: Este artigo propõe uma solução para a recuperação de informações textuais em um banco de dados acadêmico, utilizando técnicas de processamento de linguagem natural para identificar especialistas em energias renováveis. A solução emprega uma taxonomia facetada e uma plataforma de mapeamento de competências.
Metodologia: A pesquisa segue uma abordagem experimental, estruturada nas seguintes etapas: 1) Identificação do problema e definição dos objetivos; 2) Busca e revisão sistemática de artigos sobre energias renováveis para a formação do vocabulário de controle; 3) Construção da taxonomia de energias renováveis usando o método 101; 4) Implementação do mecanismo de busca; 5) Análise dos dados dos pesquisadores especialistas. Os dados foram catalogados na plataforma simcc.uesc.br, incluindo informações como número de publicações, resumos do Lattes, índices de relevância e instituições dos pesquisadores.
Resultados: O desenvolvimento de um motor de busca e de uma solução analítica permitiu correlacionar pesquisadores com a taxonomia de energias renováveis. A aplicação da taxonomia facetada como filtro resultou em 550 requisições na base de dados.
Conclusões: A utilização da taxonomia facetada e o desenvolvimento do motor de busca proporcionaram uma recuperação de especialistas em energias renováveis, demonstrando a eficácia da abordagem proposta na combinação automática de termos para melhorar a busca e análise de informações acadêmicas.
Downloads
Referências
AGANETTE, Elisangela; ALVARENGA, Lídia; SOUZA, Renato Rocha. Elementos constitutivos do conceito de taxonomia. Informação & Sociedade: Est., João Pessoa, v. 20, n. 3, p. 77-93, set./dez. 2010. Disponível em: https://periodicos.ufpb.br/ojs/index.php/ies/article/view/3994. Acesso em: : 23 ago. 2024.
CAPES. Metodologia do Qualis – Referência Quadrienal 2017-2020. 2019. Disponível em: https://www.gov.br/capes/pt-br/acesso-a-informacao/acoes-e-programas/avaliacao/avaliacao-quadrienal/avaliacao-quadrienal-2017-2020/metodologia-do-qualis-referencia-quadrienio-2017-2020. Acesso em: 23 ago. 2024.
COELHO JÚNIOR, Abeil; LEMOS, Daniela Lucas da Silva. Tratamento da informação em acervos culturais: avaliação do uso de vocabulários controlados em coleções museológicas sob gestão do Instituto Brasileiro de Museus. RICI: Revista Ibero-Americana de Ciência da Informação, Brasília, v. 16, n. 1, p. 131-145, 2023. Disponível em: https://brapci.inf.br/v/219726. Acesso em: 23 ago. 2024.
EVERS, Aline; FINATTO, Maria José Bocorny. Linguística de corpus, léxico-estatística textual e processamento de linguagem natural: perspectiva para estudos de vocabulário em produções textuais. Revista GTLex, Uberlândia, v. 1, n. 2, p. 271-295, jan./jun. 2016. Disponível em: https://seer.ufu.br/index.php/GTLex/article/view/34711. Acesso em: 23 ago. 2024.
FERREIRA, Hildenise. A Taxonomia Enquanto Estrutura Classificatória: Uma Aplicação em Domínio de Conhecimento Interdisciplinar. Ponto de Acesso, Salvador, v. 4, n. 2, p. 131-156, set. 2010. Disponível em: https://periodicos.ufba.br/index.php/revistaici/article/view/4103. Acesso em: 19 de fevereiro 2024.
GIL, Antônio Carlos. Como elaborar projetos de pesquisa. 4. ed. São Paulo: Atlas, 2002.
GONZALES, Marco; LIMA, Vera L. S. Recuperação de informação e processamento da linguagem natural. In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAÇÃO. 23, 2003, Campinas. Anais [...]. Porto Alegre: SBC, 2003, p. 347-395. Disponível em: https://www.marilia.unesp.br/Home/Instituicao/Docentes/EdbertoFerneda/mri-06---gonzales-e-lima-2003.pdf. Acesso em: 26 ago. 2024.
GUIMARÃES, Nathália Ramos. Bahia é o estado que mais produziu energia eólica no primeiro trimestre de 2023. Brasil 61, 06 jun. 2023. Disponível em: https://brasil61.com/n/bahia-e-o-estado-que-mais-produziu-energia-eolica-no-primeiro-trimestre-de-2023-pind234048. Acesso em: 19 de fevereiro 2024.
JANNUZZI, Gilberto de Martino. Uma avaliação das atividades recentes de P&D em energia renovável no Brasil e reflexões para o futuro. Campinas, SP: Energy Discussion Paper nº 2.64-01/03, 2003. (Energy Discussion Paper). Disponível em: https://www.iei-brasil.org/pdf/reliei-2640103.pdf. Acesso em: 23 fev. 2024.
JORGE, Eduardo Manuel de Freitas; SANTOS, Franciele Portugal dos; CARNEIRO, Breno Pádua Brandão; MACHADO, Fernanda Almeida. Arquitetura da informação analítica para integração de dados da pesquisa e pós-graduação: um estudo de caso da Universidade do Estado da Bahia. Informação & Informação, Londrina, v. 25, n. 1, p. 115-140, jan./mar. 2020. Disponível em: https://ojs.uel.br/revistas/uel/index.php/informacao/article/view/36009. Acesso em: 23 ago. 2024.
LAUBHEIMER, Page. Taxonomy 101: definition, best practices, and how it complements other IA work. In: NNGroup, 03 jul. 2022. Disponível em: https://www.nngroup.com/articles/taxonomy-101/. Acesso em: 23 ago. 2024.
LMSYS. Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90% ChatGPT Quality. [S.l.] LMSYS, 2023. Disponível em: http://www.lmsys.com/vicuna13b. Acesso em: 23 de fevereiro 2024.
MACULAN, enildes Coura Moreira dos Santos; LIMA, Gercina Angela Borém de Oliveira. Taxonomia facetada navegacional: agregando valor às informações disponibilizadas em bibliotecas digitais de teses e dissertações. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília. Anais [...]. Brasília: Encontro Nacional de Pesquisa e Pós-Graduação em Ciência da Informação, 2011. Disponível em: https://cip.brapci.inf.br/download/174991. Acesso em: 23 ago. 2024.
META AI. Introducing LLaMA: a foundational, 65-billion-parameter large language model. Meta, 24 fev. 2023. Disponível em: https://ai.meta.com/blog/large-language-model-llama-meta-ai/. Acesso em: 23 fev. 2024.
MOOERS, Calvin S. Editor’s corner: “coding, information retrieval, and the rapid selector”. American Documentation, v. 1, n. 4, p. 225-229, oct. 1950. Disponível em: https://onlinelibrary.wiley.com/doi/10.1002/asi.5090010409. Acesso em: 25 mar. 2024.
OBSERVATÓRIO DA EPT. Dashboard da distribuição da produção de energias renováveis no Brasil. 25 ago. 2022. Disponível em: https://observatorioept.org.br/ept-em-numeros/painel-de-energias-renovaveis. Acesso em: 19 de fevereiro 2024.
SANTOS, M. S. dos; OLIVEIRA, V. H. de J.; JORGE, E. M. de F.; COSTA, G. de M. Solução para Mapeamento e Consulta das Competências dos Pesquisadores: uma arquitetura para extração, integração e consultas de informações acadêmicas. Cadernos de Prospecção. Salvador, v. 17, n. 2, p. 671–688, 2024. DOI: 10.9771/cp.v17i2.56670. Disponível em: https://periodicos.ufba.br/index.php/nit/article/view/56670. Acesso em: 25 jul. 2025.
SINERGIA BAHIA. Bahia é o líder em energia eólica no país. Sinergia-Ba, 28 jul. 2019. Disponível em: https://sinergiabahia.com.br/bahia-e-o-primeiro-em-energia-eolica-no-pais/. Acesso em: 19 fev. 2024.
STELAEXPERTA. Plataforma StelaExperta. [Plataforma online]. São Paulo: StelaTek, 2023. Disponível em: http://www.stelaexperta.com.br/. Acesso em: 19 fev. 2024.
TERRA, José Cláudio Cyrineu; SCHOUERI, Ricardo; VOGEL, Michely Jabala M.; FRANCO, Carlos. Taxonomia: elemento fundamental para a Gestão do Conhecimento. [S. l.]: Biblioteca TerraForum Consultores, p. 1-8, [20--?]. Disponível em: http://paginapessoal.utfpr.edu.br/mansano/arquivos/
taxonomia.pdf. Acesso em: 19 fev. 2024.
UNIVERSIDADE FEDERAL DE MINAS GERAIS. Somos UFMG. [Plataforma online]. Belo Horizonte: UFMG, [s.d.]. Disponível em: https://somos.ufmg.br/ Acesso em: 19 de fevereiro 2024.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2025 Eduardo Manuel Freitas Jorge, Gleidson Meireles Costa, Victor Hugo Jesus Oliveira, Alex Álisson Bandeira Santos, Gesil Sampaio Amarante Segundo

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
A revista se reserva o direito de efetuar, nos originais, alterações de ordem normativa, ortográfica e gramatical, com vistas a manter o padrão culto da língua e a credibilidade do veículo. Respeitará, no entanto, o estilo de escrever dos autores. Alterações, correções ou sugestões de ordem conceitual serão encaminhadas aos autores, quando necessário.
O conteúdo dos textos e a citação e uso de imagens submetidas são de inteira responsabilidade dos autores.
Em todas as citações posteriores, deverá ser consignada a fonte original de publicação, no caso a Informação & Informação.




