Recuperación de especialistas en energías renovables a través de taxonomía facetada y técnicas de procesamiento del lenguaje natural
un experimento de minería de datos académicos aplicado por investigadores de las universidades del estado de Bahía
DOI:
https://doi.org/10.5433/1981-8920.2025v30n2p242Palabras clave:
Buscas de información, Procesamiento del lenguaje natural, Minería de datosResumen
Objetivo: Este artículo propone una solución para recuperar información textual de una base de datos académica, utilizando técnicas de procesamiento del lenguaje natural para identificar expertos en energías renovables. La solución emplea una taxonomía facetada y una plataforma de mapeo de competencias.
Metodología: La investigación sigue un enfoque experimental, estructurado en los siguientes pasos: 1) Identificación del problema y definición del objetivo; 2) Búsqueda y revisión sistemática de artículos sobre energías renovables para formar el vocabulario de control; 3) Construcción de la taxonomía de energías renovables utilizando el método 101; 4) Implementación del motor de búsqueda; 5) Análisis de los datos de los investigadores expertos. Los datos se catalogaron en la plataforma simcc.uesc.br, incluyendo información como número de publicaciones, resúmenes de Lattes, índices de relevancia e instituciones de los investigadores.
Resultados: El desarrollo de un motor de búsqueda y una solución analítica permitió correlacionar a los investigadores con la taxonomía de energías renovables. La aplicación de la taxonomía facetada como filtro resultó en 550 solicitudes a la base de datos.
Conclusiones: El uso de la taxonomía facetada y el desarrollo del motor de búsqueda proporcionaron una recuperación de expertos en energías renovables, demostrando la efectividad del enfoque propuesto en la combinación automática de términos para mejorar la búsqueda y análisis de información académica.
Descargas
Citas
AGANETTE, Elisangela; ALVARENGA, Lídia; SOUZA, Renato Rocha. Elementos constitutivos do conceito de taxonomia. Informação & Sociedade: Est., João Pessoa, v. 20, n. 3, p. 77-93, set./dez. 2010. Disponível em: https://periodicos.ufpb.br/ojs/index.php/ies/article/view/3994. Acesso em: : 23 ago. 2024.
CAPES. Metodologia do Qualis – Referência Quadrienal 2017-2020. 2019. Disponível em: https://www.gov.br/capes/pt-br/acesso-a-informacao/acoes-e-programas/avaliacao/avaliacao-quadrienal/avaliacao-quadrienal-2017-2020/metodologia-do-qualis-referencia-quadrienio-2017-2020. Acesso em: 23 ago. 2024.
COELHO JÚNIOR, Abeil; LEMOS, Daniela Lucas da Silva. Tratamento da informação em acervos culturais: avaliação do uso de vocabulários controlados em coleções museológicas sob gestão do Instituto Brasileiro de Museus. RICI: Revista Ibero-Americana de Ciência da Informação, Brasília, v. 16, n. 1, p. 131-145, 2023. Disponível em: https://brapci.inf.br/v/219726. Acesso em: 23 ago. 2024.
EVERS, Aline; FINATTO, Maria José Bocorny. Linguística de corpus, léxico-estatística textual e processamento de linguagem natural: perspectiva para estudos de vocabulário em produções textuais. Revista GTLex, Uberlândia, v. 1, n. 2, p. 271-295, jan./jun. 2016. Disponível em: https://seer.ufu.br/index.php/GTLex/article/view/34711. Acesso em: 23 ago. 2024.
FERREIRA, Hildenise. A Taxonomia Enquanto Estrutura Classificatória: Uma Aplicação em Domínio de Conhecimento Interdisciplinar. Ponto de Acesso, Salvador, v. 4, n. 2, p. 131-156, set. 2010. Disponível em: https://periodicos.ufba.br/index.php/revistaici/article/view/4103. Acesso em: 19 de fevereiro 2024.
GIL, Antônio Carlos. Como elaborar projetos de pesquisa. 4. ed. São Paulo: Atlas, 2002.
GONZALES, Marco; LIMA, Vera L. S. Recuperação de informação e processamento da linguagem natural. In: CONGRESSO DA SOCIEDADE BRASILEIRA DE COMPUTAÇÃO. 23, 2003, Campinas. Anais [...]. Porto Alegre: SBC, 2003, p. 347-395. Disponível em: https://www.marilia.unesp.br/Home/Instituicao/Docentes/EdbertoFerneda/mri-06---gonzales-e-lima-2003.pdf. Acesso em: 26 ago. 2024.
GUIMARÃES, Nathália Ramos. Bahia é o estado que mais produziu energia eólica no primeiro trimestre de 2023. Brasil 61, 06 jun. 2023. Disponível em: https://brasil61.com/n/bahia-e-o-estado-que-mais-produziu-energia-eolica-no-primeiro-trimestre-de-2023-pind234048. Acesso em: 19 de fevereiro 2024.
JANNUZZI, Gilberto de Martino. Uma avaliação das atividades recentes de P&D em energia renovável no Brasil e reflexões para o futuro. Campinas, SP: Energy Discussion Paper nº 2.64-01/03, 2003. (Energy Discussion Paper). Disponível em: https://www.iei-brasil.org/pdf/reliei-2640103.pdf. Acesso em: 23 fev. 2024.
JORGE, Eduardo Manuel de Freitas; SANTOS, Franciele Portugal dos; CARNEIRO, Breno Pádua Brandão; MACHADO, Fernanda Almeida. Arquitetura da informação analítica para integração de dados da pesquisa e pós-graduação: um estudo de caso da Universidade do Estado da Bahia. Informação & Informação, Londrina, v. 25, n. 1, p. 115-140, jan./mar. 2020. Disponível em: https://ojs.uel.br/revistas/uel/index.php/informacao/article/view/36009. Acesso em: 23 ago. 2024.
LAUBHEIMER, Page. Taxonomy 101: definition, best practices, and how it complements other IA work. In: NNGroup, 03 jul. 2022. Disponível em: https://www.nngroup.com/articles/taxonomy-101/. Acesso em: 23 ago. 2024.
LMSYS. Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90% ChatGPT Quality. [S.l.] LMSYS, 2023. Disponível em: http://www.lmsys.com/vicuna13b. Acesso em: 23 de fevereiro 2024.
MACULAN, enildes Coura Moreira dos Santos; LIMA, Gercina Angela Borém de Oliveira. Taxonomia facetada navegacional: agregando valor às informações disponibilizadas em bibliotecas digitais de teses e dissertações. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12., 2011, Brasília. Anais [...]. Brasília: Encontro Nacional de Pesquisa e Pós-Graduação em Ciência da Informação, 2011. Disponível em: https://cip.brapci.inf.br/download/174991. Acesso em: 23 ago. 2024.
META AI. Introducing LLaMA: a foundational, 65-billion-parameter large language model. Meta, 24 fev. 2023. Disponível em: https://ai.meta.com/blog/large-language-model-llama-meta-ai/. Acesso em: 23 fev. 2024.
MOOERS, Calvin S. Editor’s corner: “coding, information retrieval, and the rapid selector”. American Documentation, v. 1, n. 4, p. 225-229, oct. 1950. Disponível em: https://onlinelibrary.wiley.com/doi/10.1002/asi.5090010409. Acesso em: 25 mar. 2024.
OBSERVATÓRIO DA EPT. Dashboard da distribuição da produção de energias renováveis no Brasil. 25 ago. 2022. Disponível em: https://observatorioept.org.br/ept-em-numeros/painel-de-energias-renovaveis. Acesso em: 19 de fevereiro 2024.
SANTOS, M. S. dos; OLIVEIRA, V. H. de J.; JORGE, E. M. de F.; COSTA, G. de M. Solução para Mapeamento e Consulta das Competências dos Pesquisadores: uma arquitetura para extração, integração e consultas de informações acadêmicas. Cadernos de Prospecção. Salvador, v. 17, n. 2, p. 671–688, 2024. DOI: 10.9771/cp.v17i2.56670. Disponível em: https://periodicos.ufba.br/index.php/nit/article/view/56670. Acesso em: 25 jul. 2025.
SINERGIA BAHIA. Bahia é o líder em energia eólica no país. Sinergia-Ba, 28 jul. 2019. Disponível em: https://sinergiabahia.com.br/bahia-e-o-primeiro-em-energia-eolica-no-pais/. Acesso em: 19 fev. 2024.
STELAEXPERTA. Plataforma StelaExperta. [Plataforma online]. São Paulo: StelaTek, 2023. Disponível em: http://www.stelaexperta.com.br/. Acesso em: 19 fev. 2024.
TERRA, José Cláudio Cyrineu; SCHOUERI, Ricardo; VOGEL, Michely Jabala M.; FRANCO, Carlos. Taxonomia: elemento fundamental para a Gestão do Conhecimento. [S. l.]: Biblioteca TerraForum Consultores, p. 1-8, [20--?]. Disponível em: http://paginapessoal.utfpr.edu.br/mansano/arquivos/
taxonomia.pdf. Acesso em: 19 fev. 2024.
UNIVERSIDADE FEDERAL DE MINAS GERAIS. Somos UFMG. [Plataforma online]. Belo Horizonte: UFMG, [s.d.]. Disponível em: https://somos.ufmg.br/ Acesso em: 19 de fevereiro 2024.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2025 Eduardo Manuel Freitas Jorge, Gleidson Meireles Costa, Victor Hugo Jesus Oliveira, Alex Álisson Bandeira Santos, Gesil Sampaio Amarante Segundo

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
A revista se reserva o direito de efetuar, nos originais, alterações de ordem normativa, ortográfica e gramatical, com vistas a manter o padrão culto da língua e a credibilidade do veículo. Respeitará, no entanto, o estilo de escrever dos autores. Alterações, correções ou sugestões de ordem conceitual serão encaminhadas aos autores, quando necessário.
O conteúdo dos textos e a citação e uso de imagens submetidas são de inteira responsabilidade dos autores.
Em todas as citações posteriores, deverá ser consignada a fonte original de publicação, no caso a Informação & Informação.




