Preparação automatizada de corpus textual para pesquisas qualitativas com IRAMUTEQ
DOI:
https://doi.org/10.5433/1981-8920.2025v30n3p521Palavras-chave:
Análise documental, Revisão bibliográfica, Google ColabResumo
Objetivo: Apresentar um método automatizado para a preparação de corpus textual em pesquisas qualitativas utilizando o IRaMuTeQ, reduzindo o tempo e esforço na limpeza e formatação de textos.
Metodologia: Foi desenvolvido um script em Python, executado no Google Colab, capaz de extrair o texto de arquivos PDF por meio da biblioteca pdfminer.six, remover caracteres incompatíveis com o IRaMuTeQ, substituir elementos de formatação proibidos (como aspas, hífens e símbolos especiais), unificar quebras de linha e padronizar a estrutura do corpus. Cada documento foi processado individualmente, gerando arquivos de texto no formato .txt já estruturados com linhas de comando específicas (subcorpus), conforme as normas do software. Após essa etapa, foi realizada uma revisão manual para corrigir fragmentações de palavras e eliminar elementos residuais, como numeração de páginas.
Resultados: A abordagem automatizada eliminou inconsistências na formatação dos textos e reduziu significativamente o tempo necessário para a preparação do corpus, tornando a análise qualitativa mais eficiente e precisa. A metodologia permitiu maior padronização e replicabilidade no processamento dos dados textuais.
Conclusões: A automação proposta facilita a adoção do IRaMuTeQ em pesquisas qualitativas de grande escala, eliminando barreiras técnicas e permitindo análises mais detalhadas. A integração de ferramentas computacionais à análise textual otimiza a organização dos dados, melhorando a qualidade e confiabilidade dos resultados.
Downloads
Referências
ACAUAN, L. V.; ABRANTES, C. V.; STIPP. M. A. C.; TROTTE, L. A. C.; PAES, G. O.; QUEIROZ, A. B. A. Utilização do software Iramuteq® para análise de dados qualitativos na Enfermagem: um ensaio reflexivo. REME-Revista Mineira de Enfermagem, [S.l.], v. 24, n. 1, 2020.
ALMEIDA, L. M. N.; GOULART, M.C.L.; GÓES, F.G. B.; PEREIRA-ÁVILA, F. M. V.; PINTO, C. B.; SILVA, A. C. S. S.; GARCIA, L. R.; BRUN, L. S. O. Continuidade do aleitamento materno no retorno ao trabalho: sentimentos, desafios e estratégias de enfermeiras nutrizes. Revista Gaúcha de Enfermagem, [S.l.], v. 44, p. 1-15, 2023.
BAKER, R.; ISOTANI, S.; CARVALHO, A. Mineraçao de dados educacionais: Oportunidades para o brasil. Revista Brasileira de informática na educação, v. 19, n. 02, p. 03, 2011.
BARBOSA, R. O. Maternagem, educação e emancipação: uma análise curricular. 2025. 206 f. Tese (Doutorado em Educação para a Ciência) - Faculdade de Ciências, Universidade Estadual Paulista, Bauru, 2025.
BUENO, A. J. A. Uma análise por meio do software Iramuteq de teses e dissertações defendidas entre 2007 e 2017 com a temática filmes comerciais no ensino de ciências. 2018. Dissertação (Mestrado em Ensino de Ciências e educação Matemática) – Universidade Estadual de Ponta Grossa, Ponta Grossa, 2018.
CAMARGO, B. V.; JUSTO, A. M. IRAMUTEQ: um software gratuito para análise de dados textuais. Temas em psicologia, [S.l.], v. 21, n. 2, p. 513-518, 2013.
SÃO PAULO (Estado). Secretaria da Educação. Currículo Paulista: etapa Ensino Médio. São Paulo: SEE, 2020.
SÃO PAULO (Estado). Secretaria da Educação. Currículo Paulista: etapa Educação Infantil e Ensino Fundamental. São Paulo: SEE, 2019.
HOFFMANN, Y. T.; ALVAREZ, E. B.; MARTÍ-LAHERA, Y. Análise textual com IRaMuTeQ de pesquisasrecentes em História da educação matemática no Brasil: um exemplo de Humanidades Digitais. Investigación Bibliotecológica: Archivonomía, Bibliotecología e Información, Cidade do México, v. 34, n. 84, p. 103-133, 2020.
MELO, N. M.; VASCONCELOS, A. M.; LIMA, T. N. Percepção Ambiental e Biofilia nos Parques Urbanos: Uma Revisão Bibliográfica. Revista Pantaneira, [S.l.], v. 22, p. 42-53, 2023.
MENDES, L. O. R.; PROENÇA, M. C.; PEREIRA, A. L. O" software" IRaMuTeQ na pesquisa qualitativa: ma revisão no campo da Educação Matemática. Paradigma, [S.l.], n. 2, p. 228-258, 2022.
MOTTA, J. A.; FIÚZA, A. L. C. Mulheres na ciência: uma análise sistematizada dos artigos científicos publicados no Brasil pós-década de 1990. Cadernos de Gênero e Tecnologia, [S.l.], v. 15, n. 46, p. 46-63, 2022.
NASCIMENTO, V. B.; SANTOS, L. A.; SARAIVA, R. S. A. Softwares de análise de dados qualitativos: revisão narrativa da literatura. Revista Científica da Faculdade de Educação e Meio Ambiente, [S.l.], v. 13, n. 1, p. 44-58, 2022.
RAMOS, M. G.; LIMA V. M. R; ROSA, M. P. Contribuições do software Iramuteq para a análise textual discursiva. In: COSTA, A. P.; SOUZA, D. N.; CASTRO, P. A.; SAAVEDRA, R. A.; SÁ, S. O. Atas do 7o Congresso Ibero-Americano em Investigação Qualitativa em Educação. Fortaleza: Universidade de Fortaleza; 2018. p. 505-14.
RATINAUD, P. IRAMUTEQ: Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires. Disponível em: http://www.iramuteq.org. 2008.
SANTOS, J. S.; ALMEIDA JUNIOR. E. R. B.; BRITO. A. A. NOGUEIRA, G. Tecnologia na enfermagem: uma revisão bibliográfica. Research, Society and Development, [S. l.], v. 11, n. 3, p. e54811327051, 2022.
SCHLOSSER, D. F.; FRASSON, A. C.; CANTORANI, J. R. H. Softwares livres para análise de dados qualitativos. Revista Brasileira de Ensino de Ciência e Tecnologia, [S.l.], v. 12, n. 1, 2019.
SILVA, J. V.; SOUZA, P. A. R. O Ambiente de Gestão de Microempresas: uma análise a partir do software IRAMUTEQ. Revista de tecnologia aplicada, [S.l.], v. 8, n. 3, p. 54-66, 2020.
SILVA, S.; RIBEIRO, E. A. W. O software Iramuteq como ferramenta metodológica para análise qualitativa nas pesquisas em Educação Profissional e Tecnológica. Cadernos de Educação Tecnologia e Sociedade, [S.l.], v. 14, n. 2, p. 275–284, jun. 2021.
SILVA, T. R.; DELL'AGLIO, D. D. Abuso sexual contra crianças e adolescentes e as consequências psicológicas: Revisão bibliográfica com análise de similitude. Psicologia e Saúde em debate, [S.l.], v. 9, n. 2, p. 653-669, 2023.
SOUZA, M. A. R. O uso do software IRAMUTEQ na análise de dados em pesquisas qualitativas. Revista da Escola de Enfermagem da USP, [S.l.], v. 52, p. e03353, 2018.
SOUZA, R. F.; CARVALHO, P. R.; RAMOS, M. G. 50 anos do PPGCI IBICT: análise textual da produção científica com iramuteq. Informação & Informação, [S.l.], v. 25, n. 4, p. 117-141, 2020.
TINTI, D. S.; BARBOSA, G. C.; LOPES, C. E. O software IRAMUTEQ e a Análise de Narrativas (Auto) biográficas no Campo da Educação Matemática. Bolema: Boletim de Educação Matemática, [S.l.], v. 35, p. 479-496, 2021.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2025 Roberta de Oliveira Barbosa, Júlio de Oliveira Júnior, Luciano Cássio Lugli, Deise Aparecida Peralta

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
A revista se reserva o direito de efetuar, nos originais, alterações de ordem normativa, ortográfica e gramatical, com vistas a manter o padrão culto da língua e a credibilidade do veículo. Respeitará, no entanto, o estilo de escrever dos autores. Alterações, correções ou sugestões de ordem conceitual serão encaminhadas aos autores, quando necessário.
O conteúdo dos textos e a citação e uso de imagens submetidas são de inteira responsabilidade dos autores.
Em todas as citações posteriores, deverá ser consignada a fonte original de publicação, no caso a Informação & Informação.




