Automated preparation of textual corpus for qualitative research with IRAMUTEQ
DOI:
https://doi.org/10.5433/1981-8920.2025v30n3p521Keywords:
Document analysis, Literature review, Google Colab, PythonAbstract
Objective: To present an automated method for preparing textual corpora in qualitative research using IRaMuTeQ, reducing time and effort in text cleaning and formatting.
Methodology: A Python script was developed and executed in Google Colab to automate text extraction from PDF files, remove incompatible characters, and structure the corpus according to IRaMuTeQ standards. The methodology was tested with different datasets to verify its effectiveness.
Results: The automated approach eliminated inconsistencies in text formatting and significantly reduced the time required for corpus preparation, making qualitative analysis more efficient and accurate. The methodology enabled greater standardization and replicability in textual data processing.
Conclusions: The proposed automation facilitates the adoption of IRaMuTeQ in large-scale qualitative research, eliminating technical barriers and enabling more detailed analyses. The integration of computational tools with textual analysis optimizes data organization, improving the quality and reliability of results.
Downloads
References
ACAUAN, L. V.; ABRANTES, C. V.; STIPP. M. A. C.; TROTTE, L. A. C.; PAES, G. O.; QUEIROZ, A. B. A. Utilização do software Iramuteq® para análise de dados qualitativos na Enfermagem: um ensaio reflexivo. REME-Revista Mineira de Enfermagem, [S.l.], v. 24, n. 1, 2020.
ALMEIDA, L. M. N.; GOULART, M.C.L.; GÓES, F.G. B.; PEREIRA-ÁVILA, F. M. V.; PINTO, C. B.; SILVA, A. C. S. S.; GARCIA, L. R.; BRUN, L. S. O. Continuidade do aleitamento materno no retorno ao trabalho: sentimentos, desafios e estratégias de enfermeiras nutrizes. Revista Gaúcha de Enfermagem, [S.l.], v. 44, p. 1-15, 2023.
BAKER, R.; ISOTANI, S.; CARVALHO, A. Mineraçao de dados educacionais: Oportunidades para o brasil. Revista Brasileira de informática na educação, v. 19, n. 02, p. 03, 2011.
BARBOSA, R. O. Maternagem, educação e emancipação: uma análise curricular. 2025. 206 f. Tese (Doutorado em Educação para a Ciência) - Faculdade de Ciências, Universidade Estadual Paulista, Bauru, 2025.
BUENO, A. J. A. Uma análise por meio do software Iramuteq de teses e dissertações defendidas entre 2007 e 2017 com a temática filmes comerciais no ensino de ciências. 2018. Dissertação (Mestrado em Ensino de Ciências e educação Matemática) – Universidade Estadual de Ponta Grossa, Ponta Grossa, 2018.
CAMARGO, B. V.; JUSTO, A. M. IRAMUTEQ: um software gratuito para análise de dados textuais. Temas em psicologia, [S.l.], v. 21, n. 2, p. 513-518, 2013.
SÃO PAULO (Estado). Secretaria da Educação. Currículo Paulista: etapa Ensino Médio. São Paulo: SEE, 2020.
SÃO PAULO (Estado). Secretaria da Educação. Currículo Paulista: etapa Educação Infantil e Ensino Fundamental. São Paulo: SEE, 2019.
HOFFMANN, Y. T.; ALVAREZ, E. B.; MARTÍ-LAHERA, Y. Análise textual com IRaMuTeQ de pesquisasrecentes em História da educação matemática no Brasil: um exemplo de Humanidades Digitais. Investigación Bibliotecológica: Archivonomía, Bibliotecología e Información, Cidade do México, v. 34, n. 84, p. 103-133, 2020.
MELO, N. M.; VASCONCELOS, A. M.; LIMA, T. N. Percepção Ambiental e Biofilia nos Parques Urbanos: Uma Revisão Bibliográfica. Revista Pantaneira, [S.l.], v. 22, p. 42-53, 2023.
MENDES, L. O. R.; PROENÇA, M. C.; PEREIRA, A. L. O" software" IRaMuTeQ na pesquisa qualitativa: ma revisão no campo da Educação Matemática. Paradigma, [S.l.], n. 2, p. 228-258, 2022.
MOTTA, J. A.; FIÚZA, A. L. C. Mulheres na ciência: uma análise sistematizada dos artigos científicos publicados no Brasil pós-década de 1990. Cadernos de Gênero e Tecnologia, [S.l.], v. 15, n. 46, p. 46-63, 2022.
NASCIMENTO, V. B.; SANTOS, L. A.; SARAIVA, R. S. A. Softwares de análise de dados qualitativos: revisão narrativa da literatura. Revista Científica da Faculdade de Educação e Meio Ambiente, [S.l.], v. 13, n. 1, p. 44-58, 2022.
RAMOS, M. G.; LIMA V. M. R; ROSA, M. P. Contribuições do software Iramuteq para a análise textual discursiva. In: COSTA, A. P.; SOUZA, D. N.; CASTRO, P. A.; SAAVEDRA, R. A.; SÁ, S. O. Atas do 7o Congresso Ibero-Americano em Investigação Qualitativa em Educação. Fortaleza: Universidade de Fortaleza; 2018. p. 505-14.
RATINAUD, P. IRAMUTEQ: Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires. Disponível em: http://www.iramuteq.org. 2008.
SANTOS, J. S.; ALMEIDA JUNIOR. E. R. B.; BRITO. A. A. NOGUEIRA, G. Tecnologia na enfermagem: uma revisão bibliográfica. Research, Society and Development, [S. l.], v. 11, n. 3, p. e54811327051, 2022.
SCHLOSSER, D. F.; FRASSON, A. C.; CANTORANI, J. R. H. Softwares livres para análise de dados qualitativos. Revista Brasileira de Ensino de Ciência e Tecnologia, [S.l.], v. 12, n. 1, 2019.
SILVA, J. V.; SOUZA, P. A. R. O Ambiente de Gestão de Microempresas: uma análise a partir do software IRAMUTEQ. Revista de tecnologia aplicada, [S.l.], v. 8, n. 3, p. 54-66, 2020.
SILVA, S.; RIBEIRO, E. A. W. O software Iramuteq como ferramenta metodológica para análise qualitativa nas pesquisas em Educação Profissional e Tecnológica. Cadernos de Educação Tecnologia e Sociedade, [S.l.], v. 14, n. 2, p. 275–284, jun. 2021.
SILVA, T. R.; DELL'AGLIO, D. D. Abuso sexual contra crianças e adolescentes e as consequências psicológicas: Revisão bibliográfica com análise de similitude. Psicologia e Saúde em debate, [S.l.], v. 9, n. 2, p. 653-669, 2023.
SOUZA, M. A. R. O uso do software IRAMUTEQ na análise de dados em pesquisas qualitativas. Revista da Escola de Enfermagem da USP, [S.l.], v. 52, p. e03353, 2018.
SOUZA, R. F.; CARVALHO, P. R.; RAMOS, M. G. 50 anos do PPGCI IBICT: análise textual da produção científica com iramuteq. Informação & Informação, [S.l.], v. 25, n. 4, p. 117-141, 2020.
TINTI, D. S.; BARBOSA, G. C.; LOPES, C. E. O software IRAMUTEQ e a Análise de Narrativas (Auto) biográficas no Campo da Educação Matemática. Bolema: Boletim de Educação Matemática, [S.l.], v. 35, p. 479-496, 2021.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Roberta de Oliveira Barbosa, Júlio de Oliveira Júnior, Luciano Cássio Lugli, Deise Aparecida Peralta

This work is licensed under a Creative Commons Attribution 4.0 International License.
A revista se reserva o direito de efetuar, nos originais, alterações de ordem normativa, ortográfica e gramatical, com vistas a manter o padrão culto da língua e a credibilidade do veículo. Respeitará, no entanto, o estilo de escrever dos autores. Alterações, correções ou sugestões de ordem conceitual serão encaminhadas aos autores, quando necessário.
O conteúdo dos textos e a citação e uso de imagens submetidas são de inteira responsabilidade dos autores.
Em todas as citações posteriores, deverá ser consignada a fonte original de publicação, no caso a Informação & Informação.




