Preparação automatizada de corpus textual para pesquisas qualitativas com IRAMUTEQ

Autores

DOI:

https://doi.org/10.5433/1981-8920.2025v30n3p521

Palavras-chave:

Análise documental, Revisão bibliográfica, Google Colab

Resumo

Objetivo: Apresentar um método automatizado para a preparação de corpus textual em pesquisas qualitativas utilizando o IRaMuTeQ, reduzindo o tempo e esforço na limpeza e formatação de textos.
Metodologia
: Foi desenvolvido um script em Python, executado no Google Colab, capaz de extrair o texto de arquivos PDF por meio da biblioteca pdfminer.six, remover caracteres incompatíveis com o IRaMuTeQ, substituir elementos de formatação proibidos (como aspas, hífens e símbolos especiais), unificar quebras de linha e padronizar a estrutura do corpus. Cada documento foi processado individualmente, gerando arquivos de texto no formato .txt já estruturados com linhas de comando específicas (subcorpus), conforme as normas do software. Após essa etapa, foi realizada uma revisão manual para corrigir fragmentações de palavras e eliminar elementos residuais, como numeração de páginas.
Resultados: A abordagem automatizada eliminou inconsistências na formatação dos textos e reduziu significativamente o tempo necessário para a preparação do corpus, tornando a análise qualitativa mais eficiente e precisa. A metodologia permitiu maior padronização e replicabilidade no processamento dos dados textuais.
Conclusões: A automação proposta facilita a adoção do IRaMuTeQ em pesquisas qualitativas de grande escala, eliminando barreiras técnicas e permitindo análises mais detalhadas. A integração de ferramentas computacionais à análise textual otimiza a organização dos dados, melhorando a qualidade e confiabilidade dos resultados.

Downloads

Não há dados estatísticos.

Biografia do Autor

Roberta de Oliveira Barbosa, Universidade Estadual Paulista - UNESP

Doutora em Educação para a Ciência pela Universidade Estadual Paulista (Unesp). São Paulo, Brasil. 

Júlio de Oliveira Júnior, Universidade de São Paulo - USP

Doutorando no Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq),  no Instituto de Pesquisas Energéticas e Nucleares (IPEN) pela Universidade de São Paulo (USP). São Paulo, Brasil.

Luciano Cássio Lugli, Italian Institute of Technology - IIT

Doutor em Engenharia Mecânica pela Universidade de São Paulo (USP). São Paulo, Brasil.

Deise Aparecida Peralta, Universidade Estadual Paulista - UNESP

Doutora em Educação Para a Ciência pela Universidade Estadual Paulista (Unesp). Docente Programa de Pós-Graduação em Educação para a Ciência na Unesp. São Paulo, Brasil.

Referências

ACAUAN, L. V.; ABRANTES, C. V.; STIPP. M. A. C.; TROTTE, L. A. C.; PAES, G. O.; QUEIROZ, A. B. A. Utilização do software Iramuteq® para análise de dados qualitativos na Enfermagem: um ensaio reflexivo. REME-Revista Mineira de Enfermagem, [S.l.], v. 24, n. 1, 2020.

ALMEIDA, L. M. N.; GOULART, M.C.L.; GÓES, F.G. B.; PEREIRA-ÁVILA, F. M. V.; PINTO, C. B.; SILVA, A. C. S. S.; GARCIA, L. R.; BRUN, L. S. O. Continuidade do aleitamento materno no retorno ao trabalho: sentimentos, desafios e estratégias de enfermeiras nutrizes. Revista Gaúcha de Enfermagem, [S.l.], v. 44, p. 1-15, 2023.

BAKER, R.; ISOTANI, S.; CARVALHO, A. Mineraçao de dados educacionais: Oportunidades para o brasil. Revista Brasileira de informática na educação, v. 19, n. 02, p. 03, 2011.

BARBOSA, R. O. Maternagem, educação e emancipação: uma análise curricular. 2025. 206 f. Tese (Doutorado em Educação para a Ciência) - Faculdade de Ciências, Universidade Estadual Paulista, Bauru, 2025.

BUENO, A. J. A. Uma análise por meio do software Iramuteq de teses e dissertações defendidas entre 2007 e 2017 com a temática filmes comerciais no ensino de ciências. 2018. Dissertação (Mestrado em Ensino de Ciências e educação Matemática) – Universidade Estadual de Ponta Grossa, Ponta Grossa, 2018.

CAMARGO, B. V.; JUSTO, A. M. IRAMUTEQ: um software gratuito para análise de dados textuais. Temas em psicologia, [S.l.], v. 21, n. 2, p. 513-518, 2013.

SÃO PAULO (Estado). Secretaria da Educação. Currículo Paulista: etapa Ensino Médio. São Paulo: SEE, 2020.

SÃO PAULO (Estado). Secretaria da Educação. Currículo Paulista: etapa Educação Infantil e Ensino Fundamental. São Paulo: SEE, 2019.

HOFFMANN, Y. T.; ALVAREZ, E. B.; MARTÍ-LAHERA, Y. Análise textual com IRaMuTeQ de pesquisasrecentes em História da educação matemática no Brasil: um exemplo de Humanidades Digitais. Investigación Bibliotecológica: Archivonomía, Bibliotecología e Información, Cidade do México, v. 34, n. 84, p. 103-133, 2020.

MELO, N. M.; VASCONCELOS, A. M.; LIMA, T. N. Percepção Ambiental e Biofilia nos Parques Urbanos: Uma Revisão Bibliográfica. Revista Pantaneira, [S.l.], v. 22, p. 42-53, 2023.

MENDES, L. O. R.; PROENÇA, M. C.; PEREIRA, A. L. O" software" IRaMuTeQ na pesquisa qualitativa: ma revisão no campo da Educação Matemática. Paradigma, [S.l.], n. 2, p. 228-258, 2022.

MOTTA, J. A.; FIÚZA, A. L. C. Mulheres na ciência: uma análise sistematizada dos artigos científicos publicados no Brasil pós-década de 1990. Cadernos de Gênero e Tecnologia, [S.l.], v. 15, n. 46, p. 46-63, 2022.

NASCIMENTO, V. B.; SANTOS, L. A.; SARAIVA, R. S. A. Softwares de análise de dados qualitativos: revisão narrativa da literatura. Revista Científica da Faculdade de Educação e Meio Ambiente, [S.l.], v. 13, n. 1, p. 44-58, 2022.

RAMOS, M. G.; LIMA V. M. R; ROSA, M. P. Contribuições do software Iramuteq para a análise textual discursiva. In: COSTA, A. P.; SOUZA, D. N.; CASTRO, P. A.; SAAVEDRA, R. A.; SÁ, S. O. Atas do 7o Congresso Ibero-Americano em Investigação Qualitativa em Educação. Fortaleza: Universidade de Fortaleza; 2018. p. 505-14.

RATINAUD, P. IRAMUTEQ: Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires. Disponível em: http://www.iramuteq.org. 2008.

SANTOS, J. S.; ALMEIDA JUNIOR. E. R. B.; BRITO. A. A. NOGUEIRA, G. Tecnologia na enfermagem: uma revisão bibliográfica. Research, Society and Development, [S. l.], v. 11, n. 3, p. e54811327051, 2022.

SCHLOSSER, D. F.; FRASSON, A. C.; CANTORANI, J. R. H. Softwares livres para análise de dados qualitativos. Revista Brasileira de Ensino de Ciência e Tecnologia, [S.l.], v. 12, n. 1, 2019.

SILVA, J. V.; SOUZA, P. A. R. O Ambiente de Gestão de Microempresas: uma análise a partir do software IRAMUTEQ. Revista de tecnologia aplicada, [S.l.], v. 8, n. 3, p. 54-66, 2020.

SILVA, S.; RIBEIRO, E. A. W. O software Iramuteq como ferramenta metodológica para análise qualitativa nas pesquisas em Educação Profissional e Tecnológica. Cadernos de Educação Tecnologia e Sociedade, [S.l.], v. 14, n. 2, p. 275–284, jun. 2021.

SILVA, T. R.; DELL'AGLIO, D. D. Abuso sexual contra crianças e adolescentes e as consequências psicológicas: Revisão bibliográfica com análise de similitude. Psicologia e Saúde em debate, [S.l.], v. 9, n. 2, p. 653-669, 2023.

SOUZA, M. A. R. O uso do software IRAMUTEQ na análise de dados em pesquisas qualitativas. Revista da Escola de Enfermagem da USP, [S.l.], v. 52, p. e03353, 2018.

SOUZA, R. F.; CARVALHO, P. R.; RAMOS, M. G. 50 anos do PPGCI IBICT: análise textual da produção científica com iramuteq. Informação & Informação, [S.l.], v. 25, n. 4, p. 117-141, 2020.

TINTI, D. S.; BARBOSA, G. C.; LOPES, C. E. O software IRAMUTEQ e a Análise de Narrativas (Auto) biográficas no Campo da Educação Matemática. Bolema: Boletim de Educação Matemática, [S.l.], v. 35, p. 479-496, 2021.

Downloads

Publicado

2025-10-23

Como Citar

Barbosa, R. de O., Oliveira Júnior, J. de, Lugli, L. C., & Peralta, D. A. (2025). Preparação automatizada de corpus textual para pesquisas qualitativas com IRAMUTEQ. Informação & Informação, 30(3), 521–540. https://doi.org/10.5433/1981-8920.2025v30n3p521