O uso de técnicas computacionais no âmbito da Dialetologia e da Lexicografia
XML e X-Query
DOI:
https://doi.org/10.5433/2237-4876.2023v26n3p102-114Palavras-chave:
Processamento de Linguagem Natural, Dialetologia, LexicografiaResumo
Esse trabalho tem como objetivo demonstrar e discutir sobre o uso da Extensible Markup Language (XML) e das expressões X-Query como técnicas computacionais utilizadas no tratamento de dados dialetais e lexicográficos permitindo, dessa forma, a execução de tarefas de Processamento de Linguagem Natural (PLN). Trata-se de um recorte da pesquisa de doutoramento que teve como objetivo, mais amplo, desenvolver um protótipo de vocabulário dialetal eletrônico a partir dos dados do Projeto Atlas Linguístico do Brasil (ALiB), referente à rede de pontos do interior da região Norte do país. Desse modo, foi possível recuperar informações específicas do banco de dados em XML para analisar questões de interesse da Dialetologia, a partir da filtragem de dados por meio das variáveis localidade, sexo e idade, bem como selecionar um conjunto de informações em formato lexicográfico para exibi-las no protótipo do vocabulário dialetal. O estudo fundamenta-se na Linguística Computacional, na Dialetologia e na Lexicografia e justifica-se pela necessidade da transformação de dados de origem oral em um formato que permita o PLN, viabilizando a recuperação eletrônica de informações para análises linguísticas, além de fornecer meios de apresentação de dados em formato digital.
Downloads
Referências
BERBER SARDINHA, TONY. Linguística de Corpus. Barueri, SP: Manole, 2004.
BLOOMFIELD, Leonard. Language. New York: Henry Holt, 1933.
CHAMBERS, Jack. y TRUDGILL, Peter. La dialectología. Madrid: Visor Libros, S. L., 1994.
CHOMSKY, Noam. Aspects of the theory of syntax. Cambridge: MA: MIT Press, 1965. DOI: https://doi.org/10.21236/AD0616323
COMITÊ NACIONAL DO PROJETO ALIB. Atlas Lingüístico do Brasil: questionário 2001. Londrina: EDUEL, 2001.
GRÜN, Chistian. BaseX. Versão 8.5.1. Software de computador. Earlangen, Alemanha: BaseX Team, 2016. Disponível em: <https://files.basex.org/releases/8.5.1/>. Acesso em: 14 set. 2023.
O’KEEFFE, Anne; MCCARTHY, Michael. What are corpora and how have they evolved? In:
O’KEEFFE, Anne; MCCARTHY, Michael (Ed.). The Routledge handbook of corpus linguistics.
London/New York: Routledge, 2010. p. 3–10.
ORLANDI, Eni Puccinelli. O que é linguística. 2ª ed. São Paulo: Brasiliense, 2009.
SRINIVASA-DESIKAN, Bhargav. Natural Language Processing and Computational Linguistics: A practical guide to text analysis with Python, Gensim, spaCy, and Keras. Birmingham: Packt, 2018.
TARP, Sven. Connecting the dots: tradition and disruption in Lexicography. [S.l.]: Lexikos, v. 29, 2019, p. 224-249. Disponível em: <http://lexikos.journals.ac.za>. Acesso em: 17 set. 2023. DOI: https://doi.org/10.5788/29-1-1519
WALMSLEY, Priscilla. XQuery: Search Across a Variety of XML Data. 2ª ed. Sebastopol/CA: O’Reilly, 2015.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2024 Jorge Luiz
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Signum: Estudos da linguagem, publica seus artigos licenciados sob a Licença Atribuição-NãoComercial-CompartilhaIgual 4.0 Internacional. Esta licença permite que terceiros façam download e compartilhem os trabalhos em qualquer meio ou formato, desde que atribuam o devido crédito de autoria, mas sem que possam alterá-los de nenhuma forma ou utilizá-los para fins comerciais. Se você remixar, transformar ou desenvolver o material, não poderá distribuir o material modificado.