Redes complexas de homônimos para análise semântica textual

Autores

DOI:

https://doi.org/10.5433/1981-8920.2017v22n1p293

Palavras-chave:

Processamento de Linguagem Natural, Redes Complexas, Processamento Textual, Semântica

Resumo

Introdução: Estudos voltados ao processamento de linguagem natural já são bem difundidos e possuem aplicações diversas. Relacionado a essa área de pesquisa, o uso de técnicas para manipular um texto determinando a morfologia e sintaxe de suas palavras é bastante comum. Existem ferramentas que fazem esse tratamento, entretanto adicionar mecanismos de identificação semântica para essas palavras é fundamental para aumentar o entendimento automático da linguagem empregada. Objetivo: Com base nesse contexto, este artigo apresenta o processo de utilização de redes complexas como base de dados comparativa para determinar, através do contexto, o significado de palavras que expressam posicionamentos distintos. Além disso, são classificados com mesma morfologia e sintaxe, como ocorre com alguns homônimos. Metodologia: Através de uma metodologia experimental, o modelo aqui proposto baseia-se em pesquisa já consolidadas em Processamento de Linguagem Natural para montar uma rede complexa que recebe como vértices as palavras de um determinado texto e estabelece suas ligações a partir da ocorrência de adjacência entre esses termos. Assim observando as variações da rede, identifica-se como os homônimos do texto estão relacionados, e através da análise do contexto em que se encontram, verificar se é utilizado para expressar mais de um significado. Resultados: Um processo genérico com etapas de pré-processamento, montagem de Redes Complexas usando Processamento de Linguagem Natural para concepção de uma rede de homônimos para extrair informação textual semântica. Conclusões: A análise de homônimos selecionados e etiquetados é um processo não apenas morfossintático, acrescentado semântica em uma frase, parágrafo ou texto onde as palavras são empregadas. Assim, através de Processamento de Linguagem Natural acontecimentos mundiais e fatos filosóficos escritos textualmente podem ser melhor analisados, como por exemplo, o poder de argumentação e o perfil de escrita de um autor.

Downloads

Não há dados estatísticos.

Biografia do Autor

Eduardo Manuel de Freitas Jorge, Universidade do Estado da Bahia (UNEB)

Doutor em Difusão do Conhecimento no programa multi institucional pela UFBA (Universidade Federal da Bahia) no projeto de pesquisa Mobi (Modelo de Ontologia baseado em Instâncias). É, também, mestre em Ciência da Computação pela UFPB (Universidade Federal da Paraíba) e certificado PMP (Project Management Professional).

 

Hugo Saba, Universidade do Estado da Bahia - UNEB

Possui graduação em Processamento de Dados pela Faculdade Rui Barbosa (1995), Especialização em Computação Científica pela Fundação Visconde de Cairu (FVC) (2003), Mestrado em Modelagem Computacional pela FVC (2005) e Doutorado em Difusão do Conhecimento na Universidade Federal da Bahia (UFBA)(2013), Professor Efetivo da UNEB. Tem experiência na área de Ciência da Computação, atuando principalmente nos seguintes temas: modelagem computacional, tecnologias sociais, robótica educacional, gestão de projetos, educação a distância, gestão do conhecimento e difusão do conhecimento. No ambito profissional, vem atuando nos últimos anos como coordenador de projetos de pesquisa e desenvolvimento, junto a Instituições de Ciência e Tecnologia (ICTs). Vice-coordenador da Camara de Computação na FAPESB. Professor Permanente dos Programas: Doutorado em Difusão do Conhecimento (DMMDC) e Mestrado Profissional em Ensino da Física (PROFIS), e Professor Colaborador no Mestrado Profissional em Propriedade Intelectual e Transferência de Tecnologia para a Inovação(PROFNIT).

Referências

Aires, R. V. X., Aluísio, S. M., Kuhn, D. C. S., Andreeta, M. L. B. and Oliveira Jr., O. N. (2000). Combining Multiple Classifiers to Improve Part of Speech Tagging: A Case Study for Brazilian Portuguese, In: Proceedings of the 15th Brazilian Symposium on Artificial Intelligence (SBIA’2000), Atibaia, SP.
ANTIQUEIRA, L ; NUNES, M G V ; OLIVEIRA JR, O N ; COSTA , L. da. F. Complex networks in the assessment of quality text. In Physics, 2005.
BARABÁSI, A. L. Linked: How everything is connected to everything else and what it means for business, science and everyday life. New York: Plume, 2003.
BIBER, D. et all. Corpus Linguistics: Investigating Language Structure and Use. Cambridge: Cambridge University Press, 1998.
CALDEIRA, S. M. G. Caracterização da rede de signos linguísticos: um modelo baseado no aparelho psíquico de Freud. 2005. Dissertação (Mestrado). Fundação Visconde de Cairu, Salvador, 2005.
CAMPOS, M. L. de A.; CAMPOS, L. M.; MEDEIROS, J. da S. A Representação de Domínios de Conhecimento e uma Teoria de Representação: a ontologia de fundamentação. Informação & Informação, [S.l.], v. 16, n. 2, p. 140-164, dez. 2011. Disponível em: http://www.uel.br/revistas/uel/index.php/informacao/article/view/10389. Acesso em: 11 Nov. 2015.
CHISHMAN, R. L. de O. Integrandoléxicossemânticos e ontologias: uma aproximação a favor da Web Semântica. Informação&Informação, [S.l.], v. 14, n. 1esp, p. 103-124, dez. 2009. Disponível em: http://www.uel.br/revistas/uel/index.php/informacao/article/view/2159. Acesso em: 11 Nov. 2015.
FIGUEIREDO, A.; FIGUEIREDO, F. Gramática Comentada com Interpretação de Textos. 2. ed. São Paulo: Elsevier, 2012. 515p.
FINATTO, M. J. B. Sobre a Eficácia do MXPOST Etiquetador morfossintático para o português do Brasil. Disponível em: http://www.ufrgs.br/textecc/porlexbras/porpopular/arquivos/Sobre.pdf. 2011.
GALLISON, R. Dicionário de Didáctica das Línguas. Coimbra: Livraria Almedina, 1983.
JÚNIOR, J. M. C. Sobre o Conceito de Processamento de Linguagem Natural. Universidade Estadual de Campinas, Faculdade de Tecnologia. Limeira, São Paulo, 2010.
METZ, J. ; CALVO, R. ; SENO, E. R. M. ; ROMERO, R. A. F. ; LIANG, Z. . Redes Complexas: conceitos e aplicações. Série de relatórios técnicos do ICMC - USP nº 290, 2007 (Relatório Técnico).
NELSON, D. L., MCEVOY, C. L., e SCHREIBER, T. A.The University of South Florida word association rhyme, and word fragment norms. Behav. Res. Methods Instrum. Comput, 36, 402–407, 2004. Disponível em: https://www.ncbi.nlm.nih.gov/pubmed/15641430 . Acesso em 2014.
Newman, M.E.J., The Structure and Function of Complex Networks. SIAM Review, 2003. 45(2): p. 167
OTHERO, G. de Á. Linguística Computacional Teoria & Prática. São Paulo: Parábola Editorial, 2005.
RATNAPARKHI, A. A Maximum Entropy Part-Of-Speech Tagger. In: the Proceedings of the Empirical Methods in Natural Language Processing Conference. Pennsylvania: University of Pennsylvania, 1996.
SOARES, L. D. Abecedário Maluco. Porto: Civilização Editora, 2004.

Downloads

Publicado

2017-06-19

Como Citar

Santos, J., Andrade, F., Jorge, E. M. de F., Batista, J., & Saba, H. (2017). Redes complexas de homônimos para análise semântica textual. Informação & Informação, 22(1), 293–305. https://doi.org/10.5433/1981-8920.2017v22n1p293

Edição

Seção

Artigos