Homonyms's Complex Networks to Semantic Analysis Textual

Authors

DOI:

https://doi.org/10.5433/1981-8920.2017v22n1p293

Keywords:

Natural Language Processing, Complex Networks, Textual Processing, Semantic

Abstract

Introduction: Study centres in natural language processing already spread and the study have several applications. Relate with this research area, it is common the use technic for manipulation a text. These technic is be able to determine the word morphology and the word syntax. There are tools that do this work, however adding engines for semantic identification of the words is essential for increase the automatic understanding the used language. Objective: On the basis of that, This paper present the process of using complex networks as a comparative database to determine by context the meaning of words that express different positions. Moreover, they are classified as same morphology and syntax , as with some homonyms. Methodology: Through of a experimental methodology, the model proposed it is based in consolidate researches in Natural Language Processing for building a Complex Network that receives as vertices the words of a certain text and establishes its connections from the occurrence of adjacency between these terms. Therefore, observing the variations of network, it is identified how to textual namesakes are related and through an context analyzed how if be there, check whether it is used to express more than one meaning. Results: A generic process with stages of preprocessing, building of a Complex Network used to Natural Language Processing for the building of a network homonyms to extract semantic information textual. Conclusions: The analyze of homonyms selected and labeled is the process not only morphosyntatic, adding semantic in the phrase, paragraph or text where the words are applied. However, with Natural Language Processing an events and philosophical facts can be better analyzed through of a world written textually, for example, the power of argument and the writing of an author profile.

Downloads

Download data is not yet available.

Author Biographies

Eduardo Manuel de Freitas Jorge, Universidade do Estado da Bahia (UNEB)

Doutor em Difusão do Conhecimento no programa multi institucional pela UFBA (Universidade Federal da Bahia) no projeto de pesquisa Mobi (Modelo de Ontologia baseado em Instâncias). É, também, mestre em Ciência da Computação pela UFPB (Universidade Federal da Paraíba) e certificado PMP (Project Management Professional).

Hugo Saba, Universidade do Estado da Bahia - UNEB

Possui graduação em Processamento de Dados pela Faculdade Rui Barbosa (1995), Especialização em Computação Científica pela Fundação Visconde de Cairu (FVC) (2003), Mestrado em Modelagem Computacional pela FVC (2005) e Doutorado em Difusão do Conhecimento na Universidade Federal da Bahia (UFBA)(2013), Professor Efetivo da UNEB. Tem experiência na área de Ciência da Computação, atuando principalmente nos seguintes temas: modelagem computacional, tecnologias sociais, robótica educacional, gestão de projetos, educação a distância, gestão do conhecimento e difusão do conhecimento. No ambito profissional, vem atuando nos últimos anos como coordenador de projetos de pesquisa e desenvolvimento, junto a Instituições de Ciência e Tecnologia (ICTs). Vice-coordenador da Camara de Computação na FAPESB. Professor Permanente dos Programas: Doutorado em Difusão do Conhecimento (DMMDC) e Mestrado Profissional em Ensino da Física (PROFIS), e Professor Colaborador no Mestrado Profissional em Propriedade Intelectual e Transferência de Tecnologia para a Inovação(PROFNIT).

References

Aires, R. V. X., Aluísio, S. M., Kuhn, D. C. S., Andreeta, M. L. B. and Oliveira Jr., O. N. (2000). Combining Multiple Classifiers to Improve Part of Speech Tagging: A Case Study for Brazilian Portuguese, In: Proceedings of the 15th Brazilian Symposium on Artificial Intelligence (SBIA'2000), Atibaia, SP.
ANTIQUEIRA, L ; NUNES, M G V ; OLIVEIRA JR, O N ; COSTA , L. da. F. Complex networks in the assessment of quality text. In Physics, 2005.
BARABÁSI, A. L. Linked: How everything is connected to everything else and what it means for business, science and everyday life. New York: Plume, 2003.
BIBER, D. et all. Corpus Linguistics: Investigating Language Structure and Use. Cambridge: Cambridge University Press, 1998.
CALDEIRA, S. M. G. Caracterização da rede de signos linguísticos: um modelo baseado no aparelho psíquico de Freud. 2005. Dissertação (Mestrado). Fundação Visconde de Cairu, Salvador, 2005.
CAMPOS, M. L. de A.; CAMPOS, L. M.; MEDEIROS, J. da S. A Representação de Domínios de Conhecimento e uma Teoria de Representação: a ontologia de fundamentação. Informação & Informação, [S.l.], v. 16, n. 2, p. 140-164, dez. 2011. Disponível em: http://www.uel.br/revistas/uel/index.php/informacao/article/view/10389. Acesso em: 11 Nov. 2015.
CHISHMAN, R. L. de O. Integrandoléxicossemânticos e ontologias: uma aproximação a favor da Web Semântica. Informação&Informação, [S.l.], v. 14, n. 1esp, p. 103-124, dez. 2009. Disponível em: http://www.uel.br/revistas/uel/index.php/informacao/article/view/2159. Acesso em: 11 Nov. 2015.
FIGUEIREDO, A.; FIGUEIREDO, F. Gramática Comentada com Interpretação de Textos. 2. ed. São Paulo: Elsevier, 2012. 515p.
FINATTO, M. J. B. Sobre a Eficácia do MXPOST Etiquetador morfossintático para o português do Brasil. Disponível em: http://www.ufrgs.br/textecc/porlexbras/porpopular/arquivos/Sobre.pdf. 2011.
GALLISON, R. Dicionário de Didáctica das Línguas. Coimbra: Livraria Almedina, 1983.
JÚNIOR, J. M. C. Sobre o Conceito de Processamento de Linguagem Natural. Universidade Estadual de Campinas, Faculdade de Tecnologia. Limeira, São Paulo, 2010.
METZ, J. ; CALVO, R. ; SENO, E. R. M. ; ROMERO, R. A. F. ; LIANG, Z. . Redes Complexas: conceitos e aplicações. Série de relatórios técnicos do ICMC - USP nº 290, 2007 (Relatório Técnico).
NELSON, D. L., MCEVOY, C. L., e SCHREIBER, T. A.The University of South Florida word association rhyme, and word fragment norms. Behav. Res. Methods Instrum. Comput, 36, 402-407, 2004. Disponível em: https://www.ncbi.nlm.nih.gov/pubmed/15641430 . Acesso em 2014.
Newman, M.E.J., The Structure and Function of Complex Networks. SIAM Review, 2003. 45(2): p. 167
OTHERO, G. de Á. Linguística Computacional Teoria & Prática. São Paulo: Parábola Editorial, 2005.
RATNAPARKHI, A. A Maximum Entropy Part-Of-Speech Tagger. In: the Proceedings of the Empirical Methods in Natural Language Processing Conference. Pennsylvania: University of Pennsylvania, 1996.
SOARES, L. D. Abecedário Maluco. Porto: Civilização Editora, 2004.

Published

2017-06-19

How to Cite

Santos, J., Andrade, F., Jorge, E. M. de F., Batista, J., & Saba, H. (2017). Homonyms’s Complex Networks to Semantic Analysis Textual. Informação & Informação, 22(1), 293–305. https://doi.org/10.5433/1981-8920.2017v22n1p293

Issue

Section

Artigos