Use of ontology in the retrieval of information in digital collections of newspapers

Authors

  • Luana Carla de Moura dos Santos Universidade Federal de Santa Catarina, Departamento de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação.
  • Marisa Bräscher Universidade Federal de Santa Catarina, Departamento de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação.

DOI:

https://doi.org/10.5433/1981-8920.2017v22n3p346

Keywords:

Information Retrieval, Digital Newspaper Collection, Domain Ontology, Soccer

Abstract

Introduction: It aims at modeling an ontology of the soccer field for the treatment of diachronic and synchronic variations of the language; Objective: To support the retrieval of information in digital collections of newspapers. Methodology: This is an applied research, using as basis a digital journal collection. It uses the methodology OntoForInfoScience, de Mendonça (2015) to develop the ontology of the soccer field. Information collection was carried out on domain reference materials and newspaper news. Chronologically, the established cut covers terminology used between 1900 to 2015, a period that contemplates the existence of football clubs in Brazil. The ontology was formalized in logical language with the help of the editor Protegé. As a way of evaluating the developed ontology, competence issues were elaborated that were executed in SPARQL language. To verify the use of the ontology in environments composed by printed and digital newspapers, demonstrative searches were carried out in a real collection. Results: The analysis of the results showed that without the use of the ontology in the digital collections of newspapers, the information retrieval is exhaustive and retrieves documents that are not relevant due to the absence of relationships between the terms that form the domain. Conclusion: With the inclusion of the ontology, the search for information can dispense with both the user's literacy, because with the relationships formed, it is not necessary to perform numerous searches to retrieve equivalent concepts and expressions.

Author Biographies

Luana Carla de Moura dos Santos, Universidade Federal de Santa Catarina, Departamento de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação.

Mestre em Ciência da Informação pela Universidade Federal de Santa Catarina (UFSC), graduada em Biblioteconomia pela Universidade do Estado de Santa Catarina (Udesc)

Marisa Bräscher, Universidade Federal de Santa Catarina, Departamento de Ciência da Informação, Programa de Pós-Graduação em Ciência da Informação.

Professora do Departamento de Ciência da Informação da Universidade Federal de Santa Catarina. Mestrado e doutorado em Ciência da Informação pela Universidade de Brasília, com dois anos de pesquisa na Université de Nice Sophia Antipolis (França).

References

ALMEIDA, M. B.; MENDONÇA, F. M.; AGANETTE, E. C. Interfaces entre ontologias e conceitos seminais da Ciência da informação: em busca de avanços na organização do conhecimento. In: ENANCIB, v. 4, 2013, Florianópolis. Anais eletrônicos... Disponível em: http://repositorios.questoesemrede.uff.br/repositorios/bitstream/handle/123456 789/2339/INTERFACES ENTRE ONTOLOGIAS.pdf?sequence=1>. Acesso em: 13 set. 2016.
ALMEIDA, M. B.; OLIVEIRA, V.; COELHO, K. Estudo exploratório sobre ontologias aplicadas a modelos de sistemas de informação: perspectivas de pesquisa em Ciência da Informação. Encontros Bibli: Revista Eletrônica de Biblioteconomia e Ciência da Informação, set. 2010. Disponível em: http://www.periodicos.ufsc.br/index.php/eb/article/view/10987/14369>. Acesso em: 13 set. 2016.
ANSI/NISO Z39.19-2005. Guidelines for the construction, format, and management of monolingual thesauri. 2005. Disponível em: http://www.niso.org/apps/group_public/download.php/12591/z39-192005r2010.pdf>. Acesso em: 23 set. 2016.
ARANO, S. Los tesauros y las ontologías en la Biblioteconomía y la Documentación. Thesauruses and ontologies. Hipertext.net, 2005, n. 3.
BAEZA-YATES, R.; RIBEIRO-NETO, B. Modern information retrieval. 1st ed. Boston, MA: Addison-Wesley Longman Publishing Co., Inc., 1999.
BERNERS-LEE, T.; HENDER, J.; LASSILA, O.. The semantic web: a new form of web content that is meaningful to computers will unleash a revolution of new possibilities. 2001. Disponível em: http://www.cs.umd.edu/~golbeck/LBSC690/SemanticWeb.html84A9809EC 588EF21>. Acesso em: 02 set. 2016.
BHOGAL, J.; MACFARLANE, A.; SMITH, P.. A review of ontology based query expansion. Information Processing & Management, v. 43, n. 4, p.866-886, jul. 2007. Disponível em: <http://www-sciencedirect com.ez46.periodicos.capes.gov.br/science/article/pii/S0306457306001476#>. Acesso em: 01 set. 2016.
BOCCATO, V. R. C.; RAMALHO, R. A. S.; FUJITA, M. S. L. A contribuição dos tesauros na construção de ontologias como instrumento de organização e recuperação da informação. IBERSID: revista de sistemas de información y documentación, número monográfico, p. 199-209, 2008.
BREITMAN, K. K. Web semântica: a internet do futuro. Rio de Janeiro: LTC, 2010. xvii, 190 p
CAMPOS, M. L. A. O papel das definições na pesquisa em ontologia. Perspectivas em Ciência da Informação, Belo Horizonte, v. 1, n. 15, p. 220238, abr. 2010. Disponível em: http://www.scielo.br/pdf/pci/v15n1/13.pdf>. Acesso em: 24 fev. 2016.
CURRÁS, E. Tesauros, linguagens terminológicas. Tradução de Antônio Felipe Corrêa da Costa. Brasília: Instituto Brasileiro de Informação em Ciência e Tecnologia, 1995.
DODEBEI. V. Tesauro: linguagem de representação da memória documentaria. Rio de Janeiro: Intertexto, 2002.
FARIA, M. J. F. L. Definição de uma ontologia aplicada ao futebol. 2009. 147 f. Dissertação (Mestrado) - Curso de Engenharia Electrotécnica e de Computadores, Faculdade de Engenharia da Universidade do Porto, Porto, 2009. Disponível em: http://paginas.fe.up.pt/~ee99157/FariaTese.pdf>. Acesso em: 24 fev. 2016.
GUARINO, N. Formal ontology in information systems. Proceedings of FOIS’98, Trento, Italy, 6-8 June 1998. Amsterdam, IOS Press, pp. 3-15, 1998.
HAAV, H.; LUBI, T. A Survey of concept-based information retrieval tools on the web.2001. Disponível em: http://www.mii.vu.lt/ADBIS/local2/haav.pdf>. Acesso em: 24 set 2016.
KROVETZ, R.; CROFT, W. B. Lexical Ambiguity and Information Retrieval. ACM Transactions on Information Systems, v.10, n.2. p. 115-141, 1992. Disponível em: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.11.1928&rep=rep1& type=pdf>. Acesso em: 01 set 2016.
LAKATOS, E. M.; MARCONI, M. A. Fundamentos de metodologia científica. 3ed. São Paulo: Atlas, 1991.
LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: revisão da literatura. Ci. Inf, Brasília, v. 1, n. 31, p.41-52, abr. 2002. Disponível em: http://www.scielo.br/pdf/ci/v31n1/a05v31n1.pdf>. Acesso em: 24 set. 2016.
MANNING, C. D.; SCHÜTZE, H. Foundations of statistical natural language processing. Cambridge, Massachusetts / London, England: The MIT Press, 1999. Disponível em: http://ics.upjs.sk/~pero/web/documents/pillar/Manning_Schuetze_StatisticalNL P.pdf> Acesso em: 01 set 2016.
MARTELOTTA, M. E. Mudança linguística: uma abordagem baseada no uso. São Paulo: Cortez, 2011
MELO, F. J. D.; BRASCHER, M. Fundamentos da lingüística para a formação do profissional da informação. Brasília: Thesaurus, 2011. MENDONÇA, F. M. Ontoforinfoscience: metodologia para construção de ontologias pelos cientistas da informação: uma aplicação prática no desenvolvimento da ontologia sobre componentes do sangue humano (HEMONTO). 2015. 311 f. Tese (Doutorado) - Curso de Ciência da Informação, Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2015. Disponível em: http://www.bibliotecadigital.ufmg.br/dspace/handle/1843/BUBD-A35H3K>. Acesso em: 17 set 2016.
MOREIRO GONZÁLEZ, J. A. Linguagens documentárias e vocabulários semânticos para a web. Salvador: Edufba, 2011.
MOURA, D. O. O ‘sincrônico’, o ‘diacrônico’, o acontecimento e a errância de sentidos na análise do discurso jornalístico. Comunicação & Informação, Brasil, v. 2, n. 12, p.63-73, jul. 2009. Semestral. Disponível em: http://www.revistas.ufg.br/index.php/ci/article/view/12270/8132>. Acesso em: 15 set. 2016.
REIS, L. P.; LAU, N. Coach Unilang: a standard language for coaching a (Robo) socer team. Disponível em: http://eaia07.di.fc.ul.pt/docs/reis/Reis%20Atelier/paginas.fe.up.pt/_lpreis/EAIA 07/Docs/COACH_UNILANG_A_Standard_Language_for_Coaching_a_(Robo)_ Soccer_Team.pdf>. Acesso em: 24 set 2016.
SALES, R.; CAFÉ, L. Semelhanças e Diferenças entre Tesauros e Ontologias. Datagramazero, Rio de Janeiro, v. 8, n. 4, ago. 2008. Disponível em: http://www.dgz.org.br/ago08/Art_02.htm>. Acesso em: 23 set. 2016.
SCHIESSL, M. Lexicalização de ontologias: o relacionamento entre conteúdo e significado no contexto da Recuperação da Informação. 2015. 259 f. Tese (Doutorado) - Curso de Ciência da Informação, Programa de Pósgraduação em Ciência da Informação da Universidade, Universidade de Brasília, Brasília, 2015. Disponível em: http://www.repositorio.unb.br/bitstream/10482/18663/1/2015_MarceloSchiessl.pdf>. Acesso em: 02 mar. 2017.
SOERGEL, D. Functions of a Thesaurus / Classification / Ontological Knowledge Base. College of Library and Information Services, University of Maryland, 1997. Disponível em: http://www.dsoergel.com/cv/soergelfctclass.pdf>. Acesso: 06 set. 2016.
SOUZA, R. R.; ALVARENGA, L. A web semântica e suas contribuições para a ciência da informação. Ciência da Informação, v.33, n. 1, p. 132-141, jan./ abr. 2004. Disponível em: http://www.scielo.br/scielo.php?pid=S010019652004000100016&script=sci_arttext>. Acesso em: 09 ago. 2016.
STUDER, R.; BENJAMINS, V. R.; FENSEL, D. Knowledge Engineering: Principles and methods. Data & Knowledge Engineering, n.25, 1998, p.161167. Disponível em: http://www.it.iitb.ac.in/~palwencha/ES/Knowledge%20engineering%20%20Principles%20and%20methods.pdf>. Acesso em: 10 ago. 2016.
SURE, Y.; STAAB, S.; e STUBER, R. On-To-Knowledge Methodology (OTKM). 2003.Disponível em: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.14.798&rep=rep1&ty pe=pdf>. Acesso em: 08 set de 2016.
USCHOLD, M.; JASPER, R. A framework for understanding and classifying ontology applications. 1999. Disponível em: http://ceur-ws.org/Vol-18/11uschold.pdf>. Acesso em: 10 ago. 2016.
VICKERY, BC. Ontologies. Journal of Information Science, v.23, n.4, p. 227 – 286, Jan. 1997.

Published

2017-12-31

How to Cite

Santos, L. C. de M. dos, & Bräscher, M. (2017). Use of ontology in the retrieval of information in digital collections of newspapers. Informação & Informação, 22(3), 346–376. https://doi.org/10.5433/1981-8920.2017v22n3p346

Issue

Section

Artigos