Relationsip semi-automation in thesauri: a proposal for semantic relationship refinement based on thesaurus AGROVOC




Knowledge Organization System, Thesaurus, Sematic Relations, AGROVOC


Introduction: Thesauri are tools that contribute to information retrieval in information services like digital data bases and digital libraries. Objective: This study aims to present a quantitative analysis on the refined sematic structure of the AGROVOC Thesaurus and propose a semi-automated model for semantic relationship refinement of thesauri. Methodology: To carry out this study, we used data from the AGROVOC Thesaurus represented in a refined SKOS-XL model. This data has been qualitatively aggregated in the classification of concepts by entity types as well as the hierarchical classification of relationships done by Soergel. From this base, we conducted a quantitative analysis of the relationship types. Results: Results from the quantitative data analysis showed that the refinement of the AGROVOC Thesaurus is not yet complete. Most Related Term relationships seem to have been refined, but hierarchical relationships (Broader / Narrower) have not. Conclusion: In sum, this study demonstrates that quantitative analysis can shed light on the structure of a thesaurus and indicate areas where improvements are possible.

Author Biographies

Decio Wey Berti Junior, Universidade Estadual de Londrina (UEL) Universidade Federal de Minas Gerais (UFMG)

Doutorando em Ciência da Informação (UFMG)

Mestre em Gestão da Informação (UEL)

Analista de Sistemas na Assessoria de Tecnologia de Informação (ATI) (UEL)

Dagobert Soergel, University at Buffalo (UB)

Dr. phil., Freiburg.

Professor Emeritus, Information Studies, University of Maryland

Gercina Ângela de Lima, Universidade Federal de Minas Gerais (UFMG)

Doutora em Ciência da Informação (UFMG)

Professora na Escola de Ciência da Informação (UFMG)

Programa de Pós-Graduação em Gestão e Organização do Conhecimento

Benildes Coura Moreira dos Santos Maculan, Universidade Federal de Minas Gerais (UFMG)

Doutora em Ciência da Informação (UFMG)

Professora na Escola de Ciência da Informação (UFMG)

Programa de Pós-Graduação em Gestão e Organização do Conhecimento


BARITÉ, M. et al. Diccionario de Organización del Conocimiento: clasificación, indización, terminología. 5a. ed. Montevideo: PRODIC, 2013.
BOCCATO, V. R. C.; BISCALCHIN, R. As dimensões culturais no contexto da construção de vocabulários controlados multilíngues. Rev. Interam. Bibliot, Medellín, v. 37, n. 3, p. 237-250, Dec. 2014.
BRÄSCHER, M.; CAFÉ, L.. Organização da Informação ou Organização do Conhecimento? In: SMIT, J. W.; GINEZ DE LARA, M. L. (Org.). Temas de pesquisa em Ciência da Informação no Brasil. São Paulo: Escola de Comunicações e Artes/USP, 2010. p. 8-103. Disponível em:>. Acesso em: 20 jan 2017.
CAFÉ, L. M. A.; BARROS, C. M.; SANTOS, V. C. O conceito de Organização do Conhecimento nas revistas brasileiras de Ciência da Informação. Rev. Interam. Bibliot, Medellín, v. 37, n. 3, p. 201-214, Dec. 2014.
CAFÉ, L.; BRÄSCHER, M. Organização do Conhecimento: teorias semânticas como base para estudo e representação de conceitos. Inf. & Inf., Londrina, v. 16, n. 2, p. 25-51, dez. 2011. Disponível em:>. Acesso em: 25 fev. 2017.
CAMPOS, M. L. A. Linguagem documentária: teorias que fundamentam sua elaboração. Rio de Janeiro: EUFF, 2001.
CAMPOS, M. L. A.; GOMES, H. E. Metodologia de elaboração de tesauro conceitual: a categorização como princípio norteador. Perspect. Ciênc. Inf., Belo Horizonte, v. 11, n. 3, p. 348-359, set./dez. 2006. Disponível em:>. Acesso em: 05 março 2016.
CAMPOS, M. L. A.; GOMES, H. E.; MOTTA, D. F. Manual de elaboração de tesauro. Rio de Janeiro: BITI, 2004.
CARVALHO, S. A. L. Terminologia e Documentação: um estudo terminográfico sobre performance musical. 2013. 188f. Dissertação (Mestrado em Ciência da Informação) – Escola de Ciência da Informação, Universidade Federal de Minas Gerais, Belo Horizonte, 2013.
CINTRA, A. M. M. et al. Para entender as linguagens documentárias. 2. ed. rev. ampl. São Paulo: Polis, 2002.
CURRÁS, E. Tesauros: linguagens terminológicas. Brasília: IBICT, 1995.
DAHLBERG, I. A referent-oriented, analytical concept theory of Interconcept. International Classification, v. 5, n. 3, p. 122-151, 1978.
DAHLBERG, I. Teoria da classificação, ontem e hoje. Tradução de Henry B. Cox. In: CONFERÊNCIA BRASILEIRA DE CLASSIFICAÇÃO BIBLIOGRÁFICA, 12-17 de setembro de 1972, Rio de Janeiro. Anais... Brasília, IBICT/ABDF, v. 1, p. 352-370, 1979.
DODEBEI, V. L. D. Tesauro: linguagem de representação da memória documentária. Niterói: Intertexto, 2002.
FARRADANE, J. Relational Indexing: part I e part ll. Journal of Information Science, n.1, p. 267-276; 313-324, 1980.
FOSKETT, A. C. A abordagem temática da informação. São Paulo: Polígono, 1973.
GOMES, H. E. (Org.). Manual de elaboração de tesauros monolíngues. Brasília: Programa Nacional de Bibliotecas de Instituições de Ensino Superior, 1990.
GREEN, R. Overview of relationship in knowledge organization. In: BEAN, C. A.; GREEN, R. (Ed.). Relationship in knowledge organization. Dordrecht: Kluwer, 2001. Chapter 1, p. 3-18.
GREEN, R. Relationships in knowledge organization. Knowledge Organization, v. 35, n. 2-3, p. 150-159, 2008.
HODGE, G. Systems of knowledge organization for digital libraries: beyond traditional authorities files. Washington, DC: Council on Library and Information Resources, 2000. Disponível em:>. Acesso em: 5 out. 2016.
HUTCHINS, W. J. Languages of indexing and classification: a linguistic study of structures and functions. Stevenage: Herts Peter Peregrinus, 1975. (Librarianship and information studies, 3).
INTERNATIONAL STANDARD ORGANIZATION. ISO 25964: thesauri and interoperability with other vocabularies. Part 1: thesauri for information retrieval. Geneve: International Standard Organization, 2011.
INTERNATIONAL STANDARD ORGANIZATION. ISO 25964: thesauri and interoperability with other vocabularies. Part 2: interoperability with other vocabularies. Geneve: International Standard Organization, 2013.
KOBASHI, N. Y. Fundamentos semânticos e pragmáticos da construção de instrumentos de representação de informação. DataGramaZero - Revista de Ciência da Informação, v. 8, n. 6, dez. 2007.
MACULAN, B. C. M. S. Estudo e aplicação de metodologia para reengenharia de tesauro: remodelagem do THESAGRO. 2015. 339f. Tese (Doutorado em Ciência da Informação) - Escola de Ciência da Informação da Universidade Federal de Minas Gerais, Belo Horizonte, 2015.
MARRONI, G. N. B. Identificação e delimitação de relações associativas em tesauros: um estudo de caso na área do direito do trabalho. 2006. 127f. Dissertação (Mestrado em Ciência da Informação) – Universidade de Brasília, Brasília, 2006.
MOTTA, D. F. Método relacional como nova abordagem para a construção de tesauros. 1987. 89f. Dissertação (Mestrado em Ciência da Informação) – Instituto Brasileiro de Informação em Ciência e Tecnologia, Rio de Janeiro, 1987.
SOERGEL, D. et al. Reengineering thesauri for new applications: the AGROVOC example. J. Digital Inf., v.4, n.4, p. 1-23, 2004. Disponível em:>. Acesso em: 05 março 2016.
SOERGEL, D. Entity type assignments. [mensagem pessoal]. Mensagem recebida por>. Acesso em: 18 fev. 2017.
SOUZA, R. R.; TUDHOPE, D.; ALMEIDA, M. B. Towards a taxonomy of KOS: dimensions for classifying knowledge organization systems. Knowledge Organization, v. 39, n. 3, p. 179-192, 2012. Disponível em: downloads/ Souza_Tudhope_Almeida__KOS_Taxonomy.Submitted.pdf>. Acesso em: 10 out. 2016.
SVENONIUS, E. The intellectual foundations of information organization. Cambridge: The MIT Press, 2000.
ZENG, M. L. Knowledge organization systems (KOS). Knowledge Organization, Frankfurt, v. 35, n. 2-3, p. 160-182, Jan. 2008.



How to Cite

Berti Junior, D. W., Soergel, D., Lima, G. Ângela de, & Maculan, B. C. M. dos S. (2017). Relationsip semi-automation in thesauri: a proposal for semantic relationship refinement based on thesaurus AGROVOC. Informação & Informação, 22(3), 377–404.


