OntoSmart: proposta de um modelo de recuperaçao de informaçao baseado em ontologia

EnglishAn information retrieval system is a linguistic environment that mediates the communication between a stock of information and its requesters. Their efficien-cy depends on an adequate control of representation of the documents and of the requests of its users. In the context of Information Science, thesaurus has established as a very efficient tool in the representa-tion of information. However, ontologies are emerging as a new technology that assist the representation and organization of information and knowledge. This research aims to develop an ontology-based information retrieval model that uses the formal structure of the Vector Space Model. The vectors representing the documents are created during the automatic in-dexing process. From an initial set of terms extracted from the documents there shall be an inference in the ontology in order to enrich the indexing. Similarly, a user's query is also represented by a vector created from a query expansion process through inferences in ontology. Using the proposed model, it was initiated the development of an information retrieval system called OntoSmart, whose partial results point to a significant increase in accuracy of retrieval. portuguesUm sistema de recuperacao de informacao e um ambiente linguistico mediador da comunicacao entre um estoque de informacao e seus requisitantes. Sua eficiencia depende de um controle adequado da representacao dos documentos e das requisicoes de seus usuarios. No contexto da Ciencia da Informacao o tesauro se consolidou como uma ferramenta bas-tante eficiente na representacao da informacao. Po-rem, as ontologias surgem como uma nova tecnolo-gia que auxiliam na representacao e na organizacao da informacao e do conhecimento. Esta pesquisa tem por objetivo desenvolver um modelo de recuperacao de informacao baseado em ontologia que utiliza como estrutura formal o Modelo Espaco Vetorial. Os veto-res que representam os documentos sao criados durante o processo de indexacao automatica. A partir de um conjunto inicial de termos extraidos dos docu-mentos, procede-se uma inferencia na ontologia com a finalidade de enriquecer a indexacao. De forma semelhante, a expressao de busca de um usuario e tambem representada por um vetor, criado a partir de um processo de expansao de consulta por meio de inferencias em uma ontologia. Utilizando o modelo proposto, deu-se inicio ao desenvolvimento de um sistema de recuperacao de informacao denominado OntoSmart, cujos resultados parciais apontam para um aumento significativo na precisao da recuperacao.

[1]  Lluís Codina,et al.  Tesauros y ontologías en sistemas de información documental , 2011 .

[2]  Timothy W. Finin,et al.  Information Retrieval and the Semantic Web , 2005, Proceedings of the 38th Annual Hawaii International Conference on System Sciences.

[3]  Renata Wassermann,et al.  An information retrieval application using ontologies , 2010, Journal of the Brazilian Computer Society.

[4]  Fernando Gomide,et al.  Fuzzy relational ontological model in information search systems , 2006, Fuzzy Logic and the Semantic Web.

[5]  Jaana Kekäläinen,et al.  CIRI-An Ontology-based Query Interface for Text Retrieval , 2004 .

[6]  B. C. Vickery,et al.  Ontologies , 1997, J. Inf. Sci..

[7]  Thomas R. Gruber,et al.  A translation approach to portable ontology specifications , 1993, Knowl. Acquis..

[8]  Balakrishnan Chandrasekaran,et al.  What are ontologies, and why do we need them? , 1999, IEEE Intell. Syst..

[9]  El marco disciplinar de los lenguajes documentales: la Organización del Conocimiento y las ciencias sociales , 1996 .

[10]  Guilherme Ataíde Dias,et al.  UM MÉTODO DE EXPANSÃO AUTOMÁTICA DE CONSULTA BASEADA EM ONTOLOGIA , 2013 .

[11]  Elin K. Jacob Ontologies and the Semantic Web , 2005 .

[12]  Dagobert Soergel The Rise of Ontologies or the Reinvention of Classification , 1999, J. Am. Soc. Inf. Sci..

[13]  Thomas R. Gruber,et al.  Toward principles for the design of ontologies used for knowledge sharing? , 1995, Int. J. Hum. Comput. Stud..

[14]  Antonio García Jiménez,et al.  Instrumentos de representación del conocimiento: tesauros versus ontologías , 2004 .

[15]  Gerard Salton,et al.  Experiments in Automatic Thesaurus Construction for Information Retrieval , 1971, IFIP Congress.

[16]  Nicola Guarino,et al.  OntoSeek: content-based access to the Web , 1999, IEEE Intell. Syst..

[17]  Schubert Foo,et al.  Ontology research and development. Part 1 - a review of ontology generation , 2002, J. Inf. Sci..

[18]  Jian Qin,et al.  Converting a controlled vocabulary into an ontology: the case of GEM , 2001, Inf. Res..

[19]  Lígia Maria Arruda Café,et al.  Diferenças entre Tesauros e Ontologias , 2009 .