Un modelo para detectar la similitud semántica entre textos de diferentes longitudes

Resumen En el presente trabajo se desarrolla un modelo para resolver el problema de similitud semantica entre textos de diferente longitud. Se propone extraer caracteŕisticas lexicas, caracteŕisticas basadas en conocimiento y caracteŕisticas basadas en corpus, con el objetivo de desarrollar un modelo de aprendizaje supervisado. El modelo fue desarrollado utilizando regresion loǵistica de la herramienta Weka. Los resultados obtenidos sobre los datos ofrecidos en el marco del Semeval 2014, han sido buenos para dos tipos de corpora.

[1]  Eneko Agirre,et al.  SemEval-2012 Task 6: A Pilot on Semantic Textual Similarity , 2012, *SEMEVAL.

[2]  Ian H. Witten,et al.  The WEKA data mining software: an update , 2009, SKDD.

[3]  Darnes Vilariño Ayala,et al.  FCC: Three Approaches for Semantic Textual Similarity , 2012, SemEval@NAACL-HLT.

[4]  Eneko Agirre,et al.  *SEM 2013 shared task: Semantic Textual Similarity , 2013, *SEMEVAL.

[5]  Michael E. Lesk,et al.  Automatic sense disambiguation using machine readable dictionaries: how to tell a pine cone from an ice cream cone , 1986, SIGDOC '86.

[6]  Carlo Strapparava,et al.  Corpus-based and Knowledge-based Measures of Text Semantic Similarity , 2006, AAAI.

[7]  David W. Conrath,et al.  Semantic Similarity Based on Corpus Statistics and Lexical Taxonomy , 1997, ROCLING/IJCLCLP.

[8]  Dekang Lin,et al.  An Information-Theoretic Definition of Similarity , 1998, ICML.

[9]  Eduardo Blanco,et al.  Choosing the Right Words: Characterizing and Reducing Error of the Word Count Approach , 2013, *SEMEVAL.

[10]  Martha Palmer,et al.  Verb Semantics and Lexical Selection , 1994, ACL.

[11]  Roberto Navigli,et al.  SemEval-2014 Task 3: Cross-Level Semantic Similarity , 2014, *SEMEVAL.

[12]  Madhura Parikh Semantic Textual Similarity , 2015 .

[13]  Bahar Salehi,et al.  Predicting the Compositionality of Multiword Expressions Using Translations in Multiple Languages , 2013, *SEMEVAL.

[14]  Martin Chodorow,et al.  Combining local context and wordnet similarity for word sense identification , 1998 .

[15]  Philip Resnik,et al.  Using Information Content to Evaluate Semantic Similarity in a Taxonomy , 1995, IJCAI.

[16]  Christiane Fellbaum,et al.  Combining Local Context and Wordnet Similarity for Word Sense Identification , 1998 .

[17]  Peter D. Turney Mining the Web for Synonyms: PMI-IR versus LSA on TOEFL , 2001, ECML.

[18]  Anette Frank,et al.  Automatically Identifying Implicit Arguments to Improve Argument Linking and Coherence Modeling , 2013, *SEMEVAL.

[19]  Patrick F. Reidy An Introduction to Latent Semantic Analysis , 2009 .

[20]  Cuong Chau,et al.  Montague Meets Markov: Deep Semantics with Probabilistic Logical Form , 2013, *SEMEVAL.

[21]  Manfred Pinkal,et al.  Using the text to evaluate short answers for reading comprehension exercises , 2013, *SEMEVAL.