La compresión de frases: un recurso para la optimización de resumen automático de documentos

El objetivo de este trabajo de investigacion es confirmar si es adecuado emplear la compresion de frases como recurso para la optimizacion de sistemas de resumen automatico de documentos. Para ello, en primer lugar, creamos un corpus de resumenes de documentos especializados (articulos medicos) producidos por diversos sistemas de resumen automatico.  Posteriormente realizamos dos tipos de compresiones de estos resumenes.  Por un lado, llevamos a cabo una compresion manual, siguiendo dos estrategias: la compresion mediante la eliminacion intuitiva de algunos elementos de la oracion y la compresion mediante la eliminacion de ciertos elementos discursivos en el marco de la Rhetorical Structure Theory (RST).  Por otro lado, realizamos una compresion automatica por medio de varias estrategias, basadas en la eliminacion de palabras de ciertas categorias gramaticales (adjetivos y adverbios) y una baseline de eliminacion aleatoria de palabras.  Finalmente, comparamos los resumenes originales con los resumenes comprimidos, mediante el sistema de evaluacion Rouge. Los resultados muestran que, en ciertas condiciones, utilizar la compresion de frases puede ser beneficioso para mejorar el resumen automatico de documentos.