TURBIO: sistema de extracción de información a partir de textos estructurados
暂无分享,去创建一个
En este articulo se presenta un sistema para la extraccion de informacion a partir de textos de dominio restringido. Nuestra propuesta, TURBIO, tiene dos funcionalidades: el aprendizaje de reglas de extraccion a partir de una muestra significativa del corpus de origen y la ejecucion de dichas reglas para la extraccion de informacion del corpus. La principal aportacion de TURBIO es, pues, que hace innecesaria la generacion manual de reglas de extraccion. Los resultados obtenidos en el experimento llevado a cabo para la extraccion de informacion a partir de textos micologicos hacen pensar que la tecnica de aprendizaje de reglas es transportable a otros dominios con un esfuerzo limitado.
[1] Ann A. Copestake,et al. The ACQUILEX LKB: representation issues in semi-automatic acquisition of large lexicons , 1992, ANLP.
[2] Lisa F. Rau,et al. SCISOR: extracting information from on-line news , 1990, CACM.