TURBIO: sistema de extracción de información a partir de textos estructurados

En este articulo se presenta un sistema para la extraccion de informacion a partir de textos de dominio restringido. Nuestra propuesta, TURBIO, tiene dos funcionalidades: el aprendizaje de reglas de extraccion a partir de una muestra significativa del corpus de origen y la ejecucion de dichas reglas para la extraccion de informacion del corpus. La principal aportacion de TURBIO es, pues, que hace innecesaria la generacion manual de reglas de extraccion. Los resultados obtenidos en el experimento llevado a cabo para la extraccion de informacion a partir de textos micologicos hacen pensar que la tecnica de aprendizaje de reglas es transportable a otros dominios con un esfuerzo limitado.