Análisis y expansión de consultas en lenguaje natural para mejora de la búsqueda en Web

1. Resumen El proceso tradicional de búsqueda en Web se encuentra limitado por los lenguajes de consulta y por la carencia de información semántica sobre el dominio al que se refiere el usuario. Esto provoca que el sistema no recupere todos los resultados relevantes y sí obtenga, por el contrario, resultados que nada tienen que ver con la consulta original. El proyecto MESIA (CAM 07T/0017/1998) intenta paliar esta situación en el servidor Web de la Comunidad Autónoma de Madrid (www.comadrid.es ), actuando como interfaz entre el usuario y el buscador Altvista. 2. Objetivos El sistema MESIA facilita al usuario la comunicación con el motor de búsqueda, actuando como interfaz en dos niveles: antes de la búsqueda, recibe la consulta del usuario escrita en lenguaje natural y, posteriormente, la convierte en una consulta booleana. Durante este proceso se produce una expansión de la consulta mediante recursos lingüísticos que mejora sensiblemente los resultados. Después de la búsqueda, MESIA incorpora información sobre el dominio al proceso, permitiendo la expansión semántica de resultados: una vez identificado el tema de la consulta, a los resultados obtenidos se añaden enlaces sobre asuntos relacionados con dicho tema. Además, esta información sirve también para ordenar los resultados según su relevancia para la consulta. 3. Descripción del sistema La figura 1 describe la arquitectura del prototipo actual de MESIA (http://tornado.dia.fi.upm.es/mesia/mesia_demo .hml), que ha sido implementado en el entorno CIAO-Prolog [1]. A continuación se describen los dos módulos principales: el módulo de expansión de la consulta y el de ampliación y ordenación de resultados.