Representación de páginas web a través de sus enlaces y su aplicación a la recuperación de información

Los sistemas mas habituales de Recuperacion de la Informacion se basan en conseguir una representacion homogenea y procesable de documentos y consultas, y en el calculo subsiguiente de alguna funcion que exprese el grado de similaridad entre una consulta dada y cada uno de los documentos de una coleccion. Por regla general, tales representaciones toman como base las palabras o terminos que aparecen en los documentos. Las paginas web, sin embargo, contienen hiperenlaces, lo que sugiere la posibilidad de representar dichas paginas en funcion de tales hiperenlaces, en lugar de terminos. Se describe un experimento exploratorio efectuado para estimar la viabilidad de esta hipotesis. Los resultados de dicho experimento sugieren que los hiperenlaces pueden ser aplicados ventajosamente en la representacion de las paginas web, pero tambien que es preciso definir y aplicar mecanismos correctores