Statistical language modeling for information retrieval : Information retrieval
暂无分享,去创建一个
Les AA. presentent une synthese de la recherche sur la modelisation statistique du langage pour la recherche d'information (RI). Il existe differents modeles de langage, en fonction de la theorie de probabilite envisagee : modele requete-probabilite, modele de traduction statistique, modele de pertinence. Differentes strategies de lissage (smoothing) sont utilisees, notamment pour pallier le probleme de donnees trop eparses. Les techniques de modelisation du langage ont ete comparees aux approches probabilistes traditionnelles. Elles sont notamment appliquees aux tâches de retroaction de pertinence, de RI repartie, de RI multilingue, de quantification de l'ambiguite de la requete et d'extraction de passages. La recherche a venir devra relever les defis de l'acces mondial a l'information, la capture et l'integration de l'information sur l'utilisateur et le contexte, ou encore la multiplicite des sources.