Recherche d'information dans les microblogs : que manque-t-il aux approches classiques ?

Nous nous interessons dans cet article a la recherche d'information dans les microblogs. Les modeles de RI classiques, concus pour des textes plus longs que les 140 caracteres d'un microblog, ne sont pas forcement adaptes pour ces derniers. Une analyse de leurs resultats nous a permis d'identifier la difference de vocabulaire entre les microblogs et la requete comme etant la raison principale de leur manque de performance. Pour ameliorer la qualite de la recherche, nous proposons d'etendre les microblogs grâce au texte des URL qu'ils contiennent, et egalement d'etendre les requetes avec WordNet ou en utilisant des articles de presse. Les resultats montrent l'interet de l'extension des tweets, celui de l'extension des requetes restant a prouver.