Un regard statistique sur l'évaluation de performance : L'exemple de CLEF 2005

RESUME . Cette communication evalue et compare l'efficacite du depistage de l'information de onze modeles a l'aide de quatre collections de documents rediges dans les langues francaise, portugaise- bresilienne, hongroise et bulgare. Pour les deux dernieres langues, on compare egalement l'indexation basee sur des mots a celle reposant sur des quadrigrammes (4-grams). En recourant a quatre tests statistiques et deux regles ad hoc, nous analysons les performances obtenues pour savoir si les differences de performance observees sont significatives. Enfin, nous comparons les resultats de ces differentes regles de decision afin de verifier leur degre de concordance.