Résumé automatique de texte avec un algorithme d'ordonnancement

Dans cet article, nous proposons une nouvelle approche pour le resume automatique de textes utilisant un algorithme d'apprentissage numerique specifique a la tâche d'ordonnancement. L'objectif est d'extraire les phrases d'un document qui sont les plus representatives de son contenu. Pour se faire, chaque phrase d'un document est representee par un vecteur de scores de pertinence, ou chaque score est un score de similarite entre une requete particuliere et la phrase consideree. L'algorithme d'ordonnancement effectue alors une combinaison lineaire de ces scores, avec pour but d'affecter aux phrases pertinentes d'un document des scores superieurs a ceux des phrases non pertinentes du meme document. Les algorithmes d'ordonnancement ont montre leur efficacite en particulier dans le domaine de la meta-recherche, et leur utilisation pour le resume est motivee par une analogie peut etre faite entre la meta-recherche et le resume automatique qui consiste, dans notre cas, a considerer les similarites des phrases avec les differentes requetes comme etant des sorties de differents moteurs de recherche. Nous montrons empiriquement que l'algorithme d'ordonnancement a de meilleures performances qu'une approche utilisant un algorithme de classification sur deux corpus distincts.