Dernières évolutions de SQuaLIA, le système de Questions/Réponses du LIA

RESUME. Cet article presente le systeme de Questions/Reponses (sQR) du LIA, ses composants internes (categorisation des questions, recherche de passages, extraction des reponses) ainsi que les points d'appui en amont des traitements, comme les bases de connaissances ou la prediction de la capacite a repondre. Tous ces aspects sont observes au travers des performances obtenues lors des campagnes d'evaluation qui permettent d'etablir un diagnostic des besoins d'amelioration et d'adaptation des systemes. L'analyse des resultats intermediaires des modules de notre sQR, depuis les donnees de la campagne EQueR, permet d'etudier l'influence de l'utilisation de scores de densite pour la recherche de passage ou de scores de compacite pour l'extraction des reponses. Les bases de connaissances prennent en charge des questions frequentes et permettent d'apporter une credibilite supplementaire a certaines reponses. Enfin, un apprentissage automatique des caracteristiques des questions auxquelles le systeme a pu repondre lors de la campagne EQueR permet de predire dans plus de 70% des cas si le systeme est capable de repondre a une question donnee. ABSTRACT. This paper introduces our Question Answering System. Evaluation campaigns such as TREC or EQueR helped us to better analyse the effects of various features on the main components, and lead us to propose new ones, as density for passages detection or compacity for answer extraction. The framework of the evaluation campaigns gives us some restrictions concerning the questions forms and focus. Some frequent questions may be answered with knowledge bases. In the particular context of evaluation campaigns, it can only validate candidate answers. From our participation at EQueR, we also studies if our system can predict its ability to answer to questions. With a machine learning algorithm using questions features, we show that we can predict with 70% of certainty if the system will be able to answer. MOTS-CLES : systeme de Questions Reponses, Questions Reponses, EQueR, evaluation d'un systeme de Questions Reponses, densite, compacite, bases de connaissances, prediction, prediction de la difficulte d'une question.