Conception de methode d'apprentissage symbolique et automatique pour l'acquisition de cadres de sous-categorisation de verbes et de connaissances semantiques a partir de textes : le systeme asium

Ce travail de these se situe au carrefour de l'acquisition de connaissances, de l'apprentissage automatique et du traitement automatique du langage naturel. La methode est fondee sur une approche distributionnelle de la semantique. Les classes semantiques qu'il est possible d'apprendre a partir d'un corpus analyse syntaxiquement manquent souvent d'homogeneite qui rend l'approche cooperative indispensable. Nous avons concu une nouvelle methode d'apprentissage cooperatif fondee sur un algorithme de classification conceptuelle implemente dans le systeme asium. Il permet d'acquerir des connaissances semantiques organisees en ontologie qui seront validees au fur et a mesure par un expert du domaine. La cooperation de l'expert via l'interface ergonomique d'asium lui permet d'influer sur le processus d'apprentissage pour le guider et en corriger les resultats. Le systeme conservant les liens entre les concepts appris et leurs contextes syntaxiques d'utilisation fournit des connaissances specifiques pouvant etre utilisees dans de nombreuses applications comme, par exemple, la classification de textes ou l'extraction d'information.