Webaffix : une boîte à outils d’acquisition lexicale à partir du Web

Nous presentons ici Webaffix, un outil qui permet de constituer et d’enrichir semi-automatiquement des donnees lexicales en utilisant le Web comme corpus. Il permet de detecter et d’analyser morphologiquement des unites lexicales nouvelles (c’est-a-dire absentes de listes de reference telles que les dictionnaires) construites par suffixation ou prefixation. Nous presentons les techniques utilisees par Webaffix, en declinant les differents modes d’utilisation que nous avons envisages et mis en pratique, ainsi que des exemples de resultats produits par diverses campagnes de collecte. Les donnees ainsi recueillies constituent des ressources lexicales pour differentes applications en traitement automatique des langues, mais egalement pour l’etude a grande echelle de la morphologie derivationnelle.