A Pattern Dictionary for Natural Language Processing

Cet article passe en revue de facon succincte trois des ressources principales utilisees actuellement pour la desambiguisation lexicale (WordNet, FrameNet et les classes de Levin), et propose une approche alternative, en prenant comme point de depart les verbes et leurs valences. Cette nouvelle approche ne tente pas de rendre compte de tous les usages possibles d’un mot, mais plutot de tous ses usages normaux (les ‘normes’). Les patrons normaux d’utilisation des verbes sont degages par une methode que nous appelons Corpus Pattern Analysis (CPA, analyse des patrons basee sur les corpus). A chaque patron se trouve associe un sens (une ‘implication principale’). Les patrons sont ensuite utilises comme des etalons par rapport auxquels on peut mesurer le sens probable de n’importe quelle phrase.Nous abordons aussi le statut des usages anormaux ou inhabituels (les ‘exploitations’). Nous reconnaissons aussi trois types d’alternance : les alternances syntaxiques liees a la diathese, les alternances de type semantique et les alternances lexicales.