Identification et catégorisation automatique des entités nommées dans les textes français

La reconnaissance des entites nommees (EN) reste un probleme pour de nombreuses applications de Traitement Automatique des Langues Naturelles. Consequemment a une etude linguistique permettant l'emergence de parametres definitoires operationnels lies au concept d'entite nommee, un etat de l'art du domaine et une etude en corpus fondee sur des criteres graphiques et referentiels, nous presentons Nemesis, un systeme d'identification et de categorisation des EN du francais, fonde sur l'analyse des evidences interne et externe realisee a l'aide de lexiques de mots declencheurs et de regles de reecriture et comportant une phase d'apprentissage. Dans cette version minimale, Nemesis atteint environ 90% en precision et 80% en rappel. Pour augmenter le rappel, nous proposons differents modules optionnels (examen d'un contexte encore plus large et utilisation du Web comme source de nouveaux contextes) et une etude pour la realisation d'un module de desambiguisation et d'apprentissage de regles.