DEFT'09 : détection de la subjectivité et catégorisation de textes subjectifs par une approche mixte symbolique et statistique

Nous presentons dans cet article le bilan de notre participation a la 5eme edition du DEfi Fouille de Textes(DEFT'09). Nous participons a deux tâches parmi les trois tâches proposees dans le cadre de ce defi. La premiere consiste a categoriser des textes journalistiques en deux classes : subjectif et objectif, et la seconde cherche a delimiter a un niveau de granularite le plus fin possible les passages subjectifs qui apparaissent dans des textes journalistiques et parlementaires. Pour realiser ces tâches sur des textes en francais, nous proposons deux methodes basees sur la detection d'indices de differents niveaux linguistiques par une approche symbolique. Pour la tâche 1, nous utilisons ces indices comme attributs d'un texte dans une methode d'apprentissage et de categorisation automatique standard.