Classification de textes d'opinions : une approche mixte n-grammes et sémantique

Cet article presente la participation de l'equipe du GREYC a DEFT'07, en detaillant les differentes approches mises en place ainsi que les resultats obtenus. Plusieurs techniques ont ete mises en œuvre, notamment une approche a base de n-grammes, et une chaine de traitement linguistique de production d'indices. L'approche de type n-grammes a beneficie de traitements linguistiques complementaires tels que la lemmatisation et la synonymie, et constitue a elle seule un classifieur autonome. La chaine de traitements alimente quant a elle un classifieur supervise en lui fournissant des indices s'appuyant en particulier sur un lexique. Enfin, un autre classifieur a pour vocation de conjuguer les resultats obtenus par les deux traitements precedents.