Categorization of B2B Service Offers: Lessons learnt from the Silex Use case

Dans le domaine de la recherche d'information et du traite-ment automatique du langage, la tâche de classification de textes est devenue une tâche cruciale. Dans cet article, nous partageons notre experience de la classification de textes dans un contexte industriel et presentons une evalu-ation comparative de differents algorithmes de classification binaire et multi-label appliques a des textes decrivant des offres de services, issus de la plateforme B2B SILEX pour la recommandation de prestataires de services. Nous montrons que dans certains cas pratiques comme celui que nous considerons, une representation des donnees sous la forme de "bags of words" donne de meilleurs resultats de classification qu'une representation reputee plus promet-teuse par "word embeddings".