Des textes communautaires à la recommandation

La these concerne la transformation de donnees textuelles non structurees en donnees structurees et exploitables par des systemes de recommandation. Deux grandes categories d'informations sont utilisees dans le domaine des moteurs de recommandation : les donnees descriptives de contenus comme les meta-donnees ou les tags (filtrage thematique), et les donnees d'usages qui peuvent etre des notes ou encore des pages Web visitees par exemple (filtrage collaboratif). D'autres donnees sont presentes sur le Web et ne sont pas encore reellement exploitees. Avec l'emergence du Web 2.0, les internautes sont de plus en plus amenes a partager leurs sentiments, opinions, experiences sur des produits, personnalites, films, musiques, etc. Les donnees textuelles produites par les utilisateurs representent potentiellement des sources riches d'informations qui peuvent etre complementaires des donnees exploitees actuellement par les moteurs de recommandation et peuvent donc ouvrir de nouvelles voies d'etudes dans ce domaine en plein essor. Notre objectif dans le cadre de la these est de produire, a partir de commentaires issus de sites communautaires (blogs ou forums), des matrices d'entrees pertinentes pour les systemes de recommandation. L'idee sous-jacente est de pouvoir enrichir un systeme pour un service debutant, qui possede encore peu d'utilisateurs propres, et donc peu de donnees d'usages, par des donnees issues d'autres utilisateurs. Nous faisons tout d'abord un etat de l'art de la recommandation automatique. Nous presentons ensuite le moteur ainsi que les donnees utilisees pour les experimentations. Le chapitre suivant decrit les premieres experimentations en mode thematique. Nous faisons ensuite un nouvel etat de l'art sur la classification d'opinion. Pour finir, nous decrivons les experimentations menees pour l'approche collaborative a l'aide de la classification d'opinion.