La Classification non Supervisée (Clustering) de Documents Textuels par les Automates Cellulaires

Resume : Dans cet article nous presentons un automate cellulaire (Class_AC) pour resoudre un probleme de text mining en l’occurrence la classification non supervisee (Clustering). Avant de proceder a l’experimentation par l’automate cellulaire, nous avons vectorises nos donnees en procedant a l’indexation des documents textuels provenant de la base de donnee REUTERS 21578 par l’approche Wordnet. L’automate que nous proposons dans cet article est une grille de cellules de structure plane avec un voisinage decoulant de cette structure (planaire). Trois fonctions de transitions ont servi a faire varier l’automate ayant quatre etats pour chaque cellule. Les resultats obtenus montrent que la machine virtuelle a calcul parallele (Class_AC) regroupe efficacement des documents similaires a un seuil pres.