De l'induction confirmatoire à la classification : contribution à l'apprentissage automatique

La generalisation confirmatoire consiste a determiner les lois les plus generales confirmees par un ensemble d'observations. L'induction confirmatoire repose sur l'hypothese des similarites : les individus inconnus se comportent comme les individus connus. Nous montrons qu'une circonscription des individus modelise mieux cette hypothese qu'une circonscription des proprietes. Nous proposons un modele capable d'obtenir des clauses plus generales et d'eviter des generalisations indesirables par rapport aux approches existantes. Ce modele defini en logique des predicats se specialise dans le cas propositionnel en un calcul des premiers impliques. Considerant le probleme de la classification, ou classement, d'objets a partir d'exemples, nous montrons que les regles minimales coherentes et pertinentes ne sont pas, dans le cas general, des generalisations confirmatoires. Nous proposons une nouvelle technique de classification, dite par portee, qui consiste a chercher l'ensemble des exemples a partir desquels une regle coherente et pertinente peut etre construite. Elle a donc une approche a base d'instances de la classification a base de regles. Nous presentons un ensemble d'adaptations des fondements logiques de la classification par portee aux donnees reelles. Nous etendons egalement notre technique aux instances generalisees en regles. Les strategies de generalisation que nous proposons, et surtout la recherche des voisins different nettement de celles existantes. Nous montrons que, bien que les hypotheses construites different, notre approche et celle de l'espace des versions disjonctives conduisent au meme classement. Notre point de vue original permet cependant de proposer, au dela d'une implantation plus efficace, des developpements propres a une approche a base de regles. Notre approche a en moyenne une meilleure precision et un temps d'execution semblable a ceux les approches les plus utilisees a base d'instances ou a base de regles sur des ensembles de test usuels.