Contribution à la structuration fonctionnelle des documents imprimés : exploitation de la dynamique du regard dans le repérage de l'information
暂无分享,去创建一个
Cette these s'inscrit dans le domaine de l'analyse automatique d'images de documents imprimes et repose sur deux grandes thematiques a premiere vue sans lien, que sont la segmentation de documents et la perception visuelle humaine. Plus specifiquement, elle developpe une methodologie de structuration de documents composites par la capture d'informations a fort pouvoir attractif. La determination de la structure des documents en blocs homogenes et la recuperation des proprietes necessaires a leur reconnaissance se realisent par 1' exploitation de notre mode de perception visuelle. Cette exploration est decrite par le parcours du regard, privilegiant tour a tour des zones dont la localisation ne depend pas d'un balayage uniforme, mais d'une intention de l'observateur et des caracteristiques visuelles du document. La simulation du parcours de 1' œil sur le document que nous avons retenue traduit la segmentation que ferait un lecteur qui aborde le document sans a priori sur ce qu'il veut trouver. Les traitements se decoupent en deux phases principales. La premiere etape, de bas niveau, est basee sur l'analyse multiresolution des proprietes geometriques des contours des regions. Elle permet une selection rapide des zones d'interet et aboutit a une esquisse de structuration physique du document. La deuxieme etape, de plus haut niveau, exploite les caracteristiques macroscopiques des textes liees a des conventions typographiques standards (disposition et frequence d'apparition des lettres, police, graisse, langue. . . ), mais egalement significatives d'une volonte du redacteur. Elle permet une premiere classification des differents types de fontes des blocs de texte. Elle constitue une amelioration des procedures de bas niveau en ajoutant une information de texture a la base de la reconnaissance des blocs. Nous proposons finalement une phase de validation de ces travaux realisee a partir de la prise de mesures oculometriques experimentales (sur des observateurs humains).