5 - Structuration de documents par repérage de zones d'intérêt

Cette etude presente une nouvelle approche de la structuration de documents imprimes basee sur l'exploitation de la dynamique du regard dans le reperage de l'information. Le systeme qui a ete mis en place nous permet d'obtenir une representation du document segmente en faisant appel a des procedures d'extraction de primitives geometriques simples (traitements de bas niveau) relevant de la prise en compte de certains comportements caracteristiques chez l'homme dans l'extraction d'information. Il utilise une serie de representations de type multiresolution du document ou la nature du sous-echantillonnage est une fonction de la position du regard. Cette approche est basee sur la recherche des zones de focalisation de l'attention permettant de conserver une description precise des elements dans les zones de fixation, tout en resumant les regions presentant un « interet » moindre. La simulation du parcours de l'oeil sur le document que nous avons retenue traduit la segmentation que ferait un lecteur qui aborde le document sans a priori sur ce qu'il veut trouver. Pour cela, nous nous sommes inspires d'une strategie exploratoire particuliere : le survol. Celle-ci s'appuie essentiellement sur l'aspect visuel du document, c'est-a-dire sur les caracteristiques visuelles de bas niveau de l'image. Elle permet en outre une perception equilibree des donnees en privilegiant l'organisation globale du document. La technique mise en oeuvre s'appuie sur un partitionnement evolutif de l'espace, en zones centrees aux points de fixation successifs. C'est sur la base de ce partitionnement, que la description des differentes regions ciblees du document evolue et converge vers une representation segmentee.

[1]  Friedrich M. Wahl,et al.  Document Analysis System , 1982, IBM J. Res. Dev..

[2]  Richard M. Stern,et al.  Fast Computation of the Difference of Low-Pass Transform , 1984, IEEE Transactions on Pattern Analysis and Machine Intelligence.

[3]  J.-M. Ogier,et al.  Interprétation de document par cycles perceptifs de construction d'objets cohérents. Application aux données cadastrales , 1995 .

[4]  Henry S. Baird,et al.  Image segmentation by shape-directed covers , 1990, [1990] Proceedings. 10th International Conference on Pattern Recognition.

[5]  Martin D. Levine,et al.  Visual information processing in primate cone pathways. I. A model , 1996, IEEE Trans. Syst. Man Cybern. Part B.

[6]  Lawrence O'Gorman,et al.  The Document Spectrum for Page Layout Analysis , 1993, IEEE Trans. Pattern Anal. Mach. Intell..

[7]  Likforman-Sulem,et al.  02 - Une méthode de résolution des conflits d'alignements pour la segmentation des documents manuscrits , 1995 .

[8]  Haruo Asada,et al.  Major components of a complete text reading system , 1992 .

[9]  Ching Y. Suen,et al.  Document structures: A survey , 1993, Proceedings of 2nd International Conference on Document Analysis and Recognition (ICDAR '93).

[10]  Kazuhiko Yamamoto,et al.  Structured Document Image Analysis , 1992, Springer Berlin Heidelberg.

[11]  Axel Pinz,et al.  Layout and analysis: Finding text, titles, and photos in digital images of newspaper pages , 1993, Proceedings of 2nd International Conference on Document Analysis and Recognition (ICDAR '93).

[12]  Rangachar Kasturi,et al.  A Robust Algorithm for Text String Separation from Mixed Text/Graphics Images , 1988, IEEE Trans. Pattern Anal. Mach. Intell..

[13]  E. V. Krishnamurthy,et al.  On the compactness of subsets of digital pictures , 1978 .