Le traitement des images au service du document patrimonial. Vers une pluridisciplinarité

Le domaine du document est une science a part entiere nee dans les annees 80, en meme temps que le traitement des images, dont l'enjeu est l'extraction des informations constitutives du document dans un but de dematerialisation. Pour cela, les methodes qui sont generalement utilisees fonctionnent au niveau du pixel, et sont, par consequent, relativement vulnerables aux moindres variations (presence de bruit residuel dans les images, nombre de couleurs utilisees...). A l'oppose, le traitement des images, beaucoup plus generaliste, propose sans cesse de nouveaux outils destines a fonctionner sur des images de nature tres variee (images medicales, satellitaires, video...), possedant donc des proprietes tres differentes. L'idee de cet article est donc de renforcer les liens entre ces deux univers, en montrant, sur quelques exemples precis au niveau du caractere, que l'application de techniques classiques en traitement d'image (comme les contours actifs ou les filtres de Gabor) peut apporter des solutions reelles aux problemes poses par le traitement du document.

[1]  Peter E. Hart,et al.  Image continuation , 1993, Proceedings of 2nd International Conference on Document Analysis and Recognition (ICDAR '93).

[2]  B. S. Manjunath,et al.  Texture Features for Browsing and Retrieval of Image Data , 1996, IEEE Trans. Pattern Anal. Mach. Intell..

[3]  Anil K. Jain,et al.  Unsupervised texture segmentation using Gabor filters , 1990, 1990 IEEE International Conference on Systems, Man, and Cybernetics Conference Proceedings.

[4]  Hong Yan,et al.  Linking broken character borders with variable sized masks to improve recognition , 1996, Pattern Recognit..

[5]  Denyse Baillargeon,et al.  Bibliographie , 1929 .

[6]  Jerry L. Prince,et al.  Gradient vector flow: a new external force for snakes , 1997, Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition.

[7]  Hubert Emptoz,et al.  Texture feature characterization for logical pre-labeling , 2003, Seventh International Conference on Document Analysis and Recognition, 2003. Proceedings..

[8]  Tieniu Tan,et al.  Font Recognition Based on Global Texture Analysis , 2001, IEEE Trans. Pattern Anal. Mach. Intell..

[9]  Edward M. Riseman,et al.  Finding text in images , 1997, DL '97.

[10]  Peter C. Cheeseman,et al.  Bayesian Classification (AutoClass): Theory and Results , 1996, Advances in Knowledge Discovery and Data Mining.

[11]  Hubert Emptoz,et al.  Degraded character image restoration using active contours: a first approach , 2002, DocEng '02.

[12]  Anil K. Jain,et al.  Unsupervised texture segmentation using Gabor filters , 1990, 1990 IEEE International Conference on Systems, Man, and Cybernetics Conference Proceedings.

[13]  Laurent D. Cohen,et al.  On active contour models and balloons , 1991, CVGIP Image Underst..

[14]  Hubert Emptoz,et al.  Character Prototyping in Document Images Using Gabor Filters , 2003, SCIA.

[15]  Anil K. Jain,et al.  On texture in document images , 1992, Proceedings 1992 IEEE Computer Society Conference on Computer Vision and Pattern Recognition.