Apport du traitement des images à la numérisation des documents manuscrits anciens

Le traitement des images est une etape incontournable de la numerisation des manuscrits anciens. Les traitements presentes ici permettent de restaurer ou nettoyer les images, d’extraire les differentes structures du document (illustrations, elements graphiques et textuels, lignes de texte) et dans certains cas de reconnaitre les symboles textuels ou musicaux presents dans l’image. Nous decrivons ces differents traitements suivant leur niveau: pretraitement, segmentation, analyse et reconnaissance ainsi que les techniques de base qui y sont associees. Nous illustrons quelques-unes de ces techniques sur des images de manuscrits anciens (lettres de remission du XVIe siecle).

[1]  Denyse Baillargeon,et al.  Bibliographie , 1929 .

[2]  Laurent Robert,et al.  Image and text coupling for creating electronic books from manuscripts , 1997, Proceedings of the Fourth International Conference on Document Analysis and Recognition.

[3]  Lsabel Granado,et al.  Extraction de texte et de figures dans les livres anciens à l'aide de la morphologie mathématique , 2000 .

[4]  L. Truffet The Frechet Contingency Array Problem is Max-Plus Linear , 2009, 0904.2244.

[5]  Sylvie Calabretto,et al.  BAMBI : système de gestion de manuscrits anciens pour historiens , 1998 .

[6]  Chew Lim Tan,et al.  Restoration of Archival Documents Using a Wavelet Technique , 2002, IEEE Trans. Pattern Anal. Mach. Intell..

[7]  Laurent Robert,et al.  Edition hypertextuelle et consultation de manuscrits , 1997 .

[8]  Yann LeCun,et al.  Djvu: Un systeme de compression d'images pour la distribution reticulaire de documents numerises (Djvu: An image compression system for distributing scanned document on the internet) , 2000 .

[9]  Rafael Dueire Lins,et al.  An environment for processing images of historical documents , 1994, Microprocess. Microprogramming.

[10]  Laurence Likforman-Sulem,et al.  A Hough based algorithm for extracting text lines in handwritten documents , 1995, Proceedings of 3rd International Conference on Document Analysis and Recognition.

[11]  Eric Bruillard Hypertextes et Hypermédias, réalisation, outils et méthodes , 1995 .

[12]  Jean Camillerapp,et al.  A robust detector for music staves , 1993, Proceedings of 2nd International Conference on Document Analysis and Recognition (ICDAR '93).

[13]  João Rogério Caldas Pinto,et al.  Ancient Music Recovery for Digital Libraries , 2000, ECDL.

[14]  Klaus D. Tönnies,et al.  Line detection and segmentation in historical church registers , 2001, Proceedings of Sixth International Conference on Document Analysis and Recognition.

[15]  Michele Mengucci,et al.  Morphological Segmentation of Text and Figures in Renaissance Books (XVI Century) , 2000, ISMM.