Accès par le contenu aux documents manuscrits d'archives numérisés

Cet article presente l’acces par le contenu aux documents d’archives manuscrits. Cet acces doit s’appuyer sur des informations (annotations) associees aux images de documents. Nous proposons deux manieres complementaires de produire ces annotations: automatiquement en utilisant la reconnaissance de documents, et collectivement sur internet par une saisie manuelle effectuee par les lecteurs eux-memes. Une plate-forme de gestion de ces annotations est presentee, ainsi que des exemples d’annotations automatiques sur des registres paroissiaux et d’etat civil, des formulaires militaires (registres matricules) et des decrets de naturalisation, en utilisant une methode generique de reconnaissance de documents. Cette methode a ete valide sur plus de 60 000 pages de documents. Des exemples d’annotations collectives construites sur des annotations automatiques sont donnes.

[1]  Frank Lebourgeois,et al.  Networking digital document images , 2001, Proceedings of Sixth International Conference on Document Analysis and Recognition.

[2]  Denyse Baillargeon,et al.  Bibliographie , 1929 .

[3]  Jean Camillerapp,et al.  Une méthode générique de rétroconversion de documents pour la constitution de dossiers numériques , 2002, Document Numérique.

[4]  Wen Gao,et al.  A robust method for unknown forms analysis , 1999, Proceedings of the Fifth International Conference on Document Analysis and Recognition. ICDAR '99 (Cat. No.PR00318).

[5]  Bertrand Coüasnon,et al.  Using a Grammar for a Reliable Full Score Recognition System , 1995, ICMC.

[6]  C. Brisset Using Logic Programming Languages For Optical Music Recognition , 1995 .

[7]  Bertrand Coüasnon,et al.  Using a Generic Document Recognition Method for Mathematical Formulae Recognition , 2001, GREC.

[8]  Jean Camillerapp,et al.  A way to separate knowledge from program in structured document analysis: application to optical music recognition , 1995, Proceedings of 3rd International Conference on Document Analysis and Recognition.

[9]  Panos Constantopoulos,et al.  Research and Advanced Technology for Digital Libraries , 2001, Lecture Notes in Computer Science.

[10]  Bertrand Coüasnon DMOS: a generic document recognition method, application to an automatic generator of musical scores, mathematical formulae and table structures recognition systems , 2001, Proceedings of Sixth International Conference on Document Analysis and Recognition.

[11]  Bertrand Coüasnon,et al.  A Symbol Classifier Able to Reject Wrong Shapes for Document Recognition Systems , 1999, GREC.

[12]  Robert Wilensky,et al.  Multivalent Annotations , 1997, ECDL.

[13]  Eric Prud'hommeaux,et al.  Annotea: an open RDF infrastructure for shared Web annotations , 2002, Comput. Networks.

[14]  Jane Hunter,et al.  An Indexing and Querying System for Online Images Based on the PNG Format and Embedded Metadata , 1999 .

[15]  Daniel P. Lopresti,et al.  A Tabular Survey of Automated Table Processing , 1999, GREC.

[16]  V. Poulain D'andecy,et al.  Analyse de partitions musicales , 1995 .