Gestion D'hypothhses Pour La Reconnaissance Structurelle De Documents Hypothesis Management for Structured Document Recognition

RRsumm : Cet article ddcrit une approche originale pour identiier la structure spciique d'un document partir d'un moddle ggnnrique, dans un systtme base de blackboard appell graphein. Le systtme peut traiter diiirentes hypothhses de structuration et sa mmthodologie permet de prendre en compte le contexte structurel des documents. Le moddle est ddcrit l'aide d'un formalisme standard international (oda) qui caracttrise le contenu des diiirents objects et leurs subordinations. Le systtme adopte diiirentes strattgies de lecture l'aide des hypothhses extraites du moddle. Une mmthode descendante (guidde par le moddle) est appliquue lorsqu'une hypothhse est suusamment ssre, une mmthode mixte extrait d'abord des indices sur l'image avant de choisir une hypothhse, ou une mmthode entiirement ascendante (fusion) est active lorsque le moddle n'est pas directement utilisable. Le choix de la meilleure strattgie ddpend de l'analyse des hypothhses courantes. Abstract : This paper describes a new approach to identify the speciic structure of a document from a generic model by a blackboard based system called Graphein. The system deals with diierent hypotheses of structuration and its methodology permits to take into account the structural context of documents. The model is described with an international standard 1 formalism (oda) which characterizes the diierent constituent objects and their subordinates. The system adopts diierent reading strategies according to the hypotheses extracted from the model. A top-down method (guided by the model) is applied when an hypothesis is sure enoughh, a mixed method extracts clues from the image before applying one hypothesis, or a full bottom-up method (fusion process) is activated when the model is not directly usable. The choice of the best strategy to apply depends on the analysis of the current hypotheses.