Auteurs
Résumé
On présente dans ce papier une approche analytique multi-échelle pour le word spotting dans les documents manuscrits. Le modèle proposé comporte deux niveaux. D’abord, un module de filtrage global permettant de définir des zones candidates répondant à la requête dans le document testé. Ensuite, l’échelle de l’observation est modifiée à un niveau plus fin afin d’affiner les résultats et de sélectionner uniquement ceux qui sont vraiment pertinents. Le présent article se focalise sur la première étape de la méthode. Les contributions de cet article sont l’utilisation et l’adaptation des caractéristiques pseudo-Haar dans le word spotting. De plus, une technique permettant de modéliser les requêtes sélectionnées par l’utilisateur à partir d’un clavier est proposée. Notre méthode ne nécessite pas la segmentation préalable du document en ligne et mots. L’approche est évaluée sur la base de données publique George Washington.
Abstract
This paper addresses the problem of word spotting in handwritten documents. We propose a coarse-to-fine segmentation free approach. This approach is based on two filtering phases, which are a global filtering followed by a local filtering after changing the observation scale. The contribution of this work is the use and the adaptation of the Haar-like-features in word spotting task for each tested document and the introduction of a new technique permits modelling queries typed by the user. The approach is evaluated using the George Washington manuscripts database.