Auteurs
Résumé
Récemment, des approches basées sur l’analyse des descripteurs de texture ont été largement explorées pour la segmentation d’images de documents anciens numérisés. Il a été prouvé que ces méthodes fonctionnent efficacement en n’ayant pas de connaissances préalables. En outre, il a été démontré qu’elles sont robustes lorsqu’elles sont appliquées sur des documents dégradés ou bruités. Dans cet article, une approche d’évaluation de trois différents ensembles de descripteurs texturaux est présentée pour la segmentation de documents anciens. Sur un vaste corpus expérimental de documents anciens, nous visons tout d’abord à déterminer quels descripteurs de texture pourraient être les mieux appropriés pour séparer les illustrations des régions textuelles d’une part et d’autre part pour discriminer les blocs du texte de différentes tailles et polices de caractères. C’est dans ce but que nous étudions différents descripteurs de texture, extraits de trois outils du traitement d’image, les plus répandus et largement utilisés (la fonction d’auto-corrélation, les matrices de co-occurrence des niveaux de gris et les filtres de Gabor). Un aperçu sur le temps de calcul et la complexité de chaque ensemble de descripteurs de texture est également présenté dans ce travail. Sur une base d’images de plus de 300 docu- ments, une étude expérimentale avec des observations qualitatives et numériques, est proposée pour montrer les performances de chaque ensemble de descripteurs de texture.
Abstract
Recently, texture-based features have been used for digitized historical document image segmentation. It has been proven that these methods work effectively with no a priori knowledge. Moreover, it has been shown that they are robust when they are applied on degraded documents under different noise levels and kinds. In this paper an approach of evaluating texture-based feature sets for segmenting historical documents is presented in order to compare