Étude comparative de trois ensembles de descripteurs de texture pour la segmentation de documents anciens.

01-01-0001

Actes de SDNRI 2014

PDF

Auteurs

Maroua Mehri, Mohamed Mhiri, Pierre Héroux, Petra Gomez-Krämer, Mohamed Ali Mahjoub, Rémy Mullot

Résumé

Récemment, des approches basées sur l’analyse des descripteurs de texture ont été largement explorées pour la segmentation d’images de documents anciens numérisés. Il a été prouvé que ces méthodes fonctionnent efficacement en n’ayant pas de connaissances préalables. En outre, il a été démontré qu’elles sont robustes lorsqu’elles sont appliquées sur des documents dégradés ou bruités. Dans cet article, une approche d’évaluation de trois différents ensembles de descripteurs texturaux est présentée pour la segmentation de documents anciens. Sur un vaste corpus expérimental de documents anciens, nous visons tout d’abord à déterminer quels descripteurs de texture pourraient être les mieux appropriés pour séparer les illustrations des régions textuelles d’une part et d’autre part pour discriminer les blocs du texte de différentes tailles et polices de caractères. C’est dans ce but que nous étudions différents descripteurs de texture, extraits de trois outils du traitement d’image, les plus répandus et largement utilisés (la fonction d’auto-corrélation, les matrices de co-occurrence des niveaux de gris et les filtres de Gabor). Un aperçu sur le temps de calcul et la complexité de chaque ensemble de descripteurs de texture est également présenté dans ce travail. Sur une base d’images de plus de 300 docu- ments, une étude expérimentale avec des observations qualitatives et numériques, est proposée pour montrer les performances de chaque ensemble de descripteurs de texture.

Abstract

Recently, texture-based features have been used for digitized historical document image segmentation. It has been proven that these methods work effectively with no a priori knowledge. Moreover, it has been shown that they are robust when they are applied on degraded documents under different noise levels and kinds. In this paper an approach of evaluating texture-based feature sets for segmenting historical documents is presented in order to compare

Posts Récents

Premier appel à communication - CORIA 2024

13-12-2023

Journée accès à l’information (GDR TAL)

21-09-2022

Conférence CIRCLE 2022

24-01-2022

Conférence CORIA/RJCRI 2021

01-01-2021

Groupe de lecture ARIA

06-11-2020

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.