ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2012
PDF

Auteurs

Van Cuong Kieu

Résumé

Cet article présente un logiciel de génération d’images semi-synthétiques de documents anciens et de la vérité terrain associée. Ce travail s’inscrit dans le cadre de la génération de données pour l’évaluation de performances d’algorithmes d’analyse d’images de documents. Ce logiciel permet à un utilisateur de spécifier le contenu et la mise en page des images à générer (choix des fontes, illustrations, interlignes). Plusieurs modèles de dégradations ont été intégrés dans ce logiciel. Il est ainsi possible de générer des images contenant les défauts les plus couramment observés dans les ouvrages anciens (transparence, dégradation des carac- tères et pliures d’une page). En générant une grande variété de documents, il est ainsi possible d’évaluer la robustesse d’un algorithme vis-à-vis de ces dégradations.

Abstract

This paper presents a software dedicated to semisynthetic old document image gener- ation and its associated ground truth. This work is thus part of the data generation for document processing algorithm performance evaluation. This software allows a user to specify the content and layout of images to generate (fonts, illustrations, line spacing). Several degradation models were incorporated into the software. It is thus possible to generate images containing defects most commonly seen in old books (ink transparency, character degradation). By generating a huge variety of documents, it is possible to assess the robustness of an algorithm according to these degradations.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.