ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de SDNRI 2014
PDF

Auteurs

Nabil Ghanmi, Abdel Belaïd

Résumé

Nous abordons dans ces travaux, le problème de la segmentation de documents de cahiers de la chimie en zones homogènes. Les documents à traiter sont manuscrits sans contraintes composés de zones de textes, de tableaux et de graphiques, représentant l’expres- sion graphique de l’expérience réalisée. L’objectif de ce premier travail est d’extraire, dans chaque document, le bloc contenant le schéma graphique. Nous proposons une méthode d’ex- traction et de classification des structures élémentaires du document sur lesquels s’appuiera une technique de séparation verticale des blocs. Des descripteurs spécifiques tenant compte de la texture du texte et du graphique sont pris en compte. Des connaissances a priori sur la structure du document sont ensuite utilisées pour délimiter le bloc graphique. Les résultats ex- périmentaux obtenus sur une variété de documents de chimie sont de l’ordre de 92% de bonne extraction de graphique

Abstract

In this work, we address the problem of segmentation of chemistry documents in ho- mogeneous areas. The documents are handwritten, unconstrained and composed of text areas, tables and graphics representing the chemical formula. The goal of this first part is to extract, in each document, the block containing graphical drawings. We propose a method to extract and classify elementary structures of the document. A vertical separation of the blocks is then carried out. Specific descriptors taking into account the texture of the text and graphics are con- sidered. A priori knowledge about the document structure is then used to delimit the graphical block containing the chemical formula. Experiments results obtained on a variety of chemistry documents are around 92% of good graphic extraction

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.