ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de SDNRI 2014
PDF

Auteurs

Olivier Augereau, Nicholas Journet, Jean-Philippe Domenger

Résumé

La contribution principale de cet article est de proposer une nouvelle méthode de clas- sification des images de documents combinant les caractéristiques textuelles visuelles extraites respectivement avec les techniques des sacs de mots (BoW) et sacs de mots visuels (BoVW). Alors que les tentatives classiques de combinaison telles que celles basées sur le ‘Borda-Count’ aboutissent à des résultats décevants, nous proposons ici une combinaison par apprentissage. Les expériences de cet article ont été réalisées sur une base de données industrielles de 1925 images de document. Ces tests révèlent que la combinaison des information améliore signi- ficativement les performances de classification. Notre contribution finale est une discussion concernant les réglages des BoW et BoVW dans un contexte industriel.

Abstract

The main contribution of this paper is a new method for classifying document images by combining textual and visual features repectively extracted with the Bag of Words (BoW) and the Bag of Visual Words (BoVW) techniques. While previous attempts have been showing disappointing results by combining visual and textual features with the Borda-count technique, we’re proposing here a combination through learning approach. The other contribution of this paper are the experiments conducted on a 1925 document image industrial database revealing that this fusion scheme significantly improves the classification performances. Our concluding contribution deals with the choosing and tuning BoW/BoVW techniques in an industrial context.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.