Fusion multimodale image/texte par réseaux de neurones profonds pour la classification de documents imprimés.

01-01-0001

Actes de CORIA-TALN 2018

PDF

Auteurs

Thibault Magallon, Frédéric Béchet, Benoît Favre

Résumé

La classification de documents imprimés est une tâche réalisée en entrée de multiples chaînes de traitement et d’analyse d’archives numériques, ce qui en fait un point critique dans de tel systèmes. Afin d’extraire des éléments caractéristiques de chaque catégorie parmi lesquels ces pièces doivent être classés, des données textuelles ou des images sont utilisés. Nous présentons dans cet article une analyse de différentes approches pour la catégorisation de documents exploitant des données textuelles ou des images en entrée, ainsi qu’un système de classification utilisant l’information du texte et de l’image de façon jointe en un modèle de réseau de neurone convolutionnel.

Abstract

Document classification is an important task in the analysis and processing of digital collections as it is mainly used for input pipeline of such systems. To extract features allowing algorithms to categorize the elements, text and pictures are used. We present in this paper different approaches for document classification using textual datas and pictures, as well as a classification model using both of this datas in single model of convolution neural network.

Posts Récents

Premier appel à communication - CORIA 2024

13-12-2023

Journée accès à l’information (GDR TAL)

21-09-2022

Conférence CIRCLE 2022

24-01-2022

Conférence CORIA/RJCRI 2021

01-01-2021

Groupe de lecture ARIA

06-11-2020

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.