ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2012
PDF

Auteurs

Philippe Mulhem, Jean-Pierre Chevallet

Résumé

Cet article porte sur la recherche de parties de documents appelées doxels. Nous défi- nissons la notion de contexte documentaire d’un doxel, en utilisant deux éléments : 1) un lissage de type Dirichlet sur des doxels, et 2) une interprétation du contexte d’un doxel par des pro- pagations du contenu des autres doxels de contexte. Nous montrons que cette interprétation de contexte documentaire est exprimable par des combinaisons du contenu intrinsèque lissé et des contenus propagés, non lissés, des doxels. Cette expression est donc compatible avec des im- plantations à base de fichiers inverses. Nous avons étudié différentes propagations sur le corpus INEX 2009, en constatant systématiquement une forte augmentation des résultats en contexte, par rapport à une approche par modèle de langue de référence hors contexte.

Abstract

This article focuses on the retrieval of documents parts called doxels. We define the notion of documentary context of a doxel by exploring two elements: 1) a Dirichlet smoothing on doxels, and 2) interpretating the documentary context of a doxel by propagating the content of the context doxels. We show that this interpretation of documentary context can be expressed by a combination of the intrinsic content and the content, unsmoothed, of the context doxels. This expression is therefore compatible with inverted files implementation. We studied several propagations on the INEX corpus 2009, and we found a significant increase in systematic results using the documentary contexts, compared to a reference approach without context.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.