ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de SDNRI 2014
PDF

Auteurs

Philippe Mulhem, Jean-Pierre Chevallet

Résumé

Cet article fait un retour sur l’un des éléments majeurs d’un système de recherche d’information : la correspondance basée sur des fichiers inverses car le passage d’une formule théorique à une implantation compatible avec des fichiers inverse est rarement explicitée dans les publications. Nous proposons ici de définir plus formellement l’expression d’une formule de correspondance compatible avec des fichiers inverses. Nous proposons deux niveaux de com- patibilité. Nous étudions les modèles les plus classiques en vérifiant leur compatibilité avec les fichiers inverses. Nous explorons la traduction d’une correspondance de Jensen-Shannon, initialement non-compatible avec les fichiers inverses, vers deux formules compatibles avec les fichiers inverses à chaque niveau. Une expérimentation simple, sur un corpus d’images, montre que la classique Divergence de Kullback-Leibler obtient des résultats moins bons que la Diver- gence de Jensen-Shannon compatible avec des fichiers inverses.

Abstract

This article focuses on one of the major elements of an information retrieval system: the matching function based on inverted files. In existing papers, the transition from a theoretical formula for implantation files compatible with the reverse is rarely explained. We define here formally what makes a matching function in IR compatible with inverted files. We define two levels of compatibility. We study classical matching functions and assess their inverted files compatibilities. We explore then the rewriting of the Jensen-Shannon divergence, initially not compatible with inverted files, into two inverted file compatible expressions. An experiment on an image corpus shows that the classical Kullback-Leibler divergence underperforms the Jensen-Shannon divergence compatible with inverted files.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.