ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2012
PDF

Auteurs

Bo Li 0012, Éric Gaussier

Résumé

Nous présentons dans cet article plusieurs extensions multilingues des modèles d’infor- mation, en particulier le modèle log-logistique (LL) et le modèle Smoothed Power Law (SPL), récemment introduits en recherche d’information (Clinchant et al., 2010). Ces extensions sont fondées sur (a) une généralisation de la notion d’information utilisée dans ces modèles, (b) une généralisation des variables aléatoires utilisées et (c) une expansion de la requête utilisant l’en- semble des traductions de chaque mot. Nous analysons ensuite ces extensions d’un point de vue théorique, par l’intermédiaire d’une condition que doivent satisfaire les systèmes de recherche d’information multilingue. Cette nouvelle condition permet d’étendre le champ de l’approche axiomatique de la recherche d’information au cadre multilingue. Les résultats expérimentaux, obtenus sur trois collections et trois couples de langue, sont en accord avec l’analyse théo- rique et montrent que le modèle LL fournit les meilleurs résultats en recherche d’information multilingue.

Abstract

We present in this paper well-founded cross-language extensions of the recently in- troduced models in the information-based family for information retrieval, namely the LL (log- logistic) and SPL (smoothed power law) models of (Clinchant et al., 2010). These extensions are based on (a) a generalization of the notion of information used in the information-based family, (b) a generalization of the random variables also used in this family, and (c) the di- rect expansion of query terms with their translations. We then review these extensions from a theoretical point-of-view, prior to assessing them experimentally. The results of the experi- mental comparisons between these extensions and existing CLIR systems, on three collections and three language pairs, reveal that the cross-language extension of the LL model provides a state-of-the-art CLIR system, yielding the best performance overall.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.