Estimation du paramètre de collection des modèles d'information pour la RI.

Parantapa Goswami, Éric Gaussier

CORIA 2013 - Conférence en Recherche d'Informations et Applications - 10th French Information Retrieval Conference, Neuchâtel, Suisse, April 3-5, 2013.


RÉSUMÉ. Nous explorons dans cet article plusieurs méthodes permettant, a priori, d'estimer le paramètre de collection des modèles d'information. Jusqu'à présent, ce paramètre a était fixé au nombre moyen de documents dans lesquels un mot donné apparaissait. Nous présentons ici plusieurs méthodes d'estimation de ce paramètre et montrons qu'il est possible d'améliorer les performances du système de recherche d'information lorsque ce paramètre est estimé de façon adéquate.

ABSTRACT. In this paper we explore various methods to estimate the collection parameter of the information based models for ad hoc information retrieval. In previous studies, this parameter was set to the average number of documents where the word under consideration appears. We introduce here a fully formalized estimation method for both the log-logistic and the smoothed power law models that leads to improved versions of these models in IR. Furthermore, we show that the previous setting of the collection parameter of the log-logistic model is a special case of the estimated value proposed here.

MOTS-CLÉS : Modèles de RI, modèles fondés sur l'information, estimation des paramètres.

KEYWORDS : IR models, information-based models, parameter estimation.


fichier Fichier

Identifiant : doi:10.24348/coria.2013.coria2013_82

Citation :

@inproceedings{coria/2013/coria2013_82,
author = {Parantapa Goswami and Éric Gaussier},
title = {Estimation du paramètre de collection des modèles d'information pour la RI.},
booktitle = {CORIA 2013 - Conférence en Recherche d'Informations et Applications - 10th French Information Retrieval Conference, Neuchâtel, Suisse, April 3-5, 2013.},
pages = {201-216},
year = {2013},
doi = {doi:10.24348/coria.2013.coria2013_82}
}