Auteurs
Résumé
Dans cet article nous présentons une nouvelle technique de reformulation de requête. Cette technique considère la requête comme un ensemble de termes composés et un ensemble de termes simples. Pour déterminer les termes d’expansion on additionne les poids des relations d’un terme candidat avec chacun des termes de la requête (simple, composé). Un terme candidat est choisi s’il est fortement en relation avec la plupart des termes de la requête. Cette technique est modélisée dans le cadre de modèle de langue. Les tests effectués sur deux collections TREC ont montré des améliorations par rapport à deux modèles: le modèle uni-gramme et le modèle d’expansion de requêtes basé sur la mesure Kullback- Leibler Divergence (KLD).
Abstract
In this paper we present a new technique for query expansion. This technique considers the query as a set of compound terms and a set of simple terms. To determine the expansion terms we add the weight of a term relationships with each of the candidate query terms (simple, compound). A candidate term is selected if it is strongly related with most query terms. This technique is modeled in the context of the language model. Tests on two TREC collections showed improvements compared to the uni-gram model and KLD expansion model.