Auteurs
Résumé
Il est reconnu que le contexte joue un rôle important en recherche d’information (RI). Or, très peu de systèmes opérationnels le considèrent. Dans cet article, nous considérons un des aspects du contexte u le domaine d’intérêt de l’usager. Nous caractérisons un domaine d’intérêt par un ensemble de documents. Nous utilisons une approche de modélisation de langue statistique pour établir un modèle de langue du domaine. Ce modèle est utilisé de trois façons : pour étendre la requête initiale, pour réordonner les documents retrouvés, et pour exploiter les relations lexicales spécifiques au domaine. Nos expériences montrent que nos modèles, qui tiennent compte du contexte, surpassent en performance le modèle traditionnel. Ces expérimentations montrent que le contexte doit être pris en compte si on veut améliorer la performance des systèmes de RI actuels.
Abstract
It is recognized that context plays a crucial role in information retrieval (IR). However, few operational systems take it into account. In this paper, we consider one of the important aspects of the context u the domain of interest of the user. We assume that each domain can be characterized by a set of documents. This latter is used to build a statistical language model, which is then integrated in three different ways: to expand the original query model, to re-rank the retrieved documents and to extract lexical dependencies of the domain. Our experiments show that our contextual approaches improve significantly the retrieval performance compared to the basic approach, which does not consider context. These experiments provide evidence that context should be taken into account to further improve the effectiveness of current IR systems.