Auteurs
Résumé
Dans des applications de recherche documentaire, il est souvent utile d’avoir une me- sure de confiance dans l’ensemble de document trouvés, afin de pouvoir proposer un traitement spécifique (automatique ou interactif) des requêtes particulièrement difficiles, ou encore sim- plement avertir l’utilisateur de la faible fiabilité de l’information proposée. Pour cela, nous avons analysé différents indicateurs potentiels de performance de recherche par rapport aux requêtes données. Cet article se concentre sur les scores utilisés par différent types de systèmes de recherche documentaire pour le classement relatif des documents, et leur utilisation comme estimateurs absolus de performance. Nous allons montrer que, malgré une forte variation entre les scores fournis par différents systèmes, un grand nombre de ceux-ci peut effectivement être utilisé pour prédire la précision globale d’un ensemble de documents trouvés pour une requête.
Abstract
In document retrieval it is often useful to have a measure of confidence in the retrieved document set in order to allow for specific treatment of particularly difficult queries, or simply alert the user to the low reliability of the information offered by the system. We have analyzed a number of potential retrieval performance indicators. This article concentrates on the scores used by different types of document retrieval systems for the relative ranking of documents for a given query, and their use as estimators of absolute retrieval performance. We will show that, despite a great variability among the scores used by different systems, an important number of these can effectively be used in order to predict the overall precision of a set of retrieved documents for a query.