Auteurs
Résumé
S’appuyant sur la Cluster Hypothesis, qui stipule que les documents pertinents à une requête tendent à être plus proches les uns des autres que des documents non pertinents, la plupart des systèmes de recherche d’information réalisant une catégorisation de leurs ré- sultats visent à regrouper l’ensemble des documents pertinents dans un même groupe. Nous proposons ici, par la mise en place de nouvelles mesures d’évaluation, de reconsidérer les bé- néfices résultant d’une telle concentration de l’information pertinente. Contrairement à ce qui est habituellement admis, nous montrons finalement que des systèmes réalisant une distribu- tion de l’information pertinente peuvent s’avérer au moins aussi intéressants pour l’utilisa- teur que des systèmes regroupant l’ensemble des documents pertinents dans un cluster unique.
Abstract
Relying on the Cluster Hypothesis, which states that relevant documents tend to be more similar one to each other than to non-relevant ones, most of information retrieval systems producing search results as a set of clusters seek to gather all relevant documents in the same cluster. We propose here, by the settlement of new evaluation measures, to reconsider the benefits of the entailed concentration of the relevant information. Contrary to what is commonly admitted, we finally show that systems realizing a distribution of the relevant information may be at least as useful for the user as systems gathering all relevant documents in a single group.