Auteurs
Résumé
La croissance continuelle et exponentielle des volumes d’information numérique affecte principalement des domaines comme celui de la Recherche d’Information (RI). Toutefois, peu de travaux en RI ont jusqu’alors abordé les questions d’efficience et d’efficacité des sys- tèmes de RI dans le contexte du passage à l’échelle dans la taille des corpus. Face à la masse grandissante d’information, il est préférable du point de vue de l’utilisateur moyen que les documents retournés soient classés par ordre de pertinence décroissante ; ce qui implique de prendre en compte de multiples niveaux de pertinence pour les documents. Nous établissons un lien entre ces deux pans de la RI (pertinence multivaluée et passage à l’échelle) et nous étu- dions des protocoles pouvant permettre d’évaluer l’abilité des systèmes de RI à retourner les documents de meilleur niveau de pertinence en tête des résultats quand la masse d’information croît.
Abstract
Nowadays, many factors support a growing production of information. In modern large environments, for the user’s point of view, it is desirable to have IRS that retrieve docu- ments according to their relevance levels. Relevance levels have been studied in some previous IR works while some others (few) IR research works tackled the questions of IRS effectiveness and collections size. These latter works used standard IR measures on collections of increasing size to analyze IRS effectiveness scalability. In this work, we bring together these two issues in IR (multigraded relevance and scalability) by designing some new metrics for evaluating the ability of IRS to rank documents according to their relevance levels when collection size increases.