ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA-TALN 2018
PDF

Auteurs

Gilles Hubert, Yoann Pitarch, Karen Pinel-Sauvagnat, Ronan Tournier, Léa Laporte

Résumé

De nombreuses approches supervisées utilisant les caractéristiques des documents ont été proposées pour l’ordonnancement de documents. Un inconvénient est qu’elles requièrent une phase d’apprentissage. Dans cet article, nous proposons TournaRank, une approche non supervisée d’ordonnancement de documents inspirée des compétitions sportives. Les documents sont représentés par un ensemble de caractéristiques et s’affrontent lors de tournois. Un tournoi est vu comme une séquence de matchs au cours desquels deux documents s’affrontent sur la base des valeurs de leurs caractéristiques. À l’issue du tournoi, les documents sont ordonnés dans l’ordre décroissant des scores obtenus durant le tournoi. Notre approche est entièrement paramétrable (type de tournoi, règle des matchs, etc). Nous présentons les résultats de notre approche sur trois collections (Robust2004, Web2014, LETOR3.0) et la comparons à différentes approches de l’état de l’art en Learning to Rank et fusion des résultats. Cet article est une version résumée de (Hubert et al., 2018).

Abstract

Numerous supervised ranking models based on document features have been proposed in Information Retrieval. Such models require a learning phase. We propose TournaRank, an unsupervised approach inspired by sport competition principles. Documents compete against each other in tournaments using features as evidences of relevance. Tournaments consist of sequences of matches, which involve pairs of documents playing in turn their features. Once a tournament is ended, documents are ranked according to their scores obtained during the tournament. This principle is generic and flexible since it can be applied to any collection type and different variants can be considered (the tournament type, the match rules, etc). TournaRank was evaluated on three collections (TREC Robust2004, Web2014, and LETOR3.0) and compare to various state-of-the-art Learning to Rank and fusion approaches.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.