ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2009
PDF

Auteurs

M'hamed Mataoui, Mohamed Mezghiche

Résumé

Dans cet article nous présentons deux adaptations de l’algorithme PageRank aux collections de documents XML et les résultats d’expérimentation obtenus pour la collection Wikipedia utilisée dans INEX 2007. Ces adaptations que nous appelons ‘DOCRANK’ et ‘HITS_docrank’ permettent un reclassement des résultats renvoyés par l’exécution de base (base run) pour en améliorer la qualité. Nos expérimentations sont effectuées sur les résultats renvoyés par les trois systèmes les mieux classés pour la tâche ‘Focused’ d’INEX 2007. Les évaluations que nous avons menés ont montrés des améliorations de la qualité des résultats (voir très significatives pour certaines ’topics’, ex : 491, 521, etc.). La meilleure amélioration obtenue pour les résultats renvoyés par le système de l’université DALIAN (pour l’ensemble des 107 topics d’INEX 2007) était de l’ordre de 3.78%.

Abstract

In this paper we present two adaptations of the PageRank algorithm to collections of XML documents and the experimental results obtained for the collection Wikipedia used in INEX 2007. Those adaptations that we call ‘DOCRANK and HITS_docrank’ allow the re- rank of the results returned by the base run execution to improve retrieval quality. Our experiments are applied on the results returned by the best three systems ranked in the ‘Focused’ task of INEX 2007. Evaluations have shown improvements in the quality of retrieval results (improvement of some topics is very significant, eg: 491, 521, etc.). The best improvement achieved in the results returned by the DALIAN university system (all 107 topics of INEX 2007) was about 3.78%.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.