ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2011
PDF

Auteurs

Emmanuel Navarro, Yannick Chudy, Bruno Gaume, Guillaume Cabanac, Karen Pinel-Sauvagnat

Résumé

Les Systèmes de Recherche d’Information structurent en général leurs résultats sous la forme d’une liste de documents. Nous pensons qu’il existe une structure plus riche dans ces résultats. En effet, la plupart des graphes obtenus à partir de données réelles (entre autre, les graphes de documents) partagent certaines propriétés structurelles, en particulier une organisation en communautés que nous proposons d’exploiter afin de mieux organiser l’ensemble des documents restitués pour une requête. Pour ce faire, l’ensemble des documents restitués est modélisé par un graphe biparti (Documents Termes) sur lequel est appliqué notre algorithme Kodex de détection de communautés. Cet article présente Kodex et son évaluation : sur la mesure F1, Kodex améliore significativement la baseline Okapi BM25 de 22 %.

Abstract

Information Retrieval Systems (IRS) generally display results as a list of documents. One may think that a deeper structure exists within results. This hypothesis is reinforced by the fact that most of the graphs produced from real data (e.g., graphs of documents) share some structural properties, and in particular a community structure. We propose to use these properties to better organize the set of returned documents for a query from a given IRS. For this purpose, the retrieved document set is modeled as a bipartite graph (Documents Terms) on which the Kodex community detection algorithm is applied. This paper presents Kodex and its evaluation : regarding F1 measure, Kodex overcomes baseline Okapi BM25 by 22%.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.