ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de SDNRI 2014
PDF

Auteurs

Mohannad Almasri, Catherine Berrut, Jean-Pierre Chevallet

Résumé

Cet article aborde le problème des requêtes courtes et précises, qui n’ont pas suffisamment d’informations pour être non ambigües. Le pseudo-relevance feedback (PRF) est une technique efficace pour améliorer la performance de ces requêtes courtes par l’ajout de termes `a la requ^ete. Cependant, cette méthode ne récupère que les termes des documents les plus pertinents de la collection. Si les réponses initiales ne sont pas correctes, comme c’est le cas pour des requêtes courtes, cette expansion ne fonctionnera pas. Par cons´equent, nous présentons à la place du PRF, une méthode d’expansion sémantique des requêtes basée sur Wikipedia. Nous étendons requêtes courtes par des termes sémantiquement liés. Nous adaptons les modèles de langue pour évaluer les requêtes étendues. Les expérimentations sur une corpus CLEF du patrimoine culturel montrent une am´elioration significative de la performance. Nous montrons que le nombre de termes d’expansion a un impact important sur l’amélioration de la précision.

Abstract

This paper deals with the short and precise queries problem. Short and precise queries do not have sufficient information to be non ambiguous. Pseudo-relevance feedback (PRF) is an effective technique to improve retrieval performance by expanding a user query. However, this collection based expansion method does not work well in the case of short queries. Therefore, we present instead of PRF, a semantic query expansion method based on Wikipedia as external knowledge. We expand short queries by semantically related terms extracted from Wikipedia. We propose and study the effectiveness of three variations for expansion terms se- lection. We incorporate the expansion terms into the original query and adapt language models to evaluate the expanded queries. Experiments on CLEF cultural heritage corpora show signif- icant improvement in the retrieval performance. We show that the number of expansion terms has an important impact on the precision improvement.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.