ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de SDNRI 2014
PDF

Auteurs

Bissan Audeh, Philippe Beaune, Michel Beigbeder

Résumé

Les requêtes exploratoires du Web sont souvent courtes et ambigües. De plus, l’utilisation des entités nommées dans ce type de requêtes est fréquente. Dans cet article, nous explorons l’expansion des requêtes exploratoires par l’ajout de termes appartenant aux concepts de la requête. Nous distinguons deux types de concepts : explicites, correspondants aux enti- tés nommées ayants des références aux concepts de l’ontologie YAGO, et implicites que nous trouvons à l’aide de l’approche LSI (Indexation par la sémantique latente) sur les documents de retour de pertinence. Nous proposons une modélisation hybride qui permet d’intégrer les termes d’expansion extraits de ces deux types de concepts dans la requête. Nos expériences sur une collection issue du Web (WT10G) montrent que notre approche améliore significative- ment un modèle de base sans expansion, et elle a une meilleur performance qu’une approche classique de retour de pertinence.

Abstract

Explorative web queries are often short and ambiguous. In addition, using named entities in this type of queries is well-known and frequent. In this paper, we explore query reformulation for adding terms belonging to query concepts. We distinguish two types of concepts: explicits ones that correspond to named entities having references to concepts in the Yago on- tology, and implicit ones that we discover using Latent Semantic Indexing technique on pseudo relevance feedback documents. We propose a hybrid model that integrates terms extracted from these two types of concepts with the original query. Our experiences on a standard web collec- tion (WT10G) show that our approach significantly improves a baseline with no expansion and performs better than a classical expansion approach based on pseudo relevance feedback.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.