ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2015
PDF

Auteurs

Abdelhamid Chellal, Mohand Boughanem, Karima Amrouche

Résumé

L’information sur le web est de plus en plus extraite depuis des bases de données (BD) où les langages d’interrogation sont basés sur une recherche exacte. L’utilisateur se trouve confronté au problème de réponses nombreuses lorsque sa requête est peu sélective. Pour remédier à ce problème, plusieurs approches ont été proposées, à l’instar de celles utilisant les techniques de relaxation des requêtes. D’autres travaux proposent de classifier les résultats. Une autre classe d’approches, au quelle on s’intéresse, suggère l’adaptation des techniques de la recherche d’information (RI) pour trier les résultats dans les BD. On propose dans cet article, une adaptation du modèle de langue de la RI pour trier les tuples retournés selon leur score de pertinence vis-à-vis la requête. Ce score est évalué par un modèle de langue bi-gramme qui combine, à travers un lissage par interpolation, les probabilités d’occurrence des valeurs des attributs dans l’ensemble des tuples retournés ainsi que dans la BD. Nous avons évalué l’efficacité de notre approche sur une table contenant

Abstract

Information over the web is increasingly retrieved from relational databases using exact query matching. As result, the user can be confronted to the problem of overabundant answers in the case of imprecise query. To overcome this problem, several approaches have been proposed we distinguish those based on automatic strengthening of the predicates used in vague conditions. Others works suggest the use of classifications techniques to provide users with hierarchical clustering schemas of their query results. Another class of approaches proposes the adaptation of information retrieval (IR) approaches for ranking tuples returned for a query. We discuss in this paper, an adaptation of IR based language model to rank results according to their relevance score. This score is evaluated using bi-gramm language model smoothed by interpolation between the probabilities of occurrence of attributes values in the result set and their probabilities of occurrence in the DB. We evaluate the effectiveness of our approach with a table with16842 tuples. The preliminary results show the interest of exploiting attribut’s value dependency.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.