ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2008
PDF

Auteurs

Michel Beigbeder

Résumé

Nous présentons une méthode pour calculer un score d’un élément quelconque d’un document structuré qui prend en compte la proximité des termes de la requête dans le texte du document. Plus précisément nous définissons autour de chaque occurrence d’un terme de la requête une fonction d’influence. Pour une occurrence qui apparaît dans le texte proprement dit, cette fonction d’influence décroit linéairement de 1 à 0 selon la distance à l’occurrence. Lorsqu’un terme de la requête apparaît dans le titre d’une (sous-)section d’un document struc- turé, son influence est uniformément 1 du début à la fin de la (sous-)section. Nous utilisons des requêtes booléennes et les fonctions d’influence sont combinées à chaque noeud ET et OU de l’arbre de la requête selon le modèle de la logique floue. Le score d’une partie quelconque de document est la normalisation de la somme de la fonction d’influence résultante à la racine de l’arbre de la requête sur l’intervalle associé à cette partie. Nous présentons et commentons les résultats obtenus dans le cadre de la tâche ad’hoc de la campagne INEX 2006.

Abstract

We present a method for scoring any part of a structured document that takes into account the proximity of the query terms in the text of the document. More precisely we define around each occurrence of a query term an influence function. For an occurrence appearing in the text itself, this influence function is linearly decreasing from 1 to 0 depending on the distance to the occurrence. When a query term happens to appear in a (sub-)section title of a structured document its influence is uniformly 1 from the beginning to the end of the (sub-)section. We use boolean queries and these influence functions are combined at each node AND or OR of the query tree by using fuzzy logic. The score of any part of a document is the normalization of the summation of the resulting influence function at the root of the query tree on the range of this part. We present and comment the results obtained within the 2006 INEX ad’hoc track.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.