ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2009
PDF

Auteurs

Mathias Géry, Christine Largeron, Franck Thollard

Résumé

Cet article traite de l’intégration des balises XML dans la fonction de pondération des termes, pour la recherche d’information (RI) XML ciblée. Notre modèle permet de considérer un certain type d’information structurelle: les balises qui représentent la structure logique des documents (titre, section, paragraphe, etc.) ainsi que les balises liées à la mise en forme (gras, italique, centré, etc.). Nous prenons en compte l’influence des balises sous forme d’un poids en estimant la probabilité pour une balise de mettre en évidence les termes pertinents. Ensuite, ces poids sont intégrés à la fonction de pondération des termes. Des expérimentations sur une collection de grande taille dans le cadre de la compétition de RI XML, INEX 2008, ont montré une amélioration de la qualité des résultats en RI ciblée.

Abstract

None

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.