ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de SDNRI 2014
PDF

Auteurs

Rafik Abbes, Karen Pinel-Sauvagnat, Nathalie Hernandez, Mohand Boughanem

Résumé

Dans cet article nous souhaitons renvoyer à partir de documents issus du Web, ceux apportant des informations nouvelles sur une entité donnée. Ces documents peuvent ainsi servir à mettre à jour un profil existant (par exemple une page Wikipedia) de cette entité. Notre approche se base initialement sur un appariement des mentions de l’entité afin de renvoyer un premier ensemble de documents pertinents, puis s’appuie sur des modèles de langue estimés à partir de différentes unités d’information. Nous avons évalué notre approche dans le cadre de la tâche “Cumulative Citation Recommendation” de TREC KBA 2013. Les résultats montrent l’intérêt des modèles de langue par rapport aux méthodes de l’état de l’art, et que la vitalité est mieux estimée en considérant tout le contenu des documents mentionnant l’entité.

Abstract

In this paper, we aim at identifying vital documents that a human would want to cite when updating an entity profile (for example, its Wikipedia article). In our approach, we first retrieve a set of potential relevant documents containing at least one entity mention, then we rank vital documents using vitality-based language models estimated from different information units. We evaluated our approach through the 2013 CCR task of TREC KBA. Results show the interest of our approach compared to those of the state-of-the-art. We also show that vitality is better estimated when considering the whole content of documents mentioning the entity instead of considering only the entity sentences.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.