Auteurs
Résumé
L’objectif principal de la pondération en recherche d’information (RI) est d’assigner aux termes d’index des poids sensés traduire leur importance dans les documents où ils apparaissent. En RI sémantique, les termes d’index représentent des concepts. L’importance d’un concept est généralement mesurée soit à travers sa fréquence d’occurrence, soit à travers sa centralité, définie comme son degré de relation avec les autres concepts du document. Dans ce papier, nous proposons et évaluons une approche de pondération des concepts basée sur une nouvelle définition de la centralité. La centralité d’un concept est une mesure combinée de sa fréquence relative et de sa proximité sémantique avec les autres concepts du document. Nous montrons en particulier que notre approche offre de meilleurs résultats que les approches de pondération classiques sur des concepts.
Abstract
The main objective of term weighting in information retrieval (IR) is to assign index terms with weights assumed to reflect their importance in the documents where they appear. In semantic information retrieval, index terms are concepts. Concept importance is measured either through its occurrence frequency or its centrality, defined through the degree of its relations to other concepts in the document. In this paper, we propose and evaluate an approach to concept weighting that is based on a novel definition of centrality. Concept centrality is a combined measure of its relative frequency and its semantic relatedness to other concepts in the document. In particular we show that our approach provides better results than classical weighting approaches on concepts.