Auteurs
Résumé
La recherche d’information à base de connaissances est largement étudiée, mais avec peu de succès. Dans cet article, nous étudions l’impact de l’exploration d’une base de connais- sance, nommée méta thésaurus UMLS pour la recherche d’information médicale. D’abord, l’in- dexation par concepts d’UMLS extrait dans des textes ne montre qu’une légère amélioration de MAP(Mean Average Precision) par rapport à l’indexation par termes. Nous intégrons ensuite les étiquettes sémantiques des concepts dans une indexation multicouche qui donne des résul- tats encourageants pour la collection ImageCLEF 2006. Pourtant, nous notons un problème de rappel dans les cas où le concept de la requête est plus général que celui des documents. Afin de résoudre ce problème, nous proposons un modèle basé sur un réseau bayesien pour capturer les liens générique-spécifique entre concepts de la requête et ceux des documents.
Abstract
Knowledge-based information retrieval is widely exploited, but still not very well successful. In this paper, we aim to study the impact of the exploitation of a knowledge source, named UMLS meta-thesaurus, in medical domain information retrieval. First, indexing with UMLS concepts extracted from text shows just a slight increase in MAP (Mean Average Pre- cision) comparing to word-based indexing. We then integrate semantic labels of concepts in a multi-layer indexing which shows quite encouraging results for ImageCLEF 2006 test collec- tion. However, a recall problem is noticed when query concepts are more general than document concepts. In order to resolve this problem, we propose a Bayesian network based model which captures the general-specific links between query concepts and documents concepts.