Auteurs
Résumé
L’utilisation d’ontologies, c’est-à-dire de bases de connaissances, en recherche d’infor- mation est devenue une voie très explorée. Cela permet de dépasser de nombreux problèmes liés aux comparaisons terme à terme entre documents ou entre documents et requêtes, en pas- sant à un niveau d’abstraction supérieur qui n’est pas soumis aux limitations intrinsèques à l’utilisation de mots-clés. De nombreuses techniques utilisent désormais les ontologies (expan- sion de requêtes, désambiguïsation sémantique, etc.) dans le but d’obtenir de meilleurs résultats en recherche d’information. Un problème récurrent de ces applications est la mesure de proxi- mité entre concepts dans une ontologie. Elle a été étudiée par de nombreux auteurs, et deux grandes approches se sont détachées : les approches basées sur les arcs, c’est-à-dire sur la structure de l’ontologie, et les approches utilisant le contenu informatif des concepts, donc en passant par des corpus renseignant l’importance des concepts dans un document. Nous avons eu besoin de comparer les mesures classiques de distance entre concepts dans une ontologie. Des résultats de psychologie nous ont amenés à en choisir une qui respecte plus la manière dont un humain juge la proximité entre entités.
Abstract
Using ontologies, that is to say knowledge basis, in IR has become a well-known is- sue. Moving to an upper level of abstraction that is not bounded by the use of key-words enables to go beyond the problems related to term-to-term comparisons between documents or between documents and queries. Lots of methods now use ontologies (query expansion, semantic dis- ambiguation, etc.) to get better results in IR. A recurring problem of these applications is the similarity measure between concepts in an ontology. It was analyzed by many authors and two main approaches have become dominant: the edge-based approach, that is to say based on the structure of the ontology, and the mode-based approach that uses corpora that give information about the importance of concepts within a document. We had to compared classical measures of distance between concepts within an ontology. Results based on psychological researches bring us to choose one that respect the way in which people upraise proximity between entities.