Auteurs
Résumé
Nous considérons des systèmes pair-à-pair pour le partage de documents dans lesquels chaque pair utilise une ontologie pour représenter ses documents. Lorsque tous les pairs n’utilisent pas la même ontologie, le système est sémantiquement hétérogène, ce qui constitue à priori un frein à l’inter- opérabilité. Nous proposons un système dont l’organisation générique en couches logicielles sépare les algorithmes dédiés à la diminution de l’hétérogénéité de ceux utilisés pour la recherche d’informa- tion sémantique distribuée. Nous proposons une méthode de RI, puis nous étudions sur l’impact qu’ont des algorithmes dédiés à la diminution de l’hétérogénéité sur l’interopérabilité (mesurée en termes de précision/rappel). Nos expérimentations considèrent des ontologies du domaine bio-médical et des documents issus de la base PubMed. Nous mesurons l’hétérogénéité du système et le taux de préci- sion/rappel obtenus avant et après avoir appliqué deux algorithmes visant à diminuer l’hétérogénéité.
Abstract
We consider peer-to-peer information sharing systems in which each peer uses an ontology to represent its documents. When the peers do not use the same ontology, the system is semantically heterogeneous, which prevents good interoperability. We propose a system with a generic layered software architecture that separates the algorithms dedicated to heterogeneity reduction from those which are used for semantic information retrieval. We propose an algorithm for distributed semantic retrieval in heterogeneous context. Then, we focus on the effects on interoperability (measured through precision and recall) of two algorithms for semantic heterogeneity reduction. Our experiments consider bio-medical ontologies and documents from the PubMed database. We measure semantic heterogeneity and precision/recall before and after using algorithms that aim to reduce heterogeneity.