Auteurs
Résumé
La collecte pertinente d’information sur le Web est une tâche très complexe et les moteurs de recherche actuels, reposant sur des méthodes d’indexation et de recherches basées sur des mots-clés, ont de très faibles taux de précision. Les recherches qu’ils réalisent sont essentiellement lexicales statistiques et ne prennent pas en compte leurs contextes sous- jacents. En se limitant à des domaines restreints, la prise en compte de ces contextes est possible et doit conduire à des collectes plus pertinentes. Dans ce papier, est proposée une collecte coopérative d’information à base d’agents logiciels et d’ontologies. Ensuite, une architecture logicielle générique, AGATHE, mettant en oeuvre ce type de collecte et permettant le développement de systèmes de collecte relatif à un ou plusieurs domaines, est présentée en détail.
Abstract
Relevant information gathering in the Web is a very complex task. The main problem with most information retrieval approaches is neglecting the context of the pages, mainly because search engines are based on keyword-based indexing. Considering restrained domain, it is possible to take into account of this contextwhat should lead to more relevant information gathering. In this paper, a specific cooperative information gathering approach based on the use of software agents and ontologies is proposed. To operationalise this approach, a generic software architecture, named AGATHE, permitting the development of specific restricted-domain information gathering systems is presented in detail.