Auteurs
Résumé
Notre étude se situe dans le domaine de la recherche d’informations. Certains mo- dèles classiques comme le modèle vectoriel permettent de classer les documents par ordre de pertinence alors que d’autres, qui n’offrent pas cette possibilité de classement, possèdent des fonctionnalités particulières comme repérer les documents où les termes de la requête appa- raissent proches les uns des autres. Cette dernière idée ayant conduit à des améliorations des résultats, nous formulons l’hypothèse que plus les occurrences des termes d’une requête se re- trouvent proches dans un document, plus ce document doit être positionné en tête de la liste de réponses retournées par un système. Par ailleurs, les méthodes de recherche de passages per- mettent de sélectionner les passages répondant à la requête et définissent ainsi une proximité au niveau du passage. Après avoir rappelé les principaux modèles de recherche d’informations ainsi que les approches qui traitent de la proximité entre les termes nous présentons notre mo- dèle de proximité qui utilise la logique floue. Nous avons expérimenté notre modèle et nous comparons les résultats obtenus par rapport à ceux d’une méthode de recherche de passages.
Abstract
Scoring and ranking relevant documents compared to the user’s information need is a principal objective in information retrieval domain. We base our study on the terms proximity over documents, we assume that more the occurrences of the query terms request are found close in a document then more this document must be positioned in the top of the document retrieve list. After a brief description of traditional models and the few approaches which treat proximity between the occurrences of terms, we present our method on fuzzy proximity which makes it possible to give a score of relevance to the documents according to the localization of the terms in these documents. In this study, we compare our approch with passage retrieval methods based on the MG and LUCY information retrieval system. We define a method to split the collection in passages.