ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2006
PDF

Auteurs

Fabienne Moreau, Vincent Claveau

Résumé

Cet article s’intéresse au problème de la formulation différente d’une même idée, d’un même concept, en recherche d’information à travers la prise en compte du phénomène de la variation morphologique. L’approche proposée est une méthode simple de reconnaissance des variantes morphologiques utilisées pour l’enrichissement des requêtes au sein d’un système de recherche d’information (SRI). À l’inverse de nombreux travaux déjà réalisés dans ce domaine, la technique proposée présente la particularité de ne nécessiter aucunes ressources ni connais- sances externes, et d’être applicable par conséquent à une grande variété de langues. Les éva- luations de cette approche réalisées sur plusieurs collections de documents, sur 6 différentes langues et comparées à différents outils existants (stemmer, lemmatiseur) attestent de l’intérêt de la méthode puisqu’une amélioration significative des performances des SRI est constatée dans tous les cas.

Abstract

Information retrieval systems (IRS) usually suffer from a low ability to recognize a same idea or concept that is expressed in different forms. A way of improving these systems is to take into account morphological variations. In this paper, we propose a simple method to recognize these variations that are further used so as to enrich queries. In comparison with already published methods, this system does not need an external ressources or knowledge and thus supports many languages. This approach is evaluated on several collections, 6 differ- ent languages and compared to existing tools (stemmer, lemmatizer); reported results show a significant improvement of the overall IRS performance in every case.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.