Auteurs
Résumé
Dans le domaine biomédical, l’emploi de termes spécialisés est la clef de l’accès à l’in- formation. Mais dans la plupart des langues indo-européennes, ces termes sont des construc- tions morphologiques complexes. Dans cet article, nous cherchons à identifier les différents éléments de sens composant ces termes et utilisons ces analyses pour améliorer la recherche d’information biomédicale. Nous présentons en particulier une approche automatique combi- nant alignement avec une langue pivot et apprentissage analogique permettant une analyse morphologique fine des termes. Ces analyses morphologiques sont utilisées pour améliorer l’indexation des documents médicaux. Les expériences rapportées dans cet article montrent le bien-fondé de cette approche avec des améliorations de MAP de +10% par rapport à un système de RI standard.
Abstract
In the biomedical field, the key to access information is the use of specialized terms. However, in most of Indo-European languages, these terms are complex morphological struc- tures. The aim of the presented work is to identify the various meaningful components of these terms and use this analysis to improve biomedical information retrieval. We present an ap- proach combining an automatic alignment using a pivot language, and an analogical learning that allows an accurate morphological analysis of terms. These morphological analysis are used to improve the indexing of medical documents. The experiments reported in this paper show the validity of this approach through improvements in MAP of 10 % compared to a stan- dard IR system.