Auteurs
Résumé
MEDLINE est le plus grand répertoire au monde de résumés biomédicaux. Il demeure le point de départ de toute recherche d’information pour beaucoup de biologistes malgré la disponibilité croissante de l’intégralité des articles sur le Web. Chaque entrée MEDLINE est indexée manuellement avec des termes MeSH et afin d’améliorer la recherche, les champs MeSH ont déjà été utilisés avec succès dans des techniques de upseudo relevance feedback » et d’expansion de requête. Néanmoins, ces expériences ont peu exploité la structure des champs MeSH. Cet article étudie l’impact de la structure des champs MeSH dans une méthode qui combine des recherches portant sur les champs de texte libre et les champs MeSH contenus dans les entrées d’un vaste sous-ensemble de MEDLINE. Les requêtes MeSH sont générées par la technique u Offer Weight » de Robertson. La méthode utilisée est évaluée avec l’ensemble standard de l’épreuve ad hoc de l’atelier génomique de TREC 2005. Les résultats montrent que notre approche améliore la recherche de manière significative.
Abstract
The MEDLINE database is the world largest repository of bio-medical abstracts. It is a central information entry point for most biologists despite the growing availability of full-text articles on the WWW. Each article is manually annotated by MeSH terms to allow easy access and in order to improve retrieval, the MeSH fields of MEDLINE records were successfully used in the past with pseudo-relevance feedback and MeSH query expansion. However, previous experiments often ignored the MeSH field structure information. This paper investigates the impact of the MEDLINE MeSH field structure on a method that combines text and MeSH searches on a large subset of the MEDLINE database. Robertson’s Offer Weight technique is used to generate MeSH queries. Our method is evaluated within the TREC 2005 Genomics Track on the ad hoc task collection and our results show that this approach does significantly improve retrieval performance.