Auteurs
Résumé
Ce papier présente un modèle d’indexation sémantique adapté aux dossiers électro- niques de patients. Ce modèle servira de support à des processus de recherche d’information médicale, permettant à terme de promouvoir l’expérience collective des médecins. Compte tenu de la spécificité de ce type de documents, le processus d’indexation est basé sur la succes- sion d’étapes d’annotation sémantique fondée sur l’utilisation de MeSH (Medical Subject Hea- dings), de désambiguïsation répondant au problème d’homonymie, d’extraction de valeurs cli- niques, puis de pondération des concepts. Le schéma de pondération tient compte du niveau de description de l’index (document ou dossier) ainsi que de la localisation des concepts dans le document et dans la hiérarchie de MeSH et ce, dans le but de traduire à la fois leur spéci- ficité et leur centralité. Le modèle d’indexation proposé est évalué sur un corpus de dossiers électroniques de patients et montre son efficacité pour ce type de documents.
Abstract
This paper presents a semantic model adapted for the indexing of electronic pa- tient records (EHRs) as a support to the process of finding medical information. Given the specificity of such documents, the indexing is based on the sequence of Natural Language Pro- cessing steps: semantic annotation based on the use of the MeSH (Medical Subject Headings) thesaurus, concept disambiguation, extraction of clinical values, and concept weighting. The weighting scheme takes into account the granularity level of the index (patient documents or patient records) and the location of concepts in documents and in the MeSH hierarchy in order to translate both their specificity and their centrality. The proposed indexing model is evaluated on a corpus of EHRs and shows its effectiveness for indexing such documents.