Auteurs
Résumé
Si la recherche d’information conceptuelle a montré son efficacité dans différents contextes, elle nécessite de disposer de corpus de ressources indexées avec des concepts issus d’une ontologie de domaine. Or le processus d’indexation est souvent lourd et fastidieux et des solutions doivent être imaginées pour assister les experts dans cette tâche. Nous avons étendu notre méthode de propagation d’indexations vectorielles au cas de l’indexation con- ceptuelle, ce qui nous permet de suggérer à l’utilisateur une indexation conceptuelle pour une nouvelle ressource, lorsque celle-ci est positionnée sur une carte sémantique. Pour cela nous maximisons une fonction objectif PHVXUDQW OD VLPLODULWp HQWUH O¶indexation proposée et celles des documents présents dans le voisinage du document à annoter. Cette méthode est appli- quée à l’indexation de publications scientifiques dans le domaine du cancer.
Abstract
Concept-based information retrieval is known to be a powerful and reliable pro- cess. However, the need of a semantically annotated corpus and its respective data structure ± e.g. a domain ontology ± can be problematic. The conception and enlargement of a seman- tic index is a tedious task, which needs to be addressed. We previously suggested an annota- tion propagation approach in a vector space representation of the corpus to help users en- riching a corpus. In this paper, we propose an extension of this process for semantic indexa- tions. Starting from a map showing the documents of the corpus, a user will just have to place a new resource on this map to obtain a first annotation of this resource. This annotation is obtained by optimizing an objective function, which assesses the semantic similarity between the annotation suggested for this new resource and those of documents found in its vicinity. Here, we illustrate this strategy on tumor-related scientific papers.