Auteurs
Résumé
La plupart des systèmes de recherche d’information représentent la requête, et les do- cuments, comme un sac de termes d’indexation sans aucune relation entre eux. Cette représen- tation pose problème pour les spécialistes d’un domaine spécifique comme le domaine médical. Nous proposons une alternative au sac de termes d’indexation, en fonction de la structuration requête sémantique, afin de répondre à ce besoin de précision dans un domaine spécifique. Cette structuration est obtenue en regroupant les termes d’indexation des requêtes à l’aide des caté- gories prédéfinies appelées dimensions. Ces dimensions représentent les différents aspects qui pourraient apparaître dans une requête ou un document. Les résultats expérimentaux montrent une amélioration de précision liée à la granularité des dimensions et de sa distribution.
Abstract
Most Information retrieval systems represent a query, also a document, as a bag of indexing terms without any relation between each other. This bag-based representation causes a problem for specialists when they deal with a specific domain like medical one. We present an alternative to the bag of indexing terms representation depending on semantic query struc- turing, in order to fulfill this need of precision in a specific domain. This structure of a query is obtained by grouping indexing terms using pre-defined categories called dimensions. These dimensions represent the different aspects that could appear in a query or a document. By using this notion, the relevant document to a given query should not only has a maximum number of shared indexing terms but also have a similar structure. Experimental results show precision improvement related to the granularity of dimensions and its distribution over the whole corpus.