Auteurs
Résumé
La représentation des documents et questions en Recherche d’Information (RI) est res- tée une représentation majoritairement uni-dimensionnelle (i.e., vecteur). Cette représentation a des limites : Comment par exemple représenter un document qui traite de plusieurs thèmes ou une question ambiguë ? Ces problèmes sont importants pour développer des systèmes de RI interactifs ou cherchant à diversifier les résultats. Les modèles actuels sont soit basés sur des heuristiques, soit sur des modèles latents qui pré-supposent un nombre limité de thèmes pour décrire les documents. L’approche basée sur les probabilités dites “quantiques” permet d’établir des bases formelles pour une représentation multi-dimensionnelle des documents (ou plus généralement, des objets d’information) qui dépasse les limites évoquées plus haut. Cet article décrit la méthodologie QIA ( Quantum Information Access) pour la représentation des documents, résume les résultats expérimentaux obtenus et décrit les perspectives.
Abstract
The representation of documents and queries in Information Retrieval (IR) is mostly a one-dimensional (vector) representation. This representation has limitations: For example, how to represent a multi-topical document or an ambiguous query? These issues are crucial for the development of interactive systems or for diversification. Beside heuristics models that cannot be generalized, most representations are based on latent models such as LDA (Latent Dirichlet Allocation) that presuppose limited and small number of topics for documents, which implies a decrease in precision. The approach based on “quantum” probabilities can lay the groundwork for a formal multi-dimensional representation of documents (or more generally, information objects) that get over the limits mentioned above. The article discusses the QIA (Quantum Information Access) methodology for representing documents, summarizes the experimental results obtained so far and propose future directions.