ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2007
PDF

Auteurs

Noureddine Chatti, Sylvie Calabretto

Résumé

Nous traitons dans cet article le problème de l’interrogation des documents à structures multiples, appelés aussi documents multi-structurés. Pour des besoins d’usages variés, plusieurs structurations différentes peuvent être associées à un même document initial. Par exemple, une première structure peut être définie pour organiser logiquement le contenu d’un document tandis qu’une deuxième explicitera les règles de sa mise en forme sur un support physique. Dans de précédents travaux, nous avons proposé une modélisation générique prenant en compte différents aspects de ce type de document. Partant de ce modèle nous avons également proposé un formalisme, basé sur XML, appelé MultiX permettant la sérialisation d’un document multi-structuré. Dans cet article, nous étudions l’exploitation de ces documents dans le contexte de la recherche d’information. Pour interroger efficacement les documents multi-structurés au format MultiX nous avons développé une extension du langage XQuery sous forme d’une bibliothèque de fonctions spécifiques permettant d’explorer les documents en prenant en compte la sémantique du format MultiX.

Abstract

This paper deals with the interrogation of multi-structured documents. For various use aims, several distinct structures may be defined simultaneously for the same original document. For example, a document may have a first structure to express a set of content formatting rules (logical structure), and a second structure to express a set of content formatting rules (layout structure). In previous works, we have proposed a generic model for the multi-structured document and MultiX, an XML-based formalism to encode multi- structured documents. In this paper, we present one solution to query multi-structured documents. This solution is based on a library of XQuery functions.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.