Auteurs
Résumé
Cet article présente le projet “Pyrénées Itinéraires Virtuels”. Ce projet consiste à va- loriser un fonds documentaire patrimonial localisé dans le territoire pyrénéen. Dans ce cadre, nous proposons des modèles unifiés pour la définition formelle d’entités spatiales. Ces modèles permettent de mettre en place un système de recherche d’information basé sur le contenu sé- mantique de documents multi-formats. L’objectif de ce projet est d’étendre les fonctionnalités de systèmes de gestion de base documentaire classiques en permettant une gestion plus fine des restrictions spatiales dans une recherche. Pour cela nous développons un processus d’extraction d’information (EI) spécifique basé sur les modèles unifiés. De plus, une réflexion est menée sur l’interprétation numérique des entités spatiales. Un outil de recherche d’information (RI) utilise alors le traitement sémantique effectué pour retrouver des fragments de documents spatialement pertinents. Un prototype implémentant ce processus est développé afin de valider nos travaux.
Abstract
This paper outlines the “Pyrénées Itinéraires Virtuels” project. The aim of this project is to add value to a legacy localised corpus. Unified models are proposed to define spatial entities in a formal way. These models allow to build a specific information retrieval system based on the semantic contents of various kinds of documents. Moreover, a reflection on computable interpretation of these spatial entities is performed, in order to be used in an information retrieval process. A prototype implementing this kind of information extraction and information retrieval process has been developped to validate our assumptions.