ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2006
PDF

Auteurs

Loïc Maisonnasse

Résumé

En Recherche d’Information (RI) les méthodes purement statistiques basées sur des distributions de mots-clef ont actuellement atteint une limite. Cette limite n’est franchissable que par l’apport massif de connaissances extérieures au sein du système de RI. Nos travaux portent sur l’utilisation en RI des liens de niveaux syntaxiques entre les termes. Nous considérons ainsi les dépendances syntaxiques contenues dans l’arbre de dépendance produit par des analyseurs syntaxiques de surface. Pour intégrer ces informations en RI, le contexte des modèles de langue nous semble favorable. En effet, l’aspect théorique des modèles de langue est très intéressant, il est adaptable et permet l’intégration de nouvelles connaissances. Nous présentons ici, l’intégration des liens syntaxiques au sein d’un modèle de langue. Ce modèle est évalué sur une partie de la collection de CLEF. Les résultats montrent que l’intégration des dépendances syntaxiques abaisse les performances du système de RI. Face à ces résultats, nous souhaitons pour la suite de ces travaux nous orienter vers l’apport d’information de niveau plus sémantique.

Abstract

In Information Retrieval (IR), statistic keyword based methods have reached a limit. This limit can only be cross by integrating, in large number outside source of knowledge, in IR system. Our work is based on the integration of the syntactic link between the terms produced by shallow parser. For that we consider the syntactic dependency of dependency tree produce by parser. For integrating these information in IR, we present the use of a language modeling approach. Language modeling approach theoretically framework is attractive as it can be adapted or in order to take into account new information. We present here the integration of the dependency relation in a language model. We evaluate this model on a part of the CLEF collection. The results show that the integration of dependency relation lowers the IR results. Consequently, knowing these results in the continuation of this work, we intend to integrate more semantic information instead of syntactic information.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.