ARIA

Association Francophone de Recherche d’Information (RI) et Applications

Actes de CORIA 2019
PDF

Auteurs

Wafa Aissa, Laure Soulier, Ludovic Denoyer

Résumé

La RI repose sur un cadre standard qui interroge des collections de documents à partir d’un besoin en information exprimé sous la forme d’un ensemble de mots-clés. Notre contri- bution vise à dépasser ce paradigme habituel en traitant directement le besoin en information exprimé en langage naturel pour tendre vers une nouvelle génération de systèmes de RI axés sur l’aspect conversationnels (appelés aussi “search oriented conversational systems”). Une première étape réside alors dans la formulation de requêtes à partir de besoins en informa- tion exprimés en langage naturel. Nous proposons dans ce papier un modèle de formulation de requêtes capable 1) d’apprendre la traduction des expressions en langage naturel en requêtes de type mots-clés de manière supervisée, et 2) d’injecter les retours de pertinence dans le pro- cessus d’apprentissage (apprentissage par renforcement). Pour pallier au manque de données d’apprentissage, nous considérons le modèle de traduction comme un modèle de sélection de mots. Notre modèle est évalué sur deux collections TREC démontrant ainsi son efficacité.

Abstract

IR is based on a standard framework that queries document collections through an in- formation need expressed as a set of keywords. Our contribution aims at overpassing this usual paradigm by starting the retrieval process from the natural language expression of the informa- tion need; giving rise to a new generation of IR systems based on conversational features (also called “search-oriented conversational systems”). Therefore, the first step focuses on the query formulation from the information need expressed in natural language. In this paper, we pro- pose a query formulation model able of 1) translating natural language expressions to keyword queries in a supervised manner, and 2) injecting relevance feedback in the learning process through reinforcement learning technics. To overcome the lack of training data, we consider the translation model as a word selection process. Our model is evaluated on two TREC collections to demonstrate its effectiveness.

Posts Récents

Catégories

A Propos

ARIA (Association Francophone de Recherche d’Information (RI) et Applications) est une société savante, association loi 1901, ayant pour but de promouvoir le savoir et les connaissances du domaine de la Recherche d’Information (RI) et des divers domaines scientifiques en jeu dans la conception, la réalisation et l’évaluation des systèmes de Recherche d’Information.